Escolar Documentos
Profissional Documentos
Cultura Documentos
Frontispı́cio
Este é o texto do frontispı́cio do livro.
ii
Índice
1 Teoria da Gravitação 1
1.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.2 Teoria Newtoniana da gravitação . . . . . . . . . . . . . . . . . . . . . . . 5
1.2.1 A lei da gravitação universal . . . . . . . . . . . . . . . . . . . . . . 5
1.2.2 Multipolos gravitacionais . . . . . . . . . . . . . . . . . . . . . . . . 9
1.2.3 Massa inercial e massa gravitacional . . . . . . . . . . . . . . . . . 11
1.2.4 Forças de maré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.3 O tensor energia-momento . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.1 Notação e definições . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.3.2 O tensor energia-momento de um fluido perfeito em movimento . . 17
1.4 Teoria Linear da Gravitação . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.4.1 Construindo as Equações de Campo . . . . . . . . . . . . . . . . . . 19
1.4.2 Equações de Campo como Consequência de um Princı́pio Variacional 22
1.4.3 Transformação de calibre . . . . . . . . . . . . . . . . . . . . . . . . 25
1.4.4 Problemas com a Lei de Conservação da Energia . . . . . . . . . . . 25
1.4.5 O tensor energia-momento do campo gravitacional — primeira aprox-
imação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 26
1.4.6 Balanço de momentum-energia entre a Matéria e o Campo Grav-
itacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.4.7 As Equações de Campo no Limite Newtoniano . . . . . . . . . . . . 31
1.5 Teoria da Relatividade Geral . . . . . . . . . . . . . . . . . . . . . . . . . . 33
1.5.1 O princı́pio da equivalência . . . . . . . . . . . . . . . . . . . . . . 33
1.5.2 As equações de campo . . . . . . . . . . . . . . . . . . . . . . . . . 34
1.5.3 O limite Newtoniano . . . . . . . . . . . . . . . . . . . . . . . . . . 38
1.6 A solução de Schwarzschild e aplicações . . . . . . . . . . . . . . . . . . . . 41
1.6.1 Movimento de partı́culas teste na solução de Schwarzschild . . . . . 44
1.6.2 Testes de campo solar . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 54
1.8 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2 Cosmologia I: Fenomenologia 58
2.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
2.2 O Universo Observado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
2.2.1 Galáxias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.2.2 Grupos e Aglomerados de Galáxias . . . . . . . . . . . . . . . . . . 66
2.2.3 O Cosmos Dinâmico: O Universo em Expansão . . . . . . . . . . . 74
2.2.4 Estrutura em Grande Escala . . . . . . . . . . . . . . . . . . . . . . 78
2.3 O Universo Homogêneo I . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
2.3.1 Dinâmica: A equação de Friedmann . . . . . . . . . . . . . . . . . 82
iii
2.4 O Universo Homogêneo II . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
2.4.1 Uma Breve História Térmica do Universo . . . . . . . . . . . . . . . 87
2.5 O Universo Perturbado . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 90
2.5.1 O Crescimento Linear das Estruturas (Newtoniano) . . . . . . . . . 91
2.5.2 O Universo Muito Perturbado: Simulações Computacionais . . . . . 103
2.6 Sı́tios de Internet Sugeridos . . . . . . . . . . . . . . . . . . . . . . . . . . 103
2.7 Livros sugeridos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
2.8 Artigos Sugeridos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 107
2.9 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
2.10 Glossário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 114
2.11 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
iv
5.3.1 Limite de baixa densidade (Γ = 5/3) . . . . . . . . . . . . . . . . . 193
5.3.2 Limite de alta densidade (Γ = 4/3) . . . . . . . . . . . . . . . . . . 195
5.4 O limite de massa de Chandrasekhar . . . . . . . . . . . . . . . . . . . . . 195
5.5 Anãs brancas: São verdadeiramente observadas no céu? . . . . . . . . . . . 197
5.6 Estabilidade de estrelas anãs brancas . . . . . . . . . . . . . . . . . . . . . 198
5.6.1 Estabilidade de ABs na relatividade geral . . . . . . . . . . . . . . 198
5.7 Estrelas de Nêutrons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 203
5.8 Equação de estado de gás perfeito no domı́nio nuclear . . . . . . . . . . . . 204
5.9 Modelos realı́sticos de estrelas de nêutrons . . . . . . . . . . . . . . . . . . 208
5.9.1 Massa máxima de ENs . . . . . . . . . . . . . . . . . . . . . . . . . 211
5.10 Estrelas de nêutrons: são realmente observadas no céu? Possuem as pro-
priedades preditas? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 212
5.10.1 Pulsares binários . . . . . . . . . . . . . . . . . . . . . . . . . . . . 213
5.11 Apêndice A . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
5.12 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 217
5.13 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 219
v
7.8 Taylor & Hulse: Um prêmio Nobel pelas OGs do pulsar binário PSR 1913
+ 16 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 282
7.9 Astronomia de ondas gravitacionais . . . . . . . . . . . . . . . . . . . . . . 290
7.10 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
7.11 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 292
8 Astropartı́culas I 293
8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 293
8.2 Modelo Padrão de Partı́culas Elementares . . . . . . . . . . . . . . . . . . 294
8.2.1 A força forte . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
8.2.2 A força fraca . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
8.2.3 A classificação padrão . . . . . . . . . . . . . . . . . . . . . . . . . 300
8.3 Elementos de Teoria de Grupos . . . . . . . . . . . . . . . . . . . . . . . . 302
8.3.1 Definições . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 302
8.3.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
8.3.3 Revisitando a classificação das partı́culas elementares . . . . . . . . 308
8.4 Elementos de Teoria de Campos . . . . . . . . . . . . . . . . . . . . . . . . 311
8.4.1 Campo Escalar Real . . . . . . . . . . . . . . . . . . . . . . . . . . 311
8.4.2 Campo Eletromagnético . . . . . . . . . . . . . . . . . . . . . . . . 314
8.4.3 Mecanismo de Higgs . . . . . . . . . . . . . . . . . . . . . . . . . . 315
8.5 Unificação das Forças Fundamentais e Transições de Fase . . . . . . . . . . 317
8.6 O Universo como um acelerador . . . . . . . . . . . . . . . . . . . . . . . . 321
8.7 Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
8.8 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 324
9 Astropartı́culas II 325
9.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 325
9.2 Defeitos Topológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
9.3 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 326
9.4 Paredes cósmicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
9.5 Tensor de momento energia para um fluido de parede cósmica . . . . . . . 329
9.6 Cordas cósmicas e monopolos . . . . . . . . . . . . . . . . . . . . . . . . . 330
9.6.1 Defeitos topológicos e os raios cósmicos de alta energia . . . . . . . 334
9.7 O modelo de Inflação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
9.7.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 335
9.8 Os problemas do Modelo Cosmológico Padrão . . . . . . . . . . . . . . . . 336
9.8.1 O problema do horizonte . . . . . . . . . . . . . . . . . . . . . . . . 336
9.8.2 O problema da platitude . . . . . . . . . . . . . . . . . . . . . . . . 337
9.8.3 O problema das perturbações primordiais . . . . . . . . . . . . . . . 338
9.8.4 O problema dos monopolos magnéticos . . . . . . . . . . . . . . . . 339
9.9 Uma fase de expansão acelerada no Universo primordial . . . . . . . . . . . 340
9.10 Implementando um modelo inflacionário . . . . . . . . . . . . . . . . . . . 342
9.11 Matéria e energia escuras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
9.11.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 345
9.12 A matéria escura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
9.13 A energia escura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 350
9.14 Constante cosmológica, quintessência ou... . . . . . . . . . . . . . . . . . . 353
9.15 Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 356
vi
10 Gravitação e Cosmologia Quânticas 357
10.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 357
10.1.1 Argumentos a favor da construção de uma Teoria Quântica da
Gravitação e da chamada Cosmologia Quântica . . . . . . . . . . . 358
10.2 Gravitação Quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 363
10.2.1 Quantização Canônica . . . . . . . . . . . . . . . . . . . . . . . . . 363
10.2.2 Quantização Covariante . . . . . . . . . . . . . . . . . . . . . . . . 369
10.2.3 Gravitação Quântica de Laços ou Supercordas? Ou ambas? . . . . . 371
10.3 Cosmologia Quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 372
10.3.1 A interpretação de Bohm-de Broglie . . . . . . . . . . . . . . . . . . 374
10.3.2 A Cosmologia Quântica e a singularidade cosmológica . . . . . . . . 376
10.3.3 Condições iniciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 379
10.4 Comparação com a Observação . . . . . . . . . . . . . . . . . . . . . . . . 380
10.4.1 Verficação da natureza discreta do espaço-tempo . . . . . . . . . . . 380
10.4.2 Uma escala de Planck observável . . . . . . . . . . . . . . . . . . . 381
10.4.3 A radiação de fundo e a Cosmologia Quântica . . . . . . . . . . . . 382
10.5 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 383
10.6 Leituras Recomendadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 384
10.7 Agradecimentos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 385
vii
12.6.1 Momentum linear . . . . . . . . . . . . . . . . . . . . . . . . . . . . 421
12.6.2 Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 424
12.7 Espaço-tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 426
12.7.1 O espaço-tempo de Minkowski . . . . . . . . . . . . . . . . . . . . . 426
12.7.2 Geometria do espaço-tempo de Minkowski . . . . . . . . . . . . . . 431
12.7.3 Diagramas de espaço-tempo . . . . . . . . . . . . . . . . . . . . . . 433
12.8 Cálculos simples em relatividade . . . . . . . . . . . . . . . . . . . . . . . . 437
12.8.1 Paradoxo dos gêmeos . . . . . . . . . . . . . . . . . . . . . . . . . . 438
12.8.2 Paradoxo da garagem . . . . . . . . . . . . . . . . . . . . . . . . . . 441
12.9 Formalismo tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
12.9.1 Rotações espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . . 443
12.9.2 Grupo de Lorentz-Poincaré . . . . . . . . . . . . . . . . . . . . . . . 446
12.10Contribuições da fı́sica experimental . . . . . . . . . . . . . . . . . . . . . . 451
12.11Referências bibliográficas . . . . . . . . . . . . . . . . . . . . . . . . . . . . 452
12.12Exercı́cios . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 454
viii
Capı́tulo 1
Teoria da Gravitação
Vitorio de Lorenci1
1.1 Introdução
Desde o surgimento da teoria da gravitação universal, fundamentada por I. Newton
no ano de 1686 [1], os efeitos relacionados a este fenômeno vêm sendo testados experi-
mentalmente nas mais distintas situações , e com regularidade crescente. A interação
gravitacional é reconhecidamente muito fraca quando comparada às demais interações
da natureza e em consequência é muito difı́cil a realização de testes para tal fenômeno
em laboratórios terrestres. O cosmos, há muito tempo vem exercendo o papel de nosso
melhor campo de medições dos efeitos gravitacionais e de fato, a sua observação ao longo
de tantos anos foi fator preponderante no encaminhamento das formulações teóricas para
a descrição deste processo.
Já no inı́cio do século XX a comunidade cientı́fica estava ciente da não aplicabilidade
da teoria Newtoniana na previsão de alguns fenômenos naturais, como por exemplo a
precessão do periélio das órbitas planetárias, o que levou diversos pesquisadores a propor
novas teorias a fim de completar o quadro experimental até então determinado. A in-
trodução de outras teorias, na maior parte das vezes, levou à predição de novos efeitos,
que puderam ser submetidos à examinação a fim de se resolver pela consistência da teoria
em seus resultados. Neste sentido, a ciência teórica e experimental, no que diz respeito à
interação gravitacional, tem caminhado em contı́nua dependência.
Das teorias que surgiram no intervalo de tempo que vai de 1686 até os dias atuais,
uma única tem se mostrado, pela excelência de seus resultados postos à experimentação ,
como a boa teoria da gravitação . Esta, a bem conhecida teoria da relatividade geral,
desenvolvida por A. Einstein [2] na primeira metade do século XX, tem sido amplamente
testada e comprovada em todas as suas predições 2 .
1
Afiliação: Instituto de Ciências Exatas (ICE), Universidade Federal de Itajubá (UNIFEI), PO Box
50 37500-903 Itajuba, MG.
2
Existem certos efeitos relacionados à precessão do periélio das órbitas de sistemas estelares duplos,
onde a configuração de campo é extremamente forte, que ainda não se pode dizer que sejam adequada-
mente previstos pelas soluções da teoria da relatividade geral. Os mais famosos destes sistemas são o
DI Herculis e AS Camelopardalis. No entanto, existem muitos fatores extras, relacionados a estrutura
interior das estrelas e da vizinhança, que devem resultar em grandes perturbações em seu movimento.
1
Vamos fazer um breve histórico de algumas das possibilidades que são de particular
interesse ao nosso trabalho, no que diz respeito a teorias para o campo gravitacional, antes
de examinarmos alguns aspectos da relatividade geral.
Uma primeira condição fundamental que qualquer teoria da gravitação deve satisfazer
é o princı́pio de covariância de Lorentz. O que significa que, na situação em que o
campo gravitacional for nulo, a teoria da relatividade especial (veja o Capı́tulo 12 e [3])
deve emergir naturalmente do arcabouço da teoria gravitacional. Esta condição deve
ser imposta sobre a teoria para que a mesma seja compatı́vel com a experimentação ,
que já é largamente verificada para este princı́pio. Uma segunda condição consiste na
obtenção da formulação clássica Newtoniana como uma situação limite na aproximação
de campo gravitacional fraco em regime de baixas velocidades. Como é bem conhecido,
nesta situação limite, a teoria clássica se ajusta bem aos dados experimentais. Uma vez
obtida uma formulação que respeite a estas condições assimptóticas, deve-se passar aos
testes padrões da gravitação , quais sejam: (i) desvio espectral; (ii) a deflexão dos raios
luminosos em um dado campo gravitacional; (iii) o atraso temporal dos pulsos de radar
emitidos (e refletidos) ao encontro de uma região de campo gravitacional crescente, como
por exemplo na direção dos planetas interiores (mais próximos do Sol); e por fim, (iv)
a precessão do periélio das órbitas planetárias. Para uma revisão sobre os testes padrões
da gravitação , veja as referências [4, 5, 6, 7, 8, 9, 10]. Estes testes são conhecidos como
testes de campo solar, e foram os primeiros realizados no intuito de se testar a teoria
da relatividade geral. Estes requerimentos são, como ponto de partida, indispensáveis a
qualquer boa teoria da gravitação .
Ao passarmos à formulação da teoria, surge a questão da escolha dos objetos matemá-
ticos que devem ser usados na sua construção . Podemos escolher, de forma geral, entre
uma formulação escalar, vetorial ou tensorial, a qual está intimamente relacionada com o
spin da partı́cula que carregará a interação gravitacional. Para os casos acima citados o
spin será sempre inteiro3 . Uma boa maneira de se resolver qual quantidade matemática é
mais adequada à descrição da gravitação consiste em estabelecermos qual deve ser a fonte
material para este fenômeno. Para isto, devemos impor que exista uma lei de conservação
envolvida, que será manifestada pela divergência nula do objeto representando a fonte
para a interação em questão. De inı́cio, já podemos descartar a formulação vetorial,
uma vez que o único objeto vetorial que conhecemos que tem associado a ele uma lei de
conservação é o 4-vetor corrente, assim uma teoria construı́da com este objeto em nada
diferiria do eletromagnetismo. Além disto, uma teoria construı́da com campos de spin 1
— vetorial — leva a dois tipos de potencial, um atrativo e outro repulsivo. E, uma vez que
a gravitação somente se manifesta atrativamente, não podemos usar tais objetos na sua
descrição matemática. Um histórico sobre as possibilidades de se formular tais teorias foi
realizado por Gupta, especialmente na referência [12]. A menos do 4-vetor corrente, existe
o tensor momentum-energia da matéria, Tµν , que é um objeto Lorentz-covariante e tem
dimensão de densidade de energia, assim como esperarı́amos de um bom candidato à fonte
material da gravitação . Com este tensor, à primeira vista, podemos dar prosseguimento
tanto à formulação escalar, tomando o traço de Tµν para representar a fonte material,
quanto a formulação tensorial, assumindo o tensor momentum-energia completo como
fonte material da teoria. O primeiro caso é particularmente problemático, pois como é bem
conhecido, o traço do tensor momentum-energia associado ao campo de Maxwell (teoria do
Com a melhoria da tecnologia dos rádio-telescópios nos últimos anos, tais problemas poderão ser avaliados
com maior precisão brevemente e uma resposta mais conclusiva poderá ser aferida.
3
Spin semi inteiro leva a problemas com respeito a obtenção de configurações de campo gravitacional
estático, que está em contradição imediata com os resultados da teoria Newtoniana. Para um breve
estudo sobre este assunto, veja o prefácio da referência [11].
2
campo eletromagnético) é identicamente nulo, logo, não contribuiria como fonte material
da gravitação caso a teoria que a representasse fosse escalar. Fato este que está em contra-
ponto com o princı́pio de equivalência Newtoniano4 , que estabelece que a massa de repouso
total de um sistema interage com o campo gravitacional. Poderı́amos ainda, construir
objetos escalares com o tensor momentum-energia utilizando contrações com 4-vetores,
como por exemplo com o 4-vetor velocidade. No entanto, de forma geral teorias escalares
à gravitação não são compatı́veis com os resultados experimentais. Para fins de revisão,
umas das melhores tentativas de teorias escalares foi formulada por Otto Bergmann, em
1955, e prescreve um valor para a precessão do periélio das órbitas planetárias que é 1/6
do valor correto e em sentido de precessão contrário ao observado [13]. Resta-nos assim,
o caso tensorial. Nesta formulação , a fonte dos efeitos gravitacionais é representada
pelo tensor de momentum energia da matéria, e em princı́pio, não apresenta problemas,
contrariamente ao que acontece para as teorias escalar e vetorial. Ora, se admitirmos a
fonte material do campo gravitacional sendo um tensor de segunda ordem, é natural que
façamos a escolha de um objeto tensorial também de segunda ordem para representar o
próprio campo gravitacional.
Vamos começar examinando a situação mais simples possı́vel, em que as equações
resultem ser lineares. O único critério que temos para nos orientar na derivação das
equações de campo, consiste na imposição de uma lei de conservação associada ao
tensor momentum-energia da matéria. A teoria que emerge deste procedimento é a bem
conhecida teoria de Fierz-Pauli [14] para campos de spin-2. Uma vez obtida a equação
de movimento, a construção desta teoria através de um princı́pio variacional é elementar,
ou seja, pode-se facilmente obter a Lagrangeana que resulta nestas equações . Entretanto,
um grave problema ocorre quando procuramos ajustar tal teoria à descrição dos efeitos
gravitacionais, qual seja, o limite de campo fraco e baixas velocidades não resulta na teo-
ria clássica Newtoniana. Este problema tem origem na lei de conservação envolvida para
a teoria linear onde encontramos que o tensor momentum-energia se conserva separada-
mente. Este processo gera uma inconsistência fı́sica, pois o próprio campo gravitacional
tem uma energia associada, e como qualquer tipo de energia interage gravitacionalmente,
esta energia deve também ser fonte do próprio campo, logo, o tensor momentum-energia
da matéria não pode se conservar separadamente. Eis a razão da teoria estritamente lin-
ear não corresponder ao limite clássico. Uma maneira de se contornar este problema é
somando às equações de campo a energia do campo gravitacional. Podemos realizar isto
facilmente se observarmos que a Lagrangeana da teoria linear tem associado a ela um
tensor de momentum-energia (que é de ordem 2 do campo), assim, podemos derivá-lo e
acrescentá-lo às equações . Agora, as equações que resultam, possuem uma lei de con-
servação e o limite Newtoniano é recuperado. Entretanto, surge aqui uma interessante
questão: como somamos às equações de campo um novo termo, que chamamos de ten-
sor momentum-energia do campo gravitacional, as mesmas foram modificadas, assim, a
Lagrangeana que as resulta não é mais a da teoria linear. Então, se derivarmos a nova
Lagrangeana para esta teoria, associada a ela haverá um novo tensor momentum-energia,
agora em ordem maior de não linearidade no tensor que representa o campo gravitacional.
E, se somarmos este objeto nas equações de movimento, as modificaremos novamente,
gerando um processo que se repete a cada ordem de correção da energia, apontando final-
mente para uma inconsistência nesta formulação . A única forma de tornarmos esta teoria
completa é somando todos os infinitos termos de energia que surgem da Lagrangeana do
campo corrigida em cada ordem. Uma excelente abordagem deste procedimento é apre-
4
Consequentemente com a observação , onde se pode medir efeitos gravitacionais relacionados com a
energia do campo eletromagnético.
3
sentada na referência [11]. Alguns autores demonstraram que a teoria que emerge desta
série infinita é exatamente a relatividade geral de Einstein [15, 16].
Um procedimento alternativo de tornar consistente uma teoria a partir da formulação
linear que exploramos acima, foi proposto por S. Deser e B. E. Laurent [17] e também
por C. G. Bollini, J. J. Giambiagi e J. Tiomno [18]. Nesta proposta eles introduzem um
objeto com divergência indenticamente nula construı́do com as projeções não locais do
tensor momentum-energia da matéria para ser fonte do campo gravitacional, resultando
assim em uma teoria consistente para a gravitação . Este tipo de teoria é chamada de
“quase linear”. Podemos dizer que a não localidade faz o papel da não linearidade. Tal
construção é capaz de prescrever a estrutura de campo esférico, se ajustando perfeita-
mente bem aos dados observacionais. Entretanto, falha em algumas predições que estão
fundamentalmente relacionadas aos efeitos da não-localidade introduzida nas equações
de campo. Estes problemas foram apontados por C. M. Will, no trabalho [19]. Existem
ainda diversas teorias alternativas propostas ao longo dos últimos anos, mas a maioria
apresenta problemas que as tornam não viáveis.
O ponto fundamental que separa a teoria clássica Newtoniana da teoria da relativi-
dade geral tem origem na introdução do princı́pio da equivalência Einsteiniano5 . Uma
formulação deste princı́pio diz que todos os corpos caem, em um dado campo gravitacional
externo, com a mesma aceleração , implicando que para um observador em um laboratório
que cai livremente no mesmo campo gravitacional, os corpos deverão ser observados como
se estivessem livres de aceleração . Assim, a medida que seus movimentos mecânicos são
considerados, os corpos se comportam como se o campo gravitacional estivesse ausente.
Ainda mais, Einstein postulou que, não somente as leis da mecânica, mas todas as leis da
fı́sica, deveriam se comportar em tal laboratório como se a gravitação estivesse ausente.
De forma mais rigorosa, este princı́pio determina que uma teoria da gravitação é uma
teoria métrica, ou seja, deve satisfazer aos postulados de metricidade, que são: (i) o
espaço tempo é deformado pela presença de um dado campo gravitacional, podendo as-
sim ser representado por uma estrutura métrica efetiva, distinta da Minkowskiana; (ii)
as partı́culas teste tem seus movimentos determinados pelas geodésicas desta geometria;
e ainda, (iii) se escolhermos um referencial local de Lorentz6 , quaisquer leis naturais de
origem não gravitacional, devem ser aquelas da relatividade especial, isto é, que satisfazem
aos princı́pios da relatividade especial.
Como podemos perceber, este princı́pio da equivalência determina que a estrutura
de propagação das partı́tulas7 testes (não importando a sua constituição material) é
universal. Entretanto, em seu conteúdo, este princı́pio não estabelece que a estrutura de
propagação da própria interação gravitacional deva ser, necessariamente, a mesma das
partı́culas materiais. Assim, para estarmos consistentes com o princı́pio da equivalência
basta impormos que a geometria do espaço tempo, determinada pelo campo gravitacional,
é universalmente sentida pelas partı́culas materiais. Ainda não há um único experimento
realizado que determine que o princı́pio da equivalência deva ser estendido no que diz
respeito à interação gravitacional.
Existe uma grande expectativa com respeito a possibilidade de detectarmos ondas
gravitacionais nos próximos anos. Nunca se construiu tamanho número de aparelhos de
5
Uma boa revisão sobre o princı́pio de equivalência e suas consequências experimentais pode ser
encontrada no livro do C. M. Will [7].
6
A escolha de um referencial local de Lorentz quer dizer que podemos sempre anular localmente o
campo gravitacional.
7
Estamos denotando por partı́culas, àquelas que podem ser descritas pelo tensor de momentum energia
da matéria. Assim, partı́culas podem ser massivas, como planetas ou elétrons, ou não massivas, como
fótons.
4
medida para tal fim como a partir dos anos 70, quando descobriu-se que a perda de
energia em um sistema estelar duplo colapsante — pulsar binário — estava fortemente
relacionada com a emissão de ondas gravitacionais. Tal observação garantiu o prêmio
Nobel de Fı́sica ao pesquisador J. H. Taylor (veja as referências [20, 21, 22]). Com isto
a comunidade cientı́fica entendeu que a existência destas ondas gravitacionais estivesse
sendo indiretamente comprovada por tal efeito, como de fato acontece, uma vez que todas
as outras formas de interação puderam ser calculadas e desprezadas para tal situação .
No entanto, até os dias de hoje, nenhum detector de ondas gravitacionais obteve qualquer
resposta conclusiva a respeito da observação direta destas ondas. E ainda mais, a sua
existência comprovada indiretamente através deste experimento nos diz pouco a respeito
da sua forma de propagação , uma vez que o efeito que resultaria de um pequeno desvio na
velocidade destas ondas seria certamente não detectável e talvez, até mesmo, confundido
com perturbações da galáxia próxima. Por isso, uma pergunta natural a se fazer é a
seguinte: a velocidade de propagação das ondas gravitacionais é a mesma encontrada
para os raios luminosos? Ou seria melhor perguntar: O princı́pio da equivalência pode
ser estendido para abarcar a própria interação gravitacional?
Vamos abordar aqui alguns aspectos da teoria da gravitação. Revisaremos a teoria da
gravitação universal de Newton, construiremos uma teoria de campos para a gravitação
dentro de uma aproximação linear, e finalmente examinaremos brevemente a teoria da
relatividade geral de Einstein e exploraremos algumas de suas soluções.
Por fim, salientamos que estas notas correspondem a uma compilação (essencialmente,
dos livros citados ao longo da apresentação ), e não contém contribuições pessoais ao tema
tratado. Para alcançar um aprofundamento nos aspectos apresentados nestas notas, o
leitor deve se dirigir às referências listadas no final do capı́tulo.
a interação gravitacional entre dois corpos pode ser expressa por uma força central,
atrativa, diretamente proporcional às massas dos corpos e inversamente proporcional ao
quadrado da distância entre eles.
Isac Newton, Principia, Livro III, Proposiç~
ao VII e corolário.
Matematicamente teremos
m1 m2
F =G ,
r2
onde G é uma constante que deve ser obtida experimentalmente, conhecida por constante
de gravitação.
A partir de um referencial O, podemos escrever
(~r2 − ~r1 )
F~12 = Gm1 m2 ,
|~r2 − ~r1 |3
onde F~12 simboliza a força atuante em m1 devido a interação com o corpo m2 . Adicional-
mente, notamos que F~12 = −F~21 .
5
Figura 1.1: Interação gravitacional entre dois corpos de massas m1 e m2 . Note que
F~12 = −F~21 (terceira lei de Newton).
Definimos o campo gravitacional ~g (~r) como a força por unidade de massa. Matematica-
mente esta definição é escrita na forma
N
F~ X (~r − ~ri )
~g (~r) = = −G mi . (1.4)
m i=1
|~r − ~ri |3
8
Atualizações deste valor podem ser obtidas no endereço http://physics.nist.gov/constants
6
Figura 1.2: Representação dos vetores posições no caso de um aglomerado de partı́culas
interagindo gravitacionalmente com uma massa externa m.
8
Figura 1.5: Distribuição contı́nua de massa: situação na qual o ponto de medida do
campo esta situado a uma distância muito grande da distribuição .
• Obs:
Vamos utilizar a seguinte notação:
x1 = x, x2 = y, x3 = z
9
Usando a notação de ı́ndices, a equação (1.10) pode ser apresentada na forma
1 1 X x k xk 1 X 0k 0l
k l
02 kl x x
≈ + + 3x x − r δ . (1.11)
|~r − ~r 0 | r k
r 3 2 k,l
r 5
Finalmente, o potencial gravitacional avaliado no ponto P (x, y, z), determinado pelo vetor
posição ~r, será dado por
GM G X k k G X kl xk xl
Φ(~r) = − − 3 x D − Q + ··· (1.12)
r r k 2 k,l r5
onde Z
M= dV 0 ρ (~r 0 ) (1.13)
V0
representa a massa total do aglomerado, e definimos os momentos de dipolo Dk e quadripolo
Qkl como:
Z
.
k
D = dV 0 x0k ρ (~r 0 ) (1.14)
V 0
Z
.
kl
Q = dV 0 (3x0k x0l − r02 δ kl )ρ (~r 0 ) . (1.15)
V0
• Obs:
1. Os momentos acima definidos são momentos de massa. Podemos continuar a
série (1.12) até quanto for necessário para descrever o potencial gravitacional
de uma certa distribuição de massa.
2. Nas expressões acima Dk representa as componentes do vetor de dipolo grav-
~ enquanto Qkl representa as componentes do tensor de quadripolo
itacional D,
↔
gravitacional Q.
3. Em geral, os planetas possuem formas que desviam da forma perfeitamente
esférica por pequenas diferenças. No caso do Sol, seu diâmetro equatorial difere
do diâmetro polar por uma quantidade da ordem de 10−5 . Esta diferença gera
um momento de quadripolo na expressão para o seu potencial gravitacional.
Um dos efeitos importantes gerados pela presença do termo de quadripolo é a
precessão do periélio das órbitas planetárias. No caso da precessão de Mercúrio,
o momento de quadripolo solar implica em uma precessão da ordem de uns
poucos segundos de arco por século. Este valor, no entanto, é pequeno quando
comparado à precessão devido à interação com outros planetas do sistema solar
(500 segundos de arco por século). Adicionalmente, a teoria da relatividade
geral (que será vista mais a frente) acrescenta mais ∼ 43 segundos de arco por
século para a precessão do periélio de Mercúrio.
4. Note que este mecanismo pode ser utilizado de maneira inversa; ou seja, a partir
da observação das perturbações da órbita elı́ptica (Kleperiana) de satélites or-
bitando um determinado planeta, podemos obter resultados precisos a respeito
da distribuição de massa deste planeta.
5. Para o caso de um sistema composto por uma Pdistribuição de partı́culas, o
momento de dipolo de massa é dado por Dk = mxk . Assim, uma vez que
..
o momentum linear total do sistema isolado se conserva, segue que Dk = 0.
Este resultado está diretamente relacionado com o fato de que não pode existir
radiação gravitacional de origem dipolar.
10
1.2.3 Massa inercial e massa gravitacional
Como é bem conhecido, corpos que se movimentam sob a ação exclusiva do campo grav-
itacional sofrem uma aceleração que não depende de suas propriedades fı́sicas. Esta lei
pode ser apresentada na seguinte construção. A equação de movimento de uma partı́cula
de massa m em um dado campo gravitacional (cujo potencial é Φ), é dada por:
d 2 xk ∂Φ
mi 2
= −mg k , (1.16)
dt ∂x
ou seja
mi a = mg g. (1.17)
Assim
mg
a= g. (1.18)
mi
Trocando em palavras
massa gravitacional
aceleração = × intensidade do campo gravitacional.
massa inercial
Uma vez que a aceleração experimentada pela partı́cula em um dado campo gravitacional
é sempre a mesma (independentemente do seu estado e de sua natureza), concluı́mos que
a massa gravitacional e a massa inercial devem manter a mesma relação para todos os
corpos, ou seja
mi ∝ mg . (1.19)
Por uma escolha adequada de unidades, podemos fazer com que
mi = mg . (1.20)
• Obs:
Se o corpo em consideração for extenso, então, a acelaração do seu centro de massa
será dada por
d 2 xk
Z
∂
mi 2 = − dV 0 ρg (~r 0 ) 0k Φ(~r 0 ), (1.21)
dt V0 ∂x
onde ρg (~r 0 ) representa a densidade de massa gravitacional do corpo e a integral é
tomada por todo o seu volume. Assim, a equação (1.16) somente será recuperada
caso ∂Φ/∂xk possa ser considerado constante ao longo do volume do corpo.
Em resumo, o princı́pio de equivalência Newtoniano somente será válido em campos
gravitacionais homogêneos com corpos suficientemente pequenos.
11
Figura 1.6: Forças de maré: Nesta representação , o sistema de coordenadas O0 está
adaptado a um corpo que cai livremente sob a ação do campo gravitacional terrestre.
• Obs:
O princı́pio da equivalência Newtoniano implica que corpos suficientemente pe-
quenos localizados em uma região de campo gravitacional suficientemente homogêneo
experimentam a mesma aceleração. Note, entretanto, que uma região de campo
gravitacional “suficientemente” homogêneo não significa “exatamente” homogêneo.
~ z) = − GM GM
~g (OP 2 ẑ = − ẑ. (1.22)
|~ro + ~z| (ro + z)2
~ 0 ) = ~g (~ro ) = − GM
~g (OO ẑ. (1.23)
ro 2
12
Assim, a aceleração da partı́cula em Pz relativa à origem O0 será
~ z ) − ~g (OO
~ 0) = − GM GM
~g (OP 2 ẑ + ẑ. (1.24)
(ro + z) ro 2
Mas, uma vez que z ro , podemos expandir o primeiro termo no lado direito de Eq.
(1.24) em série de Taylor, resultando em
" 2 #
~ z ) − ~g (OO
~ 0) = − GM 2z z GM
~g (OP 1 − + O ẑ + ẑ
ro 2 ro ro ro 2
2GM z
= ẑ. (1.25)
ro 3
Este resultado mostra que, relativo à origem O0 , a partı́cula em Pz experimenta uma força
repulsiva f~z dada por
2GM mz
f~z = ẑ. (1.26)
ro 3
Vejamos agora uma partı́cula localizada na posição Px (x, 0, 0). Esta partı́cula estará
sujeita a uma aceleração dada por:
~ x ) = − GM (~ro + ~x) .
~g (OP (1.27)
|~ro + ~x|3
~ x ) · ~x = − GM x
~g (OP , (1.28)
(ro 2 + x2 )3/2
No entanto, somente o primeiro termo desta expressão será mantido, uma vez quel ele
será o termo de primeira ordem em Eq. (1.29). Assim
~ x ) · ~x = − GM x .
~g (OP (1.31)
ro 3
Resumindo, uma partı́cula de massa m situada na posição x estará, relativamente à origem
O0 , experimentando uma força
GM m
f~x = − xx̂. (1.32)
ro 3
Similarmente, concluı́mos que para uma partı́cula situada em Py , segue:
GM m
f~y = − y ŷ. (1.33)
ro 3
13
Figura 1.7: Corpo esférico coberto por uma camada lı́quida em um laboratório em repouso
longe da ação de campos gravitacionais externos.
As forças f~ são denotadas por forças de maré, e atuam sobre um dado corpo em queda
livre de tal maneira a provocar, ao longo da direção radial, um “esticamento”, e ao
longo do plano perpendicular, uma “compressão”. A figura 1.7 resume graficamente estes
resultados. Como vemos, as forças de maré podem ser utilizadas como um mecanismo
para a detecção de um campo gravitacional. Somente na situação teórica onde o campo
gravitacional seja homogêneo, as duas configurações acima seriam indistinguı́veis.
• Obs: Forças de maré em notação de componentes.
Para um referencial cuja origem se encontra em queda livre sob a ação de um
dado campo gravitacional, a força de maré pode ser representada na seguinte forma
(notação indicial):
X ∂F k
k
f = xi i
, (1.34)
i
∂x x i =0
Mas
GM mx
Fx = F~ · ~x = − (1.36)
(ro 2 + x2 )3/2
conforme inferimos de Eq. (1.28). Assim,
∂Fx GM m ∂Fx ∂Fx
=− ; = =0 (1.37)
∂x x=0 ro 3 ∂y ∂z
e
GM m
fx = −
x. (1.38)
ro 3
Analogamente a expressão para fy , teremos, de Eq. (1.22)
GM m
Fz = F~ · ~z = − . (1.39)
(ro + z)2
Assim
∂Fz 2GM m ∂Fz ∂Fz
= 3
; = =0 (1.40)
∂z z=0 ro ∂x ∂y
e
2GM m
fz = z. (1.41)
ro 3
14
Figura 1.8: Corpo esférico coberto por uma camada lı́quida em uma laboratório em queda
livre em uma região de campo gravitacional.
A equação (1.34) pode ser reescrita em termos do potencial gravitacional Φ como segue
(das equações (1.2) e (1.5)):
X ∂ 2Φ
fk = − mxi i k . (1.42)
i
∂x ∂x
Vamos definir o objeto (tensor)
. 1 ∂F k 1 ∂ 2Φ
Rk oio = − 2 = (1.43)
mc ∂xi c2 ∂xk ∂xi
que chamaremos de tensor de forças de maré. Usando esta definição, encontramos que a
força de maré que atua sobre uma partı́cula localizada em um dado ponto xi , com respeito
ao referencial em queda livre, na aproximação xi ro , pode ser apresentada na forma
X
f k = −mc2 xi Rk oio . (1.44)
i
Para este caso analizado acima, Rk oio pode ser apresentado na forma matricial
1 0 0
GM
Rk oio = 3 2 0 1 0 . (1.45)
ro c
0 0 −2
A divergência de f k em uma região vazia do espaço é sempre nula. Este resultado pode
ser mostrado, para o caso geral, a partir da Eq. (1.42) e usando a equação de Poisson
(1.8) fazendo ρ = 0. Para o caso partı́cular examinado acima, temos que:
~ · f~ = ∂k f k
∇
X ∂xi
= −mc2 k
Rk oio
i
∂x
X
2
= −mc Ri oio = 0, (1.46)
i
15
1.3 O tensor energia-momento
1.3.1 Notação e definições
O intervalo de espaço-tempo ds2 é dado por
3
X
2 2 2 2 2 2
ds = c dt − dx − dy − dz ≡ τµν dxµ dxν , (1.47)
µ,ν=0
onde denotamos
xµ ≡ (ct, x, y, z). (1.48)
Usaremos a convenção de Einstein para a soma, segundo a qual ı́ndices repetidos (super-
escritos e sub-escritos) indicam um somatório. Assim, a equação (1.47) poderá ser apre-
sentada na forma compacta
ds2 = τµν dxµ dxν , (1.49)
onde τµν é o tensor métrico do espaço-tempo de Minkowski. Em notação matricial teremos
1 0 0 0
0 −1 0 0
τµν = 0 0 −1 0 .
(1.50)
0 0 0 −1
Da equação (1.47),
v2
2 2 2 2 2 2 2 2
ds = dt c − vx − vy − vz = c dt 1 − 2 . (1.51)
c
Definimos
v2
−2
γ = 1− 2 . (1.52)
c
Assim
γ 2 ds2 = c2 dt2 . (1.53)
Como pode ser facilmente entendido ds2 é invariante frente a transformações de Lorentz,
sendo, portanto, uma grandeza escalar. Vamos adotar
r
ds v2
= dτ = dt 1 − 2 . (1.54)
c c
Em um referencial ligado à partı́cula (referencial de repouso da partı́cula) teremos dτ = dt,
o que nos indica que τ deve ser sempre o tempo próprio da partı́cula. Mais especifica-
mente dτ é o intervalo de tempo medido por um relógio que se move com a partı́cula.
Denotaremos t como tempo coordenado.
Definiremos o quadri-vetor velocidade, ou simplesmente 4-velocidade, na forma
µ
µ . dx dt dx dy dz
u = = c , , , . (1.55)
dτ dτ dτ dτ dτ
dt
Uma vez que dτ
= γ, teremos
16
Denotando por m a massa de repouso de uma partı́cula, definiremos o quadri-vetor mo-
mentum, ou simplesmente 4-momentum, como
.
pµ = muµ . (1.57)
E = γmc2 , (1.59)
pi = γmv i . (1.60)
• Obs:
Usaremos em todo o texto letras gregas como ı́ndices de espaço-tempo (ex.: µ =
0, 1, 2, 3) e letras latinas como ı́ndices somente espaciais (ex.: i = 1, 2, 3).
O nosso objetivo agora é construir (ou identificar) um objeto matemático que carregue
toda a informação a respeito do conteúdo de energia e momentum de uma partı́cula, ou
conjunto de partı́culas. A motivação para isto está no fato de que, em relatividade, massa
e energia são ambos fontes de campo gravitacional, e uma vez que a energia aparece como
a componente temporal do 4-vetor momentum, é esperado que este objeto apareça na
construção.
• Obs:
Note que a energia relativı́stica E não é um escalar!
T µν uν = c2 ρuµ , (1.62)
17
que representa, a menos do fator c2 , a densidade de 4-momentum. Usamos acima
que, de Eq. (1.56),
2
uµ uµ = u0 u0 + ui ui = u0 + γ 2 v i vi
v2
= γ c − γ v = γ c 1 − 2 = c2 .
2 2 2 2 2 2
(1.63)
c
O tensor momentum energia de um sistema isolado é tal que possui divergência nula. Este
fato (que pode ser demonstrado facilmente) representa a lei de conservação do momentum
e energia, em sua forma diferencial.
Assim, para sistemas isolados,
∂T µν
= 0, (1.64)
∂xν
ou ainda, em notação mais compacta:
T µν ,ν = 0. (1.65)
Vamos, a seguir, explorar esta lei de conservação no contexto do modelo proposto em Eq.
(1.61) para um fluido em movimento.
Das equações (1.61) e (1.65),
h p i
ρ + 2 uµ uν − pτ µν = 0 (1.66)
c ,ν
ou
1 p 1
(ρuµ ),µ uν + ρuµ uν ,µ + 2
p,µ uµ uν + 2 uµ ,µ uν + 2 puµ uν ,µ − p,µ τ µν = 0. (1.67)
c c c
Podemos obter, a partir de Eq. (1.67), uma equação escalar projetando-a na direção de
uµ :
1
c2 (ρuµ ),µ + ρuµ uν uν ,µ + p,µ uµ + puµ ,µ + 2 puµ uν uν ,µ − p,µ uµ = 0 (1.68)
c
mas, uma vez que uµ uµ = c2 , segue que
uν uν ,µ = 0 (1.69)
e, de (1.68) resulta
1 µ
(ρuµ ),µ +
pu ,µ = 0. (1.70)
c2
Finalmente, introduzindo Eq. (1.70) em (1.67), obtemos
1 µ ν µν 1 µ ν
ρ + 2 p u u ,µ = τ − 2 u u p,µ . (1.71)
c c
• Obs:
No limite não relativı́stico de baixa velocidade
vc (1.72)
18
e baixa pressão
p ρc2 , (1.73)
obtemos, de Eq. (1.70), a equação da continuidade clássica:
∂ρ ~
+ ∇ · (ρ~v ) = 0; (1.74)
∂t
e de Eq. (1.71), obtemos a conhecida equação de Euler:
∂~v ~ 1~
+ ~v · ∇ ~v = − ∇p. (1.75)
∂t ρ
A equação (1.71) pode ser apresentada em uma forma mais intuitiva se reescrevermos o
termo uµ uν ,µ na seguinte forma:
dxµ ∂
ν
µ ν dx
u u ,µ = µ
dτ ∂x dτ
ν
d dx d 2 xν
= = . (1.76)
dτ dτ dτ 2
• Obs:
Todo o tratamento utilizado foi realizado considerando um espaço-tempo plano
com métrica de Minkowski τ µν . A generalização para espaços-tempos curvos é
operacionalizável requerendo o critério de covariância das equações. Neste caso, as
derivadas simples são substituı́das por derivadas covariantes e a métrica plana τ µν
é substituı́da pela métrica curva gµν .
19
ou fluxo de momentum. Assim, devemos procurar por um objeto que possa representar
todas estas formas de “energia”, da mesma maneira, em todos os referenciais Lorentzianos.
Um bom objeto que é conforme a estas caracterı́sticas e pode ser usado como fonte da
gravitação é o tensor momentum-energia da matéria, que denotamos por Tµν [5, 4].
Este objeto encerra toda a informação a respeito de qualquer tipo de matéria e energia
de origem não gravitacional. Note que, quando falamos energia, entendemos energia de
interação . Neste caso, Tµν carrega a contribuição da energia de interação entre a matéria
com ela própria e com o campo gravitacional, mas não a do campo gravitacional consigo
próprio.
Poderı́amos ser levados a pensar na possibilidade de considerar como fonte da gra-
vitação , o traço do tensor momentum-energia, T α α , que certamente é uma quantidade
Lorentz-invariante e representa uma densidade de energia. No entanto, se analisarmos
o caso do campo eletromagnético, vê-se que o traço do tensor momentum-energia cor-
respondente é identicamente nulo, de onde resulta que uma teoria construı́da com este
objeto determinaria que energia de origem eletromagnética não atuaria como fonte de in-
teração gravitacional. Fato este que entra em direta contradição com a experimentação .
Este problema aparece aqui, em consequência da teoria eletromagnética de Maxwell ser
linear. Em verdade, é possı́vel pensar na viabilização de uma formulação não linear
para o eletromagnetismo que resulte em um tensor momentum-energia com traço não
nulo, contribuindo finalmente para uma teoria construı́da de tal maneira a admitir este
escalar, T α α , como fonte material do campo. Entretanto, tal construção nos levaria por
outros caminhos, contrariamente ao que estamos propondo discutir neste trabalho. Uma
completa revisão sobre este assunto pode ser encontrada no livro sobre eletrodinâmica
não linear, escrito por J. Plebanski (veja ref.: [24]). Uma vez que a teoria de Maxwell é
teoria do eletromagnetismo por excelência, somos levados a aceitar o tensor momentum-
energia, simétrico e de ordém 2, como um bom candidato para representar a fonte do
campo gravitacional.
Desde que o termo de fonte é um tensor de ordem 2, vamos escolher o tensor potencial
gravitacional que denotaremos por φµν , para representar esta interação . Acrescentamos
ainda que φµν seja simétrico,
φµν = φνµ ,
e impomos que este tensor seja adimensional, isto é,
[φµν ] = 1.
A maneira mais geral de escrever as equações de campo, de tal forma que: (i) respeitem
ao critério de linearidade; (ii) sejam construı́das com derivadas de no máximo ordem 2, e
ainda; (iii) que contenham Tµν como fonte material, resulta na combinação que segue:
20
Para procurar o valor das constantes envolvidas, vamos estabelecer o princı́pio de
conservação da energia, ou seja, imporemos que o tensor momentum-energia, escolhido
para atuar como fonte do campo, tenha divergência nula
T µν ,ν = 0. (1.79)
a = −1, (1.81)
d = +1, (1.82)
b = −c. (1.83)
b = 1,
sem entrar em outros detalhes que esta escolha sugere [11]. Assim, temos as seguintes
equações de campo, lineares, para a descrição do campo gravitacional,
Reconhecemos a constante que resta, κ, como uma constante de acoplamento, e seu valor
pode ser fixado facilmente quando procurarmos pelo limite assimptótico da teoria, qual
seja, confrontando-a com resultados experimentais verificados na teoria Newtoniana.
Apesar de termos escrito as equações acima utilizando um sistema de coordenadas
cartesiano, as mesmas podem, sempre que necessário, ou conveniente, passar para uma
forma mais geral, válida em um sistema arbitrário de coordenadas no espaço tempo plano.
A justificativa é fundamentada no fato de que as equações obedecem ao princı́pio de
covariância, portanto, são válidas em qualquer sistema de coordenadas. Logo, para pro-
cedermos a tal generalização , devemos substituir as derivadas simples por derivadas
covariantes, com respeito a métrica geral γαβ , e substituir a métrica constante ταβ por
γαβ . Desta forma, a equação tensorial (1.84) pode ser reescrita como:
onde (;) simboliza a derivada covariante com respeito a métrica geral para o espaço tempo
plano, γµν . Desde que nada perdemos em generalidade, usaremos sempre o sistema de
coordenadas que torna mais simples as operações matemáticas. Só escreveremos as
expressões de maneira geral em sua forma final, quando for conveniente.
As equações lineares para campos de spin-2, foram primeiramente apresentadas por
M. Fierz e W. Pauli no trabalho [14], onde derivaram as equações de onda para partı́culas
com spin arbitrário em um dado campo eletromagnético.
21
1.4.2 Equações de Campo como Consequência de um Princı́pio
Variacional
De maneira alternativa a que realizamos para chegar à equação (1.85), podemos pensar
em construir a teoria linear da gravitação a partir de um princı́pio variacional, escrevendo
primeiramente uma Lagrangeana para representar o campo de spin-2, o que denominamos
de campo gravitacional, e dela derivar as equações de movimento seguindo o procedimento
usual que o princı́pio da mı́nima ação estabelece. Na literatura existem vários trabalhos
usando o formalismo Lagrangeano na derivação das equações lineares para a gravitação .
Uma boa revisão deste assunto pode ser encontrada no trabalho de W. E. Thirring,
indicada na referência [25]. Vamos usar a mesma motivação da seção 1.4.1 e aceitar
que a fonte do campo seja completamente determinada pelo tensor energia-momento da
matéria, Tµν . Vamos, então, procurar pela expressão mais geral possı́vel que possa ser
escrita em termos do potencial tensor, φµν , e derivadas de, no máximo, ordem 2. Note
que para resultar em equações de campo lineares, diferenciais de segunda ordem em φµν ,
a Lagrangeana deve ser de ordem 2 nas primeiras derivadas do potencial tensor. Com
estas caracterı́sticas, a quantidade mais geral pode ser escrita da seguinte maneira:
1
C1 φαβ,γ φαβ,γ + C2 φαβ ,β φγ α,γ + C3 φαβ ,β φγ γ,α + C4 φα α,γ φβ β,γ .
Lφ = (1.86)
κ
Em verdade, Lφ é a densidade de Lagrangeana do campo gravitacional, como fixaremos
a seguir quando avaliarmos a dimensão da constante de acoplamento. Esta expressão é a
mais geral no sentido em que qualquer outro termo que possamos construir desta forma,
pode ser convertido em um dos quatro já presentes em (1.86), a menos de termos de
superfı́cie, que não contribuiriam para a derivação das equações de campo.
Antes de prosseguir com o cálculo das variações , vamos examinar as dimensões fı́sicas
das quantidades que introduzimos. Da forma como escrevemos, a expressão (1.86) é uma
densidade de Lagrangeana, e como a Lagrangeana de um sistema fı́sico deve ter dimensão
de energia, implica que Lφ deva ter dimensão de densidade de energia. Assim, como o
tensor potencial, φαβ , foi escolhido para ser adimensional, podemos escrever as dimensões
de (1.86) na forma:
1 1
[Lφ ] = , (1.87)
[κ] L2
onde utilizamos
1
[φαβ,µ ] = .
L
Mas, impondo que
M L2 1
energia
[Lφ ] = ≡ ,
T 2 L3 volume
encontramos, comparando as expressões acima,
M L2 1 1 1
2 3
= .
T L [κ] L2
De onde resulta que a dimensão da constante de acoplamento deve ser dada por
T2
1
[κ] = = . (1.88)
ML força
Vemos assim, que a constante κ que aparece em (1.86) e também em (1.84), tem dimensão
de inverso de força. Então, visto que κ é uma constante dimensional e, como as únicas
22
constantes naturais que dispomos são a constante de Newton (G) e a velocidade da luz (c),
podemos encontrar uma relação de proporcionalidade entre elas. Vejamos, as dimensões
de G e c são, respectivamente,
L3
[G] = (1.89)
MT 2
L
[c] = . (1.90)
T
Desta feita, as equações (1.88), (1.89) e (1.90) podem ser combinadas de tal forma que
encontramos a seguinte relação :
G
[κ] = 4 . (1.91)
c
Ou seja, a menos de um fator numérico, multiplicativo, a constante de acoplamento, κ,
pode ser escrita em termos das constantes naturais c e G, na forma:
G
κ∼ . (1.92)
c4
Só poderemos escrever a expressão exata realizando algum teste observacional com a
teoria, ou mais diretamente, exigindo que a mesma se reduza, no limite de campo fraco e
baixas velocidades, ao caso Newtoniano.
A ação do campo gravitacional, Sφ , é construı́da como,
Z
1
Sφ = − d4 xLφ . (1.93)
c
S = Sφ + SM , (1.94)
δS = 0. (1.95)
Por enquanto, deixaremos em aberto a descrição da matéria por meio de uma La-
grangeana especı́fica e escreveremos somente que
Z
1
SM = d4 xLM , (1.96)
c
onde LM obedece à variação
1
δLM = T αβ δφαβ , (1.97)
2
a fim de que a variação da ação com respeito ao campo φαβ resulte no tensor de momentum-
energia da matéria.
Vamos considerar, então, a variação da ação total definida pela equação (1.94),
δS = δSφ + δSM = 0.
9
Veja a Seção 8.4.1.
23
De posse das relações acima definidas, a variação efetuada10 fornece,
Z
1 4 1
2 C1 φαβ,γ γ + 2 C2 φαρ,β ρ + C3 φ,αβ + 2 C4 τ αβ φ,τ τ + C3 τ αβ φτ σ ,τ σ
dx
c κ
1 αβ
+ T δφαβ = 0,
2
(1.98)
1
C1 = + (1.100)
4
1
C2 = − (1.101)
2
1
C3 = + (1.102)
2
1
C4 = − . (1.103)
4
Assim sendo, as equações de movimento tomam a forma já esperada, apresentada na
equação (1.84). Substituindo finalmente os valores das contantes na Lagrangeana (1.86),
resulta:
1
φαβ,γ φαβ,γ − 2 φαβ ,β φγ α,γ + 2 φαβ ,β φγ γ,α − φα α,γ φβ β,γ .
Lφ = (1.104)
4κ
(L)
Gµν uφµν − φα (µ,ν),α + φ,µν − τµν (u
=t tφα α − φαβ ,αβ ). (1.105)
A letra (L) indica que este objeto é linear na sua dependência no potencial tensor, φαβ .
Em termos deste objeto, as equações de campo podem ser apresentadas compactamente
como,
G(L)
µν = −κ Tµν , (1.106)
e a Lagrangeana Lφ pode ser convenientemente reescrita, a menos de termos de superfı́cie,
na seguinte forma:
1
Lφ = − G(L) φµν . (1.107)
4κ µν
Vemos então, que a teoria linear para campos de spin 2 pode ser facilmente derivada de
um formalismo Lagrangeano, como apresentamos nesta seção .
10
Devemos notar que abandonamos integrais de superfı́cie, admitindo que o tensor potencial gravita-
cional tenha suporte compacto.
24
1.4.3 Transformação de calibre
Como podemos notar, das equações de campo, uma dada solução de φµν continua a
ser solução se somarmos o objeto simétrico Λµ,ν . Em outras palavras, as equações de
campo, (1.106), são invariantes sob a seguinte transformação :
Isto significa que estas equações não determinam as soluções univocamente, mas a menos
de uma transformação , indicada pela expressão (1.108), gerando assim uma ambiguidade
na determinação das mesmas. Uma maneira de se tentar eliminar esta ambiguidade seria
pela introdução de certas condições . Vamos definir a seguinte condição sobre o tensor
potencial (Gauge de Hilbert):
1
φαβ ,β − τ αβ φ,β = 0, (1.109)
2
ou ainda, se introduzirmos a mudança de variável,
1
hµν ≡ φµν − τµν φ, (1.110)
2
obteremos,
hαβ ,β = 0. (1.111)
Em termos desta nova variável e usando as condições acima, as equações de campo se
reduzem à
t
uhµν = −κTµν . (1.112)
Esta é uma forma simples e muito conveniente de expressar as equações que resultam
desta construção linear. Nos capı́tulos que seguem, as usaremos para derivar algumas das
soluções necessárias para a verificação do limite Newtoniano. Mais detalhes a respeito
de introdução de condições sobre equações de campo, podem ser encontrados em vários
livros textos de gravitação , como por exemplo nas referências [5, 26, 4] dentre outras.
25
Então, as equações de movimento devem ser alteradas para a forma,
G(L)
µν = −κ (Tµν + tµν ) , (1.114)
(T µν + tµν ) ,ν = 0, (1.115)
que representa uma lei de conservação adequada, deixando as equações de campo repre-
sentadas pela expressão (1.114), livre de inconsistências.
O próximo passo consiste, necessariamente, em encontrar a forma explı́cita do novo
objeto, tµν . Aqui surge um interessante problema. É bem conhecido que existe um pro-
cedimento canônico de se obter o tensor energia-momento, associado a um campo, a partir
da Lagrangeana deste dado campo. No entanto, a Lagrangeana que construı́mos é tal que
resulta, juntamente com a matéria, nas equações de movimento (1.106), que, como já
vimos, não são completas. Assim, o tensor energia-momento que poderemos encontrar
a partir desta Lagrangeana, não poderá ser o tensor energia-momento completo para a
gravitação , mas apenas uma primeira aproximação deste. Entretanto, quando escrever-
mos este objeto — primeira aproximação — deveremos somá-lo às equações (1.106)
no intuito de as aproximar para a forma fechada (1.114), e esta operação , modificando
as equações de campo, modifica como consequência a Lagrangeana que as resulta de
um princı́pio variacional. Então, a fim de corrigir esta Lagrangeana de modo a acertar a
teoria nesta ordem, devemos acrescentar a ela o complemento adequado. Ora, uma vez
que a Lagrangeana agora está modificada, um novo tensor de energia-momento do campo
poderá ser derivado, resultando ser este — segunda aproximação — mais completo. É
evidente que este procedimento se extende indefinidamente, e em cada estágio, estaremos
com a teoria mais completa para descrever o campo gravitacional. A teoria final surge
quando realizarmos infinitas interações deste tipo.
A teoria que emerge deste procedimento é identificada com a relatividade geral por
alguns autores. Os primeiros esforços nesta direção , foram realizados por R. H. Kraichnan
[27, 28] e, na mesma época, por S. N. Gupta [29]. No entanto, um excelente exame a
respeito destas questões foi feito, independentemente, por R. P. Feynman em um curso de
gravitação que ministrou durante os anos de 1962-63 na Califórnia-EUA, e cujas notas de
aula foram recentemente publicadas por dois de seus alunos (veja ref.: [11]). Veja também
a referência [15], onde o assunto é apresentado em sua versão mais completa.
o princı́pio da mı́nima ação fornece uma quantidade conservada, dada pela expressão,
∂L
Λµ ν = ξ,µ − δµ ν L, (1.117)
∂ξ,ν
11
que chamamos de tensor energia-momento do campo ξ.
11
Uma boa discussão deste objeto é apresentada no livro do L. D. Landau e E. M. Lifshitz, na referência
[30]. Veja também a Seção 8.4.1.
26
Assim, o tensor energia-momento associado ao campo gravitacional pode ser obtido
por meio da expressão:
∂Lφ
tµ ν = φαβ,µ − δµ ν Lφ , (1.118)
∂φαβ,ν
onde Lφ é a densidade de Lagrangeana do campo, dada em (1.104). Vamos introduzir a
seguinte relação de derivação das derivadas do tensor potencial,
∂φστ,ω 1
= δ µ (σ δ ν τ ) δ ρ ω . (1.119)
∂φµν,ρ 2
ν
Finalmente, usando esta relação , o tensor momentum-energia, t(1)
µ , pode ser encontrado,
e resulta na seguinte expressão:
ν 1
t(1)
µ = φαβ,µ φαβ,ν − 2 φβ ν ,µ φβρ ,ρ + φα ν ,µ φ,α + φ,µ φνρ ,ρ − φ,µ φ,ν
2κ
δµ ν
αβ,γ αβ γ αβ ,α
− φαβ,γ φ − 2 φ ,β φ α,γ + 2 φ ,β φ,α − φ φ,α . (1.120)
2
Como já comentamos anteriormente, este tensor consiste apenas na primeira aproximação
do tensor completo, por este motivo escrevemos o indice “(1) ” na expressão acima. Desta
feita, as equações de movimento são reescritas, nesta ordem, na forma:
G(L) (1)
µν = −κ Tµν + tµν . (1.121)
No caso de fixarmos condições sobre o tensor potencial, φαβ , definidas pela relação
(1.111),
1
φαβ ,β = φ,α , (1.122)
2
o tensor t(1)
µν se reduz à forma,
δµ ν
(1) ν
1 αβ,ν 1 ,ν αβ,γ 1 ,α
tµ = φαβ,µ φ − φ,µ φ − φαβ,γ φ − φ φ,α . (1.123)
2κ 2 2 2
Note que, para reescrevermos esta última expressão em termos da variável hαβ , é necessário,
simplesmente, substituir a letra φ pela letra h.
O tensor momentum-energia do campo gravitacional associado à Lagrangeana da teo-
ria linear, para uma escolha de coordenadas harmônicas, foi primeiramente apresentado
por S. N. Gupta, quando examinava um método de quantização da teoria da relatividade
geral, em aproximação linear — veja Refs.: [31, 32].
T µν ,ν + t(1)µν ,ν = 0. (1.125)
27
Mas, da equação (1.123), reescrita em termos da variável hαβ , e tomada a sua divergência,
encontramos:
(1)αβ
1 µν,α 1 ,α
t ,β = tuhµν h − tuhh . (1.126)
2κ 2
Entretanto, se introduzirmos aqui as equações de campo, (1.124), e desprezando quaisquer
contribuições de ordem superior a que estamos tratando12 , ou seja, desprezando termos
de ordem O(φ3 ), a expressão acima se reduz à interessante forma,
1
t(1)αβ ,β = − Tµν φµν,α , (1.127)
2
donde a lei de conservação expressa pela relação (1.125), pode ser reescrita mais conve-
nientemente como,
1
Tα β ,β − φµν,α T µν = 0. (1.128)
2
Esta é a equação que representa o balanço de momentum-energia entre a matéria e o
campo gravitacional. A partir desta relação , podemos derivar a equação que governa o
movimento das partı́culas materiais imersas em um dado campo gravitacional fraco. Para
isto, começamos por integrar a equação (1.128) num volume V , fornecendo a relação
integral: Z Z
3 β 1
d xTα ,β = d3 xφµν,α T µν . (1.129)
V 2 V
e, como podemos estender a superfı́cie de integração para fora da região onde existe
conteúdo material, esta integração se anula, resultando assim:
Z Z
3 β
d x Tα ,β = d3 xTα 0 ,0 . (1.132)
V V
ML
[Pµ ] = = {momentum linear} .
T
28
Assim, de (1.129), Z
∂Pα 1
= d3 xφµν,α T µν . (1.134)
∂t 2 V
Para calcular a integração que aparece no lado direito da equação (1.134), vamos
usar dois argumentos. Primeiramente, façamos a hipótese de que o potencial tensor tenha
variação desprezı́vel sobre o volume da partı́cula, ou seja, pode ser considerado constante
nesta região. Desta forma, φαβ,µ pode sair da integração acima, restando,
Z
∂Pα 1
= φµν,α d3 xT µν . (1.135)
∂t 2 V
29
assim como o fizemos com o lado direito das equações (1.135). Até este ponto, podemos
apenas inferir que sua forma seja dada por termos do tipo
Pα ∼ {m uα ; m φαβ uβ },
desde que qualquer outro termo necessitaria de uma nova constante dimensional. De qual-
quer modo, uma maneira particularmente interessante de se obter a expressão procurada,
formalmente, é por meio de comparação com as equações de Euler-Lagrange, que são,
equivalentemente, as equações de movimento da partı́cula.
Para uma dada Lagrangeana, que seja função das coordenadas {xµ } e da 4-velocidade
uα , o princı́pio de Hamilton fornece as seguintes equações de movimento:
d ∂L ∂L
µ
− µ = 0. (1.143)
dτ ∂u ∂x
Se compararmos estas equações com (1.141), poderemos identificar os seguintes termos:
∂L
= Pµ (1.144)
∂uµ
e
∂L m
= φαβ,µ uα uβ . (1.145)
∂xµ 2
A equação (1.145) pode ser integrada imediatamente, fornecendo a expressão para a
Lagrangeana, L:
m
L = φαβ uα uβ + L0 (u), (1.146)
2
onde L0 (u) é a constante proveniente da integração com respeito a xµ , logo, uma função
arbitrária da 4-velocidade. Podemos encontrar a forma desta função L0 (u) impondo que
o limite assimptótico seja válido, i.e., para uma situação de campo nulo (φµν = 0), a
Lagrangeana deve se reduzir ao caso de uma partı́cula livre, para o qual,
m α
L0 = u uα . (1.147)
2
Assim, retornando à equação (1.146), escrevemos
m m
L= φαβ uα uβ + uα uα . (1.148)
2 2
Finalmente, de posse deste resultado, podemos derivar a expressão para o 4-momentum,
Pµ , através da relação apresentada em (1.144), fornecendo então:
Pµ = m uµ + m φαµ uα . (1.149)
d 1
(uµ + φαµ uα ) − φαβ,µ uα uβ = 0. (1.150)
dτ 2
14
Note que esta equação é independente da massa da partı́cula, já mostrando ser válido o princı́pio
de Galileu, ou seja, o movimento de uma partı́cula teste submetida a um campo de forças de origem
gravitacional é tal que independe da massa da partı́cula. Com isso, partı́culas de massas diferentes
sentem a mesma aceleração proveniente da interação com este campo.
30
A derivada da 4-velocidade com respeito ao tempo próprio é chamada de 4-aceleração ,
e é da ordem do próprio campo, implicando que a derivação do segundo termo entre
parênteses pode ser simplificada, resultando assim em:
duµ 1
+ φµα,β uα uβ − φαβ,µ uα uβ = 0. (1.151)
dτ 2
Lembramos que a única aproximação que utilizamos para derivar esta equação de movi-
mento, foi a aproximação para campo fraco. No entanto, não impomos limite para baixas
velocidades. Assim, se quizermos verificar o limite Newtoniano, deveremos impor uma
condição adicional, uma vez que a teoria é relativista. É o que realizaremos na próxima
seção .
dxk
uk = ≈ v k c. (1.154)
dτ
Das condições (1.152) e (1.153), vemos que termos de ordem v 2 e v φ poderão ser de-
sprezados nas equações que seguem, uma vez que são de ordem O(2) na aproximação
considerada. As equações de movimento se reduzem, para este caso, à forma:
dv k c2
+ c2 φk 0,0 − φ00 ,k = 0. (1.155)
dt 2
Desde que estamos interessados em examinar o caso estático, o segundo termo em (1.155)
se anula, restando
dv k c2
= φ00 ,k . (1.156)
dt 2
No entanto a equação equivalente na teoria Newtoniana é dada por:
dv k
= Φ,k , (1.157)
dt
onde Φ representa o potencial Newtoniano. Assim, comparando estes resultados, encon-
tramos:
c2
Φ = φ00 . (1.158)
2
31
Agora que já identificamos o potencial gravitacional para esta situação assimptótica,
vamos operar diretamente com as equações de movimento (1.124). Primeiramente, vamos
analisar as componentes do tensor momentum-energia, T µν , cujas componentes se reduzem
à:
T 00 ≈ ρ0 c2 ≈ ρ c2 (1.159)
T kµ ≈ ρ uk uµ ≈ 0. (1.160)
52 h00 ≈ κ ρ c2 (1.161)
52 hkµ ≈ 0. (1.162)
52 h ≈ κ ρ c 2 , (1.163)
e podemos escrever finalmente a expressão para o Laplaciano do campo φ00 , que já rela-
cionamos previamente com o potencial Newtoniano. Assim operando, encontramos
1
52 φ00 = κ ρ c2 . (1.164)
2
ou ainda,
κ ρ c4
52 Φ = . (1.166)
4
Porém, da teoria Newtoniana,
52 Φ = 4π G ρ. (1.167)
16 π G
κ= . (1.168)
c4
32
Nota
A densidade de Lagrangeana associada à teoria linear (aproximação linear) da gravitação
foi apresentada através da equação (1.148). Da mecânica Lagrangeana, pode ser demons-
trado que a expressão uα (∂L/∂uα )−L corresponde a uma constante de movimento. Assim,
usando este resultado na Lagrangeana encontrada em Eq. (1.148), teremos, após algumas
simplificações,
φαβ uα uβ + uα uα = c2 . (1.169)
Finalmente, usando a definição para a 4-velocidade, esta equação pode ser reapresentada
na forma
ds2 = (ταβ + φαβ )dxα dxβ . (1.170)
Esta expressão mostra claramente que na ausência de campo gravitacional (φ) o espaço-
tempo se reduz a forma plana Minkowskiana, e quanto φ 6= 0 (na presença de campo
gravitacional), ds2 corresponderá ao elemento de linha de um espaço-tempo curvo (em
geral).
33
• Obs:
Obviamente, existem efeitos devido a não homogeneidade do campo gravitacional,
mas os mesmos podem ser considerados desprezı́veis a medida que utilizamos um lab-
oratório de dimensões muito pequenas. Para fins práticos a dimensão do laboratório
utilizado no experimento deve ser tal que influência devida a não homogeneidade do
campo recaia, no valor medido para a grandeza em consideração , sobre algarismos
não significativos do valor medido.
Einstein foi ainda além e estabeleceu que, não somente as leis da mecânica, mas todas
as leis da fı́sica deveriam se comportar em tal laboratório como se a gravitação estivesse
ausente. Similarmente ao caso Newtoniano, vamos definir o princı́pio da equivalência
Einsteiniano da seguinte forma:
i) “O princı́pio da equivalência Newtoniano é válido;
ii) O resultado de qualquer experimento local não gravitacional é independente da
velocidade de queda livre do aparatus, bem como independente de onde e quando no
universo ele for realizado”.
• Obs:
A verificação do princı́pio da equivalência para uma dada teoria, candidata à
gravitação , implica para a mesma na verificação dos postulados de uma teoria
métrica para este fenômeno. Estes postulados estabelecem que o espaço-tempo,
preenchido pelo campo gravitacional, deve ser deformado pelo mesmo, podendo, as-
sim, ser representado por uma estrutura métrica, que definiremos através do tensor
g µν . (1.172)
sofre uma modificação quando o campo gravitacional está presente. Neste caso (o caso
linear) resulta que
ds2 = (τµν + φµν )dxµ dxν . (1.174)
Assim, podemos interpretar que uma partı́cula teste no espaço-tempo preenchido por um
campo gravitacional (que na aproximação linear foi denotado por φαβ ) “experimenta”
uma geometria efetiva, em geral curva, dada por
34
As equações de movimento desenvolvidas na seção 1.4 podem ser reapresentadas em
termos de gµν por simples substituição de φµν por gµν , uma vez que somente aparecem
termos contendo derivadas de φµν na expressão para o G(L) µν . Nesta representação , as
equações de campo ficam
• Obs:
A métrica do espaço-tempo na aproximação linear é τµν .
As equações exatas, não lineares para a descrição dos fenômenos gravitacionais não
podem ser derivadas por critérios puramente lógicos, e constituem uma lei fı́sica. No
entanto, podemos propor alguns aspectos que esperamos serem verificados pelas equações
de campo, e, a partir desses aspectos procurar pela sua formulação (da teoria).
Exigiremos que as equações de campo respeitem aos seguintes critérios:
(i) As equações de campo devem ser invariantes frente a transformações gerais de co-
ordenadas: desde que uma teoria da gravitação que incorpore o princı́pio da equivalência
deve admitir sistemas de referências não inerciais gerais, as leis devem ser tensoriais, de
modo que dois quaisquer sistemas de coordenadas arbitrárias não possam ser distinguidas
pela lei fı́sica.
(ii) As equações de campo devem ser diferenciais de segunda ordem no tensor métrico
gµν (x): a fim de resultar no limite correto da teoria Newtoniana.
(iii) As equações de campo devem admitir uma métrica de Lorentz como solução
particular.
(iv) As equações de campo devem ser lineares nas derivadas segundas de gµν (x): com
isto garantimos a unicidade das soluções .
(v) As equações de campo devem ser dez equações diferenciais para os campos gµν (x):
uma vez que o campo gravitacional deve ser descrito pelas dez componentes do tensor
métrico. Assim, as equações para gµν devem ser expressas através de tensores construı́dos
com gµν e suas derivadas, e dadas numa forma covariante tensorial.
A escolha mais simples que contempla os critérios acima estabelecidos pode ser apre-
sentada através de contrações do tensor de curvatura e da métrica (explicitamente), para
o vazio (ausência de matéria), na forma
T µ νkµ = 0, (1.179)
implica que
(Rµ ν + aRg µ ν )kµ = 0. (1.180)
35
• Obs:
15
– Estamos usando o sı́mbolo k para representar a derivada covariante
– Já utilizamos na expressão acima que
gµνkα = 0. (1.181)
1
a=− , (1.182)
2
o que resulta em
µ 1 µ
R ν − R∂ ν = 0; (1.183)
2 kµ
1 K
Rµν − Rgµν = − Tµν . (1.184)
2 2
Note que restam ainda duas constantes a serem determinadas (Λ e K).
Para uma região livre de matéria as equações de campo são dadas por
1
Rµν − Rgµν + Λgµν = 0. (1.185)
2
Uma solução gµν (x) dada em um sistema de coordenadas (xµ ) está determinada a
menos de uma transformação de coordenadas
0
xα → x α (x), (1.186)
que introduz na solução quatro funções arbitrárias. A fim de nos livrarmos desta arbi-
trariedade devemos impor 4 condições de coordenadas envolvendo gµν . Estas condições
não são covariantes e são satisfeitas por qualquer métrica somente quando um sistema
de coordenadas for escolhido. Assim, teremos 10 equações de campo e 4 condições
de coordenadas. Ainda, devemos lembrar que a identidade de Bianchi implica em uma
dependência entre algumas equações . Em verdade, temos apenas 6 equações indepen-
dentes. Desta maneira, temos 6 equações de campo e 4 condições de coordenadas,
resultando em dez equações para dez incógnitas.
As constantes K e Λ podem ser fixadas quando impomos que as equações de campo
(equações de Einstein) devem, no limite de campo fraco e baixa velocidade, reduzir à
teoria Newtoniana. Neste caso, pode-se mostrar que
16πG
K= (1.187)
c4
e Λ deve ser zero, ou ter um valor muito pequeno a ponto de não interferir com os
resultados experimentais conhecidos dentro da faixa de algorismos significativos.
15
Ao longo do texto serão usadas outros sı́mbolos, tais como “;” e “∇”. Veja a definição de derivada
covariante no Capı́tulo ??
36
A constante Λ é conhecida na literatura como constante cosmológica e o termo cos-
mológico Λgµν é interpretado em algumas situações como a energia do vácuo. Para ver
isto, vamos reescrever convenientemente as equações de Einstein na forma
c4 Λ
1 8πG
Rµν − Rgµν = − 4 Tµν + gµν . (1.188)
2 c 8πG
Nesta forma o termo cosmológico aparece como uma contribuição extra ao tensor momentum-
energia.
• Obs:
Mesmo admitindo um pequeno valor para Λ (de tal forma a verificarmos os resul-
tados experimentais conhecidos nos testes de campo solar), a presença do termo
cosmológico pode trazer modificações profundas em um cenário cosmomógico de-
scrito pelas equações de Einstein.
c4
1 8πG
uφµν − τµν t
t uφ = − 4 Tµν + Λτµν (1.189)
2 c 8πG
onde usamos também que Λ ≈ 0. Esta equação pode ser reescrita na forma
8πG 1
t
uφµν = − 4 Tµν − T τµν + Λτµν . (1.190)
c 2
t
uφµν = λτµν (1.191)
Finalmente, considerando o limite de baixa velocidade v << c e usando que φ00 = 2 cΦ2 ,
onde Φ é identificado com o potencial Newtoniano, a equação (1.191) se reduz a
c2
52 Φ = − Λ. (1.192)
2
Se relembrarmos da equação de Poisson [Eq. (1.8)]:
52 Φ = 4πGρ, (1.193)
37
Figura 1.9: Pontos ao longo da trajetória da partı́cula são determinados pelas coordenadas
xµ (τ ), onde τ é um parâmetro afim.
não termos problemas com o limite assimptótico, deixaremos de lado o termo cosmológico
a partir deste ponto16 , e consideraremos as equações de Einstein na forma
κ
Gµ ν = − T µ ν , (1.195)
2
ou, antecipando o valor da constante de acoplamento κ,
8πG µ
Gµ ν = − T ν (1.196)
c4
onde introduzimos o tensor de Einstein
1
Gµ ν = Rµ ν − Rg µ ν . (1.197)
2
38
• o limite de baixas velocidades:
v << c. (1.201)
d 2 xµ d2 xµ dt
≈ (1 − φ00 ). (1.208)
dτ 2 dt2 dτ
Assim, de Eq. (1.207), e dentro da ordem considerada, segue:
d 2 xµ
+ c2 Γµ00 = 0. (1.209)
dt2
Como estamos examinando a situação de campo estático, teremos que a componente
µ = 0 da equação (1.209) será identicamente nula, como esperado. A componente
espacial será tal que
d 2 xi c2
= − ∂i φ00 . (1.210)
dt2 2
Esta equação pode ser reapresentada na forma vetorial:
d2~x
2
~ c φ00
2
= −∇ , (1.211)
dt 2
39
e representa a equação de movimento de uma partı́cula teste. Comparando com os
resultados provenientes da mecânica Newtoniana, concluı́mos que o potencial Newtoniano
será identificado com φ00 na forma
c2 φ00
Φ= . (1.212)
2
1 κ
Rµ ν − Rg µ ν = − T µ ν , (1.214)
2 2
Mas
κ κ
R= T ≈ ρc2 . (1.215)
2 2
Assim, retornando à eq. (1.214):
κ κ
Rµν = − Tµν + ρgµν c2 (1.216)
2 4
A componente R00 será então
κρc2
R00 = − . (1.217)
4
Mas
Rµν = Γαµα,ν − Γαµν,α + termos de ordem superior. (1.218)
Assim, no regime de campo estático encontramos
1 1
R00 = −Γk00,k = − φ00,kk = − ∇2 φ00 . (1.219)
2 2
c4 κρ
∇2 Φ = . (1.220)
4
Comparando esta equação com a equação de Poisson, concluı́mos que
16πG
κ= .
c4
Desta maneira, mostramos que a teoria da relatividade geral contém a teoria Newtoniana
no seu limite de campo fraco e baixas velocidades.
40
1.6 A solução de Schwarzschild e aplicações
Encontrar soluções exatas para as equações de Einstein não é uma tarefa fácil, haja visto
o grau de não-linearidade que as mesmas apresentam. Ainda hoje, o estudo de técnicas
para obtenção de soluções exatas é um tema bastante pesquisado. Para uma revisão
sobre está questão, é aconselhável consultar a referência [33]. A primeira solução exata
das equações de Einstein foi obtida em 1916 por K. Schwarzschild, e constitui uma solução
para o tensor métrico gµν representando um campo gravitacional estático e esfericamente
simétrico, como é esperado que ocorra no caso de sistemas planetários como o sistema
solar. Ainda, a solução foi derivada para a região exterior a uma distribuição de massa
com simetria esférica. Vamos derivar esta solução a partir das equações de Einstein, e
para isto, seguiremos os mesmos passos realizados na derivação original de Schwarzschild
[34].
Vamos recorrer aos seguintes critérios:
1. O campo deve ser estático;
• Obs:
Em verdade os critérios (2) e (3) implicam em (1). Este fato foi demonstrado por
Birkhoff e é conhecido como teorema de Birkhoff.
• A hipótese (3) requer que A(r) e B(r) devem ser derivadas a partir das equações de
campo para o vazio:
Rµν = 0. (1.222)
• Obs:
Note que o limite 1.224 não precisa necessariamente ser 1, uma vez que, até este
ponto, não podemos identificar a coordenada r com distância radial.
41
Resta-nos agora utilizar a métrica proposta em Eq. (1.221) como uma solução-tentativa
para o problema. Devemos procurar por soluções de Eq. (1.222). Como já foi definido,
e
1
Γαµν = g αβ (gβµ,ν + gβν,µ − gµν,β ) . (1.226)
2
De Eq. (1.221) podemos escrever (na forma matricial):
A(r) 0 0 0
0 −B(r) 0 0
gµν = 2
(1.227)
0 0 −r 0
2 2
0 0 0 −r sin θ
Assim, usando Eq. (1.227) em Eq. (1.226) teremos as seguintes componentes não nulas
da conexão:
A0
Γ010 = = Γ001
2A
A0
Γ001 =
2B
B0
Γ111 =
2B
B0
Γ111 =
2B
r
Γ122 =−
B
r sin2 θ
Γ133 =− (1.228)
B
1
Γ212 = = Γ221
r
Γ233 = − sin θ cos θ
1
Γ133 = = Γ331
r
Γ233 = cot θ = Γ332 .
.
Denotamos Z 0 = dZ/dr.
Introduzindo os resultados acima em Eq. (1.225), e usando Eq. (1.222), resultam
A00 A0 A0 B 0 A0
R00 = − + + − =0 (1.229)
2B 4B A B rB
A00 A0 A0 B 0 B0
R11 = − + − =0 (1.230)
2A 4A A B rB
0
B0
1 r A
R22 = − 1 + − =0 (1.231)
B 2B A B
R33 = R22 sin2 θ = 0. (1.232)
Com todas as outras componentes sendo identicamente nulas. Como vemos, das 4 equações,
apenas três precisam ser resolvidas.
42
Consideremos a seguinte operação: (A/B)R00 + R11 . Assim
1 A0 B 0
− + =0
r A B
de onde concluı́mos que:
A0 B0
=− . (1.233)
A B
Podemos integrar esta equação na forma
d
[ln (AB)] = 0, (1.234)
dr
O que resulta em
AB = const. (1.235)
Esta constante pode ser obtida a partir da hipótese (4) [veja Eqs. (1.223) e (1.224)]; e
resulta:
AB = c2 . (1.236)
Logo, resolvendo para B:
c2
B= (1.237)
A
e retornando este resultado em Eq. (1.231), resulta
rA A0 A0
A
−1+ 2 + =0 (1.238)
c2 2c A A
ou
rA0 + A = c2
d
(rA) = c2 (1.239)
dr
com solução:
2 λ
A=c 1+ (1.240)
r
e, de Eq. (1.237):
1
B= (1.241)
1 + λ/r
Se retornarmos estas soluções nas equações de campo verificaremos facilmente que as
mesmas constituem uma solução para as mesmas. Concluı́mos então que
2 2 λ 1
ds = c 1 + dt2 − dr2 − r2 dθ2 − r2 sin2 θdϕ2 . (1.242)
r 1 + λ/r
Vamos passar agora à determinação da constante λ (que seguramente deve estar rela-
cionada à massa do objeto que produz o campo gravitacional).
Se considerarmos o limite de campo fraco, correspondente à região onde r 1, o
intervalo acima fica escrito na forma
2 λ 2 2 λ
dr2 − r2 dθ2 + sin2 θdϕ2 ,
ds = 1 + c dt − 1 − (1.243)
r r
43
e poderemos comparar com a expressão
conforme discutimos nas seções anteriores. Nesta situação identificamos [conforme Eq.
(46) nas notas da seção 1.5]:
2
φ00 = 2 Φ (1.245)
c
onde Φ representa o potencial Newtoniano. Finalmente, uma vez que
λ
φ00 = , (1.246)
r
e, do potencial Newtoniano associado a uma configuração esferica de massa
GM
Φ=− , (1.247)
r
resulta
2GM
λ=− . (1.248)
c2
Assim, a solução de Schwarzschild fica sendo
−1
2 2GM 2 2 2GM
dr2 − r2 dθ2 + sin2 θdϕ2 .
ds = 1 − 2 c dt − 1 − 2 (1.249)
cr cr
• Obs:
A presença do termo cosmológico altera a solução acima para
−1
Λr2 2 2 Λr2
2 2GM 2GM
dr2 − r2 dθ2 + sin2 θdϕ2 .
ds = 1 − 2 − c dt − 1 − 2 −
cr 3 cr 3
(1.250)
Note que neste caso a métrica não será assimptoticamente plana quando r → ∞.
– Sol
MSol = 1, 98 × 1030 kg
rSol = 6, 96 × 105 km
rs = 2, 94 km
– Terra
MT erra = 5, 98 × 1024 kg
rT erra = 6, 37 × 103 km
rs = 8, 86 mm
– Próton
MP roton = 1, 67 × 10−27 kg
rs = 2, 48 × 10−54 k
dxµ dxν
2
c , massa 6= 0
gµν = (1.255)
dτ dτ 0, massa = 0.
. dxα
ẋα = . (1.257)
dτ
Da Eq. (1.254), usando a notação acima e introduzindo a expressão para a conexão afim,
resulta
dẋµ 1 µρ
+ g (gρα,β + gρβ,α + gαβ,ρ )ẋα ẋβ (1.258)
dτ 2
que pode ser reescrita na forma mais simples:
d 1
(gλµ ẋµ ) = gαβ,λ ẋα ẋβ . (1.259)
dτ 2
45
Vamos expressar a métrica (1.251) como
• λ = 0:
d 3
c Aṫ = 0 (1.262)
dτ
• λ = 1:
A0 2
d 1
− A−1 ṙ = 2 0 2 2 2
c A ṫ − 2 ṙ − 2rθ̇ − 2r sin θϕ̇2
(1.263)
dτ 2 A
• λ = 2:
d 2
r θ̇ = r2 sin θ cos θϕ̇2 (1.264)
dτ
• λ = 3:
d 2 2
r sin θϕ̇ = 0 (1.265)
dτ
Vamos considerar as seguintes condições iniciais de movimento:
π
θ= e θ̇ = 0. (1.266)
2
Assim, usando Eq. (1.266) em Eq. (1.264) vemos que θ̈ e qualquer outra derivada de
ordem maior em θ serão nulas. Isto determina que a órbita fica confinada ao plano
θ = π/2.
As equações Eq. (1.262) e Eq. (1.265) podem ser integradas diretamente resultando
em, respectivamente
`2
2 2 2
ṙ = c ε − + b A, (1.269)
r2
ou ainda
`2
2 2 2 2m
ṙ = c ε − +b 1− . (1.270)
r2 r
46
A fim de descrevermos a trajetória das partı́culas, necessitaremos procurar pela expressão
de como r varia com a coordenada angular ϕ (lembrando que θ está fixada). Desta forma,
podemos escrever
2 2 2 2
2 dr dr dϕ 2 dr `2 dr
ṙ = = = ϕ̇ = 4 . (1.271)
dτ dϕ dτ dϕ r dϕ
du d2 u du mc2
2
2 +u =2 + 3mu (1.277)
dϕ dϕ2 dϕ `2
ou
d2 u mc2
+ u = + 3mu2 . (1.278)
dϕ2 `2
A menos do termo 3mu2 , esta equação corresponde à equação Newtoniana para a órbita
de uma partı́cula teste no campo gravitacional produzido por um corpo massivo pontual,
onde ` deve ser identificado como `N
dϕ
`N = r2 . (1.279)
dt
Na equação (1.278) o termo 3mu2 corresponde a uma perturbação quando comparado ao
termo mc2 /`2 , e portanto podemos considerar a solução da equação (1.278) por meio de
uma expansão perturbativa.
47
• Obs:
Para o planeta Mercúrio (que está sujeito ao campo mais forte) temos os seguintes
dados
hrorbital i = 5, 79 × 1010 m
perı́odo = 7, 60 × 106 s
Assim
∆ϕ
` ≈ r2 = 2, 78 × 1015 m2 /s
∆t
Comparando os dois últimos termos em Eq. (1.278):
3mu2 3`2
= ≈ 7, 68 × 10−8 ,
mc2 /`2 c2 r 2
O que mostra claramente que 3mu2 corresponde a uma correção do termo mc2 /`2 .
d2 u o mc2
+ u o = , (1.280)
dϕ2 `2
d2 u 1 3m3 c4
+ u 1 = 3muo
2
= (1 + e cos ϕ)2 . (1.284)
dϕ2 `4
ou
d2 u 1 3m3 c4 6m3 c4 e 3m3 c4 e2
+ u 1 = + cos ϕ + cos2 ϕ. (1.285)
dϕ2 `4 `4 `4
Uma vez que |cos ϕ| ≤ 1 e, para os planetas do sistema solar, a excentricidade é ≤ 0, 2,
podemos desprezar o último termo na equação (1.285). Ainda, o efeito do termo 3m3 c4 /`4
na equação (1.285) é somente de reavaliar as constantes que aparecem em (1.281). Uma
vez que estas constantes podem ser ajustadas aos valores observados, não precisamos nos
preocupar com este termo também. Então, só precisaremos determinar uma solução para
d2 u1 6m3 c4 e
+ u 1 = cos ϕ, (1.286)
dϕ2 `4
48
que pode ser encontrada na forma:
3m3 c4 e
u1 = ϕ sin ϕ. (1.287)
`4
Retornando à Eq. (1.282) conclı́mos que
mc2 3m3 c4 e
u= (1 + e cos ϕ) + ϕ sin ϕ. (1.288)
`2 `4
Vamos reescrever a Eq. (1.288) na forma mais conveniente
mc2
u= (1 + e cos ϕ + eδω sin ϕ) , (1.289)
`2
onde definimos
3m2 c2
δω = ϕ. (1.290)
`2
Note que (δω)2 δω 1. Então, podemos reapresentar a Eq. (1.289) como
mc2
u= [1 + e cos(ϕ − δω)] . (1.291)
`2
• Obs:
Vejamos a interpretação desta equação. A equação clássica de uma elipse com
excentricidade e e distância a partir da origem f (conforme mostra a figura 1.10), é
dada por
u = a(1 + e cos φ), (1.292)
onde
f
a= = semi-eixo maior
e
Então, em analogia com a construção apresentada para a equação (1.292), segue que Eq.
(1.291) representa a equação de uma elipse com excentricidade e e semi-eixo maior
mc2
a= . (1.293)
`2
49
Quando o argumento da função cosseno varia de 2π radianos, em Eq. (1.291), teremos a
coordenada angular ϕ variando de
ϕ = 2π + δω|ϕ=2π . (1.294)
Assim, a cada revolução o afélio (ou periélio) da órbita avança de uma quantidade δω,
dada por (retornando o valor de m):
6πG2 M 2
δω = . (1.295)
c2 `2
Usando os dados experimentais conhecidos para o planeta Mercúrio encontramos (usando
para ` o valor médio obtido anteriormente [imediatamente após Eq. (1.279)]),
δω = 4, 83 × 10−7 rad/revolução
ou
δω = 2, 77 × 10−5 o /revolução.
Desde que o perı́odo orbital de Mercúrio é τM = 7, 60 × 106 s e o da Terra é τT =
3, 16 × 107 s. Segue que
δω = 41, 43 arcsec/século.
• Obs:
– Um melhor ajuste para ` leva à
`2 = aGM (1 − e2 ) (1.296)
Assim, de (1.295):
6πGM
δω = , (1.297)
ac2 (1 − e2 )
resultando em
δω = 42, 99 arcsec/século.
50
Figura 1.11: Representação gráfica da equação da reta Eq. (1.306).
• Obs:
O tratamento perturbativo é válido neste caso pois estaremos interessados em testes
de campo solar. Neste caso, a menor distância possı́vel para uma partı́cula teste,
a partir da origem (que está fixada no centro do Sol), será o raio do Sol (situação
limite). Neste caso r = 105 GM/c2 . Assim, de (1.299):
3mu2 3m 3GM/c2
= = 5 ≈ 10−5 .
u r 10 GM/c2
51
Desta forma, a solução aproximada para este problema será
1 m
cos ϕ + 2 1 + sin2 ϕ .
u= (1.309)
Ro Ro
• Obs:
A solução (1.305) pode ser escrita na forma mais geral vo = Ro−1 cos(ϕ − ϕo ). Por
uma escolha conveniente de eixos fazemos ϕo = 0, e resulta na Eq. (1.305).
Como vemos da equação (1.309), a trajetória de uma partı́cula sem massa nas vizinhanças
de um corpo de massa M localizado na origem, se afasta de uma trajetória retilı́nea pelo
termo
m
1 + sin2 ϕ ,
Ro 2
que é uma perturbação quando comparado ao primeiro termo no lado direito em Eq.
(1.309).
A fim de calcular o desvio da trajetória retilı́nea, vamos considerar a mudança de
coordenada angular
π
ϕ = − δ. (1.310)
2
Em termos de δ a equação (1.309) se escreve como:
1 m
sin δ + 2 1 + cos2 δ .
u= (1.311)
Ro Ro
Quando r → ∞, teremos δ → ∆ 1, e u → 0. Assim
1 m
∆ + 2 (1 + 1) + O ∆2 ,
0= (1.312)
Ro Ro
de onde
2m
∆=− . (1.313)
Ro
O sinal negativo indica que a trajetória da partı́cula sofre um desvio para dentro com
respeito a trajetória retilı́nea determinada por Eq. (1.305). Uma vez que ocorre um
desvio angular na aproximação e no afastamento da partı́cula, concluı́mos que o desvio
total sofrido pela partı́cula será
4m 4GM
D = |2∆| = = 2 . (1.314)
Ro c Ro
Na expressão acima Ro representa a distância de máxima aproximação da partı́cula com
respeito à origem. A figura 1.12 apresenta a trajetória da partı́cula de acordo com os
resultados acima.
No caso do Sol, um raio luminoso cuja trajetória tangencia o disco solar, sofrerá um
desvio
D = 1, 74 arcsec
• Obs:
Valor experimental medido em 1952:
52
Figura 1.12: Desvio da trajetória retilı́nea Newtoniana, conforme previsto pela equação
(1.309). Esta figura não está em escala. A fim de que as relações angulares ficassem
evidentes, as distâncias ao longo do eixo Y foram encolhidas e o desvio angular aumentado.
53
1.7 Exercı́cios
1. Verifique a última igualdade na Eq. (1.1).
4. Mostre que as equações (1.15) e (1.16) se reduzem às equações clássicas (1.19) e
(1.20) no limite não relativı́stico.
T µ ν = (ρ + p/c2 )uµ uν − pδ µ ν .
. 1
Gµ ν = Rµ ν − Rδ µ ν ,
2
possui divergência identicamente nula.
(a) Suponha que Λ = 0 e mostre que a equação de Poisson pode ser obtida a partir
das equações de Einstein considerando-se a sua componente-00 na aproximação
de campo fraco e baixa velocidade.
54
(b) Suponha que Λ 6= 0 e reescreva a equação de Poisson apresentando o termo
contendo Λ.
(c) Suponha agora que Λ 6= 0 e T µ ν = 0. Neste caso, interprete o significado de Λ
a partir dos resultados obtidos anteriormente.
[2] A. Einstein, Annalen der Physik 49, 769 (1916). Traduzido para o inglês em The
Principle of Relativity. (Methuen, 1923. Reimpresso pela ed. Dover Publications);
[3] A. Einstein, em Zur Elektrodynamik Bewegter Körper. Annalen der Physik 17, 891
(1905). Traduzido para o potuguês em Textos Fundamentais da Fı́sica Moderna: H.
A. Lorentz, A. Einstein and H. Minkowski. (Volume I, “O Principio da Relatividade”.
Fund. Calouste Gulbenkian, Lisboa, 1971);
[4] S. Weinberg, em Gravitation and Cosmology: Principles and Applications of the Gen-
eral Theory of Relativity. (John Wiley & Sons, New York, 1972);
[6] H. C. Ohanian, em Gravitation and Spacetime. (W. W. Norton & Company, New
York, 1976);
[10] Ivano Damião Soares, Notas do curso de Gravitação ministrado na Primeira Escola
de Cosmologia e Gravitação (CBPF, Rio de Janeiro, Julho de 1991);
55
[11] R. P. Feynman, F. B. Morinigo e W. G. Wagner, in Feynman Lectures On Gravitation.
(Addison-Wesley Pub. Company, Massachusetts, 1995);
[12] S. N. Gupta, Eintein’s and Other Theories of Gravitation. Phys. Rev. 96, 1683 (1954);
[14] M. Fierz e W. Pauli, On Relativistic Wave Equations for Particles of Arbitrary Spin
in an Electromagnetic Field. Proc. Roy. Soc. 173A, 211 (1939);
[15] S. Deser, Self-Interaction and Gauge Invariante. J. Gen. Rel. Grav. 1, 9, (1970);
[19] C. M. Will, em Relativistic Gravity in the Solar System III. Experimental Disproof
of a Class of Linear Theories of Gravitation. Astrophys. J. 185, 31 (1973);
[20] J. H. Taylor, Discover of a Pulsar in a Binary System. Ann. N. Y. Acad. Sci. 262,
490 (1975);
[22] J. H. Taylor, Binary Pulsars and Relativistic Gravity. Rev. Mod. Phys. 66, 711
(1994);
[23] R. H. Dicke, Mach’s Principle and Equivalence. Em Evidence for Gravitational Theo-
ries. (Proceedings of Course 20 of the International School of Physics “Enrico Fermi,”
ed. C. Moller. Academic, New York, 1962);
[26] V. Fock, em The Theory of Space, Time and Gravitation. (Pergamon Press, Oxford,
1964);
[29] S. N. Gupta, Gravitation and Electromagnetism. Phys. Rev. 96, 1683 (1954);
56
[31] S. N. Gupta, Quantization of Einstein’s Gravitational Field: Linear Approximation.
Proc. Phys. Soc. A 65, 162 (1952);
[34] J. Foster & Nightingale, em A Short Course in General Relativity. (Longman Scien-
tific & Technical, Hong Kong, 2003);
57
Capı́tulo 2
Cosmologia I: Fenomenologia
Martin Makler1
2.1 Introdução
O leitor pode estar se perguntando o que significa a palavra fenomenologia no tı́tulo
deste capı́tulo. Por isso, vamos começar conceituando esse termo no contexto cos-
mológico. Como a palavra dá a entender, essa área possui uma conexão direta com
os fenômenos, ou seja, com o que é observado no Universo. Não se trata exatamente
da cosmologia observacional, que precisa lidar com um grande número de aspectos
relacionados à aquisição e tratamento dos dados (imagens, espectros, etc.), estratégias
observacionais, instrumentos utilizados, etc. Por outro lado, a cosmologia teórica en-
volve aspectos mais fundamentais relacionados a modelos e teorias de gravitação e
fı́sica de partı́culas. O foco principal da fenomenologia é exatamente a relação entre
as observações astronômicas e os modelos teóricos. Essa área tem tido um crescimento
vigoroso nos últimos anos graças ao vasto conjunto de dados observacionais voltados
para a cosmologia, coletados a partir de telescópios na Terra e no espaço, varrendo os
mais diversos comprimentos de onda da radiação eletromagnética, dos raios gama às
ondas de rádio.
Muitas pessoas se referem ao momento atual da cosmologia como “era de precisão”.
Embora esse termo possa ser discutido, não há dúvidas de que a cosmologia passou
por uma profunda transformação na última década. Há cerca de vinte anos, a dis-
persão nos valores da maioria das quantidades relevantes para a cosmologia chegava
facilmente a 100%. O parâmetro de Hubble (i.e., a taxa de expansão do Universo), por
exemplo, oscilava entre 50 e 100 Km/s/Mpc, dependendo do método de medida. As
medidas da densidade de matéria tinham incertezas comparáveis e não havia pratica-
mente nenhuma informação sobre a variação da taxa de expansão (i.e. a aceleração)
do Universo. Com as pesquisas detalhadas utilizando a radiação cósmica de fundo, os
levantamentos de posições de galáxias e as supernovas do tipo Ia, entre outros, esse
panorama mudou por completo. Para se ter uma idéia, a temperatura da radiação
1
Afiliação:ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ – Brazil.
58
cósmica de fundo é conhecida com uma incerteza de 0,1% e a densidade de matéria
ordinária (prótons e nêutrons) é estimada com uma incerteza de cerca de 3%.
Essa mudança qualitativa na cosmologia observacional deveu-se à disponibilidade de
dados em abundância, graças aos desenvolvimentos tecnológicos e ao interesse nessa
área de pesquisa. Para se ter uma idéia do volume de dados disponı́vel, um mapea-
mento ótico do céu, conhecido como Sloan Digital Sky Survey (SDSS), disponibilizou
publicamente em 2006 seu quinto data release, contendo imagens de 215 milhões de
objetos e espectros de cerca de 670.000 galáxias, totalizando uma base de dados de
mais de 9 TB. Por outro lado, a sonda espacial WMAP realizou um mapa completo do
céu na faixa da radiação cósmica de fundo (microondas) com uma resolução de algu-
nas dezenas de segundo de arco. De um modo geral, podemos dizer que a cosmologia
contemporânea se caracteriza por uma grande abundância de dados observacionais, ao
menos no que se refere a um conjunto de observáveis que inclui os mencionados acima
(distribuição de galáxias e aglomerados, radiação cósmica de fundo e supernovas).
Essa situação implica na necessidade de utilizar métodos estatı́siticos apropriados para
lidar com esse conjunto de dados, permitindo extrair a maior quantidade de informação
fı́sica a partir destes. Outra implicação da abundância de dados é a necessidade de
uma modelagem realista dos sistemas observados e dos métodos utilizados. Lembrando
de uma distinção apreendida nos cursos de fı́sica experimental, existem os erros es-
tatı́sticos e os sistemáticos. Quando há muitos dados, os erros sistemáticos passam a
ser dominantes. Isso significa que é preciso levar em conta de forma detalhada como
as medidas e indicadores estatı́siticos se relacionam com os processos fı́sicos que se
quer investigar. Longe de ser uma tarefa enfadonha, a necessidade de levar em conta
essas questões abre una nova janela de possibilidades para pesquisas tanto de cunho
mais teórico, quanto mais aplicado, em um terrenho bastante recente no contexto
cosmológico.
Infelizmente, tanto pelas limitações espaço-temporais, quanto pelo caráter introdutório
deste livro, não será possı́vel explorar a vasta área da fenomenologia em cosmologia.
O objetivo muito mais modesto deste capı́tulo é apresentar um breve panorama do
Universo observado e introduzir alguns conceitos e equações que permitem descrever a
sua estrutura e evolução. Naturalmente, em vários momentos procuraremos enfatizar
a conexão entre os modelos e as observações.
Quase todos os resultados deste capı́tulo serão baseados na chamada “cosmologia new-
toniana”, onde poderemos nos centrar nos conceitos sem a neccessidade de utilizar o
ferramental da relatividade geral. Através dessa formulação newtoniana da cosmolo-
gia poderemos abordar um grande número de fenômenos cosmológicos, incluindo a
dinâmica global (média) do Universo e a formação de estruturas em grande escala.
Procuraremos deixar claro as limitações dessa abordagem, apontado o que muda e o
que fica igual quando consideramos a cosmologia relativista. No próximo capı́tulo será
discutida em detalhes a cosmologia relativista.
59
Universo, introduzir o conceito de matéria escura, e apresentar as supernovas do tipo
Ia e a sua utilizade em cosmologia.
2.2.1 Galáxias
Pode-se escolher como marco do nascimento da cosmologia observacional a descoberta
da expansão do Universo. Como veremos mais adiante, essa descoberta foi feita a partir
de medidas do afastamento das galáxias. Esses objetos proporcionaram, portanto, as
primeiras formas de sondar o nosso Cosmos e continuam até hoje a ser uma das
principais fontes de informação para cosmologia. Nada mais justo do que começar o
nosso passeio pelo Universo falando um pouco sobre a natureza desses objetos. Nesse
caminho também procuraremos que o leitor se familiarize com algumas ordems de
magnitude das escalas cosmológicas2 .
Quase tudo o que vemos a olho nú no céu está contido na Via Láctea, a nossa galáxia.
No entanto, há bilhões de galáxias no Universo osbervável. A natureza extra-galáctica
das “nebulosas espirais”, ou seja, o fato desses objetos serem externos à Via Láctea
(constituindo outros “universos-ilha”, como nossa galáxia), só foi estabelecida na
década de 1920. Essa descoberta está intimamente relacionada à medida da distância à
galáxia de Andrômeda (M31, veja a fig. 2.1), que havia sido assunto de intenso debate
durante a década anterior (para uma cronologia resumida, veja as refs. [1, 2, 3]).
A questão chave é justamente a dificuldade de se realizar medidas de distância em
escalas astronômicas, já que apenas para as estrelas mais próximas é possı́vel medir
as distâncias de forma direta, através de sua paralaxe3 . Quase todos os métodos para
medir distâncias cosmológicas se baseiam no conhecimento de alguma propriedade
intrı́nseca do objeto (ou conjunto de objetos) que se quer observar. Por exemplo, se
sabemos a luminosidade L de um objeto, ou seja, a energia total por unidade de tempo
que ele emite, é fácil obter a sua distância, já que o seu fluxo observado (energia por
unidade de tempo e área) cai com o inverso do quadrado da distância (e o fluxo é
uma quantidade diretamente observável, ligado ao brilho aparente do astro). Uma
boa parte da cosmologia observacional do século XX foi dedicada à busca por relações
que permitam obter a luminosidade intrı́sica a partir de propriedades observáveis de
algum objeto. Um exemplo desse tipo de relação foi a proposta por Ernst Öpik4 em
1921. Öpik desenvolveu um método de medida de distâncias baseado na velocidade
de rotação das galáxias. Ele pressupôs que a razão massa/luminosidade (M/L) das
galáxias (espirais) é aproximadamente constante e que o seu brilho superficial também
não sofre grandes variações entre galáxias distintas. Com isso ele chegou à relação
L ∝ Vc4 , onde Vc é a velocidade circular máxima de uma galáxia, medida através da
largura das linhas do seu espectro. A partir desse resultado, Öpik encontrou que M31
2
As unidades de distância mais utilizadas em astronomia, e portanto em cosmologia observacional, são
o parsec (abrevia-se pc) e seus derivados. Veja o glossário (seção 2.10) para a sua definição e a conversão
para outras unidades.
3
A paralaxe é a variação na posição de uma estrela próxima em relação a estrelas distantes causada
pelo movimento da Terra ao longo do Sol. Esse efeito geométrico pode ser utilizado para medir a distância
de algumas estrelas usando trigonometria elementar.
4
Para uma breve biografia de Öpik, com a discussão de suas contribuições para a astronomia, veja
http://www.aai.ee/muuseum/Reprints/HTML/index.html?ernstopikcentenary.htm.
60
Figura 2.1: Imagem da galáxia de Andrômeda (M31) e de duas galáxias satélites, M31
(abaxio) e M110 (mais alongada, no canto superior esquerdo da foto). Crédito: T.A.Rector
e B.A.Wolpa/NOAO/AURA/NSF.
está a 750 quiloparsecs (kpc, veja o glossário) da Terra, uma distância bem maior do
que o tamanho estimado de nossa galáxia. Embora o seu resultado não tenha recebido
muita atenção na época (realmente as hipóteses que levaram a essa relação são um
pouco grosseiras), as suas idéias são a base de um método de medida da distância a
galáxias espirais utilizado até hoje, conhecido como método de Tully-Fisher.
Uma forma de medir distâncias melhor fundamentada do ponto de vista empı́rico
foi desenvolvida a partir dos trabalhos da astrônoma Henrietta Leavitt em 1911-12.
Leavitt estudou um tipo de estrela variável conhecido como cefeida e verificou que
havia uma relação entre o perı́odo de variação e o brilho máximo dessas estrelas.
Ela chegou a essa conclusão ao estudar 25 cefeidas na pequena nuvem de magalhães
(fig. 2.3). Supondo que elas estavam aproximadamente à mesma distância da Terra, a
relação entre o brilho aparente e o perı́odo de variação deveria ser uma conseqüência de
uma relação intrı́nsica entre perı́odo e luminosidade. Com isso, seria possı́vel saber a
distância relativa entre duas cefeidas, mas ainda faltava obter o chamado “ponto zero”,
que daria a distância absoluta das cefeidas. Pouco tempo após a descoberta de Leavitt,
Ejnar Hertzsprung (1913) e Harlow Shapley (1918) obtiveram medidas de distância
para cefeidas em aglomerados globulares utilizando um método estatı́stico associado
à paralaxe. Agora era possı́vel medir distâncias astronômicas utilizando cefeidas.5
N~
ao há refer^
encia a esta figura no texto
Em 1917, George Willis Ritchey descobriu estrelas “novas” em “nebulosas”, o que mo-
tivou Edwin Hubble a estudar a variabilidades desses objetos. Assim, Hubble acabou
descobrindo várias estrelas do tipo cefeida em M31. A partir das cefeidas, Hubble
obteve, em 1923, o valor de 275 kpc para a distância de M31, o que, embora estando
abaixo do valor obtido por Öpik, confirmava a sua natureza extra-galáctica. Essa foi a
evidência considerada decisiva de que Andrômeda estava realmente fora da Via Láctea
5
Para uma discussão mais detalhada sobre a medida de distância com cefeidas e a sua história, veja
a ref. [3].
61
Figura 2.2: Curvas de luz (variação do brilho em função do tempo) de quatro cefeidas na
galáxia M33 obtidas por Hubble. Fonte: referência [5].
e era o que hoje conhecemos como galáxia, encerrando o chamado “grande debate”
sobre a natureza desses objetos. É oportuno salientar que Hubble só pôde utilizar a
relação descoberta por Leavitt pois ele tinha acesso ao recém inaugurado telescópio
Hooker – o maior de sua época, com um espelho de 100 polegadas de diâmetro – o que
permitiu identificar estrelas individuais em Andrômeda e medir a variação do brilho
das cefeidas ali descobertas.
Uma medida moderna da distância a M31 fornece o valor 784 ± 13 ± 17 kpc (in-
cluindo os erros estatı́sticos e sistemáticos) [4]. Essa diferença é devida à existência
de duas populações (classes) diferentes de cefeidas, obedecendo a relações perı́odo-
luminosidade distintas6 , fato desconhecido na época das medidas de Hubble. Esse erro
sistemático se propagou também na estimativa da taxa de expansão do universo, como
mencionaremos mais adiante. Cabe ressaltar que o valor encontrado por Öpik, emb-
ora seja surpeendentemente próximo do valor atual, também estava sujeito a muitas
incertezas. O próprio pesquisador chegou a obter valores próximos de 400 kpc para a
mesma distância.
O método baseado em estrelas cefeidas ainda é muito utilizado para medir distâncias
de galáxias relativamente próximas e para determinar a taxa de expansão do Universo,
como será discutido nas seções (2.2.3) e (2.2.4).
idem
Tipos de Galáxias
62
Figura 2.3: Relação perı́odo-luminosidade das Cefeidas obtida por Henrietta Leavitt.
Magnitudes aparentes de 25 cefeidas na Pequena Nuvem de Magalhães em função do
logaritmo do perı́odo em dias. Os pontos superiores (inferiores) correspondem aos máximos
(mı́nimos) da luminosidade de cada estrela. Fonte: referência [7].
63
Figura 2.4: Imagem da galáxia de Andrômeda obtida por Hubble com a anotação “var”
ao lado de uma estrela variável. Crédito: Observatories of the Carnegie Institution of
Washington, Mount Wilson Observatory Historical Archive.
Em resumo, à medida que passamos de galáxias elı́pticas para espirais e depois para
irregulares, seguimos uma seqüência de estrelas velhas para estrelas novas, ausência
de gás e poeira para abundância destes e baixa formação estelar para alta formação
estelar.
As luminosidades das galáxias variam de 10−3 vezes a da Via Láctea até 5 vezes esta,
que equivale a 15 × 109 vezes a luminosidade do Sol. Há muito mais galáxias tênues
do que luminosas, mas a maior parte das estrelas está em galáxias com luminosidade
comparável à da Via Láctea.
Graças ao efeito Doppler, podemos medir a velocidade de rotação das galáxias. Por
exemplo, a partir de um espectro cobrindo diferentes partes de uma galáxia espiral
vista de perfil pode-se determinar a velocidade de rotação em função da distância ao
centro galáctico. Esse resultado, obtido tipicamente através do estudo algumas linhas
de emissão do gás (por exemplo a linha de 21 cm do hidrogênio), é chamado curva
de rotação. Durante a década de 1970, Vera Rubin — que nos anos 1950 já havia
descoberto a rotação das galáxias e proposto a existência da estrutura em grande
escala — obteve curvas de rotação para diversas galáxias [8]. A partir desses dados
é possı́vel fazer uma estimativa da distribuição de massa nas galáxias. Por exemplo,
supondo que o gás e as estrelas estão em movimento estacionário circular e utilizando
a lei de Newton temos:
M (r) [V (r)]2
G 2 = , (2.1)
r r
64
Figura 2.5: Detalhe da galáxia M100, localizada no aglomerado de galáxias da Virgem. Nos
destaques é possı́vel ver a variação de uma estrela cefeida, descoberta através do telescópio
espacial Hubble. Créditos: Dr. Wendy L. Freedman, Observatories of the Carnegie Insti-
tution of Washington, STScI e NASA.
onde V é a velocidade tı́pica das estrelas situadas a uma distância r do centro galáctico
e M é a massa no interior de sua órbita8 . Para estrelas e gás na periferia da galáxia,
a massa contida em sua órbita seria aproximadamente igual à massa total: M (r) '
Mgaláxia = const. Dessa forma, a velocidade deveria cair com a raiz quadrada da
distância, nas partes mais externas das galáxias.
As curvas V (r) × r preditas pela luminosidade observada (estrelas + gás) não con-
seguem explicar as velocidades medidas a grandes distâncias do centro galáctico (veja
a figura 2.9). Em vez de decair, a velocidade permanece aproximadamente constante a
grandes distâncias. Se adicionamos uma componente de matéria com uma distribuição
do tipo ρ ∝ r−2 à distribuição de massa detectada, é possı́vel reproduzir as velocidades
observadas. No entanto, não há sinal da matéria visı́vel em nenhum comprimento de
onda seguindo essa distribuição. Por isso, chamamos esta matéria de matéria escura.
Na maioria das galáxias, há de 3 a 10 vezes mais matéria escura do que matéria visı́vel.
Os halos de matéria escura se extendem por distâncias bem maiores que o raio visual
(óptico) das galáxias. É possı́vel que o halo da Via Láctea, por exemplo, se extenda
por centenas de kpc.
8
Naturalmente haveria correções devido à galáxia não ser esfericamente simétrica. No entanto, o termo
dominante da força gravitacional é o de monopolo e só queremos fazer uma estimativa do resultado.
65
Figura 2.6: A galáxia espiral M83. Crédito: Telescópio SOAR.
repete de forma bastante genérica para outras galáxias em que é possı́vel obter curvas
de rotação: não é possı́vel explicar essas curvas somente com a matéria luminosa.9
66
Figura 2.7: A galáxia elı́ptica gigante M87, situada no aglomerado de Virgem. Créditos:
David Malin e Anglo-Australian Observatory.
67
Figura 2.8: A Grande Nuvem de Magalhães é uma galáxia irregular, satélite da Via
Láctea. Créditos: Anglo-Australian Observatory/Royal Observatory, Edimburgh.
68
Figura 2.9: Curva de rotação da galáxia M33, segundo a referência [9]. A curva com
tracejado curto mostra a contribuição do disco da galáxia para as velocidades, enquanto a
com tracejado longo mostra a contribuição do gás. A curva contı́nua mostra o modelo que
melhor ajusta as velocidades obtidas observacionalmente. A curva com tracejado curto e
longo mostra a contribuição do halo de matéria escura inferida a partir da distribuição de
velocidades observada e do modelo utilizado para ajustar esses dados.
Além de surpreendente, o resultado obtido por Zwicky foi muito controverso e não foi
bem aceito na época de sua descoberta. O conceito de matéria escura só ganhou força
após os trabalhos de Vera Rubin na década de 70 mencionados acima.
14
Apenas uma referência posterior, de 1937 é fácil de ser obtida [13].
15
A velocidade de dispersão das galáxias em grupos é da ordem de 150 km/s.
16
O teorema do virial nos permite ter uma estimativa da ordem de grandeza dos aglomerados. Natural-
mente, modelos muito mais detalhados para a distribuição de velocidades das galáxias foram estudados.
A conclusão é sempre a mesma: a matéria escura domina a dinâmica dos aglomerados.
69
Figura 2.10: Aglomerado de galáxias de Coma (Abell 1656). Composição de exposições
em três filtros feitas com o telescópio de 90cm do Kitt Peak National Observatory. Crédito:
O. Lopez-Cruz (INAOEP) et al., AURA, NOAO, NSF.
Uma conseqüência natural da deflexão da luz por um corpo massivo, predita pela teoria
da relatividade geral, é a possibilidade da existência de lentes gravitacionais. Embora
seja um fato ainda pouco conhecido, Einstein obteve a equação de lente gravitacional,
a possibilidade de imagens duplas e a magnificação das imagens em anotações de
1912 [15]. Em 1924, Chwolson publicou o primeiro artigo sobre lentes gravitacionais
[16], mencionando a idéia de “estrelas duplas fictı́cias”. Ele também discutiu o caso
simétrico de duas estrelas exatamente alinhadas com a Terra, resultando em uma
imagem circular da estrela mais distante. Já em 1936, Einstein previu o aparecimento
de um “cı́rculo luminoso” para um alinhamento entre fonte e lente,17 e de duas imagens
magnificadas para dois objetos levemente desalinhados18 [17]. Em 1937 Zwicky notou
que seria muito mais provável observar o efeito de lente gravitacional em galáxias do
que em estrelas e que as lentes gravitacionais podem ser utilizadas como um “telescópio
natural” [13]. No mesmo ano ele propôs a utilização do efeito de lente gravitacional
para determinar a massa de aglomerados de galáxias.
A deflexão da luz, predita por Einstein em 1911 (com um erro de um fator dois) e com
a teoria de relatividade geral em 1915, foi confirmada experimentalmente durante o
eclipse solar de 1919 observado em Sobral, no Ceará (e também na na Ilha Prı́ncipe,
mas o resultado teve uma significância menor). Entretanto, apenas em 1979 foi de-
scoberta a primeira lente gravitacional: uma imagem dupla de um quasar, causada por
uma galáxia. A partir daı́ as lentes gravitacionais se tornaram uma área observacional
com inúmeras aplicações em astrofı́sica e cosmologia e que vem sendo explorada cada
vez mais. A primeira lente gravitacional formada por um aglomerado de galáxias foi
17
Hoje em dia essa configuração de lente é chamada de “anel de Einstein”, mas talvez devesse ser
chamada de “anel de Einstein-Chwolson”.
18
Para uma animação desse efeito, mostrando a distorção de uma radiofonte ao passar por trás de uma
galáxia, veja o link
http://www.usm.uni-muenchen.de/people/botzler/lecture/animated lens large.gif.
70
Figura 2.11: Velocidade de recessão das galáxias no aglomerado de Coma obtidas a partir
dos desvios para o vermelho. A velocidade de cada galáxia é mostrada em função de sua
distância angular ao centro do aglomerado. Também aparecem galáxias no mesmo campo
angular, mas que não pertencem ao aglomerado.
encontrada por acaso, por Roger Lynds e Vahe Petrosian e, independentemente, por
Soucail et al., em 1986 [19].
Além do efeito mais espectacular de gerar imagens múltiplas e arcos (conhecido como
efeito forte, veja a figura 2.12), as lentes gravitacionais podem produzir um efeito
fraco, para objetos mais distantes da linha de visada entre a Terra e a lente (ou
seja, o alomerado) ou para lentes em que não há suficiente concentração de matéria
no centro. Esse efeito consiste em uma deformação das imagens de galáxias situadas
atrás do aglomerado na direção tangencial (veja a figura 2.13). Tal distorção pode
ser extremamente sutı́l e detectável apenas estatisticamente para um grande número
de galáxias (ao contrário da fig. 2.13). Tanto o efeito forte, quanto o fraco, têm sido
utilizados para estimar massas de aglomerados. Os resultados são consistentes com os
obtidos a partir da dispersão de velocidades, ou seja, a maior parte de sua massa está
sob a forma de matéria escura.
Os aglomerados não são formados apenas por suas galáxias membro e pela matéria
escura. Eles são permeados por um gás rarefeito (basicamente Hidrogênio e Hélio) em
equilı́brio hidrostático (pelo menos em primeira aproximação). Para não colapsar sob
a ação dos fortes campos gravitacionais dos aglomerados, esse gás intra-aglomerado
tem que estar a temperaturas altı́ssimas, da ordem de 107 ∼ 108 K, correspondendo
a energias da ordem dos quilo-elétron-volts (veja o glossário 2.10). O gás emite fótons
nessa faixa de energia, que corresponde aos “raios-x moles”. De fato, as primeiras
observações em raios-x, na década de 197019 detectaram a emissão de aglomerados
nessa faixa do espectro eletromagnético. A partir do espectro em raios-x é possı́vel
determinar a temperatura do gás e, utilizando da hipótese de equilı́brio, obtem-se
uma estimativa do potencial gravitacional que “segura” o gás, ou seja da massa do
19
As observações em raios-x precisam ser feitas do espaço, pois a atmosfera é praticamente opaca nessa
faixa do espectro.
71
Figura 2.12: Região central do aglomerado de galáxias 0024+1654, situado a aproxi-
madamente 1,5 Gpc. Fica claro o efeito forte de lente gravitacional causado por esse
aglomerado, exibindo imagens múltiplas da mesma galáxia azul, distando o dobro que o
aglomerado. Esses arcos foram descobertos em 1988 por David Koo, do observatório Lick.
Crédito desta foto: W.N. Colley e E. Turner (Princeton University), J.A. Tyson (Bell
Labs, Lucent Technologies) e NASA/STScI.
aglomerado. Os resultados obtidos com essa técnica são consistentes com as estimativas
feitas a partir da dispersão de velocidades (veja a seção 2.2.2) e do efeito de lente
gravitacional (seção 2.2.2). Para aglomerados relaxados (ou seja próximos do estado
de equilı́brio) as estimativas de massa com esses três métodos diferem em cerca de
20% entre si apenas (veja, por exemplo, a ref. [20]), mantendo o resultado de que a
matéria em galáxias corresponde a poucos centésimos da massa total do aglomerado.
A partir da luminosidade em raios-x dos aglomerados (LX ∼ 109 − 1011 L , onde
L á a luminosidade total do Sol) é possı́vel obter a densidade do gás, que corre-
sponde a 10−4 − 10−2 partı́culas por cm3 . Mesmo com uma densidade tão baixa, o
gás intergaláctico responde pela grande maioria da matéria “comum” (não escura)
nos aglomerados. A massa em gás pode chegar a 20 vezes a massa das estrelas em
galáxias (massa luminosa). Ainda assim, a maior parte da massa dos aglomerados é
proporcionada pela matéria escura. A composição de um aglomerado pode ser resum-
ida da seguinte forma: 2-5% da massa em galáxias, 10-15% no gás intra-aglomerado e
80-90% em matéria escura.20
Além do ótico e dos raios-x, os aglomerados também são estudados no infra-vermelho
(onde são mais facilmente identificados do que no ótico), em ondas de rádio (onde há
menos contaminação por outras fontes) e em microondas. Nesse último caso, os fótons
não são emitidos pelo aglomerado, mas são provenientes da radiação cósmica de fundo
(RCF).
Como veremos mais adiante, existe uma radiação, na faixa de microondas, que per-
meia todo o Cosmos e é o resquı́cio de uma fase quente e densa do Universo. Nós
detectamos esses fótons vindos de uma camada muito distante, conhecida como su-
perfı́cie de último espalhamento. Em seu trajeto em direção à Terra um fóton da RCF
20
Para uma contabilidade mais detalhada sobre a contribuição de cada componente (estrelas, galáxias,
gás ionizado, etc.) para o conteúdo total dos bárions no universo, veja as refs. [21].
72
Figura 2.13: O aglomerado de galáxias Abell 1689. É fácil ver o efeito de lente grav-
itacional sobre as imagens de galáxias situadas atrás do aglomerado, criando arcos para
galáxias próximas ao seu centro e provocando uma distorção tangencial nas galáxias mais
distantes Crédito: NASA/STScI, N. Benitez (JHU), T. Broadhurst (The Hebrew Univer-
sity), H. Ford (JHU), M. Clampin (STScI), G. Hartig (STScI), G. Illingworth (UCO/Lick
Observatory), ACS Science Team e ESA.
73
Figura 2.15: Imagem da região central do aglomerado Abell 586 obtida pelo Gemini Multi-
Object Spectrograph (GMOS), no telescópio Gemini Norte. As curvas sólidas representam
regiões de igual intensidade (isofotas) da emissão em raios-x, medida pelo telescópio espa-
cial Chandra, espaçadas logaritmicamente. As curvas tracejadas representam a densidade
de massa reconstruı́da através do efeito fraco de lentes gravitacionais. Fonte: Cypriano,
et al. (ref. [20]), gentilmente cedida pelos autores.
pode interagir com os elétrons do gás intra-aglomerado (que é ionizado devido à alta
temperatura), ganhando energia. Esse processo é conhecido como efeito Compoton
inverso, pois são os elétrons que cedem energia aos fótons. Portanto, à raiz dessa in-
teração, a temperatura da RCF muda na direção dos aglomerados massivos, fenômeno
conhecido como efeito Sunyaev-Zel’dovich (SZ). Desse modo, olhando para a RCF en
alta resolução, é possı́vel detectar os aglomerados pelo efeito SZ. A grande vantagem
desse método é que o efeito SZ independe da distância do aglomerado a nossa galáxia.
A intensidade dos fótons emitidos pelo aglomerado, seja no ótico ou no raio-x, decresce
com o inverso do quadrado da distância, enquanto o efeito SZ permanece constante.
O efeito SZ é portanto um método promissor para detectar aglomerados distantes.
Há vários projetos sendo desenvolvidos para identificar aglomerados com esse método
e obter várias quantidades fı́sicas, como a sua massa. Entre os que estão operando,
podemos citar o Sunyaev-Zeldovich Array21 e o Arcminute Microkelvin Imager22 , que
cobrem áreas relativamente pequenas do céu. Está entrando em operação o South Pole
Telescope [22], que mapeará uma extensa área do céu e descobrirá da ordem de 40.000
aglomerados. Para maiores detalhes sobre as aplicações cosmológicas do efeito SZ, veja
a referência [23].
74
Quando um corpo emitindo ondas (por exemplo, eletromagnéticas, ou ondas sonoras)
está em movimento em relação a um observador, este detecta essas ondas com um
comprimento distinto do emitido. Em particular, se movimento é de aproximação em
relação ao observador, o comprimento de onda detectado é menor. Se o emissor se
afasta, o comprimento de onda aumenta. Como os elementos quı́micos emitem a ra-
diação em uma sequência bem definida de comprimentos de onda (linhas de emissão
ou absorção), é fácil medir o efeito Doppler através do espectro. Uma vez que uma
linha é identificada no espectro de um objeto celeste o comprimento de onda desta
(λr ) é comparado com o comprimento de onda de repouso associado a essa linha (λe ).
Assim, define-se o desvio para o vermelho (ou rubro desvio) pela relação
λr − λe
z := ,
λr
onde λr é o comprimento de onda detectado na Terra e λe é o comprimento de onda
emitido (ou seja, em repouso em relação à fonte). No caso não relativı́stico, o desvio
para o vermelho é dado por z = v/c, onde c é a velocidade da onda (no caso, a
velocidade da luz) e v é a velocidade relativa entre fonte e observador.
A primeira medida do desvio espectral de uma galáxia foi feita pelo astrônomo Vesto
Melvin Slipher em 1912. Utilizando o telescópio refrator de Lowel, ele obteve o espec-
tro de Andrômeda (M31) e mediu o seu rubro desvio. Ele precisou fazer uma exposição
de 40h em várias noites, para captar o espectro numa chapa fotográfica. Ele obteve
que M31 se aproxima de nossa galáxia a cerca de 300 Km/s. Depois ele mediu a veloci-
dade da galáxia de sombrero, que desta vez de afasta a uma velocidade de cerca de 100
Km/s. Em 1915, Slipher tinha medido os desvios para o vermelho de 15 galáxias (neb-
ulosas espirais, na época), dos quais 13 eram positivos, ou seja, as galáxias estavam se
afastando. Slipher continuou a observar mais galáxias e esse resultado se mantinha, ou
seja, a grande maioria tinha uma velocidade de recessão. Intrigado por esse resultado,
Hubble, com a ajuda de Milton Humason, repetiu as medidas de Slipher e obteve
os desvios para o vermelho de 46 galáxias, em 1929 (novamente, graças ao telescópio
Hooker de Monte Wilson, que era capaz de captar 17 vezes mais luz que o utilizado
por Slipher).
Como vimos na seção (2.2.1), Hubble mostrou que as nebulosas espirais eram extra-
galácticas, aplicando a relação perı́odo-luminosidade de estrelas cefeidas para obter
75
a distância de Andrômeda. Restava agora identificar variáveis cefeidas nas outras
galáxias para as quais eles dispunham do rubro desvio. O resultado foi apresentado
em 1929 e se tornou um mais conhecidos de toda a história da ciência. Hubble mostrou
um diagrama contendo as velocidades e distâncias de 24 galáxias individuais e de uma
combinação de galáxias separadas em 9 grupos (veja a fig. 2.17). O resultado evi-
denciava uma “relação aproximadamente linear entre as velocidades e as distâncias”,
precisamente o que era esperado de um Universo em expansão! No seu artigo, Hubble
conclui “The outstanding feature, however, is the possibility that the velocity-distance
relation may represent the de Sitter effect, and hence that numerical data may be
introduced into discussions of the general curvature of space” (ref. [24]), ou seja, ele
tinha noção das possı́veis implicações desse resultado no contexto da relatividade geral
(embora ele não tenha utilizado o termo expansão do Universo).
Figura 2.17: Diagrama original obtido por Hubble em 1929 (ref. [24]). A legenda original
diz: “Velocidades radiais, corrigidas pelo movimento do Sol, são graficadas em função das
distâncias estimadas pelas estrelas envolvidas e pelas luminosidades de nebulosas [galáxias]
em grupos. Os discos cheios e a linha contı́nua representam a solução para o movimento
solar [ou seja, em relação à Via-Lactea] usando nebulosas individuais. Os cı́rculos rep-
resentam a solução combinando as nebulosos em grupos. A cruz representa a velocidade
média de 22 nebulosas cujas distâncias não puderam ser estimadas individualmente. Nota:
aparentemente, naquela época era comum apresentar a velocidade em quilômetros (e não
em km/s!). Fonte: referência [24].
76
tro. Portanto, é conceitualmente errado associá-la a uma explosão. Explosões possuem
um centro, uma origem bem definida, a expansão cósmica não.
Também é importante enfatizar que o efeito linear é esperado apenas em distâncias
relativamente pequenas, menores que 1Gpc. O raciocı́nio que levou à linearidade não
leva em conta que: i) a taxa de expansão pode variar no tempo, ii) as observações são
feitas a tempos distintos, pela finitude da velocidade da luz (diz-se que as observações
são feitas no cone de luz ), iii) a curvatura do Universo pode afetar esse resultado.
Em 1931 Hubble conseguiu medir as distâncias e desvios para o vermelho de galáxias
vinte vezes mais distantes, o que confirmou o seu resultado de uma relação aproxi-
madamente linear [6]. Hubble já era famoso por ter resolvido o debate sobre a natureza
das nebulosas espirais. Agora ele virou estrela por ter descoberto experimentalmente
a expansão do Universo.
A relação de Hubble costuma se expressa na seguinte forma
v = H0 D,
77
Figura 2.18: Velocidade versus distância de galáxias, obtidas a partir de estrelas cefeidas
com o projeto Hubble Space Telescope Key Project (ref. [25]). Um ajuste desses dados
por uma reta fornece H0 = 75 ± 10 (estatı́sico) km s−1 Mpc−1 , em acordo, dentro das
incertezas, com o valor de H0 obtido a partir de métodos que se extendem a distâncias
maiores.
Para finalizar esta seção sobre o Universo osbervado, vamos falar das escalas que
vão além dos aglomerados. Embora a maior parte da matéria que se aglomera em
estruturas esteja formada por matéria escura, as galáxias podem ser consideradas
os “tijolos”, ou melhor, os marcadores da estrutura em grande escala no universo.
Portanto, para estudar as estruturas em grande escalas é preciso mapear as posições
das galáxias, preferencialmente em 3 dimensões. Medir a posição angular das galáxias
é bastante trivial, o difı́cil é obter estimativas de distâncias para um grande número
delas, sobretudo as mais distantes. Nesse caso não é possı́vel detectar estrelas cefeidas
e a probabilidade de observar uma supernova em cada uma delas é muito pequena. O
que se pode fazer é medir o desvio para o vermelho de uma fração das galáxias. Se todas
as galáxias seguissem a expansão homogênea do Universo, seria muito simples obter
a distância a partir do rubro desvio seguindo a relação de Hubble: D ' H0−1 cz. No
entanto, justamente devido às aglomerações locais de matéria, cada galáxia tem o seu
movimento próprio, além da expansão. É como se todas as velocidades pudessem ser
decompostas em vexp +vpec , onde vexp é a componente devida à expansão do Universo e
vpec é uma velocidade peculiar, de cada objeto. Podemos fazer uma analogia com uma
caixa contendo um gás. Se movemos a caixa a uma velocidade v, as moléculas desse gás
terı́am uma velocidade que á a combinação da velocidade relativa própria delas com o
movimento global, médio, que representa o movimento da caixa. No caso cosmológico,
a velocidade vexp aumenta com a distância. Já as velocidades peculiares não variam
com a distância (mas sim com a densidade local de matéria). Esse efeito é claramente
visı́vel na figura (2.11): as galáxias possuem um movimento próprio em relação a uma
média (nesse caso, da ordem de 7000 Km/s). Essa média é dada pelo afastamento
do aglomerado em relação a nós, devido à expansão do Universo. As velocidades
peculiares em aglomerados podem chegar a ser muito altas, justamente porque elas são
as maiores estruturas gravitacionalmente ligadas no Universo (veja a seção 2.2.2). Já
para as estruturas em escalas maiores, as velocidades são menores. A medida individual
do desvio para o vermelho de uma galáxia fornece cz = vexp + vpec = H0 D + vpec .
78
Figura 2.19: Velocidade versus distância de galáxias, obtidas com o projeto Hubble Space
Telescope Key Project (ref. [25]). Quadrados: supernovas do tipo Ia; cı́rculos cheios:
relação de Tully-Fisher; triângulos: plano fundamental; diamantes: flutuações de brilho
superficial; quadrados vazios: supernovas do tipo II. É mostrada uma inclinação de
H0 = 72 km s−1 Mpc−1 entre duas linas deslocadas de ±10%. Abaixo: valor de H0
em função da distância.
Claramente o primeiro termo aumenta com a distância. O segundo termo deve ficar
próximo de zero, num certo volume apreciável e fazendo uma média num grande
número de galáxias.
O resumo da discussão acima é que as velocidades peculiares impedem uma conexão
direta entre o rubro desvio e a distância. Num diagrama distância-rubro desvio isso
não é um problema, pois o que importa é a relação média. As velocidades peculiares
apenas causam uma dispersão e ainda assim, esta só é apreciável a distâncias menores.
Já para fazer um mapa da distância individual das galáxas a partir de z, isso poderia
ser um problema. No entanto, como foi dito, o efeito de vpec não é muito grande e não
influencia nas estruturas nas maiores escalas. Desse modo, um mapa de (z, θ φ) para
cada galáxia fornece uma excelente representação da estrutura em grande escala em
três dimensões (z é a coordenada radial e θ e φ são as coordenadas angulares). Um
mapa desse tipo é mostrado na figura (2.22).
Antes de que fossem feitos os primeiros levantamentos da distribuição de galáxias,
esperava-se que não houvesse estruturas em escalas maiores que aglomerados de
galáxias. Acreditavasse que, a partir dessas escalas, o universo deveria ser homogêneo.
Foi uma grande surpresa quando os primeiros resultados do CfA, na década de 1980
[47], mostraram a existência de complexas estruturas: super-aglomerados, filamentos,
paredes e vazios de matéria (voids). Os super-aglomerados são formados por grupos,
aglomerados e galáxias isoladas e têm dezenas de Mpc de extensão. Por exemplo, o
super-aglomerado local, onde está o nosso grupo de galáxias mede cerca de 30 Mpc.
Outro super-aglomerado próximo é o de Coma-Virgem. Os superaglomerados ficam
no cruzamento entre filamentos, que por sua vez aparecem na interseção de estruturas
achatadas, como o “grande muro” que tem dimensões da ordem de 80 Mpc por 220
Mpc. Portanto, a estrutura em grande escala do universo tem uma aparência ”espon-
josa” e que é predominantemente filamentar. Em escalas maiores, acima de centenas
79
de Mpc a alguns Gpc, o Universo tende à homogeneidade (veja, por exemplo a ref.
[51]).
Uma grande importância da estrutura em grande escala é o fato dela ter sido pouco
afetada pela dinâmica complexa que deu origem a estruturas menores, como os aglom-
erados. Nas maiores escalas, as flutuações de densidade são relativamente pequenas
ρEGE /ρuniverso . 1. Por isso, diz-se que elas são lineares. De fato, pode-se mostrar que
nesse caso, e num universo dominado por matéria escura, as flutuações mantêm a sua
forma original, aumentando apenas de amplitude (veja a seção 2.5.1). Ou seja, a forma
das perturbações de densidade na estrutura em grande escala guarda a memória de
heterogeneidades que estavam presentes em fases muito mais remotas da história do
Universo.
A distribuição de matéria em grandes escalas proporciona mais uma evidência para a
existência de matéria escura, já que num universo composto apenas por bárions, não
teria havido tempo suficiente para a formar as estruturas observadas (veja a seção
2.5.1, em particular o resultado 2.42).
Uma compreensão da distribuição atual de matéria em grandes escalas é crucial para
entender a origem das estruturas no universo e testar cenários detalhados de sua
formação. Por sua vez, a determinação desses cenários permite impor limites sobre os
parâmetros cosmológicos e as teorias do universo primordial que predizem as primeiras
flutuações.
80
o SDSS e cobrindo um volume quatro vezes maior. Apenar do projeto não ter espec-
troscopia, poderão ser feitas boas estimativas do rubro desvio, devido à informação
em cinco bandas do espectro (filtros). Depois de 2015, entrará em operação o Large
Synoptic Survey Telescope (LSST) que será capaz de cobrir todo o céu de sua área de
observação em poucos dias e atingirá magnitudes ainda mais profundas do que os pro-
jetos anteriores. No plano de espectroscopia, há projetos para construir espectrógrafos
capazes de captar cerca de 5000 espectros por exposição, proporcionando medidas
precisas do desvio para o vermelho para milhões de galáxias.
Alguns autores afirmam que, como há objetos com z > 1, isso implicaria em veloci-
dades superluminais, o que violaria a relatividade, de modo que não se pode inter-
pretar a expansão do universo como um afastamento real das galáxias, e sim como
a “expansão do espaço-tempo”. Essa afirmação é totalmente falsa, pois baseia-se na
equação não relativı́stica v = cz. O resultado exato da relatividade restrita para o
efeito Doppler é s
∆λ 1 + vc
z= = − 1.
λ 1 − vc
Portanto, para velocidades de recessão relativı́sticas, z pode atingir valores arbitraria-
mente altos. Assim, não há nenhum problema em se interpretar a expansão do universo
como um real afastamento das galáxias. Ao contrário, não é possı́vel separar fisica-
mente as velocidades como sendo uma ”velocidade de expansão” e uma “velocidade
real”. A separação entre um “fluxo de Hubble” e velocidades peculiares resulta apenas
das propriedades do nosso universo, que é aproximadamente homogêneo em grandes
escalas, com heterogeneidades que aumentam à medida que as escalas diminuem. As-
sim, é conveniente separar a descrição dinâmica em quantidades médias e perturbações,
como é feito na seção (2.5.1). Por incrivel que pareça, a interpretação da expansão do
universo ainda é assunto de debates. Para uma discussão e alguma bibliografia veja,
por exemplo, a referência [74].
81
do Universo, embora recheadas de estruturas, têm propriedades estatı́sticas semel-
hantes. Além disso, sabemos também que o Universo era muito mais homogêneo no
passado, com perturbações de uma parte em dez mil ((ρ − ρ̄)/ρ̄ ∼ 10−5 ).
Se bem hoje em dia temos muitas motivações para escolher um Universo homogêneo e
isotrópico como primeira aproximação, essa escolha não estava tão bem fundamentada
quando foram desenvolvidos os primeiros modelos cosmológicos com o advento da
teoria da relatividade geral. Naquela época, duas motivações devem ter norteado essa
escolha, a simplicidade e o “princı́pio de Copérnico”, segundo o qual não deveria haver
nem pontos nem direções privilegiadas no Universo.
De certa forma a história da cosmologia se confunde com a história da gravitação,
e é imprescindı́vel conhecer a teoria da gravitação (no caso, a teoria da relatividade
geral) para compreender a cosmologia. No entanto, neste capı́tulo, procuraremos uti-
lizar o mı́nimo possı́vel de resultados da relatividade geral, por questões pedagógicas,
de modo que ele seja accessı́vel às pessoas ainda não familiarizadas com a cosmolo-
gia relativı́sta. Grande parte dos resultados e conceitos aqui discutidos não requerirá
todo o arcabouço formal da gravitação. Ainda assim, eles incluirão os ingredientes
necessários para entender os modelos cosmológicos atuais. Portanto, partiremos agora
da mecânica newtoniana para construir um modelo para a dinâmica do Cosmos.
∇2 Φ = 4πGρ(~r, t).
82
de partı́culas vizinhas. Elas ficam indefinidas devido à divergência do potencial, ou
melhor, pela falta de condições de fronteira apropriadas.
Qual seria o valor do campo gravitacional ~g num meio infinito e homogêneo? Se
consideramos primeiro o campo dentro de uma esfera finita de raio R temos, pelo
teorema de Gauss, ~g = −(4π/3)Gρ~r (para r < R). Esse resultado não muda para
R → ∞ e logo serı́amos tentados a concluir que o campo está bem definido em qualquer
r finito. Suponha agora que estejamos no interior de um esferóide de excentricidade
e > 0. Nesse caso o campo gravitacional não é radial. A única diferença está na casca
entre o esferóide e a esfera nele circunscrita, no entanto o campo muda em todos
os pontos (exceto em r = 0). Extendendo esse esferóide indefinidamente, temos um
exemplo explı́cito em que o campo gravitacional depende das condições de contorno no
infinito. Outro problema é que, mesmo num espaço homogêneo o campo dependeria
fortemente da posição e da origem do sistema de coordenadas.
Vamos ver agora um modo de evitar esses problemas que nos permite construir uma
cosmologia newtoniana. Dessa forma, as condições de contorno no infinito já estarão
“embutidas” nas equações de movimento.
Como discutido na seção 2.2.3, as observações de galáxias distantes mostram que o
universo está se expandindo (há outras evidências da expansão do universo que irão
aparecendo nas seções seguintes e muitas que nem serão mencionadas neste capı́tulo).
Se a expansão fosse perfeitamente uniforme, as separações entre objetos co-móveis
com a expansão cósmica mudariam com o mesmo fator a(t), denominado fator de
escala do Universo. Na verdade sabemos que ela não é uniforme, mas podemos fatorar
a expansão média, ou seja, separar a dinâmica em uma parte global e homogênea e
perturbação em relação a esse comportamento médio. É nesse processo que desapare-
cerá a indeterminação de ~g . Para isso, é necessário utilizar coordenadas co-móveis ~x,
definidas pela relação25
~r
~x:= . (2.2)
a(t)
Também é conveniente utilizar uma nova variável temporal, o tempo conforme η,
definido pela relação26
dt
dη := . (2.3)
a(t)
1 da 1 da
H(t) := 2
= .
a dη a dt
25
As coordenadas cartesianas usuais de uma partı́cula ou elemento de volume serão denotadas por ~r.
26
A variável t, conhecida como tempo cosmológico, é o tempo próprio medido por um observador
co-móvel com a expansão média.
83
Note que ~v é a velocidade medida por um observador cuja coordenada co-móvel é fixa
(para esse observador, ~r = a ~x e portanto a sua velocidade é dada por (da/dt) (1/a) ~r =
H~r ).
Como sempre podemos multiplicar o fator de escala a por uma constante, é melhor
trabalhar com quantidades que são invariantes com relação a essa mudança, estas
serão chamadas de quantidades próprias. Assim H e vi = dxi /dη = (adri ) / (adt) são
quantidades próprias, enquanto dxi /dt não é. Essa é uma razão para utilizarmos η em
vez de t como variável independente.
Para deduzir as leis que governam a expansão média, consideraremos uma distribuição
esfericamente simétrica e uniforme com densidade ρ̄. Para que a homogeneidade seja
mantida, é preciso que todas as escalas se alterem por igual. Dessa forma a trajetória
de um elemento de volume de massa m será dada por r(t) = a(t)x com x fixo (difer-
entes valores de x denotam elementos de diferentes cascas esféricas). A equação de
conservação da energia para esse elemento de volume é
2
1 dr GM m
m − = E,
2 dt r
onde M é a massa contida numa esfera de raio r. Logo27
2
da
dt
x 4π
3
ρ̄ (ax)3 E
−G = .
2 ax m
Assim, obtemos
8πG 2
(aH)2 = ρ̄a − K,
3
onde K = −2E/mx2 . Essa equação é conhecida como equação de Friedmann. Para ter-
mos uma expansão homogênea, a função a (η) deve ser a mesma para todos os elemen-
tos de volume, logo devemos ter K = const. A equação de Friedmann que acabamos
de deduzir é idêntica àquela obtida utilizando a relatividade geral (eq. [aqui, citar a
eq. de Friedmann como aparece no curso do Novello]).28 Na relatividade geral pode-se
mostrar que K está relacionado à curvatura do espaço (ou seja, das hipersuperfı́cies
com η constante)[colocar referências para a(s) seção(ões) de relatividade geral e/ou
cosmologia relativı́stica]. A equação de Friedmann geralmente é expressa na forma
2
da/dt 8πG K
= ρ̄ − 2 . (2.5)
a 3 a
Para resolver essa equação ainda é preciso obter uma relação do tipo ρ̄ = ρ̄ (a (η)).
Para tal, primeiramente consideraremos o caso de matéria não relativı́stica, ou seja,
um fluido composto por partı́culas cuja energia cinética é muito menor do que a sua
massa de repouso.
Atenção: de agora em diante, para aliviar a notação, eliminaremos a barra para deno-
tar a densidade média, ficando implı́cito que ρ se refere à densidade média. Apenas na
seção (2.5.1) voltaremos a utilizar essa notação, dado que estudaremos as perturbações
sobre um fundo homogêneo.
27
Note que cada casca pode ter uma energia total diferente E(x). Ela é fixada pelas condições iniciais.
28
No entanto, na dedução acima ρ denota a densidade de massa, enquanto na relatividade a quantidade
que aparece é a densidade de energia. Quando a pressão não é relativı́stica, que é a situação relevante
para a formação de estruturas, essas quantidades são equivalentes.
84
Matéria não relativı́stica
ρ ∝ a−3 . (2.6)
Substituindo essa expressão na eq. (2.5) obtemos uma equação diferencial de 1a ordem
no tempo para o fator de escala a(t) [ou a(η)]
2 2
8πGρi a3i 1
1 da da
= = − K, (2.7)
a dη dt 3 a
onde ρi e ai são os valores de ρ e a num tempo ti dado. Essa equação pode ser
integrada para vários valores de K. Os diversos valores dessa constante determinam o
comportamento assintótico do fator de escala.
A conservação da energia
% = %0 + ε = nmc2 + ε, (2.9)
85
Nos cursos de termodinâmica vemos que, se não há produção de entropia, a con-
servação de energia leva a
dE = −pdV,
onde E é a energia (interna) contida num volume V (E = εV ) e p é a pressão. Um
volume que acompanha a expansão do Universo terá as suas dimensões proporcionais
ao fator de escala a (como no exemplo acima para matéria não-relativı́stica), ou seja,
ao longo da expansão, seu volume será proporcional a a3 . Nesse caso, a equação acima
leva a
a3 dε + 3εa2 da = −3pa2 da.
Se as partı́culas não são criadas nem destruı́das, o seu número total (nV ) não mudará
com a expansão, desse modo, temos a3 dn = −3a2 nda. Combinando essa expressão
com a equação acima e utilizando a (2.9), obtemos
da
d% + 3 (% + p) = 0. (2.10)
a
Essa é a equação da conservação da energia (veja a seção 3.49), quando levamos em
conta a contribuição da energia interna (através da pressão) para a densidade de
energia total. Podemos expressar a equação (2.10) em função da densidade de massa
(total, e não apenas de repouso) ρ = %c2 . Assim, teremos
p da
dρ + 3 ρ + 2 = 0. (2.11)
c a
Esse resultado é idêntico ao encontrado quando aplicamos a relatividade geral a um
Universo homogêneo e isotrópico, mesmo se há a criação de partı́culas.
Para processos adiabáticos e sem criação de partı́culas, a pressão é apenas uma função
da densidade30 , p = p (ρ). Nesse caso, podemos utilizar essa equação de estado na
equação (2.11) para obter ρ (a) . Substituido esse resultado na equação de Friedmann
(2.5), podemos obter a dinâmica do Universo.
ρ ∝ a−4 .
Mais adiante, veremos que esse resultado possui uma interpretação fı́sica simples. O
resultado acima ainda é válido no caso de um gás relativı́stico de partı́culas com massa,
30
Esse tipo de equação de estado é conhecido como barotrópico.
86
para o qual p ' ρc2 /3. Assim, quando a temperatura é muito alta e a energia cinética
das partı́culas é muito maior do que a energia de repouso, o gás se comporta como
radiação. Isso ocorreu, por exemplo, em uma época primordial da história do Universo.
Outro exemplo de interesse cosmológico é a equação de estado do vácuo p = −ρ, para
a qual obtemos ρ = const. De modo geral, uma equação de estado do tipo p = wρc2
possui solução analı́tica simples (ρ ∝ a−3(1+w) ).
Outras equações de estado menos simples, como p ∝ ρα ainda admitem uma
solução analı́tica para a equação (2.11). Nos casos em que ela não pode ser resolvida
analı́ticamente, basta resolver a equação diferencial, ou converter a solução em uma
integral.
87
que a expansão cósmica, então essa partı́cula fica em equilı́brio. Quando a densidade
diminui, a taxa de espalhamento é reduzida. Se ela for menor que a taxa de expansão,
a partı́cula perde contato com o resto do plasma cósmico. Muitas partı́culas passaram
por esse processo, conhecido por desacoplamento, no universo primitivo.
Hadronização
Quando a temperatura era por volta de 1GeV (∼ 1013 K), a matéria bariônica estava
sob a forma de um plasma de quarks e glúons. Quando ela baixou para uns 200 MeV
(∼ 2 × 1012 K), por volta de 10−4 s após o Big-Bang, houve a hadronização e foram
criados os bárions (e anti-bárions) e os mésons.
Aniquilação próton-anti-próton
Recombinação
88
Evento T (Kelvin) t (segundos)
Tempo de Plack — inı́cio da era clássica (?) 1032 10−43
Transição de fase GUT — báriogênese (?) 1029 10−37
Hadronização — aniquilação p − p̄ 1012 10−4
Nucleossı́ntese — formação de He, D, Li 1011 − 109 10−2 − 102
Igualdade matéria–radiação 104 1012
Recombinação — desacoplamento dos γ 103 1013
Primeiras estrelas e galáxias — H2 é formado 102 1015
Aglomerados de galáxias, QSOs 10 1017
Agora 3 4 × 1017
Tabela 2.1: Algumas etapas importantes na evolução cósmica. As transições com ponto
de interrogação se referem a fases para as quais não há evidências observacionais ou cujos
mecanismos fı́sicos ainda são desconhecidos. A última coluna denota o tempo transcorrido
desde a extrapolação para um “instante inicial” até a referida etapa.
Formação de estruturas
Como veremos mais a diante, o crescimento substancial das pequenas flutuações pri-
mordiais ocorreu quando o universo passou a ser dominado pela matéria. A matéria
escura começou a se aglomerar por causa da atração gravitacional. Regiões ligeira-
mente mais densas do que a média (tipicamente um milésimo mais densas, na época
do desacoplamento) acabaram gerando grandes concentrações de matéria criando uma
estrutura rica e variada.
Há ainda outras transições de fase que o universo pode ter sofrido, mas que ainda são
mais incertas: transição eletrofraca, transição da grande unificação, quebra da super
simetria, inflação, etc.
33
Esse nome não é muito apropriado no sentido que o Universo fica neutro pela primeira vez na sua
história. Pode-se falar alternativamente na “época do desacoplamento”, embora as duas coisas não sejam
exatamente a mesma...
89
2.5 O Universo Perturbado
As observações da radiação cósmica de fundo e da distribuição de galáxias mostram
que o Universo é homogêneo e isotrópico em grandes escalas (da ordem de Gpc). Entre-
tanto, ele se mostra heterogêneo em escalas menores, exibindo um padrão complexo
de grandes estruturas filamentares, regiões vazias e superaglomerados (veja a seção
2.2.4), com dimensões tı́picas da ordem de 10 - 100 Mpc. Nessas escalas, as flutuações
na densidade média de matéria são relativamente pequenas ((ρ − ρ̄)/ρ̄ ' 1). Diz-se
que elas estão no regime linear, pois podem ser tratadas como pequenas perturbações
sobre um fundo homogêneo. Em escalas ainda menores, correspondendo às galáxias
e aglomerados, as flutuações são não lineares ((ρ − ρ̄)/ρ̄ 1). Entender a complexa
distribuição de matéria no Universo nas diversas escalas é um dos grandes desafios da
cosmologia moderna.
O estudo do problema de formação de estruturas em cosmologia, utilizando uma teoria
relativista da gravitação, foi inaugurado em 1946, pelo artigo pioneiro de Lifshitz [75].
Neste trabalho foi mostrado como se comportam as perturbações na densidade em
um modelo cosmológico isotrópico e homogêneo, no regime linear (veja seção 2.5.1).
Desde aquela época, a área de formação de estruturas no universo tem sido uma das
mais ativas da cosmologia e da astrofı́sica, tanto em seus aspectos teóricos quanto
observacionais.
Os modelos atuais levam em conta o processo de geração das flutuações e a evolução dos
modos perturbados ao longo das diferentes fases da evolução do Universo. Processos
não lineares também têm sido abundantemente estudados, o que permite compreender
a formacão de estruturas até as dimensões dos aglomerados de galáxias. No que se ref-
ere à formação de galáxias, aglomerados e super-aglomerados, não é possı́vel limitar-se
a uma aproximação linear de modo que outra abordagem é necessária. O desenvolvi-
mento recente de simulações numéricas de N-corpos levou a uma verdadeira revolução
na área, permitindo modelar detalhadamente a evolução não linear das estruturas.
Tais simulações chegam a envolver sistemas com 1010 partı́culas que se movem sob a
ação de sua própria gravidade num Universo em expansão (veja a seção 2.5.2).
Como se não bastassem os avanços teóricos, computacionais e observacionais men-
cionados acima, o estudo das estruturas em grandes escalas tem tido um interesse
renovado como meio de estudar a energia escura, uma componente de matéria-energia
que responderia por cerca de 80% da densidade cosmológica. A compreensão da ener-
gia escura envolve necessariamente modificações na fı́sica fundamental, seja na teoria
da gravitação ou no domı́nio das partı́culas elementares e campos. Projetos como o
DES (veja a seção 2.2.4) visam estudar a estrutura em grande escala como meio de
aprender sobre o comportamento da energia escura.
Desse modo, a estrutura em grandes escalas no Universo é hoje um dos instrumentos
mais importantes para a cosmologia. A combinação entre teoria e observação permite
a discriminação de modelos fı́sicos (matéria e energia escuras, massa dos neutrinos,
flutuações primordiais, etc.) e a determinação dos parâmetros cosmológicos.
90
A cosmologia newtoniana é de fundamental importância para estudar a formação de
estruturas. No regime não-linear, apenas um tratamento newtoniano é factı́vel, por-
tanto quase todas as simulações computacionais (veja a seção 2.5.2) e aproximações
analı́ticas são feitas com base na cosmologia newtoniana. Além disso, o limite newto-
niano é uma ótima aproximação para a dinâmica das estruturas em grandes escalas
dentro do raio de Hubble, DH := c/H0 = h−1 3000 M pc. Para pequenas flutuações
é possı́vel fazer um tratamento relativı́stico, mas a análise newtoniana é muito mais
simples e ajudará a compreender fisicamente o inı́cio da formação das estruturas.
d2~r ~r − ~r0 3 0
Z
= ~g = −G ρ d r,
dt2 |~r − ~r0 |3
91
d2~x ~x − ~x0 3 0
Z
d ȧ ȧ d~x 2
+ ~x + = −Ga (ρ̄(η) + δρ(~x, η)) d x.
dη 2 dη a a dη |~x − ~x0 |3
Agora podemos eliminar os termos que aparecem num universo homogêneo da seguinte
forma. O primeiro termo do lado direito é o campo gerado por uma distribuição
uniforme de matéria (multiplicado por a). Se supomos que o universo é (em média)
esfericamente simétrico a grandes distâncias, esse termo dá −(4π/3)Ga2 ρ̄ ~x. É aqui que
as condições de contorno no infinito são usadas explicitamente. Agora podemos utilizar
a equação (2.13), escrita em termos de η (o notando que estamos nos restringindo ao
caso não relativı́stico), para eliminar os termos proporcionais a ~x. Desse modo, a
equação de movimento fica37
onde
δρ(~x0 , η) 3 0
Z
2
φ̃(~x, η) := −Ga d x. (2.15)
|~x − ~x0 |
Note que φ̃ é uma quantidade própria: a2 d3 x0 /|~x − ~x0 | ∼ d3 r/|~r − ~r0 |.
R
Como V δρ d3 x → 0 em grandes escalas, φ̃ é finito e bem definido (exceto sobre mas-
sas pontuais, que ignoramos ao tratar o campo de densidade como contı́nuo). Não há
mais ambigüidade na equação de movimento para ~x(η). O campo φ̃ não varia muito
com a origem do sistema de coordenadas, já que a contribuição da distribuição de
matéria distante é pequena; o que resolve mais um paradoxo da cosmologia newto-
niana. Concluı́mos que φ̃, chamado de potencial gravitacional peculiar, é o potencial
apropriado para a cosmologia newtoniana, desde que trabalhemos em coordenadas
co-móveis. Esse tratamento é válido mesmo em regiões altamente heterogêneas, já que
em nenhum momento foi preciso supor que δρ ρ̄. O procedimento efetuado nesta
seção serve apenas para eliminar o problema das condições de contorno no infinito.
Em resumo, as equações de movimento ficam:
d2~x ȧ d~x ~ x φ̃ ,
+ = −∇ ∇2x φ̃ = 4πGa2 δρ(xi , η) (2.16)
dη 2 a dη
As mesmas equações saem do limite de campos fracos (|φ| c2 ) e baixas velocidades
(v 2 c2 ) da relatividade geral para um espaço-tempo de Robertson-Walker per-
turbado. Localmente, a descrição da relatividade geral num universo de Friedmann-
Lemaı̂tre perturbado é equivalente à cosmologia newtoniana, com a condição de fron-
teira de que a distribuição de massa é homogênea e isotrópica no infinito. O trata-
mento da cosmologia newtoniana requer que o espaço seja euclidiano, o que é uma
ótima aproximação; exceto próximo a objetos compactos (como buracos negros), e
eventualmente, em escalas da ordem da distância de Hubble c/H0 .
Observação: Há vários modos de se eliminar a indeterminação em ∂φ2 /∂ri ∂rj , que
foi discutida no inı́cio desta seção. Um método consiste no exame preliminar de um
37
Se ρ̄ inclui matéria relativı́stica, tanto o campo gravitacional como o comportamento de a(η) mudam.
Os termos homogêneos também se cancelam nesse caso, mas a sua justificativa requer a relatividade geral.
92
corpo finito, seguido da transição para um corpo infinito. Foi esse o caminho aqui
adotado, aplicado a uma distribuição de matéria esférica. O mesmo procedimento
pode, por exemplo, ser extendido a um elipsóide homogêneo. Ao investigar o caso de
um elipsóide finito, vemos que é possı́vel acrescentar infinitas camadas sem alterar
a sua evolução temporal, nem o campo gravitacional em seu interior. Assim pode-
mos produzir um universo infinito com as propriedades das condições de fronteira
do elipsóide. O resultado seria portanto diferente do obtido nesta seção, que está em
acordo com os dados observacionais e com o limite newtoniano de um universo de
Friedmann-Lamaı̂tre perturbado. Dessa forma, vemos que não é possı́vel introduzir
uma cosmologia puramente newtoniana de forma unı́voca.
Uma outra forma de se obter a cosmologia newtoniana é estudar o desvio geodésico
num universo homogêneo, através da formulação da gravitação newtoniana na lin-
guagem do espaço curvo [64, 65]. No entanto, essa abordagem é muito mais compli-
cada, pois utiliza o aparato matemático da geometria diferencial. Além disso ela não
leva imediatamente às equações newtonianas para um universo heterogêneo.
93
Escrevendo essa equação em coordenadas co-móveis e notando que d/dt = (1/a)d/dη,
obtemos
d~v d ~x d ȧ ȧ 1 d~v
= (H~r + ~v ) = + ~v 2 + .
dt dt a dη a a a dη
Como vimos na seção 2.3.1, o campo gravitacional é
~ r Φ = − 4πG ρ̄ a~x − 1 ∇
~g = −∇ ~ x Φ̃. (2.22)
3 a
Ao substituirmos estes resultados na (2.21) notamos que os termos proporcionais a ~x
se cancelam (pela 2.13). Assim, obtemos finalmente:
d~v ȧ ~ − 1 ∇p
~ ,
+ ~v = −∇Φ (2.23)
dη a ρ
com as derivadas sendo calculadas no sistema co-móvel, e Φ representando o potencial
peculiar (a partir de agora não colocaremos mais o til, nem o sı́mbolo x na derivada).
Para fechar as equações de fluido ainda é necessária uma equação de evolução para
a pressão, ou para outra variável termodinâmica, como por exemplo a entropia. Para
um gás com colisões temos uma equação de estado p = p(ρ, S) onde S é a entropia
especı́fica (i.e. entropia por unidade de massa). Num um gás monoatômico ideal não-
relativı́stico, em processos reversı́veis temos,
3p 1
T dS = d + pd . (2.24)
2ρ ρ
~ · ~v ≈ 0 , ∂~v ȧ ~ − 1 ∇p
~
δ̇ + ∇ + ~v ≈ −∇Φ (2.25)
∂η a ρ̄
A pressão pode ser obtida da equação de estado p = p(ρ, S). Para um gás monoatômico
ideal não-relativı́stico, utilizando a (2.24), obtemos
1~ ~ + 2 T ∇S
~ , ∂p 5p
∇p = c2s ∇δ c2s := = . (2.26)
ρ 3 ∂ρ 3ρ
Como estamos lidando com pequenas perturbações de um universo homogêneo,
podemos escrever a temperatura e a entropia como: T (~x, η) = T̄ (η) + δT (~x, η) e
S(~x, η) = S̄(η) + δS(~x, η). O lado direito da (2.26) fica, em 1a ordem: (2/3)T̄ ∇2 (δS).
De modo geral, é suficiente manter apenas termos de primeira ordem na equação
(2.26). Assim, podemos utilizar c2s = (5/3)(p̄/ρ̄) nessa equação e manter apenas a
desidade homogênea ρ̄ no lado esquerdo da equação.
94
Há cinco variáveis do fluido (ρ, S e três componentes de ~v ), e portanto há cinco modos
linearmente independentes40 . A perturbação linear geral é uma combinação desses mo-
dos. Do ponto de vista cosmológico, apenas o modo irrotacional e sem perturbação na
entropia tem interesse prático (veja, por exemplo, a ref. [74]). Portanto, discutiremos
em mais detalhes apenas esse modo, que no regime linear corresponde às flutuações
de densidade.
~ · ~v = 0 , ∂~v ȧ ~ − c2 ∇δ
~ ,
δ̇ + ∇ + ~v = −∇φ s ∇2 φ = 4πGρ̄a2 δ . (2.27)
∂η a
onde ωJ é a freqüência de Jeans. Modos com k < kJ são instáveis (ω 2 < 0), como foi
observado por Jeans em 1902. Fisicamente, as forças de pressão não podem evitar o
colapso gravitacional quando o tempo para o som atravessar o corpo λ/cs é maior que
o tempo de queda livre (Gρ)−1/2 para uma perturbação de tamanho λ = 2πa/k.
40
De fato, temos cinco equações que governam a dinâmica desse sistema, as equações (2.25) e (2.26) e
mais uma relação termodinâmica.
95
O comprimento de Jeans (co-móvel) é definido por λJ := 2π/kJ . Para perturbações
muito maiores que esse comprimento (k kJ ) a evolução se comporta como num
fluido sem colisões, isto é, a pressão é desprezı́vel.
Incluindo o amortecimento, a instabilidade de Jeans passa a ter um comportamento
em lei de potência no tempo, em vez de exponencial, para k kJ . Em geral há uma
solução crescente e outra decrescente para δ(k, η); elas serão denotadas por δ± (k, η).
δ+ ∝ η 2 ∝ a e δ− ∝ η −3 , (2.33)
96
Suporemos que depois de recombinação a temperatura dos bárions é da ordem da tem-
peratura dos fótons (Tγ ≈ Tgas ). Esta é uma aproximação razoável, já que a ionização
residual acopla termicamente os dois fluidos por um longo perı́odo, mesmo havendo
uma transferência de momentum desprezı́vel. Num gás de fótons ργ ∝ Tγ4 além disso
temos que ργ ∝ a−4 logo Tγ ∝ a−1 . Para um gás ideal p/ρ ∝ Tgas . Assim c2s = c20s a−1
onde c0s é constante. Num universo de Einstein-de Sitter a eq. (2.29) fica:
2 δ
δ̈ + δ̇ = 6 − k 2 c20s η02 2 .
η η
97
em cosmologia. Uma teoria completa da formação de estruturas deve especificar essa
função a partir de considerações fı́sicas. Por exemplo, o cenário inflacionário oferece
uma previsão para variação da amplitude com o número de onda k (ou seja, ela fornece
A(k) a menos de um valor multiplicativo global, veja a Seção 9.7). Modelos em que o
universo passa por um ricochete também podem fazer esse tipo de previsão (veja as
Seções 3.10 e 10.3.2).
98
As soluções dessa equação são42 :
p
−5 ± 25 − 4(kc0s η0 )2
Φ± (k, η) ∝ η m , m = . (2.39)
2
Nessa solução, modos crescentes de grandes comprimentos de onda (kcs η 1) têm
potencial correspondente Φ+ = const., enquanto os modos decrescentes têm Φ− ∝
−5
R −3
η ∝ a dη. Esse comportamento se repete para qualquer equação de estado usual
num universo de Einstein-de Sitter. As perturbações na densidade e no potencial
diferem por um fator ρ̄a2 ∝ a−1 (2.36). Se K < 0 ou k 2 c2s > 0, então Φ+ decai com o
tempo, embora δ+ continue crescendo.
δM E = Ca,
onde c é uma constante. Substituindo essa relação na (2.41) e usando que, em EdS
4πGa2 ρ̄ = 6/η 2 , temos
ȧ
δ̈b + δ̇b = 6C.
a
A solução do modo crescente dessa equação é
b
δb = C (a (η) − b) = δM E 1 − , (2.42)
a (η)
onde b é uma constante. Essa solução mostra que δb → δM E para a (η) b, mesmo se
δb ' 0 para algum a (ηi ) = b, que pode ocorrer, digamos, para ηi = ηdesacoplamento .
42
Esse resultadoP
poderia ser P
obtido substituindo a (2.34) na (2.36).
43
De modo que B ρ̄B δB = B (ρB − ρ̄B ) = ρtot − ρ̄tot = ρ̄tot δtot .
99
Esse importante resultado mostra que as perturbações na matéria bariônica são in-
duzidas pelas flutuações da matéria escura após o desacoplamento. Isso mostra que a
matéria escura é a principal responsável pela formação das primeiras estruturas em
grande escala. Sem a matéria escura, as flutuações seriam muito menores e não teria
havido tempo de produzir as estruturas em grande escala que são observadas.
100
hidrostático, terı́amos δγ /4 + Φ = 0 (e obviamente ve = 0) de modo que não have-
ria anisotropias primárias na RCF. As flutuações seriam dadas apenas pela variação
ocorrida na trajetória da luz, que é o chamado efeito Sachs-Wolfe integrado e é dado
pelo último termo na expressão (2.43).
Sachs e Wolfe [58] mostraram que, para perturbações adiabáticas na era dominada
pela matéria, em escalas maiores que o horizonte acústico, as contribuições intrı́nseca
e gravitacional dominam. A soma desses fatores (os dois primeiros termos da expressão
2.43) é Φ/3. Dessa forma, em escalas maiores do que 1◦ (que equivale aproximadamente
o tamanho do horizonte acústico) as anisotropias na radiação cósmica de fundo são
uma medida direta do potencial gravitacional na fotosfera, na recombinação.
O fator Φ/3 pode ser compreendido com a combinação do desvio para o vermelho
causado pelo campo gravitacional e uma dilatação temporal. Para sair do poço de
potencial o fóton perde energia, de modo que
∆1 = Φ.
Além disso, como o potencial produz uma dilatação temporal, quando vemos o fóton
ele viajou um caminho maior e veio portanto de uma época mais quente. A variação
temporal é dada por δt/t = Φ. Utilizando que a ∝ t2/3 e que T ∝ a−1 obtemos
2
∆2 = − Φ.
3
A combinação desses dois efeitos dá
Φ δk
∆SW = ∝ 2,
3 k
que é o chamado efeito Sachs-Wolfe. Na última relação, utilizamos a equação (2.36).
Desse modo, as flutuações na temperatura se relacionam diretamente com as per-
turbações na densidade.
Em escalas angulares menores que 1o predomina o efeito Doppler. Nessas regiões
menores do que o horizonte acústico, ocorrem as oscilações acústicas discutidas na
seção 2.5.1. Essas oscilações dão origem aos picos no espectro da radiação cósmica
de fundo que foram detectados no ano 2000 por dois experimentos em balões es-
tratosféricos [36, 37] e medidos com grande precisão pela sonda WMAP em 2003.
101
ou seja, eles não são correlacionados. A variância de cada harmônico é dada pelo es-
pectro de potência angular Cl . A simetria rotacional faz com que ele seja independente
de m.
O espectro de potência da RCF pode ser calculado a partir da estatı́stica das flutuações
primordiais e da evolução temporal dessas flutuações. Pode-se mostrar que [57]:
Z
Cl = 4π d3 kPΦ (k) Dl2 (k) , (2.45)
45
O espectro Pφ (k) está associado ao espectro das flutuações primordiais na densidade, pela relação
Pφ (k) ∝ P (k) /k 2 (eq. 2.36).
102
2.5.2 O Universo Muito Perturbado: Simulações Computa-
cionais
A análise linear das perturbações ajuda a compreender a radiação cósmica de fundo, as
primeiras fases da formação de estruturas e a estrutura em grande escala do universo.
Nas maiores escalas observáveis, as flutuações na densidade são pequenas e a teoria
linear ainda pode ser aplicada. No entanto, em escalas menores, talvez já nos super-
aglomerados e certamente nos grupos e aglomerados de galáxias, a aglomeração de
matéria não é linear (δρ/ρ > 1). Nesses casos, as variações na densidade são da
ordem de 105 (ρgaláxias /ρuniverso ) ou 102 − 103 (ρaglomerados /ρuniverso ) [39]. Portanto, para
compreender as estrutura no universo, é preciso fazer simulações computacionais, ou
recorrer a aproximações para a evolução não-linear.
Nas simulações numéricas utilizam-se condições de contorno periódicas para repre-
sentar um universo infinito. Como o volume simulado é fixo nas coordenadas ~x, na
verdade temos uma fronteira que evolui acompanhando a expansão média. A equação
de Poisson (2.16) é resolvida numericamente, utilizando a transformada de Fourier,
ou algum método hierárquico. Em geral, para simular a matéria escura utilizam-se al-
goritmos de N -corpos. Cada partı́cula segue uma trajetória dada pela equação (2.16).
A matéria bariônica (gás) é simulada utilizando algoritmos de fluidos para resolver
as eqs. (2.20) e (2.23), como por exemplo SPH (Smoothed Particle Hydrodynamics
[59]). A referência [60] é um excelente artigo de revisão sobre simulações numéricas
em cosmologia.
As simulações com matéria escura e gás são feitas para determinar a temperatura
final do gás (e comparar com os resultados das observações de raios-X ou do efeito
Sunyaev-Zel’dovich), ou para acompanhar a formação de galáxias. Nas escalas maiores
a dinâmica é dominada pela matéria escura, e portanto o gás não teria muita influência.
Por isso muitas simulações da formação de estruturas utilizam apenas matéria com
p = 0 (N -corpos).
Um exemplo atual de uma simulação de N -corpos é dado pela millenium simullation
[63], que envolveu mais de 1010 partı́culas, distribuı́das em um cubo com 500h−1 M pc
(i.e., cerca de 109 anos luz) de lado. A resolução é de 5h−1 kpc, de modo que a sim-
ulação varre um intervalo dinâmico de 5 ordens de grandeza. Simulações que incluem
a hidrodinâmica são limitadas a um intervalo dinâmico menor (∼ 103 ).
As simulações computacionais têm sido um instrumento fundamental para o estudo
da formação e evolução de estruturas. Elas parecem convergir em suas predições até a
escala dos aglomerados de galáxias, mas ainda estão longe de reproduzirem a formação
de galáxias individuais, devido à complexa fı́sica envolvida e às limitações de resolução.
103
• The Kavli Institute for Cosmological Physics (EUA):
http://cfcp.uchicago.edu/
• Dark Cosmology Center (Dinamarca): www.dark-cosmology.dk
• Laboratoire Astroparticule & Cosmologie: http://www.apc.univ-paris7.fr/
• Beecroft Institute for Particle Astrophysics and Cosmology
http://www.development.ox.ac.uk/mpsnewsbee.htm
Revisão das escalas de distância, do Sistema Solar até as maiores estruturas do universo
(da ref. [35]):
http://www.astro.princeton.edu/~mjuric/universe/
Atualização do livro de John Peacock, com algumas discussões interessantes:
http://www.roe.ac.uk/~jap/book/additions.html
104
– Galaxies and cosmology:
http://pan-starrs.ifa.hawaii.edu/public/science/cosmology.html
– Supernoave, Gamma Ray Bursts, Active Galaxy Nuclei:
http://pan-starrs.ifa.hawaii.edu/public/science/active.html
Simulações Numéricas:
• Redshift Surveys and Cosmology (um resumo sobre catálogos de desvio para o
vermelho de gláxias):
http://www.atnf.csiro.au/pasa/17 3/colless/paper/node2.html
• APM: http://www-astro.physics.ox.ac.uk/~wjs/apm survey.html
• CfA redshift survey: http://cfa-www.harvard.edu/~huchra/zcat/
• Las Campanas Redshift Survey: http://qold.astro.utoronto.ca/~lin/lcrs.html
• Southern Sky Redshift Survey: http://arxiv.org/abs/astro-ph/9804064
• Sloan Digital Sky Survey: http://www.sdss.org
• 2dF: http://www.mso.anu.edu.au/2dFGRS/, http://www.aao.gov.au/2df/
• 6dF: http://www.aao.gov.au/local/www/6df/
• Dark Energy Survey: http://www.darkenergysurvey.org,
http://www.des-brazil.org/
• Links para vários levantamentos e outras informações sobre astronomia e as-
trofı́sica: http://www.sdss.org/links.html
Levantamentos in infra-vermelho:
105
• BOOMERANG: http://oberon.roma1.infn.it/boomerang/
• MAP: http://map.gsfc.nasa.gov
• Planck: http://planck.esa.int (lançamento previsto em 2007), [ver também
http://astro.estec.esa.nl/(SA-general/Projects/)Planck]
• CAMB (Code for Anisotropies in the Microwave Background):
http://camb.info/
• CMBEASY: an Object Oriented Code for the Cosmic Microwave Background :
www.cmbeasy.org
• CMBFAST: http://physics.nyu.edu/matiasz/CMBFAST/cmbfast.html
• COSMICS: Cosmological Initial Conditions and Microwave Anisotropy Codes,
http://arcturus.mit.edu/cosmics/
• Projetos de Supernovas:
http://webusers.astro.umn.edu/~hlee/astro.html
http://www.iafe.uba.ar/relatividad/gangui/cosmocurso/
http://cfcp.uchicago.edu/education/resources/index.html
Íntegra do livro de Kepler de Souza Oliveira Filho e Maria de Fátima Oliveira Saraiva
da UFRGS. É um texto bem geral de astronomia e astrofı́sica, não penas cosmolo-
gia. Leitura recomendada: capı́tulos introdutórios e aqueles depois do “A Escala do
Universo”.
Pacotes/aplicativos/códigos
• DarkSUSY Home Page [fortran package for supersymmetric dark matter cal-
culations.]: http://www.physto.se/~edsjo/darksusy/, P. Gondolo, J. Edsjö,
P. Ullio, L. Bergstöm, M. Schelke and E.A. Baltz, JCAP 0407 (2004) 008;
astro-ph/0406204
• RECFAST: www.astro.ubc.ca/people/scott/recfast.html (Seager, Sas-
selov, Scott, 2000)
106
2.7 Livros sugeridos
Os anais da Escola Brasileira de Cosmologia e Gravitação, proporcionam uma exce-
lente fonte bibliográfica em muitos ramos da cosmologia e gravitação. A maior parte
dos cusos está disponı́vel integralmente on-line no sı́tio: www.icra.cbpf.br. Segue
abaixo uma lista com outros livros sugeridos no contexto deste capı́tulo:
Kolb, E. W, Turner, M. S., The Early Universe (Addison - Wesley, Redwood City,
CA, 1990) [dados um pouco desatualizados, mas abordagem moderna sobre modelo
padrão da cosmologia]
Weinberg S., Gravitation and Cosmology, J.Wiley, New York (1972)
Padmanabhan T., Structure Formation in theUniverse, Cambridge University Press
(1993)
Zel’dovich Ya. B., Novikov I. D., The Structure and Evolution of the Universe (Rela-
tivistic Astrophysics, volume 2), The University of Chicago Press (1983)
Peebles, P. J. E., The large scale structure of the Universe, Cambridge University
Press (1980)
Peebles, P. J. E. Principles of Physical Cosmology. Princeton, NJ: Princeton Univer-
sity Press (1993) [Contém extensos comentários sobre o desenvolvimento histórico da
cosmologia, escritos por quem foi parte dessa história].
Hawking, S. W. and Ellis, G. F. R. The Large Scale Structure of Space-Time. Cam-
bridge University Press (1975)
Peacock, J. A. Cosmological Physics. Cambridge University Press (1999)
Dodelson, S., Modern Cosmology, Academic Press (Elsevier Science) (2003) [per-
turbações, focando/discussão detalhada de CMB, análise estatı́stica]
Rindler, W., Introduction to Special Relativity, Oxford University Press (2004)
[primeira edição de 1960]
107
Artigo original do Hubble:
• Edwin Hubble, A Relation Beteewn Distance and Radial Velocity Among Extra-
Galactic Nebulae, Proceedings of the National Academy of Sciences 15, vol. 3
(1929), reproduzido em
http://antwrp.gsfc.nasa.gov/diamond jubilee/1996/hub 1929.html
Lentes gravitacionais:
108
Energia Escura:
Matéria Escura
109
• James Glanz, Astronomers See a Cosmic Antigravity Force at Work, Science, Vol
279, Number 5355, pp. 1298-1299, 27 Feb. 1998
Supernovas e cosmologia:
110
• A. Lewis, A. Challinor, A. Lasenby, Efficient Computation of CMB anisotropies
in closed FRW models, ApJ 538 (2000) 473-476, astro-ph/9911177
• Doran M., CMBEASY: an Object Oriented Code for the Cosmic Microwave Back-
ground, astro-ph/0302138
Efeito Sunyaev-Zel’dovich [ótimo review sobre o que promete ser um dos assuntos mais
quentes da cosmologia observacional nos próximos anos]
• W. Freedman, Final Results from the Hubble Space Telescope Key Project to
Measure the Hubble Constant, ApJ 553, 47 (2001), astro-ph/0012376.
111
2.9 Exercı́cios
Exercicio: Unidades e ordens de grandeza
Respostas
8π 5 k4
1) ργ0 = 4.642 × 10−34 g/cm3 (σ = 15c3 h3
= 7. 566 × 10−16 kgm−3 K−4 ).
2) H0−1 = h−1 3.08568025 × 1017 s ' h −1
9.8 × 109 anos, DH = c
H0
= h−1 3000 M pc
3H 2
3) ρcrit = 8πG
= h2 1.8788 × 10−29 g/cm3 .
Ω0γ = 2.471 × 10−5 h−2 . Para h = 0.72, temos Ω0γ = 4.766 × 10−5
para obter X
Ωi + ΩΛ + ΩK = 1,
i
2) Conservação da energia.
Reescreva a equação da conservação de energia
ρ̇ + 3H (ρ + p) = 0
Calcule a idade do universo (em Ga = 109 anos) para Ωm = 0.3, ΩΛ = 0.7 e h = 0.72.
O valor de Ωr será dado pelo resultado do exercı́cio 3) (aqui, apenas com propósitos
didáticos, desprezaremos a contribuição dos neutrinos) [Como obter o valor de ΩK ?].
O que ocorre se desprezamos a contribuição da radiação? E da curvatura?
Como fica a idade do Universo se agora ΩΛ = 0 e ΩK = 0?
Supondo que o universo é plano (K = 0) e desprezando a radiação, faça um gráfico
de t0 em unidades de h−1 Ga em função de Ωm .
113
Faça o mesmo gráfico, mas agora para ΩΛ = 0 (e portanto K 6= 0).
Diversas estimativas atuais para a idade das estrelas mais velhas indicam um limite
inferior de 11 Ga (veja, por exemplo, a ref. [31]). Naturalmente esse valor fornece um
limite inferior para a idade do universo. A que conclusões você pode chegar, tendo em
vista os resultados que você obteve acima?
2.10 Glossário
Parsec (pc)
Unidade de distância amplamente utilizada em astronomia cujo nome deriva de “per
second arc”. Corresponde à distância na qual um segmento medindo uma unidade
astronômica (equivalente à distância média da Terra ao Sol) subtende um ângulo de um
segundo de arco. Sua origem decorre da utilização da paralaxe para medir distâncias
às estrelas mais próximas. Um pc equivale a 3.26 anos luz ou 3.086 × 1013 Km. As
distâncias cosmológicas são usualmente medidas em Megaparsec (Mpc = 106 pc) e
Gigaparsec (Gpc = 109 pc).
Seção de choque
A seção de choque é uma medida da probabilidade de ocorrência de uma dada reação.
Ela é definida como o número de reações por unidade de tempo dividido pelo número
de colisões (“encontros” entre partı́culas) por unidade de tempo por unidade de área,
ou seja, é o número de reações por unidade de tempo dividido pelo fluxo incidente. A
seção de choque depende da energia das partı́culas e da reação em questão. Pode-se
pensar na seção de choque como uma área efetiva para as colisões, daı́ o seu nome.
De fato, o número de reações pode ser calculado assumindo-se que o núcleo tem uma
área e que uma dada reação ocorre sempre que uma partı́cula atinge aquela área.
114
2.11 Referências bibliográficas
[1] G.A. Tammann, B. Reindl, Cosmic Expansion and H0 : A Retro- and Pro-Spective
Note, proceedings of the XXXVIIth Moriond Astrophysics Meeting “The Cosmo-
logical Model”, Les Arcs, France, March 16-23, 2002, astro-ph/0208176
[2] Hoskin, M. A., Ritchey, Curtis and the Discovery of Novae in Spiral Nebulae,
Journal for the History of Astronomy, 7, 47 (1976)
[3] Nick Allen, Msc thesis: The Cepheid Distance Scale: A History, 2001
(http://www.institute-of-brilliant-failures.com/).
[4] K. Z. Stanek, P. M. Garnavich, Distance to M31 With the HST and Hipparcos
Red Clump Stars, astro-ph/9802121
[5] Hubble, E. P., A spiral nebula as a stellar system: Messier 33, Astrophys. J., 63,
236-274 (1926)
[6] Hubble, Edwin; Humason, Milton L., The Velocity-Distance Relation among
Extra-Galactic Nebulae, Astrophysical Journal, vol. 74, p.43 (1931)
[7] Leavitt, Henrietta S.; Pickering, Edward C., Periods of 25 Variable Stars in the
Small Magellanic Cloud, Harvard College Observatory Circular, vol. 173, pp.1-3
(1912)
[8] V.C. Rubin & W.K. Ford, Astrophys. J. 159, 379 (1970)
[9] E. Corbelli, P. Salucci, The Extended Rotation Curve and the Dark Matter
Halo of M33, MNRAS, 311, 441 (2000), astro-ph/9909252 [veja também E.
Corbelli, Dark matter and visible baryons in M33, MNRAS 342, 199 (2003),
astro-ph/0302318]
[10] L. Ferrarese et.al., The Extragalactic Distance Scale Key Project. IV. The Discov-
ery of Cepheids and a New Distance to M100 Using the Hubble Space Telescope,
ApJ 464, 568 (1996).
[11] Koester, B.P. , et al., A MaxBCG Catalog of 13,823 Galaxy Clusters from the
Sloan Digital Sky Survey, astro-ph/0701265.
[12] Press W.H., Schechter, P.L., Astrophys. J. 187, 425 (1974)
[13] F., Zwicky, On the Masses of Nebulae and of Clusters of Nebulae, ApJ, 86, 217
(1937).
[14] M. Colless, A.M. Dunn, Structure and Dynamics of the Coma Cluster, ApJ, 458,
435 (1996), astro-ph/9508070.
[15] J. Renn, T. Sauer, & J. Stachel, The origin of gravitational lensing: A postscript
to Einstein’s 1936 Science paper, Science, 275, 184 (1997).
[16] Chwolson, O., Über eine mögliche Form fiktiver Doppelsterne [Sobre um Possı́vel
Tipo de Estrelas Duplas Fictı́cias], Astron. Nachr., 221, 329, (1924).
[17] A. Einstein, Lens-like action of a star by the deviation of light in the gravitational
field, Science, 84, 506, (1936).
[18] F., Zwicky, Nebulae as Gravitational Lenses, Phys. Rev. Lett., 51, 290 (1937);
F., Zwicky, On the Probability of Detecting Nebulae Which Act as Gravitational
Lenses, Phys. Rev. Lett., 51, 679, (1937).
[19] Lynds, R., Petrosian, V., BAAS, 18, 1014 (1986); Lynds, R., & Petrosian, V.,
Astropys. J, 336, 1 (1989); Soucail, G., Fort, B., Mellier, Y., & Picat, J. P.,
Astronomy & Astrophys., 172, L14 (1987).
115
[20] E.S. Cypriano, G.B. Lima Neto, L. Sodré, J.-P. Kneib, L.E. Campusano, Luis E.,
Gemini and Chandra observations of Abell 586, a relaxed strong-lensing cluster,
Astrophys.J. 630 (2005) 38, astro-ph/0504036
[21] M. Fukugita, C. J. Hogan, P. J. E. Peebles, The Cosmic Baryon Budget, ApJ.
503, 518 (1998), astro-ph/9712020; M. Fukugita, P. J. E. Peebles, The Cosmic
Energy Inventory, ApJ 616, 643 (2004), astro-ph/0406095.
[22] South Pole Telescope: http://spt.uchicago.edu/
[23] J. E. Carlstrom, G. P. Holder, E. D. Reese, Cosmology with the Sunyaev-
Zel’dovich Effect, Ann.Rev.Astron.Astrophys. 40, 643 (2002), astro-ph/0208192
[24] Edwin Hubble, A Relation Beteewn Distance and Radial Velocity Among Extra-
Galactic Nebulae, Proceedings of the National Academy of Sciences 15, vol. 3,
163 (1929)
[25] W.L.Freedman, et al., Final Results from the Hubble Space Telescope Key Project
to Measure the Hubble Constant, ApJ, 553, 47 (2001), astro-ph/0012376.
[26] J. Huchra, M. Davis, D. Latham, J. Tonry, A survey of galaxy redshifts. IV - The
data, ApJS, 52, 89 (1983).
[27] V. de Lapparent, M.J. Geller, J.P. Huchra, A slice of the universe, ApJ, 302, L1
(1986).
[28] L. N. da Costa, et al., The Southern Sky Redshift Survey, ApJ, 327, 544 (1988).
[29] L. N. da Costa, et al., A complete southern sky redshift survey, ApJ, 424, L1
(1994); L. N. da Costa, et al., The Southern Sky Redshift Survey, Astron. J., 116,
1 (1998), astro-ph/9804064.
[30] S.A. Shectman, et al., The Las Campanas Redshift Survey, ApJ, 470, 172 (1996),
astro-ph/9604167.
[31] L. M. Krauss, B. Chaboyer, Science, 299, 5603, 65 (2003); L. M. Krauss, ApJ,
604, 481 (2004), astro-ph/0212369.
[32] J.R. Primack, Precision cosmology, New Astronomy Reviews, 49, 25 (1995),
astro-ph/0408359.
[33] R. A. Daly, ApJ, 426, 38 (1994); veja também: E. J. Guerra, R. A. Daly, L.
Wan, ApJ, 544, 659 (2000); R. A. Daly, E. J. Guerra, AJ, 124, 1831 (2002); S.
Podariu, R. A. Daly, M. P. Mory, B. Ratra, ApJ, 584, 577 (2003).
[34] M. Visser, Jerk, snap, and the cosmological equation of state, Class. Quant. Grav.
21, 2603 (2004), gr-qc/0309109; veja também R. R. Caldwell, M. Kamionkowski,
Expansion, Geometry, and Gravity, astro-ph/0403003 e T. Chiba, T. Nakamura,
The Luminosity Distance, the Equation of State, and the Geometry of the Uni-
verse, Prog. Theor. Phys. 100, 1077 (1998); astro-ph/9808022
[35] J.R. Gott, et al., A Map of the Universe, ApJ, 624, 463 (2005),
astro-ph/0310571.
[36] de Bernardis, P., et al. 2000, Nature, 404, 955 (2000); Lange, A. E., et al., 2000,
Phys. Rev. D., 63, 042001, astro-ph/0005004.
[37] S. Hanany et al., ApJ 545, L5 (2000); A. Balbi et al., ApJ 545, L1 (2000).
[38] Netterfield, C. B., et al., A Measurement by BOOMERANG of Multiple Peaks in
the Angular Power Spectrum of the Cosmic Microwave Background, ApJ, 571,
604 (2002).
116
[39] Kolb, E. W., Turner, M. S.,The Early Universe, Addison-Wesley (1994).
[40] P. J. E. Peebles, Large-scale background temperature and mass fluctuations due
to scale-invariant primeval perturbations, ApJ 263, L1 (1982).
[41] J. R. Bond & G. Efstathiou, Cosmic Background Radiation Anisotropies in Uni-
verses Dominated by Nonbaryonic Dark Matter, ApJ 285, L45 (1984)
[42] S. Burles, K. M. Nollett, M. S. Turner, Big-Bang Nucleosynthesis Predictions for
Precision Cosmology, ApJ 552, L1 (2001), astro-ph/
[43] D. Kirkman, D. Tytler, N. Suzuki, J. M. O’Meara, D. Lubin, The cosmological
baryon density from the deuterium to hydrogen ratio towards QSO absorption
systems: D/H towards Q1243+3047, Astrophys. J., Suppl. Ser. 149, 1 (2003),
astro-ph/0302006
[44] Maddox, S. J., Efstathiou, G., Sutherland, W. J. & Loveday, J., Galaxy corre-
lations an large scales, MNRAS, 242, 43 (1990); Maddox, S. J., Efstathiou, G.,
Sutherland, W. J. & Loveday, J., MNRAS, 243, 692 (1990)
[45] Las Campanas Redshift Survey: http://qold.astro.utoronto.ca/~lin/lcrs.html.
[46] Shectman, S. A., et. al., The Las Campanas Redshift Survey, ApJ, 470, 172
(1996)
[47] Lapperent, V., Geller, M. J., Huchra J. P., A Slice of the Universe, ApJ, 302, L1
(1986)
[48] 2dF: http://www.mso.anu.edu.au/2dFGRS/, http://www.roe.ac.uk/~jap/2df/
[49] Sloan Digital Sky Survey: http://www.sdss.org
[50] Dark Energy Survey: http://www. darkenergysurvey.org
[51] K. S. Wu, O. Lahav & M. J. Rees, The large-scale smoothness of the Universe,
Nature, 397 (1999)
[52] J. C. Mather, D. J Fixsen, R. A. Shafer, C. Mosier, D. T. Wilkinson, Calibrator
Design for the COBE Far-Infrared Absolute Spectrophotometer (FIRAS), Astro-
phys. J., 512, 511 (1999).
[53] C. L. Bennett, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP)
Observations: Preliminary Maps and Basic Results, astro-ph/0302207, submit-
ted to The Astrophysical Journal.
[54] D. N. Spergel, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP)
Observations: Determination of Cosmological Parameters, astro-ph/0302209,
submitted to The Astrophysical Journal.
[55] G. Hinshaw, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP)
Observations: The Angular Power Spectrum, astro-ph/0302217, submitted to
The Astrophysical Journal,
L. Page, et al., First Year Wilkinson Microwave Anisotropy Probe (WMAP) Ob-
servations: Interpretation of the TT and TE Angular Power Spectrum Peaks,
astro-ph/0302220, submitted to The Astrophysical Journal.
[56] Bertschinger E., Cosmological Dynamics, in R. Schaeffer, J. Silk, M. Spiro and V.
Zinn-Justin eds., Cosmology and Large Scale Strucutre, XV Les Houches Summer
School (1993), Elsevier Science, Amsterdam (1996) 273, astro-ph/9503125
[57] Bertschinger, E., Cosmological Perturbation Theory and Structure Formation, in
M. C. Bento, O. Bertolami, L. Teodoro eds., COSMOLOGY 2000 Conference
Proceedings, astro-ph/0101009
117
[58] Sachs R. K., Wolfe A. M., Perturbations of a Cosmological Model and Angular
Variations of the Microwave Background, ApJ 147, 73 (1967)
[59] Monaghan J. J., Smoothed Particle Hydrodynamics, Annu. Rev. Astron. Astro-
phys., 30, 543 (1992)
[60] Bertschinger, E., Simulations of Structure Formation in the Universe, Annu. Rev.
Astron. Astrophys., 36, 599-654 (1998)
[61] Virgo Consortium: www.virgo.dur.ac.uk
[62] Hubble Volume: http://www.physics.lsa.umich.edu/hubble-volume
[63] Springel V., et al., Simulations of the formation, evolution and clustering of galax-
ies and quasars, Nature 435, 629 (2005); astro-ph/0504097
[64] Tipler, F. J., Rigurous Newtonian Cosmology, Am. J. Phys. 64, 10, 1311 (1996)
[65] Tipler, F. J., Newtonian Cosmology Revisited, MNRAS, 282, 206 (1996)
[66] Zel’dovich Ya. B., Novikov I. D., The Structure and Evolution of the Universe
(Relativistic Astrophysics, volume 2), The University of Chicago Press (1983)
[67] J.C. Mather, D. J. Fixsen, R.A. Shafer, C. Moser, D.T. Wilkinson, Calibrator
Design for the COBE Far-Infrared Absolute Spectrophotometer (FIRAS), ApJ
512, 511 (1999), astro-ph/9810373. [T0 = 2.725 ± 0.002]
[68] M. Fukugita, P.J.E. Peebles, The Cosmic Energy Inventory, Astrophys. J. 616,
643 (2004), astro-ph/0406095.
[69] Biviano et al., A catalogue of velocities in the central regions of the Coma cluster,
Astron. Astrophys. Suppl. Ser. 111, 265 (1995).
[70] Novello, M., A Spinor Theory of Gravity and the Cosmological Framework,
arXiv:gr-qc/0701120
[71] Novello, M., Constructing Dirac linear fermions in terms of non-linear Heisenberg
spinors, arXiv:0705.2692
[72]
[73] Hawkins, E., et al., The 2dF Galaxy Redshift Survey: correlation functions, pe-
culiar velocities and the matter density of the Universe, MNRAS 346, 78 (2003);
astro-ph/0212375
[74] Makler, M., Dinâmica Gravitacional da Formação de Estruturas no Universo,
Tese de doutorado, CBPF (2001)
[75] Lifshitz, E. M., On the gravitational stability of the expanding universe. J. Phys.
USSR 10, 116 (1946)
[76] Reis, R. R., Domain of validity of the evolution of perturbations in Newtonian
cosmology with pressure, Phys. Rev. D 67 7301 (2003); Erratum ibid 68, 9901
(2003).
118
Figura 2.20: Diagrama ilustrando a hierarquia e ordens de grandeza das dimensões das
estruturas no Universo.
Figura 2.21: O catálogo de galáxias APM (do inglês automatic plate machine) contém
mais de 2 milhões de galáxias, cobrindo aproximadamente 1/10 da esfera celeste. As inten-
sidades em cada pı́xel são proporcionais ao número de galáxias, com as cores azul, verde
e vermelho representando galáxias brilhantes, de brilho médio e fracas, respectivamente.
As áreas escuras recortadas foram excluı́das por conter estrelas brilhantes e outros obje-
tos que impediram a identificação das galáxias de fundo. Créditos: Steve Maddox, Will
Sutherland, George Efstathiou, Jon Loveday, Gavin Dalton e Departamento de Astrofı́sica
da Universidade de Oxford. Veja referência [44].
119
Figura 2.22: Distribuição de galáxias em função do desvio para o vermelho obtida pelo
projeto 2dF [48] (http://magnum.anu.edu.au/∼TDFgg/).
Figura 2.23: Estrutura em grande escala segundo a millenium simulation. A figura mostra
a distribuição de matéria escura em uma “fatia” dessa simulação, nas maiores escalas (veja
a ref. [63]).
120
Figura 2.24: Distribuição de matéria em um aglomerado massivo segundo a millenium
simulation. Esta imagem representa um zoom na figura 2.23 (veja a ref. [63]).
121
Capı́tulo 3
Introdução à Cosmologia
Mário Novello1
3.1 Introdução
Neste capı́tulo descreveremos alguns aspectos teóricos da Cosmologia Relativista. De-
vido ao caráter universal e somente atrativo da gravitação é ela a força responsável
pela estrutura e evolução do universo. Assim, a cosmologia do século XX se inicia
quando em 1917 Einstein aplicou as suas equações da Teoria da Relatividade Geral
(TRG) ao universo2 .
122
uma hipótese de trabalho, possivelmente tal afirmação não seja válida em algumas
situações, mas sem assumı́-la, jamais poderemos determinar as suas limitações .
Como consequência desta primeira afirmação, conclui-se, a partir de nossas ob-
servações astronômicas locais, que os objetos celestes devem ter carga total muito
próxima de zero. Sendo assim, das duas únicas interações de longo alcance conhecidas
na natureza, o eletromagnetismo e a gravitação, somente esta última tem relevância
para a Cosmologia.
Como discutido em Capı́tulo 1, em 1915, Einstein completou a formulação de uma
nova teoria da gravitação, a Teoria da Relatividade Geral. Nela, a gravitação não é
descrita como uma força provocada pela existência de grandes massas, mas como uma
modificação da geometria do espaço-tempo provocada pela energia sob qualquer forma,
nele contida. As partı́culas nesta região, se não sofrerem a influência de nenhuma
outra força, são ainda consideradas partı́culas livres, descrevendo trajetórias que são o
caminho extremal entre dois pontos do espaço-tempo isto é geodésicas do tipo tempo
e nula de geometria. As equações de Einstein da gravitação relacionam algebricamente
a curvatura do espaço-tempo com a distribuição de matéria e energia.
Uma vez construı́da uma nova teoria da gravitação, o passo lógico seguinte é aplicá-la
à Cosmologia. Entretanto, como estas equações são muito complexas, faz-se necessária
uma hipótese simplificadora, que é a segunda parte do Princı́pio Cosmológico.
Em uma geometria que possui estrutura espacial homogênea e isotrópica todos os pon-
tos do espaço, bem como todas as direções a partir de qualquer ponto são equivalentes.
Isto restringe bastante as possı́veis geometrias espaciais. Na verdade, é possı́vel mostrar
que só existem 3 geometrias que satisfazem este Princı́pio (veja Ref.[1], capı́tulo 13).
A primeira consiste no espaço plano. Outra possibilidade, em duas dimensões, é a
superfı́cie de uma esfera. Não há pontos ou direções preferenciais nesta superfı́cie.
Entretanto, a superfı́cie de uma esfera tem apenas 2 dimensões e vivemos em 3 di-
mensões. É possı́vel generalizar este conceito para 3 dimensões? Vejamos: uma esfera
bidimensional, denotada por S 2 , é definida num espaço tridimensional plano, no qual
os comprimentos infinitesimais são dados por
123
Examinemos a dependência em da Eq. (3.4). Para = 1 temos, como vimos, a 3-
esfera. Se fizermos = 0, reencontramos o espaço plano da Eq. (3.2), que é também
homogêneo e isotrópico, com um fator multiplicativo a2 . O caso = −1 é a terceira
possibilidade de espaço homogêneo e isotrópico, que pode também ser obtido através
de seções hiperbólicas do espaço-tempo de Minkowski
n dr2 o
ds2 = dt2 − a2 (t) + r 2
[dθ 2
+ sin 2
(θ)dφ2
] . (3.6)
1 − r2
Note que a única função arbitrária a ser determinada pelas equações de Einstein no
caso do universo isotrópico e homogêneo é o fator de escala a(t). Note que temos duas
possibilidades com relação às unidades. Podemos considerar as coordenadas espaciais
sem unidades e jogar as unidades de comprimento em a(t), ou conservar as unidades
nas coordenadas, e adimensionalizar o fator de escala fazendo a(t) → a(t)/a(t0 ), onde
t0 é um tempo de referência. Adotaremos aquı́ a segunda possibilidade.
Vamos tentar entender fisicamente o significado da geometria (3.6) e sua relação com
o Universo real. Em primeiro lugar, é fácil verificar da geometria (3.6), através da
equação da geodésica (11.10), que os objetos astronômicos sujeitos apenas ao campo
gravitacional cosmológico e livres de outras forças (seguindo, portanto, as geodésicas
da geometria (3.6)), têm coordenadas espaciais (r, θ, φ) constantes ao longo de sua
história. Por isso as chamamos de coordenadas co-moventes. Assim, a distância espa-
cial entre dois objetos astronômicos só varia de t = t1 =cte. a t = t2 =cte. através
do fator de escala a(t) (veja Eq.(3.6) com dt = 0). A situação é análoga a pontos na
superfı́cie da Terra determinados por suas latitudes e longitudes. Se a Terra inflasse
(através do aumento do raio da Terra a(t)), as latitudes e longitudes destes pontos
permaneceriam as mesmas mas suas distâncias reais aumentariam proporcionalmente
ao incremento em a(t). Sobre marcações de tempo, um mesmo objeto astronômico
teria seu tempo próprio dado, ao longo de sua história, pela coordenada t, chamado
tempo cósmico (veja Eq.(3.6) com dr = dθ = dφ = 0).
A geometria dada pela equação (3.6) é chamada geometria de Friedman, e a ob-
servação mostra que ela descreve bem o universo (ver Capitulo 2). Veremos a seguir
outras propriedades do elemento de linha dado pela Eq.(3.6). Para isso, é conveniente
124
introducir a coordenada χ usando r = σ(χ), onde a função σ vem definida por
sin χ para = 1,
σ(χ) = χ para = 0,
sinh χ para = −1.
(3)
Chamando R o escalar de curvatura do 3-espaço t=constante, temos
" #
00 02
(3) 2σ σ 1
R ≡ (−2) + 2 − 2 ,
σ σ σ
1 (3)
e pondo ≡ 6
R temos3
ä ȧ2
R=6 + + . (3.10)
a a2 a2
Podemos então obter as componentes
1
Gµν ≡ Rµν − Rδ µν .
2
As únicas não-nulas, são:
2
ȧ
G00 = −3 − 3 2, (3.11)
a a
2
ä ȧ
G11 = −2 − − 2, (3.12)
a a a
2
ä ȧ
G22 = G33 = −2 − − 2,
a a a
(3.13)
3 (3)
Um cálculo direto mostra que, partindo da definição de R, temos que = +1, 0, −1.
125
Desvio para o Vermelho
dt dr
= ±√ .
a(t) 1 − r2
O sinal depende do sentido da direção de propagação do fóton. Integrando esta ex-
pressão desde um tempo te (tempo de emissão) até um tempo t0 (tempo de observação),
temos: Z t0 Z re
dt dr
= √ = f (re ).
te a(t) 0 1 + r2
Consideremos um segundo raio luminoso que começa a sua trajetória um pequeno
intervalo de tempo após o primeiro (t02 = te + ∆te ). Este segundo raio chegará até nós
no tempo t0 + ∆t0 , onde
Z t0 +∆t0
dt
= f (re ),
te +∆te a(t)
onde a função f (re ) é a mesma nos dois casos, devido a que r é uma coordenada
comovente, e tanto a fonte quanto o observador se movem com o fluido cosmológico.
Subtraindo essas expressões, a considerando as aproximações ∆t0 << t0 e ∆te << te ,
temos
∆t0 ∆te
= .
a(t0 ) a(te )
Se νe é o comprimento de onda da radiação emitida e ν0 é o comprimento de onda
observado, temos
λe ∆te a(te )
= = .
λ0 ∆0 a(t0 )
Considerando o desvio espectral medido por z
λ0 − λe
z≡ ,
λ0
temos
a(t0 )
1+z = .
a(te )
Um desvio para o vermelho implica que a função a(t) é crescente: o Universo se
encontra em expansão. Este é precisamente o desvio medido por E. Hubble em 1929
(veja a Seção 2.2.3).
Horizontes
Dado que existe uma velocidade limite para a propagação de qualquer partı́cula,
devemos considerar o problema seguinte: quais pontos podem enviar sinais luminosas
tais que possam ser recebidas por qualquer observador até o tempo arbitrário t? Us-
ando novamente a função f (r), dada por
Z r
dr0
f (r) = √ ,
0 1 + r02
126
a distancia real entre a origem espacial e uma partı́cula situada em r1 , no tempo t, é
dada por Z r1
dr0
`(t) = a(t) √ ,
0 1 + r02
isto é,
`(t) = a(t)f (r1 ).
A partir da métrica de RW dada na eq.(3.6), o movimento de um fóton emitido
radialmente (dθ = dφ = 0) em direção à origem (isto é, em direção á posição do
observador) é descrito por
t r
dr0
Z Z
dt
=− √ ,
te a(t) re 1 + r02
e converge para o valor finito f0 . Logo, para cada valor do tempo, digamos t0 , existe
uma distância r0 tal que
f (r0 ) = f0 ,
isto é, tal que o fóton emitido em r0 no instante t0 atinge a origem (o observador ali
colocado) em um tempo infinito. Com efeito,
Z ∞
dt
f (r) = f (r0 ) − = f (r0 ) − f0 = 0.
t0 a(t)
Fótons emitidos no instante t0 , e afastados da origem por uma distância f (r) > f (re )
nunca serão observados pelo observador situado na origem. Dessa maneira, f (r0 ) = f0
define uma região chamada horizonte de eventos, pois ela separa eventos observáveis
de eventos para sempre inobserváveis.
Um exemplo de Universo onde esse fenômeno ocorre é dado pela geometria de de
Sitter, cujo elemento de linha pode se escrever como:
127
Voltemos agora nossa atenção para fenômenos já observados desde a origem dos tempos
(t = 0), ate um dado valor t0 . Um fenômeno arbitrário terá sido observado por um
observador se a distância f (r) se anulou. Temos agora
Z t0
dt
f (r) = f (re ) − .
0 a(t)
Rt
Em t = t0 , as partı́culas afastadas da origem por um valor f (re ) > 0 0 dt/a(t) ainda
não foram observadas (pelo observador na origem).
Rt
A região definida pelo valor f0 = 0 0 dt/a(t) caracteriza, como a expressão análoga
anterior, um horizonte, chamado horizonte de partı́culas. À medida que o tempo passa,
mais e mais partı́culas vão sendo observadas. Se todas serão observadas, isto é, se
Rconheceremos
∞
no futuro toda a região espacial para um dado t, depende do valor de
0
dt/a(t) ser convergente ou não.
Tensor de Projeção
Seja v µ um campo vetorial do tipo tempo definido sobre uma variedade espaço-
tempo M4 . Em cada ponto P de M4 , ele determina um sub-espaço tri-dimensional
constituido de vetores ortogonais ao campo de velocidades normalizado v µ :
vµ vν g µν = 1 (3.14)
Se identificarmos este campo vetorial com uma classe de observadores movendo-se com
esta velocidade, o sub-espaço H, determinado pelo conjunto de vetores ortogonais a
v µ , constitui o que chamamos simplesmente ”espaço” - verdadeiramente o tri-espaço
associado ao observador correspondente. Construiremos o tensor hµν de projeção no
tri-espaço H, pela expressão
hµν ≡ gµν − vµ vν . (3.15)
Esse tensor projeta objetos geométricos, como tensores, por exemplo, definidos em M4 ,
no sub-espaço H perpendicular à v µ . É simples mostrar que hµν tem as caracterı́sticas
de um projetor. Com efeito, ele satisfaz as propriedades:
hαβ v β = gαβ v β − vα vβ v β = 0.
128
Note ademais que hµν é simétrico:
hµν = hνµ .
Podemos então identificar o tensor hµν com a métrica induzida em H pela geome-
tria de M4 . Um observador de velocidade ~v , localizado em um dado ponto P de M4
de coordenadas xα (P ) mede a sua distância a um ponto Q vizinho, de coordenadas
xα (P ) + ∆xα pela forma:
ds2 (P Q) = gµν dxµ dxν = hµν dxµ dxν + (vµ dxµ )2 (3.16)
Tal operação gera um tensor Bµλ ≡(3) ∇µ Wλ que pertence a H. Com efeito, v λ Bµλ = 0
e também v µ Bµλ = 0 .
Um cálculo simples permite mostrar que a conexão (3) Γαµν está associada à métrica hµν
no tri-espaço H, pois
(3)
∇µ hβν = 0.
Com efeito, temos
(3)
∇µ hβλ = hµα hβσ hλρ ∇α hσρ = −hµα hβσ hλρ ∇α (Vσ Vρ ) = 0.
Parâmetros Óticos
129
Usando o teorema de decomposição de tensores em partes irredutı́veis, podemos escr-
ever
θ
Qαβ = hαβ + σαβ + ωαβ , (3.17)
3
onde σαβ é tensor simétrico de traço nulo e ωαβ tensor anti-simétrico. Segue que
1 1
ωαβ = (Qαβ − Qβα ) = h[αµ hβ]λ vµ;λ , (3.18)
2 2
1 µ λ 1
σαβ = h h vα;λ − θhαβ , (3.19)
2 [α β] 3
θ = hαλ vα;λ = v α ;α . (3.20)
Vemos que os tensores σµν e ωµν pertencem a H. Com efeito, das definições acima
segue que σµν v µ = 0, e ωµν v µ = 0 Podemos então escrever
θ
hαβ hµλ vα;µ = hβλ + σβλ + ωβλ . (3.21)
3
Desenvolvendo o lado esquerdo temos
v̇β ≡ vβ;α v α .
hµν = gµν − vµ vν .
130
Propagação das Quantidades Cinemáticas
Mas,
hαµ hβν (vµ;ν )· − hαµ hβν aµ;ν + hαµ hβν vµ;γ v γ ;ν = Rµενγ v ε v γ hµα hνβ , (3.25)
hαµ hβν (Qµν +aµ vν )· −hαµ hβµ aµ;ν +hαµ hβν (Qµγ +aµ vγ )(Qγν +aγ aµ ) = Rαεβγ v ε v γ . (3.26)
Daı́,
hαµ hβν Q̇µν + aµ aν hαµ hβν − hαµ hβν aµ;ν + +hαµ hβν Qµγ Qγν + hαµ hβ aµ vγ Qγν = Rαεβγ v ε v γ .
(3.27)
µ
Lembrando que aµ Q ν = 0, obtemos finalmente,
hαµ hνβ Q̇µν + aα aβ − hαµ hνβ aµkν + Qαγ Qγβ = Rαεβγ v ε v γ . (3.28)
Equação de Evolução de θ
Mas
131
isto é, Q = θ Daı́, temos
Mas
µα θ θ µα
Qαµ Q = hαµ + σαµ + ωαµ h + σ µα + ω µα =
3 3
θ2
= + σµα σ µα + ωαµ ω µα .
3
Definiremos as normas σ 2 , ω 2 :
1
σ2 ≡ σµν σ µν ,
2
1
ω2 ≡ ωµν ω µν .
2
Daı́,
θ2
Qαµ Qµα = + 2σ 2 − 2ω 2 .
3
Então
θ2
θ̇ + + 2σ 2 − 2ω 2 − aµ ;µ + ȧµ v µ + aµ aµ = Rµν v µ v ν .
3
Mas,
ȧµ v µ = (aµ v µ )· − aµ aµ = −aµ aµ .
Tem-se, finalmente:
θ2
θ̇ + + 2σ 2 − 2ω 2 − aµ ;µ = Rµν v µ v ν . (3.29)
3
A equação (3.29) determina a evolução do parâmetro θ ao longo da curva e é conhecida,
em Cosmologia, como equação de Raychaudhuri. Ela pode ser usada para demostrar
que o universo descrito pela solução de Friedman é singular, assumindo a validade de
algumas hipóteses, como por exemplo a chamada condição de energia forte, dada por
ρ+3p > 0. É importante notar que a inevitabilidade da existência de uma singularidade
inicial tem sido contestada em diversas ocasiões ao longo da história da cosmologı́a.
De fato, existem modelos que não apresentam singularidade (veja mais adiante).
132
Nesta Seção apresentaremos a teoria geral do fluido cósmico, bem como estudaremos
a expressão da energia gerada por campos escalar, vetorial, etc., em um espaço de
Riemann arbitrário. Deixaremos a discussão da caracterização das diversas fases do
nosso Universo para outro lugar.
v µ v ν gµν = +1.
qµ v µ = 0,
πµν v µ = 0,
πµν g µν = 0,
πµν = πνµ .
Conservação da Energia
T µν;ν = 0. (3.31)
133
onde
ρ̇ ≡ v µ ∂µ ρ ,
(phµν );ν vµ = −pθ,
(q µ v ν + q ν v µ )kν vµ = q̇ µ vµ + q νkν + q ν v µkν vµ = q̇ µ vµ + q µkµ ,
Pois, temos
v µ;µ vµ = 0.
E o quarto termo dará
Neste caso, as leis de conservação (3.33) e (3.35) reduzem-se às formas simples:
ρ̇ + (ρ + p)θ = 0, (3.37)
p,µ hµα = 0. (3.38)
T dS = dE + pdV,
ao caso do universo descrito pela métrica de Friedman, para o qual o volume é pro-
porcional à a(t)3 , e a expansão é adiabática (S =constante).
134
Na investigação de um modelo idealizado capaz de representar o fluido cósmico, somos
levados a considerar equações de estado que estabelecem dependência funcional da
pressão com a densidade de energia. Supondo uma equação de estado barotrópica,
p = p(ρ) em particular, consideraremos dependência linear de p com ρ:
p = λρ,
onde
ρ = Tµν v µ v ν ,
e
1
Tµν (g µν − v µ v ν ).
p=
3
Um segundo observador, com velocidade veµ decompõe o mesmo tensor momento-
energia sob a forma
ρ + pe) veµ veν − pegµν ,
Tµν = (e (3.40)
onde
ρe = Tµν veµ veν ,
e
1
pe = Tµν (g µν − veµ veν ).
3
A questão que queremos responder envolve a relação entre λ e λ e onde p = λρ e pe = λe
eρ.
Temos a relação
(ρ + p) vµ vν − pgµν = (e
ρ + pe) veµ veν − pegµν (3.41)
Multiplicando por veµ veν e definindo β ≡ v µ veµ obtemos
ρe = β 2 − β 2 λ − λ ρ
(3.42)
isto é
1 2
β λ − β 2 + 1 − 2λ ,
pe = (3.43)
3
Finalmente
2 2
e = 1 β λ − β + 1 − 2λ .
λ (3.44)
3 β 2 − β 2λ − λ
135
Podemos agora responder à pergunta anterior sobre qual o valor de λ para o qual
qualquer observador atribui o mesmo valor. Segue desta expressão acima que isso
ocorre para λ = − 1. Um tal fluido com a equação de estado p = −ρ é chamado
de vácuo. Em 1917, Einstein modificou as equações da RG adicionando um termo
proporcional à métrica:
1
Rµν − gµν R + Λgµν = Tµν , (3.45)
2
onde Λ é a constante cosmológica.
O que dizer sobre a parte material? Qualquer fluido pode ser caracterizado por uma
densidade de energia, uma pressão isotrópica, pressões anisotrópicas e fluxo de calor.
Com a suposição de isotropia, pressões anisotrópicas e fluxo de calor (que indicaria
uma direção privilegiada) não devem existir. A hipótese de homogeneidade implica
que tanto a densidade de energia quanto a pressão isotrópica devam ser funções só do
tempo, denotadas a partir de agora por ρ(t) e p(t), respectivamente. Atualmente, as
partı́culas que formam esse fluido seriam aglomerados de galáxias com pouca interação
entre si, e portanto pressão praticamente nula. Na situação onde as escalas de distância
são bem menores, quando não existem gláxias mas partı́culas fundamentais e radiação
em equilı́brio térmico, a pressão seria relevante. Sendo ela dada, aproximadamente, por
p = ρ < v 2 > /3c, onde < v 2 > representa o valor médio do quadrado das velocidades
dos constituintes do fluido e c a velocidade da luz, terı́amos que, em situações de alta
temperatura onde tais partı́culas teriam velocidades próximas da velocidade da luz,
p ≈ ρ/3 (correções relativı́sticas não alteram este resultado), muito próximo de um
gás de fótons, onde p = ρ/3 exatamente.
Qual a relação entre a densidade de energia e o fator de escala para o caso de poeira
e radiação? Para a poeira, se há conservação de massa, então ρ x volume ∝ ρa3 =cte.
Para radiação, se há conservação do número de fótons com frequência ν, N (ν) =cte.
(hipótese bastante razoável na maior parte da história do Universo), teremos que
ρ(ν) = N (ν)hν/volume, onde hν é a energia de um fóton de frequência ν (h é a
constante de Planck). Mas o comprimento de onda de um fóton é diretamente propor-
cional ao fator de escala (como segue da Eq.2.2), e portanto a sua frequência e energia
inversamente proporcional a este. Assim, ρa4 = cte. Concluindo temos, para poeira
ρp = cp /a3 e para radiação ρr = cr /a4 , onde cr e cp são constantes. Estas relações
poderiam ter sido obtidas a partir da equação relativı́stica de conservação de energia
numa geometria dada pela Eq.(3.6)
ȧ
ρ̇ + 3 (ρ + p) = 0, (3.46)
a
substituindo-se na mesma as equações de estado p = 0 e p = ρ/3, correspondentes à
poeira e radiação, respectivamente. No caso de uma equação de estado geral, dada por
p = ωρ, com ω arbitrario, a equação (3.46) pode ser integrada, dando como resultado
ρa3(1+ω) = const. (3.47)
136
e das expressões (3.13) e (3.36) seguem as equações
2
ȧ 3ε
3 + 2 = 8πGρ + Λ, (3.48)
a a
ä 4πG Λ
=− (ρ + 3p) + , (3.49)
a 3 3
já exibidas no Capı́tulo 2. Junto com estas podemos considerar a conservação da
energia, dada na eq.(3.46). Da identidade de Bianchi
Gµν;ν ≡ 0,
segue que estas três equações não são independentes. Quando a constante cosmológica
Λ é nula, podemos caracterizar a seção espacial do modelo cosmológico, através de
uma medida da densidade de energia contida no Universo. Com efeito, temos (quando
Λ = 0)
8πGρ 2
= a − ȧ2 . (3.50)
3
Definindo uma densidade critica ρc pela relação
2
3 ȧ 3H 2
ρc = ≡ , (3.51)
8πG a 8πG
podemos escrever (3.50) sob a forma
a2
= (ρ − ρc ) . (3.52)
3
Vemos desta equação que o sinal de ρ − ρc implica em tres possibilidades:
ρ > ρc =⇒ > 0 =⇒ = 1,
ρ = ρc =⇒ = 0,
ρ > ρc =⇒ < 0 =⇒ = −1.
Rµν v µ v ν = 0. (3.53)
137
A partir das equações de Einstein
1
Rµν = −Tµν + T gµν , (3.54)
2
temos que
1
Rµν V µ V ν = −Tµν V µ V ν +
T.
2
Para um fluido perfeito, sem pressão, o tensor momento-energia assume a forma
Dai
ρ
Rµν v µ v ν = − ,
2
que é incompatı́vel com a eq. (3.53), mostrando que as propriedades cinemáticas im-
postas a priori para o fluido cósmico no modelo de Einstein são incompatı́veis com
uma densidade de matéria diferente de zero. Para identificar tal modelo como rep-
resentativo do nosso cosmos, Einstein foi levado a alterar suas equações originais da
gravitação com a introdução de uma constante cósmica fundamental que foi repre-
sentada pela letra grega Λ. Assim, as equações que descrevem a gravitação a longas
distâncias deveriam ser distintas das equações gravitacionais em nossa vizinhança, isto
é, para distâncias não-cósmicas (por exemplo no Sistema Solar). O modo mais simples
de alteração das equações originais de Einstein conduziu à expressão:
1
Rµν − Rgµν + Λgµν = −Tµν , (3.55)
2
onde Λ tem dimensão de (comprimento)−2 . Equivalentemente, escrevemos:
1
Rµν = −Tµν + T gµν + Λgµν . (3.56)
2
Note que para que a energia se conserve (isto é, para que a divergência covariante de
Tµν se anule, T µν;ν = 0) é preciso que Λ seja uma constante. Com a nova expressão eq
(3.56) tem-se
1
Tµν − T gµν − Λgµν v µ v ν = 0,
2
isto é,
ρ = 2Λ , (3.57)
mostrando assim a possibilidade de compatibilização das novas de equações de
gravitação com um fluido estacionário. A metrica da geometria de Einstein é dada
por
ds2 = dt2 − a2 dχ2 + σ 2 (χ) dθ2 + sen2 θdφ2 ,
(3.58)
onde a é uma constante e σ(χ) uma função, a única a ser determinada para o conheci-
mento completo desta geometria. Usando as equações (3.8),(3.9), e seguintes obtemos,
da equação (3.55), Componente (0 − 0) :
3
= 8πGρ + Λ. (3.59)
a2
Componente (1 − 1) : 00
1 σ
2 + 3 = Λ. (3.60)
a2 σ
138
Componente (2 − 2) :
1 σ 00
= −Λ. (3.61)
a2 σ
Destas equações seguem os resultados
σ = senχ, (3.62)
1
Λ = 2. (3.63)
a
(3)
Usando esses valores na definição da curvatura espacial R,
(3) σ 00 2 σ02
R=4 − 2 + 2 2 = 6,
σ σ σ
encontramos
= 1,
e de (3.59) a relação encontrada anteriormente:
Λ
ρ= .
4πG
Assim, a positividade da energia implica que Λ deve ser uma quantidade positiva.
Finalmente, a métrica de Einstein se escreve:
1 2
ds2 = dt2 − dχ + sen2 χ dθ2 + sen2 θdφ2 .
(3.64)
Λ
O domı́nio das variáveis é dado por −∞ < t < +∞; 0 < χ < π; 0 < θ < π;
0 < φ < 2π. É fácil ver que o volume do universo de Einstein é independente do
tempo e dado por V = 2π 2 Λ−3/2 .
139
De (3.67) vemos que o modelo sera compatı́vel se Λ < 0. As equações (3.67) e (3.68)
são facilmente integráveis. Obtemos
√ Λ
a(t) = a0 e − 3 t. (3.69)
Neste caso, a expansão θ = 3ȧ/a se reduz a uma constante:
√
θ = −2Λ.
Esta geometria foi descoberta por de Sitter em 1917, e constituiu durante bastante
tempo um modelo cosmológico competitivo com os modelos expansionistas de Fried-
man.
Caso II: Seção Aberta (ε = −1; σ = senχ). A solução do sistema de equações neste
caso, dado por
2
ȧ 3
3 − 2 = −Λ,
a a
2
ä ȧ 1
2 + − 2 = −Λ,
a a A
depende do sinal da constante cosmológica. Se Λ < 0, temos:
s r !
3 |Λ|
a(t) = sinh t ,
|Λ| 3
e, consequentemente "r #
p |Λ|
θ = 3|Λ| coth t .
3
Se Λ > 0, a solução para a(t) é dada por
r r !
3 Λ
a(t) = sen t ,
Λ 3
e para a expansão: "r #
√ Λ
θ= 3Λ cot g t .
3
Caso III: Seção Fechada (ε = 1; σ = senχ). Temos as equações:
2
ȧ 3
3 − 2 = −Λ,
a a
2
ä ȧ 1
2 + − 2 = −Λ.
a a a
A solução é dada par s r !
3 |Λ|
a(t) = sinh t .
|Λ| 3
Note que como consequência da equação
2
ȧ 3
3 − 2 = −Λ
a a
a constante cosmológica, neste caso, não pode ser positiva.
140
3.5.3 Modelo cosmológico de Friedman
Como vimos anteriormente, o conteúdo material do univeso pode ser modelado usando
um fluido perfeito. As equações de Einstein, dadas por Gµν = 8πGTµν para a métrica
de Friedman e tendo um fluido perfeito como fonte, incluindo a constante cosmologica,
são dadas por: 2
ȧ 8πG
+ 2 = ρ, (3.70)
a a 3
4 p
ä = − πG ρ + 3 2 a, (3.71)
3 c
onde ρ e p são a densidade de energia e a pressão totais (incluindo a constante cos-
mológica). Conforme discutido anteriormente, distingue-se três periodos distintos na
evoluç ao do universo, caracterizados por diferentes fontes da curvatura. Primeira-
mente, consideraremos uma fase de radiação na qual p = 1/3 ρ), em seguida uma
fase de poeira ou matéria incoerente onde p = 0, e finalmente uma fase de expansão
acelerada, causada pela “energia escura”. Nas considerações que seguem modelare-
mos a fase atual usando a constante cosmológica como energia escura. Somando estas
contribuições podemos escrever
2
8πG ρ0m ρ0r
ȧ Λ
+ 2 = + 4+ , (3.72)
a a 3 a3 a 8πG
onde ρ0m e ρ0r são a densidade de matéria e radiação em algum momento da evolução .
Definindo as quantidades
ρm
Ωm = ,
ρc
ρr
Ωr = ,
ρc
Λ
ΩΛ = , (3.73)
8πGρc
podemos escrever
8πGa2 ρc
= (Ωm + Ωr + ΩΛ − 1) . (3.74)
3
Assumindo uma equação de estado p = ωρ, podemos encontrar a forma genérica do
fator de escala. Como vimos em (3.47),
ρ ∝ a−3(1+ω) .
Note que para tempos pequenos, se ω > −1/3, podemos desprezar o termo /a2 frente
aos termos de matéria na equação (3.70) e ao termo da constante cosmológica. Assim,
podemos integrar a (3.70):
a(t) ∝ t2/3(1+ω) . (3.75)
No universo primitivo, podemos supor que as partı́culas são relativı́sticas, com ω =
1/3. Da (3.75),
ar (t) ∝ t1/2 .
Para tempos mais longos, é a matéria não relativı́stica quem domina o lado direito da
(3.70), com ω = 0. Supondo que = 0 obtemos
am (t) ∝ t2/3 .
141
3.5.4 Análise geral
A equação de Friedmann (3.72) com poeira, radiação e constante cosnológica, para
arbitrário pode ser escrita da seguinte forma:
Ω0 = 1.010+0.018
−0.017 , (3.79)
Ω0p = 0.27+0.03
−0.04 , (3.80)
e
Ω0Λ = 0.70+0.04
−0.03 , (3.81)
vemos que V (amax ) < −1. Assim, no cenário idealizado de Friedman o universo,
para qualquer que seja o valor de o Universo se expande desaceleradamente desde a
singularidade presente neste modelo a = 0 até amax , passando então, a partir daı́, a se
expandir aceleradamente. De fato, é este tipo de comportamento que as observações
vêm indicando. Para este modelo, a idade do Universo seria dada por (veja Exerı́cio)
1/2
2 −1 −1/2 h 1 + Ω0Λ i
t0 = H0 Ω0Λ ln 1/2
, (3.82)
3 1 − Ω0Λ
Segue então, para Ω0Λ = 0.69 e h = 0.66, um valor de t0 de 14.5 bilhões anos.
adicionar exercicio: análise geral do potnecial (do d’inverno)
142
3.6 Modelos cosmológicos com menos simetria
Na investigação das possı́veis estruturas métricas do Universo, encontramos dois
tipos caracterı́sticos de modelos. Chamamos modelo convencional àquele que admite
como fonte principal de curvatura um fluido perfeito (incluindo o vazio); e denotamos
modelo não-convencional os demais. Não deve causar espanto o fato de que modelos
convencionais, possuindo uma fonte tão simples, tenham sido historicamente descober-
tos numa primeira fase da investigação cosmológica, e que os não convencionais tenham
história mais recente. Nesta seção trataremos dos modelos descobertos por Gödel e
Kasner.
Como foi discutido, o tensor momento-energia do fluido cósmico é descrito por:
Modelo
Cosmológico Expansão Rotação Deformação
Einstein Não Não Não
Friedmann Sim Não Não
Kasner Sim Não Sim
Gödel Não Sim Não
143
Escolhendo uma base de tetradas ortonormalizadas eA
µ tal que
e0µ = δµ0
e1µ = a(t)δµ1
e2µ = b(t)δµ2
e3µ = c(t)δµ3
0 ȧ
R101 =
a
0 ḃ
R202 =
b
0 ċ
R303 =
c
0 ȧ ḃ
R212 = (3.85)
ab
0 ȧ ċ
R313 =
ac
0 ḃ ċ
R313 =
bc
onde definimos as componentes das tetradas para um tensor X AB pela relação
X AB = eA B µν
µ eν X .
Contraindo,
ä b̈ c̈
R00 = +
a bc !
ä ȧ ḃ ċ
R11 = + + (3.86)
a a b c
2 b̈ ḃ ȧ ċ
R2 = + +
b b a c
!
c̈ ċ ȧ ḃ
R33 = + +
c c a b
RAB = 0 (3.87)
144
Kasner propôs uma solução dessas equações sob a forma de potências de t. Ponhamos
a(t) = tp1
b(t) = tp2 (3.88)
c(t) = tp3
onde pl , p2 , p3 são constantes. As únicas relações entre elas, impostas por (3.87) dão
(faça como exercı́cio)
p1 + p2 + p3 = 1 (3.89)
(p1 )2 + (p2 )2 + (p3 )2 = 1 (3.90)
Podemos observar logo que um desses pk é negativo e os outros dois positivos. Ademais,
o domı́nio deles pode ser descrito facilmente analisando-se a eq. (11). Vamos denotar
os números pk em uma ordem tal que sempre teremos p1 < p2 < p3 . Então devemos
ter para o domı́nio dos pk os valores:
1
− ≤ p1 ≤ 0
3
2
0 ≤ p2 ≤ (3.91)
3
2
≤ p3 ≤ 1
3
Note que quando (p1 , p2 , p3 ) = (0, 0, 1) a geometria se reduz ao espaço plano de
Minkowskii (faça como exercı́cio ). Vamos agora calcular os parâmetros de congruência
da geodésica v α = δ0α . (Deixamos ao leitor a demonstração de que essa curva é real-
mente uma geodésica da geometria de Kasner.) Temos, da definição da expansão θ:
α α
θ = v;α = v,α + Γαεα v ε = Γα0α
ȧ ḃ ċ (abc)·
= + + = ,
a b c abc
1 θ
σµν = (Vµ;ν + Vν;µ ) − hµν (3.92)
2 3
com h11 = g11 = −a2 . Dai
ȧ 1 V̇ 2
σ11 = − a,
a 3 V
e, analogamente
ḃ 1 V̇
σ22 = − ,
b 3 V
ċ 1 V̇
σ33 = − .
c 3 V
145
Note que σ11 + σ22 + σ33 = 0, como deveria ser. Da definição de rotação , temos imedi-
atamente que:
1
ωµν = V[µ;ν] = 0.
3
Assim, a geometria de Kasner representa um Universo sem matéria (o campo grav-
itacional se auto-alimenta) com expansão distinta segundo três eixos ortogonais, isto
é, possui anisotropia, mas não apresenta rotação. A análise do comportamento do
Universo nas vizinhanças da singularidade admite duas atitudes, a saber:
(i) Admite-se que o modelo de Friedmann do Universo atual pode ser extrapolado
pare o passado sem qualquer limite.
(ii) Admite-se que o modelo de Friedmann é um estágio ulterior de um processo
inicial (eventualmente caótico) no qual todos os possı́veis comportamentos pode-
riam co -existir.
1 2cx 2
ds2 = dt2 + 2ecx dy dt + e dy − dx2 − dz 2 . (3.1)
2
Assim, o tensor métrico tem a forma matricial seguinte:
1 0 ecx 0
0 −1 0 0
gµν =
ecx 1 2cx
(3.2)
0 2
e 0
0 0 0 −1
146
2e−cx
−1 0 0
0 −1 0 0
gµν =
2e−cx
(3.3)
0 −2e−2cx 0
0 0 0 −1
e0(0) = 1,
e0(2) = ecx , (3.6)
e1(1) = 1,
1
e2(2) = √ ecx ,
2
3
e(3) = 1,
0 c2
R101 = , (3.8)
2
0 c2
R202 = , (3.9)
2
1 c2
R212 =− . (3.10)
2
A única componente não nula do tensor de curvatura contraı́do RAB é dado por
147
3.8.1 A Solução de Gödel
No modelo de Gödel, a fonte de curvatura é um fluido de densidade de energia ρ sem
pressão. No sistema de tétradas que estamos utilizando podemos escrever o tensor
momento-energia sob a forma
TAB = ρ δA0 δB0 , (3.13)
onde a velocidade vA no sistema inercial local vale vA = δA0 . A equação de Einstein
com termo cosmológico se escreve:
κ
RAB = −κ TAB + T ηAB + Λ ηAB (3.14)
2
Da componente 0 − 0 obtemos
κρ
c2 = − Λ, (3.15)
2
e da componente 1 − 1,
0 = −κρ − 2Λ. (3.16)
As demais componentes diagonais repetem a expressão de 1 − 1. Temos então que
κρ = −2Λ = c2 . (3.17)
A positividade da energia está assegurada (c2 > 0) e temos então que Λ deve ser
negativa. Para entender o significado da constante c vamos estudar as congruências
de curvas comoventes com o fluido.
Quantidades Cinemáticas
θ=0
(iii) Rotação: Da definição dada anteriormente o único termo não-nulo é dado por
√
2ω 12 = −γ 012 + γ 021 = − 2 c
isto é,
c
ω12 = − √ . (3.18)
2
A
Para o vetor de rotação ω encontramos, na base de tetradas
A c
ω = (0, 0, 0, ω12 ) = 0, 0, 0, − √ . (3.19)
2
148
Chamando de −Ω2 a norma de ω A (lembre que ω A é um vetor do tipo espaço), teremos
c2
Ω2 = −ω A ωA = . (3.20)
2
Assim, escrevemos
ω A = (0, 0, 0, −Ω)
Esse resultado permite escrever então que vale a relação
κρ = 2Ω2 , (3.21)
e0(0) = a
e0(2) = ah
e1(1) = a (3.23)
e2(2) = a∆
e3(3) = a
p
onde definimos ∆ pela relação ∆ ≡ h2 − g. As inversas:
(0) 1
e0 =
a
(0) h1
e2 = −
∆a
(1) 1
e1 = (3.24)
a
(2) 11
e2 =
a∆
(3) 1
e3 =
a
A
Daı́, obtemos as curvaturas RBCD :
2
1 h0
R0101 = 2 ,
4a ∆
149
2
1 h00 h0 ∆0
R0112 =− 2 − 2 ,
2a ∆ ∆
2
1 h0
R0202 = 2 ,
4a ∆
" 0 2 #
00
1 ∆ 3 h
R1212 = 2 − ,
a ∆ 4 ∆
κρ = −2Λ , (3.29)
e consequentemente, 2
∆00 1 h0
− =0 (3.30)
∆ 2 ∆
Uma solução de (3.30), encontrada por Gödel, é dada por
√
h = 2 sinh2 r (3.31)
∆ = sinh r cosh r (3.32)
150
Assim, temos: 2
1 h0 κρ
− 2 = − + Λ = −κρ (3.33)
2a ∆ 2
Mas √ √
h0 = 2 2 sinh r cosh r = 2 2 ∆
e então,
4
κρ = (3.34)
a2
Lembrando que a rotação ω A vale
1 ABC
ωA = ε ωBC
2
1 h0
e que o tensor de rotação vale ω12 = − 2a ∆
, temos:
" √ #
1 h0
A 2
ω = 0, 0, 0, − = 0, 0, 0, − (3.35)
2a ∆ 2
De Ω2 = −ω A ωA , temos:
2
Ω2 = (3.36)
a2
κρ = 2Ω2 (3.37)
que foi o resultado obtido anteriormente (cf. eq. (3.21)).
Seja RC o raio crı́tico tal que sinh(RC ) = 1. Para os valores de rI tais que 0 < rI < RC
temos g < 0, e para rII < RC tem-se g > 0. Isto é, o cı́rculo nulo (g = 0) definido
por z = constante, t = constante, r = RC separa o espaço-tempo de Gödel em duas
regiões que chamaremos C e A (iniciais de causal e acausal, respectivamente). Na região
interna a RC , isto é, a região C, as curvas fechadas são do tipo espaço. No entanto, em
A, os cı́rculos definidos por t = constante, r = constante, z = constante, são do tipo
tempo. Isto é, um observador real poderia nesta região viajar ao seu passado. Como
a geometria de Gödel é homogênea, devemos concluir que por cada ponto passe uma
curva acausal. Considere , no entanto, o observador centrado em 0. Pelo que vimos
acima, as curvas fechadas só ocorrem para r > RC . Como conciliar esse resultado com
a homogeneidade da geometria de Gödel ? Seja P um ponto vizinho de 0. Existe,
pelo que vimos acima, uma curva de raio constante passando por P centrado em 00
tal que para o observador em 00 , a curva por P está além de seu raio crı́tico R0 c .
Ocorre que a curva por P que viola causalidade cruza duas vezes a fronteira RC de 0,
penetrando assim na região acausal de 0. Se limitarmos nossas observações em 0 ao
151
interior de seu raio crı́tico, não podemos verificar violação de causalidade pela curva
em P . Isto evidencia o caráter global, isto é, não local, da causalidade. Dificuldades
nessa geometria de Gödel ocorrem se o observador caminha além de seu raio crı́tico.
Aı́, a questão da violação da causalidade aparece inevitavelmente.
Um exemplo explı́cito de uma curva do tipo tempo fechadas em Gödel pode ser descrita
considerando a curva γ : xα = xα (s) tal que
z = cte
t = cte (3.38)
r = cte
0 < ϕ < 2π
sinh rc = 1
Assim, para r > rc ⇒ ds2 > 0 e a curva é do tipo tempo e fechada; nós a deno-
taremos pela sigla inglesa CTC. É deixado como exercicio mostrar que esta curva
não é geodésica. A existencia de CTC implica que não é possivel dividir a variedade
espaço-tempo quadridimensional em termos de uma dimensão de tempo (global) e três
de espaço – a separação dita 3 + 1.
∂V (ϕ)
2ϕ + =0 (3.39)
∂ϕ
1 √
2ϕ ≡ √ −g ϕ,α g αβ ,β .
−g
152
Note que nesta expressão gµν representa a métrica de Minkowski escrita em um sistema
arbitrário de coordenadas. A equação (3.39) pode ser obtida a partir da Lagrangiana:
1
Lϕ = ϕ,α ϕ,β g αβ − V (ϕ) (3.40)
2
Se o potencial se restringe à expressão
1 2 2
V (ϕ) = µϕ (3.41)
2
então o campo escalar é livre e massivo com massa igual a m = µ~/c (isto porque,
no espaço de momenta, cada modo do campo escalar com quadri-momentum k µ se
comporta como uma partı́cula livre massiva satisfazendo gµν k µ k ν = m2 ).
De posse desta Lagrangiana, podemos obter a expressão do tensor momento-energia
através da relação (veja a Eq.1.117)
√
2 δ −gLϕ
Tµν ≡ √
−g δg µν
Usando a expressão
√ 1√
δ −g = − −ggµν δg µν , (3.42)
2
é fácil mostrar que para Lϕ dada pela equação (3.40) obtem-se:
Vamos agora examinar o que ocorre quando o campo escalar interage com um campo
gravitacional. Em geral, quando qualquer campo da fı́sica está em interação gravita-
cional, dois tipos de acoplamento são possiveis:
• Acoplamento mı́nimo;
• Acoplamento direto com a curvatura ou não-mı́nimo.
153
No caso do campo escalar, claro está que qualquer termo do tipo f (R)ϕ2 , para uma
função f arbitrária, acrescido à Lagrangeana no espaço plano poderia ser admitida
como gerando um bom sistema de equações capaz de conduzir no limite de pequena
curvatura (como perto da Terra), Rαβρσ → 0, às equações do campo escalar no espaço
de Minkowski. Infelizmente, essa arbitrariedade não é possı́vel de ser removida sem
a introdução de um critério adicional como, por exemplo, com uma nova invariância
para o campo escalar.
Alguns autores, seguindo este caminho, propuseram alterar a Lagrangeana escalar
para a forma
1 R
Lcϕ = ϕ,α ϕ,β g αβ − ϕ − V (ϕ) (3.44)
2 6
A principal motivação para essa alteração está associada à invariância das equações
de movimento obtidas a partir de Lϕ , quando V (ϕ) = λϕ4 /4, mediante as chamadas
transformações conformes, a saber, a aplicação
eαβ = Ω− 2 Rαβ µν − 1 δ [ α [ µ Lβ ] ν ]
R µν
4
onde os colchetes significam antissimetrização e usamos que
eαµ = Ω− 2 Rα µ − 1 Lα µ − 1 Lδµα
R
2 4
e = Ω−2 R + 6 2 Ω
R (3.47)
Ω
Finalmente, coletando essas transformações, obtém-se para o tensor de Weyl a lei:
f αβ = Ω− 2 W αβ µν
W µν
f α = W α βµν
W βµν
que é, por esta razão, também chamado de tensor de curvatura conforme.
154
Voltando à Lagrangiana (3.44), variando-se Lcϕ obtemos
R
2 ϕ+ ϕ + λϕ3 = 0 (3.48)
6
Da equação (3.47) e da relação
2
e ϕ̃ = −Ω−4 ϕ 2 Ω + Ω−3 2 ϕ,
obtem-se
R
e R
2
e ϕ̃ + ϕ̃ + λϕ 3
e =Ω−3
2 ϕ+ + ϕλϕ 3
6 6
Vemos assim que a introdução do fator proporcional ao escalar de curvature R na
Lagrangeana gera uma nova simetria: a invariância da equação do campo escalar por
transformação conforme.
Vamos a seguir detalhar um pouco mais os dois tipos de acoplamento.
Acoplamento Mı́nimo
L = LE + Lϕ
onde LE representa a Lagrangiana de Einstein-Hilbert e Lϕ a Lagrangiana do campo
escalar dada por:
1
L= ϕ,µ ϕ,ν g µν − V (ϕ) (3.49)
2
Da definição do tensor energia-momento (3.43) segue a expressão
Tµν = ϕ, µ ϕ, ν − L gµν (3.50)
cujo traço é
T = −ϕ,µ ϕ,µ + 4 V.
Uma situação bastante estudada consiste em identificar o termo de potencial V com um
polinômio de ordem n. Consideremos, como um exemplo particular, a forma quártica
1 1
V = µ2 ϕ2 + λ ϕ4 . (3.51)
2 4
A equação de movimento é dada por
∂V
2ϕ + = 0.
∂ϕ
Quando o potencial não é um monômio, existe a possibilidade de uma solução ho-
mogênea. Isso ocorre quando V possui um extremo6
∂ V
= 0.
∂ ϕ ϕ0 = const
No caso em que V é dado por (3.51) temos duas possibilidades
6
Nessa seção estamos considerando o campo ϕ como real.
155
• ϕ = 0.
• ϕ0 = − µ2 /λ.
p
Como o campo é real segue que para existir a solução não-trivial acima é preciso que
tenhamos λ < 0. Com a forma anterior para a distribuição de energia deste campo,
podemos calcular a sua expressão explı́cita no caso homogêneo não-trivial. Temos
Λef ≡ V ( Φ0 ).
Segue então o resultado notável:
Acoplamento Não-Mı́nimo
1 1
Lc = ϕµ ϕν g µν − V (ϕ) + R ϕ2 + 2 Λ + R (3.52)
2 κ
Vamos examinar o caso especial do acoplamento conforme onde a constante = − 16 .
A equação do campo escalar é dada por
1 ∂V
2ϕ + Rϕ+ = 0. (3.53)
6 ∂ϕ
1 1
T c = −ϕ, λ ϕ, λ + 2 V + R ϕ2 + 2 ϕ2
6 2
e, usando a equação de movimento dá
1 ∂V
Tc = 2V − ϕ
2 ∂ϕ
Note que quando a massa for zero e o potencial V reduzir-se ao monômio de quarta
ordem, da equação acima segue o resultado que procurávamos, a saber
156
Estrutura Riemanniana e a geometrização do campo escalar
gµν;α = 0. (3.56)
Esta condição implica que geodésicas são também curvas com elemento de linha
extremo (máximo se for uma geodésica tipo-tempo e mı́nimo se for tipo-espaço) e
que o transporte paralelo de vetores preserva o ângulo entre eles, ambas propriedades
também presentes no espaço-tempo plano.
Segue desta expressão que a conexão é métrica, isto é ela pode ser escrita em termos
de derivadas do tensor métrico (se a parte anti-simétrica da conexão, chamada torsão,
for nula), através da fórmula:
1
Γα µν = g αβ [gβµ, ν + gβν, µ − gµν, β ] (3.57)
2
√
Z
SH = −gRd4 x.
7
Chamaria a atenção do leitor para o fato de que, ainda hoje, passado quase 80 anos, estes são os únicos
campos de longo alcance conhecidos. Embora algumas propostas de existência de campos de longo alcance
tenham aparecido neste século, nenhuma delas conseguiu exibir alguma evidência de sua existência.
8
Nós o chamaremos de método EP.
157
Ao examinarmos as consequências do princı́pio variacional sobre esta ação, ao invés de
considerarmos como usualmente é feito, que a estrutura métrica é dada a priori, nós
deixaremos isso para ser decidido no próprio espectro das variações permitidas neste
Princı́pio. Isto é, consideraremos que as variações possı́veis são completamente ar-
bitrárias, sem impormos o vı́nculo Riemanniano que relaciona as variações da métrica
às variações da conexão, admitiremos que as variações δgµν e δΓµαβ são independentes.
Consideremos um sistema local quase-Euclideano de coordenadas onde as variações
do tensor contraı́do de Ricci possa ser escrito sob a forma:
√ √ 1 √ 1 √
Z Z h
1 i
δSH = µν
−g Rµν − Rgµν δg + ( −gg µ );α − ( −gg µν );ν δα − ( −gg ν );ν δαµ δΓα µ .
2 2 2
Segue então que
√ 1 √ 1 √
( −gg µ );α − ( −gg µν );ν δα − ( −gg ν );ν δαµ = 0.
2 2
α
Multiplicando por δµ obtemos:
√
( −gg µ );α = 0.
Uma simples manipulação algébrica implica então que
gµ;α = 0 (3.58)
isto é, o espaço-tempo da Relatividade Geral é Riemanniano. A outra equação obtida
do princı́pio variacional é precisamente a equação de Einstein. Devemos reconhecer
que um tal resultado permite dar um passo além, retirando a análise da geometria do
mundo de considerações aprioristicas para colocá-la no território no qual se estrutura
a dinâmica.
158
Nós iremos mostrar que a resposta a esta pergunta depende do modo pelo qual a
matéria se acopla com a gravitação. Esse é talvez um dos mais inesperados resulta-
dos da extensão do método introduzido por Palatini, na caracterização da estrutura
geométrica do espaço-tempo. O modo mais simples de demonstrar isso consiste em
considerar um exemplo especı́fico. Aprendemos, no que vimos no exame da interação
entre um campo escalar e a gravitação, que há dois tipos de acoplamento possı́vel, a
saber:
• Acoplamento mı́nimo
• Acoplamento direto ou não-mı́nimo.
√
Lϕ = −gRϕ2 . (3.59)
Usando o procedimento variacional anterior temos:
√ √ 1 √ 1 √
Z Z h
1
δSϕ = µν
−gϕ Rµν − Rgµν δg + ( −gϕ2 g µ );α − ( −gϕ2 g µν );ν δα − ( −gϕ2 g ν );ν δ
2
2 2 2
Segue daı́, por um cálculo semelhante ao caso anterior (deixado como exercicio:
√
( −gϕ2 g µν ); = 0,
isto é, não segue da variação que a estrutura do espaço-tempo é Riemanniana, pois
temos
gµν α = Qµνα ,
onde o tensor Qµνα é função do tensor métrico e do campo ϕ. Para calcular a forma
explı́cita deste tensor podemos proceder por analogia com a estrutura Riemanniana.
Temos:
1
Γλ µα = ∆λ µα − [Qµ λ α + Qλ αµ − Qαµ λ ].
2
Usando o resultado anterior:
ϕ2 ,λ
Qµνλ = − gµν ,
ϕ2
isto é,
ϕ,α
gµν;α = −2 gµν . (3.60)
ϕ
159
Este tipo de geometria é chamada de geometria de Weyl integrável. Chegamos assim à
estrutura de Weyl através da interação não mı́nima entre gravitação e campo escalar.
Ele foi utilizado na Cosmologia para examinar cenários cosmológicos não singular, isto
é, possuindo uma fase de colapso anterior à fase de expansão.
F µν;ν = J µ (3.61)
proveniente da Lagrangeana
√
1 µν µ
L = −g − Fµν F + Jµ A , (3.62)
4
onde
Fµν = Aµ,ν − Aν,µ .
Entretanto, pode-se argumentar que na presença de campos gravitacionais intensos,
acoplamentos envolvendo funcionais da curvatura poderiam se tornar importantes e
alterar o sistema de equações do Eletromagnetisno. Essa idéia foi desenvolvida por
Novello e Salim. Eles argumentaram que, para campos fortes (isto é, quando a cur-
vatura do espaço-tempo é grande) a dinâmica do processo é descrita pela Lagrangeana
não-mı́nima:
√
1 µν µν µ ν
L = −g − Fµν F + λ R Aµ Aν g + β Rµν A A + LE + Lµ , (3.63)
4
160
onde
1
(1 + λA2 ) (Rµν − R gµν ) − λ 2 A2 gµν +
2
+λA2,µ;ν + λRAµ Aν = − Eµν − k Mµν
µ
F µν;ν = −λ RW µ + Jext (3.64)
A2 ≡ Aµ Aν gµν .
161
onde M = Mµν g µν . Substituindo esse valor de R na última equação do sistema (3.64)
temos:
3λ2 µ
F;νµν = −λ M Aµ + (2 A2 )Aµ + Jext (3.69)
k
A equação (3.69) exibe explicitamente o caráter não-linear da interação eletro-
magnética induzida pela curvatura do espaço-tempo. Vemos dessas equações que, para
campos fracos, o modelo de universo coincide com o obtido sem acoplamento direto,
isto é, para (λ = 0), que constitue uma primeira aproximação da interação entre os
campos eletromagnético e gravitacional.
b2 + 4c < 0
Embora este modelo apresenta um cenário coerente e capaz de prover uma descrição de
boa parte das observações cósmicas - isto é, não local - algumas dificuldades, tanto de
natureza formal quanto observacional, levaram a uma profunda crı́tica deste modelo.
Dentre estas podemos citar:
163
• Como conciliar as observações recentes de que o fator de escala do universo está
sendo acelerado com a positividade da energia e pressão, no cenário padrão?
Com o propósito de resolver alguns desses problemas, nos ultimos anos uma mudança
profunda vem sendo realizada na Cosmologia. Não iremos entrar nestes detalhes aqui,
mas comentaremos ao longo deste curso algumas dessas tentativas recentes de afasta-
mento do MCP. Alguns deles (como o chamado modelo inflacionário) são extensões
do MCP e são até mesmo entendidas como constituindo o novo modelo cosmológico
padrão (NMCP). Entretanto, a maior parte destas novas modificações ainda estão no
território da especulação.
θ̇ µ ν 1
hαµ hβν σ̇µν + hα hβ hµν + aα aβ − hαµ hβν (aµ;ν + aµ;µ ) +
3 2
1 µ 1
+ Qαµ Q β + Qβµ Qα = Rαεβν v ε v µ
µ
2 2
Mas
θ θ µ
Qαµ Qµβ = hαµ + σαµ + ωαµ µ µ
h +σ β +ω β =
3 3 β
θ2 2 2
= hαβ + θσαβ + θωαβ + σαµ σ µβ +
9 3 3
+σαµ ω µβ + ωαµ σ µβ + ωαµ ω µβ
Daı́
2 2 4
Qαµ Qµβ + Qβµ Qµα = θ hαβ + θσαβ + 2σαµ σ µβ + 2ωαµ ω µβ
9 3
Para simplificar esta expressão, usaremos a definição do vetor de rotação dado por
1 αβρτ
ωτ = η ωαβ vρ
2
cuja inversa é dada por
ωαβ = ηαβµν ω µ v ν
Tem-se, então:
ωαµ ω µβ = ηαµρσ ω ρ v σ η µβ ε τ
ετ ω v
βετ ρ
= δαρσ ω ωε v σ vτ
= ωµ ω µ hβα − ω β ωα
ω µ vµ = 0
164
Coletando esses cálculos, obtemos
1 1
hαµ hβν σ̇µν + hαβ θ̇ + aα aβ − hαµ hβν (aµ;ν + aν;µ ) +
3 2
θ2 2
+ hαβ + θσαβ + σαµ σ µβ + ωµ ω µ hαβ − ωβ ωα = Rαεβν V ε V ν
9 3
Usando a equação de evolução temos:
1
hαµ hβν σ̇µν + hαβ −ω 2 − 2σ 2 + aλ ;λ + aα aβ +
3
1 2
− hαµ hβν (aµ;ν + aν;µ ) + θσαβ + σαµ σ µβ − ωα ωβ =
2 3
ε ν 1 µ ν
= Rαεβν v v − Rµν v v hαβ (3.80)
3
que é a expressão da equação de evolução de σµν .
1 αβρτ
Lembrando a definição de ω τ = η ωαβ vρ , podemos escrever
2
ωαβ η αβγλ vλ − ωαβ η αβγλ vλ;γ + aα vλ vβ;γ η αβγλ = 0
;γ
isto é,
−2ω α ;α − ωαβ ωλγ η αβλγ − 2ω λ aλ − 2aα ω α = 0
ou ainda
ω α ;α + 2ω α aα = 0 (3.86)
− 23 θvα ωρ + 2aα ωρ = 1
2
Rαµβγ v µ vε ηργβε
Simetrizando em α, ρ:
onde g é o determinante da métrica gµν . Com este objeto é possı́vel definir para
qualquer par de ı́ndices antissimétricos um objeto dual. Assim, para um tensor anti-
simétrico arbitrário Fµν = − Fνµ construı́mos o seu dual pela relação:
∗ 1
Fµν ≡ ηµναβ F αβ (3.89)
2
Segue então que a operação repetida (dual do dual) tem o efeito de trocar o sinal do
tensor:
∗∗
Fµν = − Fµν .
satisfazendo as simetrias
∗
ηαβµν = − gαβµν (3.92)
e também:
167
ρσλ
ηαβµν η αρσλ = − δβµν (3.94)
ρσλ
na qual a quantidade δβµν é o determinante da matriz 3x3
Segue então
ηασµν η βσµν = −6 δαβ (3.95)
Eµ = Fµα v α
∗ α 1
Bµ = Fµα v = ηµαρσ Fρσ V α
2
Segue que estas quantidades estão definidas no tri-espaço do observador inercial de
velocidade v µ isto é,
Eµ v µ = 0
Bµ v µ = 0
1
Rαβµν = Wαβµν + Mαβµν − Rgαβµν (3.96)
6
onde
2Mαβµν = Rαµ gβν + Rβν gαµ − Rαν gβµ − Rβµ gαν . (3.97)
Desta definição segue que o tensor de Weyl tem somente 10 componentes indepen-
dentes. As outras 10 componentes que completam o tensor de Riemann estão contidas
no traço Rµν . As 10 componentes algebricamente independentes do tensor de Weyl po-
dem ser separadas em partes eletrica e magnética, para um observador de velocidade
v µ , como o fizemos para o campo de spin 1. Temos:
168
Das simetrias de Wαβµν segue que a operação dual é independente do par ao qual ela
é aplicada.
Destas expressões acima segue que os tensores elétrico e magnético são simétricos, sem
traço e pertencem ao 3-espaço ortogonal ao observador, isto é:
Eµν = Eνµ
Eµν v µ = 0 (3.100)
Eµν g µν = 0,
e
Hµν = Hνµ
Hµν v µ = 0 (3.101)
Hµν g µν = 0.
Invariantes de Debever
1
Cµν = Rµν − R gµν
4
Dµν ≡ Wµανβ C αβ
∗
D̃µν ≡ Wµανβ C αβ
Dimensionalidade Invariantes
L−2 I5
−4
L I1 , I3 , I6
−6
L I2 , I4 , I7 , I9 , I12
L−8 I8 , I10 , I13
−10
L I11 , I14
169
A expressão destes invariantes é dada por:
I1 = Wαβµν W αβµν
∗
I3 = W αβµν Wαβµν
I5 = R
I6 = Cµν C µν
I7 = Cαβ C βµ Cµ α
I8 = Cαβ C βµ Cµλ C αλ
I9 = Cµν Dµν
I12 = D̃µν C µν
∗
D̃µν ≡ Wµανβ C αβ .
Apêndice 3: Tetradas
Um sistema de quatro vetores - um do tipo tempo e tres do tipo espaco - pode ser um
sistema de referências com os quais um dado observador descreve suas medidas. Nós
chamaremos a este conjunto de vetores um sistema de tetradas e denotaremos como
eAµ
onde o ı́ndice latino (variando de 1 a 4) representa cada um dos vetores e o ı́ndice grego
representa sua componente vetorial. Escolheremos o vetor e0µ como o campo de veloci-
dades de um observador e os demais ei µ como vetores do tipo espaço ortonormalizados.
Isto é:
170
e0µ e0ν g µν = 1
e1µ e1ν g µν = −1
e2µ e2ν g µν = −1
e3µ e3ν g µν = −1 (3.103)
eAµ eB
νg
µν
= η AB (3.104)
ZA = Zα eAα (3.106)
F µν;ν = 0 (3.110)
∗
F µν;ν = 0 (3.111)
171
A equação (3.111) pode ser posta sob a forma
Daı́
1
Tµν = Fµα F αν + gµν Fαβ F αβ
4
Segue então que o traço T ≡ Tµν g µν se anula identicamente.
A equação para F µν é dada por
λ
F µν;ν = − RAµ + J µ
κ
onde J ν é uma corrente externa. A lei de conservação de carga assume a forma
λ
J µ;µ − (RA);µ = 0
κ
Usando a decomposição do tensor Fµν em suas partes elétricas (Eσ ) e magnéticas
(Bα ) (para um dado observador V µ ) podemos escrever o tensor Tµν em função de
Eα , Bα . Vamos assim identificar suas componentes ρ, πµν e qµ (conforme notação
anterior). Seja o observador caracterizado pelo vetor tangente à sua linha de Universo
v µ , normalizado, isto é v µ v ν gµν = 1., Temos
Eµ = Fµα V α
1
Bµ = Fµ∗ α V α = ηµαρσ Fρσ V α
2
Alguns cálculos preliminares são necessários. Temos para o invariante Fαβ F αβ em
termos dos vetores eletrico (Em ) e magnético (Hµ ).
172
com E 2 ≡ −Eα E α e B 2 ≡ −Bα B α (obs.: note que E α e B α são vetores do tipo espaço
e assim temos Eα E α < 0 e B α Bα < 0). Daı́
1
gµν (E 2 − B 2 ) .
2Tµν = Fµα F αν −
2
Usando estes resultados obtemos as expressões procuradas:
Densidade de energia:
1
ρ = Tµν v µ v ν = (E 2 + B 2 ) (3.115)
2
Pressão isotrópica:
1 1
p = −Tµν hµν = ρ
3 3
pois Tµν g µν = T = 0. Fluxo de calor (vetor de Poynting)
1 E2
qλ = Tαβ v β hαλ = Fλµ E µ − vλ (3.116)
2 2
Mas
Fλµ E µ = −vλ Eµ + vµ Eλ + ηλµρσ vρ Bσ E µ = E 2 vλ + ηλµρσ vρ Bσ Eµ
Daı́
1 µρσ
qλ = η Eµ vρ Bσ
2 λ
Finalmente, a pressão anisotrópica se escreverá:
πµν = Tαβ hαµ hβν + phµν =
1 1
= Fαε F β − gαβ (E − B ) hαµ hβν + phνν
ε 2 2
(3.117)
2 2
Calculando por partes:
Fµε E ε = −vµ Eε + vε Eµ + ηµερε vρ Bσ E ε =
= E 2 vµ + ηµερσ Eε vρ Bσ = E 2 vµ + 2qµ
Fµε F εµ = −vµ Eε + vε Eµ + ηµεαβ vα Hβ (−v ε Eν + vν E ε +
+ η ενρσ v ρ B σ =
= E 2 vµ vν − Eµ Eν + ηνερ E ε v ρ B σ vµ +
+ηµερσ E ε v ρ B σ vν + η αβ ε ρ σ
µ ηενρσ vα v Bβ B .
Mas
η αβµε η ενρσ = δνρσαβµ
= δνα δρβ δσµ − δνα δσβ σρµ
−δρε δνβ δσµ + δρα δσβ δµµ + δσα δρµ δνβ − δσα δρβ δνµ
Daı́
η αβµ ε ηενρσ Vα V ρ Hβ H σ = Vν Vµ H 2 − Hµ Hν − H 2 gµν
então
Fµε F εν = E 2 vµ vν − Eµ Eν + 2qν vν + 2qµ vν − B 2 gµν +
+ vµ vν B 2 − Bµ Bν
Colectando os termos, obtemos:
1 2 1
πµν = −Eµ Eν − E hµν − Bµ Bν − B 2 hµν .
3 3
173
3.11.6 Equações de Maxwell
Na presença de fontes, representada pela corrente vetorial J µ , as equações de Maxwell
se escrevem:
F µν ; ν = J µ (3.118)
F µν ; ν = 0 (3.119)
Vamos escrevê-las usando a decomposição acima.
Primeira Projeção
Multiplicando a expressão (3.118) por vµ temos
F µν ; ν vµ = −( v α E β ); β vα + ( v β E α );β vα + (η αβµν vµ Bν ); β vα .
isto é,
F µν ; ν vµ = −E;αα − E α v̇ α − 2ω µ Bµ (3.120)
Finalmente podemos escrever
onde pusemos
ρ ≡ J µ vµ
Para um observador geodésico e irrotacional, encontramos o resultado convencional
~ = −ρ
div E
Segunda Projeção
Multiplicando a expressão (3.118) por hµν temos
Fµ ν ; ν hµλ = Jµ hµλ
Desenvolvendo o lado esquerdo (LE) dessa expressão temos
µν
LE = −(vα E β );β hαλ + (v β E α );β hαλ + ηαβ vµ Bν ; β hαλ
1 λβ
− λβ
σ + θh +ω λβ
Eβ + θ E λ + Ėβ hλβ + η αβµν vµ Bν ; β hα λ
3
+ η αβµν
ωµβ Bν hα λ + η αβµν vβ v̇µ Bν hα λ .
174
Mas
η αβµν ωµβ Bν = − 2ω λ Bλ v α .
Segue então
λβ λβ 2 λβ λβ
Ėβ h − σ − θ h + ω Eβ + η λβµν vµ Bν ; β + η λβµν vβ v̇µ Bν = Jµ hµλ (3.122)
3
De um modo equivalente obtemos o outro par de equações:
Exercı́cios
1. Mostre que a o volume da seção espacial da métrica (3.6) no caso = 1 é
V (t) = 2π 2 a(t)3 .
2. Mostre que a métrica de RW é conformemente plana.
3. Mostre que equação da conservação da energia (3.46) é conseqüência da
aplicação da primeira lei da termodinâmica
T dS = dE + pdV,
ao caso do universo descrito pela métrica RW, para o qual o volume é proporcional
à a(t)3 , e a expansão é adiabática (S =constante).
4. Mostre que v µ = δ µ0 é uma geodésica para a métrica de Friedmann. Mostre
também que a congruência gerada por essa geodésica não possue rotação.
5. Calcule os vetores de Killing (10) da geometria de Sitter. Calcule em seguida
as álgebras associadas. Compare com a álgebra das isometrias do espaço de
Minkowski.
6. Nos modelos de Friedmann (com Λ = 0) vemos que aparece uma singularidade
para um dado valor de t (identificado com a origem t = 0). Este singularidade,
aparece tanto na geometria (o raio do Universo A(t) se anula para t = 0, os
invariantes geométricos divergem) quanto na matéria (a densidade ρ de energia
diverge para t = 0). Mostre que a presença da constante cosmológica, no modelo
de Lemaı́tre, evita o aparecimento da singularidade.
7. Mostre que o volume do universo de Einstein é dado por V = 2π 2 a3 .
8. Calcule a idade do universo num modelo com constante cosmológica positiva e
poeira (resultado dado pela eq.(3.82).
9. Mostre que a equação (19) é invariante por transformação conforme, no limite
µ = 0.
Sugestão: faça a transformação
ϕ → ϕ̃ = Ω−1 ϕ
gµν → g̃µν = Ω2 gµν
1
Γ̃αµν = Γαµν + Ω,µ δ αν + Ω,ν δ αµ − Ω,λ g αλ gµν
(3.125)
Ω
175
10. Mostre que as equações de Maxwell são invariantes por transformação conforme.
11. Considere um campo vetorial acoplado não-minimalmente com a gravitação e
cuja equação provém da Lagrangeana
1 √ 1 √
L= −g (1 + λWµ W µ ) R − −g Fµν F µν + Lm (3.126)
κ 2
onde Lm é a Lagrangeana que descreve os demais campos materiais.
Obtenha a equação de movimento a partir da variação dessa Lagrangeana.
Solução:
∗
Rαβµν = Rαβ ∗µν
Solução:
1
Rµν = Rgµν .
4
COMPLETAR REFERENCIAS!!
176
Capı́tulo 4
Termodinâmica em Relatividade
Geral.
J. M. Salim1
Introdução.
Iniciaremos o nosso estudo pelo sistema fı́sico denominado Fluido Perfeito. O leitor
interessado podera consultar as referê cias [1], [2], [3] Um fluido em geral é modelado
como um contimuun caracterizado primeiramente por um campo de velocidade media
v α normalizado v α vα = 1. No caso de um fluido perfeito a velocidade é univocamente
definida como a velocidade relativa a qual não há corrente de particulas nem fluxo
de calor. Claro está que esse modelo é uma aproximação e a validade da mesma
pressupõe que o livre caminho médio das particulas constituintes do fluido deve ser
muito menor que qualquer comprimento macroscópico caracteristico do sistema. O
campo vetorial que define localmente a velocidade do fluido, também chamado de
campo de observadores comoventes com o fluido, define uma separação covariante do
espaço-tempo em espaço e tempo. Essa separação é operada pelo tensor de projeção
definido como:
hαβ = gαβ − vα vβ (4.1)
Esse operador projeta os tensores definidos em cada ponto do espaço-tempo no espaço
de repouso instantaneo do observador comovente e a métrica desse tri-espaço é de-
terminada pelo tensor hαβ . As operações de derivação covariante no tri-espaço são
definidas como:
∇ˆ α φ = hβ φ|β (4.2)
α
177
v α = δ0α (4.4)
O ponto sobre o sinal de igual indica que a igualdade só vale nesse sistema de coorde-
nadas e o chapeu sobre o vetor Aα indica que se trata da projeção do vetor no espaço
de repouso instantâneo do observador comovente. Ainda nesse sistema de coordenadas
o tensor métrico do tri-espaço perpendicular a v α assume a seguinte forma simples:
h0α =0
˙ (4.6)
hij =g
˙ ij (4.7)
Todo tensor pode ser decomposto em suas partes perpendicular a v α (espaço de repouso
instantâneo do observador comovente) e paralela a v α , para nós será de particular
interesse a decomposição da derivada covariante do vetor velocidade:
1
vαβ = hαβ θ + σαβ + ωαβ . (4.9)
3
onde
θ = vαα , (4.10)
1 1
σαβ = (vαβ + vβα ) − hαβ θ, (4.11)
2 3
e
1
ωαβ = (vαβ − vβα ) (4.12)
2
são respectivamente, a expanção, o tensor de cisalhamento e o tensor de rotação.
Exercı́cio. Mostre que no espaço de repouso instantâneo do observador comovente esses
tensores se reduzem aos correspondentes objetos da hidrodinâmica Newtoniana. No
RCI, em coordenadas adaptadas, a lei de Pascal é valida e a pressão exercida por uma
dada porção do fluido é a mesma em todas as direções e perpendicular a área onde
ela atua, logo
hα µ Tµν dsν =
˙ δα i Tij dsj =
˙ δα i p dsi (4.13)
178
Tendo isso em conta, conteudo de energia e momento do fluido perfeito em um sistema
arbitrário de coordenadas é descrito pelo tensor
T αβ = ρ v α v β − p hαβ (4.15)
Esse tensor satisfaz a seguinte equação (consequência direta das equações de Einstein):
T αβ ||β = 0. (4.16)
Essa equação pode ser decomposta em suas partes paralela (vα T αβ ||β = 0) e perpen-
dicular (hα β T βλ = 0) a v α como segue:
ρ|α v α + θ (ρ + p) = 0 (4.17)
∂~v . ~
(ρ + p) = ∇p. (4.20)
∂t
Além dessas equações devemos acressentar a equação de conservação do número de
particulas
N α ||α = (n v α )||α = 0 (4.21)
Nessa expressão s é a entropia especı́fica. Vimos então que um fluido perfeito é car-
acterizado pelas variáveis (N α , S α , T αβ ), essas variáveis devem satisfazer as equações
de conservação que discutimos anteriormente. Nesse conjunto de variáveis temos sete
variáveis e seis equações de conservação. Ademais dessas equações a termodinâmica
nos fornesse a equação de Gibbs
ρ 1
T ds = d( ) + p d( ) (4.23)
n n
Essa equação nos mostra que são necessários dois escalares como variáveis indepen-
dentes e uma nova variável conhecida como temperatura (T ) é introduzida. Assim
supondo que o fluido perfeito já determinou a geometria temos um sistema de oito
variáveis e sete equações. Para podermos determinar o sistema é nessário ainda for-
nesser uma equação de estado, usulamente p = p(ρ, n). Dependendo do caso es-
pecı́fico a ser tratado é comum utilizar-se outras variáveis independentes, a saber
(s, ρ), (s, T ), (n, T ), etc. Tomando como variáveis independentes (ρ, p) na equação de
Gibbs no caso de um fluido perfeito temos:
ρ + p ∂n ∂n 1
T ds = − 2 dρ + dp + dρ (4.24)
n ∂ρ ∂p n
179
ou
n2 T
n ∂n ∂n
ds = − dρ − dp (4.25)
ρ+p ρ + p ∂ρ ∂p
Como n = n(ρ, p) segue que
∂n ∂n
ṅ = ρ̇ + ṗ. (4.26)
∂ρ ∂p
Logo
∂n ṅ ∂n ṗ
= − (4.27)
∂ρ ρ̇ ∂p ρ̇
Substituindo esse resultado na expressão anterior para a equação de Gibbs encon-
tramos:
n2 T
n ṅ ∂n ṗ ∂n
ds = − − dρ − dp (4.28)
ρ+p ρ + p ρ̇ ∂p ρ̇ ∂p
Finalmente usando a equação de conservação para o numero de particulas e densidade
de energia obtemos:
2 ∂n ṗ
n T ds = (ρ + p) dρ − dp (4.29)
∂p ρ̇
Dessa expressão segue que para um fluido barotrópico p = p(ρ), ds = 0. Os exemplos
mais comuns de fluidos desse tipo é a radiação p = 13 ρ. Em cosmologia costuma-se
usar equação de estado barotropica linear:
p = (γ − 1)ρ (4.30)
180
de uma componente fora do equilı́brio é determinado por uma variável cinética, a
velocidade do fluido v µ , e duas variáveis termodinâmicas, o número de partı́culas por
unidade de volume n e a energia interna especı́fica. A idéia básica que orienta essas
descrições é a hipótese do equilı́brio local[8] que impõe que a equação fundamental da
termodinâmica depende localmente das mesmas variáveis como no equilı́brio; não são
necessárias variáveis adicionais e a equação fundamental contem toda a informação
sobre o sistema. Nessas descrições o tensor momento energia, bem como a corrente de
partı́culas, são modificadas respectivamente como
Tµν = ρ vµ vν − p hµν + 4Tµν = T̄µν + 4Tµν , (4.34)
N µ = n v µ + 4N µ , (4.35)
onde ∆Tµν e ∆Nµ representam o efeito da dissipação presente na dinâmica do flu-
ido.Antes de seguirmos adiante devemos chamar a atenção para o fato de que a
quadrivelocidade do fluido V µ não tem sentido fı́sico preciso uma vez que podemos
tomá-la como a velocidade do fluxo de energia v µ = vEµ ou a velocidade do fluxo de
µ
particulas v µ = vN . No primeiro caso, no referencial definido por vEµ , o fluxo de energia
é nulo:
Tνµ vEν = ρvEµ (4.36)
ou ainda
A lei de balanço para a entropia (4.46) agora pode ser escrita como:
vα;µ T,µ
sµ ;µ = − ∆T αµ + 2 vα ∆T αµ (4.48)
T T
A segunda lei da termodinâmica requer que o lado direito de (4.48) seja positivo
definido , essa imposição nos permite determinar ∆T µν como uma combinação linear
dos gradientes da temperatura e velocidade. Note que a correção ∆T µν não pode
conter termos envolvendo gradientes das variáveis de equilibrio ρ, n e p pois, nesse
caso, não seria possı́vel obter para o lado direito de (4.48) termos positivos definidos
para configurações arbitrárias do fluido. A seguir vamos utilizar a bem conhecida
decomposição de vαµ em suas partes irredutiveis:
1
vαβ = σαµ + ωαµ + θ hαµ + aα vµ (4.49)
3
∆T αµ
θ T,µ aα v µ
sα;α = σαµ + hαµ − vα − ∆T αµ (4.50)
3 T T2 T
σαµ π αµ
α θπ T,µ aµ
s ;α = − − 2
− qµ (4.52)
T T T T
A imposição de que o lado direito dessa expressão seja positivo definido nos leva a:
π αµ = η θ (4.53)
π = −ζ θ (4.54)
q µ = χ hµα (T,α − T aα ) (4.55)
182
Nessas expressões η, ζ e χ são respectivamente os coeficientes de viscosidade de dis-
torção ou ligamento, de viscosidade volumar e de condução de calor. Esses coeficien-
tesdevem ser todos positivos definidos. Assim obtemos:
πµν π µν π2 q µ qµ
sµ ||µ = + − (4.56)
ηT ζT χT 2
183
muito pequenos comparados com o inverso da constante de Hubble. O resultado obtido
foi muito inferior ao valor observado. Seguiram-se vários trabalhos p.ex. [8], [9], [10],
onde os autores dedicaram-se à procura de uma solução para esse problema. Iremos
dedicar especial atenção ao modelo de Murphy. Nesse a fonte das equações de Einstein
é um fluido viscoso homogêneo e isotrópico, sendo a viscosidade volumar descrita pela
equação fenomenológica
π = −ζ θ (4.57)
Em modelos desse tipo a viscosidade decorre da interação da matéria com a radiação.
No trabalho de Murphy a expressão para o coeficiente de viscosidade volumar adotada
foi a seguinte ([10]):
ζ = αρ (4.58)
Nesse caso, a expressão para o fluido se reduz a:
Por simplicidade, vamos considerar apenas modelos com seção plana k = 0. Nesse caso
as equações de Einstein se escrevem como:
1 2 ȧ
8πGρ = θ = 3 H 2 := 3 (4.61)
3 a
8πG (γ − 1 − 3α H) ρ = − 2 Ḣ + 3 H 2 , (4.62)
onde utilizamos a equação de estado p = (γ − 1) ρ.
Eliminando ρ nas equações (4.61) e (4.62) obtemos:
3(γ − 3αH) 2
Ḣ + H =0 (4.63)
2
Primeiramente notemos a solução simples Ḣ = 0, nesse caso:
γ
H = H0 = , (4.64)
3α
e a pressão total do fluido se reduz a
p = pe + π = (γ − 1)ρ − 3 α ρ H0 = − ρ. (4.65)
184
O outro limite é
C a3γ/2 >> | ln a3γ/2 |. (4.68)
Então
a = (3 γ H0 t /2C)2/3γ , (4.69)
que é uma solução do tipo Friedmann, sendo os efeitos da viscosidade desprezı́veis.
Devemos ressaltar que as soluções obtidas NÃO TÊM SINGULARIDADE. Esse re-
sultado, que inicialmente despertou grande interesse para o modelo, não resistiu a
uma análise mais geral da dinâmica do modelo. Em 1975 e posteriormente em 1977,
Belinski e Khalatnikov [11], [12] utilizaram a técnica de análise qualitativa para estu-
dar o sistema de equações que acabamos de obter. Nesse trabalhos ficou demonstrado
que mesmo em situações mais gerais do que a estudada por Murphy, a singularidade
não pode ser evitada dado que a solução de Murphy não é estável frente a peque-
nas perturbações. Essas dificuldades podem ser ultrapassadas utilizando a teoria da
termodinâmica causal [13], [14], [15].
4.3 Exercı́cio
Mostre que as descrições de Landau e Eckart são equivalentes quando levamos em
conta apenas termos em primeira ordem nas correções ∆N α e ∆T µν .
185
Capı́tulo 5
5.1 Introdução
O estudo da origem, ou formação , e evolução das estrelas nos mostra que estas
evoluem de tal maneira que ao final de suas vidas dramáticos eventos acontecem, e
como consequência destes uma classe de objetos estelares muito peculiares podem
vir a ser produzidos. Esta classe de objetos é referida em astrofı́sica como Objetos
Compactos, em clara referência a sua comparação , em termos de escalas de massas
1
Afiliação : ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ –
Brazil.
186
e tamanhos, com as estrelas normais conhecidas como estrelas da sequência principal
(ver Figura 5.1, o diagrama de Hertzsprung-Russell, ou diagrama HR). Esta classe de
objetos compactos é constituı́da por estrelas anãs brancas (ABs), estrelas de nêutrons
(ENs) (incluem-se aqui as estrelas de quarks), e buracos negros (BNs). A ordem de
apresentação usada neste capı́tulo segue a hierarquia de intensidades do campo grav-
itacional em cada um destes objetos, supondo que eles possuam uma mesma massa
(ver Tabela 1).
Tabela 1??
Desta forma, estes corpos celestes representam o ponto final da evolução de estrelas
normais, e passam a ser, portanto, um ingrediente fundamental do conteudo fı́sico do
Universo.
Nesta primeira aproximação á fı́sica de tais objetos, estaremos procurando entender
tanto a origem de suas principais propriedades fı́sicas, bem como caracterizando-os
em relação ao resto dos corpos celestes que podem de alguma maneira ser observados
com os modernos instrumentos astronômicos como os telescópios de raios-X e raios-γ,
os radiotelescópios, e o telescópio espacial Hubble, dentre muitos outros.
Para começarmos esta fundamentação da fı́sica dos objetos compactos é bom lembrar
as propriedades fı́sicas que os tornam definitivamente diferentes das estrelas normais.
Em primeiro lugar, eles são remanescentes da evolução estelar normal, isto é; eles con-
stituem o estágio final da vida das estrelas ordinárias. Ao alcançar este estágio, uma
estrela normal teria esgotado todo seu combustı́vel nuclear. Isto a deixaria pronta para
sofrer o colapso gravitacional no seu interior, processo através do qual estes objetos
compactos poderão vir a se formar. De fato, é a queima deste combustı́vel durante a
fase de estrela da sequência principal(SP) o que sustenta estas estrelas normais em
contra da atração gravitacional produzida pela própria matéria que as constitue, evi-
tando assim seu colapso. Visto desta maneira, uma estrela normal, ou da SP, é uma
esfera de gás em equilı́brio hidrostático. Este equilı́brio acontece entre a força gravita-
cional, que tenta compactar esta matéria, e a pressão térmica gerada pela queima do
combustı́vel nuclear que tenta espargı́-la, ou desagregá-la, para o infinito onde não há
força atrativa qualquer capaz de re-agregá-la. Só para exemplificar, uma anã branca
(AB) é suportada pela força de repulsão (pressão) quântica, ou de degenerescência,
dos seus elétrons. Entretanto, uma estrela de nêutrons (ENs) é sustentada pela pressão
quântica de seus nêutrons, também degenerados 2 .
O outro elemento diferenciador entre objetos compactos e estrelas ordinárias é o seu
tamanho, excessivamente pequeno quando comparado com estrelas normais de massa
comparável. Tem de se notar aqui que objetos de massa similar mas de raio compar-
ativamente menor possuem campos gravitacionais em suas superfı́cies que são pro-
porcionalmente mais intensos. Uma estimativa da intensidade destes campos grav-
itacionais pode ser obtida calculando (a lá Newton) a aceleração gravitacional na
superfı́cie de uma estrela AB, de nêutrons, ou ainda de um buraco negro, e compará-
la com aquela na superfı́cie de nosso planeta, por exemplo. É bom frisar aqui que este
conceito aplica-se a estrelas totalmente colapsadas, isto é, estrelas que não encontram
meios de se suportar em contra do puxão produzido pela sua própria gravidade e co-
2
Diz-se que uma distribuição de matéria é degenerada quando sua pressão não se reduz a zero apesar
de sua temperatura, ou energia térmica, pode ser quase nula, i.e., ∆T ∼ 0. Posto de outra maneira, a
pressão quântica não responde a mudanças de temperatura, mas sim ao Principio de Exclusão de Pauli.
187
188
189
lapsam a uma singularidade. A descrição da fı́sica de buracos negros é o assunto do
Capı́tulo 6 deste curso.
Esclarecemos ainda que nosso objetivo aqui é fornecer uma introdução ao estudo desta
classe de corpos astrofı́sicos, focalizando nossa atenção nos elementos “essenciais” de
sua fı́sica e evolução . Assim sendo, apresentar-se-ão neste capı́tulo os fundamentos
desta fı́sica, ficando para os interessados revisarem algumas das referências forneciadas
ao final para obterem uma descrição mais detalhada destes objetos. Em particular,
nossa fonte mais imediata é o livro de S. L. Shapiro & S. A. Teukolsky: Black holes,
white dwarfs and neutron stars: The physics of compact objects (Wiley & Sons, New
York, 1983). Entretanto, cabe alertar que estudos mais aprofundados irão requerer de
um entendimento fı́sico refinado da estrutura da matéria a altas densidades e pressões e
da natureza das interações entre partı́culas, incluindo as forças forte e fraca, o eletro-
magnetismo, e a gravitação , as quais desempenham um papel crı́tico na dinâmica
destes sistemas. Um tal estudo está fora do escopo deste livro.
190
estabelece se
dP m(r)
− = G 2 dm, (5.2)
dr r
ou equivalentemente,
dP m(r)ρ
= −G 2 . (5.3)
dr r
~ = −ρ∇Φ,
De modo geral, equilı́brio hidrostático implica que ∇P ~ onde Φ é o potencial
gravitacional produzido pela distribuição de massa m(r), o qual pode ser obtido a
aprtir da equção de Poisson.
Uma consequência imediata da lei de equilı́brio hidrostático é o chamado Teorema
do Virial, o qual determina que a energia potencial gravitacional W de uma dis-
tribuição de matéria (a estrela) é dada por
Z R
m(r)ρ
W =− G 2
4πr2 dr. (5.4)
0 r
Usando a Eq.(5.3) acima, pode-se escrever
Z R
dP (r)
= 4πr3 dr (5.5)
0 dr
Z R
= −3 4πr2 P (r)dr, (5.6)
0
P (r)
E0 = . (5.9)
Γ−1
A equação (5.8) pode ser integrada usando a eq.(5.7) para obter
P (r)
E = ρc2 + , (5.10)
Γ−1
que conduz ao resultado:
E 0 ≡ E − ρ0 c2 . (5.11)
A equação (5.6) pode ser rescrita como
191
onde Z R
U= 4πr2 E 0 dr (5.13)
0
é definida como a energia interna total da estrela. Assim, a energia total da estrela se
escreve então como E = W + U . Para um gás de Maxwell-Boltzmann com expoente
adiabático Γ, a energia de movimento translacional ET é dada por ET = 23 (Γ − 1)U ,
de tal forma que o teorema do virial para esse gás se reduz a
1
ET = − W. (5.14)
2
Portanto, a energia total dessa estrela é
3Γ − 4
ET + W + U = − |W |, (5.15)
3(Γ − 1)
2
onde W ∼ −G MR . Além disto, pode-se mostrar que se a equação de estado do gás
da estrela segue a lei politrópica descrita pela eq.(5.7), então a energia potencial dela
resulta ser dada (após uma dupla integração por partes) pela expressão
3(Γ − 1) GM 2
W =− . (5.16)
5Γ − 6 R
Quando uma estrela normal esgota seu combustı́vel nuclear sua energia total E diminui
por causa da radiação que ela emite. Assim, segundo as eqs.(5.15,5.16), se ∆E ≤ 0
então ∆R ≤ 0 sempre que Γ 34 , isto é, a estrela se contrai. Dai surge a pergunta,
até que ponto pode a estrela se contrair? Ou em outras palavras, pode a estrela se
contrair indefinidamente até alcançar um raio R ∼ 0 ? A resposta a esta questão é não!
sempre e quando a massa da estrela M for da ordem de 1M , conforme demonstramos
a seguir.
Suponha que a pressão durante um colapso em quase-equilı́brio seja dada pela lei de
Maxwell-Boltzmann
ρ0
P = κT, (5.17)
µmu
onde µ define o peso molecular médio do gás, mu a unidade atómica de massa, T a
temperatura do gás, e κ uma constante. Note que para Carbono (12 C) puro e ionizado
µ = 12/7. Assim, pelo teorema do virial
Z R
−W = 3 4πr2 P (r)dr, (5.18)
0
3κT̄ R
Z
= 4πr2 ρ0 dr, (5.19)
µmu 0
3M
= κT̄ , (5.20)
µmu
onde T̄ representa a temperatura média na estrela. Desta maneira T̄ ∝ M/R, isto é,
T̄ aumenta quando R diminui. No entanto, note ρ̄ ∝ M/R3 , de modo que a densidade
aumenta muito mais rapidamente ainda. Este resultado sugere a não validade da lei
de Maxwell-Boltzmann nestas condições de colapso, pois o gás de elétrons se torna
degenerado!, e portanto provê uma fonte de suporte de pressão inclusive a temperatura
192
zero! Vejamos o por quê. A diferença de momento linear tı́pico entre elétrons num gás
de Maxwell-Boltzmann é
1/2
1/2 12me GM mu µ
∆Pe ∼ 6me κT̄ ∼ , (5.21)
7R
onde usamos Γ = 5/3 e as eqs.(5.16, 5.20). Observe que para dois elétrons
1/2
∆prms = (p~1 − p~2 )2 . (5.22)
r2 dP
1 d
= −4πGρ. (5.27)
r2 dr ρ dr
193
Substituindo a equação de estado (5.7), e definindo Γ ≡ 1 + n1 , onde n é o chamado
ı́ndice politrópico, podemos escrever esta equação em forma adimensional usando as
definições seguintes
ρ
= θn , (5.28)
ρc
r
= ξ (5.29)
a
!1/2
(1/n−1)
[n + 1]Kρc
a = , (5.30)
4πG
1 d 2 dθ
ξ = −θn . (5.31)
ξ 2 dξ dξ
Esta é a conhecida equação de Lane-Emden para a estrutura de um politropo de
ı́ndice n. As condições de fronteira no centro de uma estrela politrópica são (o simbolo
0
indica derivada com respeito a ξ)
194
As soluções nas que estamos mais interessados correspondem a valores dos parâmetros
[tomados da lista de parâmetros calculados por S. Chandrasekhar no livro: An intro-
duction to the stellar structure, Dover (1939)]
5 3 2 0
Γ = −→ n= , ξ1 = 3.65375, ξ1 |θ (ξ1 )| = 2.71406 (5.40)
3 2
4
ξ12 |θ0 (ξ1 )| = 2.01824 .(5.41)
Γ = , −→ n = 3, ξ1 = 6.89685,
3
Desta maneira, podemos ver que para anãs brancas de baixa densidade (Γ = 35 ) as
propriedades fı́sicas fundamentais da estrela resultam ser:
−1/6
4 ρc µe −5/6
R = 1.122 × 10 km, (5.42)
106 g cm3 2
1/2
ρc µe −5/2
M = 0.4964 M (5.43)
106 g cm3 2
−3
R µe −5
= 0.7011 4
M . (5.44)
10 km 2
195
(por causa do Principio de Exclusão de Pauli), de forma que a relação de incerteza de
Heisenberg indica que o momento linear do férmion é pF ∼ ~n1/3 . Assim, a energia de
Fermi de uma partı́cula do gás no regime relativı́stico é
196
Figura 5.3: Localização de algumas anãs brancas famosas (Syrio B e Procyon B) no
diagrama HR, quando comparadas com a posição da sequência principal (curva central na
figura). (Tomada do site de Davison E. Soper, Institute of Theoretical Science, University
of Oregon).
197
atmosferas estelares à radiação residual observada. O fluxo Fν , em unidades erg s−1
cm−2 Hz−1 , medido na terra, é definido em função do fluxo na superfı́cie da AB como
R2 Fν (?)
Fν (⊕) = , (5.58)
D2
onde R é a raio da estrela e D é sua distância. Para anãs brancas ‘vizinhas’ a grandeza
D é determinada medindo o paralaxe da estrela. Seguidamente, constrói-se um modelo
de atmosfera, que depende da temperatura efetiva e da gravidade superficial da estrela,
de forma a reproduzir o fluxo Fν (?) observado em diferentes comprimentos de onda, e
a partir deste encontra-se o raio R. A determinação desta grandeza para inúmeras (&
4000) anãs brancas mostra que a discordância entre teoria e observação é menor de
10%. A Figura 5.3, também ilustra esta propriedade. A Figura 5.3 indica que o raio
de Syrio B e Procyon B é aproximadamente de uns 7300 km para cada uma delas. As
observações mais recentes indicam que uma grande parcela destas anãs brancas possui
uma composição quı́mica que se estende até elementos como 12 C e 16 O (é claro sem
excluir a possibilidade de se encontrarem estrelas com composição inclusive de 56 Fe
puro !).
Em geral, é difı́cil estimar dinamicamente e diretamente as massas de anãs bran-
cas (algo semelhante acontece com outras estrelas compactas). O melhor dos casos
é quando a estrela forma parte de um sistema binário, ou triplo, cujos parâmetros
orbitais podem ser medidos astrometricamente. No caso de ABs em binárias suas mas-
sas foram estimadas analisando a dinâmica de variáveis cataclı́smicas, ou em sistemas
binários que contém como companheira uma ENs. Estas estimativas indicam que efe-
tivamente todas as ABs observadas possuem massas menores do que M ∼ 1.445 M .
198
Figura 5.4: Relação massa-raio para anãs brancas de 12 C, 24 M g, e 56 F e previstas por
modelos teóricos. As linhas tracejada-pontilhada, pontilhada e duplamente pontilhada,
respectivamente, são comparada com determinações desta propriedade através de ob-
servações de 40 Eri B, Sirius B, Procyon B. (Tomada de F. Weber, [astro-ph/0112058
(2001)]).
199
do modo fundamental de oscilação de um fluido). Para analisarmos a estabilidade de
uma AB levando em consideração os efeitos da relatividade geral (GR), conforme
expresso pelo termo ∆EGR , pode-se escrever a energia total da estrela na forma
Z
m
Egrav = −G dm, (5.63)
r
ξ1
GM 5/3
Z
1/3
= (4πρc ) M 2 0 ξ 3 θn+1 dξ. (5.64)
|ξ1 θ (ξ1 )|5/3 0
200
onde as constantes κ1 e κ2 são definidas (para n = 3, Chandrasekhar 1939) como
n(n + 1) |ξ12 θ0 |
κ1 = = 1.75579, (5.73)
5−n ξ1
e
3 |4πξ12 θ0 |1/3
κ2 = = 0.639001. (5.74)
5−n ξ1
Entretanto, o termo ∆Eint representa o desvio da equação de estado com respeito
àquela de um politropo com n = 3, em razão de que os elétrons não são completamente
relativı́sticos. Assim, a energia interna por unidade de massa (u ≡ U/M ) é
Ee − me c2 ne
u= , (5.75)
ρ
onde ρ = µe mu ne ≡ ρ0 . Assim, usando o limite para elétrons relativı́sticos dado no já
citado livro de Chandrasekhar (1939), escrevemos
1 4 2 1
Ξ(x) −→ 2 x + x − ln 2x... , (5.76)
4π 2
no qual o momento linear de Fermi adimensional, ou parâmetro relativı́stico da
equação de estado, é definido como: x ≡ pF /me c >> 1. A partir disto, encontra-
se que
3 me c2
4 2 1
u= x + x − ln 2x... . (5.77)
4 µe mu 2
Na eq.(5.77), o termo proporcional a x, isto é, 12 ln 2x, é simplesmente 3P/ρ, que é o
mesmo que foi usado para calcular Eint . O termo seguinte é uma constante e pode ser
desprezada usando o principio variacional, de tal modo que
3 me c2
Z
1
∆Eint = dm. (5.78)
4 µe mu x
201
Por outro lado, a correção relativı́stica pode ser obtida integrando a equação de Lane-
Emden para um politropo com n = 3, e resulta ser dada por (κ4 = 0.918294)
G2 7/3 2/3
∆EGR = −κ4 2 M ρc . (5.83)
c
Assim, a energia total pode escrever-se como
E = (AM − BM 5/3 )ρc1/3 + CM ρc−1/3 − DM 7/3 ρc2/3 , (5.84)
onde as seguintes constantes são definidas:
m2e c3 G2
A = κ1 K, B = κ2 G, C = κ3 , D = κ4 . (5.85)
~(µe mu )2/3 c2
Desta forma, o equilı́brio se estabelece se a condição ∂E/∂ρc = 0 é satisfeita. Obtemos
então
1 1 2
(AM − BM 5/3 )ρc−2/3 − CM ρc−4/3 − DM 7/3 ρ−1/3 c = 0. (5.86)
3 3 3
Considerando soluções até primeira ordem na densidade central ρc , podemos igno-
rar os termos proporcionais a C e D. A partir do que recuperamos a expressão de
Chandrasekhar para a massa máxima
3/2 µ −2
A e
M= = 1.457 M , (5.87)
B 2
onde fizemos uso da definição da constante politrópica K dada por
( )
31/3 π 2/3 ~c 1.2435 × 1015
K= 4/3 4/3
= 4/3
em unidades c.g.s. (5.88)
4 mu µe µe
Por outro lado, se mantivermos os termos C e D obtemos pequenas correções ao valor
de M , que dependem de potências de ρc .
Assim sendo, a instabilidade se desencadeia quando a condição ∂ 2 E/∂ρ2c = 0 é satis-
feita. Nesta ocasião obtemos
12 14 21
− (AM − BM 5/3 )ρ−5/3 c + CM ρ−7/3
c + DM 7/3 ρ−4/3
c = 0. (5.89)
33 33 33
Resolvendo a eq.(5.86), e subtituindo na eq.(5.89), observando que todas as grandezas
são da mesma ordem de magnitude, podemos substituir M por (A/B)3/2 , para achar-
mos finalmente que
CB 2 16κ3 κ22
2 2
mu µe
ρc = 2
= 2 2/3 2
, (5.90)
DA (3π ) κ4 κ1 λ3e me
µ 2
e
= 2.646 × 1010 g cm−3 , (5.91)
2
que define a densidade crı́tica para o surgimento da instabilidade numa AB dev-
ido a relatividade geral. Lembre-se que para 56 Fe µe = 2, 154, e portanto ρc =
3.07 × 1010 g cm−3 . Note que este limite é maior do que o valor crı́tico para o de-
caimento β-inverso: ρc = 1.14 × 109 g cm−3 , e por consequência a relatividade geral
é irrelevante para anãs brancas compostas puramente de ferro. No entanto, para 4 He
ou 12 C a densidade crı́tica obtida considerando os efeitos devidos à relatividade geral
é ρc = 2.65 × 1010 g cm−3 . Esta densidade é menor do que o limite para neutron-
(4 He) (12 C)
ização ,(neutron drip) ρc = 1.37 × 1011 g cm−3 e ρc = 3.90 × 1010 g cm−3 .
Nestes casos, certamente é a relatividade geral a que limita a densidade central da
estrela.
202
Figura 5.5: A foto mostra a região central da Nebulosa do Caranguejo, o remanescente da
explosão supernova do ano 1054. A estrela brilhante no centro da imagem, da qual parecem
emanar jatos de radiação , é o pulsar do Caranguejo. (Foto cortesia do CHANDRA X-ray
Observatory).
Por volta de 1932, Landau ofereceu uma explicação elementar da natureza do limite
de Chandrasekhar, conforme foi discutido na seção anterior. Inspirado nestas idéias
ele aplicou esses mesmos argumentos ao conceito de estrelas de nêutrons, após tomar
conhecimento da descoberta do nêutron. Em 1934 W. Baade e F. Zwicky propuseram
a idéia das estrelas de nêutrons (ENs), salientando que estas deveriam ser objetos
de alta densidade que possuiriam raios muito pequenos. Com uma sugestão defini-
tivamente visionária estes pesquisadores ainda conjecturaram que estas estrelas de
nêutrons seriam formadas em explosões de supernova! De fato, hoje em dia conhece-
mos dois caminhos bem estabelecidos para a formação de uma ENs: a) a ENs pode-se
formar durante a explosão de supernova de uma estrela com massa entre 5 e 30 massas
solares (massas maiores do que 30 M supõe-se produziriam buracos negros como re-
manescentes), ou b) a ENs pode ser o resultado do colapso gravitacional induzido por
acrescência de matéria sobre uma AB numa variável cataclı́smica. Um das supernovas
mais conhecidas é a que foi observada por astrônomos chineses no ano 1054, à qual,
sabemos hoje, esteve associada a formação do pulsar do Caranguejo (The Crab pulsar,
ver Figura 5.5).
Tempo depois, em 1939, o primeiro cálculo teórico de um modelo de ENs foi realizado
por Oppenheimer & Volkoff (OV) usando relatividade geral. Apesar dessa evidência
teórica da existência desta classe de objetos estelares, a idéia foi praticamente aban-
203
donada durante de mais de 30 anos. Foi só quando os pulsares3 foram descobertos por
Jocelyn Bell, e explicados por Anthony Hewish em 1968, que tais estrelas tornaram-
se uma realidade astrofı́sica. Hoje sabemos da existência, conforme registrada em
catálogos, de mais de 2000 pulsares, embora o número provável de estrelas de nêutrons
na nossa galáxia estime-se ser de centenas de milhões. Com a descoberta das fontes
cósmicas de raios-X não-locais (i. e., não solares), por Giaconni et al. em 1962, muitos
teóricos especularam que o telescópio de raios-X estaria vendo estrelas de nêutrons,
jóvens e quentes! A onda se propagou, e uma corrida pela modelagem do esfriamento,
entre muitas outras propriedades, das estrelas de nêutrons começou. O resultado final,
conforme o entendemos hoje, é que as estrelas de nêutrons são laboratórios de fı́sica
extrema, como diria Jocelyn Bell [Astron. & Geophys., Vol 45, 1.7 (2004)].
204
de repouso dos nêutrons, mas a massa total é menor do que esta por causa da energia
de ligação gravitacional da estrela.
Entretanto, ENs de baixa densidade com equação de estado de gás perfeito de nêutrons
podem ser aproximadas por politropos newtonianos com n = 3/2. Usando as fórmulas
da seção precedente encontramos
−1/6
ρc
R = 14.64 , (5.96)
1015 g cm−3
1/2
ρc
M = 1.102 M , (5.97)
1015 g cm−3
3
15.12 km
= M . (5.98)
R
Assim, na equação TOV no existe uma massa mı́nima para a ENs pois quando M −→
0, R −→ ∞ quando ρc −→ 0. De fato, os nêutrons se tornam instáveis ao decaimento
β a densidades muito mais baixas.
Os resultados de TOV podem ser obtidos de forma aproximada usando o principio
variacional da energia. Uma vez que ρc é definida, a Mmax fica restrita à região de
transição do regime não-relativı́stico para o relativı́stico. Porém, não é enteiramente
claro que classe de politropo se aproxima melhor da configuração de estrela constituı́da
por puros nêutrons quando a massa da estrela se aproxima a Mmax .
Usando as definições dadas acima para Eint , e Egrav temos
e
Egrav = −κ2 Gρc1/3 M 5/3 , κ2 = 0.760777. (5.100)
Assim, para calcular ∆Eint , primeiramente temos de calcular
En − mn c2 nn
u= , (5.101)
ρ0
para a qual ρ0 = mn nn = mn x3 /(3π 2 λ3n ), onde o parâmetro relativı́stico x 1.
Usando, mais uma vez, o resultado para elétrons não relativı́sticos (ver livro de Chan-
drasekhar 1939)
1 3 3 5 3 7
Ξ(x) → 2 x + x − x .... , (5.102)
3π 10 56
encontramos que
2 3 2 3 4
u=c x − x . (5.103)
10 56
O primeiro termo na eq.(5.103) dá Eint , enquanto o segundo conduz a
Z
3 2
∆Eint = − c x4 dm. (5.104)
56
Substituindo para x em termos de ρ0 de sua definição dada acima, e fazendo a usual
substituição para um politropo na integral anterior, obtemos
~4
∆Eint = −κ3 16/3
M ρc4/3 , (5.105)
mn c2
205
onde agora para ENs
Z ξ1
3 2 4/3 1
κ3 = (3π ) θ3.5 ξ 2 dξ = 1.1651. (5.106)
56 |ξ12 θ0 (ξ1 )| 0
Finalmente, a correção devida à relatividade geral, ∆EGR , pode ser obtida usando as
definições dadas acima
G
∆EGR = −κ4 2 M 7/3 ρc2/3 , (5.107)
c
onde
Z ξ1 Z ξ1
(4π)2/3 5 + 2n − n2
3 0 n+1 3 4 0 2 n
κ4 = − 2 ξ θ θ dξ + (n − 1) ξ (θ ) θ dξ .
(5 − n)[ξ12 |θ0 (ξ1 )|]7/3(n + 1) 0 2 0
(5.108)
Caso a estrela for constituı́da só de nêutrons, a avaliação numérica destas integrais
produz κ4 = 0.6807. Desta forma, a energia total da ENs é dada por
~4 G2
A = κ1 K, B = κ2 G, C = κ3 , D = κ4 . (5.110)
(mn )16/3 c2 c2
2Aρ−1/3
c − BM 2/3 ρc−2/3 − 4Cρc1/3 − 2DM 4/3 ρ−1/3
c = 0. (5.111)
−2Aρ−1/3
c + BM 2/3 ρc−2/3 − 4Cρc1/3 + 2DM 4/3 ρ−1/3
c = 0. (5.112)
BM 2/3
ρc = . (5.113)
8C
Substituı́ndo isto na Eq.(5.112), e introduzindo o parâmetro y = M 4/9 , chegamos a
uma equação cúbica em y que tem a forma
A raı́z positiva desta acontece para o valor de y = 6.605 × 1014 em unidades c.g.s., de
modo que
M = 1.11 M , ρc = 7.43 × 1015 g cm−3 . (5.115)
206
Figura 5.6: Relação massa-raio de modelos teóricos de estrelas de nêutrons comparada
com determinações desta propriedade através de observações das fontes de raios-X Vela
X-1, Cyg X-2, e o pulsar binário PSR 1913+16. (Tomada de F. Weber [Prog. Part. Nucl.
Phys. 54, 193 (2005)]. Copyright Elsevier 2005).
E
= −0.08 M . (5.116)
c2
Desta maneira, se tirarmos esta fração da massa obtida na Eq.(5.115), resulta que a
EN s
massa total máxima prevista para uma ENs é Mmax = 1.03 M ! Esta é quase 40%
maior do que a obtida com a equação de TOV no modelo de um gás puro de nêutrons,
conforme referido na Eq.(5.95).
207
5.9 Modelos realı́sticos de estrelas de nêutrons
Uma equação de estado5 mais realı́stica considera uma mistura (ideal) de nêutrons,
prótons e elétrons que não interagem entre si. As caracterı́sticas principais desta
equação de estado são: 1) os nêutrons só estão presentes a densidades que excedem
ρn = 1.2 × 107 g cm−3 , 2) a razão nêutron/próton alcança um máximo ao redor de
ρn/p = 7.8 × 1011 g cm−3 , e 3) ultrapassado este máximo esta razão diminui até o valor
8 quando a densidade ρ → ∞. (Lembre-se sempre: para um gás perfeito P → ρ3 c2
quando ρ → ∞). Assim, os modelos estelares construı́dos com esta equação de estado
diferem muito dos resultados obtidos por TOV, visto que P (ρ) é muito semelhante ao
caso de nêutrons puros. Como exemplo, os parâmetros das estrelas nesta caso resultam
ser:
a) Modelos estelares calculados com a equação de estado, por exemplo do tipo Bethe-
Johnson, têm massas máximas muitos maiores do que estrelas obtidas a partir de
equações de estado ‘moles’, como, por exemplo, a equação do tipo Reid.
b) Estrelas calculadas com uma EOS ‘dura’ têm uma densidade central baixa, um raio
maior, e uma crosta mais grossa do que estrelas da mesma massa modeladas com uma
EOS mole (ver Figura 5.7).
5
Uma equação de estado é uma relação entre a densidade de matéria e sua pressão. Note, de passagem,
que as equações de estado (EOS) classificam-se em: 1) duras (‘stiff’) se seu volume ou densidade é difı́cil
de alterar, por exemplo a água, 2) moles (‘soft’) se estas propriedades podem ser modificadas facilmente,
por exemplo o ar, e moderadamente duras (‘semi-stiff) se admitem alguma mudança importante. Assim
sendo, o conhecimento da EOS nos diz quão flexı́vel é a matéria sob consideração .
208
Figura 5.7: Visão moderna da estrutura interna de uma ENs. Pode-se ver a diversidade de
partı́culas elementares que acredita-se possam existir no interior destes objetos. (Versão
original de F. Weber, nos Proceedings of the VIII International Workshop on Hadron
Physics, April 14-19, 2002, Rio Grande do Sul, Brazil).
209
Figura 5.8: Relação massa-raio do objeto candidato a ser uma strange star: SAX J1808.4-,
conforme determinada a partir de observações com o Rossi XTE, comparada com modelos
teóricos de estrelas de nêutrons e estrelas estranhas. (Versão original de X. D. Li, et al.
[Phys. Rev. Lett. 83, 3776 (1999)]. Copyright 1999, by the Americam Physical Society).
c) A condensação de pı́ons (ver Figura 5.7), se esta acontece, tende a contrair, i.e.,
tornar de raio menor, a ENs de uma massa dada ao mesmo tempo que dimui sua
massa máxima Mmax .
Conforme pode-se verificar na Figura 5.7, a estratificação das configurações é simples-
mente uma consequência do advento de regimes diferentes na EOS enquanto se avança
em direção a densidades mais altas. As camadas podem ser identificadas como segue:
a) A superfı́cie (ρ ≤ 106 g cm−3 ), uma região na qual as temperaturas e campos
magnéticos, que se supõe que existem nessas estrelas, podem afetar a EOS.
b) A crosta exterior (106 ≤ ρ ≤ 1011 g cm−3 ), uma região sólida em que a rede
cristalina (‘lattice’) de Coulomb de núcleos pesados coexiste em equilı́brio β com o
gás degenerado de elétrons (ver EOS de ABs).
c) A crosta interior (4.3 × 1011 ≤ ρ ≤ 2.14 × 1014 g cm−3 ), que coexiste com a rede
cristalina de núcleos ricos em nêutrons, com um gás de nêutrons superfluido e um gás
de elétrons.
d) O lı́quido de nêutrons (2.14×1014 ≤ ρ ≤ ρcore ), que contém principalmente nêutrons
superfluidos com uma pequena concentração de prótons superfluidos e elétrons nor-
mais.
e) A região do core (ρ > ρcore ), que pode or não existir em algumas estrelas. Isto
depende de se ocorre ou não condensação de pı́ons, ou se ocorre uma transição de fase
210
a um sólido de nêutrons ou a matéria de quarks, ou alguma outra fase fisicamente
distinta de um lı́quido de nêutrons a densidades acima de algum valor crı́tico ρcore ).
Se a EOS é dura, a densidade central de uma ENs relativamente maciça (1.4 M ) é ρ ≤
1015 g cm−3 , e de fato, ainda as ENs estáveis mais maciças, têm ρ . few ×1015 g cm−3 .
Desta forma, uma transição a matéria de quark ou alguma outra forma exótica de
matéria parece improvável nestas condições . No entanto, existe a possibilidade de um
terceiro ramo estável de ‘estrelas estranhas’ no diagrama M vs. ρc (ver Figura 5.6),
além das ABs e ENs.
Entretanto, na natureza, estrelas de nêutrons com massas perto do limite de Chan-
drasekhar de 1.4 M parecem ser favorecidas. Tais estrelas com EOS moderadamente
duras não são susceptı́veis á formação de condensados de pı́ons. Isto parece precisar
que a condição ρ ≥ 2 ρnuc seja satisfeita se elas verdadeiramente se formam. Por outro
lado, a massa mı́nima de uma ENs estável é determinada fixando o valor médio do
ı́ndice adiabático Γ igual ao valor crı́tico ∼ 43 para estabilidade radial contra o colapso.
Isto conduz a Mmin ∼ 0.09 M . Enquanto isso, todos os cálculos microscópicos de EOS
levam a ENs com massa máxima Mmax ∼ 3 M , conforme mostrado a seguir.
dP
≥ 0. (5.118)
dρ
211
dP
≤ c2 . (5.119)
dρ
isto é, a velocidade do som na matéria da estrela é menor do que a velocidade da luz
no vácuo.
d) A EOS abaixo de uma ‘densidade de junção ’ ρ0 é conhecida.
Rhoades e Ruffini efetuaram um cálculo variacional para determinar que EOS acima
de ρ0 , sujeita aos vı́nculos das eqs.(5.118) e (5.119), maximiza a massa. O resultado
dessa análise mostra que
P = P0 + (ρ − ρ0 ) c2 , ρ ≥ ρ0 (5.120)
−1/2
é o mais plausı́vel. O que se traduz na relação Mmax ∝ ρ0 para ρ < ρ0 . Desta
maneira, a integração numérica da equação de TOV com uma EOS tipo Harrison-
Wheeler mostra que
−1/2
ρ
Mmax = 3.2 M . (5.121)
4.6 × 1014 g cm−3
Modelos mais sofisticados implementados em modernos estudos desta propriedade
mostram que essencialmente a massa máxima de ENs fica por volta de 3 M .
Acima deste limite, qualquer objeto compacto que venha a ser encontrado poderá
caracterizar-se como um buraco negro. O estudo desta classe particular de OCs é o
tema do capı́tulo seguinte deste livro.
a = a1 + a2 , (5.122)
M1 a1 − M2 a2 = 0. (5.123)
212
onde P? é o perı́odo orbital. Assim, se o espectro de M1 mostrar variações periódicas,
então P? e V1 podem ser medidos e portanto se obter uma função para a1 seni. Alter-
nativamente, para pulsos de raios-X podem medir-se variações periódicas no tempo
de chegada dos pulsos. A amplitude destas variações é simplesmente o tempo de vôo
através da órbita projetada, isto é, a1 seni/c.
Ora, a lei de Kepler estabelece que
2
G(M1 + M2 ) 2π
= . (5.125)
a3 P?
M1 + M2
a= a1 , (5.126)
M2
de modo que a função de massa f , que depende só dos observáveis P? e V1 (ou a1 seni),
é definida como
(M2 seni)3 P? V13
f (M1 , M2 , i) ≡ = . (5.127)
(M1 + M2 )2 2πG
Se somente uma função de massa pode ser medida para um sistema binário, então não
se pode proseguir além da Eq.(5.127) sem ter informações adicionais. Só em alguns
casos de binárias de raios-X tem sido possı́vel medir ambas as funções de massa, da
companheira óptica, O, e da fonte de raios-X, X, obtendo-se
213
Figura 5.9: Massas de ENs obtidas a partir de observações de sistemas binários que contém
pelo menos um pulsar radio. Note que a média corresponde a 1.35 ± 004 M . (Versão
original publicada por S. E. Thorsett & D. Chakrabarty, The Astrophysical Journal 512,
288 (1999). Copyright The American Astronomical Society (1999)).
214
caracterı́sticas da população de pulsares binários, e massas de estrelas de nêutrons
com diferentes histórias de transferência de massa. Particularmente, no caso de teo-
rias como as da gravitação , eles permitem discriminar de maneira efetiva entre as
várias alternativas para se descrever esta interação na natureza, colocando vı́nculos
fortes sobre os desvios em relação à relatividade geral. Procuras por novos pulsares
(‘surveys’) produzem sistemas binários novos que aumentam nossa compreensão de
todos estes campos e podem abrir áreas da fı́sica enteiramente novas, como espectacu-
larmente demonstrado pela recente descoberta do único sistema (conhecido até hoje)
duplo de pulsares extremamente relativı́stico: J0737-3039 A,B !
No caso do pulsar binário de Taylor & Hulse (PSR 1913+16), somente uma função de
massa é disponı́vel a partir de observações em radio. A estrela companheira é um
objeto compacto de algum tipo, mas não tem sido possı́vel observá-lo diretamente.
Contudo, a alta precisão das observações do pulsar, combinadas com a velocidade
orbital (V1 acima) relativamente alta permitiram medições do avanço do periastro
devido ao efeito previsto pela relatividade geral e o deslocamento Doppler de segunda
ordem. Estes forneceram duas relações a mais entre M1 , M2 , a1 e seni, além das
Eqs.(5.124, 5.127), que permitiram uma solução completa para todos os parâmetros.
O melhores valores das massas neste sistema são:
215
Figura 5.10: Descrição esquemática da órbita de
um pulsar binário. (Versão original tomada do site
http://astrosun2.astro.cornell.edu/academics/courses//astro201/psr1913.htm).
216
5.11 Apêndice A
onde Gµν = Rµν − 21 Rgµν é chamado de tensor de Einstein. A estrela é modelada pela
métrica (gµν ) esfericamente simétrica de Schwarzschild
dr2
2 RS
ds = 1 − dt2 − RS
− r2 (dθ2 + sen2 θdφ2 ) , (5.136)
r 1− r
5.12 Exercı́cios
Anãs brancas
Exercı́cio AB-1 ??.— Mostre que a razão entre a densidade média e a densidade central
0
num politropo é dada por ρρ̄c = 3 |θ ξ(ξ11 )| .
Tópico especial: A luminosidade de Eddington
Existe um limite natural para luminosidade que um objeto ligado gravitacionalmente
pode emitir. Neste limite a força gravitacional dirigida para o centro do objeto é
contra-balanceada pela pressão de radiação que aponta para fora de sua superfı́cie.
Embora esta luminosidade limite, (Luminosidade de Eddington), possa ser contornada
de várias maneiras, ela fornece uma estimativa útil da massa mı́inima de uma fonte
particular de radiação .
a. considere hidrogênio ionizado. Cada par elétron-próton possui uma massa da ordem
da massa do próton (mp ) e uma seção de choque à radiação igual a seção de choque
de Thomson (σT ).
b. a pressão de radiação é dada pelo fluxo dividido pela velocidade da Luz (a Lei de
Stefan).
c. equacione a força para fora devida à radiação sobre o par com a força da gravidade
sobre o mesmo par de partı́culas.
d. resolva para a luminosidade como função da massa.
Qual é a luminosidade de Eddington para o Sol, cuja massa é 2 × 1033 gramas (1 M )?
Estrelas de nêutrons
217
-2 Embora não discutidas neste capı́tulo, as propriedades rotacionais de um objeto
compacto são interessantes para entendermos algumas de suas caracterı́stica dinâmicas
e suas propriedades estruturais. Vejamos o que sucede com uma estrela de nêutrons
em rotação .
a. o Sol gira a cada 24 a 30 dias dependendo da latitude. Quão rápido ele poderia
rodar se fosse comprimido até um raio de 10 km, enquanto conserva seu momento
angular?
b. quão rápido poderia rodar uma estrela de nêutrons sem arrebentar-se? Suponha
que ela possui uma massa equivalente a 1.4 M , e tem um raio de 10 km.
c. quais o momento angular e energia rotacional de uma estrela de nêutrons? Usar as
seguintes relações e parâmetros
M R2
I ' 0.21 (5.138)
(1 − 2) GM
Rc2
218
-5 Massa de uma estrela de nêutrons
a. use a pressão e densidade caracterı́sticas discutidas acima (3.a) para obter a
relação entre a massa e o raio de uma estrela. Note que ENs possuem nêutrons rel-
ativı́sticos tal que sua pressão é dada, aproximadamente, pelo produto da densidade
vezes a velocidade da luz ao quadrado, isto é, P ∼ ρc2 .
b. um gás relativı́stico degenerado tem uma densidade de uma partı́cula por cada
comprimento de onda Compton. Combine isto com o resultado de a. para calcular
qual a massa da estrela.
219
Capı́tulo 6
Buracos Negros
220
Figura 6.1: Potencial gravitacional na teoria de Newton para movimento vertical. O
movimento depende do sinal da energia.
221
estrelas e do colapso gravitacional, graças aos trabalhos de Chandrasekhar (anãs
brancas) e Oppenheimer (colapso esférico), entre outros. Em 1963, Roy Kerr publicou
[4] a primeira solução das EE descrevendo o espaço-tempo gerado pelo que ele pensou
se tratava de uma estrela com momento angular não nulo, mas no ano seguinte
Brandon Carter mostrou que a solução de Kerr descrevia não uma estrela mas um
outro tipo de objeto em rotação, com uma estrutura de singularidades mais complexa
que a de Schwarszchild. Em 1965 a solução de Kerr foi generalizada ao caso de uma
configuração com carga por Newman et al [5]. O nome de buraco negro foi dado em
1967 por John Wheeler ao estado final do colapso gravitacional de uma estrela muito
massiva, sendo mais tarde generalizado para abranger qualquer solução que apresente
horizonte(s) de eventos 3 (tal como as de Schwarszchild, Kerr e Kerr-Newmann).
Dois anos mais tarde, Roger Penrose desenvolveu um processo para extrair energia
rotacional do buraco negro de Kerr. Um outro resultado que foi sendo elaborado na
decada dos 60 foi o teorema que mostra que “os buracos negros não tem cabelo”.
Isto quer dizer que os buracos negros não conservam nenhum detalhe da estrela que
colapsou para formá-los. De outra forma, os únicos parâmetros que caraterizam um
buraco negro são a massa, o momento angular, e a carga elétrica.
No inicio da década dos 70 foi estudada toda a teorı́a de perturbações da geometria
de Schwarszchild, completando assim o entendimento dos buracos negros do ponto
de vista clássico. Para completar a discussão das caracterı́sticas clásicas dos buracos
negros, na Sec. 6.7 apresentaremos os buracos negros astrofı́sicos.
Como veremos na Sec. 6.8, a surpresa chegou no ano 1974, quando Hawking mostrou
que efeitos quânticos fazem com que o buraco negro emita radiação com espectro de
corpo negro. Esta descoberta abriu a porta para a formulação da termodinâmica de
buracos negros, colocando também novos problemas (ver Sec. 6.9). Na seção seguinte,
começaremos nosso estudo com a solução de Schwarszchild.
222
onde 0 ≤ θ ≤ π, −π ≤ φ ≤ π.
• Ela representa a solução exterior de um objeto com massa M , como foi mostrado
a partir do limite de campo fraco na Sec. 2.6.
Como em qualquer outra solução das EE, a métrica terá informação não só da ge-
ometria mas também do sistema de coordenadas escolhido. É bom lembrar que uma
escolha judiciosa do sistema coordenado ajuda tanto na resolução das EE quanto na
obtenção de uma métrica que mostre de cara algumas das propriedades do espaço-
tempo em questão. Por exemplo, no caso da geometria de Schwarszchild o problema
de achar a solução das EE, que envolve em principio determinar os 10 coeficientes da
métrica, foi reduzido usando somente questões de simetria (ver Sec.2.6) ao problema
de achar duas funções A(r) e B(r). Estas foram determinadas através das EE para o
caso de vácuo.
223
6.2.1 Singularidades
48M 2
Rµνρσ Rµνρσ = , (6.5)
r6
para mostrar que o ponto r = 0 é uma singularidade essencial. Mas este resultado
não permite concluir nada sobre a superfı́cie r = rg 6 . Um outro critério que pode-
riamos adotar é o seguinte: uma singularidade é real se as forcas de maré que agem
sobre um objeto na suposta singularidade são infinitas 7 . Este critério concorda com a
noção de singularidade como divergência da força associada ao campo, bem conhecida
no caso do eletromagnetismo por exemplo. Para calcular as forças de maré utilizaremos
a equação do desvio geodésico
D2 η i
− Rabcd eia v b v c ejd η j = 0, (6.6)
Dη 2
D2 η r 2M
2
= + 3 ηr ,
Dη r
6
Nesta seção e nas seguintes faremos c = G = 1.
7
As forças de maré foram discutidas na Seção 1.2.4 e .....
224
D2 η θ M θ
= − η ,
Dη 2 r3
D2 η φ M φ
= − η .
Dη 2 r3
O sinal “+” do lado direito da primeira equação indica uma tensão ou esticamento
na direção radial, enquanto que o sinal “-” das outras equações indica uma pressão
ou compressão nas direções transversais. Claramente vemos que as forças de maré são
finitas em r = rg , mas divergem na origem, confirmando o caráter essencial da singu-
laridade em r = 0, e estabelecendo que a superfı́cie r = rg não é uma singularidade
real, mas um artefato do sistema de coordenadas escolhido 8 . Veremos na Sec. 6.2.3
que é possı́vel construir sistemas de coordenadas bem comportados em r = rg , que
nos ajudarão a entender melhor a natureza da solução de Schwarszchild.
Para aprofundar o entendimento da geometria da solução de Schwarszchild podemos
analizar o comportamento dos cones de luz (veja Seção 12.7.3). É conveniente lembrar
que o cone de luz é definido como o locus dos pontos xµ + dxµ na vizinhança de um
ponto xµ tal que
gµν dxµ dxν = 0.
Sendo os cones de luz definidos pelas trajetórias de partı́culas de massa nula, estu-
daremos aqui as geodésicas nulas, começando pelas geodésicas radiais, definidas por
225
É conveniente lembrar que o movimento de partı́culas no espaço-tempo de
Schwarszchild foi estudado na Sec.2.6.1 utilizando a equação da trajetória r = r(φ).
Aqui estudaremos a dependência das coordenadas com o parâmetro afim λ (no caso
de partı́culas com massa zero), ou com o tempo coordenado t (no caso de partı́culas
com massa não nula).
Da EOM (2.271) obtemos para o caso de massa nula e momento angular zero,
ṙ = ±E, (6.11)
onde o ponto representa a derivada com relação ao parâmetro afim. Para analizar o
diagrama espaço-tempo precisamos conhecer t = t(r). Usando a integral da expressão
(2.263),
(1 − 2M/r)ṫ = E
na identidade
dt ṫ
= ,
dr ṙ
obtemos (tomando o sinal positivo em (6.11))
dt r
= , (6.12)
dr r − 2M
que pode ser integrada dando como resultado
t = r + 2M ln |r − 2M | + constante. (6.13)
226
Figura 6.2: Solução de Schwarszchild em coordenadas de Schwarszchild
t = r + 2M ln |r − 2M | + constante. (6.15)
Vemos desta equação que t → ∞ para r → 2M . Ou seja que leva um tempo coordenado
infinito para o fóton alcançar r = 2M independendo da posição inicial. Voltaremos a
esta questão daqui a pouco.
Passemos agora a estudar as geodésicas radiais de partı́culas com massa não nula. As
equações de movimento que seguem de (2.263) e (2.264) são
(1 − 2M/r)ṫ = E, (6.16)
227
Integrando,
2 3/2
τ − τ0 = √ r0 − r3/2 . (6.18)
3 2M
Esta expressão mostra que a partı́cula passa através do horizonte e atinge r = 0 num
tempo finito, contrariamente ao que sugere a Figura 6.2. Vejamos agora o que acontece
na descrição do movimento usando a coordenada t. Integrando a equação
r 1/2 −1
dt ṫ 2M
= =− 1− ,
dr ṙ 2M r
obtemos
1/2
2 3/2 3/2 1/2 1/2 (r1/2 + (2M )1/2 )(r0 + (2M )1/2 )
t−t0 = − √ (r −r0 +6M (r −r0 ))+2M ln 1/2 .
3 2M (r0 + (2M )1/2 )(r1/2 − (2M )1/2 )
(6.19)
É facil ver que esta equação coincide com a equação (6.18) no caso em que r, r0 >>
2M . No entanto, para r ≈ 2M ,
Figura 6.3: Tempo coordenado vs. tempo próprio, a partir das equações (6.18) e (6.19).
A linha em r = 0 indica a singularidade.
A seguir mostraremos que é possı́vel introduzir uma nova coordenada temporal que
remova a singularidade aparente em r = 2M .
228
6.2.3 Outros sistemas dee coordenadas?
t̄ = t + 2M ln(r − 2M ) (6.20)
para r > 2M , vemos que a equação (6.14) que define a congruência das geodésicas
incidentes toma a forma
t̄ = −r + constante, (6.21)
que é uma reta que faz um angulo de -45◦ com o eixo r. Diferenciando a equação (6.20)
e eliminando dt na métrica de Schwarszchild em favor de dt̄ obtemos
2 2M 2 4m 2M
ds = 1 − dt̄ − dt̄ dr − 1 + dr2 − r2 dΩ2 , (6.22)
r r r
(correspondente aos “fótons imergentes”) é dado por uma linha a -45◦ com o eixo r.
O lado direito (correspondente aos “fótons emergentes”) começa a 45◦ em infinito, e
depois vai se fechando a medida que r diminue, atingindo a vertical em r = 2M , e
229
continuando a se fechar depois. Vemos que em r = 2M os fótons emergentes “ficam no
lugar”. A diferença com relação a figura (6.2) é que esta figura mostra corretamente
o que acontece com uma partı́cula em queda radial.
Note que a solução de Schwarszchild nestas coordenadas é regular em r = 2M . De
fato, ela é regular no intervalo 0 < r < ∞. Ou seja, a transformação (6.20) extendeu
o intervalo da variável r coberto pelo sistema coordenado de Schwarszchild, de jeito
semelhante ao que acontece na extensão analı́tica de uma função em análise complexa
[7], e por isso a métrica (6.22) se chama extensão analı́tica da métrica (6.3). O sis-
tema de coordenadas de Schwarszchild cobre então somente uma parte da variedade
espaço-tempo, trata-se de um local coordinate patch sobre a variedade completa. As
coordenadas de E-F imergentes por sua vez cobrem uma parte maior da variedade
(mas veremos depois que não cobrem toda a variedade) 9 .
A métrica (6.22) pode ser re-escrita introduzindo a coordenada
v = t̄ + r.
Da figura 6.4 vemos que longe da origem, os cones de luz são os do espaço-tempo de
Minkowski. A medida que vamos nos aproximando a r = 0, as frentes de onda emer-
gentes são atraı́dos “para dentro” (isto é, os cones viram). Em r = 2m, fótons radiais
9
Rigorosamente, a análise na região 0 < r < 2m da seção anterior é correta a posteriori, já que as
coordenadas de Schwarszchild não cobrem essa região. Mas a análise nas coordenadas de E-F e Kruskal
(ver Sec. 6.5) concorda com a interpretação que segue das coordenadas de Schwarszchild “internas”.
230
emergentes ficam sobre a superfı́cie, enquanto todos os outros são arrastados para
dentro de r = 2M . Já na região II, dentro da superfı́cie r = 2M , até os fótons radiais
emergentes são desviados na direção da singularidade. Segue então que a superfı́cie
r = 2M age como uma membrana unidirecional 10 , permitindo que as curvas tipo
tempo ou nulas dirigidas ao futuro passem da região II para a I, mas não deixando
que curvas tipo tempo ou nulas dirigida ao futuro possam sair da região I para a II.
A superfı́cie r = 2M é chamada de horizonte de eventos já que representa a fron-
teira dos eventos que podem ser observados desde r > 2M . A figura 6.5 representa
esquematicamente num diagrama espacial o comportamento dos cones de luz no plano
equatorial do buraco negro de Schwarszchild. Note que o horizonte existe tanto para
curvas geodésicas como para curvas aceleradas, já que mesmo as partı́culas aceleradas
se movem dentro do cone de luz (mas não seguindo retas).
231
Já no sistema de coordenadas de Painlevé-Gullstrand, o elemento de linha (também
conhecido como elemento de linha de Lemâitre), tem a forma
r
2GM 2GM
ds2 = 1 − dt2 ± dr dt − dr2 − r2 dΩ2 . (6.25)
r r
Neste sistema, as superfı́cies t=constante sao planas: toda a curvatura do espaço-
tempo está nas componentes t−t e t−r da métrica. Outras caracterı́sticas da solução de
Schwarszchildnestas coordenadas são discutidas em [8].
Temos discutido até agora as caracterı́sticas matemáticas da solução de Schwarszchild.
Mas qual é a situação fı́sica por ela descrita? Para responder esta pergunta, seremos
obrigados a efetuar um breve desvio para falar de colapso gravitacional.
232
Figura 6.6: Colapso em coodenadas de Schwarszchild.
ver capı́tulo 5). Neste caso, o raio gravitacional está sempre no interior do corpo,
não existe nenhuma singularidade, e a métrica de Schwarszchild descreve a geometria
a partir da superfı́cie do mesmo 12 . O segundo caso é aquele o mostrado na figura 6.6, no
qual, como resultado do colapso, a superfı́cie da estrela atravessa o raio gravitacional,
e o horizonte fica “a descuberto”. Este é o caso do buraco negro 13 .
O que acontece no caso mais geral de uma estrela colapsando sem manter a simetria
esferica? Não existe critério geral que permita decidir em quais condições se formará
um horizonte, dada uma situação inicial arbitrária. A dificuldade principal deste prob-
lema é a dependência temporal do processo: durante o colapso, existe um perı́odo de
tempo durante o qual o horizonte está aumentando desde raio zero até 2M no caso
de Schwarszchild. Isto fica claro da figura 6.6, onde vemos que existe um último fóton
(o “marginal”) que fica no horizonte. Nesta situação de simetria esférica não é difı́cil
determinar a posição do horizonte, mas em situações assimétricas, e com emissão de
radiação gravitacional, o cálculo é extremamente complexo. Contudo, alguns resulta-
dos têm sido obtidos:
233
• Diversos cálculos indicam que qualquer horizonte (mesmo em ausência total de
simetria) acabará sendo estacionário (o que se conhece como a conjectura de “no
hair”).
• Um resultado conhecido para o caso de horizontes não estacionários é o teorema
da área de Hawking (ver Seção 6.9).
é satisfeita, onde VN (r) é o potencial newtoniano efetivo, dado por VN (r) = −M/r +
L2 /(2r2 ). Em particular, aqueles r tais que E = VN (r) são os pontos de retorno, e
neles a velocidade da partı́cula é zero. Começaremos revisando o movimento no caso
newtoniano, deixando o caso de Schwarszchild para a seção seguinte, onde veremos que
existem grandes diferências devidas á RG. O diagrama correspondente ao potencial
efetivo VN é dado na figura 6.7. Vemos dele que
• partı́culas com E > 0 vem desde infinito, são refletidas pelo potencial no ponto
r = rret dado pela equação E = VN (rret ), e voltam para o infinito seguindo
órbitas abertas (parabólicas ou hiperbólicas), enquanto
234
Figura 6.7: Potencial efetivo para o caso newtoniano com diferentes valores de a = L/M :
a1 = 1, a2 = 4.
Detalhes sobre o movimento neste caso podem ser encontrados em qualquer livro de
mecânica clássica, por exemplo [12], mas é importante lembrar que o potencial efetivo
não tem informação sobre a parte angular do movimento. Esta segue da equação de
movimento correspondente á φ (ver eq.(6.27)).
Veremos a seguir que um raciocinio análogo ao aplicado no caso newtoniano pode ser
desenvolvido no caso da solução de Schwarszchild, mas com resultados bem diferentes.
Como foi mostrado na Seção refmteste, no movimento de partı́culas teste (isto é,
aquelas que não alteram a geometrtia de fundo) na métrica de Schwarszchild,
dr2
2 2M
ds = 1 − dt2 − 2M
− r2 (dθ2 + sin2 θdφ2 ),
r 1− r
pt ≡ E, pφ ≡ ±L.
onde λ é o tempo próprio por unidade de massa. Dividindo por m2 e definindo ≡ E/m
e ` ≡ L/m obtemos
2
dr 2
= − v 2 (r), (6.26)
dτ 2
235
onde τ é o tempo próprio e
s
rg `2
v(r) = 1− 1+ 2 .
r r
é o potencial efetivo [13], definido para r > 2M . A equação diferençial (6.26) determina
a variação de r com τ . Para a variação das outras duas coordenadas relevantes temos
dφ 1 dφ pφ g φφ L `
= = = = 2, (6.27)
dτ m dλ m m r
dt 1 dt pt g tt E
= = = = . (6.28)
dτ m dλ m m 1 − 2M/r
Obtendo r = r(τ ) a partir de (6.26), estas duas equações determinan a dependência
de t e φ com τ (notar que para objetos de massa nula não podemos utilizar o tempo
próprio; veremos como resolver isto mais adiante).
Vamos examinar agora as possı́veis órbitas de uma partı́cula de massa não nula na
geometria de Schwarszchild, utilizando o potencial efetivo,
r
2M `2 2M `2
v(r) = 1 − + 2− . (6.29)
r r r3
A primeira coisa a ser notada é que para r < 2M o potencial é imaginario,
não existindo então pontos de retorno, definidos por = v(r). Em outras palavras, se
a partı́cula entra na superfı́cie r = 2M já não volta a sair, confirmando o fato de que
esta superfı́cie é um horizonte.
Por meio de álgebra simples é possı́vel mostrar que o potencial tem extremos em
236
Figura 6.8: Potencial efetivo para a =??. O movimento depende do valor da energia.
Impondo as condições para que a órbita r = rc seja circular (isto é, ∂V /∂r = 0 e
dr/dt = 0) obtemos que a energia numa órbita de raio rc é dada por
rc − 2M
E(rc ) = √ √ .
rc rc − 3M
onde o tempo implı́cito nesta equação é o tempo próprio da partı́cula. Já a freqüência
237
Figura 6.9: Potencial efetivo para diferentes valores de a. Note a aparição do poço, que
possibilita órbitas finitas.
238
Figura 6.10: Potencial efetivo no caso de partı́culas de massa nula.
t = ±r∗ + constante,
onde a coordenada “tartaruga” [13] introduzida por Regge and Wheeler está definida
por r
r∗ = r + 2M ln −1 ,
2M
239
de jeito tal que −1
dr∗ 2M
= 1− .
dr r
Definimos agora coordenadas nulas u e v como segue:
u = t − r∗ , v = t + r∗ .
2M e−r/2M (v−u)/4m
ds2 = e du dv.
r
Introduzindo agora novas coordenadas
U = e−u/4m , V = ev/4m ,
a métrica se escreve
32M 3 e−r/2M
ds2 = − dU dV.
r
Finalmente, fazendo mais uma transformação ,
U +V V −U
T = , X= ,
2 2
e escrevendo a métrica em 4 dimensões, obtemos a métrica de Kruskal-Szekeres
32M 3 e−r/2M
ds2 = (−dT 2 + dX 2 ) + r2 (dθ2 + sin θ2 dφ2 ). (6.35)
r
A relação entre as coordenadas (t, r) e as (T, X) é dada pelas equações
r
− 1 er/2M = X 2 − T 2 , (6.36)
2M
t T +X −1 T
= ln = 2 tanh . (6.37)
2M X −T X
Note que na equação (6.35) r é função de X e T por causa da equação (6.36). O
intervalo permitido para as coordenadas X e T fica definido pela condição r > 0, ou
X 2 − T 2 > −1. O diagrama de espaço-tempo da extensão de K-S é mostrado na figura
6.11. A estrutura causal do espaço-tempo de Schwarszchild extendido é facilmente en-
tendida do diagrama, já que as geodésicas radiais nulas são linhas a 45◦ nas coordendas
K-S. Note que o diagrama mostra que a singularidade em “r = 0” das coordenadas de
Schwarszchild corresponde nas coordenadas de K-S à duas singularidades, dadas por
240
Figura 6.11: Solução de Schwarszchild em coordenaas de Kruskal-Szekeres.
√
X = ± T 2 − 1. Elas estão no futuro da região II e no passado da III respectivamente.
Veja também que embora as coordenadas K-S são muito convenientes para analizar
a região de campo forte da geometria de Schwarszchild, não são uteis para estudar o
limite r → ∞, já que guu e gvv caem exponencialmente com r.
O diagrama mostra também que o horizonte é uma linha nula (isto é, ela forma um
ângulo de 45◦ com o eixo horizontal). Isto reflete o fato de que o horizonte é a divisoria
entre aqueles raios que não podem escapar e aqueles que escapam. Ele é o caminho
percorrido pelo raio “marginal”.
241
no vácuo, mas da discusão de colapso gravitacional sabemos que o interior de um
corpo em colapso não será descrito pela métrica de Schwarszchild (já que Tµν 6= 0
alı́). Por causa do teorema de Birkhoff, o exterior do corpo estará representado pela
geometria de Schwarszchild. O espaço-tempo correspondente ao colapso gravitacional
nas coordenadas de K-S está representado pela figura 6.12. As regiões III e IV (assim
como partes da I e II) são cobertas por materia, e nelas a solução das EE não é a de
vácuo. Somente uma parte da região II do espaço-tempo de K-S aparecerá quando a
matéria colapsando atravessar r = 2M . Assim, as regiões III e IV não são relevantes
no colapso gravitacional.
Até aqui analisamos a solução de Schwarszchild, que possui um alto grau de sime-
tria (ela é esféricamente simétrica e estática). Do ponto de vista da astrofı́sica, seria
interessante dispor também de soluções descrevendo objetos em rotação (isto é com
simetria axial). Estudaremos a seguir um tipo de buraco negro que possui velocidade
angular não nula.
242
2M r 2 4
2 2 2
− (r + a ) sin θ + 2 a sin θ) dφ̄2 , (6.38)
ρ
onde
ρ2 = r2 + a2 cos2 θ.
Esta forma pode ser obtida a partir da métrica de Schwarszchild , fazendo uma trans-
formação de coordenadas onde r pode ter valores complexos [5]. A segunda forma da
solução é em coordenadas tipo cartesianas, como foi descoberta por Kerr. Pode ser
obtida da anterior fazendo a transformação
t̄ = v − r,
∆ sin2 θ 2 2 ρ2 2
ds2 = (dt − a sin 2
θdφ 2 2
) − (r + a 2
)dφ − adt − dr − ρ2 dθ2 , (6.39)
ρ2 ρ2 ∆
onde
∆ = r2 − 2M r + a2 .
Os detalhes do cálculo da solução podem ser encontrados por exemplo em [31].
A forma de B-L é talvez a mais utilizada, e vale a pena salientar algumas das suas
propriedades. Primeiramente, as superfı́cies t = constante, r = constante não tem a
métrica da 2-esfera, como era de esperar numa geometria sem simetria esférica. Em
segundo lugar, a métrica de Kerr depende de dois parâmetros, m e a. Fazendo a = 0
recuperamos a solução de Schwarszchild nas coordenadas de Schwarszchild (eq.(6.3)),
e então M é a massa do buraco negro. Vemos também que os coeficientes da métrica in-
dependem de t e φ, e conseqüentemente a solução é estacionaria e axialmente simétrica
(ela é invariante respeito de rotações com eixo z). A métrica tem ainda duas simetrias
discretas: ela é invariante sob a transformação
t → −t, φ → −φ,
e sob
t → −t, a → −a.
243
A primeira sugere que o campo tem como fonte um corpo em rotação, já que correr
o tempo para atrás com uma direção de rotação negativa é equivalente a correr o
tempo para adiante com uma direção de rotação positiva. A outra simetria sugere que
a tem relação com o momento angular. De fato, e possı́vel mostrar que a é o momento
angular por unidade de massa, a = J/M [17].
Singularidades e horizontes
O cálculo dos invariantes mostra que a métrica de Kerr tem somente uma singularidade
intrı́nseca quando ρ = 0. Da definição de ρ,
ρ2 = r2 + a2 cos2 θ,
x 2 + y 2 = a2 , z = 0,
no caso em que a2 < M 2 (o momento angular é menor que a massa), que é o rele-
vante em astrofı́sica 15 . A solução de Kerr é então regular nas três regiões seguintes:
r+ < r < ∞, r− < r < r+ , e 0 < r < r− . O horizonte r+ está totalmente dentro de S+ ,
e a região entre eles é a ergosfera, cujas propriedades discutiremos depois. A figura 6.13
mostra um esquema da solução de Kerr. Note que no caso a > M terı́amos o campo
gravitacional de uma singularidade “nua” (isto é, não “vestida” pelo horizonte). Dev-
ido ao fato de que tanto o espaço e o tempo deixam de ter sentido nas vizinhanças da
singularidade, e sendo que as leis da fisica pressupõem a existência destes, uma singu-
laridade nua seria um “lugar onde todo vale”. Por este motivo, R. Penrose formulou
em 1969 a Conjectura de Censura Cósmica , que afirma que o colapso gravitacional
não pode ter como resultado uma singularidade nua. Quase 30 anos depois de sua
formulação , ainda não foi possı́vel provar tal conjectura.
15
Veremos uma justificativa para este resultado mais abaixo.
244
Figura 6.13: Esquema da solução de Kerr
A solução de Kerr não tem simetria esférica, e por tanto não existem nela curvas
que correspondam a geodésicas radiais. Na relatividade geral, isto pode ser entendido
como o fato de que a fonte em rotação arrasta o espaço perto dela e conseqüentemente
as geodésicas (veja Sec.6.6.2). A situação é bem diferente do que acontece na teoria
de Newton, onde sempre podemos levar a fonte ao repouso mudando ao referencial
em rotação com a fonte. Mas isto não é possı́vel na RG já que não existe nenhuma
transformação de coordenadas que leve da métrica de Kerr na de Schwarszchild. Não
estudaremos aqui o detalhe das geodésicas (ver [16] e [17]), mas é possı́vel mostrar que
existem duas congruências de geodésicas nulas, definidas pelas equações
(r2 + a2 )l
ṫ = ,
∆
ṙ = ±l,
al
φ̇ = ,
∆
onde l é uma constante do movimento. Como no caso de Schwarszchild, temos duas
congruencias nulas, correspondentes aos dos sinais na equação para ṙ. Escolhendo
ṙ = +l, as equações podem ser integradas no caso a2 < M 2 , e o resultado é
M2 M2
t=r+ M +√ ln |r − r+ | + M − √ ln |r − r− | + constante,
M 2 − a2 M 2 − a2
a r − r+
φ= √ ln + constante.
2
2 M −a 2 r − r−
245
Do fato que ∆ > 0 nas regiões I e III, e < 0 na II, junto com a equação
dt ṫ r 2 + a2
= = ,
dr ṙ ∆
segue que dr/dt > 0 na região I, e consequentemente esta congruência é chamada
de congruência principal de geodésicas nulas emergentes. A solução com o sinal “-”
pode ser obtida da solução com o sinal “+”, fazendo a mudança t → −t, φ → −φ.
Obtem-se então a congruência principal de geodésicas nulas incidentes. Estas duas con-
gruências desempenham um papel análogo as congruências estudadas na solução de
Schwarszchild. Fazendo um diagrama espaço-tempo encontramos na região I uma
situação semelhante aquela vista na Fig. 6.2 no caso de Schwarszchild. Os cones de
luz vão se afinando quanto mais perto chegarmos de r = r+ , onde t e φ são infinitos,
sugerindo que se trata de una singularidade do sistema de coordenadas. Fazendo as
transformações
2M r
t → t̄, onde dt̄ = dt + dr,
∆
a
φ → φ̄, onde dφ̄ = dφ + dr,
∆
e definindo uma coordenada tempo avançado,
v = t̄ + r,
obtemos a forma de E-F da métrica Kerr, ver figura (6.14). Vemos do diagrama que
nenhum raio de luz pode sair da região II para a região I. Segue então que a superfı́cie
r = r+ é um horizonte. Já na região II, os cones estão inclinados na direção da
singularidade em r = 0, e qualquer partı́cula que entre na região II se moverá na
direção da singularidade até cruzar a superfı́cie r = r− ou alcançá-la asintoticamente.
Já na região III, a partı́cula não necessariamente cai na singularidade.
pφ = g φα pα = g φφ pφ + g φt pt ,
pt = g tα pα = g tt pt + g tφ pφ .
16
A métrica de Kerr tem um tensor de Killing que fornece mais uma constante de movimento, o que
permite integrar explicitamente as equações das geodésicas, como foi mostrado num belo artigo por B.
Carter [43], utilizando a separabilidade das equações de Hamilton-Jacobi deste problema.
246
Figura 6.14: Solução de Kerr em coordenadas de E-F avançadas (a2 < M 2 ).
Seja agora uma partı́cula se deslocando com momento angular nulo, isto é pφ = 0
(notar que esta condição quer dizer que a partı́cula foi “jogada” com velocidade inicial
na direção radial no infinito). Das definições
dt dφ
pt = m , pφ = m ,
dτ dτ
a trajetória da partı́cula pode ser obtida (no caso pφ = 0) como segue:
dφ pφ g φt
= t = tt ≡ ω(r, θ).
dt p g
Esta equação define a velocidade angular de uma partı́cula com momento angular zero.
Note que ω(r, θ) sempre será diferente de zero no caso em que gtφ 6= 0. Temos então o
resultado que uma massa caindo “reto” desde infinito é arrastada pela influência da
gravitação e adquire uma velocidade angular (com o mesmo sentido que a rotação da
fonte, como veremos em seguida). No caso da métrica de Kerr em coordenadas de B-L,
√
a sin θ ± ∆
ω(r, θ) = √ .
(r2 + a2 ) sin θ ± ∆ sin2 θ
Quando ω(r, θ) > 0 (que é o caso do sinal ”+”) as partı́culas seguem órbitas no sentido
da rotação da fonte. É facil mostrar que na região I,
√
ω < 0 ↔ a sin θ − ∆ ≤ 0 ↔ r ≥ rS+ .
247
Ou seja, na superfı́cie S+ , ω = 0 17 , e dentro (na chamada ergosfera) os cones
de luz são ”inclinados” na direção de φ ”crescente”, de jeito tal que as partı́culas
são obrigadas a descrever órbitas na direção de rotação da fonte (ver figura 6.15).
Figura 6.15: Diagrama espacial da solução de Kerr (a2 < M 2 ) no plano equatorial.
Assim como a métrica de Schwarszchild pode ser usada para descrever o campo grav-
itacional no exterior de uma estrela com simetria esférica, a métrica de Kerr com
0 < a2 < m2 pode representar o exterior de uma estrela em rotação. Mas enquanto
no caso de Schwarszchild existem soluções interiores (isto é, soluções das equações de
Einstein com a matéria que compõe a estrela como fonte) que são coladas suavemente
com o exterior de Schwarszchild, não se conhecem soluções internas realistas para a
métrica de Kerr.
Finalmente, note que a métrica de Kerr pode ser estendida maximalmente utilizando
as coordenadas de E-F avançadas e retardadas (ver por exemplo [17]).
Para entender as diferenças com o caso estático, nesta seção estudaremos as órbitas de
partı́culas de massa nula no plano θ = π/2. Neste caso, dθ = 0, mas a diferença do caso
de Schwarszchild, que tem simetria esférica, aqui estamos nos restringindo a um caso
particular: fótons que não estejam no equador podem ter órbitas bem diferentes das
que vamos estudar aqui. Não obstante, fótons inicialmente com pθ = 0 permanecerão
assim, já que a métrica tem simetria com respeito a uma reflexão no plano θ = π/2.
As simetrias da métrica garantem que pt = E e pφ = L são constantes de movimento.
17
É por isto que a superfı́cie S+ é chamada também de superfı́cie do limite estacionário.
248
Seguindo os passos dados na seção 6.4 obtemos
2
dr
= g rr [−g tt E 2 + 2g tφ EL − gφφ L2 ],
dλ
que pode ser escrita como
2
(r2 + a2 )2 − a2 ∆ r2 − 2M r
dr 2 4M ra 2
= E − 2 EL − 2 L .
dλ r4 (r + a2 )2 − a2 ∆ (r + a2 )2 − a2 ∆
(6.40)
Esta equação se reduz à equação (6.26) no caso a = 0. Note que por causa do termo
EL não podemos definir um potencial efetivo utilizando (dr/dλ)2 = E 2 − V 2 , mas o
lado direto da (6.40) pode ser fatorado assim:
2
dr (r2 + a2 )2 − a2 ∆
= (E − V+ )(E − V− ), (6.41)
dλ r4
onde √
2M ra ± r2 ∆
V± (r) = 2 L. (6.42)
(r + a2 )2 − a2 ∆
Esta equação deve ser comparada com a (6.26) do caso de Schwarszchild, na qual o
potencial efetivo é imaginário dentro do horizonte. Já V± se torna imaginário para
∆ < 0. Nos dois casos isto significa que não há soluções para a equação dr/dλ = 0,
isto é não há pontos de retorno para os fótons, independente da energia dos mesmos.
Uma vez que os fótons cruzam a linha ∆ = 0 não podem sair. A equação ∆ = 0 então
delimita o horizonte no equador, e de fato pode mostrar-se que ela define o horizonte
mesmo fora do equador (como já vimos da figura 6.14).
A partir do gráfico de V± é possı́vel analizar qualitativamente o movimento. Nos re-
stringiremos a r ≥ r+ . Discutiremos primeiro o caso em que o fóton tem momento
angular no sentido do momento angular do buraco negro (fig. 6.16). Note que para r
Figura 6.16: Potencial efetivo no caso em que o fóton tem momento angular no sentido
do momento angular do buraco negro.
grande, as duas curvas caem como 1/r, e a rotação não tem importância. Já para r
249
perto do horizonte, aparecem caracterı́sticas próprias da rotação. Da equação (6.41)
vemos que o movimento só poder acontecer quando E > V+ ou E < V− . Aqueles
fótons com E > 0 não apresentam maiores novidades: eles vêm desde infinito, e
atingem um r mı́nimo para depois voltar para infinito, ou passam pelo horizonte se
não encontram antes o potencial. A condição E < V− permite fótons com E < 0, mas
é possı́vel mostrar que estes devem ser descartados se admitirmos que as partı́culas
somente podem viajar em direção ao futuro [18]. Devemos considerar então no gráfico
(6.16) somente geodésicas com E > V+ .
No caso de fótons com momento angular negativo aparecem novidades (ver Fig. 6.17).
De fato, da Eq.(6.42) vemos que neste caso as curvas são trocadas. Aplica-se ainda o
Figura 6.17: Potencial efetivo no caso em que o fóton tem momento angular no sentido
contrário ao momento angular do buraco negro.
raciocı́nio anterior, e só curvas com E > V+ são permitidas. Mas surpreendentemente
algums fótons que satisfazem esta condição tem energia negativa: são aqueles dentro
de r < r0 , isto é, dentro da ergosfera. A existência desta região permite que aconteça
um fenômeno incomun, que foi discutido por R. Penrose em 1969. Suponha que em
algum ponto entre r+ e r0 é criado um par de fótons, um deles tendo energia +E
e o outro −E, de manera tal que a energia total é zero, e com momentos opostos
tal que o fóton com energia positiva escapa para o infinito, enquanto o outro cai na
singularidade. O efeito resultante é que o fóton de energia positiva deixará o buraco
negro, e sua energia pode ser convertida no infinito em trabalho. Isto sugere que
é possivel extrair energia (ergo massa) do buraco negro com custo zero. Das figuras
(6.16) e (6.17) vemos que isto é possivel só se no processo diminuir o momento angular
do buraco negro. A energia extraida vem então da energia rotacional do buraco. Este
processo de extração de energia (chamado processo de Penrose) poderia acontecer toda
vez que exista uma ergosfera, seja no caso de um buraco negro em rotação ou no caso
de estrelas “exóticas” (ver [18]). Ele não tem relevância em astrofı́sica [40], mas foi
importante no desenvolvimento da termodinámica de buracosn negros (veja Sec. 6.9).
250
6.6.3 Buracos negros carregados
Existe de fato um outro tipo de buraco negro, importante do ponto de vista teórico, e
provavelmente significativo para a astrofı́sica (como parecem indicar os resultados do
modelo de emissão de gamma-ray bursts desenvolvidos em [19]). Trata-se do buraco
negro carregado, ou mais precisamente, da solução estática, assintoticamente plana, e
com simetria esférica das equações de Einstein-Maxwell descoberta por H. Reissner em
1916, e redescoberta por G. Nordstrom em 1918 (mas a interpretação da solução como
descrevendo um buraco negro carregado foi feita por J. Graves e D. Brill em 1960).
As equações relevantes são as da RG junto com as do campo eletromagnetico,
Rµν = 8πTµν ,
∇ν F µν = 0, ∂[µ Fνρ] = 0.
A fonte do campo elétrico é uma carga pontual situada na origem (logo o campo será
radial). Sem entrar nos detalhes do cálculo, a métrica de R-N tem a forma
−1
q2 q2
2 2M 2 2M
ds = 1 − + 2 dt − 1 − + 2 dr2 − r2 (dθ2 + sin2 θdφ2 ), (6.43)
r r r r
e o campo elétrico é
q
E(r) = .
r2
No caso q = 0, a solução de R-N se reduz à métrica de Schwarszchild. A análise da
solução mostra que no caso q 2 > m2 existe somente uma singularidade, localizada na
origem. Já no caso q 2 < m2 , a métrica tem duas singularidades, situadas em
p
r± = m ± m2 − q 2 .
É possı́vel obter a solução mais geral de buraco negro usando uma trans-
formação complexa na solução de R-N em coordenadas de E-F, como foi feito para
passar da métrica de Schwarszchild para a métrica de Kerr (ver detalhes em [17]). O
resultado é a métrica de Kerr-Newman
2M r q 2
2 2a
ds = 1 − 2 + 2 dv 2 − 2 dv dr + 2 (2M r − q 2 ) sin2 θ dv dφ̄ + 2a sin2 θ dr dφ̄
ρ ρ ρ
sin2 θ 2
−ρ2 dθ2 − [(r2 + a2 )2 − (r2 − 2M r + a2 + q 2 ) a2 sin2 θ] dφ̄ , (6.44)
ρ2
que depende de três parametros: m, a, q (massa, carga, e momento angular do bu-
raco negro respectivamente). Esta solução se reduz a de Schwarszchild no caso
251
q = a = 0, d́e Kerr se q = 0, e a de Reissner-Nordstrom se a = 0. Trata-se de
uma solução estacionária com simetria axial e assintoticamente plana, que tem uma
superfı́cie estacionária limite dada por
p
r = m + m2 − q 2 − a2 cos2 θ,
252
Figura 6.18: O desenho mostra o disco de acreção em torno de um buraco negro que
atrai matéria de uma estrela normal (ilustrando a situação no sistema GRO J1655-40, na
galáxia Scorpius). Vemos ainda o vento produzido pela presença de um campo magnético,
e o espectro de emissão de raios X. Crédito: Chandra Photo Album.
com equações em duas (ou três) dimensões, com transferência radiativa! [45] (veja a
Figura 6.18).
O caminho que leva a o modelo descrito no parágrafo anterior começou no ano 1962,
quando foram observadas as primeiras fontes de raios X em nossa galáxia, num pro-
jeto comandado por R. Giacconi (Prêmio Nobel 2002 por seu trabalho em astronomia
de raios X). Logo foram observadas fontes variáveis no tempo, algumas com contra-
partida na parte óptica do espectro. Mas o aporte decisivo foi o do primer satélite
dedicado à observações astronómicas, o Uhuru 18 . Ele observou mais de 300 fontes
de raios X, muitas delas em sistemas binários. Estes dados foram interpretados como
conseqüência da acreção de matéria num objeto compacto. Os motivos que sustentam
tal interpretação ão os seguintes:
• A variabilidade observada na emissão dos raios X tem uma escala temporal curta,
o que se deve ao fato de que a região emissora deve ser pequena (do tamanho de
um objeto compacto).
• Muitas das fontes são efetivamente sistemas binários, com uma estrela observável
no óptico em órbita elı́ptica em torno de um companheiro “invisı́vel”.
• Como mencionado na seção 6.4, a queda de matéria num buraco negro é um meio
muito eficiente de conversão de massa em energı́a.
Acredita-se hoje que a emissão de raios X deve-se ao processo descrito acima, cuja
observação é uma prova indireta da existência dos buracos negros. De fato, supõe-se
que buracos negros supermassivos (com massas entre 105 e 109 vezes a massa do Sol)
existem no centro da maioria das galáxias (incluindo a nossa), e buracos negros da
ordem de algumas massas solares compõem os sistemas binários mencionados acima.
18
Uhuru significa liberdade em swahili, lingua falada na Etiopia, paı́s de onde foi lançado o satélite.
253
Mas devemos mencionar o fato de que no caso dos sistemas binários é preciso decidir
por meio da observação (por exemplo através da medida da massa) se o objeto “escuro”
é um buraco negro ou uma estrela de nêutrons. Uma outra possibilidade envolve
a diferência fundamental entre estes dois objetos: a estrela de nêutrons tem uma
superfı́cie sólida, enquanto o horizonte do buraco negro é uma superfı́cie matemática
(veja [41] para detalhes).
Para concluir, é importante notar que toda a evidência observacional que apoia a
existência de buracos negros é indireta, mas a quantidade de evidência disponı́vel
crece rápidamente, apontando para a plausibilidade da hipôtese da existência dos
buracos negros [44].
254
horizonte (por causa da fricção). Por outra parte, a intensidade da radiação do efeito
Hawking é extremamente baixa, e não existe então possibilidade alguma de observar
este efeito nos buracos negros astrofı́sicos. Mas como veremos a seguir, existe uma
chance de medir a radiação de Hawking... no laboratório!
Numa direção aparentemente sem relação com a anterior, W. Unruh [22] mostrou em
1981 que é possivel gerar um modelo análogo de um buraco negro no laboratório, sem
a intervenção da gravitação. A ideia é muito simples. Considere o fluxo de um fluido
ideal (isto é, sem viscosidade). Se a velocidade do fluxo superar a partir de algum
ponto a velocidade do som no fluido, os fónons (“partı́culas de som”) que passem
deste ponto não poderam voltar, ficando então confinadas (ver Figuras 6.19 e ??).
Isto é o análogo de um buraco negro, mas para o som exclusivamente, e não para
Figura 6.19: Diagrama simplificado de um buraco negro análogo. As flechas longas indicam
a velocidade do fluido, que é maior que a velocidade dos fónons (representada com flechas
curtas) a partir da superfı́cie r = rh
outras ondas que existam no fluido (luz por exemplo). É claro que, como vimos antes,
o fenômeno da radiação de Hawking é eminentemente quântico, mas Unruh mostrou
que ao considerar o som como composto de particulas quânticas (“fonons”), o buraco
negro análogo (ou melhor, buraco “mudo” análogo!) emitiria radiação de Hawking
“sônica”. A possibilidade de observar este fenômeno gerou uma intensa atividade de
pesquisa na área de modelos análogos, onde tem sido publicados centenas de arti-
gos [23]. Em muitos deles tenta-se generalizar o fenômeno a sistemas mais complexos
(fluidos dielétricos, superfluidos, condensados de Bose-Einstein, etc), enquanto que em
outros a noção de sistema análogo foi generalizada para abranger outros sistemas difer-
entes dos buracos negros (como por exemplo os buracos de minhoca [24]). No que diz
respeito a observação da radiação de Hawking, existem ainda problemas experimen-
tais, relacionados fundamentalmente com o fato de que a temperatura da radiação é,
em todos os casos estudados até agora, bastante menor que a temperatura do ruı́do
de fundo [25].
255
Figura 6.20: O desenho mostra um corte transversal de um buraco “mudo” realizado a
partir de um fluido em fluxo radial. Vemos como os cones de luz vão sendo inclinados na
direção do centro do buraco. Crédito: [23].
e então dA = 32π(G/c2 )M dM , ou
c6 dA
d(M c2 ) = ≡ T dS
G2 32πM
Como T = ~/(8πkM ) é a temperatura, segue da equação anterior que a entropia S
do buraco negro vem dada por
kc3 A
S= ,
G~ 4
e não pode diminuir por causa do teorema da área 19 . Temos então o inesperado
resultado de que o buraco negro se comporta como um corpo negro de temperatura
19
Note que S é um número extremamente grande.
256
h/8πM e entropia proporcional a A. É possı́vel mostrar que a escala temporal asociada
à perda de energia (“evaporação ”) vem dada por [45]
3
M3
M
τ≈ ≈ 1010 yr ,
~ 1015 g
que é irrelevante para buracos negros de algumas massas solares, mas não para M .
1015 g.
O fato de que os buracos negros deviam possuir entropia já tinha sido notado por
Wheeler 20 , mas a temperatura de um buraco negro segundo a fı́sica clássica é
zero, já que ele absorbe e não emite nada. Foi somente depois da descoberta da
radiação de Hawking que a termodinâmica de buracos negros foi aceita. Sem entrar
em detalhes, apresentamos a seguir uma tabela comparando as leis da termodinâmica
com conceitos de buracos negros (no caso de um buraco negro estático, κ é a força
que é necessário fazer desde o infinito para manter uma partı́cula pequena sobre o
horizonte [33]).
6.10 Coda
257
têm tentado responder, com diferentes graus de sucesso. Embora existam respostas
parciais ao problema (ver por exemplo [27]), ainda não temos a resposta definitiva.
Seja qual for, ela estará nos dando informação sobre o regime quântico da gravitação .
Um problema que teria uma forte relação com o anterior é o do paradoxo da in-
formação. Como vimos antes, os buracos negros emitem radiação com temperatura
TH dada pela equação (6.45). Em princı́pio a emissão continuaria até o buraco negro
se evaporar completamente, deixando somente radiação, cuja temperatura e demais
caracteristicas dependem só dos parámetros que caracterizam ao buraco negro. Ou
seja, o resultado final independe do estado inicial, isto é, do estado da materia que
colapsa para formar o buraco. Em outras palavras, dado um estado final descrito pelas
caracterı́sticas da radiação , não é possivel determinar a partir dele o estado inicial.
Este é o problema da “perda de informação ”. Por argumentos que não reproduziremos
aqui, esta perda de informação traria uma violação a evolução unitária (um dos pi-
lares da mecânica quântica usual), e como conseqüência, a gravitação quântica deveria
incorporar esta não unitariedade [28].
A possibilidade de produzir micro-buracos negros em aceleradores de partı́culas tem
recibido bastante atenção recentemente. Isto tem a ver com teorias que incorporam
a idéia de que o espaço-tempo tem 4+n dimensões, sendo as n dimensões extras
de tamanho microscópico 21 (um exemplo deste tipo de teorias é a teoria de cor-
das). Nestas teorias, os efeitos da gravitação quântica começariam a se manifestar
a energias bastante menores do que EPlanck ≈ 1019 GeV, e um destes efeitos seria a
produção copiosa de micro-buracos negros. Este fenômeno poderia ser observado no
Large Hadron Collider, que entrará em funcionamento em 2008, e na interação de
partı́culas com energias muito grandes (como raios cósmicos ultraenergéticos ou neu-
trinos) [29].
Vemos então que, os buracos negros tem um enorme potencial para desempenhar um
papel fundamental no desenvolvimento das ideias da fı́sica moderna.
6.11 Exercı́cios
1. Calcule as componentes do tensor de Riemann da métrica de Schwarszchild no
sistema das tetradas dadas nas equações (6.7)-(6.10) (compare com a eq. (8) da
ref.[35]), e o invariante dado na eq.(6.5).
2. Mostre que a transformação de coordenadas
2
MG
r =ρ 1+
2ρ
258
3. Mostre que a transformação de coordenadas
p
2GM/r
dtP G = dtS ± dr
1 − 2GM/r
leva a métrica de Schwarszchild á métrica de Painlevé-Gullstrand dada na
equação 6.25. Qual é a interpretação do sinal duplo?
4. Mostrar a partir das definições que seguem do potencial efetivo da métrica de
Schwarszchild , que (a) r+ > 6M , ou seja que não existem órbitas estáveis para
raios menores que 6M , e (b) que as órbitas instáveis estão restritas ao intervalo
3M < r− < 6M .
5. Prove que se uma partı́cula for perturbada da posição de equilı́brio r+ do po-
tencial de Schwarszchild, para deslocamentos pequenos o suficiente o movimento
será harmônico simples, com freqüência dada pela equação (6.32).
6. Uma partı́cula na gemoetria de Schwarszchild “em infinito” se desloca radial-
mente na direção do horizonte com velocidade coordenada u0 . Mostre que para
um valor finito r do raio a velocidade coordenada vem dada por
dr 2M 1 2M
= 1− 1− 2 1− ,
dt r γ0 r
onde γ0 = (1 − u20 )−1/2 . Determine a velocidade relativa a um observador esta-
cionario em r, e mostre que ela se aproxima de 1 quando r toma valores próximos
a rg , independentemente de u0 .
7. O efeito gravitomagnetico. Dois relogios se movem em direções opostas numa
órbita circular no plano equatorial da geometria de Kerr (r = constante, θ = π/2).
(a) Mostre que a equação das geodésicas radias se reduz neste caso a
τ+ − τ− ≈ 4πa = 4πJ/M.
259
Livros de texto
Básicos: Refs.[6],[13], [17], [18], [30].
Avançados:[16], [38], [39].
Recursos em Internet
• Página sobre buracos negros do telescópio Hubble
http://hubblesite.org/explore astronomy/black holes/
• Página sobre buracos negros do observatório de raios X Chandra
http://chandra.harvard.edu/xray sources/blackholes.html
• Perguntas freqüentes sobre buracos negros
http://cosmology.berkeley.edu/Education/BHfaq.html
• Introdução aos buracos negros
http://www.damtp.cam.ac.uk/user/gr/public/bh home.html
• Uma viagem virtual a um buraco negro
http://antwrp.gsfc.nasa.gov/htmltest/rjn bht.html
260
[11] R. Price. Phys. Rev. D 5, 2439 (1972).
[12] Ver por exemplo Classical Mechanics, H. Goldstein, C. P. Poole, J. L. Safko,
Addison Wesley (2001).
[13] Gravitation, K. Thorne, C. Misner, e J. Wheeler, W. H. Freeman (1973).
[14] Ver por exemplo Gravitation and Cosmology : Principles and Applications of the
General Theory of Relativity, S. Weinberg, Ed. Wiley (1972).
[15] Schwarszchild black hole lensing, K. Virbhadra e G. Ellis, Phys. Rev. D 62, 084003
(2000).
[16] The Mathematical Theory of Black Holes, S. Chandrasekhar, Oxford U. Press
(1998).
[17] Introducing Einstein’s Relativity, R. D’Inverno, Oxford U. Press (1992).
[18] A first course in General Relativity, B. Schutz, Cambridge University Press
(1995).
[19] The blackholic energy: long and short gamma-ray bursts (new perspectives in
physics and astrophysics from the theoretical understanding of gamma-ray bursts,
II), R. Ruffini, M. G. Bernardini, C. L. Bianco, P. Chardonnet, F. Fraschetti,
V. Gurzadyan, L. Vitagliano, She-Sheng Xue, Anais da XIth Brazilian School
of Cosmology and Gravitation, Rio de Janeiro, Brazil, 19-23 Jul 2004, a serem
publicados pela AIP em 2005, astro-ph/0503476.
[20] Black hole explosions, S. Hawking, Nature 248, 30 (1974).
[21] Ver por exemplo Introducción a la mecánica cuántica, L. de La Peña, Editora
FCE (1979).
[22] Experimental black hole evaporation, W. Unruh, Phys. Rev. Lett. 46, 1351 (1981).
[23] Artificial Black Holes, M. Novello, M. Visser e G. Volovik, World Scientific (2002).
[24] A nongravitational wormhole, F. Baldovin, M. Novello, S. E. Perez Bergliaffa, J.
Salim, Class. Quant. Grav. 17, 3265 (2000), gr-qc/0003075.
[25] Effective geometry, M. Novello, Santiago E. Perez Bergliaffa, Anais da Xth Brazil-
ian School of Cosmology and Gravitation Rio de Janeiro, Brazil, 29 Jul - 9 Aug
2002, publicados pela AIP Conf.Proc. 668, 288 (2003), gr-qc/0302052.
[26] Para uma introdução básica, ver por exemplo Fundamentals of Statistical and
Thermal Physics McGraw-Hill (1965).
[27] Strings, loops, and others: a critical survey of the present approaches to quantum
gravity, C. Rovelli, gr-qc/9803024.
[28] Ver por exemplo Black Holes: Classical Properties, Thermodynamics and Heuris-
tic Quantization, J. Bekenstein, Cosmology and Gravitation, M. Novello (ed.), At-
lantisciences, France,1 (2000), Black holes and information theory, J. Bekenstein,
Contemp. Phys. 45, 31 (2003), quant-ph/0311049.
261
[29] Production of black holes in Tev-scale gravity, A. Ringwald, Fortsch. Phys. 51,
830 (2003), hep-ph/0212342.
[30] Black Holes : The Membrane Paradigm, D. MacDonald, R. Price, and K. Thorne,
Yale U. Press (1986).
[31] Introduction to General Relativity, R. Adler, M. Bazin, e M. Schiffer, McGraw-
Hill, NY (1965).
[32] Dark energy stars, G. Chapline, astro-ph/0503200.
[33] Para uma discussão detalhada do problema das singularidades veja por exemplo
o capı́tulo 9 de General Relativity, R. Wald, The University of Chicago Press
(1984), ou a referência [37].
[34] Ver por exemplo Gravitational radiation, B. Schutz, gr-qc/0003069.
[35] Wormholes in spacetime and their use for interstellar travel: A tool for teaching
general relativity, M. Morris e K. Thorne, Am. J. Phys. 395 (1988).
[36] Agujeros Negros y Tiempo Curvo. El escandaloso legado de Einstein, Kip S.
Thorne, Ed. Crı́tica (1995).
[37] Para uma discussão do conceito de singularidade, e da sua história, veja Bangs,
Crunches, Whimpers, and Shrieks - Singularities and Acausalities in Relativistic
Spacetimes, J. Earman, Oxford U. Press (1995).
[38] Black Hole Physics - Basic Concepts and New Developments, V. Frolov e I.
Novikov, Springer (July 1998).
[39] A Relativist’s Toolkit: The Mathematics of Black-Hole Mechanics, E. Poisson,
Cambridge U. Press (2004).
[40] J. Bardeen, W. Press, e S. Teukolsky, Astrophys. J. 178, 347 (1972).
[41] Trust but verify: The Case for astrophysical black holes, Scott A. Hughes, Pro-
ceedings of 33rd SLAC Summer Institute on Particle Physics: Gravity in the
Quantum World and the Cosmos, p L006 (2005), hep-ph/0511217.
[42] Gravitation and Spacetime, Hans C. Ohanian e Remo Ruffini, W. W. Norton
(1994).
[43] B. Carter,Phys. Rev. 174, 1559 (1968).
[44] Para mais detalhes com relação à observação de buracos negros, veja R. Narayan,
New J. Phys.7, 199 (2005), gr-qc/0506078.
[45] Para uma introdução veja o livro Black Holes, White Dwarfs, and Neutron Stars:
the physics of compact objects, S. Shapiro e S. Teukolsky, Wiley (1983).
262
Capı́tulo 7
7.1 Introdução
Da mesma maneira que barcos navegando através do ocêano produzem ondas na água,
o movimento de massas, por exemplo estrelas ou buracos negros, produz OGs no
tecido do ST. Quanto mais maciço (massivo) for o corpo que se movimenta mais
poderosas serão as OGs por ele geradas, enquanto que objetos que se movimentam
1
Afiliação : ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ –
Brazil.
263
Figura 7.1: Simulação da geração de OGs por um sistema binário de estrelas
tal como o pulsar de Taylor & Hulse PSR 1913 + 16. (Versão original do site
http://imagine.gsfc.nasa.gov/docs/features/topics/edge.html).
1 d n r o
Aj (t, ~x) = dj t − , (7.1)
c r dt c
REFERENCIA??
onde r ≡ |~x|, e d~ é o momento de dipólo elétrico. Os campos elétrico e magnético
do tipo 1/r calculados a partir da fórmula dada pela Eq.(7.1) dependem somente
das componentes de d~ transversas à direção de propagação ~n = ~x/r, de maneira que
podemos substituir dj na Eq.(7.1) por sua parte transversa,
264
dTj ≡ Pjk dk , (7.2)
2 T 2 T
d2 E d (dj ) d (dj )
1
= 3
, (7.4)
dt dΩ 4πc dt2 dt2
2 !
d2 (dj ) d2 (dj ) d2 (dj )
1
= − nj . (7.5)
4πc3 dt2 dt2 dt2
d2 (dj ) d2 (dj )
dE 2
LEM ≡ = . (7.6)
dt 3 c3 dt2 dt2
Escrevendo dj = e xj para uma carga pontual, vemos que a equação acima é simples-
mente a fórmula de Larmor.
Entretanto, e sobre bases dimensionais, podemos esperar que o termo equivalente para
a emissão de radiação gravitacional (OG), isto é; o termo de primeira ordem no caso
das OGs emitidas por uma fonte com velocidades internas baixas deve ser igualmente
dipolar, isto é: 2
G d (dj ) d2 (dj )
LOG ∝ , (7.7)
c3 dt2 dt2
onde o momento de dipólo gravitacional de um sistema de A partı́culas é definido
como
X
dj = m A xA , (7.8)
A
d2 (dj ) X d2 (mA xA
j )
X dPjA
= = , (7.9)
dt2 A
dt2 A
dt
onde P~ A é o momento linear da Aesima partı́cula. Uma vez que o momento total do sis-
d2 (d )
tema se conserva, i.e., dt2j = 0, então podemos concluir que não há radiação dipolar
na relatividade geral.
265
Retornando ao eletromagnetismo, as componentes de ordem superior de ra-
diação multipolar são o dipólo magnético e o quadrupólo elétrico. O momento de
dipólo magnético de ‘massa’ é definido como
1X A d~xA 1 X~A
~≡
µ ~x × (mA )= j , (7.10)
c A dt c A
2 G d2 n ¯T T r o
hTjkT = I t − , (7.11)
r c4 dt2 jk c
onde r é a distância até a fonte, e I¯jk
TT
é o momento quadrupolar de massa definido
como
¯TT
X
A A 1 A 2
Ijk = mA xj xk − δjk (x ) . (7.12)
A
3
O superı́ndice TT
significa tomar a parte transversa-sem traço da grandeza I¯jk , isto é,
1
I¯jk
TT
= Pjl Pkm I¯lm − Pjk (Plm I¯lm ). (7.13)
2
Note, de passagem, que a Eq.(7.11) pode ser obtida diretamente como uma solução das
equações de Einstein linearizadas. Este procedimento é ilustrado mais adiante na
seção sobre OGs radiadas por pulsares acelerados. (Observe-se, ainda, que para esti-
mativas de ordem de magnitude podemos escrever a amplitude da OG como o escalar
r V 2
S p
h' , (7.14)
r c2
266
Subtituindo a Eq.(7.11) na Eq.(7.15), obtemos as equações análogas das Eqs.(7.4,7.5)
* +
d3 (I¯jk
TT
) d3 (I¯jk
TT
2
dE G )
= , (7.16)
dt dΩ 8πc5 dt3 dt3
* 2 +
d3 (I¯jk ) d3 (I¯jk ) d3 (I¯ij ) d3 (I¯jk ) d3 (I¯jk )
G 1
= − 2ni nk + nj nk (7.17)
.
8πc5 dt3 dt3 dt3 dt3 2 dt3
Integrando sobre ~n, isto é, sobre a parte angular da radiação , obtém-se a luminosidade
emitida na forma de OGs
3 ¯
d (Iij ) d3 (I¯ij )
dE G
LOG ≡ = . (7.18)
dt 5 c5 dt3 dt3
−1
c5
G
L0 ≡ = = 3.6 × 1059 erg s−1 ! (7.19)
c5 G
MV 2 Lint
Lint = −→−→−→ LOG ∼ Lint ! (7.20)
T L0
A força de reação de radiação correspondente à perda de energia descrita pela
Eq.(7.18) pode-se escrever como o gradiente de um potencial Newtoniano
G d5 (I¯jk )
F~ react = −m∇Φreact , Φreact = xj xk . (7.21)
5 c5 dt5
Assim, pode-se verificar que
dE X
= V~A · F~Areact (7.22)
dt A
2G d5 (I¯jk ) A
X
= − mA VAj 5 5
xk (7.23)
A
5c dt
G d5 (I¯jk ) d X
= − 5 5
mA xA A
j xk (7.24)
5 c dt dt A
G d5 (I¯ij ) d(I¯ij )
= − 5 , (7.25)
5 c dt5 dt
267
onde a última linha foi obtida depois de lembrar que I¯ij δij = 0, isto é, o tensor é de
traço nulo! Calculando a média sobre vários ciclos (para uma fonte periódica), ou
sobre um tempo longo comparado com a escala temporal dinâmica (para movimento
de fontes confinadas), nos permite integrar por partes, duas vezes consecutivas, para
assim transformar
d5 (I¯ij ) d(I¯ij ) d3 (I¯ij ) d3 (I¯ij )
−→−→−→ , (7.26)
dt5 dt dt3 dt3
e dessa forma recuperar o resultado da Eq.(7.18).
Um procedimento análogo ao de cima, permite mostrar que o momento angular car-
regado pelas OGs (i.e., conforme dissipado pela força de reação de radiação )
dJi X A(react)
= ijk xA
j Fk (7.27)
dt A
Para se obter uma teoria linearizada da TGR, começamos por definir o sı́mbolo de
Christoffel
1
Γαβν = g ασ (gσβ,ν + gνσ,β − gβν,σ ) . (7.33)
2
Substituindo a Eq.(7.29) na Eq.(7.33) obtém-se
CORREGIR podemos substituir a Eq.(7.35) na Eq.(7.36). Este resultado pode ser então
levado ao tensor de Riemann (note que o traço e o operador D’Alembertiano são dados,
respectivamente, por
)
CORREGIR
As expressões assim obtidas podem ser substituidas nas equações de campo, as quais
tomam a seguinte forma
1
Rµν − gµν R = 8πTµν (7.45)
2
1 α 1
hν,µα + hαµ,αν − h,µν − hµν − hµν
,µν − h gµν =
2 2
1h α i
hν,µα + hαµ,αν − h,µν − hµν − ηµν hαβ,αβ − h = 8πTµν . (7.46)
2
A Eq.(7.46) constitui a realização do processo de linearização da TGR. Ela descreve a
propagação de OGs cuja fonte (distribuição de matéria-energia) é bem caracterizada
pelo tensor Tµν .
269
7.3.1 A transformação de calibre
Portanto,
xα = x0α − ξ α , (7.50)
do qual se segue que
∂xα
Λαβ0 =
∂x0β
∂
= (x0α + ξ α )
∂x0β
∂ξ α
= δ α β − 0β
∂x
µ
∂x ∂ξ α
= δβα − 0β µ
∂x ∂x
∂ ∂ξ α
= δβα − 0β (x0µ − ξ µ ) µ
∂x ∂x
= δ α β − ξ α 0β . (7.51)
0 ∂xα ∂xβ
gµν = gαβ
∂x0µ ∂x0ν
= gµν − 2ξ(µ,ν) (7.52)
270
do qual segue-se que o tensor de Ricci passa a ter a forma
1 α
ψ ν,µα + ψ αµ,αν − hµν ,
Rµν = (7.55)
2
enquanto que o escalar de curvatura resulta ser
1 να
R= 2ψ,αν − h . (7.56)
2
Desta maneira, o tensor de Einstein passa a ser escrito como
1 α
+ ψα − ψµν − ηµν ψ αβ
Gµν = ψ ν,µα µ,αν ,αβ (7.57)
2
A Eq.(7.57) pode ser então reduzida a uma equação de onda se impusermos a condição
que
ψ µ ν,µ = 0 , (7.58)
ou equivalentemente
1
hµν,µ = h,ν . (7.59)
2
CORREGIR
O calibre definido pela Eq.(7.59) é conhecido como calibre de Einstein, Hilbert, de
Donder, ou Fock. É interesante notar como muda este calibre sob uma transformação
de coordenadas do tipo
hµν −→ h0µν = hµν − 2ξ(µ,ν) . (7.60)
O calibre da Eq.(7.59) neste caso toma forma
0
ψµν = ψµν − 2ξ(µ,ν) + ηαβ ξ µ ,µ . (7.61)
ψ 0µ ν = ψµ ν − 2ξ µ( , ν) + δ µν ξ σ ,σ . (7.62)
A Eq.(7.64) não fixa o calibre univocamente visto que sempre poderemos realizar
transformações adicionais com a outra parte da igualdade, isto é, com ξµ , o que
permitirá manter ψ µν,µ do jeito que era.
Desta maneira, as equações de Einstein em presença de matéria tomam a forma
ψµν = −16πTµν ,
(7.65)
271
enquanto no vácuo escrevem-se
hµν = 0 . (7.66)
Podemos propor uma solução de onda para a Eq.(7.66) do seguinte tipo
α
ψµν = Aµν eikα x , (7.67)
onde o quadri-vetor kα respresenta as componentes constantes de algum tipo de 1-
forma, e Aµν define as componentes constantes de algum tensor simétrico. Assim
sendo, a Eq.(7.66) pode-se escrever na seguinte forma
kα k α ψ µν = 0 . (7.68)
Esta condição só pode ser satisfeita se kα k α = 0, isto é, se kα é um vetor nulo. Portanto,
para um valor de xν k ν constante teremos uma hipersuperficie em que hµν é constante,
tal que
kα xα = k0 t − kx = constante . (7.69)
Por convenção , passaremos a nos referir a k0 como a frequência da onda após a
decomposição (3+1) espaço-temporal
kα −→ (ω, k) . (7.70)
Uma vez que o vetor kα é nulo, nos temos
k α kα = k 0 k0 − k i ki = 0
k 0 k0 = k i ki
ω 2 = |k|2 . (7.71)
Esta equação define a relação de dispersão para essa onda. Note ainda que a velocidade
de fase da onda é c = 1! (nestas unidaes), bem como sua velocidade de grupo.
272
7.4.1 O calibre transverso-sem-traço
Até agora só impusemos uma restrição sobre a Eq.(7.66). Portanto, se lembrarmos
agora que a outra parte da restrição tinha relação direita com o vetor ξ, o qual satisfaz
uma equação de campo igual á Eq.(7.66), podemos então impôr algum outro tipo de
restrição sobre o próprio vetor ξ. Desta maneira,
ξµν = 0. (7.75)
onde kα é um vetor de onda nulo, e Bµ é uma constante. Viu-se acima que isto produz
uma mudança em hµν dada por
0
ψµν = ψµν − ξµ,ν − ξν,µ + ηµν ξ α ,α . (7.78)
Se escolhermos Bµ de tal maneira que possamos impôr sobre Aµν o seguinte par de
restrições
onde uν é um quadri-vetor velocidade fixo, isto é, qualquer vetor tipo-tempo unitário
que nos quisessemos escolher.
O conjunto de equações (7.80,7.81) é chamado vı́nculo transverso-sem-traço, ou T T .
Notemos que tanto a condição do traço nulo bem como a Eq.(7.54) implicam que
1
ψµν = hµν − ηµν h
2
TT TT TT
ψµν = hµν = hµν . (7.82)
273
Neste referencial vamos escolher o eixo ordenado z tal que
k −→ (ω, 0, 0, ω) . (7.84)
Aµ ν = 0
Ax x + Ay y = 0
Axx = −Ayy . (7.86)
Analisando esta matriz vemos que só duas de suas componentes são linearmente in-
dependentes.
Consideremos a seguir o que aconteceria a uma partı́cula que fosse atingida por uma
onda gravitacional na TGR, no caso uma onda se propagando na direção do eixo z.
Vamos supôr que a partı́cula está inicialmente em uma região livre de ondas. Se escol-
hermos o referencial de Lorentz, no qual a partı́cula está inicialmente em repouso, o
calibre T T associado a este sistema de referência cuja quadri-velocidade é uα , será tal
que a partı́cula obedece a equação geodésica para uma partı́cula livre, i. e.,
duα
+ Γα µν u
µ ν
u = 0. (7.87)
dτ
Lembrando que a partı́cula esta inicialmente em repouso, segue-se que
α
du
= −Γα µν δ0µ δ0ν (7.88)
dτ τ =0
1
= −Γα 00 = − η αβ (hβ0,0 + h0β,0 − h00,β ) , (7.89)
2
mas sabemos também que A0α=0 , portanto
α
du
= 0. (7.90)
dτ τ =0
Isto significa que a partı́cula sempre permanecerá em repouso uma vez que tal
condição seria mantida para qualquer outro instante de tempo. Entretanto, embora
274
estar em repouso signifique que a partı́cula mantém sua posição coordenada constante
com tempo, não podemos dar uma interpretação simples a tal fato já que ao fazermos
a escolha do calibre T T nos definimos um sistema coordenado que permanece fixo ás
partı́culas, individualmente.
Para se ter uma melhor idéia do que acontece, vamos considerar duas partı́culas (ambas
em repouso): uma na origem do sistema coordenado e a outra na posição x = . Além
disso, vamos supôr que y = z = 0. Portanto, ambas as partı́culas estarão fixas
em suas posições coordenadas, do qual segue-se que sua distância média é dada pela
relação
1 1 k
∆l = |gxx (x = 0) | 2 = (1 − khxx ) 2 = 1 − Axx cos (ωt) . (7.91)
2
Isto mostra que a distância própria entre as duas partı́culas muda com o tempo.
As partı́culas permanecem em repouso relativo respeito de suas coordenadas, mas as
coordenadas mesmas oscilam em relação a uma fita métrica.
Uma maneira alternativa de se entender este proceso seria observar o desvio geodésico
entre as duas partı́culas, quando conectadas por um vetor ξ µ (sendo µ = 0, 1, 2, 3 ou
t, x, y, z ) que obedece a equação
d2 ξ α
= Rα µνβ u
µ ν β
u ξ . (7.92)
dτ 2
Neste caso, esta caracterı́stica pode se escrever ξ β −→ (0, , 0, 0), e portanto
d2 ξ
= Rα 00α ξ
α
= −Rα 0α0 ξ
α
= −Rx 0x0 . (7.93)
dτ 2
Lembrando a (Eq.7.36) temos que
1 T
Rx 0x0 = Rx0x0 = − hTxx,00 (7.94)
2
1 TT
Ry 0x0 = Ry0x0 = − hxy,00
2
1 T
Ry 0y0 = Ry0y0 = −Rx0x0 = − hTyy,00 , (7.95)
2
o qual indica que as partı́culas afastadas ao longo do eixo x tem um vetor deslocamento
ξ µ que satisfaz a relação
d2 ξ α ∂ 2ξ1 1 ∂ 2 hxx
= =
dτ 2 ∂t2 2 ∂t2
∂ 2ξx 1 ∂ 2 hxy
= (7.96)
∂t2 2 ∂t2
Entretanto, se as partı́culas estivessem afastadas ao longo do eixo y teriamos que
∂ 2ξ2 1 1 ∂ 2 hxx
= hyy = −
∂t2 2 2 ∂t2
∂ 2ξy 1 ∂ 2 hyx
= . (7.97)
∂t2 2 ∂t2
275
Figura 7.2: Deformação sofrida por um “anel” de partı́culas em repouso quando é atingido
por uma onda gravitacional.
O formalismo descrito acima pode nos ajudar a descrever a polarização da onda grav-
itacional. Para tal feito, consideremos um anel de partı́culas inicialmente em repouso
no plano x, y. Neste caso, h21 = hxy = h12 = 0, e o elemento de linha será
Observemos o que acontece com as duas partı́culas que inicialmente tem coordenadas
(x0 , y0 ) e (x0 + dx, y0 ). Tomando o elemento de linha
e considerando hxx como uma função oscilatória, vemos que quando hxx passa de
hxx = 0 para hxx ≥ 0, as partı́culas se afastam entre si, e viceversa, quando hxx
passa de hxx = 0 para hxx ≤ 0, elas tendem a se juntar. Uma situação análoga
deverá acontecer se considerassemos as partı́culas com (x0 , y0 + dy). Assim, se uma
onda plana propaga-se na direção z, e incide sobre um anel de partı́culas no plano
x, y, o anel vai se distorcer formando uma elipse pulsante cujo eixo maior gira até
ficar paralelo inicialmente ao eixo x, e posteriormente ao eixo y. Define-se este tipo de
polarização como polarização +.
Analisemos agora o que acontece quando hyx = hxy = h12 = h21 6= 0. Neste caso, o
elemento de linha é
Efetuando uma transformação de coordenadas que faz rodar os eixos coordenados por
276
π/4 radianos no plano x, y obtemos
1
y −→ y 0 = √ (y + x)
2
1
x −→ x0 = √ (y − x) . (7.101)
2
de forma que o elemento de linha passa a ser
Comparando este com o elemento de linha da Eq.(7.99) percebe-se que são os mesmos
elementos de linha, e que por tal motivo causam idênticos efeitos que hxx , mas após
uma rotação de 45 graus dos eixos coordenados, ou equivalentemente, a uma defasagem
de π/4. A este tipo de polarização se denomina polarização ×.
Para concluir, note-se que uma onda gravitacional é em geral uma superposição dos
dois modos de polarização + e ×.
Para se descrever a emissão de OGs durante a fase de impulsão inicial de pulsar, que é
acelerado a alta velocidade na Galáxia, durante por exemplo, uma explosão supernova,
podemos começar por linearizar as equações de Einstein (conforme a gente viu acima)
277
deslocamento do pulsar é fraco (devido a sua baixa velocidade: VPSR c), pode-se
usar então a expansão métrica
Vµ (τ )Vν (τ )
h̄µν = 4 M? . (7.109)
−Vλ · [x − r(τ )]λ τ =τ0
Este resultado deve ser avaliado no tempo retardado, o qual corresponde ao tempo
de interseção de rα (τ ) com o cone-de-luz passado do observador. Note que é este
fator −Vλ · [x − r(τ )]λ ; que depende da velocidade no denominador da Eq.(7.109),
que é responsável pela caracterı́stica da amplitude de ser não-evanescente, a chamada
“memória” do sinal de OG produzido pelo lançamento do pulsar à sua trajetória atual.
Esta perturbação métrica pode ser rescrita no ‘gauge’ de Lorentz, passando a ter a
forma
1
hµν = h̄µν − ηµν h̄αα ; (7.110)
2
ou equivalentemente
4 M? 1
hµν = Vµ (τ )Vν (τ ) + ηµν . (7.111)
−Vλ · [x − r(τ )]λ 2
278
Figura 7.4: Sinais de OG emitidos: a) durante a aceleração de um pulsar e b) na ocorrência
de um ‘gamma-ray burst’. Compara-se a distribuição com o ângulo de visada do sinal de
OG produzido durante a fase inicial de aceleração de um pulsar (linha tracejada –verde),
com parâmetros: V?ave = 450 km s−1 , e distância = 10 kpc, com o sinal de OG produzido
por um ‘gamma-ray burst’ (linha sólida–vermelha), como uma função do ângulo que o
jato forma com a linha de visada, e com parâmetros: Eave = 1051 erg, γ = 100, à distância
= 1 Mpc. Notável resulta a localização do máximo em cada curva.
279
frequência observada da OG é deslocada para o azul na direção para diante, e portanto
o fluxo de energia carregado pelas OGs é também colimado na direção para frente.
Ainda mais notável, no caso dos RAPs, é que o sinal de OG terá seu máximo para
ângulos de visada θ ∼ π/2, isto é, para o movimento do pulsar puramente no plano
do céu, conforme ilustrado na Fig.7.4.
Similarmente,
1
I¯yy = − µa2 cos 2φ + Constante. (7.117)
2
1
I¯xy = I¯yx = µa2 sen2φ. (7.118)
2
Visto que φ = Ωt, onde ω é a frequência angular orbital, encontramos usando a terceira
lei de Kepler,
GM
Ω2 = 3 , com M ≡ M1 + M2 , (7.119)
a
que a luminosidade em OGs emitida pelo sistema vem dada por
3 ¯
d (Iij ) d3 (I¯ij )
G
LOG = (7.120)
5 c5 dt3 dt3
G 6 1 2
= 5
(2Ω) µa sen2 2Ωt + sen2 2Ωt + 2 cos2 2Ωt (7.121)
5c 2
32 G4 M 3 µ2
= . (7.122)
5 c 5 a5
1 dP 3 da
= , (7.125)
P dt 2a dt
3 1 dE
= (7.126)
2a E dt
96 G3 µM 2
= − . (7.127)
5 c 5 a4
281
Com base na análise precedente pode-se demonstrar que as relações acima são válidas
quando a −→ 0, de maneira que o tempo T0 transcorrido até a −→ 0 é dado por
(Peters & Mathews 1964)
5 c5 a4atual
T0 = . (7.128)
256 G3 µM 2
Entretanto, usando a Eq.(7.28), que define o momento angular radiado na forma de
OGs, pode-se mostrar que para órbitas circulares
dJ 32 G7/2 µ2 M 5/2
=− , (7.129)
dt 5 c5 a7/2
de maneira que a perda de energia e de momento angular satisfazem a condição
dE dJ
=Ω . (7.130)
dt dt
Esta última relação indica que uma órbita circular permanece circular enquanto as
estrelas do sistema binário se aproximam entre si.
Por outro lado, se as duas massas estão em órbita elı́ptica com excentricidade e, e se
calcularmos a média das grandezas dE
dt
e dJ
dt
, para uma única órbita, obtemos (Peters
& Mathews 1964)
dE dE
= f (e), (7.131)
dt dt e=0
dJ dJ
= g(e), (7.132)
dt dt e=0
73 2 37 4 −7/2
f (e) = 1+ e + e 1 − e2 , (7.133)
24 96
7 2 −2
g(e) = 1+ e 1 − e2 . (7.134)
8
Uma vez que as Eqs.(7.119) e (7.123) são válidas para órbitas elı́pticas, a Eq.(7.125)
se transforma em
1 dP 96G3 µM 2
=− 5 f (e). (7.135)
P dt 5c a4
Atualmente, a evidência mais forte da existência das ondas gravitacionais proviene dos
estudos da órbita do primeiro pulsar binário descoberto em observações astronômicas.
Este feito foi logrado por J. Taylor & R. Hulse em 1974. O sistema hoje é chamado o
pulsar de Taylor & Hulse ou PSR 1913 + 16 (suas coordenadas celestes).
Imediatamente após sua descoberta, estes pesquisadores perceberam que mudanças
aparentes na frequência do pulsar poderiam ser explicadas pelo efeito Doppler devido
282
ao movimento orbital ao redor de uma companheira invisı́vel com perı́odo de 7h:45’. A
presença de um relógio de altı́ssima precisão, o pulsar, movendo-se a uma velocidade
de ∼ 300 km s−1 através do campo gravitacional da companheira causou uma ‘onda’
de atividade na comunidade relativı́stica. A Natureza teria fornecido um sistema as-
trofı́sico no qual poderiam se testar, muito além dos limites fornecidos pelos estudos
de dinâmica pós-newtoniana (PPN) no Sistema Solar, vários outros efeitos previstos
pela TGR. Na prática, estes efeitos são procurados através do estudo dos tempos de
chegada dos pulsos emitidos pelo pulsar.
Para entendermos melhor esta análise, suponhamos que M1 seja a massa do pulsar e
M2 a de sua companheira. Se supormos que eles são astros esféricos, então na ordem
mais baixa (gravidade Newtoniana) eles se movem em órbitas elı́pticas ao redor de
seu centro de massa comum. Se supormos que a órbita está no plano x − y, com sua
origem no centro de massa, a inclinação do plano orbital em relação à linha de visada
será i. Podemos ainda supôr que o eixo x está orientado ao longo da linha de nós, ou
seja, a linha que passa através da origem ao longo da intersecção do plano orbital com
o plano perpendicular à linha de visada (ver Figura 7.7). Seja ω a distância angular do
periastro a partir do nó, medido no plano orbital. Com estas definições , a posição do
pulsar a qualquer instante é dada por
onde
a1 (1 − e2 )
ψ = ω + φ, r1 = . (7.137)
1 + e cos φ
O ângulo φ, a coordenada polar medida a partir do periastro, é chamada de anomalia
verdadeira, na mecânica celeste.
A razão entre o perı́odo emitido pelo pulsar e aquele recebido pelo observador, pode-se
escrever como
283
Figura 7.7: Órbita do Pulsar Binário PSR J0737-3039A,B conforme vista da Terra. Note
que o pulsar binário PSR 1913+16 apresenta uma configuração similar, mas sua geome-
tria é muito diferente. [Original de Dunc Lorimer, in the 19th European Cosmic Rays
Symposium (10/09/2004)].
284
onde ~n é um vetor unitário que aponta da terra ao emissor. Assim, a Eq.(7.138) se
transforma (até ordem (V 2 )) e (M/r)) em
" #
∆t|rec ~
V1 · ~n 1 V12 GM2
= 1+ + + . (7.141)
∆t|em c 2 c2 rc2
Agora, note que da Figura 7.7 se tem ~n = ~ez0 = cos i~ez + seni~ey . Desta forma, a
Eq.(7.136) conduz a
V~1 · ~n = (r1 senψ + r1 ψ̇ cos ψ)seni. (7.142)
onde
2πa1 seni
K≡ . (7.145)
P (1 − e2 )1/2
A análise apresentada até agora é exatamente a mesma que é feita para uma binária
espectroscópica de uma ‘única-linha’, com a importante diferença de que ∆t|em , não
sendo de uma linha espectral, não resulta ser conhecido. Assim, qualquer termo con-
stante do lado direito da Eq.(7.141) não é mesurável: ele é simplesmente absorbido em
∆t|em . Em particular, uma velocidade uniforme entre o centro de massa do sistema
solar e o centro de massa do pulsar não é mesurável. (O movimento orbital da Terra
introduz um efeito Doppler que deve ser substraı́do usando a velocidade, conhecida,
da Terra no sistema solar).
A partir do termo Doppler de primeira ordem, os seguintes parâmetros podem ser
encontrados: e e P através da Eq.(7.143), que quando integrada dá φ(t), e também K
e ω a partir dos dois termos independentes, que variam com o tempo, proporcionais
a cos φ e senφ na Eq.(7.144). A partir de K obtém-se a1 seni, e a partir de P e a1 seni
se obtém a função de massa introduzida no Cap.??, Sec. 9.7 .
285
e também
GM2 GM22
= . (7.149)
r (M1 + M2 )r
Além do que, pela terceira lei de Kepler
2π 2 GM23
( ) = , (7.150)
P (M1 + M2 )2 a31
obtém-se
1 2 GM2
V + = β cos φ + Constante, (7.151)
2 1 r
onde foi definido
GM22 (M1 + 2M2 ) e
β≡ . (7.152)
(M1 + M2 )2 a1 (1 − e2 )
Note que o teorema do virial implica que só mais uma nova variável apareceria se
usarmos o redshift gravitacional e o efeito Doppler, ambos de segunda ordem. Contudo,
note -se que a dependência temporal na Eq.(7.151) é exatamente a mesma daquela do
termo de primeira ordem K cos ω cos φ na Eq.(7.144). Mais peculiar ainda, note que
para movimento elı́ptico o parâmetro β não é mensurável! E então, como fica esta
questão ?
Felizmente, a relatividade geral salva a gente desta ‘encrucilhada’ ! A órbita não é
exatamente uma elipse. Ela ‘deriva’ ou precessiona! com o avanço do periastro sendo
dado por
6πGM2
ω̇ = . (7.153)
a1 (1 − e2 )P c2
A média de ω̇ é ∼ 4.20 por ano para o pulsar binário. Este valor pode comparar-se
00
aos ∼ 43 por século para o planeta Mercúrio! Assim, se fizermos ω −→ ω0 + ωt
na Eq.(7.144), teremos agora quatro combinações trigonométricas de φ e ω̇t indepen-
dentes, que variam com o tempo. Portanto, mediante observações do PSR 1913 + 16,
em uma escala temporal de anos poderá se separar K, ω0 , ω̇ e β. Em particular, ω̇ e
β envolvem duas combinações diferentes dos quatro parâmetros M1 , M2 , a1 e seni, a
partir da função de massa, e a1 seni. Em conclusão, medições de ω̇ e β permitem uma
solução completa para os parâmetros do sistema binário.
Agora, considere a Eq.(7.153) para Ṗ de um sistema binário. Uma vez que todos
os parâmetros orbitais são conhecidos, podemos predizer um valor para Ṗ . Se este
concordar com o valor medido, teriamos por força confirmado a existência das ondas
gravitacionais !!
Uma ampla gama de outros efeitos astrofı́sicos poderiam também produzir uma
variação do perı́odo orbital do pulsar binário com magnitude similar á observada.
Contudo, a moderna análise de todos estes possı́veis efeitos tem demonstrado que ou
eles não agem neste sistema ou sua contribuição é excessivamente pequena como para
concorrer com as predições da relatividade geral [ver Taylor (2003) para uma revisão
completa desta questão fundamental].
286
Figura 7.8: Parâmetros da órbita do Pulsar Binário (PSR 1913 + 16) medidos pelo grupo
de J. H. Taylor. T0 é a época, ou origem do tempo para as medições . Os números entre
parentesis representam a incerteza nos últimos dı́gitos. (Tabela original publicada por
Clifford M. Will em ‘The Living Reviews on General Relativity’).
Na medida em que a precisão do ‘timing’ melhora, resulta possı́vel medir outros efeitos
relativı́sticos. Dentre estes, o atraso-temporal de sinais que atravessam a órbita em
caminho à Terra, são efeitos hoje já medidos com sondas espaciais no sistema solar.
Além disto, existem vários desvios periódicos pós-Newtonianos do movimento elı́ptico,
ainda não verificados no sistema solar. Na relatividade geral cada um destes termos
contém uma combinação desconhecida de M1 , M2 , a1 e seni. Enquanto mais e mais
destes termos sejam medidos (hoje sabemos quantos destes termos foram efetivamente
medidos) e se eles concordam com as predições da relatividade geral, então o argu-
mento em favor da relatividade geral, e das ondas gravitacionais, em particular, se
tornará cada vez mais incontestável.
O pulsar binário tem sido observado durante mais de trinta anos por J. Taylor e
seus colaboradores, sendo a precisão das observações cada vez maior. O valores atuais
dos vários parâmetros do sistema aparecem na Tabela apresentada na Figura 7.8. A
grandeza γ, um dos parâmetros pós-Newtonianos, está relacionada com β, o segundo
287
parâmetro PPN, através da condição
βP (1 − e2 )
γ≡ . (7.154)
2πc2
O efeito de atraso temporal e os efeitos orbitais pós-Newtonianos são muito bem
conhecidos hoje (ver Tabela da Figura 7.8). Note, entretanto, que a Eq.(7.153) pode
rescrever-se como
6πGM2 seni
ω̇ = (7.155)
a1 seni(1 − e2 )P c2
5/3
3G2/3 (M1 + M2 )2/3
2π
= (7.156)
(1 − e2 )c2 P
Usando o valor medido de ω̇ dado na Tabela da Figura 7.8, junto com os valores de
P e e, encontramos que
M1 + M2 = 2.8278(7) M . (7.157)
Ainda podemos escrever os parâmetros γ, seni, e Ṗ , que são determinados com muita
menor precisão, inserindo os valores de P , e, a1 seni, e M1 + M2 . A Eq.(7.154) se
transforma em
1/3
G2/3 M2 (M1 + M2 )e P
γ= = (0.0007344 s)M2 (2.8278 + M2 ), (7.158)
(M1 + M2 )4/3 2π
com M2 medido em massas solares (M ). A terceira lei de Kepler, Eq.(7.150), produz
2/3
2π (M1 + M2 )2/3 a1 seni 1.019
seni = 1/3
= , (7.159)
P G M2 M2
enquanto que a Eq.(7.153) leva a
192πG5/3 M1 M2 f (e)
2π 5/3
Ṗ = − 5 1/3
) (7.160)
5c (M1 + M2 ) P
= −1.202 × 10−12 M2 (2.8278 − M2 ). (7.161)
288
Figura 7.9: Evolução da órbita do Pulsar Binário (PSR 1913 + 16): Deriva cumulativa
do tempo (s) de passagem pelo periastro durante 25 anos de observação , comparada
com a predição da relatividade geral para a evolução da mesma grandeza como devida
a perda de momento angular por emissão de OGs. (Versão tomada do original do site
http://astrosun2.astro.cornell.edu/academics/courses/astro201/psr1913.htm).
289
alternativas existentes para se entender sua evolução , a teoria da relatividade geral
parece ser todo o que se necessita para explicar sua dinâmica. A fórmula de quadrupólo
para a emissão de ondas gravitacionais tem sido confirmada com um erro de 0.1%!
Em conclusão: a demonstração direta da existência das OGs abrirá uma nova janela
para o Cosmo, de modo semelhante ao sucedido com a verificação em laboratório da
existência das ondas eletromagnéticas previstas por Maxwell e descobertas por Hertz.
Neste sentido, a ‘fortuna’ dos astrofı́sicos relativistas não parece ter chegado a seu
fim: em 2003 foi confirmada a observação de um novo pulsar verdadeiramente binário,
formado por duas estrelas de nêutrons! Este sistema conhecido como PSR J0737-3039
A,B, conforme já referido anteriormente, constitui-se num laboratório ainda melhor
para a realização de testes das teorias da gravitação . A Natureza parece continuar a
nos providenciar O Laboratório Ideal!
290
detectadas. Isto aumenta enormemente, num fator de 8, o volume do universo para o
qual as fontes são mesuráveis.
Finalmente, em muitos casos a astronomia eletromagnética está baseiada em um im-
ageamento profundo de pequenos campos de visada. Assim, os observadores obtém
uma grande quantidade de informação sobre as fontes em uma pequena parcela do
céu. Oposto a isto, a astronomia de OGs será uma ‘affair’ de quase o céu inteiro! Os
detectores de OGs tem uma cobertura de quase 4 π stereoradianos de sensibilidade
a eventos no céu. Isto significa que um detector moderno tem uma capacidade não
muito boa de localizar uma fonte no céu com base nos padrões astronômicos, mas
ao mesmo tempo isto significa que qualquer fonte no céu poderá ser detectável, não
somente aquela para o qual o instrumento está apontado! Este contraste entre sen-
sibilidade de céu inteiro mas uma pobre resolução angular dos observatórios de OGs,
e a resolução angular, pontuada dos telescópios é muito semelhante ao contraste de
resolução angular do ouvir e enxergar, o que reforça ainda mais a utilidade da analogia
das OGs com o som.
Para terminar, lembramos que o espectro de frequências (fGW ) das OGs divide-se, na
perspectiva de sua detectabilidade no futuro ‘próximo’, em a) OGs de alta frequência,
se
10 Hz < fGW < 104 Hz, (7.163)
que corresponde a banda de sensibilidade de observatórios de OGs já opera-
cionais como o ‘Laser Interferometric Gravitational-Wave Observatory’ (LIGO,
http://www.ligo.caltech.edu/LIGO web/about/), e seus similiares VIRGO, GEO-600,
TAMA-300, e AIGO (também já operacionais), e b) OGs de baixa frequência, se
291
7.10 Exercı́cios
1. Usando a Eq.(??) e a condição da Eq.(??), obter a Eq.(7.106).
2. Calcule a potência total radiada por um pulsar de uma massa solar, e 10 km de
raio, que é impulsado do repouso até alcançar uma velocidade final de 10.000
km/s em 0.02 µas de distância. Qual é a amplitude do sinal de OG emitido neste
processo? Qual sua frequência?
3. Mostre que usando a relação para a órbita elı́ptica
2EJ 2
e2 = 1 + , (7.166)
G2 µ3 M 2
se conclue que a emissão de OGs tende a circularizar uma órbita elı́ptica ! Isto
é, mostre que de/dt < 0.
4. Verifique a relação expressa na Eq.(??) .
5. usando a relação de Peters & Mathews (1964)[6], descrita na seção do pulsar
binário, i.e., Eq.(7.125), determine a escala temporal para a coalescência ou co-
lisão entre as estrelas componentes da binária de Taylor & Hulse devido á emissão
adiabática de OGs.
6. Sugere-se ao leitor mais dedicado ao estudo deste curso completar as passagens
analı́ticas formais faltantes no processo estudado na Seção Ondas gravita-
cionais emitidas por massas aceleradas: Pulsares
292
Capı́tulo 8
Astropartı́culas I
Sergio E. Jorás1
8.1 Introdução
293
laboratório terrestre, mas a quantidade de informação adquirida não pára de crescer
ainda hoje, mesmo depois de bilhões de anos de realizada.
Na seção 8.2 veremos como o estudo das forças forte e fraca propiciaram a classi-
ficação das partı́culas elementares segundo o modelo padrão adotado atualmente. Na
seção 8.3, estudaremos os elementos básicos que nos ajudarão a entender a abordagem
matemática da classificação padrão. Na seção 8.4 faremos uma rápida introdução à
Teoria de Campos, que é o formalismo moderno para descrição das interações. To-
dos os aspectos serão colocados em conjunto na última seção deste capı́tulo, onde
estudaremos a história térmica do universo — veja também o capı́tulo 2.
Nesta seção estudaremos as forças nucleares e os métodos usados para classificar dois
importantes grupos de partı́culas elementares: os quarks e os léptons.
294
Q B S Y
u +2/3 1/3 0 1/3
d -1/3 1/3 0 1/3
s -1/3 1/3 -1 -2/3
Tabela 8.1: Números quânticos – carga elétrica, bariônico, estranheza e hipercarga, re-
spectivamente – dos três quaks mais leves.
295
MÉSONS BÁRIONS
π+ : ud¯ p+ : uud
π− : dū n: ddu
q
0
π : 1
(uū ¯ Σ+ :
− dd) uus
2
.. ..
. .
outras partı́culas neutras responsáveis pelas suas interações. Um elétron com energia
suficiente poderia arrancar um párton do núcleo, e os pedaços da colisão se mate-
rializariam como jatos de hádrons. No referencial do projétil, a dilatação temporal
diminui a taxa de interação entre os pártons, o que justifica considerá-los pratica-
mente livres durante o processo de colisão. Este comportamento se traduz experimen-
talmente através da análise das seções de choques, que diferiam daquelas esperadas
para partı́culas puntiformes [2]:
dσ dσ
= |F (~q)|2 , (8.3)
dΩ exp dΩ punt
onde q é o momento linear transferido pelo projétil e o fator de forma F (~q) indica a
distribuição de carga ρ(~x) no alvo (se ignorarmos seu recuo):
Z
F (~q) = ρ(~x) e−i~q·~x d3 x . (8.4)
296
Figura 8.1: Fatores de forma relativı́sticos F2 (q) em função da fração x do momento do
próton carregada por cada partı́cula constituinte, para diversos modelos de composição
do próton: (a) sem estrutura interna; (b) composto por 3 partı́culas elementares livres;
(c) por 3 partı́culas interagentes e (d) como o anterior, mas na presença de um mar de
quarks.
mais leves, cujas massas são muito menores que a dos outros. Aliado aos resultados
animadores do modelo de pártons, este modelo abriu o caminho para a classificação
das partı́culas elementares descrita na seção 8.2.3.
Resta ainda um ingrediente fundamental: Todos os quarks são férmions, isto é, têm
spin fracionário, enquanto os bárions podem ter spin inteiro (sendo classificados então
como bósons) ou não. A conseqüência básica desta caracterı́stica4 e que nos interessa
é que os férmions obedecem à estatı́stica de Fermi-Dirac — enquanto que os bósons
obedecem à estatı́stica de Bose-Einstein; daı́ seus nomes. Ou seja, os férmions seguem
o Princı́pio de Exclusão de Pauli: não podem ocupar o mesmo estado quântico simul-
taneamente, ao contrário dos bósons, que podem formar os chamados Condensados
de Bose-Einstein, estado no qual todas as partı́culas estão no mesmo estado funda-
mental. A existência da ressonância ∆++ , formada por três quarks up, apontou um
problema: como três quarks idênticos podem ocupar o estado fundamental, sendo
férmions? A saı́da foi acrescentar um novo número quântico, de tal forma que cada
quark ocupasse um estado diferente, obedecendo, assim, o Princı́pio de Exclusão de
Pauli. Dito de outra forma, o estado fundamental é triplamente degenerado. Este novo
número quântico recebeu o nome de cor, que, obviamente, não tem relação alguma
com as faixas do espectro eletromagnético visı́vel. Assim, na ressonância ∆++ , um
quark ocupa o estado vermelho, outro o estado azul e outro, o verde. O conjunto como
um todo — tal qual um disco de Newton — é branco: ou seja, a ressonância ∆++
não possui cor. Mésons, formados por um quark e um anti-quark, também devem
ser brancos. Para isso, deve-se sempre agrupar uma cor com sua anti-cor: vermelho
4
Ver Teorema Spin-Estatı́stica [3].
297
Figura 8.2: Criação de um par quark-antiquark na tentativa de separação do par já
existente.
298
conservado. A helicidade é definida como a projeção do spin na direção do momento
linear da partı́cula em questão. Para partı́culas sem massa, ela só pode assumir os
valores ±~/2. De acordo com o sinal, diz-se que a partı́cula é de “mão direita” (helici-
dade positiva) ou “mão esquerda” (negativa). Pode-se mostrar que a interação eletro-
magnética também conserva a helicidade em altas energias. A simetria entre partı́culas
de helicidades opostas é chamada de paridade. A interação fraca, no entanto, quebra
esta simetria: apenas neutrinos de mão esquerda (e anti-neutrinos de mão direita)
se acoplam a léptons carregados através desta interação. Os (anti-)neutrinos com he-
licidade “errada”, portanto, não podem interagir e não são observados. Até hoje as
experiências concordam com este modelo, mas ele só é válido para o caso de neutrinos
sem massa. De outra forma, poder-se-ia realizar uma transformção de Lorentz para um
referencial onde o momento do neutrino teria o sinal oposto, e também a helicidade.
Isto seria equivalente a transformar um neutrino de mão esquerda em um de direita,
e vice-e-versa.
O passo natural que se seguiu foi, como antes, a ampliação da simetria através da in-
clusão do quark c, de “charmoso” 5 . De fato, o estudo de colisões elétron-pósitron con-
firmou sua existência em 1974. 6 O novo quark c foi necessário para explicar alterações
na esperada estrutura de jatos ao atingir-se a energia necessária para sua criação. Os
férmions conhecidos até então podiam ser dispostos em 2 famı́lias de dubletos7 :
! !
e− µ−
νe νµ
L L
, (8.5)
! !
u c
d s
onde o ı́ndice L lembra que apenas estados de mão esquerda participam da in-
teração. Transições entre os membros de cada dubleto acontecem através da força
fraca. Esperava-se, portanto, transições apenas entre os quarks u e d e entre c e s.
Havia, no entanto, um contra-exemplo:
Foi necessário, então, admitir que a interação fraca acoplava quarks “rotacionados”:
! !
u c
e , (8.7)
d0 s0
5
Do inglês charm.
6
O leitor atento pode-se perguntar como se obtém quarks a partir da colisão de elétrons, que não são
formados por eles. Na verdade, o uso de partı́culas elementares como elétrons facilita muito os cálculos
e a interpretação dos resultados: a aniquilação de um par e− − e+ pode gerar energia suficiente para a
criação de um par q − q̄ e daı́, jatos de hádrons.
7
E nos singletos de “mão-direita” e− −
R , µR .
299
onde
0
d =
d cos θc + s sin θc
(8.8)
0
s = −d sin θc + s cos θc .
Aqui faremos uma rápida descrição da classificação atual das partı́culas elementares,
antecipando alguns resultados que serão discutidos mais adiante.
As partı́culas elementares podem ser classificadas em dois grandes grupos: os léptons
e os hádrons. Pode-se ainda falar em um terceiro grupo, formado pelos chamados
campos de gauge, responsáveis pela propagação das interações entre as partı́culas dos
dois primeiros grupos. A caracterı́stica fundamental dos léptons é não interagirem
através da força nuclear forte. Os léptons são formados por três famı́lias (ou sabores),
8
Do inglês bottom.
9
Do inglês top.
300
cada uma com dois participantes: a primeira, mais leve, é formada pelo elétron (e)
e pelo neutrino a ele associado (νe ). A segunda, pelo muon (µ) e seu neutrino (νµ );
a terceira, pelo tauon (τ ) e seu neutrino (ντ ). Os primeiros membros de cada famı́lia
tem cargas elétricas iguais entre si, enquanto que os outros são, como o próprio nome
indica, neutros.
! ! !
e µ τ
, eR , µR , τR (8.9)
νe νµ ντ
L L L
Os membros da primeira linha dos dubletos são massivos, e há fortes indı́cios exper-
imentais de que os neutrinos também o sejam. Os seis quarks existentes receberam
nomes exóticos como up, down, charm, strange, top e bottom e também são ordenados
em 3 famı́lias, em ordem crescente de massa:
! ! !
u c t
(8.10)
d s b
Os membros da primeira linha têm carga elétrica positiva, igual em módulo a 2/3 da
do elétron — que não é, portanto, a carga elétrica fundamental — e os da segunda
linha, carga negativa igual a −1/3e. Os hádrons são formados pelos quarks, sempre em
grupos de dois ou três, caracterizando os chamados mésons e bárions, respectivamente.
Os bárions presentes na matéria comum — prótons e nêutrons — são formados por
combinações apenas dos dois quarks mais leves. Assim, para conseguirmos uma carga
elétrica igual (em módulo) à do elétron para o próton, temos que combinar dois quarks
up e um down. Para anular a carga elétrica total do nêutron, basta juntarmos um up
e dois down.
Reações nucleares devem conservar os chamados “bons” números quânticos, como a
carga elétrica total Q e o número de léptons (ou leptônico) L. Por exemplo, um nêutron
(Q = 0, L = 0) decai em um próton (Q = +1, L = 0) emitindo um elétron (Q = −1,
L = 1) e um anti-neutrino do elétron (Q = 0, L = −1). Deste modo, podemos prever
a existência de um anti-neutrino ao invés de um neutrino como sub-produto desta
reação.
n −→ p + e + ν̄e
Q : 0 = +1 −1 +0 (8.11)
L: 0 = 0 +1 −1
Os campos de gauge, como já mencionado, são responsáveis pela interação entre os
léptons e hádrons. Assim, a força eletromagnética é intermediada pelo fóton (γ), en-
quanto que a força nuclear fraca o é pelos bósons vetoriais Z o e W ± . 10 O fóton, por não
10
Na verdade, como veremos mais adiante, pode-se descrever estas duas forças através do mesmo
formalismo matemático, o que significa que são apenas aspectos diferentes da mesma interação, conhecida
como eletrofraca [6]. O mesmo raciocı́onio nos leva a falar da força eletromagnética, mesclando seus
aspectos elétrico e magnético.
301
ter carga, não interage consigo mesmo e é o único bóson interagente sem massa. Já as
partı́culas responsáveis pela interação forte, os glúons, carregam 2 cores, e, portanto,
interagem entre si.
Até hoje, os léptons e os quarks não mostraram sinais de uma estrutura interna e, por-
tanto, até resultados em contrário, podem ser considerados partı́culas verdadeiramente
elementares ou fundamentais.
8.3.1 Definições
A0 · Ai = Ai · A0 = Ai , ∀Ai (8.12)
302
são obrigatórios em um grupo. Se a composição de quaisquer dois elementos de um
grupo independe da ordem destes elementos, isto é, se
Ai · Aj = Aj · Ai ∀{Ai , Aj } ∈ G , (8.14)
Aa = Ab · Ac ⇒ a = f (b, c) . (8.15)
8.3.2 Exemplos
Vamos nos concentrar em alguns grupos especı́ficos para fixar os conceitos introduzidos
e facilitar a explicação de novos.
303
É fácil verificar que esta operação obedece às regras para formar, de fato, um
grupo. A regra de composição é a soma vetorial; o elemento neutro é o vetor nulo
e o inverso, −aµ .
A variação em uma função escalar destas coordenadas provocada por uma
translação infinitesimal é
x2 + y 2 : invariante . (8.20)
304
expandindo-se a Eq. (8.21) em torno de θ = 0. A variação em cada componente
do vetor ~r é escrita
δx = −y δθ (8.24)
δy = x δθ . (8.25)
A mudança em uma função qualquer F (~r) causada por uma transformação in-
finitesimal como esta é
∂F ∂F
δF = δx + δy
∂x ∂y
∂ ∂
= δθ x −y F . (8.26)
∂y ∂x
∂ ∂
O operador X ≡ − x ∂y y ∂x
é o operador – ou gerador – de transformações
infinitesimais do grupo O(2), e corresponde ao momento angular em torno do
eixo z.
• SU(1)
Vamos investigar uma transformação especı́fica em objetos complexos z, dada
pela operação z 0 = U (θ)z, onde U (θ) ≡ exp(iθ). Este operador é obviamente
unitário, isto é,
U † = U −1 . (8.27)
O leitor pode verificar que o conjunto de operadores U (θ), com θ ∈ [0, 2π] forma
um grupo abeliano, denominado U (1). Como tem o mesmo número de parâmetros
(1) e a mesma regra de composição do grupo O(2), diz-se que estes grupos são
isomorfos.
Este é um grupo de simetria presente na Mecânica Quântica, onde o parâmetro θ
representa a fase da função de onda, inobservável [7]. Como veremos mais tarde,
esta simetria também aparece no eletromagnetismo.
• O(3)
Esta é a generalização direta do grupo O(2) para três dimensões. Este grupo é
formado pelas transformações lineares que mantém invariante a distância até a
origem:
x2 + y 2 + z 2 : invariante . (8.28)
Em notação matricial12 :
(xj )0 = Ojk xk , (8.29)
305
onde B é uma matriz anti-simétrica com apenas três elementos infinitesimais
independentes (i ), correspondentes aos três ângulos de Euler [10]:
0 −3 −2
B = 3 0 1 (8.30)
2 −1 0
Este grupo, portanto, não é abeliano. Estas regras de composição mostram que há
um espaço vetorial, associado ao grupo SO(3), cuja base é dada pelos operadores
infinitesimais Xi . As regras da mutiplicação acima mostram que este espaço é
fechado e definem sua álgebra de Lie.
Qualquer matriz ortogonal pode ser escrita como a exponencial de uma matriz
anti-simétrica:
∞
X 1
O(θ) = exp(θA) ≡ (θA)n . (8.33)
n=0
n!
Como os elementos de SO(3) são defindos por três parâmetros, qualquer matriz
O pertencente a este grupo pode ser escrita na forma
3
!
X
O = exp i θj Aj , (8.34)
j=1
0 −1 0 1 0 0 0 0 0
(8.35)
As matrizes Aj também obedecem a sua álgebra de Lie:
306
Este grupo generaliza o SO(2) para coordenadas e parâmetros complexos:
! !
x0 x
=A , (8.37)
y0 y
A = exp(iθj Hj ) j = 1, 2, 3 (8.39)
que obedecem à mesma álgebra de Lie dos elementos de O(3), dada pela
Eq. (8.36). Assim, os grupos O(3) e SU (2) são isomorfos. 14 A utilização deste
grupo leva ao tratamento espinorial, que foge ao escopo deste livro.
• SU(3)
Este é o grupo das transformações unitárias em três dimensões. A representação
matricial tem determinante 1 e (32 − 1) = 8 parâmetros livres. Tal como na
álgebra de momentos angulares em Mecânica Quântica, aqui também há apenas
dois operadores que podem ser diagonalizados simultaneamente.
Trataremos das propriedades deste grupo com mais detalhe ao discutirmos a força
forte.
307
onde D1 e D2 são matrizes m × m e n × n, respectivamente, então ele é dito com-
pletamente redutı́vel. Neste caso, o espaço gerado pelos vetores de estado ψ pode ser
separado em 2 subespaços invariantes (e, portanto, desconexos); um com dimensão m
e outro com dimensão n. O espaço pode então ser escrito como a soma direta destes
dois subespaços.
Freqüentemente, uma representação só pode ser reduzida à forma triangular, ou seja,
!
D1 T
M= . (8.42)
0 D2
0 0 g
será transformado em
ax + by
v10 = Mv1 = dx + ey , (8.45)
0
o que ilustra a invariância do subespaço gerado pelos vetores (1, 0, 0) e (0, 1, 0). O
subespaço gerado pelo vetor
0
v2 = 0 , (8.46)
z
por outro lado, não é invariante (verifique!).
Esta redução, quando permitida, indica os vetores fundamentais de cada grupo, que
estarão ligados, como veremos adiante, às particulas básicas da natureza. Para explic-
itar a relação destes grupos de simetria com a classificação das partı́culas elementares,
vamos seguir uma linha cronológica.
Até o inı́cio da década de 50, julgava-se que o núcleon seria uma partı́cula capaz de
assumir dois estados: próton e nêutron, que seriam autoestados de um certo operador
308
T1 :
T1 ψn = λn ψn : nêutron (8.47)
T1 ψp = λp ψp : prótron . (8.48)
Mésons: 3 ⊗ 3 = 6 ⊕ 3̄ = 8 ⊕ 1 (8.52)
Bárions: 3 ⊗ 3 ⊗ 3 = 10 ⊕ 8 ⊕ 8 ⊕ 1 . (8.53)
309
Como já mencionado anteriormente, atualmente sabe-se que esta simetria é apenas
aproximada. Como ela relaciona quarks de diferentes famı́lias (também conhecidas
como gerações ou sabores), ela é conhecida como flavor SU (3).
A simetria SU (3) referente à cor, por outro lado, é exata. Para diferenciá-la da anterior,
indica-se SU (3)C . As três cargas coloridas vermelho, verde e azul – ou R, G e B,
tomando suas inciais do inglês – formam uma representação fundamental deste grupo.
A analogia com cor não é perfeita, pois induz à conclusão errônea que um estado
simétrico (branco) em relação a SU (3)C pode ser definido agrupando apenas um quark
de uma cor com outro que possua a anti-cor. No entanto, é fácil ver que um estado
verdadeiramente simétrico deve conter todas as 3 cores:
q q̄ = (RR̄ + GḠ + B B̄) . (8.54)
Os geradores são 8 matrizes 3 × 3, das quais apenas 2 podem ser diagonalizadas
simultaneamente e que têm R, G e B como autoestados. Outros geradores (glúons)
atuando sobre estados (quarks) mudarão suas cores. Veja o que acontece, por exemplo,
quando o gerador λ1 atua sobre o estado R. Sendo
0 1 0 1
λ1 = 1 0 0 e R = 0 , (8.55)
0 0 0 0
então
0
λ1 R = 1 = G . (8.56)
0
Assim, pode-se dizer que o glúon λ1 carrega 2 cores: verde e anti-vermelho; ao interagir
com o quark vermelho (R), troca a cor deste, de vermelho para verde. Como glúons
carregam cores, podem interagir entre si – ao contrário de fótons, que são eletricamente
neutros apesar de mediarem a interação eletromagnética.
Devemos mencionar ainda o grupo responsável pela força fraca: SU (2). Se recordarmos
que neutrinos de mão direita ainda não foram observados – porque não interagem ou
porque não existem – percebemos que os elétrons de mão direita não tem como serem
agrupados, formando singletos. Neutrinos de mão esquerda, por outro lado, interagem
com elétrons (e suas versões mais massivas, o múon e o táuon); estes podem ser
agrupados, portanto, em dubletos.
! ! !
e− µ− τ−
νe νµ ντ
L L L
! ! !
u c t . (8.57)
d0 s0 b0
L,R L,R L,R
− − −
e µ τ
R R R
310
Agora podemos explicar a necessidade do ângulo de Cabibbo de um outro ponto
de vista: os autoestados dos geradores de SU (2)L não são autoestados de massa.
Isto também justifica a inexistência de uma mistura equivalente no setor leptônico:
neutrinos têm massa nula, e por isso, são autoestados simultâneos de massa e dos
geradores de SU (2)L .
As diversas simetrias indicam a conservação das diversas “cargas” a elas associadas,
como pode-se verificar pelos argumentos expostos acima. Precisamos, contudo, de um
formalismo matemático capaz de explicar as interações entre as partı́culas, em especial
entre quarks. Por que eles ainda não foram observados individualmente? Na verdade,
o mesmo acontece com qualquer partı́cula colorida. Por quê? Este é o objetivo da
próxima seção.
onde L é a Lagrangeana da partı́cula. A trajetória clássica xc (t) que liga dois pontos
fixos x(t1 ) = x1 e x(t2 ) = x2 pode ser obtida exigindo-se que a S[xc (t)] seja um
extremo no espaço funcional, ou seja, δS[xc (t)] = 0. Assim,
Z t2
dL δL
δS = δ ẋ + δx dt (8.60)
t1 dẋ δx
Z t2
d dL d dL dL
= δx − δx + δx dt (8.61)
t1 dt dẋ dt dẋ dx
t2 Z t2
dL d dL dL
= δx − − δx dt (8.62)
dẋ t1 t1 dt dẋ dx
311
onde admitimos que podemos escrever δ ẋ = (δx). ˙ O primeiro termo da Eq. (8.62) é
nulo, uma vez que os extremos da trajetória são fixos. Termos deste tipo são conhecidos
genericamente como termos de superfı́cie. O segundo termo deve, portanto, se anular
para quaisquer δx. Obtemos, assim, a equação de Euler-Lagrange:
d dL dL
− =0 (8.63)
dt dẋ dx
O estudo de um campo escalar aparece naturalmente como a extensão da Mecânica
Clássica a sistemas contı́nuos. Assim, podemos pensar em uma coleção de osciladores
(harmônicos) formando uma rede unidimensional de parâmetro a, cujos deslocamentos
ηi das respectivas posições de equilı́brio definirão o campo escalar φ(t, x) ao tomarmos
o limite para o contı́nuo a → 0. A Lagrangeana deste sistema deve ser a soma das
Lagrangeanas de todos os osciladores:
1X 1 X
L= mi η̇i2 − k (ηi+1 − ηi )2 , (8.64)
2 i 2 i
A Lagrangeana total pode ser então escrita como
" 2 #
1X m 2 ηi+1 − ηi
L = a η̇ − ka (8.65)
2 i a i a
" 2 #
1X η i+1 − ηi
= a µ η̇i2 − Y (8.66)
2 i a
X
= aLi (8.67)
Zi
−→ dx L quando a → 0 , (8.68)
312
Por isso, quando φ descreve perturbações que se propagam com velocidade da luz, é
natural substituir v por c na equação acima e escrever sua Lagrangeana16 em 3 + 1
dimensões como
1
L = ∂µ φ ∂ µ φ . (8.73)
2
O campo φ é de fato um escalar relativı́stico, pois sob uma transformação de coorde-
nadas (veja Eq. (12.48))
µ
xµ → x0 = Λµ ν xν + aµ (8.74)
se transforma como
φ(x) → φ0 (x0 ) = φ(x) . (8.75)
Pode-se mostrar que o sistema obedece às equações de Lagrange equivalentes para o
campo escalar φ,
dL dL
∂µ − =0 , (8.76)
d(∂µ φ) ∂φ
a menos de termos de superfı́cie, como antes.
Se a Ação for invariante sob uma transformação de um parâmetro α na Lagrangeana,
então é fácil mostrar que
dL dφβ
Z
δS = ∂µ δα d4 x . (8.77)
d∂µ φβ dα
A corrente
dL dφβ
Jαµ ≡ , (8.78)
d∂µ φβ dα
R
portanto, é conservada. Definindo a carga Qα ≡ Jα0 d3 x e integrando
Z
d
0 = ∂µ Jαµ d3 x = Qα + termos de superfı́cie. (8.79)
dt
Em outras palavras, a carga Q é conservada se não houver fluxo através da superfı́cie
que limita o sistema. Todas as simetrias existentes, portanto, implicam a conservação
de uma “carga” – este é o teorema de Noether [3]. Se a simetria acontece no espaço
de coordenadas, obtemos a conservação de energia, momento linear e angular, etc. No
caso dos grupos que atuam no espaço interno das partı́culas, obtemos a conservação
dos números quânticos: carga elétrica, número bariônico, etc.
Aplicando este raciocı́nio ao grupo de translações através da Eq. (8.19), obtemos
aµ ∂µ L = δL (8.80)
dL ν dL ν
= a ∂ν φ + a ∂ν ∂µ φ (8.81)
dφ d∂µ φ
ν dL
= a ∂µ ∂ν φ , (8.82)
d∂µ φ
16
Como trataremos, daqui por diante, sempre de campos, o termo “densidade” deverá estar subenten-
dido ao nos referirmos à Lagrangeana.
313
onde foi utilizada a equação de Euler-Lagrange na última passagem. Igualando o
primeiro e o último termos da expressão acima, obtém-se
dL
∂µ ∂ν φ − L δν aν = 0 ∀aν
µ
, (8.83)
d∂µ φ
−E 2 + p2 + µ2 = 0 . (8.87)
Uma regra fácil de ser aplicada para a determinação da massa de um campo — sem
correções quânticas — é calcular a derivada segunda do seu potencial no seu estado
de menor energia. Assim, de modo geral, pode-se dizer que
∂ 2V
µ2 = . (8.88)
∂φ2 φ0
A quantização deste campo, que foge ao escopo deste curso, mostra que µ é realmente
a massa dos quanta deste campo.
314
menos de um gradiente, esta Lagrangeana deve ainda ser invariante sob transformações
do tipo
Aµ −→ Aµ + ∂µ Λ . (8.89)
L ≡ C Fµν F µν − j µ Aµ , (8.91)
Fµν ≡ ∂µ Aν − ∂ν Aµ (8.92)
j µ ≡ (ρ, ~j) (8.93)
1 1
L = (∂µ φ)∗ ∂ µ φ − m2φ φ∗ φ , (8.94)
2 2
onde (·)∗ indica o complexo conjugado. Note que ela é invariante sob a transformação
φ → φ exp(ieα), pertencente ao grupo U (1). Quando α é uma constante, a simetria
sob U (1) é dita global.
18
Onde os termos divergentes não podem ser absorvidos por redefinições dos parâmetros da teoria.
315
Figura 8.3: Potencial com quebra espontânea de simetria para um campo escalar com-
plexo, com a 6= 0. O plano horizontal é definido pelas componentes real e imaginária do
campo φ. O cı́rculo, pertencente a este plano, é o vácuo deste campo.
Suponhamos agora uma Lagrangeana que acople este campo e o EM, dada por19
1
L = − Fµν F µν + (Dµ φ)∗ (Dµ φ) − V (φ) (8.95)
4
λ ∗ 2
onde V (φ) = φ φ − a2 , (8.96)
4!
na ausência de termos de fontes do EM. A definição da chamada derivada covariante20
Dµ ≡ ∂µ + ieAµ torna esta Lagrangeana invariante sob transformações locais U (1) (ou
SO(2), claro) de ambos os campos, na quais o parâmetro α depende da posição xν no
espaço de coordenadas:
Note que esta definição identifica a constante e com a carga elétrica, que acopla o
campo EM com o campo φ – representando, portanto, uma partı́cula carregada elet-
ricamente.
Um esboço do potencial V (φ) pode ser visto na Fig.(8.3). A configuração de menor
energia do campo φ – seu vácuo – é definida pelo mı́nimo deste potencial, em φ∗ φ = a.
Podemos estudar suas excitações ao redor de um vácuo especı́fico, φP = a e escrever
as variações em relação a φP em termos de suas partes real e imaginária, φ ≡ φR +i φI ,
ou seja,
1
φ(x) = a − √ (φR (x) + i φI (x)) . (8.99)
2
Ao redor deste ponto, o potencial dado pela Eq. (8.96) fica
1 λa2 2
V (φ) = φR + O(φ3 ) . (8.100)
2 6
Seguindo a mesma argumentação usada no campo escalar real, Eq. (8.88), podemos
ver que o campo φR possui massa quadrada m2R = λa2 /6, enquanto que o campo φI
19
Por que não há um fator 1/2 multiplicando o termo cinético do campo φ?
20
Não confundir com a derivada covariante da Relatividade geral.
316
não tem massa. Este é o chamado bóson de Goldstone, e aparece sempre que a simetria
do campo é quebrada espontaneamente [11].
O campo de gauge Aµ também adquire um termo de massa. Expandindo o termo da
derivada covariante e lembrando que o módulo do campo φ no seu estado de vácuo
vale a 6= 0, obtemos o termo
e2 a2 Aµ Aµ (8.101)
√
o que indica uma massa mA = 2ea para o campo de gauge Aµ .
317
que é associado ao fóton. Assim, o campo eletromagnético não é associado à simetria
U (1) presente no inı́cio, mas à que permaneceu após a quebra. Indica-se este processo
por
SU (2)L ⊗ U (1)Y −→ U (1)EM , (8.106)
Todo o mecanismo é possı́vel graças à forma do potencial, que permite que o campo
φ tenha um valor não-nulo no seu estado de vácuo. Se isto não acontecesse, as forças
fraca e eletromagnéticas seriam mediadas pelos campos de gauge Acµ e Bµ , todos sem
massa.21 . O cálculo do potencial efetivo requer conhecimentos de Teoria Quântica de
Campos que fogem a este curso, mas podemos entendê-lo como o potencial clássico
adicionado de correções quânticas. Em primeira ordem, estas correções indicam a
energia das flutuações ao redor da configuração clássica do campo φ. A principal
caracterı́stica dos potenciais efetivos que nos interessa é a mudança no sinal do termo
de massa, que depende da temperatura do sistema:
1 σ λ
VT (φ) = m2T φ2 + φ3 + φ4 (8.107)
2 3! 4!
318
Figura 8.4: Comportamento do potencial efetivo V [φ] com a mudança progressiva no
sinal do termo de massa para uma transição de fase de primeira (à esquerda) e segunda
(à direita) ordens.
Mais do que uma curiosidade, há uma analogia formal entre a quebra de simetria
em Teoria de Campos a temperatura Finita (isto é, não nula) e transições de fase
em Mecânica Estatı́stica. Pode-se adotar, por exemplo, o valor esperado do vácuo
do campo φ como parâmetro de ordem; a fase ocupada pelo sistema é caracterizada
pelo valor deste parâmetro. Seguindo a nomenclatura clássica de transições de fase,
diz-se que a transição é de primeira ordem quando a mudança no valor é brusca e
se dá através da nucleação de bolhas da nova fase em meio à atual. O potencial
efetivo apresenta um mı́nimo local na posição da fase atual, e um global na posição
da fase nova, para a qual o sistema está passando – ver Fig. (8.4a). Assim sendo,
é energeticamente favorável realizar a transição, que acontence tanto por ativação
térmica quanto por tunelamento. Existe um valor crı́tico para o raio das bolhas23
abaixo do qual a tensão superficial supera o ganho energético da transição e faz com
que elas encolham até desaparecer por completo. As bolhas com raio maior que este
valor crı́tico se expandem até percolarem, ocupando, então, todo o volume disponı́vel
e completando a transição. Um exemplo tı́pico é a transição lı́quido-vapor que a água
sofre ao atingir a temperatura de ebulição. 24 Quando a mudança no parâmetro de
ordem é suave, a transição é dita de segunda ordem. Não há barreira no potencial
efetivo entre as fases atual e futura – ver Fig. (8.4b). Este processo de transição recebe
o nome de decomposição espinodal e pode ser entendido decompondo-se o campo φ
em seus modos normais: os de maiores comprimentos de onda decaem primeiro. Ou
seja, a transição se dá de maneira deslocalizada no espaço.
A busca por uma teoria de unificação (GUTs25 ) da força forte com eletrofraca é
perseguida avidamente. Um dos indı́cios de que esta unificação é real é a observação de
que as constantes de acoplamento das três forças convergem para aproximadamente
o mesmo valor à medida em que a energia aumenta. No caso do eletromagnetismo,
23
Neste caso, a configuração do campo recebe o nome de sphaleron.
24
Em um lı́quido real, claro, há que se levar em conta o empuxo, que dificulta a colisão entre as bolhas
antes que elas sejam literalmente jogadas para fora do sistema.
25
Do inglês Grand Unified Theories.
319
Figura 8.5: Esquematização do processo de blindagem de uma carga elétrica positiva em
um meio dielétrico.
Tentativas de agrupamento das simetrias SU (2)L , U (1)Y e SU (3)C ainda não foram
bem sucedidas. O grupo mais simples com graus de liberdade suficientes é o SU (5)
[4, 5], no qual os quarks e léptons são membros do mesmo multipleto. Infelizmente,
este modelo foi descartado porque previa um decaimento do próton em uma escala de
tempo já descartada experimentalmente.
Outros motivos para buscar um grupo mais fundamental são dados pelas falhas do
modelo padrão em explicar o grande número de parâmetros livres (constantes de
acoplamento, massas), a existência de três famı́lias de léptons, que parecem se repetir,
e a existência do bóson de Higgs, ainda não observado experimentalmente. Um dos
candidatos atuais a este posto é a chamada supersimetria, que permitiria a trans-
formação de férmions em bósons, colocando-os em um mesmo multipleto.
320
Figura 8.6: Variação das constantes de interação com a energia. O eixo horizontal se
estende por várias ordens de grandeza.
O modelo padrão das partı́culas elementares é bem testado até a unificação eletrofraca.
Um modelo verdadeiramente fundamental para as partı́culas elementares, contudo,
deve ser válido, no mı́nimo, até a energia de Planck, da ordem de 1019 GeV , acima da
qual a gravitação deve obrigatoriamente ser considerada. É claro que energias deste
nı́vel não podem ser obtidas em nenhum acelerador no planeta, mas há um local, ou
melhor, uma época, quando elas eram perfeitamente acessı́veis: quando o universo
tinha cerca de 10−44 s de idade. A partir deste instante, a expansão do universo foi
paulatinamente diminuindo a temperatura e, acredita-se, permitindo uma seqüência
de quebras de simetrias (veja também o Capı́tulo 2):
• GUT
Pelas justificativas apresentadas anteriormente, acredita-se que um grupo de
simetria que englobaria as forças forte e eletrofraca deve ter se dividido nos
conhecidos SU (3)C ⊗ SU (2)L ⊗ U (1)Y quando T ∼ 1015 GeV e t ∼ 10−36 s.
• Eletro-fraca
A transição eletro-fraca, que separou a força fraca da eletromagnética quebrando
os grupos SU (2)L ⊗ U (1)Y → U (1)EM , ocorreu em t ∼ 10−10 s, a uma tem-
peratura T ∼ 300 GeV . Nesta quebra as partı́culas adquirem massa através do
mecanismo de Higgs. Não se sabe, ao certo, qual a ordem desta transição, mas
parece ser fracamente de primeira ordem.
Acredita-se que esta transição seja fundamental para a existência de matéria
atualmente em nosso universo, através do mecanismo explicado mais adiante.
• Quiral
Dois fenômenos caracterizam o final da época das transições, quando t ∼ 10−6 s,
e T ∼ 1 GeV : o confinamento dos quarks e a conseqüente formação dos hádrons.
Nesta faixa de energia, é razoável desprezar as massas dos dois ou três quarks
mais leves: u, d e s. A quebra espontânea da simetria quiral fornece, através
321
do mecanismo de Higgs, massa para estes quarks — que são então confinados.
Claro, as massas efetivas adquiridas são muito maiores do que as massas inici-
ais desprezadas, o que justifica a aproximação. Os bósons de Goldstone desta
simetria são os pı́ons, cujas pequenas massas indicam a validade do raciocı́nio.
Esta simetria não descreve uma relação fundamental, e é conseqüência apenas
dos pequenos valores das massas dos três quarks mencionados.
Antes desta transição, o universo era composto por um plasma de quarks e
glúons. Experiências estão atualmente em curso no Relativistic Heavy Ion Col-
lider (RHIC), em Brookhaven (NY, EUA), para tentar reproduzir este estado da
matéria.
A partir deste ponto, o universo é muito bem descrito pelo modelo cosmológico padrão.
Vejamos a seguir como este cenário pode responder a uma pergunta fundamental: se
partı́culas e anti-partı́culas foram criadas em igual número, de onde veio toda a matéria
que conhecemos? Não é plausı́vel imaginar um mecanismo que separasse estes pares
por distâncias tão grandes a ponto de não poderem se aniquilar.
Deve haver, portanto, um mecanismo para criar mais partı́culas do que anti-partı́culas.
A diferença relativa, expressa em função do número total de bárions NB e de anti-
bárions NB̄ como
NB − NB̄
δ= (8.108)
NB + NB̄
é estimada em torno de 10−9 . Apesar de parecer pequena, corresponde a toda a matéria
ordinária presente no universo.
322
Antes da primeira quebra de simetria, não havia diferença entre as partı́culas e suas
forças de interação; partı́culas supermassivas presentes – quaisquer que fossem – po-
diam decair em prótons ou em elétrons e vice-e-versa. Não havia conservação, por-
tanto, de número bariônico (item 1 de Sakharov). Isto, contudo, não era suficiente,
pois bárions e anti-bárions eram criados à mesma taxa.
Abaixo da escala de unificação, no entanto, as partı́culas supermassivas devem decair
em bárions ou léptons, mas esta reação não podem ser invetida, pois a taxa de expansão
do universo é muito alta: não há mais energia disponı́vel para criar as partı́culas
supermassivas – o sistema está fora do equilı́brio (item 2).
O último ingrediente é obtido pelas interações fracas, que violam CP naturalmente.
O processo de geração da assimetria bariônica durante a quebra de simetria eletro-fraca
pode ser assim resumido: o universo atinge a temperatura crı́tica; o potencial efetivo
correspondente adquire uma estrutura de mı́nimos degenerados. A seguir, os mı́nimos
diferenciam-se e bolhas da nova fase, mais favorável energeticamente, começam a
surgir; aquelas com raio acima de um certo valor crı́tico se expandem. Dentro de cada
bolha, a simetria foi quebrada; fora, o sistema ainda está na fase anterior. À medida em
que uma determinada bolha se expande, o parâmetro de ordem muda abruptamente
com a passagem da parede, deixando o sistema fora do equilı́brio térmico: o sistema
passa rapidamente de um mı́nimo local a um global. Uma flutuação local no número
médio de bárions, presente no instante de passagem da parede da bolha, seria então
mantida.
Embora todos os ingredientes pareçam estar presentes no universo primordial, o
mecanismo exato e seus detalhes permanecem em aberto e são objeto de intenso estudo
atual.
8.7 Exercı́cios
1. Conjecture a existência de partı́culas compostas por cinco quarks (um pen-
taquark), obtidas através da colisão de raios γ ou de pósitrons sobre núcleos
de Deutério. Quais quarks comporiam estas partı́culas, supondo que elas teriam
cargas +1 ou nula? Procure nos ArXives referências a respeito.
2. Mostre que o operador de paridade é um elemento do grupo de ordem 2. Qual a
regra de composição adequada?
3. Considere o grupo de ordem 3. Mostre que este é um exemplo de grupo cı́clico,
isto é, onde todos os elementos são potencias de um mesmo. Mencione algumas
realizações deste grupo.
4. O grupo de matrizes 2 × 2 com elementos reais com multiplicação matricial como
regra de composição é um grupo de Lie. Determine seus elementos inversos e o
neutro. Este grupo é abeliano?
323
5. Prove que a matriz B, dada pela Eq. (8.30) deve ser anti-simétrica.
6. Prove a Eq. (8.31).
7. Prove a Eq. (8.33). Dica: separe a expansão em potências pares e ı́mpares.
8. Deduza as equações de Maxwell no vácuo a partir da Eq. (8.91). Qual equação
deve ser imposta para obtê-las na forma usual? Determine a constante C ade-
quada.
9. Considere o potencial V (φ) = aφ2 + bφ3 + cφ4 , com a, b e c constantes conhecidas
e com os sinais adequados para uma transição de fase de primeira ordem. Estime
o valor crı́tico para o raio da bolha.
324
Capı́tulo 9
Astropartı́culas II
Júlio C. Fabris1
9.1 Introdução
A relatividade geral é a moderna teoria da gravitação, que substituiu a teoria da
gravitação newtoniana, contendo-a unicamente como o limite de campos fracos. A
relatividade geral é uma teoria clássica, no sentido de não quântica, que quando apli-
cada ao estudo do Universo como um todo gera o que usualmente se denomina de
Modelo Cosmolǵico Padrão (MCP). A descrição do Universo utilizando como base a
teoria da relatividade geral está, em geral, em excelente acordo com a observação.
Mas, sob vários aspectos, a descrição que ela fornece é considerada incompleta. Ao
mesmo tempo, existem uma série de problemas que afetam o MCP que, mantendo-se a
nı́vel puramente clássico, só podem ser resolvidos introduzindo condições inicias muito
especiais no inı́cio da história do Universo.
A teoria quântica de campos é um outro alicerce da fı́sica moderna. Ela é a base
do modelo padrão das partı́culas elementares. Este modelo padrão das partı́culas el-
ementares, assim como os conceitos básicos da teoria quântica de campos, foram de-
scritos no capı́tulo precedente. Quando se considera a existência de campos quânticos
no Universo em expansão descrito pela relatividade geral, vários fenômenos novos
são preditos. Em particular, espera-se a formação de defeitos topológicos devido às
transições de fase nos sistemas quânticos graças ao processo de resfriamento do Uni-
verso que se expande. Por outro lado, campos quânticos podem gerar sistemas com
pressão negativa, em fases altamente “quentes” da história do Universo, dando lugar
1
Afiliação : Departamento de Fı́sica, Universidade Federal do Espı́rito Santo, Goiabeiras - Vitória -
CEP29060-900, Espı́rito Santo .
325
ao que se denomina de “modelos inflacionários”. Estes modelos inflacionários podem
responder favoralmente aos problemas de condições iniciais no Universo a que se fez
menção acima. Ao mesmo tempo, talvez a existência de campos quânticos no Universo
possa resolver dois dos maiores problemas existentes atualmente em cosmologia: o da
matéria e energia escura.
Neste capı́tulo abordaremos alguns tópicos relacionados à introdução de campos
quânticos em um Universo em expansão descrito pela teoria (clássica) da relativi-
dade geral. Os tópicos selecionados, em um área extremamente vasta, abrangem os
defeitos topológicos, o modelo inflacionário, o problema da matéria e energia escura,
abordando-se rapidamente outros assuntos como os raios cósmicos de alta energia. Em
vez de exaurir o problema das consequências da existência de campos quânticos em um
Universo em expansão, procura-se ilustrar alguns aspectos da combinação da teoria
quântica de campos e a cosmologia, através de uma análise relativamente detalhada
dos tópicos citados acima.
9.3 Introdução
Defeitos topológicos são estruturas resultantes de transições de fase em um sistema
fı́sico. Nem toda transição de fase implica no aparecimento de defeitos topológicos;
entretanto, se há, em um dado sistema, defeitos topológicos, podemos dizer que houve
neste sistema uma transição de fase. Um dos exemplos mais simples de formação
de defeitos topológicos é o processo de congelamento de uma superfı́cie de um lago.
No estado lı́quido, as moléculas de água se encontram em um estado completamente
desordenado, e portanto altamente simétrico: a água parecerá sempre ter o mesmo
aspecto em qualquer lugar do fluido. Entretanto, quando a temperatura cai abaixo
do ponto crı́tico de congelamento (zero grau Celsius), gelo se forma, o que implica
que as moléculas se ordenam naquela região, formando uma estrutura cristalina. Mas,
a superfı́cie de um lago não se congela instantânea e simultaneamente em todos os
pontos. Desta forma, o ordenamento do cristal em uma região que se congelou pode
não ser o mesmo que em outra região onde também houve o congelamento. Quando
estas regiões diferentes se tocam, a interface entre elas forma um defeito topológico
devido exatamente ao diferente ordenamento da estrutura cristalina que cada uma
delas apresenta. Muitos outros exemplos de formação de defeitos topológicos podem
ser extraı́dos da fı́sica do estado sólido.
Em cosmologia, os defeitos topológicos surgem devido ao processo de resfriamento
que ocorre graças à expansão do Universo. A Teoria Quântica de Campos prevê que,
à medida que a temperatura abaixa, transições de fase devem ocorrer. O mecanismo
que gera estas transições de fase foi descrito no capı́tulo precedente. No processo de
326
transição de fase, o sistema descrito por campos quânticos deve tender ao seu estado
de vácuo, quer dizer, o estado de energia mı́nima. Se o vácuo de um dado sistema
não é único, então diferentes regiões do espaço podem estar em diferentes estados de
vácuo. Na interface entre estas diferentes regiões, defeitos topológicos se formarão.
O horizonte cosmológico define uma região que está causalmente conectada. De uma
maneira grosseira podemos definir o horizonte cosmológico, em um dado tempo t,
como a distância percorrida por um raio luminoso entre o instante inicial da evolução
do Universo e o instante de tempo t. Como será descrito na próxima seção, o Uni-
verso visı́vel hoje pode ser constituı́do de regiões que não tinham conexão causal em
épocas bem remotas. Se transições de fase ocorreram naquela época, podemos ter a
presença de defeitos topológicos no Universo visı́vel pois diferentes regiões podem ter
”escolhido” diferentes estados de vácuo. Entretanto, estas regiões que estavam, no Uni-
verso primordial, causalmente desconectada podem se encontrar dentro do horizonte
cosmológico hoje.
A natureza do defeito topológico que se forma devido ao resfriamento provocado pela
expansão do Universo, e da existência de um horizonte causal finito, depende da
estrutura dos campos quânticos envolvidos. Dito de outra forma, a natureza do defeito
topológico depende da estrutura do vácuo da teoria. Há três defeitos principais que
podem se formar no processo de expansão do Universo: as paredes cósmicas, as cordas
cósmicas e os monopolos2 . As paredes seriam defeitos bi-dimensionais, ao passo que as
cordas seriam defeitos uni-dimensionais e os monopolos defeitos pontuais. A formação
de um destes defeitos será determinada pelo tipo de simetria apresentado pelo estado
de vácuo. Descreveremos a seguir o processo de formação de cada um destes defeitos
e suas consequências para a evolução ulterior do Universo.
327
O potencial é sempre positivo definido, se anulando unicamente em dois pontos, φ =
±η, o que define os estados de vácuo. Neste caso, observe-se primeiramente que o vácuo
não é único; os dois estados de vácuo estão ligados por operação discreta: η → −η.
Além disto, o potencial tem um máximo local em φ = 0. Este é um ponto de equilı́brio
mas meta-estável. Este estado é chamado de falso vácuo.
A equação de movimento que rege a evolução deste campo é,
2φ = −V 0 (φ) , (9.3)
1 ∂2 ∂2 ∂2 ∂2
2≡ − − − . (9.4)
c2 ∂t2 ∂x2 ∂y 2 ∂z 2
Consideremos agora uma configuração estática do campo φ onde ele dependa apenas
da coordenada z. Neste caso a equação (9.3) se simplifica, resultando em,
d2 φ
2
= V 0 (φ) . (9.5)
dz
Esta equação admite a integral primeira (após ser multiplicada por dφ
dz
), que tem a
forma
1 dφ 2
−V (φ) = C , (9.6)
2 dz
onde C é uma constante. Procurando agora uma solução tal que o potencial e o
termo cinético se anulem quando z → ±∞, o que é necessário para que a energia da
configuração seja finita, obtemos a integral
Z r Z
dφ 2 dφ
z − z0 = ± p =± . (9.7)
2V (φ) λ φ2 − η 2
Ou,
h η √λ i
φ = ∓η tanh √ (z − z0 ) . (9.9)
2
Observe-se que, quando z → ±∞, φ → ±η. Além do mais, a derivada de φ tende a
zero neste limite, o que mostra a coerência com a condição inicialmente imposta.
A solução descrita anteriormente pode dar origem a uma parede cósmica. Existem,
de fato, duas soluções: a que corresponde ao sinal positivo e a que corresponde ao
sinal negativo. No primeiro caso, a configuração tende para o estado de vácuo −η
quando z → +∞, e para o estado de vácuo +η quando z → −∞. No segundo caso, o
comportamento é invertido. A existência de uma parede cósmica, neste caso, é devido
328
ao fato que, se em duas regiões vizinhas, uma delas se encontra no primeiro estado,
e a outra no segundo estado, há um defeito topológico na superfı́cie de contato entre
estas duas regiões. No caso, a superfı́cie de contato que define o defeito topológico é o
plano (x, y); logo, a parede cósmica é um defeito topológico bi-dimensional. Observe-
se que uma das configurações não pode se deformar continuamente levando à outra
configuração. Desta forma, o defeito se forma inevitavelmente na interface entre as
duas regiões que se estabeleceram em diferentes estados de vácuo.
Na interface entre duas regiões em diferentes estados de vácuo o campo escalar não
pode se encontrar em nenhum dos dois estados de vácuo diferentes. Logo, a única
possibilidade é que o campo escalar esteja no estado de falso vácuo, quer dizer, no
estado φ = 0. Portanto, a parede carrega uma energia com densidade correspondendo à
do falso vácuo. As paredes cósmicas são, devido a isto, defeitos topológicos perigosos
do ponto de vista cosmológico: como são objetos bi-dimensionais, a quantidade de
energia que elas carregam é imensa, e pode conduzir ao recolapso do Universo ainda
em sua fase primordial. Entretanto, configurações mais complexas que a descrita acima
podem fornecer resultados que evitam este problema.
onde utilizamos a solução para paredes cósmicas (9.9) e a métrica minkowskiana gµν =
ηµν = (1, −1, −1, −1). Para a pressão px ao longo do eixo x, temos
1
px = Txx = ∂x φ∂x φ − gxx ∂ρ φ∂ ρ φ + gxx V (φ)
2
329
1 2 1
= − ∂z φ − λ(φ2 − η 2 )2
2 4
λ 4 1
= − η h √ i . (9.13)
2 cosh4 η√ λ (z − z )
2 0
Seguindo os mesmos passos, podemos encontrar a expressão para a pressão nas direções
y e z:
λ 1
py = − η 4 h √ i , (9.14)
2 cos4 η√ λ (z − z )
2 0
pz = 0 . (9.15)
Logo, neste caso, a equação de estado para um fluido cosmológico de cordas cósmicas
é
2
p=− ρ . (9.18)
3
As cordas cósmicas representam, portanto, um fluido com pressão negativa. Estes
tipos de fluidos desempenham um papel muito importante em cosmologia visto que eles
podem gerar uma fase de expansão acelerada do Universo, o que é bastante interessante
por razões que serão expostas posteriormente.
330
quarks, por exemplo, aparecem em três pares, como explicitado no capı́tulo anterior.
Cada par é caracterizado por um ”sabor”, sendo que as partı́culas de cada par se
distinguem pela carga elétrica. Existem propriedades de simetria conectando estas
partı́culas. Diz-se então que estas simetrias agem sobre o espaço abstrato, interno,
onde cada vetor neste espaço caracteriza um estado associado a uma determinada
partı́cula com um valor para a carga elétrica e com um determinado sabor. Estas
simetrias diferem portanto das simetrias do espaço-tempo, como translação e rotação.
Do ponto de vista do espaço-tempo, o campo complexo a que nos referimos inicial-
mente é um escalar; mas do ponto de vista do espaço interno, ele se comporta como
uma quantidade contendo componentes e que possui simetrias especı́ficas. Com es-
tas estruturas mais complexas, podem-se se formar defeitos topológicos chamados de
cordas cósmicas, ou ainda podem se formar os chamados monopolos magnéticos. O
que distingue um caso do outro é a estrutura do vácuo, em particular seu grupo de
simetria.
No caso das cordas cósmicas o campo escalar é complexo. Portanto, a Lagrangiana
que descreve o sistema lê-se
√ h1 i
L= −g ∂ρ φ∗ ∂ ρ φ − V (φ∗ φ) . (9.19)
2
Seguindo o exemplo anterior, pode-se escolher um potencial sob a forma
λ ∗
V (φ∗ φ) = (φ φ − η 2 )2 . (9.20)
4
Este potencial tem um estado de vácuo, caracterizado como antes por V (φ∗ φ) = 0,
correspondendo a
φ = η eiθ . (9.21)
Quando θ é uma constante, teremos uma corda cósmica global. Por outro lado, quando
θ for uma função das coordenadas espaciais e temporais, tem-se uma corda cósmica
local. Neste último caso, é necessário considerar também, na análise do problema, o
campo eletromagnético que corresponde a esta corda. Por simplicidade, vamos nos
deter no caso das cordas cósmicas globais.
O potencial (9.20) tem a forma de um ”chapéu mexicano” que foi mostrado no capı́tulo
anterior. O estado de vácuo onde V (φ∗ φ) = 0 corresponde a um cı́rculo. Existe ainda
4
um máximo local em φ = 0, onde a energia é dada por V (0) = λη4 . Quando o campo
escalar se estabelece no seu estado de menor energia, ele deve ”escolher” um valor para
o mı́nimo permitido por (9.21), o que implica em definir um valor para θ no intervalo
0 ≤ θ ≤ 2π. Diferentes regiões, que não possuam contato causal, escolherão diferentes
valores para θ, portanto diferentes estados de vácuo. Isto novamente criará defeitos
topológicos. Só que agora, devido à simetria do estado de vácuo, os objetos serão cor-
das cósmicas, defeitos topológicos unidimensionais que apresentam, por conseguinte,
simetria cilı́ndrica, como veremos posteriormente.
331
Quando duas regiões com diferentes escolhas de θ se tocam, é possı́vel ”girar” contin-
uamente a orientação do vácuo de maneira a fazer a transição de um estado de vácuo
para o outro e nenhum defeito topológico ocorre. Mas quando três regiões que corre-
spondem a diferentes ”escolhas” de θ se tocam, isto não ’e mais possı́vel. A interseção
entre três regiões formará uma linha. Nestes pontos de interseção, o campo escalar
não poderá ter o valor correspondente a nenhum dos três estados de vácuo. Logo, a
única configuração de equilı́brio possı́vel é que o campo escalar fique no máximo local
correspondente a φ = 0. Este é o estado de falso vácuo para esta teoria. Temos por-
tanto uma corda cósmica, um defeito topológico que, no modelo descrito pelo potencial
(9.20), possui uma energia associada ao estado de falso vácuo.
O cálculo das componentes do tensor de momento-energia da corda cósmica apre-
senta dificuldades consideráveis, comparado com o que foi apresentado para as pare-
des cósmicas. As equações, de fato, são muito mais complicadas, sobretudo quando
se considera cordas cósmicas com simetria local, e em geral é preciso realizar uma
série de aproximações ou simplesmente empregar métodos numéricos. Tais análises
mostram que quando se tem um fluido cosmológico de cordas cósmicas, o tensor de
momento-energia deste fluido assume a forma
O fluido cosmológico de cordas cósmicas apresenta, como no caso das paredes cósmicas,
pressão negativa.
Ao contrário do caso das paredes cósmicas que apresentam vários problemas quando
introduzidas em uma estrutura cosmológica, as cordas cósmicas se revelam bem mais
interessantes. Em primeiro lugar, a contribuição de um fluido de cordas cósmicas para
a densidade total de energia do Universo não é tão catastrófica como no caso das
paredes cósmicas, justamente por se tratarem de objetos uni-dimensionais: um fluido
de corda cósmica pode existir sem contradizer o cenário de um Universo em expansão
compatı́vel com as observações. Além do mais, as cordas cósmica fornecem um cenário
para a formação de estruturas locais no Universo (galáxias, aglomerados de galáxias,
etc.) bem atraente.
De fato, um dos grandes problemas para explicar a existência de estruturas locais no
Universo reside no mecanismo de aglomeração local de matéria quando se considera
um universo globalmente homogêneo e isotrópico. O espaço-tempo criado por uma
corda cósmica se assemelha ao de um plano do qual se teria tirado uma fatia em
forma de cunha, a partir do ponto onde se localiza a corda cósmica, e depois colado as
bordas. Isto é denominado de ”déficite angular”. Partı́culas que se deslocam a partir
de regiões distantes (portanto planas), em trajetórias paralelas, ao se aproximarem da
corda cósmica são como que ”focalizadas”, suas trajetórias se aproximando. Quando
as cordas cósmicas se deslocam em um espaço onde as partı́culas estão em repouso
(precisamente o que acontece em um universo homogêneo e isotrópico, no sistema
332
de coordenadas co-móvel), este deslocamento provoca aglomeração de matéria, dev-
ido ao déficite angular na geometria na vizinhança da corda cósmica, provocando o
aparecimento de poços de potencial que gerarão posteriormente objetos como galáxias
e aglomerados de galáxias. Se este cenário corresponde realmente ao que ocorre na
natureza, apenas uma comparação detalhada com a observação poderá decidir.
Outro defeito topológico possı́vel são os monopolos magnéticos. Para que eles ocorram
é necessário que exista um multipleto de campos escalares. Quando este multipleto
inclui três campos escalares, podemos escrever
~ = (φ1 , φ2 , φ3 ) .
φ (9.23)
Ao escrevermos o campo como em (9.23) estamos querendo dizer que os três campos
escalares estão relacionados por transformações de simetria, que no caso são simetrias
internas (quer dizer, simetrias diferentes às do espaço-tempo), como às do isospin.
Neste caso, o grupo de simetria é o SO(3) que corresponde ao grupo rotação neste
espaço abstrato.
Os monopolos seriam, portanto, descritos pela Lagrangeana
√ ~ µφ~ − V (φ.
~ φ)]
~
L= −g[∂µ φ.∂ , (9.24)
V (φ. ~ = λ (φ.
~ φ) ~φ ~ − η 2 )2 . (9.25)
4
Observem que definimos um produto interno no espaço interno onde ”vive” o mul-
tipleto de campos escalares. Novamente, temos um máximo local, correspondendo a
~ = ~0, e um estado de vácuo correspondendo a φ.
φ ~φ ~ = η 2 . Agora, o estado de vácuo
tem uma simetria SO(3), com a estrutura de uma esfera, e não mais de um cı́rculo
como no caso das cordas cósmicas.
Para que um defeito topológico se forme agora será preciso a interseção de quatro
regiões que se estabeleceram em diferentes estados de vácuo. Temos assim um ponto.
Neste ponto, os campos não poderão estar em nenhum dos diferentes estados de vácuo
das regiões que se interceptam. Assim, de novo, a única possibilidade é que ali os
campos se encontrem no estado de equilı́brio correspondente ao máximo local. Temos
portanto um defeito pontual. É este defeito que chamamos de ”monopolo magnético”.
Esta denominação se deve ao fato que, além do defeito ser pontual, a interação que
ele cria em torno dele, possui simetria esférica. Tudo se passa, portanto, como se este
defeito correspondesse a uma carga pontual.
Os monopolos magnéticos carregam também uma energia associada ao fato de se en-
contrarem em um estado de falso vácuo. Mas, a existência de monopolos magnéticos
traz também problemas a nı́vel cosmológicos. Isto porque a energia deste estado
de falso vácuo é determinada pela energia em que ocorre a transição de fase. Con-
figurações do tipo monopolar surgem em teorias de Grande Unificação, que predizem
333
transições de fase com escalas de energia da ordem de 1014 GeV . Como no caso das
cargas elétricas, teremos dois ”sinais” possı́veis, correspondendo aos monopolos e anti-
monopolos. Calculando a abundância de monopolos criados no momento da transição
de fase, teremos uma contribuição destes objetos para a densidade total do Universo
muito superior à densidade crı́tica, e o Universo já teria se recolapsado muito antes
que as galáxias pudessem ter se formado. Este problema pode ser resolvido no âmbito
do modelo de inflação a ser descrito posteriormente.
Existem várias outras estruturas de defeitos topológicos possı́veis. Se considerarmos,
por exemplo, um multipleto de campos escalares com quatro componentes, transições
de fase podem originar o que se denomina usualmente de texturas. A representação
visual de tais defeitos é bem mais complicada. Por outro lado, podem existir defeitos
hı́bridos, como cordas cósmicas que têm em suas extremidades monopolos magnéticos.
Outras configurações são possı́veis, e que dependem do conteúdo da teoria e do mecan-
ismo de quebra de simetria.
Existem ”sinais” que permitem detectar a presença dos defeitos topológicos descritos
acima? Em princı́pio, existem várias possibilidades de verificar se defeitos topológicos
se formaram durante a evolução do Universo. Uma delas já foi mencionada: as cordas
cósmicas podem gerar um mecanismo para a formação das estruturas locais existentes
no Universo. Se as cordas cósmicas foram realmente as ”sementes” das estruturas
locais, o mecanismo de geração dessas estruturas deve estar refletido nas caracterı́sticas
gerais da distribuição de matéria no Universo, por exemplo no espectro da anisotropia
da radiação cósmica de fundo, que será descrito posteriormente.
Mas, existem outras possibilidades. Uma delas vem dos chamados ”raios cósmicos de
alta energia”. A Terra é constantemente bombardeada por partı́culas vindas do espaço,
por exemplo prótons. Estes prótons possuem em geral uma energia extremamente alta,
e ao colidirem com as partı́culas da região externa da atmosfera terrestre, geram um
”chuveiro” de partı́culas secundárias que chegam à superfı́cie da Terra. O estudo da
estrutura deste ”chuveiro” de partı́culas permite ter várias informações, como a energia
do próton primário, a direção da região no espaço de onde veio o próton, etc.
Raios cósmicos de energias extremamente altas já foram detectados. Tem-se eventos
de raios cósmicos com energia de até 1022 eV , o que é uma energia muito alta. Afinal,
aceleradores na Terra permitem acelerar partı́culas com energia de até 1012 eV . Muitos
daqueles raios cósmicos de alta energia podem ter se originados em mecanismo con-
hecidos, como a explosão de supernovas. Mas, quando a energia se torna muito elevada,
não se tem ainda um mecanismo eficaz para gerá-los.
Além do mais, as partı́culas ao se deslocarem no espaço interagem com os fótons
da radiação cósmica de fundo. Eles perdem portanto energia devido à interação com
334
estes fótons através do efeito Compton. Cálculos detalhados indicam que nenhuma
partı́cula deveria chegar à Terra com energia superior a aproximadamente 1020 eV .
Este é o chamado limite GZK3 . O fato de partı́culas de origem cósmica com energia
superior ao estabelecido por aquele limite já tenham sido detectadas é um dos grandes
enigmas na fı́sica atual.
Os defeitos topológicos são um dos candidatos para a origem de raios cósmicos com
energia tão alta. Como já foi dito, os defeitos topológicos carregam uma grande quan-
tidade de energia. Partı́culas podem, portanto, se encontrar aprisionadas no defeito.
Devido a própria dinâmica seguida por estes defeitos, estas partı́culas podem se lib-
erar, decaindo em seguida em, por exemplo, prótons com energia compatı́vel com
os raios cósmicos mais energéticos já detectados. Este mecanismo é particularmente
atraente no caso dos monopolos e das cordas cósmicas. Mas, apenas um estudo mais
detalhado permitirá decidir a verdadeira origem destes misteriosos raios cósmicos de
alta energia.
9.7.1 Introdução
O modelo cosmológico padrão (MCP) é muito bem sucedido sob vários aspectos.
Esteticamente, trata-se de um modelo simples e coerente. Além disto ele leva a
predições que concordam de maneira surpreendente (dada a sua simplicidade) com
as observações. Em primeiro lugar, ele incorpora naturalmente o cenário de um Uni-
verso em expansão. Depois, ele explica de forma muito natural a existência de uma
temperatura do Universo, representada pela radiação cósmica de fundo, altamente
isotrópica, consistente com o espectro planckiano de um corpo negro à temperatura
de 2, 7 K. Por fim, o MCP prevê a abundância dos elementos quı́micos leves (hidrogênio
até o lı́tio), com uma concordância com os dados observacionais a menos de 1%, algo
extraordinário tendo-se em vista que o processo de nucleossı́ntese primordial ocorreu
nos primeiros 180 s da história do Universo, quer dizer, em torno de 15 bilhões de anos
atrás.
Os sucessos do MCP não devem, entretanto, ocultar os sérios problemas que o afetam.
Entre estes problemas podemos citar, notadamente, o da platitude do Universo, o do
horizonte e o da formação das estruturas locais (galáxias, aglomerados de galáxias,
etc) observadas. Esses problemas serão descritos com mais detalhes a seguir, mas
no momento podemos unicamente enfatizar que todos eles estão relacionados com a
questão da escolha de condições iniciais muito particulares para o Universo no seu
inı́cio para que aqueles sucessos citados anteriormente sejam obtidos.
3
Abreviação dos sobrenomes dos fı́sicos que determinaram este fenômeno, o americano Kenneth
Greisen e os russos Georgi Zatsepin e Vadim Kuz’min
335
Estas dificuldades associadas ao MCP podem ser, de uma certa maneira, resolvidas se
supusermos que existiu uma fase de expansão exponencial no Universo primordial, bem
antes que a nucleossı́ntese ocorra. Este perı́odo de expansão exponencial, ou quase ex-
ponencial, é denominado de fase inflacionária. Chama-se de modelos inflacionários as
tentativas de explicar porque esta fase ocorreu. Este capı́tulo destina-se a fornecer uma
visão geral do que seria esta fase inflacionária, como ela resolve alguns dos problemas
do MCP, e quais são as dificuldades que se encontram para sua implementação. Um
aspecto muito interessante dos modelos inflacionários é que eles constituem uma inter-
essante aplicação dos conceitos e técnicas da teoria quântica de campos à cosmologia,
tais como teorias de unificação, transições de fase, etc. Fundamentalmente, o modelo
de inflação se baseia em um campo escalar, denominado inflaton, que adquire massa
em um processo de quebra espontânea de simetria devido ao processo de expansão, e
consequente resfriamento, do Universo.
336
onde designamos pelo sub-escrito e as quantidades de emissão, e pelo sub-escrito r
as quantidades de recepção. Escolhemos acima o sinal negativo de maneira a ter um
valor positivo para a distância coordenada da fonte ao receptor. Consideramos que
tr >> te .
Por outro lado, nós podemos calcular o tamanho do horizonte causal na época em que
os fótons foram emitidos, quer dizer, te . Isto define a região que possui conexão causal.
Para calcular esta região, naquela época, devemos avaliar a distância percorrida por
um fóton desde o inı́cio da história do Universo. Temos, usando o mesmo procedimento
que no caso anterior,
Z te 1/2
dt te
rc = c = 2c .. (9.27)
0 a(t) a0
Dividindo a distância coordenada entre as fontes pela distância causal, obtemos
r
2re tr
= ∼ 103 . (9.28)
rc te
Assim, as regiões que emitiram os fótons que recebemos hoje em direções diametral-
mente opostas, estavam separadas por uma distância mil vezes maior que o horizonte
causal naquela época. Logo, elas não poderiam se encontrar hoje em equilı́brio térmico.
Entretanto, observamos que estas regiões exibem a mesma temperatura. Este é o prob-
lema do horizonte.
Em princı́pio, o Universo pode apresentar uma curvatura espacial positiva (uma es-
fera), nula (um plano) ou negativa (uma pseudo-esfera). A curvatura espacial do Uni-
verso é determinada pela densidade de matéria nele existente. Para uma dada densi-
dade, denominada de densidade crı́tica, o Universo teria curvatura espacial nula; se
a densidade for superior a esta densidade crı́tica, sua curvatura será positiva; se a
densidade for inferior à densidade crı́tica, a curvatura será negativa.
Consideremos a equação de Friedmann, quer dizer, a componente temporal das
equações de Einstein:
8π
H2 + 2 = Gρ , (9.29)
a 3
onde H = aȧ , ρ é a densidade total de matéria do Universo, incluindo a contribuição dos
bárions, radiação, etc, e k é a curvatura da seção espacial. Dividindo toda a equação
por H 2 e re-arranjando os termos, temos então,
8πG ρ
1−Ω=− , Ω= . (9.30)
a2 H 2 3 H2
O parâmetro Ω é conhecido como parâmetro de densidade. Observe-se que quando Ω =
1, o Universo é espacialmente plano, quer dizer, k = 0. Isto define a densidade crı́tica.
Utilizando os valores de hoje, quer dizer, H0 ≈ 72 Mkmpc.s
, obtemos ρc0 ≈ 10−29 cmg 3 .
337
As observações hoje indicam que Ω0 ∼ 1, 02, quer dizer, a densidade do Universo é,
pelo menos, muito próxima à densidade crı́tica. O problema da platitude surge do fato
que a equação (9.30) depende do tempo. Para um Universo em expansão dominado
pela matéria, a = a0 t2/3 e H = 3t2 . Assim,
9 t2/3
1−Ω=− . (9.31)
4a20
Logo, a medida que o tempo passa, o parâmetro de densidade se afasta do seu valor
crı́tico, salvo se desde o inı́cio Ω = 1, o que fixa de uma vez por todas k = 0.
Reversamente, a medida que voltamos a tempos anteriores, para um dado valor de Ω,
mais e mais o parâmetro de densidade se aproxima do seu valor crı́tico. Em outras
palavras, a densidade crı́tica representa um ponto de equilı́brio instável. Por exemplo,
se hoje (t0 ∼ 1017 s), Ω0 é próximo da unidade pelo valor citado acima, quer dizer
Ω0 −1 ∼ 0.02, na época do desacoplamento entre a matéria e a radiação (td = 1011 s), o
parâmetro de densidade deveria ter um valor tal que Ωd −1 ∼ 2×10−4 . Se remontarmos
ao perı́odo da nucleossı́ntese primordial (tn ∼ 1 s), Ωn − 1 ∼ 10−6 .
Em outras palavras, para que o parâmetro de densidade tenha hoje um valor próximo
ao crı́tico, em tempos anteriores, ele deveria estar extremamente próximo ao valor
crı́tico.
Este fato implica que, para explicar o valor de Ω hoje, é preciso uma escolha ex-
tremamente particular do parâmetro de densidade no inı́cio da história do Universo.
Esta escolha parece ser pouco natural, por ser muito particular. Este é o problema da
platitude.
O raio visı́vel do Universo hoje é o chamado raio de Hubble. O raio de Hubble pode ser
caracterizado pela distância que a luz percorreu desde o inı́cio da história do Universo
até hoje. Logo,
c
RH = , (9.32)
H0
uma vez que a idade do Universo é dada pelo inverso da constante de Hubble. As
estruturas locais no Universo são caracterizadas por flutuações na distribuição de
matéria cuja escala é dada pelo comprimento de onda λ. Em princı́pio, λ se estende,
teoricamente, de zero a infinito. Vamos considerar uma flutuação ocorrida no Uni-
verso primordial, de comprimento de onda λi . À medida que o Universo expande, o
comprimento de onda da flutuação é também esticado devido à variação do fator de
escala a(t). Aliás isto resulta da própria noção de fator de escala. Entretanto, o raio
de Hubble definido acima varia com a constante de Hubble, isto é, cresce linearmente
com o tempo, já que H ∝ 1t . Mas, para um Universo dominado pela radiação ou pela
matéria, o fator de escala varia com o tempo segundo uma lei de potência: a(t) ∝ t2/3
338
para um Universo dominado pela matéria; a(t) ∝ t1/2 , para um Universo dominado
pela radiação. Assim, se uma dada perturbação se originou no Universo primordial
dentro do raio de Hubble naquela época (o que devemos esperar, uma vez que a flu-
tuação deve ter uma origem causal), ela terá uma escala efetiva cada vez menor que o
raio de Hubble, de maneira que hoje todas aquelas flutuações deveriam ter uma escala
extremamente menor que raio de Hubble hoje. Mas, existem estruturas cuja dimensão
caracterı́sticas são da ordem do raio de Hubble. Há aı́ uma dificuldade inegável.
Por outro lado, é preciso compreender a origem das flutuações primordiais que deram
origem às estruturas conhecidas hoje. O mecanismo de geração destas flutuações deter-
mina as propriedades estatı́sticas da aglomeração de matéria hoje. No MCP, não existe,
em princı́pio, nenhum mecanismo natural, a não ser as flutuações estatı́sticas normais
de um gás. Ocorre, que isto resulta em flutuações de amplitude extremamente pequenas
que não poderiam resultar nas estruturas observadas hoje. Há também o mecanismo
das cordas cósmicas que, entretanto, parece ser desfavorecido pela observação.
339
9.9 Uma fase de expansão acelerada no Universo
primordial
Uma das caracterı́sticas importantes do MCP é o fato que o Universo exibe uma
expansão sub-luminal. Isto quer dizer que o Universo está desacelerando: ä < 0. A
desaceleração do Universo é fruto do tipo de matéria que nele existe, radiação ou
matéria sem pressão. De fato, a partir das equações de Einstein, nós temos
n
ä 4πG X
=− (1 + 3ωi )ρi , (9.33)
a 3 i=0
onde i = 1, ..., n indicam oss diferentes componentes materiais, e onde supomos que
estes diferentes componentes obedecem uma equação de estado pi = αi ρi . É evidente,
a partir desta expressão, que se 1 + 3αi > 0, então inevitavelmente ä < 0, e o Universo
desacelera. Isto ocorre em particular se a pressão de cada fluido é positiva. Mas, se
por acaso existem fluidos de pressão negativa, é possı́vel gerar uma fase de expansão
acelerada.
Os problemas citados anteriormente que afetam o MCP podem ser solucionados se
houver uma fase na história primordial do Universo em que os fluidos que dominaram
o conteúdo energético têm pressão negativa, gerando conseqüentemente uma expansão
acelerada. A seguir, nós veremos que a introdução de uma fase de expansão acelerada,
pode solucionar os problemas citados acima. Entretanto, podemos observar a partir
de (9.33) que para se obter uma expansão acelerada é preciso introduzir um fluido
com pressão negativa, tal que 1 + 3αi < 0.
Fluidos com pressão negativa são, em princı́pio, objetos exóticos. Mas, na verdade,
eles ocorrem em situações ordinárias. Pode-se ter uma descrição de situações onde
eles surgem nas referências [5, 6]. Em Relatividade Geral, há uma forma natural de
introduzir uma fase acelerada: a inclusão de uma constante cosmológica nas equações
de Einstein. Na verdade, a quatro dimensões, a forma mais geral de se escrever as
equações de Einstein é:
1
Rµν − gµν R − Λgµν = 8πG Tµν , (9.34)
2
onde Λ é a constante cosmológica. Esta é a forma mais geral das equações de Einstein
visto que o lado esquerdo desta equação representa o tensor mais geral que se pode
escrever a quatro dimensões que tenha divergência nula e que conduza a equações
diferenciais de segunda ordem (ainda que não lineares).
Com a introdução da constante cosmológica, as equação (9.33) se torna,
n
ä 4πG X Λ
=− (1 + 3ωi )ρi + , (9.35)
a 3 i=0 3
Portanto, a constante cosmológica pode gerar uma fase de expansão acelerada (ä > 0)
se este termo dominar sobre as outras formas de matéria.
340
Vamos, a seguir, considerar que o termo cosmológico domina sob os demais. Se pode-
mos ignorar o primeiro termo do lado direito de (9.35), nós temos como solução para
o fator de escala, para o caso onde a secção espacial é plana:
r Λ
a(t) ∝ exp t . (9.36)
3
Quer dizer, o Universo se expande exponencialmente. Uma fase onde o Universo se
comporta desta forma é denominada de fase de de Sitter.
Vamos supor, por enquanto, que o Universo atravessou uma fase de expansão aceler-
ada bem no inı́cio de sua história. Isto pode conduzir a uma solução para os problemas
citados acima. A solução para o problema da platitude é imediata. Basta analisar a
equação (9.30): O termo H é constante, enquanto o fator de escala cresce exponen-
cialmente; logo, 1 − Ω se aproxima exponencialmente de zero; uma fase acelerada
prediz que o Universo deve tender rapidamente para uma situação onde sua densidade
é quase igual à densidade crı́tica, como observamos hoje.
No que diz respeito ao problema do horizonte, é preciso analisar novamente a evolução
do horizonte partı́cula. Tı́nhamos visto que a distância coordenada do horizonte
partı́cula é dado por (9.26). Agora, nós devemos dividir o processo de integração
em duas partes: primeiramente, o Universo é dominado pela constante cosmológica,
o que gera a expansão acelerada; depois, a radiação domina o conteúdo material do
Universo. Os detalhes relativos à implementação deste cenário serão discutidos poste-
q
riormente. O fator de escala se comporta inicialmente como a(t) = a1 eM t , M = Λ3 ,
evoluindo posteriormente como a(t) = a2 t1/2 . As constantes a1 e a2 dependem das
condições de junção, que impõe que o fator de escala deve ser uma função contı́nua
do tempo, e da normalização escolhida para este mesmo fator de escala. Neste caso,
considerando que a fase de expansão acelerada termina em t = tf , impondo que o
valor do fator de escala neste momento é igual a 1 (o que sempre é possı́vel, já que
isto implica em fixar a escala), obtemos :
a = eM (t−tf ) , 0 ≤ t ≤ tf ; (9.37)
(9.38)
Assim,
tf
dt0
Z
rc = . (9.39)
0 a(t0 )
Tem-se então,
1 M tf
rc = (e − 1) . (9.40)
M
Vamos supor que tf ∼ 10−33 s, que é a época onde a Teoria de Grande Unificação
sofre uma quebra espontânea de simetria. O valor final de rc , quer dizer, da região
causalmente conectada, pode ser extremamente grande se M tf >> 1. Isto implica que
o valor da constante cosmológica deverá ser muito grande para que o problema do
horizonte seja resolvido. Veremos posteriormente que isto pode de fato ocorrer.
341
O problema da superprodução de monopolos é resolvido similarmente. Como a den-
sidade de monopolo decresce com o inverso do cubo do fator de escala, obtemos que,
devido a expansão exponencial do Universo, a densidade de monopolos decresce ex-
ponencialmente, e com isso a contribuição dos monopolos para a densidade total do
Universo deve ser extremamente pequena. No caso dos problemas das flutuações pri-
mordiais, a expansão acelerada também conduz a resultados bastante positivos. Afi-
nal, as distâncias fı́sicas variam com o fator de escala. Desta forma, durante a fase de
expansão acelerada, os comprimentos de onda das perturbações são esticadas expo-
nencialmente, enquanto o raio de Hubble H = aȧ permanece essencialmente constante.
Com isto, nessa fase, o comprimento de onda das perturbações se torna muito maior
que o raio de Hubble. Quando a fase de expansão acelerada termina, o comprimento
de onda cresce mais lentamente que o raio de Hubble, e pode-se assim facilmente se
ter hoje perturbações cuja escala é comparável ao raio de Hubble hoje.
A fase de expansão acelerada fornece uma elegante explicação para a origem das
flutuações que resultaram nas estruturas observadas hoje no Universo. Como o com-
primento de onda cresce exponencialmente durante esta fase, elas poderiam ser ini-
cialmente muito menores que o raio de Hubble naquela época. Com isto, podemos
pensar que as flutuações primordiais eram de origem quântica. Os termos perturba-
tivos devem, portanto, serem descritos por modos quânticos. Estes modos quânticos
devem ser, obviamente, ortonormais. Devido ao processo de normalização dos modos
quânticos, é possı́vel obter o valor da amplitude destas flutuações assim como suas
caracterı́sticas estatı́sticas, uma vez que o estado de vácuo quântico pode ser rep-
resentado por uma distribuição gaussiana, como no caso do problema do oscilador
harmônico na mecânica quântica usual. De fato, os modos perturbativos podem ser
pensados como um conjunto de osciladores harmônicos desacoplados. As observações
recentes do espectro da anisotropia da radiação cósmica de fundo parecem estar em
acordo com este cenário. No caso clássico, a amplitude das perturbações permanece
completamente arbitrária.
Os resultados descritos acima indicam que a existência de uma fase de expansão acel-
erada do Universo, conhecida como fase inflacionária, pode resolver satisfatoriamente
os problemas mais importantes que afetam o modelo cosmológico padrão. A questão é
como gerar esta fase de expansão acelerada. Vimos acima que isto pode ser conseguido
através de uma constante cosmológica. Mas, há um problema maior em utilizar uma
constante cosmológica para este fim: exatamente porque o valor de Λ é constante, en-
quanto todas as outras formas de energia implicam uma densidade que decresce com
a expansão do Universo. Logo, uma vez que a constante cosmológica domina sobre
as outras formas de energia, ela continuará dominando posteriormente. Neste caso, a
342
fase de expansão acelerada jamais terminaria, e isto está em evidente contradição com
o que se conhece do Universo.
Há uma forma elegante e bastante atraente de se lidar com este problema. Ela consiste
em considerar que a fase de expansão acelerada não é gerada por uma constante cos-
mológica, mas por um campo que evolui com a expansão do Universo e que, por um
breve perı́odo de tempo, se comporta como uma constante cosmológica. Tais campos
podem se originar no processo de quebra espontânea de simetria em teorias funda-
mentais, como a teoria de Grande Unificação.
Consideremos um campo escalar com auto-interação. O tensor de momento-energia
para tal campo é dado por
1
Tµν = ∂µ φ∂ν φ − gµν ∂ρ φ∂ ρ φ + V (φ) , (9.41)
2
onde V (φ) é o termo de potencial que expressa a auto-interação do campo. No caso
em que consideramos a métrica de Friedmann-Robertson-Walker,
onde γij é a métrica sobre a seção espacial a curvatura constante, temos então para
as componentes do tensor momento-energia do campo escalar,
1
T00 = φ̇2 + V (φ) , (9.43)
2
1
Tij = φ̇ − V (φ) a2 (t)γij .
2
(9.44)
2
Podemos comparar estas expressões com as de um fluido perfeito, para o qual
343
Figura 9.1: Forma tı́pica do potencial do inflaton.
ȧ
ρ̇ + 3 (ρ + p) = 0 ⇒ ρ̇ = 0 ⇒ ρ = constante . (9.50)
a
O que se deseja no fundo, é um campo escalar com auto-intereção tal que, inicialmente,
o termo cinético domine sobre o termo de potencial, seguido de uma fase onde o termo
de potencial domine sobre o termo cinético (o que gera a expansão acelerada), depois
do que o termo cinético volta a dominar, de tal maneira que o Universo se comporte
como no MCP. Isto pode ser obtido se o potencial tiver, por exemplo, a forma esboçada
na figura (9.1). Um exemplo de potencial com as caracterı́sticas desejadas é o dado
por
V (φ) = V0 − βφ3 + λφ4 , (9.51)
onde V0 , β e λ são constantes positivas. Este potencial diverge para φ → ±∞. Por
outro lado, ele se comporta de forma praticamente constante para φ ≈ 0. Além do
mais, ele tem um mı́nimo absoluto em
3β
φm = . (9.52)
4λ
Obviamente, tal potencial representa um campo massivo. De fato, a massa de um
campo escalar é dada por
9 β2
m2 = V 00 (φ)|φ=φm = . (9.53)
4 λ
344
comporta como uma constante cosmológica, gerando uma expansão acelerada. Lenta-
mente, o campo escalar se dirige ao mı́nimo do potencial. Quando isto ocorre, ele
começa a oscilar em torno do ponto mı́nimo. Esse campo escalar não é o único campo
fundamental a estar presente no Universo. Existem os outros campos, que represen-
tam as demais interações. Estes campos estão, no fundo, acoplados. O processo de
oscilação do inflaton, conjuntamente com o seu acoplamento aos outros campos, gera
uma transferência de energia. Os outros campos são excitados, dando inı́cio a um
Universo dominado pela radiação. Tal processo se denomina reaquecimento. Pode-se
também entender este processo como sendo a transformação da energia potencial em
cinética.
Um aspecto delicado no modelo inflacionário reside no fato que não se conhece ainda
campos escalares fundamentais. Entretanto, estes campos devem resultar de teorias
como a Teoria de Grande Unificação, cujos efeitos caracterı́sticos se manifestam a
escalas de energia extremamente altas, muito superiores às que podem ser alcançadas
nos atuais aceleradores de partı́culas. Entretanto, as consequências muito positivas que
tais teorias teriam a nı́vel cosmolológico, as tornam extremamente atrativas. Poderia
ser dito que as consequências cosmológicas de tais teorias são evidências indiretas que
elas devem se realizar na natureza.
9.11.1 Introdução
345
testes, frequentemente, permitem fornecer informações não apenas sobre a quantidade
de matéria, como também sobre sua natureza.
Quando tais métodos indiretos são utilizados, grandes surpresas aparecem. Aparente-
mente, a maior parte da matéria existente no Universo, em torno de 99%, não é detec-
tada diretamente. Uma fração substancial desta matéria não deve ser constituı́da de
átomos ou pelas partı́culas elementares que conhecemos. Além do mais, a maior parte
desta ”matéria oculta” deve ser constituı́da por um fluido exótico cuja a pressão é neg-
ativa (denominado de energia escura), enquanto a outra parte deve ter pressão nula
(denominado de matéria escura). O que são estes constituintes ”não-convencionais”
do Universo? Este é um dos problemas mais importantes hoje em cosmologia.
Neste capı́tulo, revisaremos como se chega às conclusões expostas acima e quais são
as hipóteses para explicar a existência e a natureza da matéria exótica no Universo.
O leitor poderá também consultar as referências [7, 8].
Estudanto a órbita das estrelas e nuvens de gás em torno do centro da galáxia, pode-
se ter informações sobre a quantidade de matéria existente. Para simplificar a análise
do problema vamos fazer a aproximação (muito grosseira) que a galáxia é um objeto
esférico. Um cálculo mais preciso mudará os resultados por um fator da ordem da
unidade. Além do mais, e ainda para simplificar a análise, vamos considerar que a
densidade é constante e que as órbitas são circulares. Considere então uma órbita de
raio r menor que o raio da galáxia (a definição do que seja o raio da galáxia não é
algo simples, mas vamos ignorar no momento esta questão). A velocidade de rotação
será, nas circunstâncias descritas acima, determinada pela massa contida na esfera
interior à órbita. Digamos que M é a massa total da galáxia. A densidade de matéria
ρ (suposta uniforme) então será dada por
3M
ρ= , (9.54)
4πR3
346
onde R é o raio da galáxia. Usando o teorema de Gauss, o campo gravitacional a uma
distância r do centro da galáxia será dado por
m(r) M r3
~g = −G 2 r̂ , m(r) = , (9.55)
r R3
onde m(r) designa a massa total no interior da esfera de raio r. Assim, o campo
gravitacional pode ser escrito como
Mr
~g = −G r̂ . (9.56)
R3
Como as órbitas são circulares, a aceleração da estrela (ou nuvem de gás) é dada por
2
a = vr . Assim, tem-se
v2 Mr
=G 3 ⇒ v∝r . (9.57)
r R
Desta forma, a velocidade de rotação deve crescer com a distância ao centro da galáxia.
Por outro lado, se a estrela se encontra além do raio da galáxia (existem de fato objetos
ligados gravitacionalmente à galáxia e que estão a uma distância do centro maior que o
raio da galáxia), toda a massa da galáxia estará em seu interior. Desta forma, tem-se,
ainda para órbitas circulares,
v2 M 1
=G 2 ⇒ v∝√ . (9.58)
r r r
Assim, na borda da galáxia a velocidade de rotação deve cair com o inverso da raiz
quadrada da distância ao centro da galáxia.
Pode-se medir a velocidade de rotação nas galáxias espirais usando o efeito Doppler.
O resultado é surpreendente: enquanto no interior da galáxia a velocidade de rotação
cresce realmente com a distância, nas bordas da galáxia ela permanece constante, e
isto para distância às vezes muito superiores ao raio ótico da galáxia. Isto contraria o
que foi deduzido acima. Uma maneira de explicar este resultado é dizer que a galáxia
está envolta em um halo de matéria escura, que não pode ser detectada pela emissão
de radiação eletromagnética de nenhuma espécie, e que se estende muito além do raio
ótico. A adição deste halo escuro pode explicar as caracterı́sticas da curva de rotação
observada ajustando-se o tamanho do halo e sua densidade.
Uma quantidade importante na caracterização de uma galáxia é a razão massa-
luminosidade, quer dizer a quantidade de matéria dividida pela quantidade de luz
emitida, ambos em unidades solares. Estudando-se a vizinhaça do sol, tem-se que a
razão massa-luminosidade é da ordem de 5. A adição de matéria escura necessária
para explicar a curva de rotação observada pode aumentar esta relação luminosidade
para 15 ou mais: há muito mais matéria do que a que pode ser detectada diretamente
através da emisssão de radiação eletromagnética.
A situação se torna muito mais séria quando se considera agora aglomerados de
galáxias. Galáxias podem formar sistemas gravitacionalmente ligados, os chamados
347
Figura 9.2: Forma tı́pica da curva de rotação predita e observada em galáxias espirais.
348
N 0 N 0
1 X mi mj 1 X mi mj
= G 3
~ri .(~rj − ~ri ) − G 3
~rj .(~rj − ~ri )
2 i,j=1 rij 2 i,j=1 rij
N 0
1 X mi mj
= − G = Ep . (9.64)
2 i,j=1 rij
O segundo termo do lado esquerdo se anula quando se calcula seu valor médio ao longo
de uma órbita fechada, pois o produto interno muda de sinal ao longo de um ciclo.
Assim, obtém-se o teorema do virial:
1
< Ec >= − < Ep > . (9.66)
2
349
escura deva ser tal que m > 5 eV . Se forem neutralinos, partı́culas que surgem em
teorias supersimétricas, ela deve ser da ordem de 50 GeV .
Por outro lado, a matéria escura deve ser formada por partı́culas que interagem fraca-
mente com a matéria ordinária, bariônica, pois senão elas já teriam sido detectadas.
Assim, elas são denominadas de WIMPS, abreviação em inglês para partı́culas massi-
vas de fraca interação. Tanto o áxion quanto o neutralino satisfazem esta condição.
∆T
≤ 10−4 . (9.67)
T
No inı́cio dos anos 90, entretanto, observações feitas a partir do satélite COBE5 final-
4
Freqüentemente, na literatura recente, a fase inflacionária primordial também é incluı́da no cenário
padrão
5
Abreviação para o nome em ingês Cosmic Observatory Background Explorer
350
Figura 9.3: Espectro da anisotropia da radiação cósmica de fundo com os diferentes
resultados observacionais.
351
Assim, a anisotropia da RCF sugere que 70% da matéria existente no Universo não se
aglomera. Esta componente ”suave” foi denominada de energia escura, visto que ela
participa da dinâmica do Universo, mas não se aglomera e nem pode ser detectada
por meios diretos.
Outro teste que indica a existência de energia escura é a determinação do valor do
parâmetro de desaceleração hoje, q0 , que é definido como
aä
q0 = − |t=t0 , (9.71)
ȧ2
sendo a o fator de escala e t0 o tempo hoje. Este parâmetro pode ser avaliado através
do desvio da lei de Hubble do seu regime linear. A lei de Hubble estabelece que a
velocidade de recessão de objetos distantes deve ser proporcional à distância destes
objetos de nós. Mas, tal relação só se aplica estritamente para objetos relativamente
próximos; a grande distância, esta lei deve ser modificada, tomando a forma
1
rH0 ≈ z − (1 + q0 )z 2 , (9.72)
2
onde z é o desvio para o vermelho associado à radiação emitida pelo objeto distante,
definido por
∆λ
z= , (9.73)
λ
sendo λ o comprimento de onda da radiação emitida e ∆λ a mudança deste compri-
mento devido ao efeito Doppler cosmolológico.
Até aproximadamente 1998, acreditava-se que o Universo se encontrava em uma fase
desacelerada, quer dizer, q0 > 0. Isto aliás era de se esperar, visto que se pensava
até então que o conteúdo material do Universo era dominado por fluidos com pressão
positiva ou nula. De fato, considerando o Universo dominado por um único fluido com
densidade ρ e pressão p, temos pelas equações de Einstein,
ȧ 2 8πG
= ρ , (9.74)
a 3
ä ȧ 2
2 + = −8πG p . (9.75)
a a
Combinando as duas equações obtém-se,
ä 8πG
=− (ρ + 3p) . (9.76)
a 3
Desta forma pode-se ver que se a pressão é positiva, inevitavelmente ä será negativo
e o parâmetro de desaceleração será positivo.
Para se medir o desvio da linearidade da lei de Hubble é necessário observar objetos
bastante distantes, com altos z, quer dizer, z ∼ 1. Observar objetos tão distantes
traz problemas consideráveis. Em geral, utiliza-se galáxias. Mas, não se conhece ainda
muito bem o processo evolutivo das galáxias, e as medidas apresentam grandes in-
certezas. Desde a segunda metade da década de 90, passou-se a observar supernovas
352
do tipo Ia. Estas supernovas originam-se do processo de acréscimo de massa de uma
anã branca devido a presença de uma estrela massiva em um sistema binário. Quando a
massa da anã branca ultrapassa o limite de Chandrasekhar, quer dizer M ∼ 1, 4 M ,
ela se torna instável, dando origem a uma supernova. Como a explosão da estrela
ocorre em condições sempre muito semelhantes, a luminosidade intrı́nseca da super-
nova é padrão. Medindo-se a magnitude aparente, tem-se então a distância desta
supernova com grande precisão. As supernovas apresentam grande luminosidade, o
que permite observá-las a grande distância.
As observações de tais supernovas indicaram q0 < 0. Isto implica, a partir de (9.76) que
o Universo deve ser dominado hoje por um fluido de pressão negativa. Além do mais,
um estudo detalhado tem mostrado que os resultados observacionais são compatı́veis
com os teóricos se ΩT ∼ 1. Novamente, o estudo das supernovas tipo Ia indicam que
70% da matéria do Universo não aparecem na dinâmica dos objetos aglomerados,
constituindo uma componente ”suave” da matéria existente no Universo e que, além
do mais, deve exibir pressão negativa.
1
Rµν − gµν R − Λgµν = 8πGTµν , (9.77)
2
onde Λ é a constante cosmológica. Essas equações conduzem também à conservação
da matéria, da mesma forma que no caso tradicional onde Λ está ausente, pois a
derivada covariante da métrica é nula. À constante cosmológica podemos associar
353
uma densidade de energia dada por
Λ
ρΛ = . (9.78)
8πG
Esta densidade de energia permanece constante, mesmo para um Universo em ex-
pansão. Uma constante cosmológica pode ser também representada por um fluido
com pressão negativa tal que pΛ = −ρΛ . De fato, pela lei de conservação para um
Universo homogêneo e isotrópico em expansão, temos
ȧ
ρ̇Λ + 3 (ρΛ + pΛ ) = 0 ⇒ ρ̇Λ = 0 ⇒ ρΛ = constante . (9.79)
a
Como as formas de energia têm densidade decrescente em função da expansão do
Universo, se existe uma constante cosmológica não nula, ela deverá dominar a dinâmica
cósmica a partir de um certo momento. Mas, se ela começa a dominar hoje a dinâmica
do Universo, não há contradição com as observações ao contrário do que ocorria no
caso do cenário inflacionário.
Por enquanto, tudo parece concorrer para se admitir que é a constante cosmológica a
responsável pela expansão acelerada do Universo hoje. Mas, há vários problemas com
este cenário. O primeiro vem da teoria quântica de campos. Suponhamos um campo
quântico que possa ser representado sob a forma de osciladores harmônicos. A energia
deste campo é dada por
∞
X 1
E= n+ ~ω . (9.80)
n=0
2
O estado de vácuo é dado por n = 0. O estado de vácuo quântico é descrito por
uma expressão idêntica à da constante cosmológica, pois o vácuo quântico deve ser
invariante de Lorentz. Consideremos a densidade de energia deste campo quântico no
seu estado de vácuo. Ela será dada por
Z
ρ = ~ω dVω , (9.81)
Na verdade a integração deve ser feita até ωP l que é a frequência de Planck, pela
simples razão que desconhecemos qual fı́sica deve ser utilizada acima desta frequência.
Assim, a densidade de energia do vácuo seria dada por
Este valor é muito superior ao valor que deve ter a densidade de energia associada
à constante cosmológica necessário para explicar a aceleração do Universo hoje, que
é ρΛ = 10−47 GeV 4 . Há uma discrepância de 120 ordens de magnitude entre o valor
predito e o valor observado.
354
Outro problema se refere à chamada coincidência cósmica. Por que a constante cos-
mológica, se ela existe, tem um valor tal que somente agora ela começou a dominar o
conteúdo material do Universo? De fato, se a constante cosmológia tivesse um valor
maior que o observado, o Universo teria começado a se acelerar muito mais cedo e isto
comprometeria o processo de formação de galáxias, já que em um Universo acelerado as
perturbações que devem dar origem às estruturas locais, como galáxias e aglomerados
de galáxias, não crescem. Assim, se o Universo tivesse começado a se acelerar muito
antes que a fase atual, as galáxias não teriam se formado. Consequentemente, a vida
inteligente muito provavelmente não teria surgido. Para tentar contornar estas dificul-
dades, foram propostos cenários alternativos, como o de quintessência. Neste cenário,
recupera-se o mecanismo de inflação descrito anteriormente e que visava resolver os
problemas do modelo cosmológico padrão. Tenta-se, ao mesmo tempo, resolver o prob-
lema da coincidência cósmica de uma forma dinâmica: a própria evolução dos campos
responsáveis pela fase inflacionária atual implicaria que o Universo só poderia começar
a se acelerar em uma fase posterior à fase de formação das galáxias.
No modelo de quintessência, a aceleração do Universo é provocada por um campo
escalar com auto-interação descrito por uma Lagrangiana do tipo
1 √
L= ∂µ φ∂ µ φ − V (φ) −g . (9.84)
2
Como foi visto no caso do modelo inflacionário, a este modelo de campo escalar com
auto-interação podemos associar uma densidade de energia e uma pressão. Com uma
escolha judiciosa do potencial, pode-se ter um cenário onde inicialmente o campo
escalar apresente pressão positiva, evoluindo depois para uma configuração de pressão
negativa, o que induziria a fase de expansão acelerada.
Potenciais oriundos de teorias fundamentais como as de supergravidade podem ter as
boas caracterı́ticas para a descrição da quintessência. Entretanto, para que o resultado
final concorde com a observação é necessário um ajuste de parâmetros, o que sempre
provoca um certo desconforto. Entretanto, modelos de quintessência podem conduzir a
uma explicação para a questão da concordância cósmica: a dinâmica do campo escalar
é tal que só em momentos muito recentes ele pode provocar uma expansão acelerada
do Universo. Mas, várias outras propostas têm surgido na literatura e o campo está
inteiramente aberto para novas sugestões.
Exercı́cios
1. Mostre, por princı́pio variacional, que a Lagrangiana
1
L = ∂µ φ∂ µ φ − V (φ)
2
conduz à equação de movimento para o campo φ
2φ = −V 0 (φ) ,
355
onde a linha indica derivada em relação a φ.
2. Qual é a velocidade que teria uma bola de tênis, de massa m = 50 g, com energia
igual a 1022 eV ?
3. Calcule o valor da energia associada à constante cosmológica quando
√
Λ
∆t = 60 , ∆t = 10−30 s .
3
4. Deduza a partir da equação (9.41) as expressões para a densidade de energia e
pressão (9.46,9.47) .
5. Se a energia escura representa 70% da densidade crı́tica hoje, e a constante cos-
mológica é responsável por ela, deduza a densidade de energia associada à con-
stante cosmológica, no sistema de unidades CGS e em undidades GeV 4 , fazendo
neste último caso c = 1 e ~ = 1.
6. A razão massa-luminosidade, em unidades solares, do aglomerado de COMA, é
aproximadamente igual a 200 em unidades solares. Se o aglomerado de COMA
fosse formado por 500 galáxias idênticas à Via Láctea, qual seria a massa total
do aglomerado em gramas?
7. Estime a energia do vácuo quântico caso a frequência de corte for determinada
pela energia da quebra de simetria eletrofraca, Eef ∼ 100 GeV .
356
Capı́tulo 10
10.1 Introdução
Neste curso foram introduzidos os fundamentos da moderna teoria da gravitação, a
Teoria da Relatividade Geral (TRG), e da Cosmologia. Viu-se que, como toda forma de
energia presente na natureza interage gravitacionalmente, a teoria que descreve a in-
teração gravitacional pode ser entendida como uma teoria dinâmica do espaço-tempo,
propiciando, quando aplicada à totalidade do mundo fı́sico, uma teoria cosmológica
consistente de um Universo dinâmico com distintas fases em sua história. Estas foram
duas das grandes revoluções ocorridas na fı́sica no século XX, que modificaram total-
mente nossas concepções de espaço, tempo e cosmo.
A terceira grande revolução acontecida no século passado foi, como todos sabem, a
formulação da Teoria Quântica. Num nı́vel fundamental, ela mostrou-se absolutamente
necessária para a descrição correta e precisa de todo tipo de matéria, campos e sistemas
que existem na natureza com apenas uma exceção: justamente o campo gravitacional,
aquele que interage com tudo que existe e, como consequência, o Universo. Assim,
por um lado a TRG e a Cosmologia contemporâneas são teorias puramente clássicas
e por outro toda a Teoria Quântica (TQ) de partı́culas e campos se desenvolve num
espaço-tempo fixado de inı́cio (em franca oposição ao que há de mais básico na TRG, a
inexistência de um espaço-tempo fundamental a priori). Ou seja, as grandes revoluções
do século XX são teorias universais mas não se interpenetram, o que soa como um
contrasenso, indicando que a nossa compreensão da fı́sica contemporânea ainda não
1
Afiliação : ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ –
Brazil.
357
está completa, que estas são apenas teorias efetivas, sendo necessária a construção de
uma Teoria Quântica da Gravitação (TQG) e da chamada Cosmologia Quântica (CQ).
Entretanto, não há nenhuma observação que nos imponha a construção destas teorias.
Pior, todas as tentativas feitas até hoje mostraram a imensa dificuldade de se construir
tais teorias, parecendo que seus princı́pios fundamentais não podem ser colocados lado
a lado, ou seja, que a TRG e a TQ devem realmente se manter separadas. Apesar
disso, tentarei mostrar nesta introdução porque a construção destas teorias é tão
importante. Na verdade, as tentativas de construı́-las apresentaram grande avanço na
última década além de terem propiciado uma compreensão bem mais ampla da TRG,
da Cosmologia e, principalmente, da TQ.
Viu-se nos capı́tulos anteriores que a TRG, sob condições bastante razoáveis, desen-
volve singularidades do espaço-tempo, como os buracos negros e a singularidade inicial
cosmológica, onde quantidades fı́sicas como a curvatura do espaço-tempo e densidades
de energia divergem e nenhuma fı́sica faz sentido. Ou seja, a TRG prevê situações
onde ela própria não se aplica. Este tipo de problema já esteve presente em outras
teorias fı́sicas, como o colapso da estrutura clássica da matéria (o eletron clássico gi-
rando em volta do núcleo atômico perderia energia através da emissão de radiação
eletromagnética e cairia no núcleo) e a a divergência do campo elétrico clássico na
vizinhança de uma partı́cula carregada, ambas resolvidas através da teoria quântica
da matéria e da Eletrodinâmica Quântica. Talvez, como nesses casos, efeitos quânticos
do campo gravitacional descritos numa TQG consistente possam evitar essas singu-
laridades, propiciando uma descrição completa e consistente dos buracos negros e do
Universo. Cabe salientar, porém, que tais singularidades também podem ser evitadas
através de modificações clássicas da TRG, como o aparecimento de interações, não
previstas na teoria de Einstein, entre os campos de matéria e a curvatura nestas
situações extremas (quanto maior a curvatura mais estas modificações se tornariam
importantes), ou pela existência de materiais exóticos com pressão muito negativa
cujos efeitos fı́sicos só se manifestariam nestas regiões.
358
da matéria seria através da generalização das equações de Einstein
∂Ψ
i~ = ĤΨ, (10.2)
∂t
359
4) A existência da escala de Planck sugere uma TQG.
Tomando conjuntamente a constante de Newton G, a constante de Planck ~ e a ve-
locidade luz c, constantes fundamentais que dizem respeito à gravitação, mecânica
quântica e Relatividade, respectivamente, obtemos uma escala de comprimento,
tempo, massa e densidade de energia: a escala de Planck. Elas são:
r
~G
lpl = ≈ 10−33 cm, (10.6)
c3
r
~G
tpl = ≈ 10−43 s, (10.7)
c5
r r
~c ~c3
mpl = ≈ 10−5 g ; Epl = ≈ 1028 ev; (10.8)
G G
c5
ρpl = 2
≈ 1094 g/cm3 . (10.9)
~G
Como se vê, o comprimento e o tempo de Planck são extremamente pequenos: o
comprimento de Planck é tão menor que as dimensões de um núcleo atômico, da
ordem de 10−20 cm, quanto uma árvore é menor que uma galáxia tı́pica, e existem mais
tempos de Planck numa piscada de olho do que átomos no Monte Everest! Por outro
lado, a massa de Planck e a densidade de Planck são imensas: a massa de um eletron é
me ≈ 10−28 g, as energias mais altas que se atingiram até hoje nos grandes aceleradores
de partı́culas são da ordem de 1012 ev e a densidade de um núcleo atômico, o objeto
mais denso que se conhece, é da ordem de 1015 g/cm3 . É nessas escalas de tempo,
comprimento e energia que se espera que efeitos quânticos do campo gravitacional se
tornem importantes. Devido a esses valores extremos, não surpreende que até agora
não se tenha podido detetar tais efeitos. Por outro lado, a esperança de podermos
observá-los num futuro próximo parece bem difı́cil.
360
problema do ajuste fino da constante cosmológica, um dos maiores problemas da fı́sica
teórica contemporânea, que provavelmente só poderá ser resolvido com a elaboração
de uma Teoria Quântica da Gravitação consistente.
Para se fazer previsões sobre um sistema fı́sico clássico ou quântico, duas etapas são
necessárias: a formulação de uma dinâmica que descreva a evolução deste sistema
através de equações diferenciais e as condições iniciais satisfeitas por este sistema
para determinar univocamente sua evolução. Normalmente, tais condições iniciais são
especificadas através de uma preparação experimental (ao lançarmos, num exemplo
clássico, um projétil de uma determinada posição com uma determinda velocidade
inicial ou, num exemplo quântico, para avaliarmos a probabilidade de decaimento de
um átomo excitado quando ele é preparado inicialmente neste estado), ou através de
especificações originadas do ambiente no qual o sistema está inserido (por exemplo, se
estivermos interessados na evolução do campo eletromagnético em uma sala onde não é
observada a entrada de qualquer radiação eletromagnética, resolvemos as equações de
Maxwell com condições de contorno de acordo com este fato). Entretanto, o Universo,
objeto de estudo da Cosmologia, é um sistema essencialmente diferente já que não
se pode manipular ou preparar o Universo, nem há nada exterior ao Universo que
passe suas especificações para ele. Assim, tão importante quanto haver uma teoria
dinâmica para o Universo, que sabemos ser a TRG, é crucial formular uma teoria de
condições iniciais para que possamos entender este sistema sem paralelo na fı́sica de
forma completa. Isto se torna ainda mais importante quando sabemos que o Universo
em que vivemos é bastante peculiar por ser altamente homogêneo e isotrópico (dentro
das possı́veis soluções cosmológicas das equações de Einstein, a grande maioria não
tem qualquer traço de homogeneidade e isotropia 3 ).
3
Numa contagem simplória, a probabilidade de encontrarmos uma solução homogênea e isotrópica
dentre todas a possı́veis soluções das equações de Einstein é 1/∞3 , ou seja, zero!
361
Uma formulação quântica para a Cosmologia talvez possa resolver este problema
pois usualmente em teoria quântica surgem regras de seleção e a noção de estado
quântico fundamental. Isto será discutido mais adiante quando falarmos em Cosmolo-
gia Quântica.
i) Uma prática fundamental utilizada por todo fı́sico ao estudar algum sistema é isolá-
lo, ou seja, considerar que sistemas distantes não interferem na evolução do mesmo.
Entretanto, isto não seria possı́vel se a função de onda do Universo não pudesse ser
escrita da forma
Ψ(q i , QA , t) ≈ ψ(q i , t)ϕ(QA , t), (10.10)
iii) Como Boltzmann uma vez setenciou, a segunda lei da termodinâmica (a entropia
de sistemas isolados cresce com o tempo) também está relacionada com o estado
inicial do Universo: ‘A segunda lei da termodinâmica pode ser provada de uma teoria
mecânica [invariante por reversão temporal 4 ] se for assumido que o estado atual do
Universo ... começou a evoluir de um estado altamente improvável’.
362
10.2 Gravitação Quântica
Dentro da TRG, quantizar a gravitação significa quantizar o próprio espaço-tempo.
O que se havia feito até então era quantizar campos em espaços-tempos de fundo
fixados, ou seja, quantizar objetos se propagando em uma arena fixa. Agora, ter-se-ia
que quantizar a própria arena!
Essencialmente dois tipos de abordagem foram utilizados para quantizar a gravitação.
A primeira, a chamada quantização canônica, utilizou métodos canônicos de quan-
tização através da construção da hamiltoniana da TRG (o que implica numa separação
do espaço-tempo em espaço e tempo), procurando respeitar o aspecto mais profundo
da TRG: não há espaço-tempo absoluto. A segunda, chamada de quantização covari-
ante, procurou usar os mesmos métodos utilizados para os outros campos. Expandiu-se
a métrica gµν na forma gµν = ηµν + hµν para quantizar o campo hµν no espaço-tempo
de fundo de Minkowski cuja métrica é ηµν . Embora não seja necessária uma separação
do espaço-tempo em espaço e tempo como na primeira, daı́ o nome covariante, esta
abordagem utiliza a métrica de fundo ηµν como palco absoluto onde se propaga o
campo hµν .
Por ter sido a primeira abordagem a ser tratada de forma séria, vamos rever primeiro
a Quantização Canônica.
∂Ψ(q, t)
i~ = H(p̂, q̂)Ψ(q, t), (10.12)
∂t
onde H é a função hamiltoniana do sistema expressa em termos dos operadores mo-
mentum e posição.
Entretanto, a simples tarefa de se encontrar a hamiltoniana da TRG revelou-se mais
difı́cil do que se esperava. O fato de a TRG ser uma teoria covariante por trans-
formações gerais de coordenadas e expressa em termos de tensores, como visto nos
cursos anteriores, implica que várias componentes do tensor métrico podem ser fix-
adas mediante escolhas apropriadas das coordenadas (lembre-se como foram obtidas
363
as métricas de Schwarzchild e cosmológica: várias simplificações foram feitas através
de escolhas de coordenadas que acomodassem as simetrias presentes em cada caso).
Assim, nem todas as componentes do tensor métrico são graus de liberdade genuı́nos:
muitas delas podem ser eliminados. No formalismo hamiltoniano, isto se traduz em ter-
mos de relações entre componentes do tensor métrico e seus momenta canonicamente
associados que devem ser satisfeitas pelos mesmos. Estas relações são chamadas de
vı́nculos.
Uma outra maneira de ver a presença destes vı́nculos é através das equações de Ein-
stein:
Gµν = −κTνµ . (10.13)
É fácil verificar que as equações com ı́ndices µ = 0, ν = 0 e µ = 0, ν = i (i varia de 1 a
3 e corresponde aos ı́ndices espaciais) não envolvem derivadas segundas da métrica, só
derivadas primeiras. Como as derivadas primeiras estão usualmente relacionadas aos
momenta, estas são as relações de vı́nculo citadas acima. As únicas equações dinâmicas,
que envolvem derivadas segundas da métrica, em particular, das componentes gij , são
as equações com ı́ndices µ = i, ν = j.
Como não há equações envolvendo derivadas segundas das componentes g00 e g0i ,
estas não são variáveis dinâmicas, podendo portanto ser fixadas por uma escolha con-
veniente de coordenadas. Assim, dada uma hipersuperfı́cie tridimensional inicial de
métrica gij (xk , t0 ), que não pode ser qualquer uma pois ela deve satisfazer os vı́nculos
provenientes das equações com ı́ndices µ = 0, ν = 0 e µ = 0, ν = i, as equações de
Einstein com µ = i, ν = j nos dizem como encontrar a hipersuperfı́cie de métrica
gij (xk , t0 + ∆t) num instante posterior. O empilhamento destas hipersuperfı́cies tridi-
mensionais ao longo do tempo nos dão a quadri-geometria gµν que é solução das
equações de Einstein com estas condições iniciais.
Para lidar com os vı́nculos da TRG e chegar a sua hamiltoniana, Dirac desenvolveu
toda uma teoria denominada formalismo hamiltoniano de sistemas vinculados, com
aplicações também ao Eletromagnetismo e outras interações. Nesta formulação, a
hamiltoniana final é composta pela hamiltoniana canônica Hc = pq̇ − L, adicionada de
multiplicadores de Lagrange multiplicando os vı́nculos para garantir a sua validade.
Desta maneira, ele chegou a uma hamiltoniana correta para a TRG, que depois foi
colocada sob uma forma bem mais simples, envolvendo quantidades geométricas bem
definidas, por Arnowitt, Deser e Misner. Esta hamiltoniana tem a forma
Z
H = d3 x[N H(x) + Ni Hi (x)] + T S (10.14)
onde H(x) e Hi (x) são os vı́nculos referidos anteriormente e dependem das coordenadas
espaciais x. O primeiro está relacionado com a invariância da TRG por transformações
da coordenada temporal e o segundo com a invariância da TRG por transformações
de coordenadas espaciais. Os ı́ndices i variam de 1 a 3. N e Ni , relacionados com as
componentes g00 e g0i da métrica, são os multiplicadores de Lagrange que impõem a
364
validade dos mesmos: ao derivarmos a hamiltoniana com respeito a eles encontramos
H(x) = 0 e Hi (x) = 0, que reproduzem na linguagem hamiltoniana as equações de
Einstein (10.13) com µ = 0, ν = 0 e µ = 0, ν = i.
As funções H(x) e Hi (x) dependem apenas de gij , de eventuais campos que descrevam
a matéria e campos não gravitacionais, e de seus momenta conjugados. As equações
de Hamilton para estas quantidades (a forma geral das equações de Hamilton para
varáveis canônicas q e p é q̇ = ∂H/∂p e ṗ = −∂H/∂q) fornecem as equações de
Einstein com µ = i, ν = j. Desta maneira, obtemos todas as equações de Einstein
(10.13) dentro deste formalismo.
O termo T S é um termo de superfı́cie no infinito envolvendo todo o espaço. Ele só pode
ser calculado em situações bastante especiais. Se o espaço é fechado, isto é, finito e sem
fronteiras como a superfı́cie de uma bola de futebol, ele é zero. Para visualizarmos este
fato, sigamos com o exemplo da superfı́cie de uma bola de futebol. Nesta superfı́cie, o
análogo de uma esfera envolvendo um ponto no espaço tridimensional é um cı́rculo en-
volvendo um ponto na superfı́cie da bola. Ao aumentarmos progressivamente o cı́rculo
em torno do ponto, ele desaparecerá no ponto diametralmente oposto ao ponto inicial.
Assim, a integral T S será sobre um domı́nio nulo e portanto T S = 0 neste caso. Nos
restringiremos a partir de agora a esta situação, que é o caso de interesse cosmológico.
Note que para espaços fechados, onde o termo T S é nulo, a hamiltoniana, por ser uma
combinação linear dos vı́nculos aos quais toda solução deve satisafazer, é nula. Se ex-
trapolarmos para a TRG a interpretação usual da hamiltoniana como sendo a energia
do sistema, a conclusão é que a energia total de qualquer sistema gravitacional que
tenha espaço fechado é nula. Por isso, universos com espaços fechados são preferidos
em Cosmologia: eles têm energia zero!
Mas o que fazer quando aparece um vı́nculo f (q, p) = 0 na teoria? Não podemos
escrevê-los simplesmente como identidades entre operadores pois se f (q̂, p̂) = 0 então
[f, A] = 0 para qualquer A. Entretanto, {f, A} não se anula para qualquer A (tente
se convencer disso com um exemplo) e assim terı́amos uma contradição com a regra
(i). Dirac propôs então a regra5 :
365
Neste momento, o melhor a fazer é investigarmos um exemplo concreto para fixarmos
estas idéias.
Seja uma partı́cula não relativı́stica com a ação
Z
S = dtL(q, dq/dt, t) (10.15)
O ponto significa derivada em relação a τ . É fácil mostrar que a ação (10.16) não muda
de forma se reparametrizarmos novamente o tempo, τ̃ = τ̃ (τ ), ou seja, ela apresenta
a mesma propriedade da ação da TRG de ser invariante por transformações gerais no
tempo.
A nova lagrangeana é dada por L̄(q, q̇, t, ṫ) = ṫL(q, q̇/ṫ, t). Os momenta são dados por
∂ L̄ ∂L ∂(dq/dt)
π≡ = ṫ =p (10.17)
∂ q̇ ∂(dq/dt) ∂ q̇
e
∂ L̄ dq
π0 ≡ = L(q, q̇/ṫ, t) − p = −H(q, p, t) = −H(q, π, t). (10.18)
∂ ṫ dt
Assim temos o vı́nculo
π0 + H(q, π, t) = 0, (10.19)
que é uma relação do tipo f (q, t, π, π0 ) = 0.
A hamiltoniana canônica é
que é nula devido ao vı́nculo (10.19). Assim, segundo a prescrição de Dirac, a hamil-
toniana total é
HT = N [π0 + H(q, π, t)], (10.21)
onde N é o multiplicador de Lagrange associado ao vı́nculo (10.19).
É fácil verificar que esta hamiltoniana fornece as equações corretas do sistema. A
variação em relação a N fornece o vı́nculo H = 0. As equações de Hamilton ṫ =
∂HT /∂π0 , π˙0 = −∂HT /∂q0 , q̇ = ∂HT /∂π e π̇ = −∂HT /∂q nos dão que N = ṫ, a
conservação de H em t se esta não depende explicitamente do tempo t e as equações
de Hamilton do sistema original envolvendo a evolução no tempo t, respectivamente.
366
Aplicando as regras de quantização de Dirac para este tipo de sistema obtemos a
equações
∂Ψ(q, t, τ )
i~ = HT (π̂, πˆ0 , q̂, τ̂ , )Ψ(q, t, τ ), (10.22)
∂τ
e a regra de quantização (iv) fornece, neste caso,
Usando a Eq.(10.23) em (10.22) obtemos que o lado direito é nulo e portanto Ψ não
depende de τ . Na representação π̂0 = −i~∂/∂t, a Eq.(10.23) fornece exatamente a
equação de Schroedinger original (10.12). As regras de quantização de Dirac para
sistemas vinculados são perfeitamente consistentes.
Voltemos agora a hamiltoniana da TRG
Z
H = d3 x[N H(x) + Ni Hi (x)] (10.24)
já assumindo T S = 0. Note que, como no exemplo acima, a hamiltoniana é zero: ela
é uma combinação linear de vı́nculos. Isto implica, como no exemplo anterior, que
ao impormos a equação de Scroedinger encontraremos simplesmente que a função de
onda não depende de t, ou seja, ela depende somente da métrica gij , a única variável
dinâmica relacionada ao campo gravitacional, e dos campos de matéria. Temos ainda
as equações quânticas provenientes dos vı́nculos:
ĤΨ = 0 (10.25)
e
Ĥi Ψ = 0. (10.26)
367
difı́cil saber qual variável faz o papel do tempo nesta aboradgem da TQG. Pior que
isso, como a equação (10.25) em geral não se apresenta na forma de Schrödinger, fica
muito difı́cil saber como calcular probabilidades a partir de uma solução Ψ. Uma boa
probabilidade tem que ser positiva definida e sua soma ou integral sobre todos os
resultados possı́veis ser igual a 1. Se Ψ satisfaz uma equação tipo Schrödinger (com
derivada primeiro no tempo), é fácil mostrar, sendo Ĥ auto-adjunto, que |Ψ|2 satisfaz
estas propriedades. Caso contrário, o problema é bem mais complexo.
i) Aceitar que neste nı́vel fundamental realmente não exista noção de tempo. O tempo
só aparece quando a geometria começa a se comportar classicamente. De fato, foi
mostrado que na aproximação clássica, a equação (10.25) pode ser escrita na forma de
Schrödinger. No regime puramente quântico, deve-se procurar outras formas de definir
probabilidade com Ψ.
Estes problemas deixaram por algum tempo esta abordagem parada, até que nos
anos 80, Abhay Ashtekar conseguiu simplificar dramaticamente o vı́nculo H utilizando
novas variáveis, chamadas variáveis de Ashtekar, tornando-o similar aos vı́nculos que
aparecem em outras teorias cuja quantização é bem conhecida. Isto deu um novo
impulso à quantização canônica da gravitação.
368
rede de spins e dos nós que estes laços podem apresentar. Não há noção de tempo nesta
escala, ou seja, nesta teoria foi adotada a postura (i) citada acima para resolver o prob-
lema do tempo na equação de Wheeler-DeWitt. Foi possı́vel mostrar a quantização da
área e do volume nestas escalas. Com o ajuste adequado do parâmetro arbitrário que
aparece nas novas variáveis, citado acima, conseguiu-se também mostrar a fórmula da
entropia dos buracos negros em função da área do seu horizonte.
O grande problema deste formalismo é obter, a partir destas redes de spin, o estado
fundamental da teoria e o espaço-tempo contı́nuo da TRG clássica. Sem isso, é im-
possı́vel fazer qualquer predição que possa ser testada. Este é o problema crucial que
os pesquisadores que atuam nesta área estão agora atacando.
Na década de 60 do século XX, foi iniciada uma outra abordagem para quantizar
a gravitação baseada no que já se tinha feito para quantizar outras interações da
natureza.
Por exemplo, a repulsão eletromagnética entre dois elétrons é vista, do ponto de vista
quântico, como uma troca incessante dos quanta de campo eletromagnético, os fótons,
partı́culas de spin 1, como dois patinadores de gelo que se afastam um do outro ao
arremessarem um ao outro uma pesada bola. Esta troca é regida pelo tipo de potencial
de interação entre os elétrons e o fóton e é calculada perturbativamente através de
uma expansão em potências do parâmetro adimensional da teoria, e2 /(~c) = 1/137,
onde e é a carga do elétron. As possibilidades quânticas no caminho do fóton entre
os dois elétrons são inúmeras: o fóton pode ir direto, mas também pode desapare-
cer no meio do caminho produzindo um par partı́cula e anti-partı́cula, um elétron e
um pósitron, que logo após desaparecem fazendo reaparecer o fóton. Como só os dois
elétrons em interação podem ser observados, o fóton e o par entre eles não podem ser
detetados e por isso são chamados de partı́culas virtuais. Este processo intermediário
pode acontecer várias vezes no caminho do fóton e num curtı́ssimo intervalo de tempo.
Lembrando a relação de incerteza quântica envolvendo tempo e energia, as energias
envolvidas neste processo podem ser muito altas. O resultado final do cálculo de todos
esses processos possı́veis são inúmeros infinitos, o que parece tornar a teoria inconsis-
tente. Mesmo as massas e cargas dos elétrons calculadas desta maneira são infinitas.
Mas foi observado um fato matemático espantoso: se simplesmente retirarmos os in-
finitos das cargas e massas para que estas apresentem os valores finitos observados,
todos os outros infinitos desaparecem! Desta maneira a teoria faz sentido e produz
números que estão de acordo com resultados experimentais em até 12 casas decimais!
Este processo de retirada de infinitos é chamado de renormalização e a teoria é dita
renormalizv́el.
A idéia é fazer o mesmo com a gravitação. Para tal, escreve-se a métrica gµν na
369
forma gµν = ηµν + hµν (cuja inversa g µν se escreve como uma série infinita, g µν =
η µν + hµν + hµα hνα + ...), onde ηµν é a métrica de Minkoski, e faz-se a substituição
na lagrangiana da TRG. A teoria agora é entendida não da forma geométrica que
Einstein propôs mas como uma teoria do campo hµν se propagando no espaço-tempo de
Minkowski, interagindo com todos os campos da Natureza e consigo próprio (lembre-
se que o campo gravitacional interage com qualquer forma de energia). A quantização
da teoria levaria a um quadro similar ao da Elotrodinâmica Quântica descrito acima:
duas formas de energia interagiriam gravitacionalmente através da troca de quanta do
campo hµν , o chamado gráviton, de spin 2, que se propagaria no espaço-tempo de fundo
de Minkowski. Entretanto, os cálculos através de métodos perturbativos similares aos
da Eletrodinâmica Quântica mostraram uma situação catastrófica: os infinitos são
infinitamente diversos, ou seja, a remoção a mão de 2 ou 3 deles através de uma
renormalização não elimina os demais. Seriam necessárias infinitas renormalizações
para se encontrar resultados finitos. A TRG não é renormalizável do ponto de vista
perturbativo. Uma das razões é que, diferentemente das outras interações onde altas
energias não implicam em forte interação, partı́culas virtuais com energia tendendo
a infinito, permitidas pelo princı́pio da incerteza, interagem gravitacionalmente de
forma ilimitada, produzindo infinitos intratáveis.
Isto desanimou grande parte da comunidade até que um novo alento surgiu. Sabia-
se até então da existência de dois tipos de partı́culas fundamentais: os férmions,
de spin semi-inteiro, relacionados com a matéria propriamente dita, e os bósons, de
spin inteiro, relacionados com os quanta das interações fundamentais. Elas obedecem
estatı́sticas totalmente diferentes devido ao princı́pio da exclusão de Pauli. Em meados
da década de 70, mostrou-se a existência de uma simetria, chamada supersimetria, que
relacionava bósons com férmions: para cada bóson existiria um férmion associado (o
fóton, de spin 1, teria seu parcerio supersimétrico, o fotino, de spin 1/2, e assim
por diante) e vice-versa. Teorias supersimétricas teriam bem menos infinitos que as
teorias usuais já que os infinitos dos férmions se cancelam com os dos bósons. Com isto
foi construı́da a chamada supergravidade, uma teoria supersimétrica da gravitação e
que também pretendia ser uma teoria de unificação. Entretanto tal teoria, embora
bem menos problemática do ponto de vista perturbativo que a TRG, ainda não era
renormalizável.
Na década de 60 surgiu a idéia de se descrever processos da interação forte, aquela
responsável por manter o núcleo atômico estável, por meio de cordas segurando as
partı́culas do núcleo. Esta abordagem foi abandonada devido ao sucesso da teoria
que passou a descrever estas interações, a Cromodinâmica Quântica. Como era sabido
que as excitações destas cordas produziam, entre outras, partı́culas de spin 1 como
o fóton e de spin 2 como o gráviton, foi sugerido na década de 80 que elas fossem
utilizadas não apenas para descrever as interações fortes mas para um projeto bem
mais ambicioso: a descrição unificada de todas as interações. Assim, o mundo não
seria constituı́do de partı́culas mas de cordas, cujas excitações nos dariam todas as
370
partı́culas mediadoras das interações conhecidas e, quando tornada supersimétrica, as
partı́culas que compõem os átomos formadores da matéria usual. A teoria era formu-
lada em 9 dimensões espaciais e 1 de tempo, sua expansão perturbativa não continha
infinitos e produzia, num certo limite, a TRG. Houve grande excitação já que esta
era a primeira vez que se inseria a TRG numa teoria consitente perturbativamente, e
ainda por cima que encampava as outras interações.
Entretanto, vários problemas foram surgindo:
i) Percebemos apenas 3 dimensões espaciais e portanto é necessário incluir na teoria
uma dinâmica que possibilite a compactificação das outras 6 dimensões espaciais em
tamanhos minúsculos para que não possamos percebê-las. Porém, existem milhares
de esquemas de compactificação possı́veis, deixando a teoria praticamente sem poder
preditivo: cada maneira de compactificar implica em um determinado tipo de teoria
de campos e partı́culas nas 3 dimensões espaciais não compactificadas que observamos.
ii) Embora a série perturbativa tenha seus elementos finitos, existem fortes indicações
de que a série não converge, deixando assim muitas dúvidas sobre a validade do trata-
mento perturbativo também para esta teoria.
iii) A teoria é formulada num espaço-tempo de fundo fixado, sem dinâmica, onde as
cordas se propagam e interagem, em franca oposição ao espı́rito da TRG, onde não
cabe um espaço-tempo a priori.
Hoje existem algumas teorias de corda, todas elas interligadas por certas trans-
formações, que levou muitos a conjecturar que exista uma teoria ainda mais fun-
damental, denominada teoria M, da qual todas elas provêm.
As teorias de cordas também são bem sucedidas em calcular a entropia do buraco
negro, mas só dos carregados cuja carga elétrica, quando multiplicada pelas constantes
apropriadas, tem valor bem próximo da sua massa. As teorias de corda têm uma escala
diferente da escala de Planck já que existe uma quantidade, a tensão fundamental
da corda, que define outras escalas de comprimento, tempo e energia. A escala de
comprimento é maior que o comprimento de Planck. A constante gravitacional G é
governada por um campo e portanto varia com o tempo, tendendo ao valor atual após
vários processos dinâmicos ocorridos na teoria.
371
perturbativa problemática, ambiguidade por haver inúmeras teorias possı́veis por um
lado, possibilidade de fazer cálculos de espalhamento utilizando a noção de gráviton,
espaço-tempo clássico facilmente recuperável, teoria de unificação, por outro).
Isto sugere a alguns pesquisadores que elas sejam dois lados complementares de uma
teoria mais fundamental, ademais sabendo que a escala de comprimento vinda das
cordas é maior que a escala de Planck. Na escala de Planck mais fundamental, terı́amos
então uma teoria de laços, nós e redes de spins, que em escalas maiores geram as cordas,
e não diretamente o espaço-tempo contı́nuo, que então nos levaria aos espaços-tempos
soluções das equações de Einstein que tanto procuramos. Talvez este seja o melhor
esboço da teoria M que se tem hoje mas ainda falta muito para obtê-la em termos
matemáticos precisos.
372
mundo clássico externo a este sistema. Assim a interpretação de Copenhaguen não
pode ser utilizada na Cosmologia Quântica.
Não havendo colapso, não há necessidade de mundo clássico externo, a evolução
quântica é sempre linear e pode ser aplicada ao Universo. Esta é a interpretação
mais usada em Cosmologia Quântica e defendida por vários teóricos de fundamentos
da TQ.
Nesta interpretação, proposta por Louis de Broglie e elaborada por David Bohm no
começo dos anos 50, além da função de onda, o sistema quântico é definido também
pelas trajetórias de partı́culas e campos bem definidas e com realidade objetiva (exis-
tem independentemente da observação). No processo de medida, as partı́culas que de-
screvem o sistema observado e o aparelho de medida entram em apenas um dos ramos
seguindo a sua trajetória, singularizando este ramo com respeito aos outros. Pode-se
mostrar que os demais ramos, sem a presença das partı́culas e por isso chamadas de
ondas vazias, não podem ser detetadas por qualquer outro observador. Assim, como
no caso anterior, o colapso é aparente mas não é real. O auto-valor selecionado é
aquele em cujo ramo as partı́culas entraram. Novamente, não havendo colapso, não
373
há necessidade de mundo clássico externo, a evolução quântica é sempre linear e pode
ser aplicada ao Universo.
Por enquanto não há nenhuma evidência experimental que privilegie uma interpretação
em relação a outra, incluindo a interpretação de Copenhaguen. As preferências por
uma ou por outra são de caráter puramente estético e/ou filosófico. Para fins didáticos
passarei a descrever com mais detalhe a interpretação de Bohm-de Broglie por ser
aquela onde é mais fácil obter resultados e interpretá-los em Cosmologia Quântica.
~2 2
∂Ψ(x, t)
i~ = − ∇ + V (x) Ψ(x, t). (10.27)
∂t 2m
∂A2 ∇S
+ ∇· A2 = 0, (10.28)
∂t m
∂S (∇S)2 ~2 ∇2 A
+ +V − = 0. (10.29)
∂t 2m 2m A
A primeira é simplesmente uma equação de continuidade para A2 . A segunda é uma
~2 ∇2 A
equação de Hamilton-Jacobi com um potencial extra Q ≡ − 2m A
.
Até aqui, apenas escreveu-se equação de Schrödinger de outra forma. Entretanto, esta
forma sugere as novas hipóteses de Bohm, que são:
i) A trajetória x(t) da partı́cula existe, independentemente de observações! Esta é
uma mudança radical em relação à interpretação de Copenhaguen, para a qual o
mundo quântico não observado não passa de um conjunto de meras potencialidades
sem existência concreta.
ii) A equação (10.29), do tipo Hamilton-Jacobi, sugere que a trajetŕia da partı́cula
satisfaça a equação p = mẋ = ∇S(x, t), como na formulação de Hamilton-Jacobi
da mecânica clássica usual. A solução desta equação x = x(x0 , t) é a trajetória da
374
partı́cula, que no entanto só será determinada completamente com o conhecimento
da constante inicial x0 . A grande diferença do caso clássico é a presença do potencial
~2 ∇2 A
Q ≡ − 2m A
, cujas propriedades serão discutidas adiante. Devido à presença deste
potencial, S não é a função de Hamilton-Jacobi clássica e portanto as trajetórias
encontradas a partir dela serão diferentes da trajetória clássica. O potencial Q ≡
~2 ∇2 A
− 2m A
é portanto o responsável pelos efeitos quânticos. Por isso ele é chamado de
potencial quântico.
b) Q = 0 é o limite clássico.
375
10.3.2 A Cosmologia Quântica e a singularidade cosmológica
Um das grandes perguntas que se espera poder responder com a Cosmologia Quântica
é saber se o Universo teve um começo realmente ou se ele é eterno. Evidentemente
esta pergunta ainda não pode ser respondida no estágio atual mas os caminhos que
podem nos levar a uma resposta definitiva e que tipo de resposta pode ser dada estão
cada vez mais claros.
O procedimento utilizado foi o de usar as grandes simetrias apresentadas pelo Universo
em que vivemos, sua homogeneidade e isotropia, para simplificar drasticamente a
equação de Wheeler-DeWitt e resolvê-la. Assim, ao invés de se quantizar o campo
gravitacional na sua generalidade, quantiza-se apenas os graus de liberdade que restam
de uma geometria homogênea e isotrópica.
Seja portanto a métrica homogênea e isotrópica mais geral dada por:
3 √ N a3 ȧ2
Z Z
1 ä ȧ Ṅ
I= d x γ dt + − + . (10.32)
2κ 6 N 2 c2 a2 N 2 c2 a a c2 N 3 a2
Escrevendo
ȧa2
äa 2 2
ȧa Ṅ d ȧ2 a
N
− = −2 , (10.33)
N N2 dt N
e substituindo em (10.32), eliminando a derivada total e fazendo a integral espacial
que fornece o volume comóvel V total do tri-espaço fechado, encontramos:
ȧ2
Z
3V
I= N a3 − 2 2 + 2 dt . (10.34)
κ N a a
Vamos agora estudar dois modelos simples de Cosmologia Quântica, o primeiro cuja
fonte é a constante cosmológica com = 1 e o segundo um fluido radiativo com p = ρ/3
com = 0.
376
a) Constante cosmológica e = 1
Adicionando-se a constante cosmológica Λ > 0 à ação (10.34) tem-se:
ȧ2
Z
3V 3
1 Λ
I= Na − 2 2 2 + 2 − dt . (10.35)
κ cN a a 3
É fácil verificar que a variação desta ação com relação a N fornece a equação de
Friedmann (a equação de vı́nculo correspondente à equação de Einstein G00 = −Λ)
ȧ2 1 Λ
2 2 2
=− 2 + , (10.36)
cN a a 3
enquanto a outra nos dá a equação dinâmica (correspondente à equação Gij = −Λδji )
377
Universo ter tido um começo não singular tunelando do nada e passando a existir
com raio mı́nimo a = Λ−1/2 . Este tipo de comportamento aparece em outros modelos
mais elaborados. Note que esta criação quântica do Universo é também a criação do
espaço-tempo.
b) Fluido de radiação e = 0
Como neste caso a obtenção da hamiltoniana da parte material não é trivial, embora a
sua forma final seja bastante simples, escreverei-a diretamente. Cabe ao leitor verificar
que ela de fato gera as equações de Einstein para o modelo do Friedmann com radiação
e k = 0. Ela se escreve na forma
2 2
pc PT
H ≡ N H0 = N − + . (10.40)
λ4a a
a quantização fornece
∂Ψ ∂ 2Ψ
Ĥ0 Ψ(a, η) = 0 → i =− . (10.41)
∂η 4∂a2
Uma solução para esta equação pode ser obtida da evolução unitária da gaussiana
inicial6 : 8b 1/4
Ψ0 (a) = exp(−ba2 ), (10.42)
π
gerando
8b 1/4 1 1/2 nih i i o
Ψ(a, η) = exp 1+ a2 . (10.43)
π bη − i η (bη − i)
Vamos interpretar esta solução usando a interpretação de Bohm-de Broglie após es-
crevermos Ψ = AeiS e substituindo em (10.41) obtendo:
∂A2 ∇S
+ ∇· A2 = 0, (10.44)
∂t 2
∂S (∇S)2 ~2 ∇2 A
+ − = 0. (10.45)
∂t 4 4 A
6
O fato do domı́nio de a ser o conjunto dos reais positivos torna a tarefa um pouco mais elaborada,
R∞
tendo que se ter cuidado para que a solução encontrada satisfaça 0 da|Ψ2 (a, η)| = 1.
378
Através da equação p = 2ȧ = ∇S = ∂S/∂a, de onde interpretamos a primeira equação
como uma equação de continuidade [veja a sub-seção (3.1)], é possı́vel integrar a(t)
obtendo
p
a(η) = a0 b2 η 2 + 1 (10.46)
379
Eles se utilizam de uma definição de estado de vácuo baseada em uma formulação da
mecânica quântica em termos de integrais de trajetória proposta por Richard Feyn-
man, onde não é necessária a definição de energia mas que obviamente fornece o estado
de mı́nima energia e excitação nos sistemas onde estes conceitos podem ser definidos.
Esta definição pode ser generalizada e aplicada à quantização da TRG de onde produz,
em sistemas cosmológicos, a função de onda do Universo. É uma proposta com grande
apelo geométrico que já produziu alguns resultados bastante razoáveis (no sentido
de implicar a formação do Universo observado). Entretanto, em algumas situações,
esta prescrição não produz uma única solução da equação de Wheeler-DeWitt: muitas
vezes os caminhos nas integrais de trajetória têm que ser complexos e o resultado final
pode depender do caminho complexo escolhido. Este assunto ainda está em discussão.
Existem outras propostas, como a condição de contorno de tunelamento proposta
por Alexander Vilenkin, que essencialmente tenta impor às soluções da equação de
Wheeler DeWitt que, como no exemplo (a) da subseção anterior, o Universo surgiu
de um tunelamento do nada. Ela não tem o mesmo apelo geométrico da condição
de Hartle-Hawking mas também produz resultados consistentes, em alguns exemplos
melhores que os provenientes da condição de Hartle-Hawking.
Esta área de pesquisa ainda é muito especulativa pois depende muito da formulação
final de uma TQG consistente mas isto não impede a proposição de sugestões e seu
estudo em sistemas simples, como exposto acima, para examinar sua consistência e
viabilidade.
380
ergias altı́ssimas da ordem de 1020 ev (lembre-se das energias produzidas nos grandes
aceleradores, da ordem de 1012 ev) e parecem ter viajado por longas distâncias. É um
mistério eles conseguirem viajar por tão longas distâncias: por serem altamente en-
ergéticos, eles perecebem, do ponto de vista do seu referencial próprio, a radiação
de fundo cósmica a altı́ssima temperatura e portanto tenderiam a se aniquilar pela
contı́nua exposição a esta radiação. Existem possı́veis explicações convencionais para
este fenômeno e nem se sabe ao certo se eles viajaram reamente por longas distâncias
(não é descartada a hipótese deles terem sido produzidos nas imediações da nossa
galáxia). Entretanto, nenhuma dessas explicações paraece satisfatória.
Porém, alguns teóricos vislumbraram uma outra explicação para a observação destes
raios cósmico. A natureza discreta do espaço-tempo implica que num nı́vel fundamental
as transformações de Lorentz não sejam válidas. Estas transformações são deduzidas do
princı́pio da relatividade, invariância da velocidade da luz e da suposição que o espaço-
tempo é homogêneo e isotrópico. Mas um espaço-tempo discreto não é homogêneo.
Ademais, se realmente existe uma TQG que se manifesta na escala da energia de
Planck, esta escala também tem que ser um invariante pois senão observadores com
diferentes velocidades discordariam da energia segundo a qual efeitos quânticos são
p
importantes. Por exemplo, da fórmula relativı́stica E = mc2 com m = m0 / 1 − v 2 /c2 ,
onde m0 é a massa de repouso de uma partı́cula, com E = m0 c2 << Epl , vê-se
facilmente que observadores com velocidades próximas a da luz veriam esta partı́cula
com altı́ssima energia, talvez bem maior que a energia de Planck, discordando de
um observador em repouso em relação a partı́cula sobre se ela deve ser tratada por
uma TQG ou não. Isto implica numa modificação das transformações de Lorentz para
energias da ordem da energia de Planck. Um exemplo seria
mc2
E= 2 . (10.47)
1 + mc
Epl
É fácil ver que jamais a energia da partı́cula pode superar a energia de Planck segundo
esta fórmula.
Modificações na expressão da energia de partı́culas altamente relatı́visticas, como é o
caso destes raios cósmicos, poderiam implicar que eles não veriam a radiação de fundo
cósmica tão energética, e portanto poderiam atravessá-la por longas distâncias e chegar
até nós. Para saber se esta especulação é verdadeira, será necessário um estudo mais
aprofundado destes raios cósmicos de altı́ssimas energias, o que será feito em breve
pelo Observatório Auger na Argentina. Talvez seja possı́vel que as observações do
Auger evidenciem a natureza discreta do espaço-tempo.
Uma possibilidade surgida nas teorias de cordas, que como descrito anteriormente são
teorias formuladas em 9 dimensões espaciais e 1 de tempo, é a possibilidade das de-
381
mais dimensões espaciais não serem diminutas e compactas mas extensas. Para que
não as observemos, basta que as interações fundamentais não gravitacionais estejam
confinadas nas 3 dimensões espaciais que observamos. A única interação que poderia
penetrar nas outras dimensões seria a gravitacional mas o modelo pode ser ajustado
de forma a ainda não ser possı́vel detetar estas interações com experimentos gravita-
cionais. Entretanto, o fato da interação gravitacional se diluir em outras dimensões
implicaria numa redução drástica na energia de Planck, reduzindo-a a patamares onde
o novo grande acelerador que está sendo construı́do em Genebra, no CERN, poderia
alcançar (energias da ordem de 1013 ev). Assim, se este modelo estiver correto, efeitos
da gravitação quântica poderiam ser testados neste novo acelerador.
Entretanto, cabe ainda uma questão final: o que leva os fı́sicos a acreditarem que a
nova escala de Planck seria exatamente esta e não qualquer valor entre 1013 ev e a es-
cala de Planck usual? A resposta é que isto explicaria um grande mistério da fı́sica de
partı́culas. Vários experimentos indicam que o bóson de Higgs, aquele que dá massa
às partı́culas fundamentais, tenha uma energia da ordem de 1012 ev enquanto argu-
mentos teóricos sugerem uma energia da ordem da energia de Planck (este problema é
análogo ao problema constante cosmológica). Se esta tiver o valor mencionado acima,
não haveria discrepância alguma entre a previsão teórica e a indicação experimen-
tal, contrariamente ao valor usual, muitas ordens de grandeza maior que o sugerido
experimentalmente7 .
As medidas das anisotropias da radiação de fundo têm se tornado cada dia mais
precisas. Estas anisotropias têm origem, como explicado em outros cursos deste livro,
nas pequenas flutuações de densidade, possivelmente de origem quântica, que existiam
no Universo primordial.
Os modelos de Cosmologia Quântica mencionados na seção anterior, principalmente
aqueles modelos eternos provenientes de uma instabilidade do espaço-tempo plano,
geram anisotropias da radiação de fundo com sinais bem caracterı́sticos. Por exemplo,
os modelos com uma fase de contração anterior à fase de expansão em que vivemos
provavelmente implicam em pequenas oscilações no espectro de anisotropias da ra-
diação de fundo que poderiam ser observadas num futuro próximo, principalmente
quando o satélite Planck começar a produzir resultados no final da presente década.
Entretanto, tais oscilações podem ter outras origens que não evoquem a Cosmologia
Quântica.
Um canal observacional mais limpo é a observação das anisotropias da radiação de
fundo provocadas por ondas gravitacionais primordiais e seus efeitos na polarização
7
A supersimetria também poderia resolver esta discrepância já que ela introduz uma nova escala na
fı́sica de partı́culas.
382
desta radiação. Existem poucos dados observacionais atualmente mas a situação deve
melhorar nos próximos anos. Neste caso, modelos de Cosmologia Quântica prevêem
resultados diferentes da Cosmologia clássica padrão que são difı́ceis de ser explicados
de outra maneira.
Finalmente, algumas cosmologias provenientes das teorias de cordas citadas na seção
anterior já foram refutadas pelas observações das anisotropias da radiação de fundo
por não reproduzirem uma faixa do espectro observado. Ou seja modelos cosmológicos
oriundos de teorias quânticas da Gravitação já podem ser refutados pelas observações!
10.5 Conclusão
A história da quantização da gravitação já tem mais de 50 anos e ainda não está
acabada. Poucas vezes na história da fı́sica tantas mentes brilhantes levaram tanto
tempo para realizar uma tarefa sem obter ainda um resultado conclusivo. De fato,
quantizar o espaço-tempo, a arena da fı́sica envolve imensas dificuldades.
Entretanto, como vimos, houve grande progresso. Pela primeira vez temos uma teoria
quântica do espaço-tempo, a Gravitação Quântica de Laços, que embora não pos-
samos afirmar ser a definitiva TQG pela falta de predições observáveis, mostra que os
princı́pios da TRG e os princı́pios da TQ não são afinal incompatı́veis como muitos
afirmavam. Ela é um forte contra-exemplo a esta crença. Ademais, ela mostrou como
construir uma TQG sem usar métodos perturbativos que parecem, inapropriados num
nı́vel fundamental.
As duas abordagens principais, a quantização canônica, através da Gravitação
Quântica de Laços, e a quantização covariante, através das teorias de supercordas,
têm produzido resultados complementares que servem para montar um quadro mais
abrangente da teoria fundamental que as contem. A formulação desta teoria pode es-
tar mais próxima uma vez que as duas comunidades que antes trabalhavam nos seus
respectivos setores sem se comunicar, têm dialogado mais. Alguns temas obscuros,
como a termodinâmica dos buracos negros, têm sido melhor compreendidos e elucida-
dos. Como vimos na seção anterior, até mesmo a possibilidade de testar estas teorias
têm sido vislumbradas.
A Cosmologia Quântica, embora ainda esteja longe de produzir resultados definitivos,
tem oferecido descrições bastante sensatas a respeito do Universo primordial e se teve
ou não um começo. Se teve um começo, o Universo surgiu muito pequeno, mas com
um tamanho finito, de um tunelamento quântico a partir do nada (aqui entendido de
uma maneira mais radical como a ausência de espaço, tempo e matéria). Mas outros
modelos sugerem que ele possa ser eterno, resultante da instabilidade do espaço-tempo
plano. O mais impressionante é que estes modelos podem talvez ser testados num
futuro próximo através do estudo dos efeitos destas fases primordiais nas anisotropias
383
da radiação de fundo, alguns deles até já tendo sido refutados pelas observações! Uma
teoria cientı́fica começa a adquirir status quando ela permite ser refutada. Ademais, a
Cosmologia Quântica propiciou um grande aprofundamento na compreensão da TQ.
Percebeu-se as fortes limitações da interpretação de Copenhaguen, todos os pontos
obscuros que eram colocados debaixo do tapete e que não podiam lá continuar quando
o objeto a ser quantizado era o Universo. Construiu-se interpretações alternativas
ou tentou-se aprimorar a interpretação de Copenhaguen, implicando numa grande
evolução do nosso conhecimento sobre a TQ.
Evidentemente, a construção de uma teoria consistente da gravitação e cosmologia
quânticas com confirmação observacional e experimental não significa o fim da fı́sica,
mesmo que ela seja uma teoria unificada de todas as interações. Em primeiro lu-
gar porque as teorias fı́sicas são construções mentais às quais tentamos acomodar
os fenômenos naturais conhecidos e por isso mesmo podem ser refutadas diante de
qualquer novo fenômeno.
Em segundo lugar porque, ao contrário, ela abrirá portas que hoje nem imaginamos.
Por exemplo, será que com o conhecimento destas novas teorias conseguiremos con-
struir os chamados buracos de minhoca, atalhos do espaço-tempo que conectam dois
lugares distantes possibilitando a sua travessia em tempos curtı́ssimos? E com estes
atalhos, será possı́vel constrir máquinas do tempo? Será que as energia e matéria
escuras que parecem compor 97% da matéria do Universo não são simplesmente man-
ifestações de modificações da TRG em larga escala que serão compreendidas pela
TQG, da mesma maneira que a precessão do perihélio de Mercúrio foi explicada por
uma revolução na teoria de Newton, a TRG, e não pela presença de um planeta não
observado (Vulcano) entre Mercúrio e o Sol?
A construção da Gravitação e da Cosmologia quânticas é certamente um dos proble-
mas mais profundos e difı́ceis da história da fı́sica. Sua solução exige trabalho árduo,
colaboração e criatividade e certamente trará resultados surpreendentes e inúmeras
perspectivas. Por isso este é, a meu ver, o problema mais fascinante da fı́sica contem-
porânea.
1) Lee Smolin, Three Roads to Quantum Gravity, Basic Books-New York (2001).
2) Jonathan Halliwell, Quantum Cosmology and the Creation of the Universe, Scientific
American 265, n 6, 76 (1991).
3) Michio Kaku, Hiperespaço, Editora Rocco (1994).
4) Nelson Pinto Neto, Quantum Cosmology, Cosmology and Gravitation II: Proceed-
ings of the VIII Brazilian School of Cosmology and Gravitation, 229, editado por
Mário Novello, (Editions Frontieres 1995).
384
5) Franck Laloe, Do we really understand quantum mechanics?, American Journal of
Physics 69, 655 (2001).
6) Kip S. Thorne, Black Holes and Time Warps, W.W. Norton and Company (1994).
Exercı́cios
1. Prove que a ação da equação (11) não muda de forma por uma transformação
τ̃ = τ̃ (τ ).
2. Prove as relações (12,14,15).
3. Encontre as equações de Hamilton da hamiltoniana (16) e interprete-as.
4. Deduza as equações (23) e (24) da equação (22).
5. Mostre, usando uma analogia com fluidos e a relação p = mẋ = ∇S(x, t), que a
equação (23) é uma equação de continuidade.
6. Deduza a ação (29) da ação mais geral (26) se usarmos (25).
7. Obtenha as equações de Friedmann da ação (30) e obtenha a solução clássica
para N = 1.
8. Obtenha a hamiltoniana (33) e calcule as equações de hamilton. Compare com o
resultado do exercı́cio anterior.
9. Calcule as equações de Hamilton provenientes da hamiltoniana (35) e encontre
as equações de Friedmann para radiação. Interprete Pt . Encontre as soluções
para N = 1 e N = a/l0 , onde l0 é uma constante arbitrária com dimensão de
comprimento.
10. Mostre que (38) é solução de (36).
11. De p = 2ȧ = ∂S/∂a, encontre a solução (41) e interprete-a para η >> 1/b.
12. Calcule o potencial quântico correspondente à função de onda (38) e faça o seu
gráfico. Verifique o seu comportamente ao longo das trajetórias (41) e interprete
o seu resultado.
13. Da relação (42), faça um gráfico E x v para 0 < v < c.
10.7 Agradecimentos
Agradeço ao CNPq pela bolsa de pesquisa concedida.
385
Capı́tulo 11
Geometria Diferencial
11.1 Introdução
No inı́cio do século XX, as chamadas geometrias curvas já eram bem conhecidas. Elas
foram desenvolvidas ao se abandonar o quinto postulado da geometria plana de Eu-
clides. Esse postulado afirma que se uma reta cruza outras duas e se a soma dos ângulos
internos às duas retas for menor que 180o num lado, então as retas se encontrarão,
se estendidas para além desse lado. Durante dois milênios tentou-se provar que esse
postulado poderia ser deduzido dos outros quatro, mas o máximo que se conseguiu
foi escrevê-lo de formas equivalentes. Até que o jesuı́ta Geralamo Saccheri tentou ver-
ificar, pela primeira vez, como seria uma geometria sem o quinto postulado. A partir
daı́, o estudo dessas geometrias ganhou um grande impulso com Gauss, Lobachevski
e Bólyai, com seus estudos de geometrias curvas bi-dimensionais e com Riemann, que
generalizou esse estudo para geometrias n-dimensionais, por volta de meados do século
XIX. Nessas geometrias, coisas bizarras acontecem, como a soma dos ângulos inter-
nos de um triângulo ser diferente de 180o e o perı́metro d de um cı́rculo ser diferente
de 2πr. O ramo da Matemática que estuda estas geometrias denomina-se Geometria
Diferencial. Resumiremos a seguir seus principais conceitos e deifinições.
1
Afiliação:ICRA/CPBF/CNPq, Rua Dr. Xavier Sigaud, 150, 22290-180 – Rio de Janeiro, RJ – Brazil.
386
11.2 Objetos geométricos
Uma curva é uma função diferenciável xµ (λ) do < → <n , que associa a cada valor do
parâmetro λ ∈ < sobre a curva. as coordenadas xµ ∈ <n de um ponto p do espaço
curvo de dimensão n, onde os ı́ndices µ assumem n valores.
Um vetor é qualquer elemento de um espaço vetorial, cuja definição é bem conhecida
da Ágebra Linear. Exemplos de vetores são os vetores deslocamento num espaço plano,
velocidade instantânea (tangente a uma curva) e, num campo mais abstrato, os oper-
adores de diferenciação ∂/∂xµ . Num espaço curvo, o vetor deslocamento perde sentido
(por exemplo, o deslocamento entre dois pontos de uma esfera sequer pertence à
esfera). Por isso vamos definir vetores lançando mão de operadores de diferenciação
associados às tangentes a uma curva. Assim, vetores tangentes a uma curva num ponto
p, que formam um espaço vetorial de dimensão n, são dados por
d dxµ ∂
V≡ = , (11.1)
dλ dλ ∂xµ
onde os operadores de diferenciação atuam numa função escalar teste qualquer f (xµ ),
fornecendo a sua derivada no ponto p, e usamos a convenção de Einstein: ı́ndices
repetidos correspondem a uma soma de 1 a n.
Pode-se entender o conjunto de n vetores eµ ≡ ∂/∂xµ como uma base particular deste
espaço vetorial, constituı́da dos vetores tangentes às linhas coordenadas xµ no ponto
p, e dxµ /dλ como as componentes do vetor d/dλ nesta base. Se quisermos utilizar
um outro sistema de coordenadas para descrever os pontos do espaço curvo através
da transformação de coordenadas x0 µ = g µ (xν ) que, para ser bem definida, deve ter
jacobiano não nulo no ponto p, J ≡det|∂xν /∂x0 µ | = 6 0, as novas componentes do
mesmo vetor V = d/dλ = (dx /dλ)(∂/∂x ) na base (∂/∂x0 µ ) associada a estas novas
0µ 0µ
∂ ∂xν ∂ ∂xν
eµ0 ≡ = = eν . (11.3)
∂x0 µ ∂x0 µ ∂xν ∂x0 µ
Note que a base se transforma contrariamente às componentes e por isso os vetores
tangentes são também chamados de vetores contravariantes.
11.2.2 Tensores
387
da variedade. Como sabemos da álgebra linear, pode-se construir o espaço dual a
Tp , chamado Tp∗ , através do conjunto das aplicações lineares b̃ que levem um vetor
tangente pertencente a Tp num número real, b̃(V) = a. Pode-se construir a chamada
base dual de Tp∗ , w̃µ , através da definição
αβ...
Tµν... ≡ T(w̃α , w̃β , ...eµ , eν , ...). (11.5)
Akα (xγ + dxγ ) = Aα (xγ ) − Γαλµ (xγ )Aλ (xγ )dxµ , (11.7)
388
o que define a derivada covariante como
Aβ (xγ + dxγ ) − Akβ (xγ + dxγ )
Aβ||α ≡ Aβ;α ≡ ∇α Aβ ≡ lim
dx →0α dxα
= ∂α Aβ + Γβαν Aν . (11.8)
αβ...
∇λ Tµν... αβ...
≡ ∂λ Tµν... ηβ...
+ Γαηλ Tµν... + Γβηλ Tµν...
αη...
+ ...
−Γηµλ Tην...
αβ...
− Γηνλ Tµη...
αβ...
− .... (11.9)
Uma curva geodésica é definida como aquela cujo vetor tangente transportado parale-
lamente ao longo da curva do ponto p ao ponto q é igual ao próprio vetor tangente no
ponto q [V α (λ + dλ) = V kα (λ + dλ)], o que implica em V α ∇α V β = 0. Isto impõe a
equação da geodésica, dada por
d2 xµ α
µ dx dx
ν
+ Γ αν = 0. (11.10)
dλ2 dλ dλ
Como será visto, ela está relacionada com a queda livre dos corpos num campo grav-
itacional.
Note que no espaço plano em coordenadas cartesianas, cujas bases são constantes,
∇α eµ = 0 ⇔ Γβαµ = 0 (ou seja, no espaço plano em coordenadas cartesianas o trans-
porte paralelo não altera o vetor, como já sabemos) e a solução de (11.10) é a reta
tradicional. Evidentemente, para outros espaços, ou se trabalharmos com coordenadas
curvilı́neas no espaço plano, a conexão Γ não será nula e a solução da equação da
geodésica não será mais uma reta.
Como ∇α Aβ são as componentes de um verdadeiro tensor (1,1) e como ∂α Aβ não
se tranforma como um tensor, então Γβαµ também não pode se transformar como
um verdadeiro tensor para poder compensar este fato. É fácil verificar que Γβαµ se
transforma como
389
Figura 11.1: Transporte paralelo.
Rµνβα Aν ≡ ∇α ∇β Aµ − ∇β ∇α Aµ . (11.12)
Das equações acima podemos obter sua relação com a conexão:
O tensor de curvatura também está relacionado com uma quantidade muito impor-
tante: o desvio geodético. Seja η α o vetor que conecta dois pontos de mesmo parâmetro
ao longo de duas geodésicas vizinhas de vetor tangente V µ , que diferem uma da outra
apenas por uma pequena diferença nas suas condições iniciais. A equação do desvio
geodético é dada por
D2 ~η µ
≡ V α ∇α (V β ∇β η µ ) = Rµναβ V ν η α V β . (11.15)
Dλ2
390
Note que o tensor de curvatura é um tensor e não pode ser anulado por uma trans-
formação de coordenadas. Pode-se mostrar que um espaço é plano se e somente se o
tensor de curvatura é nulo em todos os pontos. Assim, o mais importante para carac-
terizar um espaço curvo não é a equação da geodésica, já que a conexão pode ser não
nula no espaço plano ou nula num ponto em um espaço curvo, mas sim a equação do
desvio geodético. Ela está relacionada, como será visto, com os efeitos de maré num
dado campo gravitacional.
O tensor de curvatura ainda satisfaz as chamadas identidades de Bianchi (verifique):
Esta é uma outra estrutura que podemos definir sobre a variedade, totalmente inde-
pendente da conexão. Ela é um campo tensorial (0,2) que associa dois vetores a um
número real, que fornece o ângulo entre eles. Tratando-se do mesmo vetor, podemos
associar tal número a sua magnitude. Suas componentes são gµν ≡ g(eµ , eν ). Nestas
notas, consideraremos a métrica simétrica. Para dois eventos separados pelo vetor
infinitesimal dxµ , o elemento de linha infinitesimal será dado por
Note que para um espaço plano n-dimensional em coordenadas cartesianas, gµν = δµν
(g = I) e para o espaço-tempo de Minkowski, gµν = ηµν .
Com o tensor métrico podemos definir um vetor covariante associado ao vetor con-
travariante V α da forma Vβ ≡ gβα V α ou, reciprocamente, com a sua inversa g µν ,
V β ≡ g βα Vα .
Podemos estabelecer uma relação entre a conexão e o tensor métrico impondo que
o ângulo entre dois vetores transportados pela conexão ao longo de uma curva se
mantenha constante ao longo deste transporte. Isto implica (verifique) que ∇α gµν = 0.
Estes são chamados de espaços de Riemann. Pode-se obter a conexão simétrica de um
espaço de Riemann completamente em função da geometria permutando-se os ı́ndices
da equação ∇α gµν = 0, obtendo (verifique)
1
Γβαν ≡ g βµ (∂ν gαµ + ∂α gνµ − ∂µ gαν ). (11.18)
2
Quando a conexão é dada por (11.18), as curvas geodésicas são também curvos com
ds extremo. Para o espaço plano, isto significa distância mı́nima. Para o espaço-tempo
plano de Minkowski, isto implica em distância mı́nima ou tempo próprio máximo
dependendo se a geodésica é tipo-espaço ou tipo-tempo, respectivamente.
391
Nos espaços de Riemann, o tensor de curvatura Rµναβ é anti-simétrico na troca de
ı́ndices nos primeiro e segundo pares, simétrico na troca global do primeiro par pelo
segundo e ainda satisfaz uma propriedade cı́clica nos últimos 3 ı́ndices
R ≡ g νβ Rνβ , (11.21)
e do tensor de Einstein
1
Gµν ≡ Rµν − Rgµν , (11.22)
2
que satisfaz, das identidades de Bianchi (11.16),
∇α Gαν = 0. (11.23)
1 ∂ 2 gµν
gµν = ηµν + | δxα δxβ + ... . (11.24)
2 ∂xα ∂xβ p
Portanto, nestes sistemas efeitos gravitacionais só podem ser percebidos em segunda
ordem nos deslocamentos. Referenciais associados a estes sistemas são chamados de
referenciais de Lorentz locais, em torno dos quais Einstein formulou seu Princı́pio de
Equivalência.
11.6 Exercı́cios
1) Mostre que, usando a regra de Leibniz e o fato de o operador ∇α se reduzir a ∂α
ao atuar numa função, pode-se reobter a equação (11.8) de ∇α Aβ ≡ (∇α A)(w̃β ) e
A = Aµ eµ .
392
2) Mostre as Eqs. (11.9),(11.10) e (11.11).
3) Mostra a Eq. (11.13) a partir de (11.12). Deduza (11.14).
4) Mostre que se o produto escalar entre dois vetores transportados pela conexão ao
longo de uma curva se mantem constante ao longo deste transporte então ∇α gµν = 0.
A seguir obtenha a Eq. (11.18) realizando permutações desta relação.
5) Mostre a identidade de Bianchi (11.16) e sua consequência (11.23). Sugestão: utilize
o sistema de coordenadas em que a conexão é nula e mostre que o resultado obtido é
válido em qualquer sistema de coordenadas.
6) Usando a mesma sugestão da questão anterior, demonstre a Eq. (11.19) e mostre
que o tensor de Riemann tem apenas 20 componentes independentes em 4 dimensões.
7) Calcule expressão explı́cita em termos de coordenadas esféricas em um espaço plano
tri-dimensional do laplaciano covariante de uma função escalar f , g αβ ∇α ∇β f , usando
a Eq. (11.18). Compare com o resultado conhecido.
393
Capı́tulo 12
Renato Klippert1
12.1 Introdução
A intuição corresponde a uma espécie de sı́ntese das experiências (vividas ou pen-
sadas) que constituem o passado daquele que possui tal intuição. Portanto, trata-se
de uma noção não objetiva, mas fortemente dependente do observador. Apesar disso,
ao deparar-se pela primeira vez com o estudo da Relatividade Especial, o aluno de
cursos de ciências exatas já deve ter sido apresentado a alguma disciplina de Mecânica
de Newton e, possivelmente, também ao Eletromagnetismo de Maxwell. Desta forma,
sua intuição incluirá certas experiências conceituais básicas relativas a tais temas. À
intuição partilhada por uma expressiva parcela da população denominamos senso co-
mum. Esta intuição é extremamente útil para avaliar o que é ou não razoável num
enorme número de problemas simples da vida cotidiana, e não deve de modo algum
ser descartada. Contudo, esta mesma intuição é por vezes um freio à compreensão de
novos fenômenos ou idéias, e isto freqüentemente de fato ocorre no estudo da Relativi-
dade Especial. Desta forma, este capı́tulo pretende levar o aluno a desenvolver uma
intuição relativı́stica.
12.1.1 Sinopse
394
do eletromagnetismo será importante somente para a leitura da Sub-seção 12.2.3 (a
qual pode ser omitida sem prejuı́zo na compreensão do conteúdo posterior). A Seção
12.3 desenvolve as bases fı́sicas da Relatividade, e a Seção 12.4 apresenta sua for-
mulação matemática em termos de coordenadas cartesianas. A Seção 12.5 detalha al-
gumas conseqüências desta teoria para a descrição cinemática de fenômenos da fı́sica,
e faz uso de conhecimentos básicos de ondulatória na Sub-seção 12.5.2 (a qual pode
ser omitida). A Seção 12.6 apresenta uma formulação relativı́stica da mecânica new-
toniana. Toda esta construção baseia-se numa unificação dos conceitos (previamente
independentes) de espaço e de tempo, numa nova entidade denominada espaço-tempo,
conforme é apresentado na Seção 12.7, numa técnica que é utilizada para resolver
problemas tı́picos da Teoria da Relatividade na Seção 12.8. Na Seção 12.9 analisa
uma generalização relativı́stica do Grupo de Galileu da mecânica clássica, fazendo
uso marginal do conceito matemático de grupo (cujo estudo prévio não é essencial), e
dando lugar à construção das grandezas fundamentais da fı́sica relativı́stica: os ten-
sores. A Seção 12.10 apresenta uma lista sumária de resultados de testes experimentais
da Relatividade Especial, servindo como uma justificativa pragmática ao estudo desta
teoria. As citações bibliográficas ao longo deste capı́tulo correspondem à lista a seguir
apresentada. Exercı́cios relativos ao presente capı́tulo encontram-se colecionados na
Seção 12.12. Um ı́ndice analı́tico dos principais termos utilizados no capı́tulo figura ao
final do mesmo.
A idéia básica desse texto consiste em servir como material de apoio a um mini-curso
do tema, de modo que sua estrutura pode ser particionada em aulas (com duração de
duas horas cada). Uma primeira aula é dedicada à apresentação do curso e às Secs.
12.2 e 12.3. As demais seções deste capı́tulo foram programadas para apresentação em
uma aula cada. Assim, a segunda aula é dedicada à Sec. 12.4, a terceira aula à Sec.
12.5, a quarta aula à Sec. 12.6, a quinta aula à Sec. 12.7, a sexta aula à Sec. 12.8 (com
possibilidade de inclusão de crı́ticas adicionais), e a sétima aula à Sec. 12.9. Desta
forma, o estudo dirigido deste capı́tulo requer um total de 14 horas, distribuı́das num
total de 7 aulas.
A Mecânica de Newton [3] consiste numa das mais sólidas e frutı́feras estruturas
conceituais até hoje concebidas no âmbito cientı́fico. Aliás, a noção atual do termo
ciência adquire seu significado à luz dessa teoria. Por outro lado, a primeira e mais bem
sucedida teoria de campo da fı́sica foi o Eletromagnetismo de Maxwell [2]. Nesta seção,
observaremos que a estrutura de invariância associada às leis da Mecânica Newtoniana
é incompatı́vel com aquela das leis do Eletromagnetismo Maxwelliano. A observação
deste fato levou os fı́sicos do século XIX a admitirem a existência do éter luminı́fero,
um meio material tênue e virtualmente imponderável, com respeito ao qual as leis
395
de Maxwell seriam válidas. Tentativas de evidenciar experimentalmente a presença
desse éter foram todas infrutı́feras (conforme os resultados da Sec. 12.10), fato que foi
julgado paradoxal na sua época mas que é essencial à Teoria da Relatividade Especial.
Apresenta-se aqui uma breve revisão dos conceitos e leis da mecânica de Newton [3].
A forma de apresentação adotada não necessariamente coincide com aquela suposta-
mente estudada anteriormente [7, 8].
Postulados de Newton
Decorre dessas definições e leis que, do ponto de vista estrito da mecânica de Newton,
todos os referenciais inerciais são indistingüı́veis entre si. Este importante re-
sultado constitui a assim denominada Relatividade Galileana da mecânica de Newton,
garantindo a possibilidade de escolha do referencial inercial a ser adotado conforme a
necessidade e/ou conveniência de cálculos. Os detalhes dessa relatividade de Galileu
serão analisados na Sec. 12.2.2, que corresponde à estrutura matemática subjacente à
Teoria Newtoniana.
396
Método de Galileu-Newton
A noção de força postulada por Newton apresenta problemas conceituais que foram
percebidos à época de sua construção. Em particular, a idéia de força pressupõe uma
espécie de ação à distância: um corpo atua sobre outro instantaneamente, indepen-
dentemente da distância entre ambos. Assim, para determinar todas as influências
sobre um dado corpo, faz-se necessário conhecer tudo o que existe em todo o Universo
sensı́vel.
Esta dificuldade levou à construção teórica da noção de campo, uma espécie de in-
termediário das interações entre os corpos, responsável pela transmissão através do
espaço e do tempo da informação relativa à presença do corpo-agente até o corpo-
objeto. A forma como este campo é produzido é descrita pela fı́sica de forma análoga
às leis de força, enquanto que sua ação sobre os corpos é descrita por uma lei que
envolve somente o corpo-objeto e o valor do campo na posição deste objeto. Para
descrever a forma de propagação desse campo, a fı́sica se vale usualmente da teoria
ondulatória. Com isso, o campo produzido por um corpo corresponde às potenciais
influências deste corpo sobre seu ambiente, e se propaga na forma de uma onda.
397
inercial com coordenadas cartesianas de espaço e tempo (t, x, y, z), para o qual as
leis de Newton são válidas. Analogamente, seja O0 um outro referencial inercial com
coordenadas cartesianas (t0 , x0 , y 0 , z 0 ) — para o qual as leis de Newton são igualmente
válidas.
Suponhamos que o referencial O0 se move com velocidade V~OO0 , conforme determinada
pelo referencial O. Se ambos os referenciais são inerciais, então a velocidade relativa
V~OO0 entre eles é constante. Seja P um arbitrário evento (isto é, um ponto do espaço
num especı́fico instante de tempo). Sejam (tP , xP , yP , zP ) as coordenadas de espaço
e de tempo do evento P relativas ao referencial O, e designemos as correspondentes
coordenadas deste mesmo evento P relativas ao referencial O0 por (t0P , x0P , yP0 , zP0 ). Por
simplicidade, suponhamos que os eixos cartesianos correspondentes nos referenciais
inerciais O e O0 sejam paralelos, e que a velocidade relativa V~OO0 seja V dirigida ao
longo do eixo Ox. Esses conjuntos de coordenadas se relacionam segundo o Grupo
de Galileu: 0
tP = tP + to
x0 = x − V t + x
P P P o
0
(12.1)
y P = yP + yo
0
zP = zP + zo .
Nas Eqs. (12.1) figuram as constantes (to , xo , yo , zo ), as quais correspondem tão so-
mente a uma translação constante na origem temporal e espacial, e que são usualmente
omitidas por simplicidade. Destas relações decorre que as diferenças entre essas co-
ordenadas são ∆t0P = ∆tP e ∆R ~ 0 = ∆R ~ − V~OO0 ∆tP (em notação vetorial). Assim, a
velocidade do referencial O com respeito ao referencial O0 é
dR~0 d ~ ~
V~O0 O = O
= (RO − ~OO0 tO ) = dRO − V~OO0 = −V~OO0 ,
V
dt0O dtO dtO
onde a última igualdade acima resulta do fato de ser constante no tempo a posição
no espaço da origem espacial do referencial O, conforme determinado pelo próprio
~ O /dtO = ~0. Assim, obtemos que V~O0 O = −V~OO0 .
referencial O. Isto é, dR
Do ponto de vista do referencial O0 , e considerando o resultado acima, temos as Eqs.
(12.1) na forma inversa
tP = t0P + t0o
x = x0 + V t 0 + x0
P P P o
0 0
(12.2)
yP = yP + yo
zP = zP0 + zo0 ,
onde as novas constantes (t0o , x0o , yo0 , zo0 ) podem ser facilmente determinadas em termos
de (to , xo , yo , zo ) e da velocidade relativa V~OO0 entre os referenciais.
398
bem como a propagação de ondas eletromagnéticas (tais como a luz visı́vel). Esta
~ = (Ex , Ey , Ez ) e magnético B
teoria baseia-se na existência dos campos elétrico E ~ =
(Bx , By , Bz ), bem como na noção de carga elétrica q e de corrente elétrica i. Por
simplicidade, consideraremos somente o eletromagnetismo no vácuo.
~ e
Um corpo carregado com carga q e velocidade ~v , na presença de campos externos E
~ encontra-se sujeito à força local de Lorentz
B,
~ + q ~v × B.
F~ = q E ~ (12.3)
c
Mais formalmente, essas leis podem ser escritas no sistema internacional de unidades
(por meio da permissividade elétrica do vácuo εo e da permeabilidade magnética do
vácuo µo ) na forma integro-diferencial
~ = Q
~ · dS
H
S
E εo
~ ~
H
S
B · dS = 0
(12.4)
~ = −d
~ · d` ~
~ · dS
H R
E B
C dt
S
~ = µ o i + εo d
~ · d` ~ ,
~ · dS
H R
B E
C dt S
onde S representa uma superfı́cie fechada arbitrária nas duas primeiras igualdades e
Q é a carga elétrica lı́quida contida no volume limitado pela superfı́cie S, ao passo que
nas duas últimas igualdades S é uma superfı́cie aberta arbitrária cujo contorno é a
curva C e i é a corrente elétrica lı́quida que atravessa a superfı́cie S. Alternativamente,
3
As leis de Maxwell foram traduzidas em palavras visando o máximo de simplicidade, às custas de
precisão: o sistema de unidades no qual tais enunciados são válidos pode ser desconhecido ao estudante.
399
podemos escrever essas leis na forma diferencial
~ ·E
∇ ~ = ρ
εo
~ ·B
∇ ~ = 0
(12.5)
∇ ~ = −∂B
~ ×E ~
∂t
∇ ~ = µo J~ + εo ∂ E
~ ×B ~ ,
∂t
onde ρ é a densidade volumétrica de carga elétrica e J~ é a densidade superficial de
corrente elétrica.
As Eqs. (12.5), quando escritas na ausência de fontes (ρ = 0 e J~ = ~0 ), implicam (ver
Exercı́cio 1) que cada uma das componentes cartesianas de ambos os campos elétrico
e magnético são soluções da equação da onda
1 ∂2
2
− ∇ Φ(t, x, y, z) = 0, (12.6)
v 2 ∂t2
√
(isto é, Φ = Ex e Φ = By são soluções), com velocidade v = 1/ µo εo = c cujo
valor numérico coincide com o valor experimental (Sec. 12.10) para a velocidade de
propagação da luz no vácuo. Assim, a teoria de Maxwell prevê uma velocidade natural
de propagação da luz no espaço vazio, em contradição com a relatividade de Galileu.
Pois, conforme as Eqs. (12.1), se algum referencial inercial O determina para a luz
uma velocidade de propagação v = c, outro referencial inercial O0 que se move com
respeito ao primeiro com velocidade u 6= 0 (na mesma direção e sentido do movimento
luminoso) irá determinar para a luz uma velocidade de propagação v 0 = c − u distinta
da velocidade v = c.
vO0 = vO − VOO0 ,
400
absoluta para a propagação da luz no vácuo, então o princı́pio de relatividade de
Galileu deve estar errado. Portanto, (pelo menos) uma dentre as seguintes alternati-
vas deverá ser verdadeira: ou existem referenciais inerciais privilegiados (aqueles que
determinam para a luz a velocidade c prevista teoricamente, e que se encontram em
repouso no espaço absoluto), ou as Eqs. (12.1) não são válidas no caso geral envol-
vendo altas velocidades. As evidências experimentais apontaram para a última dessas
possibilidades (conforme a relação apresentada na Seção 12.10), e o raciocı́nio que
segue admite isto como válido.
Postulados de Einstein
401
A noção de espaço é claramente dependente da escolha do observador inercial que
o determina, bem como a idéia de deslocamento.4 Por outro lado, a velocidade de
um corpo material (ponderável ou não) é, por definição, o espaço por ele percorrido
na unidade de tempo, conforme determinados por um observador (inercial). Assim, a
conjunção dos dois postulados de Einstein implicam (ver Exercı́cio 2) que a noção de
intervalo de tempo seja também dependente de observador, de tal modo que a razão
Espaço percorrido pela luz
Tempo de percurso
possa resultar numa grandeza absoluta (e igual a c), independente do observador
inercial escolhido, tal como requer o postulado de invariância. Portanto, as idéias
Newtonianas de tempo absoluto e de velocidades relativas ao observador devem ser
substituı́das na Relatividade Especial pelas idéias Einsteinianas de tempo relativo
ao observador e de velocidade da luz absoluta.5 Isto posto, fica claro que o enunci-
ado “Tudo é relativo”, usualmente atribuı́do à Relatividade Especial, é exagerado e
enganoso, se não quisermos ser rigorosos em considerá-lo como sendo completamente
equivocado.
É usual o estudante sentir dificuldades na mecânica de Newton ao estudar o tema ‘re-
ferenciais inerciais’, por não depositar a devida atenção à questão “Qual observador
faz qual medida?”. Essas dificuldades costumam ter lugar também no estudo da Re-
latividade Especial, pela mesma razão, e são agravadas pela relatividade das medidas
de tempo impostas por esta teoria (contrariamente ao senso comum que atribui ao
tempo uma noção absoluta). Assim sendo, o item (8) do Método de Newton (Seção
12.1) deve ser entendido na Relatividade Especial como referindo-se à comparação
relativı́stica entre medidas efetuadas em distintos referenciais inerciais, tema central
da Seção 12.4.
Ainda com respeito aos fundamentos da teoria, é freqüente encontrar textos mencio-
nando que a Relatividade Especial vale apenas para movimento uniforme, sendo ina-
dequada para descrever movimentos acelerados (cujo estudo requereria a Relatividade
Geral para uma descrição relativı́stica adequada). Também isto é incorreto, embora
um pouco mais próximo da verdade. A Relatividade Especial é uma teoria sobre a
comparação entre medidas efetuadas por referenciais inerciais em movimento relativo,
e não sobre quais são essas medidas. Desta forma, ela admite que o observador seja
inercial, mas nada afirma a respeito do tipo de movimento de um corpo descrito por
esse observador. Em outras palavras, a aceleração do Sistema de interesse é um con-
ceito tão lı́cito na Relatividade Especial quanto o é na Mecânica Newtoniana. Contudo,
referenciais não inerciais são desqualificados pela Relatividade Especial (tal como o
eram pela Mecânica Newtoniana). Medidas feitas por tais “maus observadores” com
efeito requerem a Relatividade Geral para uma descrição adequada a situações onde
4
Esta relatividade do espaço também ocorre na mecânica de Newton.
5
Velocidades outras que não a da luz no vácuo são dependentes de observador também na Relatividade
Especial, conforme a Seção 12.5.1.
402
as velocidades envolvidas são comparáveis à velocidade da luz no vácuo. O estudo da
Teoria da Relatividade Geral é tema do Capı́tulo 1.
Como última observação de caráter geral, cumpre salientar o papel do sistema de
coordenadas. Visto que a Relatividade Especial resulta ser, em essência, uma teoria
sobre a linguagem da fı́sica, não é surpreendente que distintos sistemas de coordenadas
sejam tratados de forma distinta. Em primeiro lugar, é comum (e nem sempre cor-
reto) identificar escolha do referencial inercial com escolha do sistema de coordenadas
cartesianas. Quando isto é feito, entende-se que o sistema de coordenadas escolhido
está adaptado ao observador; ou seja, a coordenada que mede o tempo associado aos
eventos neste sistema coordenado coincide com algum instrumento (como um relógio)
que mede a passagem do tempo ao longo da história do observador (isto é, a coleção
de eventos que o localizam no espaço ao longo do tempo). Embora seja bastante raro
uma escolha de coordenadas não adaptadas ao observador no contexto da Relativi-
dade Especial, observa-se o contrário na Teoria da Relatividade Geral. Desta forma,
o presente capı́tulo utiliza-se exclusivamente de sistemas coordenados adaptados ao
observador.
Em segundo lugar, o sistema de coordenadas cartesianas nem sempre é a forma mais
conveniente de descrever um dado Sistema (fı́sico ou matemático) de interesse. Com
efeito, o estudante talvez já esteja familiarizado com alguns sistemas de coordenadas
curvilı́neas, tais como as coordenadas polares (a duas dimensões), e as cilı́ndricas
e esféricas (a três dimensões). Embora seja possı́vel utilizar tais sistemas coordena-
dos não cartesianos na Relatividade Especial, isto introduz complicações matemáticas
desnecessárias neste momento, de modo que a apresentação neste capı́tulo restringe-se
ao uso de coordenadas cartesianas. Tais dificuldades não podem ser evitadas no estudo
da Relatividade Geral, contudo. Portanto, é sugerido ao leitor que, após ter concluı́do
o estudo dos Capı́tulos 1 e 11, retorne ao presente capı́tulo para considerar as modi-
ficações necessárias à Teoria da Relatividade Especial quando descrita em termos de
sistemas de coordenadas não cartesianos.
12.3.2 Sincronicidade
Dos resultados obtidos na Sec. 12.3.1 temos que o conceito relativı́stico de tempo não
é independente do observador inercial que o determina. Apesar disso, como veremos
na Sec. 12.4.2, a ordem temporal com que os observadores percebem os eventos é
preservada. Esta ordem unı́voca corresponde, de certa forma, à noção de causalidade da
fı́sica: as influências ocorrem de modo que as causas precedem seus próprios
efeitos. A conexão entre ordem temporal de eventos e causalidade requer uma espécie
de revisão no contexto da Relatividade Especial.
Entende-se por referencial uma coleção de observadores (um em cada ponto relevante
do espaço), em repouso relativo entre si, dispondo de réguas e relógios sincronizados.
403
Um destes observadores é qualificado, arbitrariamente, como sendo a “origem” do
referencial. A cada um desses observadores, associa-se coordenadas espaciais corres-
pondentes à sua respectiva posição relativa à origem, conforme medidas por qualquer
um deles. Embora essas posições espaciais não representem dificuldade, a sincronização
de seus relógios apresenta certa arbitrariedade.
Suponhamos que os observadores desse referencial disponham de relógios que operem
com mecanismos idênticos. Um desses observadores “mostra” ao outro a medida que
consta em seu próprio relógio. Para que o outro observador “veja” isto, é necessário
que a luz que codifica essa imagem viaje desde o primeiro observador até o segundo,
percorrendo com velocidade c a distância finita entre eles e, portanto, levando neste
percurso um tempo finito. Assim, a imagem que o segundo observador percebe do
relógio do primeiro encontra-se temporalmente atrasada com respeito àquela de seu
próprio relógio no evento A caracterizado por “segundo observador vê o relógio do
primeiro observador”. Este atraso inferido ∆t corresponde à razão entre a distância
∆x entre os observadores e a velocidade da luz nesse percurso retilı́neo, ou seja ∆t =
∆x/c. Desta forma, se a diferença entre a leitura do relógio do segundo observador no
evento A e a leitura por ele visualizada no relógio do primeiro observador nesse evento
coincidir exatamente com o cálculo ∆t acima, então dizemos que os relógios desses
dois observadores estão sincronizados (a la Einstein).
Para efetuar a sincronização de todos os relógios de um dado referencial inercial pelo
método acima, imaginemos que o observador na origem deste referencial ilumina mo-
mentaneamente seu próprio relógio no instante em que este marca o tempo “zero”. A
imagem assim produzida evolui no espaço, e progressivamente atinge os demais ob-
servadores desse referencial, tanto mais atrasada quanto maior a distância da origem
até cada um deles. Cada um desses observadores A, à distância dA da origem, é pre-
viamente instruı́do para acionar seu relógio, marcando “zero” + (dA /c), no instante
em que a imagem do tempo “zero” na origem o atinge. Como tratam-se de relógios
com mecanismos idênticos, seu funcionamento similar a partir de então deve preservar
este sincronismo inicial,6 de modo tal que esses relógios estarão sincronizados (a la
Einstein) para medições futuras de tempo.
Com base nos postulados de Einstein (Sec. 12.3.1), encontram-se desenvolvidas aqui as
regras relativı́sticas de comparação de medidas efetuadas por referenciais inerciais em
movimento relativo, denominadas Leis de Transformação de Coordenadas (Cartesianas
adaptadas) de Lorentz (ou simplesmente Transformações de Lorentz). Estas regras as-
sumem, na Relatividade Especial, o papel desempenhado na Mecânica de Newton
6
Isto é válido se o espaço é homogêneo e isotrópico, como estamos ora supondo, mas via de regra não
é verdadeiro nas situações mais amplas descritas pela Relatividade Geral.
404
pelas leis de transformação de coordenadas de Galileu, Eqs. (12.1). A obtenção das
Transformações de Lorentz encontra-se a seguir desenvolvida passo-a-passo [7], em
termos de Gedankenexperiment, (experiências de pensamento), isto é, experimentos
idealizados realizáveis em princı́pio (porém não realizados efetivamente), cujos resulta-
dos podem ser previstos teoricamente apenas com base nos postulados e nas definições
das grandezas fı́sicas envolvidas.
405
e, ao passar por este, determinaria um ponto interno ao bastão A correspondente à
extremidade superior de B naquele evento, conforme Fig. 12.1 (b).
Consideremos o ponto de vista do observador O0 , para quem B está em repouso e A
encontra-se com velocidade u dirigida ao longo do sentido negativo do eixo O0 x0 . Como
supusemos que o movimento encurta as dimensões transversas, parecerá a O0 que o
bastão A é o menor. Portanto, ao passar por B, o bastão A determinaria um ponto
interno àquele correspondente à extremidade superior de A naquele evento, conforme
Fig. 12.1 (c).
A noção de evento, contudo, não deve depender do observador: se o evento “extremi-
dade superior do menor bastão no instante de encontro dos bastões” localiza para O
um ponto interno ao bastão A, então é inaceitável que este mesmo evento localize para
O0 a extremidade de A. Assim, a hipótese acima de que o movimento ao longo de x
reduz as dimensões y e z não pode ser verdadeira, pois conduziria a uma contradição.
É imediato perceber que a hipótese de que o movimento em x dilate as dimensões
y e z conduziria analogamente a resultados igualmente inaceitáveis, sendo portanto
igualmente falsa. Resulta desse raciocı́nio que o movimento ao longo da direção x não
modifica quaisquer das dimensões transversas y e z:
(
y = y0
(12.7)
z = z0.
A emissão do raio de luz pela lanterna e seu retorno a esta determinam os eventos A e
B, e o referencial O0 associa a esses eventos uma diferença de tempo t0 . Visto que O0
percebe a luz com velocidade c (por postulado), e que a distância por esta percorrida
no trajeto de subida e descida é 2d, então devemos ter t0 = 2d/c para o tempo de
trânsito da luz neste referencial.
O mesmo experimento pode ser analisado do ponto de vista do observador O, que
percebe todo o aparato em movimento com velocidade u horizontal. Para O, o cami-
nho percorrido pelo raio de luz que atinge o espelho e retorna à lanterna não é vertical,
406
Figura 12.2: A invariância da velocidade da luz requer que o tempo entre dois dados
eventos pareça menor para o observador inercial que os situa no mesmo ponto do espaço
do que para qualquer outro observador inercial em movimento com respeito ao primeiro.
mas sim uma trajetória inclinada como ilustra a Fig. 12.2 (b). Para a subida, enquanto
o raio luminoso desloca-se verticalmente a distância y = d — igual àquela medida pelo
referencial O0 , pois trata-se de um comprimento medido perpendicularmente ao movi-
mento relativo, conforme discutido na Sec. 12.4.1 — ele também desloca-se horizontal-
mente a distância x = ut1 no tempo de subida t1 . Assim, a distância total percorrida
p
pela luz na subida é dada (pelo teorema de Pitágoras) por l1 = d2 + (ut1 )2 . Como
trata-se de um raio de luz percorrendo no vácuo a distância l1 no tempo t1 , temos (por
postulado) que l1 = ct1 , de modo que a igualdade entre estas distâncias resulta em
√
t1 = d/ c2 − u2 . Para o trajeto de descida, temos relações análogas: a distância per-
p √
corrida no tempo t2 de descida será l2 = d2 + (ut2 )2 = ct2 , donde t2 = d/ c2 − u2 .
√
O tempo total do percurso luminoso será t = t1 + t2 = 2d/ c2 − u2 .
t0
t= p , (12.8)
1 − (u/c)2
onde t0 é o intervalo de tempo definido entre esses mesmos eventos pelo observador O0
que os observa no mesmo ponto do espaço. Em geral, o intervalo de tempo τ = t0 na
Eq. (12.8), relativo a medidas entre dois eventos A e B no mesmo ponto do espaço,
é denominado (no contexto da Relatividade Especial) de tempo próprio entre esses
eventos, e corresponde ao menor lapso de tempo possı́vel entre os referidos eventos que
pode ser determinado por algum referencial inercial (pois t ≥ t0 ). É usual representar
intervalos de tempo próprio pelo sı́mbolo τ .
407
12.4.3 Contração do comprimento
Figura 12.3: A invariância da velocidade da luz requer que a distância entre dois dados
eventos pareça maior para o observador inercial que os determina entre pontos em repouso
no espaço do que para qualquer outro observador inercial em movimento com respeito ao
primeiro.
A emissão do raio de luz pela lanterna e seu retorno a esta determinam os eventos A e
B, e o referencial O0 associa a esses eventos uma diferença de tempo t0 . Visto que O0
percebe a luz com velocidade c (por postulado), e que a distância por esta percorrida
no trajeto de ida e volta é 2d, então devemos ter t0 = 2d/c para o tempo de trânsito
da luz neste referencial.
O mesmo experimento pode ser analisado do ponto de vista do observador O, que
percebe todo o aparato em movimento com velocidade u horizontal, conforme a Fig.
12.3 (b). Para O, o ponto do espaço onde a luz atinge o espelho corresponde ao encontro
no instante intermediário t1 do raio de luz (com velocidade c a partir da origem) com
o espelho (com velocidade u a partir da posição inicial x). Assim, temos ct1 = x + ut1 ,
donde x = (c − u)t1 , pois o espelho e o raio de luz viajam no mesmo sentido. Para
o retorno do raio de luz, contudo, o raio de luz e seu alvo (a lanterna), embora
inicialmente separados pela mesma distância x acima, viajam em sentidos opostos
com velocidades de mesma magnitude que acima. Portanto, o tempo de retorno t2
satisfaz à relação x = (c + u)t2 . Desta forma, o tempo total (ida e volta) do percurso
408
luminoso será
1 1 2c
t = t1 + t2 = x + =x .
c−u c+u c2 − u2
Conforme o resultado da Sec. 12.4.2, o tempo próprio t0 entre os eventos A e B (pois
o referencial O0 os determina no mesmo ponto do espaço) relaciona-se com o tempo t
acima por meio da Eq. (12.8), de modo que temos
1 t 2xc/(c2 − u2 ) x 1
p = 0 = = .
1 − (u/c)2 t 2d/c d 1 − (u/c)2
Desta forma, obtemos finalmente que a distância x entre a lanterna e o espelho em
movimento, como determinado pelo referencial O, é dada por
p
x = 1 − (u/c)2 x0 , (12.9)
409
Figura 12.4: Eventos simultâneos para um dado referencial inercial podem ser caracteriza-
dos como ocorrendo em tempos diferentes para um referencial inercial em movimento com
respeito ao primeiro, devido ao procedimento de Einstein de sincronização de relógios.
entre a chegada ao ponto médio dos pulsos de luz emitidos nos eventos A e B é
percebida pelo referencial O como sendo a diferença de tempo entre esses eventos.
1
γ=q , (12.11)
1 − (u/c)2
410
de mudança de coordenadas entre referenciais inerciais com magnitude da velocidade
relativa u. O fator de Lorentz satisfaz a relação γ ≥ 1. Nos casos em que esta velocidade
relativa u não seja clara do contexto, a notação γu é preferı́vel.
e sua lei inversa (ver Exercı́cio 5), a qual pode ser obtida daquela acima por meio das
~ ↔R
substituições formais t ↔ t0 , R ~ 0 , e u → −u (além de to → t0o e R
~o → R
~0 )
o
onde as constantes (to , xo , yo , zo ) e suas análogas (t0o , x0o , yo0 , zo0 ) desempenham, na
Relatividade Especial, papel análogo das constantes homônimas que figuram nas Eqs.
(12.1) na Mecânica de Newton — e serão, em geral, omitidas na teoria de Einstein
tal como o eram na de Newton. Aliás, as Eqs. (12.12) desempenham elas próprias na
Relatividade Especial o mesmo papel das Eqs. (12.1) na Mecânica de Newton.
Cumpre notar que as Eqs. (12.12) de Lorentz aproximam-se das Eqs. (12.1) de Galileu
no limite de baixas velocidades u c (de modo que c2 → ∞ e γ → 1). Por exemplo,
para uma velocidade u = 30Km/s (tı́pica para o movimento dos planetas em torno do
Sol, e sensivelmente maior do que as velocidades de objetos macroscópicos na superfı́cie
terrestre), temos u/c ≈ 10−4 e γ − 1 ≈ 5 · 10−9 . Portanto, a Mecânica de Newton deve
ser encarada, nesta perspectiva, como o limite de baixas velocidades da Mecânica de
Einstein (ou relativı́stica), a qual será formulada posteriormente (Sec. 12.6) com base
nos resultados acima.
411
12.5 Cinemática relativı́stica
Considere o movimento de uma partı́cula material P (ou qualquer outro sistema fı́sico
de interesse cuja descrição, em cada instante, resume-se a um ponto do espaço),
conforme descrito por um referencial inercial O. Assim, num genérico instante t,
a partı́cula P encontra-se no ponto caracterizado pelo vetor posição R ~ = R(t)
~ =
~ ~ ~
x(t)i + y(t)j + z(t)k expresso nas coordenadas cartesianas utilizadas pelo referencial
O. Com isto, a história da partı́cula P (ou sua
linha
de universo) é definida (por
~
O) pela coleção de eventos da forma t, R(t) = t, x(t), y(t), z(t) para todos os
valores do parâmetro t no domı́nio das funções x(t), y(t), e z(t).
Embora a representação de um evento em coordenadas possa depender do observador
inercial escolhido, o evento não é dependente do observador nem das coordenadas por
ele escolhidas. Assim, a história da partı́cula P , conforme a definição acima, é uma
noção relativisticamente invariante.
Considere dois arbitrários eventos A e B na história de P , respectivos aos (igual-
mente arbitrários) instantes de tempo tA e tB determinados por O. O deslocamento
Newtoniano da partı́cula P desde A até B é dado por
~ ~ ~
RAB = R(tB ) − R(tA ) = x(tB ) − x(tA ), y(tB ) − y(tA ), z(tB ) − z(tA ) .
~ AB
~v AB = (vABx , vABy , vABz ) = t R− tA
B
x(tB ) − x(tA ) y(tB ) − y(tA ) z(tB ) − z(tA )
= tB − tA , tB − tA , tB − tA .
412
e, em geral, ~v (t) = vx (t), vy (t), vz (t) para cada instante de tempo t.
A aceleração média Newtoniana de P no percurso de A para B é dada por
~v AB vx (tB ) − vx (tA ) vy (tB ) − vy (tA ) vz (tB ) − vz (tA )
~aAB = = , , .
tB − tA tB − tA tB − tA tB − tA
A aceleração instantânea Newtoniana de P no evento A é então
~aA = ax (tA ), ay (tA ), az (tA ) = lim ~aAB
tB →tA
vx (tB ) − vx (tA ) vy (tB ) − vy (tA ) vz (tB ) − vz (tA )
= lim t −t , lim t −t , lim t −t ,
tB →tA B A tB →tA B A tB →tA B A
e, em geral, ~a(t) = ax (t), ay (t), az (t) para cada instante de tempo t.
Consideremos a construção dessas mesmas quantidades cinemáticas conforme deter-
minadas pelo referencial inercial O0 , que se move com respeito ao referencial O com
velocidade u dirigida no sentido positivo do eixo Ox, conforme a Sec. 12.4. Para O0 , os
eventos que constituem a história de P são representados, conforme as Eqs. (12.12),
por
t0 , x0 (t0 ), y 0 (t0 ), z 0 (t0 ) = γu [t − u x(t)/c2 ], γu [x(t) − u t], y(t), z(t) .
0 0 0 0 R~0
~v AB = (vABx , vABy , vABz ) = 0 AB 0
tB − tA
0 0
x (tB ) − x (tA ) y (tB ) − y 0 (t0A ) z 0 (t0B ) − z 0 (t0A )
0 0 0 0
= , ,
t0B − t0A t0B − t0A t0B − t0A
γu {[x(tB ) − x(tA )] − u(tB − tA )} y(tB ) − y(tA ) z(tB ) − z(tA )
= , ,
γu {(tB − tA ) − u[x(tB ) − x(tA )]/c2 } t0B − t0A t0B − t0A
[x(tB ) − x(tA )]/(tB − tA ) − u y(tB ) − y(tA ) z(tB ) − z(tA )
= , , .
1 − u[x(tB ) − x(tA )]/[c2 (tB − tA )] t0B − t0A t0B − t0A
Ou seja, a componente longitudinal (isto é, na direção do movimento relativo entre os
0 0
referenciais) da velocidade ~v AB é então vABx = [vABx − u]/[1 − vABx u/c2 ]. Já para as
0
componentes transversais da velocidade ~v AB , temos
0 y(tB ) − y(tA ) vABy
vABy = 2 = ,
γu {(tB − tA ) − u[x(tB ) − x(tA )]/c } γu (1 − vABx u/c2 )
0
e analogamente vABz = vABz /[γu (1 − vABx u/c2 )]. Para a velocidade instantânea de P
em A, temos
~v 0A = 0
lim (vABx 0
, vABy 0
, vABz )
t0B →t0A
v Ax − u vAy vAz
= , , .
1 − vAx u/c2 γu (1 − vAx u/c2 ) γu (1 − vAx u/c2 )
413
Para cada instante de tempo t0 , temos v 0 (t0 ) = vx0 (t0 ), vy0 (t0 ), vz0 (t0 ) ≡ (vx0 , vy0 , vz0 )
onde
vx0 = vx − u 2
1 − vx u/c
vy
vy0 = (12.14)
γu (1 − vx u/c2 )
vz0 =
vz ,
γu (1 − vx u/c2 )
vx0 + u
vx =
1 + vx0 u/c2
vy0
vy = (12.15)
γu (1 + vx0 u/c2 )
vz0
vz =
.
γu (1 + vx0 u/c2 )
vx (tB ) − u vx (tA ) − u
2 −
vx0 (t0B )
− vx0 (t0A ) 1 − vx (tB )u/c 1 − vx (tA )u/c2
a0ABx = =
t0B
− t0A γu {(tB − tA ) − u[x(tB ) − x(tA )]/c2 }
[vx (tB ) − u][1 − vx (tA )u/c2 ] − [vx (tA ) − u][1 − vx (tB )u/c2 ]
=
[1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ]γu (tB − tA )[1 − vABx u/c2 ]
[vx (tB ) − vx (tA )][1 − u2 /c2 ]
=
γu [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ](tB − tA )[1 − vABx u/c2 ]
= aABx .
(γu )3 [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]
414
Para as componentes transversais, temos
vy (tB ) vy (tA )
vy0 (t0B )
− vy0 (t0A ) −
γ [1 − vx (tB )u/c ] γu [1 − vx (tA )u/c2 ]
2
a0ABy = = u
t0B
− t0A γu (tB − tA )[1 − vABx u/c2 ]
vy (tB )[1 − vx (tA )u/c2 ] − vy (tA )[1 − vx (tB )u/c2 ]
=
[1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ](γu )2 (tB − tA )[1 − vABx u/c2 ]
vABy − {[vy (tB ) − vy (tA )]vx (tA ) − vy (tA )[vx (tB ) − vx (tA )]}u/c2
=
(γu )2 (tB − tA )[1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]
aABy − [aABy vx (tA ) − vy (tA )aABx ]u/c2
=
(γu ) [1 − vx (tA )u/c2 ][1 − vx (tB )u/c2 ][1 − vABx u/c2 ]
2
e analogamente
0
A
aceleração instantânea Newtoniana de P no evento A é então expressa na forma ~aA =
a0x (t0A ), a0y (t0A ), a0z (t0A ) = 0lim0 ~a0AB = 0lim0 (a0ABx , a0ABy , a0ABz ), com componente
tB →tA tB →tA
longitudinal
ax (tA )
= ,
(γu )3 [1 − vx (tA )u/c2 ]3
e componentes transversais
t0 , onde
ax
a0x = 3
vx u/c2 ]3
(γ u ) [1 −
a [1 − vx u/c2 ] + ax vy u/c2
a0y = y (12.16)
(γu )2 [1 − vx u/c2 ]3
a [1 − vx u/c2 ] + ax vz u/c2
a0z = z ,
(γu )2 [1 − vx u/c2 ]3
onde a dependência funcional das funções foi omitida por simplicidade de notação.
As Eqs. (12.16) estabelecem a lei de transformação de acelerações entre referenciais
415
inerciais, cuja lei inversa deve ter a mesma forma (ver Exercı́cio 6), e pode ser dessa
obtida pelas substituições formais u → −u e ~v ↔ ~v 0 e ~a ↔ ~a0
γu a0x
a x =
[1 + vx0 u/c2 ]3
a0 [1 + vx0 u/c2 ] − a0x vy0 u/c2
ay = y (12.17)
γu [1 + vx0 u/c2 ]3
0 0 2 0 0 2
az = az [1 + vx u/c 0] − a2x v3z u/c .
γu [1 + vx u/c ]
Observa-se das Eqs. (12.16) que, à diferença do que ocorre no caso das velocidades
Eqs. (12.14), a escolha do observador pode alterar o número de componentes não nulas
da aceleração de um dado sistema fı́sico: por exemplo, se ax 6= 0 e ay = 0, com vy 6= 0,
então as Eqs. (12.16) implicam em a0x 6= 0 e a0y 6= 0.
Embora sua descrição seja mais trabalhosa, as ondas mecânicas são usualmente mais
intuitivas ao leigo, talvez por tratarem de conformações materiais ao invés de con-
416
figurações de grandezas abstratas. Assim sendo, discutiremos inicialmente o efeito
Doppler para ondas mecânicas.
Supondo que M seja um meio inercial (isto é, seja não acelerado), denomine-se O um
referencial inercial com respeito ao qual M encontra-se em repouso. Analogamente,
sejam O0 e O00 referenciais inerciais (com coordenadas cujos eixos sejam paralelos aos
correspondentes eixos das coordenadas de O) tais que se encontram em repouso F
com respeito a O0 e D com respeito a O00 . Por simplicidade, trataremos inicialmente
o problema unidimensional (direção Ox). Sejam xF e vF respectivamente a posição e
a velocidade da fonte, e sejam xD e vD respectivamente a posição e a velocidade do
detector, com respeito a O. Se xD − xF > 0, então temos que vF > 0 significa que o
movimento de F aproxima-a de D, e vD > 0 significa que o movimento de D afasta-o
de F .
Para um observador em repouso com respeito a O0 (tal como a fonte F , por exemplo),
cada pulso produzido por F tem extensão espacial λo , sendo dois sucessivos pulsos
separados pelo lapso de tempo To . Por definição de comprimento de onda e de perı́odo,
8
A propagação de uma dada onda num dado meio é tema da fı́sica ondulatória, e a velocidade de
propagação desta onda resulta depender tanto das carcterı́sticas desta quanto das do meio material no
qual ela se propaga. Não serão discutidos aqui esses detalhes.
9
Observa-se que não estamos supondo que os pulsos possuam identificação invariante, de modo que o
“primeiro pulso produzido por F ” pode eventualmente jamais ser detectado por D. Os termos primeiro e
segundo que figuram nos enunciados dos eventos referem-se ora à ordem com que os pulsos são produzidos
por F (para os eventos A, B, C), ora à ordem com que eles são detectados por D (para os eventos Ā, B̄,
C̄).
417
neste referencial temos λo = |x0AB | (os eventos A e B são simultâneos) e To = t0BC (os
eventos B e C ocorrem no mesmo ponto do espaço).
Para um observador em repouso com respeito ao referencial O00 (tal como o detector
D, por exemplo), temos λd = |x00ĀB̄ | (pois os eventos Ā e B̄ são simultâneos) e Td = t00B̄ C̄
(pois os eventos B̄ e C̄ ocorrem no mesmo ponto do espaço).
Para um observador em repouso com respeito a O (tal como o meio M , por exemplo),
as quantidades xAB e tBC podem ser obtidas da lei de transformação de coordenadas
de Lorentz, Eqs. (12.13), fazendo u = vF (velocidade de O0 com respeito a O) nes-
sas equações. Resulta, portanto, que xAB = γvF λo e tBC = γvF To . Analogamente, as
quantidades xĀB̄ e tB̄ C̄ podem ser obtidas daquela mesma lei fazendo u = vD (veloci-
dade de O00 com respeito a O) nessas equações. Resulta, portanto, que xĀB̄ = γvD λd
e tB̄ C̄ = γvD Td . Mas, e quanto à relação existente entre xĀB̄ e xAB (bem como aquela
existente entre tB̄ C̄ e tBC )?
Figura 12.5: Perı́odo Tm e comprimento de onda λm de uma onda produzida por uma
fonte F em movimento e detectada por um detector D em movimento, em termos de um
referencial que a caracteriza com velocidade V .
418
por D, conforme a Fig. 12.5 (a). Da igualdade entre essas duas expressões, temos
s
V − vF tB̄ C̄ γvD Td 1 − (vF /c)2 Td
= = = ,
V − vD tBC γvF To 1 − (vD /c)2 To
Por outro lado, em termos dos eventos A e B, a distância xAB entre as duas ex-
tremidades do mesmo pulso (em instantes distintos) deve corresponder à soma do
comprimento de onda λm com a distância V tAB percorrida pelo pulso. Ver Fig. 12.5
(b). Deste modo, temos λm = xAB − V tAB em termos da emissão por F ; analoga-
mente, λm = xĀB̄ − V tĀB̄ em termos da detecção por D. Da igualdade entre essas
duas expressões, temos
xĀB̄ − V tĀB̄ γvD (1 − V vD /c2 )λd
1= = ,
xAB − V tAB γvF (1 − V vF /c2 )λo
de modo que o comprimento de onda λd medido pelo detector D é dado em termos
do comprimento de onda λo medido pela fonte F por
s
λd 1 − V vF /c2 1 − (vD /c)2
= . (12.19)
λo 1 − V vD /c2 1 − (vF /c)2
419
onde v = (vF − vD )/(1 − vD vF /c2 ), obtida das Eqs. (12.14), é a velocidade da fonte
F como medida pelo detector D, a qual é tomada como positiva caso a fonte e o
detector se aproximem e negativa caso se afastem. As Eqs. (12.20) descrevem o efeito
Doppler longitudinal para ondas de campo (tais como, por exemplo, as ondas eletro-
magnéticas). Assim, a luz visı́vel emitida por um corpo que se afasta do observador
é detectada por este como apresentando uma tonalidade mais avermelhada (compri-
mento de onda maior e freqüência menor) do que aquela com que foi emitida; con-
trariamente, essa tonalidade lhe parecerá mais azulada (comprimento de onda menor
e freqüência maior) no caso de aproximação relativa entre a fonte e o observador.
Consideremos, agora, o efeito de diferença no comprimento de onda e na freqüência
de uma onda devido ao movimento da fonte F e do detector D na direção transversal
à direção de propagação da onda, fenômeno conhecido como efeito Doppler transver-
sal. Podemos construir esse efeito a partir do raciocı́nio anterior, fazendo a veloci-
dade da onda V na direção Oy. Para evitar aproximações desnecessárias ao problema,
suponhamos que os pulsos gerados por F são frentes de onda plana horizontais. Com
isto, o movimento horizontal da fonte e/ou do detector em nada modificam a in-
terpretação Newtoniana para o movimento dos pulsos e sua detecção, de modo que
terı́amos νd /νo = 1 e λd /λo = 1. As correções relativı́sticas a esse resultado Newtoni-
ano se aplicam da mesma forma que no caso anterior, de modo que o efeito Doppler
transversal para ondas mecânicas é descrito (ver Exercı́cio 8) por
r
ν 1 − (vF /c)2
νdo =
2
r1 − (vD /c) (12.21)
1 − (vD /c)2
λd = .
λo 1 − (vF /c)2
ν
p
νdo = 1 − (v/c)2
λd 1 (12.22)
λo = p
.
1 − (v/c)2
420
para a questão fundamental de caracterizar as leis fı́sicas que determinam tais me-
didas. Com base na cinemática relativı́stica por um lado e na mecânica Newtoniana
por outro, apresenta-se aqui um resumo da teoria fı́sica que pretende generalizar a
mecânica de Newton para os domı́nios de movimentos com velocidades comparáveis à
da luz no vácuo.
A estrutura das leis da Mecânica de Newton baseia-se não apenas na idéia de in-
variância de Galileu, mas também na noção fundamental de momentum linear. Em
particular, a lei de inércia garante a conservação no tempo do momentum linear total
de um sistema isolado, resultado que deve ser válido em qualquer referencial inercial.
Embora a noção Newtoniana de força seja frágil em seu aspecto de ação à distância, a
idéia de campo permite validar seu aspecto de ação local (tal como no caso das forças
de contato). Desta forma, a Teoria da Relatividade Especial não se furta de fazer uso de
algumas forças. Mas, devido à forma distinta com que são tratadas pelas Eqs. (12.14)
as componentes longitudinal e transversais da velocidade, a conservação da quanti-
P
dade k mk~v k num referencial inercial implica, em geral, em sua não conservação em
outros referenciais inerciais em movimento relativo com respeito ao primeiro. Assim,
essas expressões relativı́sticas contradizem a Mecânica de Newton. Este fato, a ser
detalhado a seguir, suscita uma correção relativı́stica à definição Newtoniana p~ = m ~v
do momentum linear de um sistema de massa m com velocidade ~v . Tal correção tem
implicações na noção de energia de um sistema fı́sico, originando assim uma nova
forma de energia: a energia de repouso.
421
Figura 12.6: Colisão elástica não frontal de duas partı́culas idênticas, analisada no referen-
cial do centro de massa do sistema, antes (diagonal SW-NE), depois (diagonal NW-SE),
e no momento (centro) da colisão.
422
f0 f0
p
vxB = −2vx /[1+(vx /c)2 ] e vyB = vy 1 − (vx /c)2 /[1+(vx /c)2 ]. Com isto, o momentum
linear (clássico) total do sistema tem componentes
−2m vx
i0 i0 i0
Px = m(vxA + vxB ) = 1 + (vx /c)2
2
i0 i0 i0 2m vy (v x /c)
P
y
= m(vyA + vyB ) = p ,
[1 + (vx /c)2 ] 1 − (vx /c)2
−2m vx
f0 f0 f0 i0
Px = m(vxA + vxB ) = 1 + (v /c)2 = Px
x
423
p
isto, temos γA = [1 − (vx /c)2 ]/{1 − [(vx /c)2 + (vy /c)2 ]} para a partı́cula A, e
p
γB = [1 + (vx /c)2 ]/ [1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]} para a partı́cula B. Desta
f0
i0
p
forma, temos γA vyA = −γA vyA = vy / 1 − [(vx /c)2 + (vy /c)2 ] para a partı́cula A, e
f0 f0
i0
p i0
γB vxB = γB vxB = −2vx / [1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]} e γB vyB = −γB vyB =
f0
γA vyA para a partı́cula B. Finalmente, as expressões relativı́sticas para o momentum
linear do sistema são
−2m vx
Pxi 0 = m(γA vxA
i0 i0
+ γB vxB )= p
[1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]}
i0
i0 i0
Py = m(γA vyA + γB vyB ) = 0,
−2m vx
f0 f0
Pxf 0 = m(γA vxA + γB vxB ) = p
[1 − (vx /c)2 ]{1 − [(vx /c)2 + (vy /c)2 ]}
f0
f0 f0
Py = m(γA vyA + γB vyB ) = 0.
Obtém-se assim que, tanto para o referencial O quanto para o referencial O0 , na colisão
das partı́culas A e B acima, vale a conservação do momentum linear relativı́stico dado
pela Eq. (12.26), onde as medidas de velocidade efetuadas por esses dois referenciais
são relacionadas pela lei de transformação de velocidades de Lorentz, Eqs. (12.14). Em-
bora seja um caso particular, este cálculo ilustra um resultado geral de conservação do
momentum linear relativı́stico de um sistema fı́sico isolado. Este resultado estabelece,
portanto, a versão relativı́stica da Lei de inércia da Mecânica Newtoniana.
12.6.2 Energia
Suponhamos que a Lei da dinâmica Newtoniana F~ = dP~ /dt seja válida no contexto
relativı́stico, onde F~ é uma força de origem local, por meio de uma re-interpretação do
vetor P~ como sendo o momentum relativı́stico da Eq. (12.26). Neste caso, o teorema
Trabalho-Energia fornece a variação da energia cinética de um sistema de massa m
sujeito à ação da força F~ na forma
424
relativı́stica, Eq. (12.27), toma a forma Newtoniana K ≈ m v 2 /2 a menos de correções
relativı́sticas de quarta ordem na razão v/c. Desprezı́veis no contexto de baixas veloci-
dades, essas correções tornam-se significativas quando v → c. Pois a energia cinética
relativı́stica assume valores arbitrariamente grandes neste último limite. Desta forma,
acelerar um corpo de massa m desde o repouso até a velocidade da luz no vácuo
demandaria uma energia infinita, sendo portanto impossı́vel. Estas previsões foram
verificadas experimentalmente (Sec. 12.10).
Cumpre notar que a Eq. (12.28) fornece uma grande quantidade de energia para
quantidades relativamente pequenas de massa, nas escalas familiares de grandeza. Em
valores numéricos, m = 1Kg equivale a cerca de Eo = 8, 987 · 1016 J. Tendo em conta
a forma de repouso da energia, tem lugar a definição da energia total
E = γ m c2 , (12.29)
Observa-se (ver Exercı́cio 11) que, para um sistema mecânico de massa m, sua energia
total E dada pela Eq. (12.29) relaciona-se com seu momentum relativı́stico P~ dado
pela Eq. (12.26) na forma
E 2 − c2 P~ · P~ = (Eo )2 , (12.30)
onde Eo é a energia de repouso desse corpo, dada pela Eq. (12.28). Ademais, segundo
uma transformação de Lorentz entre referenciais, um referencial inercial O0 que deter-
mina para o corpo de massa m uma energia total E 0 e um momentum relativı́stico P~ 0
descreve a relação entre energia total e momentum na forma (E 0 )2 − c2 P~ 0 · P~ 0 = (Eo )2 ,
a qual é formalmente similar à Eq. (12.30).
425
12.7 Espaço-tempo
Já tivemos oportunidade de verificar, nas seções precedentes deste capı́tulo, que a
noção fundamental da relatividade (qual seja, a idéia de “evento”) requer, para sua
completa especificação num dado sistema coordenado de um referencial dado, quatro
valores numéricos: um deles qualificando um instante no tempo e os demais determi-
nando uma posição no espaço. Com o auxı́lio da velocidade da luz no vácuo c, admitida
por postulado como uma constante da fı́sica, podemos uniformizar as unidades fı́sicas
dessas coordenadas dos eventos. Com efeito, um evento A caracterizado num dado refe-
rencial por (t, x, y, z) equivalentemente pode ser caracterizado por (ct, x, y, z) nesse
mesmo referencial. Para facilitar essa padronização, denominaremos por coordenadas
de eventos no espaço-tempo aos valores (x0 , x1 , x2 , x3 ), onde
0
x = ct
x1 =
x
(12.31)
x2 = y
3
x = z.
426
A escolha do ı́ndice 0 como correspondente à coordenada temporal10 de eventos no
espaço-tempo evita ambigüidades posteriores,11 e salienta o caráter distinto dessa co-
ordenada com respeito às demais, representadas por um ı́ndice “espacial” positivo.
Quanto ao fato de utilizarmos uma notação de ı́ndices sobrescritos x0 ao invés de
ı́ndices subescritos x0 , esta escolha corresponde ao caráter tensorial a ser discutido
na Sec. 12.9. Embora possa causar estranheza, por assemelhar-se a uma potência
algébrica, a ambigüidade é evitada utilizando-se da notação (x)0 (sem omitir os
parênteses, que de outro modo seriam supérfluos) sempre que for necessária uma
potência de uma grandeza com componentes coordenadas.
Temos à disposição, portanto, um ambiente quadridimensional denominado espaço-
tempo (de Minkowski, em referência ao matemático Herman Minkowski que o estabe-
leceu em 1908), cuja estrutura autônoma deve-se, em grande medida, à possibilidade
de uniformização das unidades fı́sicas correspondentes às medidas ao longo de seus
“eixos ortogonais” de espaço e de tempo. Embora seja algo difı́cil “visualizar” figu-
ras em quatro dimensões, podemos visualizar com facilidade as suas diversas seções
bidimensionais, obtidas por técnica similar à construção de curvas de nı́vel (de altura
constante) a partir do mapa topográfico de um terreno. A principal diferença con-
ceitual introduzida por esta abordagem consiste no fato que, com freqüência, uma
das coordenadas apresentadas nessa visualização por redução dimensional possui um
caráter temporal.
Expressos em termos dessa linguagem, os corpos mecânicos não evoluem no espaço
conforme a passagem do tempo, mas somente existem no espaço-tempo, sendo cada
um deles caracterizado por sua respectiva história. Desta forma, a noção de espaço-
tempo acima corresponde a uma visão estática do mundo. Embora revisada, esta visão
filosófica de um mundo mecânico estático (apesar de sua dinâmica intrı́nseca) perdura
na Relatividade Geral (Cap. 1), bem como na Cosmologia Relativı́stica (Caps. 2 e 3).
Tal como os espaços vetoriais abstratos da geometria analı́tica, o espaço-tempo acima
possui uma estrutura matemática de espaço vetorial: podemos definir um vetor
posição quadridimensional X no espaço-tempo como sendo a representação de even-
tos12 em termos das coordenadas (x0 , x1 , x2 , x3 ) utilizadas por um referencial inercial
O. Ou seja, escrevemos a relação X = (x0 , x1 , x2 , x3 ). Dados arbitrariamente o es-
calar α e os vetores X = (x0 , x1 , x2 , x3 ) e Y = (y 0 , y 1 , y 2 , y 3 ) (expressos no mesmo
sistema de coordenadas de um mesmo referencial inercial), as operações vetoriais de
soma X + Y = (x0 + y 0 , x1 + y 1 , x2 + y 2 , x3 + y 3 ) e de multiplicação por escalar
10
Observe-se que as unidades fı́sicas de comprimento dessa coordenada não alteram seu caráter tem-
poral, pois especifica um instante de tempo do referencial escolhido.
11
Sob a perspectiva relativı́stica, o número quatro acima não é fundamental: poder-se-ı́a estabelecer
igualmente a Relatividade Especial em d dimensões espaciais, sendo d um número inteiro positivo ar-
bitrário. A escolha d = 3 deve-se à nossa percepção usual do mundo mecânico como sendo composto de
objetos existentes num ambiente espacial de três dimensões.
12
Mais rigorosamente, trata-se do deslocamento com respeito à origem deste espaço vetorial. A noção
de vetor será apresentada de modo mais preciso na Sec. 12.9.
427
α X = (α x0 , α x1 , α x2 , α x3 ) localizam igualmente eventos válidos do espaço-tempo.
E, por conseguinte, são vetores legı́timos dessa estrutura vetorial abstrata. Como uma
interpretação geométrica, a soma X + Y localiza com respeito à origem O o evento
localizado por Y relativamente à origem deslocada Ō, a qual é localizada por X com
respeito a O. A interpretação para o produto por escalar no espaço-tempo é menos
intuitiva, contudo.
Em vista da universalidade da constante c, uma velocidade Newtoniana ~u ar-
bitrária pode ser completamente caracterizada pela grandeza tridimensional β~ =
(βx , βy , βz ) = ~u/c denominada velocidade Newtoniana adimensional. Esta definição
corresponde meramente a medir a velocidade Newtoniana ~u em unidades da veloci-
dade da luz no vácuo c. Em termos dessa escala de unidades, a velocidade da luz
no vácuo tem valor unitário. Em alguns textos avançados, isto corresponde à escolha
geométrica de unidades c = 1.
Consideremos dois referenciais inerciais O e O0 em movimento relativo com velocidade
relativa u de O0 com respeito a O, dirigida ao longo do sentido positivo do eixo Ox.
Seja um arbitrário evento A. Em termos do referencial O, este evento corresponde ao
vetor X = (x0 , x1 , x2 , x3 ). Já com respeito ao referencial O0 , este evento corresponde
ao vetor X0 = (x0 0 , x0 1 , x0 2 , x0 3 ). A relação entre os vetores X e X0 — mais rigo-
rosamente, trata-se do mesmo vetor expresso em dois distintos referenciais — pode
ser imediatamente obtida da lei de transformação de coordenadas de Lorentz entre
referenciais inerciais, Eqs. (12.12), na forma
00
x = γ(x0 − βx1 )
x0 1
= γ(x1 − βx0 )
(12.32)
x0 2 = x2
03
x = x3 ,
p
onde γ = 1/ 1 − (β)2 é o fator de Lorentz da Eq. (12.11) expresso em termos da
velocidade Newtoniana adimensional β, ou sua representação recı́proca
γ(x0 0 + βx0 1 )
0
x =
x1 = γ(x0 1 + βx0 0 )
(12.33)
x2 = x0 2
x0 3 .
3
x =
428
direções espaciais. Expressa na linguagem quadridimensional do espaço-tempo rela-
tivı́stico, contudo, a velocidade vetorial de um corpo num arbitrário evento A dado
corresponde à razão entre o vetor quadridimensional XAB = XB − XA que especifica
seu deslocamento até um evento B futuro na história desse corpo e o intervalo de
tempo próprio x0 0 = c τAB (expresso em unidades de comprimento) entre esses dois
eventos, no limite B → A. Pois, para que essa razão forneça como resultado um vetor
(também quadridimensional), ela deve ser tal que corresponde à operação de produto
do vetor XAB por um escalar. Mas, sendo c tAB uma das componentes de um vetor
(qual seja, o vetor XAB ), este intervalo de tempo coordenado não é um escalar, e muda
de valor perante as Eqs. (12.12). Já o intervalo de tempo próprio entre dois eventos é
uma noção invariante perante mudança de referenciais, donde é um escalar no espaço-
tempo. Podemos expressar o tempo próprio em termos do tempo coordenado na forma
x0 0 = x0 /γ, em acordo com a Eq. (12.8) e as Eqs. (12.32). Com isto, definimos o vetor
velocidade relativı́stica (quadridimensional) V = (V 0 , V 1 , V 2 , V 3 ) por
0
V0 = γ dx0 =γ
dx1
γ dx0
V1 =
= γ βx
dx2 (12.34)
V = γ dx0
2
= γ βy
dx3
V 3 = γ dx0
= γ βz ,
dx
(V 0 )2 − [(V 1 )2 + (V 2 )2 + (V 3 )2 ] = γ 2 {1 − [(β 1 )2 + (β 2 )2 + (β 3 )2 ]} = 1.
onde a matriz 4 × 4 de derivadas parciais (∂X0 /∂X) pode ser imediatamente calculada
429
das Eqs. (12.32) na forma
γ −γβ 0 0
∂X0
−γβ γ 0 0
= . (12.35)
∂X 0 0 1 0
0 0 0 1
dV 0 = γ 4 ~v · ~a
0
A = γ
dx0 c32
2
A1 = γ dV = γ [ax + γ ~v · ~a vx ]
1
0 2
dx c2 2
c2 (12.37)
2
2 γ
dV = [a + γ ~
v · ~a
A = γ y v y ]
dx0 c2 c2
A3 = γ dV 3 = γ 2 [a + γ 2~v · ~a v ],
dx0 c2 z c2 z
430
mesmo raciocı́nio adotado para a transformação de velocidades, temos
431
embora o espaço e o tempo não tenham existência invariante independentemente, mas
encontrem-se unificados num contı́nuo de espaço-tempo, ainda assim as noções intu-
itivas de espaço e de tempo são tais que não podem ser completamente identificadas
entre si.
Consideremos um lampejo luminoso produzido no evento A origem de um referen-
cial inercial O por uma fonte puntual isotrópica. Conforme determinado por esse
referencial, o pulso propaga-se (no vácuo) em todas as direções espaciais com veloci-
dade c, de modo que num instante posterior dt apresenta forma esférica com raio
p
r = (dx)2 + (dy)2 + (dz)2 = c dt. Assim, um genérico evento B sobre a superfı́cie
esférica desse pulso satisfaz uma relação
432
de qualquer dessas duas grandezas será impossı́vel caso a Eq. (12.41) seja satisfeita
(sendo A e B eventos distintos). Define-se, assim, um intervalo de espaço-tempo
ds2AB (ou distância relativı́stica) entre A e B como sendo o escalar, invariante por
transformações de Lorentz entre referenciais inerciais (ver Exercı́cio 16), dado por13
Para o caso ds2AB < 0, diz-se que esses eventos determinam entre si um intervalo tipo
espaço ds2AB = −(d`AB )2 onde d`AB é a distância própria entre A e B. Caso ds2AB = 0,
esses eventos determinam entre si um intervalo tipo luz (ou nulo), de modo que um
raio de luz viajando livremente no vácuo pode propagar-se entre A e B. Finalmente,
se ds2AB > 0, os eventos determinam entre si um intervalo tipo tempo ds2AB = c dτAB
onde dτAB é o tempo próprio entre A e B.
A fı́sica elementar nos mostra que uma boa ilustração pode conter uma grande quanti-
dade de informações. Adotaremos essa perspectiva geométrica no restante desta seção
para as investigações no âmbito relativı́stico. Tendo em vista a completa semelhança
fı́sica entre as coordenadas espaciais dos eventos, vamos freqüentemente restringir-
nos nesta seção ao estudo do espaço-tempo no setor bidimensional (t, x). Ou seja,
trataremos somente de casos em que y e z sejam constantes para todos os eventos en-
volvidos. Embora a construção dos diagramas de espaço-tempo discutidos nesta seção
poderia prescindir das noções genéricas de espaço-tempo apresentadas previamente, a
compreensão que esses diagramas proporcionam ao estudante seria consideravelmente
prejudicada.
Considere o problema do pulso luminoso esférico emitido a partir da origem do refer-
encial inercial O, apresentado na Sec. 12.7.2. Podemos representar a trajetória desse
pulso de luz num diagrama de espaço-tempo (x0 , x1 ). Nesta representação bidimen-
sional, os eventos sobre a história do pulso luminoso encontram-se sob as duas semi-
retas bissetrizes dos dois primeiros quadrantes desse diagrama. Seja A o evento na
origem do referencial O, e seja B um qualquer evento próximo de A tal que ds2AB é
do tipo tempo com dτAB > 0, de modo que B encontra-se no futuro de A. Então,
B localiza-se “entre” a cunha formada pelas duas semi-retas, conforme a Fig. 12.7
(a). Analogamente, seja C um evento próximo de B com ds2BC do tipo tempo com
dτBC > 0 (de modo que C encontra-se no futuro de B). Resulta que o evento C localiza-
se também entre aquela cunha, e encontra-se “visualmente” mais longe da origem A
do que o evento B. O evento C encontra-se, portanto, também no futuro14 de A. Este
13
A escolha do sinal global na Eq. (12.42) é arbitrária. Seja a escolha apresentada ou a sua oposta, o
intervalo ds2 pode apresentar qualquer sinal algébrico.
14
Note que o intervalo de tempo próprio dτAC em geral não corresponde à soma dτAB + dτBC , pois
esses três tempos próprios podem estar associados a três distintos referenciais inerciais.
433
Figura 12.7: Diagrama bidimensional (a) de espaço-tempo para o referencial O, que ilustra
a transitividade de intervalos tipo tempo e a falta de transitividade de intervalos tipo
espaço. Raios de luz no vácuo são representados por retas a 45o . Uma versão simplificada
(b) do diagrama tridimensional de espaço-tempo apresenta as regiões relativas ao evento
A e a história de um corpo material M .
raciocı́nio pode ser repetido indefinidamente, de modo que podemos concluir que toda
a região entre as cunhas pertence ao futuro do evento A. Uma construção inteiramente
análoga mostra que a “região” entre a cunha tracejada da Fig. 12.7 (a) (correspon-
dente ao prolongamento da trajetória do pulos luminoso para tempos anteriores à sua
produção) determina eventos no passado de A. Dado seu caráter geométrico, esses
dois setores desconexos do espaço-tempo são conhecidos como futuro invariante (ou
absoluto) e passado invariante (ou absoluto) do evento A. Um qualquer evento D
no contorno dessas regiões é caracterizado de modo invariante como estando sobre o
cone de luz do evento A. Um arbitrário evento E que não pertence nem ao futuro
invariante de A, nem ao seu passado invariante, e nem ao cone de luz desse evento,
é tal que pode ser considerado simultâneo ao evento A por algum referencial inercial
RE
O0 , de modo que o intervalo A ds2 entre os eventos A e E é do tipo espaço, qualquer
que seja a escolha dos eventos que compõe no espaço-tempo a “integral de trajetória”
de modo a formar um “caminho contı́nuo” que conecta os eventos A e B; embora o
valor dessa integral possa mudar, seu sinal algébrico não se altera. Geometricamente,
o evento E está exterior (isto é, “para fora”) ao cone de luz de A. A coleção de eventos
exteriores ao cone de luz de A caracteriza invariantemente o setor do espaço-tempo
denominado alhures (ou presente relativo) desse evento, ilustrado na Fig. 12.7 (b), e
compreende o conjunto de eventos que não apresentam conexão causal com o evento
A: não existe sinal que possa propagar-se entre A e algum desses eventos com veloci-
dade não superior à velocidade c da luz no vácuo; a seqüência temporal entre A e um
arbitrário (mas fixo) desses eventos alhures pode ser alterada perante uma mudança
de referencial inercial, conforme a análise da Sec. 12.4.4. Analogamente, seja F um
434
evento externo ao cone de luz de E, de modo que o intervalo entre E e F seja do tipo
espaço. Embora os intervalos entre A e E bem como entre E e F sejam ambos do tipo
espaço, o intervalo entre A e F não necessariamente será do tipo espaço, conforme
ilustrado na Fig. 12.7 (a). Em particular, podemos ter F = B se `AE > c τAB .
As escalas de medida dos eixos nos dois referenciais podem ser determinadas por
435
Figura 12.8: Representação no espaço-tempo da lei de transformação de Lorentz das
coordenadas, onde o eixo vertical convencionalmente tem caráter temporal. Hipérboles da
forma (x0 )2 − (x1 )2 = a2 e (x1 )2 − (x0 )2 = b2 são invariantes.
436
Figura 12.9: Rotação elı́ptica (a) de eixos espaciais do espaço-tempo segundo um ângulo
θ, e rotação hiperbólica (b) de eixos temporal e espacial do espaço-tempo segundo um
ângulo α = tanh−1 β. A construção geométrica das coordenadas de espaço-tempo de um
ponto/evento P arbitrário é apresentada em ambos os casos.
Enquanto a Eq. (12.43) preserva hipérboles da forma (x0 )2 − (x1 )2 = ±a2 , temos
que a Eq. (12.44) preserva circunferências da forma (x2 )2 + (x3 )2 = +a2 . Da seme-
lhança formal entre as Eqs. (12.43) e (12.44), a lei de transformação de Lorentz é
também denominada rotação hiperbólica no espaço-tempo, ao passo que a rotação
usual é denominada rotação elı́ptica no espaço-tempo. O efeito de cada uma dessas
transformações encontra-se ilustrado na Fig. 12.9.
437
12.8.1 Paradoxo dos gêmeos
Seguramente, o chamado paradoxo dos gêmeos é a mais difundida dessas crı́ticas [12,
13]. Considere dois irmãos gêmeos, denominados I e G (as iniciais de Irmãos Gêmeos),
e suponha que I seja um fı́sico e G um astronauta. No dia em que eles comemoram
seu trigésimo aniversário, G embarca numa espaçonave e viaja em direção a uma
Estrela fixa a 20 anos-luz de distância,15 movendo-se relativamente à Terra a 80% da
velocidade c da luz no vácuo. Ao atingir a referida Estrela, passados 25 anos de seu
embarque segundo os cálculos de I (pois 20/0, 8 = 25), o astronauta G é acometido de
súbita melancolia, e decide voltar imediatamente a seu planeta natal, desenvolvendo
no retorno a mesma velocidade com que percorreu a primeira parte de sua jornada.
Tendo G enviado para a Terra por rádio sua decisão, seu irmão pode prever que o
percurso total levará 50 anos, de modo que I contará com a avançada idade de 80 anos
até que possa rever seu irmão novamente. Contudo, por seus estudos de relatividade,
I estima que o tempo passe mais lentamente na espaçonave, seja na ida quanto no
retorno, segundo um fator de Lorentz γ = [1 − (0, 8)2 ]−1/2 = 5/3. Assim sendo, o
tempo total de viagem de G medido por ele próprio deverá ser de apenas 30 anos
(50 · 3/5 = 30), de modo que G deve contar com 60 anos no momento do re-encontro.
Portanto, I estará 20 anos mais velho que seu irmão gêmeo G ao revê-lo na Terra.
Até aqui, trata-se apenas de mais uma das “esquisitices” da relatividade. Con-
tudo, para ser astronauta, G também precisou estudar alguns elementos dessa teoria
(ainda que contra sua própria vontade). Sendo constante a velocidade relativa entre a
espaçonave e a Terra, seja na ida quanto no retorno, a simetria da cinemática confere
a G o direito de fazer uso de um raciocı́nio similar. Do ponto de vista de G, foi seu
irmão I quem “viajou para trás” e retornou depois. Portanto, G pode calcular para si
mesmo a idade de 80 anos e para seu irmão I a idade de 60 anos, de modo que I será
20 anos mais jovem do que G ao se re-encontrarem na Terra.
Embora possam estar ambos errados, não resta dúvida que os cálculos de I e de G
não podem ser ambos corretos: estando ambos frente a frente, a diferença de idade
entre I e G não pode ser 20 anos para mais e para menos. A lógica elementar parece
depor contra a relatividade, segundo o paradoxal argumento exposto acima.
438
Note que G sofre uma aceleração infinita ao inverter o sentido de velocidade de sua
espaçonave, enquanto que I é um observador inercial durante toda a viagem (note que
o problema proposto é acadêmico, ignorando os movimentos não inerciais do planeta).
Assim sendo, os dois observadores não são fisicamente equivalentes, de modo que a
descrição dos fenômenos caracterizados por eles não precisaria ser simétrica. Com isto,
a lógica elementar não depõe contra a relatividade, tal como parecia fazê-lo à primeira
vista: embora seja estranha ao senso comum, uma diferença de idades resultante não
contradiz a si mesma. Mas qual dentre os dois irmãos gêmeos resulta, após decorrida
a viagem, ser “primogênito a posteriori”?
Com respeito ao referencial O0 , o evento A tem coordenadas (t0A , x0A ) = (0, 0). Tendo
permanecido em repouso (neste perı́odo), o observador G determina o tempo próprio
τAB para o deslocamento da Estrela até a espaçonave. Da lei de Lorentz, temos τAB =
tAB /γO = 15, de modo que o evento B tem coordenadas (t0B , x0B ) = (15, 0). Como o
observador I mede o tempo próprio τAC = 50, temos t0C = γO τAC = 250/3. Visto que
o observador I se move com velocidade βO = −βO0 = −0, 8, temos x0AC = βO t0AC =
−200/3, de modo que o evento C tem coordenadas (t0C , x0C ) = (250/3, −200/3).
Com respeito ao referencial O00 , o evento A tem coordenadas (t00A , x00A ) = (0, 0). Como
o observador I mede o tempo próprio τAC = 50, a lei de Lorentz fornece t00C = γO τAC =
439
250/3. Visto que I se move com velocidade β̄O = 0, 8, temos x00AC = β̄O t00AC = 200/3,
de modo que o evento C se expressa em coordenadas por (t00C , x00C ) = (250/3, 200/3).
Como o observador G mede o tempo próprio τBC , temos τBC = tBC /γO = 15, de modo
que t00B = t00C − τBC = 205/3. Visto que I mede a distância própria `T E entre a Terra
e a Estrela, temos x00AB = `T E /γO = 12, de modo que o evento B tem coordenadas
(t00B , x00B ) = (205/3, 12).
Figura 12.10: Diagrama de espaço-tempo para o paradoxo dos gêmeos na forma qualitativa
(eixos representados fora de escala). O intervalo τEF determina a diferença de idades, a
menos do fator multiplicativo relativı́stico γ/(1 + γ).
440
donde ∆τ = [γ/(1 + γ)]τEF . Em números, obtemos τAE = 9 = τF C e τEF = 32, donde
a diferença de idade resultante ao final da viagem de ida e retorno de G (pois foi G
quem sofreu aceleração no evento B) consiste em ∆τ = 20 anos.
O exemplo idealizado acima corresponde a uma simplificação nos cálculos advinda da
aceleração infinita de G no evento B, o que ocasiona-lhe a “perda” do tempo próprio
τEF . Em uma situação mais realista, G sofreria uma aceleração elevada (porém finita)
durante um certo tempo no entorno do evento B, o que ocasionaria uma rápida (porém
contı́nua) passagem daquele tempo se comparada ao curto intervalo de tempo próprio
de duração de sua aceleração.
Menos popular do que o paradoxo dos gêmeos, a variação dos comprimentos com
respeito ao estado de movimento, que origina o problema da garagem, será analisada
de forma substancialmente mais suscinta.
Considere um milionário M , que enriqueceu após ter estudado a Relatividade Especial.
O milionário M possui uma grande mansão, com uma garagem bastante ampla. Ele
adquiriu a poucos instantes um carro novo de altı́ssima performance, mas tão longo
que seu comprimento Lo ultrapassa a extensão d da garagem. Ao verificar que seu
exagero causou-lhe um inconveniente, M lembra-se de seus antigos estudos, e percebe
que pode utilizar a contração relativı́stica de comprimentos em seu favor. Ele pede à
sua esposa E, excelente motorista, para dirigir seu carro novo em direção à garagem,
de modo que o velocı́metro acuse o valor v, e freá-lo bruscamente imediatamente antes
da colisão com o fundo dessa. A novı́ssima performance de seu carro lhe confere, além
de alta velocidade, a possibilidade de parar instantaneamente. Com respeito a M , que
permanece à entrada da garagem, o carro apresenta um comprimento reduzido L =
Lo /γv < d (para a velocidade v escolhida), de modo que M pretente fechar o portão
de ingresso da garagem imediatamente após o carro encontrar-se completamente no
interior desta. Sendo freado subitamente após isto, o carro não poderia “expandir-
se” ao seu comprimento natural Lo , pois estaria limitado pela garagem em seus dois
extremos: estando ambos em repouso relativo, o carro e a garagem não poderão colidir
— o carro deverá permanecer “encolhido”.
Nova “esquisitice”, mas pode piorar. Pois, tendo desconfiado da longa demora nas
reuniões de trabalho de seu marido, E revirou os pertences deste, tendo encontrado
alguns textos universitários que lhe explicaram fisicamente o fenômeno de dilatação
do tempo. Ficando muito impressionada com esta justificativa, E dedicou-se a ler o
restante, e também aprendeu algo a respeito do fenômeno de contração do compri-
mento. Assim, enquanto dirigia o novo carro de seu marido, E fez algumas contas de
cabeça. Do ponto de vista de E, a situação é completamente simétrica: é a garagem
que se move com velocidade −v, de modo que é esta que apresenta um comprimento
441
reduzido d/γv . Assim, E julga que o problema do estacionamento do carro novo é
ainda mais difı́cil devido à relatividade.
Claro está, a razão
comprimento do carro
comprimento da garagem
não pode aumentar e diminuir devido ao movimento relativo entre ambos. Eis que,
novamente, encontramos um paradoxo.
A solução para o impasse apresentado acima decorre, tal como no caso do paradoxo dos
gêmeos, de um maior cuidado com o uso da linguagem. E, talvez não por coincidência,
também aqui é a relatividade da simultaneidade a causa dos mal-entendidos. Sejam os
referenciais inerciais O que determina M em repouso, e O0 que se move com velocidade
Newtoniana β = v/c com respeito a O no sentido positivo do eixo Ox. Seja o evento
A “posição e instante em que a extremidade dianteira do carro e a parede da garagem
se encontram”.
Omitindo a discussão algébrica de todos os eventos relevantes à solução desse pro-
blema, passemos diretamente para a sua formulação geométrica no espaço-tempo,
ilustrada na Fig. 12.11. Conforme o acordo proposto, E freia o carro no evento A. Da
invariância das hipérboles, obtemos que os eventos A e B apresentam coordenadas
espaciais xB = L = γv Lo e x0A = L numericamente iguais x0A = xB ; analogamente,
temos x0D = Lo = xC . Como L < Lo , a extremidade posterior do carro encontra-se
no evento F no instante do evento A, conforme a simultaneidade de O0 . Do ponto de
vista de O, os eventos A e F não são simultâneos: apesar de M ter solicitado que E
freasse (todo) o carro apenas para evitar a colisão, parece-lhe que sua esposa se recusa
a fazê-lo, utilizando-se dos freios traseiros bem antes do momento em que seu marido
julga necessário fazê-lo.
442
Figura 12.11: Diagrama de espaço-tempo para o paradoxo da garagem. A linha vertical
representa a história da parede. Arcos das hipérboles invariantes que contém os eventos
A e C também estão ilustrados.
x0 3 0 −sen θ cos θ x3
16
O estudante atento à nomenclatura observará, no estudo da Relatividade Geral (Cap. 1), que a
notação de ı́ndices se aplica com igual propriedade também para grandezas não tensoriais. A noção
precisa de tensor será formalizada na Sec. 12.9.2.
443
Da mesma forma, uma rotação no plano xy segundo um ângulo ϕ e uma rotação no
plano xz segundo um ângulo ϑ têm a forma
x0 1 cos ϕ sen ϕ 0 x1
02
x = −sen ϕ cos ϕ 0 x2
x0 3 0 0 1 x3
x0 1 cos ϑ 0 sen ϑ x1
02
x = 0 1 0 x2 .
x0 3 −sen ϑ 0 cos ϑ x3
x0 3 x3
Uma equação matricial é dita verdadeira exatamente quando forem iguais as compo-
nentes correspondentes das matrizes equacionadas, de modo que podemos escrever a
444
Eq. (12.45) em suas componentes na forma
3
X
x 0 i = R i 1 x1 + R i 2 x2 + R i 3 x3 = R i j xj , (12.46)
j=1
1 0 0
I= 0 1 0
0 0 1
x0 i = R i j xj , (12.47)
onde a mera repetição do ı́ndice j em alturas diferentes (uma vez subescrito e outra
vez superescrito) no monômio Ri j xj determina implicitamente sua soma sobre todas
as possibilidades de valores desse ı́ndice. Esta notação de ı́ndices é conhecida como
notação tensorial, e a convenção de omissão dos sı́mbolos de somatório é conhecida
por convenção de soma implı́cita de Einstein.
Em termos dessa notação, podemos escrever a forma recı́proca da Eq. (12.47) como
xi = R̄i j x0 j (soma implı́cita no ı́ndice j), onde R̄ é a matriz inversa da matriz R. Isto é,
o produto matricial de R e R̄ em ambas as ordens possı́veis fornece a matriz identidade
445
I (I i k = 1 se i = k, e I i k = 0 se i 6= k) representada acima: Ri j R̄j k = I i k = R̄i j Rj k .
Do ponto de vista geométrico, R̄ representa a rotação inversa àquela representada por
R.
Para uma transformação de coordenadas dada pela Eq. (12.47), temos que ∂x0 i /∂xj =
Ri j , de modo que a matriz de rotação R pode ser interpretada como a matriz Jaco-
biana da transformação de coordenadas. Analogamente, temos a relação recı́proca
R̄i j = ∂xi /∂x0 j . Da regra da cadeia, e fazendo uso da convenção de Einstein, temos
que as derivadas parciais com respeito às coordenadas x0 são dadas por ∂/∂x0 j =
R̄i j (∂/∂xi ) em termos das derivadas parciais com respeito às coordenadas x, por uma
regra distinta daquela da Eq. (12.47): além de fazer uso de matrizes inversas entre
si, o ı́ndice livre (não somado) encontra-se em posições diferentes em cada caso, ora
subescrito ora superescrito.
Por meio da convenção de Einstein, as esferas invariantes do problema acima podem
ser escritas na forma Iij xi xj = r2 . Como outro exemplo, na álgebra matricial obtém-
se [14] a identidade det A = [(Tr A)3 − 3(Tr A) Tr (A2 ) + 2 Tr (A3 )]/6, válida para
qualquer matriz A de ordem 3 × 3, onde o traço Tr A de uma matriz A é definido
como sendo igual à soma de suas componentes diagonais. Em termos da convenção de
Einstein, temos Tr A = Ai i . Com isto, essa convenção permite expressar a condição
de determinante unitário da matriz de rotação R na forma
Observa-se, nesta expressão, o uso de diversos ı́ndices com soma implı́cita. O uso do
mesmo nome i para o ı́ndice de soma no monômio (Ri i )3 e no monômio −3Ri i Rj k Rk j
não significa qualquer correlação entre eles, mas reflete apenas uma economia no
número de sı́mbolos envolvidos.
O estudante deve atentar para o fato de não ser válido “isolar” um fator que apresenta
um ı́ndice somado numa equação que seja escrita segundo a convenção de Einstein.
Assim, por exemplo, sendo válida a equação Iij xi xj = 3 (cujo significado fı́sico é irre-
levante para o argumento), seria completamente errado daı́ obter que Iij = 3/(xi xj ),
tal como de A~·B~ = 5 seria errado obter que A ~ = 5/B. ~
x0 0 x0
γ −γβ 0 0
x0 1 −γβ γ 0 0 x1
= , (12.48)
x0 2 x2
0 0 1 0
x0 3 0 0 0 1 x3
446
onde a matriz quadrada de ordem 4 × 4 acima é a mesma que tı́nhamos encontrado
na Eq. (12.35). Por seu uso freqüente na relatividade, esta matriz (e qualquer outra
dela obtida por uma rotação de eixos espaciais, multiplicando-a convenientemente
por versões quadridimensionais de espaço-tempo das matrizes R da Sec. 12.9.1) é
re-denominada pelo sı́mbolo Λ e referida como matriz de Lorentz. Não seria muito
apropriado utilizar-se da nomenclatura Λi j para designar as componentes dessa matriz,
pois a notação de ı́ndices estabelecida na Sec. 12.9.1 nos induziria a pensar que trata-
se de uma matriz espacial 3 × 3. Introduz-se, assim, uma nova categoria de ı́ndices,
designados por letras gregas minúsculas (α, β, γ, etc), para designar as componentes de
matrizes quadridimensionais no espaço-tempo. Mais explicitamente, as possibilidades
de valores para um ı́ndice α são: α = 0, α = 1, α = 2, e α = 3. Com esta convenção, a
matriz de Lorentz Λ tem componentes Λα β . As coordenadas do espaço-tempo, reunidas
na forma da matriz-coluna da Eq. (12.48), são analogamente designadas pelo sı́mbolo
x, cujas componentes xα são precisamente essas coordenadas.
Podemos escrever a Eq. (12.48) de Lorentz na linguagem tensorial, na forma x0 α =
P3 α β
β=0 Λ β x . Porém, usando a convenção de Einstein (agora para ı́ndices quadridi-
mensionais de espaço-tempo), essa equação toma sua forma definitiva x0 α = Λα β xβ .
Neste momento, é interessante recuperar as constantes aditivas que figuram nas ex-
pressões originais da lei de Lorentz, Eqs. (12.12) da Sec. 12.4.5. Definindo o conjunto
quadridimensional de constantes z 0 = c to , z 1 = xo , z 2 = yo , e z 3 = zo , a lei de trans-
formação de coordenadas de Lorentz no espaço-tempo assume a forma de Poincaré
x0 α = Λα β xβ + z α . (12.49)
447
Fazendo β = 0 na Eq. (12.48) e transformando as coordenadas espaciais por uma
rotação de eixos, conforme a Sec. 12.9.1, a matriz de Lorentz resultante representa
uma rotação elı́ptica, e temos det Λ = 1 (conforme a Sec. 12.9.1). Neste caso, a matriz
de Lorentz torna-se uma forma quadridimensional da matriz R de rotação espacial. No
caso geral, a matriz Λ pode representar uma rotação genérica no espaço-tempo, seja do
tipo hiperbólico (matriz simétrica) ou elı́ptico (matriz ortogonal), ou de ambos os tipos.
O determinante da matriz de Lorentz é unitário em qualquer caso, det Λ = 1. Com isto,
temos que a matriz Λ (com 16 componentes) apresenta 6 componentes independentes,
determinadas pelos 3 ângulos elı́pticos (medidos nos planos x1 x2 , x1 x3 , e x2 x3 ) e
pelos 3 ângulos hiperbólicos (medidos nos planos x0 x1 , x0 x2 , e x0 x3 ). Desta forma, o
chamado Grupo de Lorentz é caracterizado por 6 parâmetros independentes.
Se aliarmos ao Grupo de Lorentz a matriz-coluna z α da Eq. (12.49), obtemos o
chamado Grupo de Poincaré, caracterizado por 10 parâmetros independentes. En-
quanto o Grupo de Lorentz descreve rotações arbitrárias no espaço-tempo, preser-
vando as seções hiperbólicas (x0 )2 − [(x1 )2 + (x2 )2 + (x3 )2 ] = constante, o Grupo
de Poincaré descreve transformações lineares arbitrárias (translações e rotações) no
espaço-tempo, preservando as seções hiperbólicas entre eventos A e B da forma
(x0B − x0A )2 − [(x1B − x1A )2 + (x2B − x2A )2 + (x3B − x3A )2 ] = constante.
Observamos também que a lei de transformação para a velocidade relativı́stica, con-
forme as Eqs. (12.36), pode ser escrita na forma
v 0 α = Λα β v β , (12.52)
Y 0 α = Λα β Y β , (12.53)
perante uma mudança de referenciais de Poincaré dada pela Eq. (12.49). Devido à ho-
mogeneidade dos ı́ndices livres que figuram nas equações tensoriais, decorre que vetores
contravariantes apresentam um ı́ndice livre superescrito, enquanto que vetores covari-
antes apresentam um ı́ndice livre subescrito. Em conseqüência, também denominam-se
contravariantes os ı́ndices superescritos, e covariantes os ı́ndices subescritos, em uma
equação tensorial.
448
Resulta da definição acima que a diferença entre as coordenadas de espaço-tempo de
dois eventos (para evitar as constantes aditivas da tranformação de coordenadas de
Poincaré) constituem um vetor contravariante, bem como são vetores contravariantes
as versões relativı́sticas da velocidade e da aceleração; enquanto que as derivadas
parciais com respeito às coordenadas do espaço-tempo constituem um vetor covariante.
Este raciocı́nio pode ser estendido para produtos diretos de mais do que dois vetores,
dando lugar a grandezas abstratas que necessitam de mais ı́ndices para especificar uma
de suas componentes. Este resultado nos permite definir, em definitiva, um tensor no
espaço-tempo como sendo um objeto Z com m ı́ndices contravariantes α1 , α2 , . . . , αm
e n ı́ndices covariantes β1 , β2 , . . . , βn , de modo que suas componentes se relacionam
por
Z 0 α1 α2 ...αm β1 β2 ...βn = (Λα1 σ1 Λα2 σ2 · · · Λαm σm )(Λ̄τ1 β1 Λ̄τ2 β2 · · · Λ̄τn βn )Z σ1 σ2 ...σm τ1 τ2 ...τn ,
(12.55)
perante uma mudança de coordenadas dada pela Eq. (12.49). Este tensor é dito de
ordem (m, n), ou m vezes contravariante e n vezes covariante. Quando a diferença
entre o caráter de contravariância e de covariância não for importante para o contexto,
o tensor Z acima é dito de ordem m + n. Assim, por exemplo, dirı́amos que o tensor
P construı́do explicitamente acima apresenta ordem (1, 1), ou simplesmente que é um
tensor de ordem 2. Em particular, as matrizes de Lorentz Λ e Λ̄ são, ambas, tensores
de ordem (1, 1). Tensores de ordem superior a 2 não são freqüentes na Relatividade
Especial, mas um tensor de ordem (1, 3) é fundamental na descrição geométrica da
interação gravitacional pela Teoria da Relatividade Geral (o tensor de curvatura de
Riemann, conforme o Cap. 1).
449
referencial inercial por
1 0 0 0
0 −1 0 0
gµν = . (12.56)
0 0 −1 0
0 0 0 −1
Com o auxı́lio do tensor g, o intervalo invariante ds2AB entre dois eventos A e B —
dado pela Eq. (12.42) da Sec. 12.7.2 — pode ser expresso na forma
ou meramente ds2 = gµν dxµ dxν . O caráter de invariância do intervalo ds2 decorre
imediatamente da forma como a Eq. (12.57) foi escrita, pois corresponde a uma con-
tração (soma implı́cita de Einstein) do tensor g de ordem (0, 2) com dois tensores dx
de ordem (1, 0), de modo que não resta nunhum ı́ndice livre nesta relação. O tensor g
da Eq. (12.56) é denominado “tensor métrico”, ou métrica, do espaço-tempo, pois es-
tabelece uma generalização ao espaço-tempo do Teorema de Pitágoras ds2 = Iij dxi dxj
tridimensional. Esta última observação mostra que a própria noção de tensor definida
acima também admite uma generalização. Com efeito, os tensores caracterizados pela
Eq. (12.55) fazem explı́cita menção à lei de Lorentz (ou de Poincaré) de transformação
de coordenadas do espaço-tempo. Poderı́amos, alternativamente, ter privilegiado uma
outra lei de transformação de coordenadas, ou mesmo utilizar coordenadas num espaço
vetorial distinto do espaço-tempo (como no caso do espaço tridimensional), de modo a
construir uma noção diferente de tensor. Assim, o termo tensor carrega, implicita ou
explicitamente, uma particular lei de transformação de coordenadas assumida como
fundamental. Por vezes, designam-se num mesmo contexto os tensores quadridimen-
sionais do espaço-tempo (transformação de Lorentz) e os tensores tridimensionais es-
paciais (transformação de coordenadas espaciais de Galileu).
As Eqs. (12.5) da eletrodinâmica de Maxwell apresentadas na Sec. 12.2.3 admitem uma
formulação compacta na linguagem tensorial. Definem-se os dois seguintes tensores [10]
de ordem (2, 0):
0 −Ex −Ey −Ez
µν
E
x 0 −Bz By
F = (12.58)
Ey Bz 0 −Bx
Ez −By Bx 0
0 −Dx −Dy −Dz
µν
Dx 0 −Hz Hy
P = , (12.59)
Dy Hz 0 −Hx
Dz −Hy Hx 0
~ = εE
onde D ~ eH
~ = B/µ
~ são os vetores de indução eletromagnética (no vácuo, ε = εo
e µ = µo ). As Equações de Maxwell tomam, então, a forma
∂ µν
F = 0 (12.60)
∂xν
450
∂ µν
P = J µ, (12.61)
∂xν
onde J µ = (ρ, Jx , Jy , Jz ) em termos da densidade volumétrica ρ de carga elétrica e da
densidade superficial J~ = (Jx , Jy , Jz ) de corrente elétrica.
451
prevê para a luz velocidades diferentes nos braços do interferômetro, produzindo
um deslocamento nas franjas de interferência ao longo do tempo. Este desloca-
mento de franjas previsto não foi observado.
Decaimento de partı́culas A vida-média de múons (partı́cula semelhante ao
elétron, porém mais pesada) produzidos em laboratório é menor do que seria
necessário classicamente para permitir a observação no solo de múons produzi-
dos na alta atmosfera, provenientes de raios cósmicos. A relatividade explica a
observação dos múons ou pela dilatação do tempo ou pela contração do compri-
mento.
Acelerador linear Embora sujeitas a elevadas forças de aceleração, as partı́culas
elementares massivas observadas nos aceleradores adquirem velocidades limitadas
superiormente pela velocidade da luz no vácuo, em acordo com a energia cinética
relativı́stica.
Acelerador sı́ncrotron Partı́culas carregadas podem ser aceleradas em anéis circu-
lares pela ação de campos eletromagnéticos oscilantes. A freqüência de oscilação
adequada ao efeito é dada pela lei de Lorentz.
Pulsos de radar A distância média da Terra à Lua é conhecida com grande pre-
cisão por medidas de radar, e suas variações são descritas pelo efeito Doppler
relativı́stico.
452
[9] John David Jackson, “Classical electrodynamics”, 3ª edição (John Wiley & Sons,
New York, 1999).
[10] Lev D. Landau & Eugene M. Lifshitz, “Elettrodinamica dei mezzi continui” (Ri-
uniti, Roma, 1986) [Coleção de Fı́sica Teórica v. 8].
[11] Jan Arnoldus Schouten, “Tensor analysis for physicists” (Dover, New York, 1989)
[baseado na 2ª edição (Clarendon, Oxford, 1954)].
[12] “Scientific American Brasil”, edição especial, ano 3, nº 29 (Duetto, São Paulo,
outubro de 2004).
[13] “Galileu” nº 161 (Globo, Rio de Janeiro, dezembro de 2004).
[14] Ronaldo Rodrigues da Silva, “The trace formulas yield the inverse metric for-
mula”, Journal of Mathematical Physics, vol. 39 (N. 11), pag. 6206-6213 (1998).
453
12.12 Exercı́cios
2. Verifique que os dois postulados de Einstein (Seção 12.3.1) são incompatı́veis com
a idéia Newtoniana de que todos os referenciais inerciais determinam o mesmo
intervalo de tempo entre dois dados eventos.
3. A sincronização de relógios apresentada na Sec. 12.3.2 baseia-se no postulado de
invariância da velocidade da luz. Explique, com suas próprias palavras, porque
é desaconselhável o método de simplesmente acionar cada um dos relógios na
origem, simultaneamente, evitando as ambigüidades, e somente então transportá-
los para suas correspondentes posições fixas no referencial.
4. Considere em repouso um bastão de comprimento `, inclinado no plano xy se-
gundo um ângulo θ com o eixo horizontal Ox, conforme determinado por um
referencial inercial O. Seja O0 um referencial inercial em movimento na direção
Ox com velocidade v, segundo as medidas do referencial O. Determine o compri-
mento e a orientação espacial do bastão, segundo as medidas efetuadas pelo
p
referencial O0 . [Solução: `0 = ` 1 + (γ v cos θ/c)2 e tan θ0 = tan θ/γ, onde
γ = (1 − v 2 /c2 )−1/2 .]
5. A lei inversa de transformação de coordenadas de Lorentz, Eq. (12.13), foi obtida
no texto por simetria com respeito à velocidade relativa entre os referenciais.
Mostre, por substituição direta, que as Eqs. (12.13) são inversas das Eqs. (12.12),
ignorando as constantes (to , xo , yo , zo ) e (t0o , x0o , yo0 , zo0 ).
6. Repita o exercı́cio 5 acima para as leis de transformação de velocidade e de
aceleração entre referenciais inerciais. Isto é, mostre por substituição direta que
as Eqs. (12.15) são inversas das Eqs. (12.14), e que as Eqs. (12.17) são inversas
das Eqs. (12.16).
7. Obtenha as expressões (12.20) da Sec. 12.5.2 para o efeito Doppler longitudinal
de ondas de campo, a partir das Eqs. (12.18)–(12.19). [Sugestão: use a relação
p p
1 − (v 0 /c)2 (1 − uvx /c2 ) = [1 − (u/c)2 ][1 − (v/c)2 ], onde v e v 0 são os módulos
das velocidades de uma mesma partı́cula relativamente aos observadores O e O0
que se movem ao longo do eixo Ox com velocidade relativa u.]
8. Obtenha as expressões (12.21) da Sec. 12.5.2 para o efeito Doppler transversal de
ondas mecânicas, a partir da construção de eventos de emissão e detecção dessas
ondas e das Eqs. (12.12) de Lorentz de transformação de coordenadas.
9. Obtenha as Eqs. (12.22) da Sec. 12.5.2 para o efeito Doppler transversal de ondas
454
de campo, a partir da construção de eventos de emissão e detecção dessas ondas
e das Eqs. (12.12) de Lorentz de transformação de coordenadas.
10. Um dado semáforo de trânsito encontra-se brilhando com sua luz vermelha. Deter-
mine o estado de movimento de um condutor de veı́culo automotor com respeito
ao semáforo para que esse brilho lhe pareça verde.
11. Deduza a Eq. (12.30) da Sec. 12.6.2, que descreve a relação invariante existente
entre a energia total E de um sistema mecânico de massa m e seu momentum
relativı́stico P~ .
12. Generalize a lei de Lorentz de transformação de coordenadas do espaço-tempo,
Eqs. (12.32) da Sec. 12.7.1, para o caso de um movimento relativo de referenciais
com velocidade Newtoniana adimensional β~ numa direção arbitrária. [Solução:
x0 0 = γ(x0 − β~ ·~x) e ~x0 = ~x + (γ − 1)(β~ ·~x)β/(
~ β~ · β)
~ − γ βx
~ 0 , onde ~x ≡ (x1 , x2 , x3 ).]
13. Verifique que a lei de transformação da velocidade relativı́stica Eqs. (12.36) da
Sec. 12.7.1 determina velocidades tridimensionais compatı́veis com a lei de trans-
formação da velocidade Newtoniana Eqs. (12.14) da Sec. 12.5.1.
14. Considere o problema de lançamento de um projétil a partir do solo, com veloci-
dade Newtoniana ~u segundo um ângulo θ com o plano horizontal. Admitindo
que um referencial inercial O fixo ao solo verifique ser correta a cinemática
Newtoniana para esse projétil (que fornece a trajetória parabólica usual), de-
termine as componentes dos vetores velocidade V~ e aceleração A ~ relativı́sticas do
projétil ao longo de sua trajetória. [Solução: V~ = (γ/c)(c, v cos θ, v sen θ − g t, 0)
eA~ = (γ 2 g/c3 ){γ(g t − v cos θ)V~ − (0, 0, c, 0)}, com 0 ≤ t ≤ 2 v sen θ/g, onde
√ p
v = ~u · ~u e γ = 1/ 1 − (v/c)2 .]
15. Utilizando o resultado do Exercı́cio 11 acima, obtenha as Eqs. (12.40) da Sec.
12.7.1.
16. Considere dois eventos A e B infinitesimalmente próximos, descritos em termos
de um referencial O por A = (x0 , x1 , x2 , x3 ) e B = (x0 + dx0AB , x1 + dx1AB , x2 +
dx2AB , x3 + dx3AB ). Seja O0 um referencial relacionado a O pelas transformações
de Lorentz Eqs. (12.12). Desprezando diferenciais de ordem superior, mostre que
o elemento de intervalo no espaço-tempo definido pela Eq. (12.42) é invariante.
Isto é, mostre que
(dx0AB ) − [(dx0AB
0 2
) + (dx0AB
1 2
) + (dx0AB
2 2 3 2
) ] = (dx0 )2 − [(dx1 )2 + (dx2 )2 + (dx3 )2 ].
17. Considerando a Fig. 12.8 da Sec. 12.7.3, que apresenta como o observador O
descreve os eixos coordenados do observador O0 , esboce o diagrama de espaço-
tempo recı́proco, que ilustra a forma como o observador O0 descreve os eixos
coordenados do observador O.
18. Obtenha a expressão α = ln[γ(1 + β)] para o ângulo α de rotação hiperbólica no
espaço-tempo devido a uma mudança de coordenadas dadas pelas Eqs. (12.32)
de Lorentz. [Sugestão: tanh α = senh α/ cosh α = (e2α − 1)/(e2α + 1).]
455
Capı́tulo 13
PARAGRAFOS!!
A Cosmologia cientı́fica é uma ciência fı́sica que objetiva descrever a gênese, a con-
stituição e o desenvolvimento da totalidade organizada dos eventos fı́sicos, denomi-
nada de Cosmos, que identificamos ao Universo astronômico enquanto expressão mais
abrangente da realidade natural. Ademais das leis fı́sicas conhecidas em laboratório, a
moderna Cosmologia possui como suporte observacional as evidências produzida pela
Astronomia profunda e, como quadro conceitual de fundo, a Teoria da Relatividade
Geral (TRG), que permite caracterizar o cenário global (o contı́nuo espaço-tempo)
onde sucederiam os processos fı́sicos relevantes em escala cósmica.
456
13.2 Os Antecedentes
Iniciemos nossa exploração indagando pela origem da imagem comum, habitual, que
temos sobre o Cosmos. Há diversos conceitos básicos que precisamos conhecer para
compreender o mundo natural e, em particular, descrever as caracterı́sticas do Uni-
verso, como espaço, tempo, corpo, causa, luz, dentre outros. Vamos, então, empreen-
der uma genealogia, uma análise histórico-genética desses conceitos, principiando pelos
mais básicos, que são as noções de espaço e de tempo. Para este fim vamos narrar uma
série de episódios que, em linhas gerais, nos fornecerão um entendimento suficiente
sobre os antecedentes da atual visão cientı́fica sobre o Cosmos.
Espaço e Tempo da Sensibilidade:
Nossa narrativa começa com um experimento que hoje é clássico, realizado por Mat-
urana e outros nos anos 50. Eletrodos foram fixados nos nervos ópticos de uma rã, na
tentativa de identificar as formas de objetos que os excitariam. Os resultados foram
surpreendentes: a rã reagia a dois padrões de movimento somente, o de um pequeno
objeto esvoaçando horizontalmente (o ”padrão-inseto”, do qual a rã tendia a se aprox-
imar) e o de uma grande sombra pairando ao alto (o ”padrão-cegonha”, do qual a rã
procurava se afastar). Ora, rãs comem insetos, e cegonhas comem rãs; os comporta-
mentos de ataque e fuga são perfeitamente compreensı́veis. O singular é que entre a
apresentação dos padrões a rã não processava quaisquer estı́mulos visuais - como se o
mundo simplesmente desaparecesse. Ela sequer podia distinguir se uma mosca única
foi e voltou ou se duas moscas distintas passaram sucessivamente - dois padrões-mosca
sucederam, é tudo. O Universo da rã é descontı́nuo, sua ’cosmologia’ é ’estroboscópica’:
não existem objetos perduráveis no mundo da rã. A pergunta então é: como surgiram
os objetos?
Para procurar uma resposta, devemos recorrer à Paleoneurologia, a ciência da evolução
dos sistemas nervosos. Nossa história remonta assim a cerca de 65 milhões de anos
atrás, quando um acidente cósmico - o choque de um grande asteróide com a Terra
- provocou mudanças profundas nas condições ambientais do planeta e determinou
a extinção do gênero então dominante - os dinossauros. Foi a partir desta catástrofe
(coincidente, além disso, com a erupção de grandes vulcões e o possı́vel alastramento
de epidemias de vı́rus) que os mamı́feros, até então circunscritos a nichos ecológicos
especı́ficos, encontraram campo livre para expandir-se e aceleraram sua evolução. Em
particular, um fato decisivo transcorreu: com o abandono dos hábitos noturnos em fa-
vor da atividade diurna agora possı́vel, a visão dos mamı́feros, acostumada às condições
da noite, teve de adaptar-se à clareza do dia. A flexibilização dos centros cerebrais da
visão, requerida para tal tarefa, permitiu que o sistema perceptivo dos mamı́feros
adquirisse uma capacidade notável, que podemos chamar de sı́ntese dos sentidos de
longo alcance, ou seja, seus cérebros passaram a integrar os estı́mulos recebidos pela
visão, pelo olfato e pela audição num mapa unificado - operação extremamente sofisti-
cada, uma vez que os sinais visuais, olfativos e sonoros são de natureza muito distinta.
457
Esta sı́ntese permitiu que os objetos percebidos ganhassem identidade e estabilidade,
ainda que estivessem em movimento ou que o observador mudasse seu ponto de vista (é
por isso que ao caminharmos em volta de uma árvore, digamos, ela continua a mesma,
embora os estı́mulos que recebemos dela estejam variando continuamente!). Em con-
seqüência, o mundo dos mamı́feros ganhou continuidade e passou a ser constituı́do
por objetos duráveis. Esta objetificação do mundo foi o nascimento do Tempo e do
Espaço da Sensibilidade, o quadro biológico de fundo a partir do qual apreendemos a
realidade e nos situamos nela.
Nossa próxima etapa também está associada a uma variação climática: há cerca de 5
milhões de anos, na África, grandes regiões de densas florestas tropicais foram pouco
a pouco se transformando em savanas de vegetação baixa. Privados do ambiente mul-
tidimensional da floresta fechada, alguns primatas que aı́ viviam adaptaram-se às
novas condições assumindo uma postura ereta (ou seja, verticalizando a coluna verte-
bral). Esta mudança aparentemente tão simples teve imensas consequências. As patas
dianteiras puderam ser liberadas da função exclusiva de locomoção; a progressiva
oposição do polegar aos outros dedos (permitindo pinçar os objetos) combinada a um
delicado alinhamento do olhar com o movimento dos punhos (garantindo a precisão
dos gestos) acabou por transformar as patas em mãos. Assim, esses primatas cam-
inhantes - nossos ancestrais - se tornaram animais técnicos, e conseguiram, há um
milhão de anos, o extraordinário feito de adquirir controle sobre um processo: o fogo.
As mãos passaram a levar o alimento à boca; liberada da função de agarrar a presa, a
mandı́bula pôde suavizar-se e diminuir de tamanho, facilitando a emissão de sons (e
o aumento concomitante da capacidade craniana). A maneira mais ’econômica’ de se
produzir todo este conjunto de alterações morfológicas é atrasar a maturação dos fetos
- processo a que os paleoantropólogos chamam de neotenia. Os bebês proto-humanos,
assim, passaram a nascer cada vez mais ’inacabados’, ou seja, sua maturação com-
pleta começou a ocorrer depois de nascidos. O desenvolvimento retardado reduz a
influência dos padrões de comportamento inatos e aumenta a capacidade (graças aos
cérebros aumentados e complexificados) de se aprender padrões; progressivamente, a
transmissão de comportamentos torna-se cada vez mais importante.
Ora, estes bebês neotênicos são, durante um longo perı́odo, relativamente incapazes, e
requerem por isso cuidados intensivos por parte do grupo. A simples sobrevivência da
espécie exigiu então uma forte coesão da coletividade, uma socialização integradora,
para que os cuidados com os infantes pudessem ser ministrados. A inovação revolu-
cionária que fomentou o fortalecimento dos laços sociais foi uma nova forma de co-
municação, apoiada na facilidade de emitir sons. A voz converteu-se assim em um
novo suporte de registro em que o significado dos gestos e posturas (de alerta, de
afeto, etc) empregados pelo grupo foi traduzido em palavras. O surgimento da fala:
talvez o acontecimento mais decisivo da história de nossa espécie. Ao comunicar-se
458
entre si, esses animais falantes produziram uma tecnologia prodigiosa, uma memória
compartilhada, fora do corpo dos indivı́duos. Pela simbolização, a codificação de sinais
substituindo coisas ou ações, o repertório de experiências e conhecimentos de todo o
grupo podia agora ser continuamente acumulado e transmitido às novas gerações. À
medida que os ciclos naturais - os perı́odos de migração de manadas e as estações do
ano, por exemplo - foram sendo recordados e correlacionados, os registros de fatos já
vividos transformaram-se em expectativas, e daı́ em previsões; rebatida sobre o fu-
turo, a memória se converte em antecipação, possibilitando a nossos ancestrais operar
com uma dimensão sem precedentes, que nenhum outro animal parece apreender: o
amanhã. Este foi o nascimento do Tempo e do Espaço Simbólicos, o quadro coletivo
de fundo a partir do qual concebemos a realidade e atuamos nela.
Ciclos e Simetrias:
459
metáforas para figurar os seres e os acontecimentos do mundo natural e, em particular,
para a descrição da relação entre o Céu e a Terra. Se considerarmos a história das
culturas, encontraremos uma variedade de formas para esta relação: os egı́pcios, por
exemplo, figuravam o céu como uma mulher que abraça seu enamorado, o mundo; os
navajos norte-americanos falavam da grande serpente do céu, cuja troca periódica de
escamas correspondia ao ciclo das estações, e assim por diante, na Índia, em Babilônia,
etc. Essas alegorias de ı́ndole animista não deveriam nos admirar; surpreendente, na
verdade, é a concepção abstrata, de caráter artificial, que graças à inspiração de Tales
de Mileto e de Pitágoras de Samos os Gregos da época clássica produziram, ao tomarem
como sı́mbolo de perfeição, ordem e equilı́brio uma figura geométrica maximalmente
simétrica, a esfera, e afirmarem que o Todo se assemelharia a uma seqüência de cascas
esféricas concêntricas, encaixadas umas nas outras. Esta imagem de uma totalidade
grandiosamente arredondada, que surge já em traços bem acabados no Timeu de
Platão, foi denominada de Cosmos, significando Todo-Ordenado ou Todo-Belo, pois
para estes Gregos as noções de simetria e ordem vinculavam-se à de beleza (em grego,
kosmé, raiz também de cosmético). Uma totalidade em que cada parte tem o seu lugar
definido em função de um princı́pio ideal de proporções harmoniosas: não seria absurdo
afirmar que a apreensão dessa Harmonia constituiu o objetivo último da Ciência grega.
Era uma concepção de mundo que ninguém havia imaginado antes, e que irá dominar
a imaginação dos homens por quase 20 séculos.
O Cosmos de Dante:
Assim, o céu foi convertido em uma abóbada, uma cúpula esférica, e o tempo cı́clico
recebeu uma metáfora inesquecı́vel: o cı́rculo. Tal como os astros se moveriam em
órbitas esféricas porque perfeitas, o Tempo, que Platão chama de ”imagem móvel
da eternidade”, exibiria a forma irretocável da circularidade. Aristóteles manterá
a esfericidade essencial do Cosmos e denominará o Tempo de ”medida do movi-
mento”, recusando-lhe autonomia mas confirmando sua reiteração circular. O tempo
aristotélico continuará a ter como modelo o ciclo, uma vez que os movimentos ce-
lestes perfeitos são cı́clicos; eventualmente, esses ciclos se completarão numa espécie
de grande ano cósmico. No século II da Era Comum, no cadinho de culturas e tradições
ocidentais e orientais que era Alexandria, esta concepção cosmológica qualitativa, ge-
ometricamente inspirada, advinda da filosofia helênica encontrou-se com a astronomia
observacional muito precisa dos Babilônios e, em particular, com a aritmética de base
sexagesimal (muitı́ssimo mais manejável que a dos Gregos) que estes empregavam.
Desta mescla entre esquema geométrico, medições detalhadas e agilidade de cálculo
resultou uma das grandes obras do pensamento Antigo, o Almagesto (”O Grande
Tratado”) de Ptolomeu. Primeiro modelo descritivo e preditivo da Fı́sica Matemática,
o Cosmos de Ptolomeu permitia representar quantitativamente os movimentos dos
astros errantes (suas ”revoluções”) através da concatenação de sucessivas rotações (os
”epiciclos”, assentados sobre cı́rculos básicos ou ”eferentes”), cuja resultante podia
ser projetada como uma linha (a ”trajetória”) numa carta ou planisfério. Gerações de
460
astrônomos aperfeiçoaram este arranjo de ciclos e epiciclos, complicando-o cada vez
mais; o esforço de Copérnico, no sec XVI, não visava senão simplificar essa barafunda
de esferas engrenadas em esferas - mas acabou, como veremos, por assinalar uma
mudança da própria civilização.
O Ocidente, porém, foi poderosamente marcado por uma outra concepção de espaço
e de tempo, igualmente original, mas inteiramente diversa da dos Gregos: a de que o
mundo (e portanto o tempo) teve um começo (e terá um fim). Atribuı́da a Zoroastro,
o profeta persa, e imensamente difundida pela Bı́blia judaico-cristã, esta doutrina
extraordinária afirma que há acontecimentos singulares que nunca se repetiram nem
se repetirão (a Gênese, a Crucificação, o Apocalipse), sendo o tempo demarcado por
estes eventos únicos. O Genesis, de fato, consiste de uma exposição temporalizada
da criação em que o espaço está quase ausente, e é decididamente secundário (sua
principal representação é o Tabernáculo, cuja estrutura remete diretamente à de uma
tenda quadrangular, montada sobre as areias do deserto). Jorge Luı́s Borges, em uma
página memorável de História da Eternidade, registra sua perplexidade perante esta
figura do tempo, pois se a essência do tempo é haver um antes sucedido por um depois,
o que dizer de um instante que não teria precedentes, que não seria a sucessão de um
instante anterior? (Kant chegará a reconhecer nesta borda absurda do tempo uma
antinomia, isto é, uma contradição intrı́nseca, da própria Razão.) Mas se os Gregos
encarnavam a repetição periódica na metáfora do cı́rculo, a figura bı́blico-zoroastriana
do tempo corresponderia a uma outra entidade geométrica: um segmento de reta,
confinado por extremidades abertas (e inconcebı́veis). Como é evidente, estas dı́ades
de imagens do espaço e do tempo, o Céu esferóide e a repetição perpétua, o Céu
poliédrico e a duração finita, são rigorosamente dı́spares, e para compatibilizá-las o
Ocidente teve que aguardar a obra de dois santos, Agostinho e Tomás de Aquino. A
concepção de Todo vigente na Idade Média européia - o magnı́fico Cosmos de Dante
- resultou deste autêntico milagre de conciliação de incompossı́veis.
De fato, recebemos desse grandı́ssimo pensador medieval a figura de um cosmos organi-
camente estruturado, demarcado por noções bem-definidas de duração e eternidade, e
de limite e infinidade. Vejamos o modelo espaciotemporal que Dante nos oferece: trata-
se antes de tudo da associação entre dois reinos ou domı́nios distintos, o material e o
espiritual. A geografia, ou mais exatamente, a cosmografia que Dante nos apresenta
articula-se com a imagem nuclear da cosmovisão medieval, a Grande Cadeia dos Seres,
segundo a qual todo e qualquer acontecimento subordina-se a uma ordem cósmica
global. Neste mundo organicamente estruturado, nenhum evento pode suceder num
local qualquer que não seja um reflexo dessa ordem cósmica - e que não se reflita nela
(por isso o terror dos cometas e dos meteoros, daquilo que surge inesperadamente no
céu e quebra a boa ordem da natureza, resultando invariavelmente em catástrofes para
reinos e pessoas). Essa subordinação do local ao global, consubstanciada na Grande
Cadeia dos Seres, é coetânea à imagem de um mundo cerrado, fechado sobre si, hi-
erarquizado formalmente. Com efeito, a forma de cada ser prescreve seu lugar numa
461
hierarquia vertical: há a profundidade infernal, a superfı́cie da Terra - onde ressalta
o monte do Purgatório - em seguida a sucessão de cascas cristalinas concêntricas (as
órbitas) em que estão engastados os astros errantes ou planetas (inclusive o Sol e a
Lua), culminando na abóbada das estrelas fixas. Envolvendo esse mundo fı́sico finito,
tão reminiscente do cosmos de Ptolomeu, encontra-se a derradeira expressão da cor-
poralidade, a camada denominada de Primum Mobile que recheia, se assim se pode
dizer, a separação entre os domı́nios fı́sico e espiritual e tem a função de realizar a
causa inicial (o ”Primeiro Motor”) dos movimentos requerido por Aristóteles. Para
além, estende-se indefinidamente o reino incorporal celeste, o Empı́reo, habitado pelas
almas bem-aventuradas e pelos querubins, anjos e arcanjos da tradição cristã.
A passagem:
462
geneizar o Espaço, liberar o Tempo de sua sujeição ao movimento, e deslocar a noção
de Causa das coisas para o comportamento das coisas. Autêntica refundação do pen-
samento do Ocidente sobre o mundo natural, cujo eixo foi o destronamento da herança
aristotélica em favor de uma concepção platônica, suas principais caracterı́sticas estão
consubstanciadas na célebre sentença de Galileu, que os séculos seguintes não es-
quecerão: ”Deus escreveu o Livro da Natureza em linguagem matemática; trata-se
doravante, para o Entendimento, de decifrar essa linguagem”. A passagem decisiva se
dá com uma série de experimentos conjeturais - perfeitamente análogos aos Gedanken-
experimente (”experimentos conjeturais”) que Einstein tanto apreciava - que acabam
por fazer Galileu concluir que os corpos tendem a manter o movimento que neles foi
impresso, até que um outro agente intervenha obrigando sua alteração (o que é a
essência do Princı́pio de Inércia, que Descartes pouco depois irá formalizar, e Newton
adotará como fundamento da moderna Mecânica). Ora, isso torna possı́vel conceber
um movimento retilı́neo de extensão e duração indefinidas, ou seja, um corpo colo-
cado em movimento retilı́neo e uniforme poderia se mover continuamente, durante
um perı́odo em princı́pio arbitrariamente longo, até sofrer uma interrupção. A prin-
cipal conseqüência dessa idéia extraordinária é abolir a distinção de natureza entre
os mundos sub- e supra-lunar; em particular, inaugura-se a possibilidade de poderem
ocorrer movimentos perpétuos lineares, e não somente circulares: à repetição cı́clica
dos astros vêm agora se somar os movimentos inerciais indefinidamente duráveis. Mas
se um corpo se move interminavelmente em linha reta, então é necessário que o espaço
fı́sico tenha uma extensão correspondentemente interminável. Rompem-se as bordas
do mundo fechado de Dante, e entra em cena o Universo infinito que será a glória de
Newton.
O Mundo Fechado:
463
Examinemos em algum detalhe como sucedeu a passagem do Mundo Fechado medieval
para o Universo Infinito moderno, ao cabo do perı́odo revolucionário do Renascimento.
No âmbito concreto, material, do Cosmos medieval, ocorrem duas naturezas distintas:
o mundo sublunar, o domı́nio abaixo da orbis ou camada onde a Lua está inscrita,
correspondente aos acontecimentos que sucedem na Terra; e o mundo supralunar, o
mundo da perfeição celeste, associado ao extraordinário sistema de cascas esféricas
móveis que representam o céu. Há então dois modos de movimento, correspondentes
às duas instâncias da natureza: o modo natural, espontâneo, perpétuo e perfeito dos
astros, e o modo sempre imperfeito, sempre limitado, sempre causado externamente,
dos movimentos terrestres, chamados de ”aberrantes”, pois nunca são duradouros,
invariavelmente começam aqui e terminam ali, nem espontâneos, invariavelmente as
coisas são obrigadas ”de fora” a se deslocar. Na verdade, os movimentos sublunares são
concebidos, nesta cosmovisão aristotélica, como mudanças análogas ao envelhecimento:
tirar um corpo daqui e colocá-lo ali é submetê-lo a uma transformação, é realizar
uma modificação semelhante ao envelhecer. Observemos que o conceito fundamental
aqui é o de indivı́duo; assim, o lugar que um corpo ocupa é, primordialmente, um
atributo seu, enquanto entidade individualizada. O mundo material, assim, consiste
do conjunto de todos os indivı́duos, do que decorre a noção medieval do espaço fı́sico
como correspondendo ao conjunto dos lugares habitados pelos indivı́duos. Numa tal
concepção não há lugar para o vazio - se retiramos um corpo que está separando outros
dois, seu ”lugar” viaja com ele, e os corpos restantes terão de entrar em contato.
Disso então resulta um mundo pleno, um mundo inteiramente denso, em que o vazio
é impossı́vel.
Além disso, há Quatro Causas ou Princı́pios Primeiros que explicam o que são as
coisas ou indivı́duos, isto é, dão conta de sua origem, essência e razão de ser, que po-
dem ser ilustradas pela famosa imagem das etapas de criação de uma estátua por um
escultor, que Aristóteles nos legou e a posteridade não esqueceu. Há primeiramente a
causa material, uma base ou suporte, análoga a um bloco de mármore bruto sobre o
qual nenhuma forma foi ainda inscrita, mas que tem a potência de receber incontáveis
formas. A seguir, há a causa formal que corresponde a uma planta ou diagrama de
proporções concebido na mente do artesão, no qual estão definidos os limites que serão
impostos àquela matéria bruta. Há então a causa eficiente, identificada ao trabalho
concreto do escultor ao desbastar a pedra e imprimir-lhe os contornos da forma dese-
jada, e enfim a causa final que é a finalidade ou objetivo da estátua pronta, ou seja,
o uso a que se destina, cerimonial, estrutural, ornamental, etc. Em suma, as Quatro
Causas dizem o quê uma coisa é - a causa material, porquê é - a causa formal, como
é - a causa eficiente, para quê é - a causa final.
Ao ser aplicada ao problema da compreensão do movimento, a doutrina das Quatro
Causas vai nos apresentar um quadro sumamente curioso. Fundamentalmente, têm
importância primordial as causas formal (segundo a qual um corpo tende a cair para
o solo ou ascender para o primeiro céu) e final (segundo a qual recuperar o repouso é
464
a tendência de todo corpo que sofre um deslocamento). É a causa formal que vai fazer
um corpo massivo, pesado, tender a dirigir-se à superfı́cie da Terra; ou, ao contrário, se
tem natureza leviana, aérea, como o fogo, tender a dirigir-se à casca da Lua, ao céu. Já
a causa final será responsável pelo destino último do movimento, que é sua extinção,
ou seja, o repouso. Todo movimento é uma transformação, e todo ser resiste a esta
transformação; portanto, quando se desloca um corpo, colocando-o em movimento,
ele naturalmente busca fazer cessar esse movimento, e para isso dirige-se para o seu
lugar natural de repouso. Quando se toma um corpo pesado, como uma pedra, e a
largamos, o que se testemunha é que ela espontaneamente se dirige para o seu lugar
natural, a superfı́cie da Terra, e lá repousa em definitivo; sem uma nova interferência
externa, ela não mais vai se animar. É essa combinação entre as causas formal e final
que irá governar o comportamento dos corpos no domı́nio sublunar.
Trata-se de uma concepção de caráter formal-qualitativo, ou seja, não importam os
caracteres quantitativos dos movimentos: não importa de que altura foi largada a
pedra, basta saber que é da sua natureza dirigir-se à Terra e lá repousar. Há, por outro
lado, uma distinção essencial entre o movimento, que é uma transformação forçada,
e o repouso, que é o estado natural de todas as coisas. Consideremos o exemplo do
movimento balı́stico: tomemos uma pedra e a lancemos para cima e para adiante.
Vemos um percurso aparentemente paradoxal: a pedra inicialmente sobe, alcança
uma altura máxima, e depois começa a descair, até chegar ao solo e parar. Por quê
a pedra não cai diretamente no chão, assim que a soltamos da mão? Não seria essa
a sua tendência ’natural’ ? Para dar conta desse tipo de fenômeno, Aristóteles lança
mão da noção de perı́stase (’quase-imobilidade’). Ao soltarmos a pedra, ela desloca o
ar de seu lugar natural, comprimindo-o à frente e o rarefazendo atrás. Ora, o ar busca
retornar a seu estado natural de imobilidade, e assim trata de compensar o desarranjo
em que se encontra migrando da frente da pedra para trás, o que resulta em um
empurrão contı́nuo do ar sobre a pedra na direção do movimento. É a combinação
entre as tendências da pedra e do ar de retornar a seus devidos lugares naturais que
explicará - de maneira inteiramente consistente com os princı́pios causais adotados, e
conforme ao testemunho dos sentidos - as trajetórias balı́sticas.
Por outro lado, trata-se de um mundo finito, isto é, o espaço, o conjunto de lu-
gares habitados pelos indivı́duos, é necessariamente finito. Por quê? De acordo com
o princı́pio da causa formal, quando um corpo é afastado do seu lugar natural de
repouso espontâneo, ele tem avidez de retornar a esse lugar, de recuperar a natural-
idade do repouso. Sabemos que de quanto mais alto for largada uma pedra, maior
será sua velocidade ao precipitar-se de volta ao chão, porque maior será sua avidez
de recuperar seu lugar natural (isto nos faria crer, por exemplo, que uma bala acel-
era ao deixar a arma...). Em resumo, quanto mais distante estiver um corpo de seu
lugar natural, maior será sua avidez em recuperá-lo. Ora, se houvesse um corpo a
uma distância infinita da Terra, ele buscaria a Terra com uma velocidade infinita -
e nós não vemos corpos passarem por nós com velocidades infinitas; logo, não há
465
corpos situados a uma distância infinita, e portanto o mundo é finito e fechado, o
espaço é cerrado. Não obstante o rigor lógico desse raciocı́nio, a finitude do Cosmos
vai colocar interessantı́ssimos problemas para os medievais; por exemplo, é possı́vel
a um anjo colocar o braço para além da última das esferas? Se o anjo puder fazer
isto, lugar, ou seja, espaço, estará sendo criado, o que é em princı́pio uma violação
da ordem cósmica preestabelecida desde o momento singular - e supostamente único
- da criação. Por outro lado, se o anjo não puder estender o braço para fora da última
esfera, então mesmo a onipotência da divindade terá limites; a vontade do anjo terá de
estar submetida à sua razão, Deus terá de ser racional antes de ser voluntarioso. Este e
outros problemas ditos ”bizantinos” - quantos anjos cabem na cabeça de um alfinete,
como fazer um camelo passar pelo buraco de uma agulha - costumam hoje em dia ser
ridicularizados, mas na verdade constituı́ram esforços profundos de investigação lógica
acerca da natureza do espaço.
Essa concepção das causas do movimento vai estar intimamente associada a uma noção
correlata acerca do tempo como um conceito derivado, dependente do conceito de
movimento: é porque há movimento que há o tempo, enquanto imagem ou sintoma da
mudança; se porventura as mudanças cessassem, cessaria todo transcurso. Assim, para
os escolásticos medievais, cultores do aristotelismo, o Espaço fı́sico era definido como a
soma dos lugares ocupados pelos corpos (e portanto o vazio - o lugar de corpo nenhum
- era absurdo), o Movimento era entendido como uma transformação, a remoção de
um corpo de seu estado ’natural’ de repouso devido a uma perturbação externa, e
o Tempo era um mero efeito da transformação em curso num dado fenômeno, sem
existência ou autonomia próprias. Ora, podemos dizer que uma das principais vias
de passagem do Mundo medieval fechado e orgânico ao Universo moderno infinito
e mecânico ocorrerá através de uma renovação do entendimento acerca da natureza
do movimento, envolvendo um deslocamento da noção de causa e uma libertação do
tempo de sua dependência ao movimento.
A Revolução do Renascimento:
Suponhamos, diz Galileu, que alguém esteja à beira de um cais num lago tranqüilo,
e que um marinheiro esteja no alto do mastro de um barco que está passando bem
próximo, num curso paralelo ao cais. Quando estão frente a frente, e quase podem
se tocar, ambos largam uma pedra, simultaneamente; o mesmo fenômeno, ocorrendo
466
em circunstâncias muito próximas. O que irá se passar? As duas pedras vão cair em
locais separados, uma no pé do cais, outra no pé do mastro do barco, embora tanto
o observador do cais quanto o marinheiro barco considerem a queda da sua pedra
perfeitamente vertical. A conclusão brilhante de Galileu é que para o experimentador
no cais o movimento do barco para avante foi emprestado para a pedra embarcada,
e reciprocamente, para o marinheiro foi o movimento ’para trás’ do cais em relação
ao barco que foi emprestado para a pedra terrestre. Ou seja, movimentos podem ser
cedidos a um corpo e se compor, adicionar-se, subtrair-se, até mesmo compensar-se;
ainda mais, corpos idênticos (com a mesma forma, portanto) podem se mover de modo
diferente de acordo com a composição de movimentos recebida - ou, equivalentemente,
de acordo com o movimento relativo entre os observadores. Galileu acabou de estab-
elecer que a velocidade de um corpo é uma grandeza relativa, ou seja, seu valor varia
para cada observador, conforme seu respectivo estado de movimento. O movimento
principia a se descolar da causa formal.
Ainda mais significativo é a conclusão seguinte, em que Galileu anuncia que um corpo
abandonado a si próprio manteria seu estado de movimento. Ele derivou esta concepção
revolucionária da seguinte experiência: seja uma esfera lisa, que deixamos escorregar
num plano inclinado. O que se verifica? Que a esfera adquire velocidade na descida,
alcança o piso, anda um pouco - e pára. Suponhamos, diz Galileu, que o piso seja
bem encerado. Nesse caso, observarı́amos a esfera, largada da mesma altura, atingir
uma distância bem maior. E se estivéssemos em um daqueles magnı́ficos palácios flo-
rentinos, com um assoalho de mármore perfeito, e exaustivamente encerado, a esfera
iria mais longe ainda. Neste momento, Galileu realiza um salto cognitivo, exibe uma
ousadia conceitual raras vezes igualada, e sugere: se o piso fosse um plano perfeita-
mente liso, um plano geométrico ideal, o corpo a que fosse emprestada essa velocidade
jamais cessaria seu movimento, se moveria perpetuamente. É importante notar que
invariavelmente se vê as coisas saı́rem daqui e pararem ali, quer dizer, ninguém jamais
observou este movimento interminável suceder - não se trata portanto de simplesmente
descrever um fenômeno tı́pico, pertinente ao mundo sensı́vel, e sim de vislumbrar o
fenômeno ’purificado’, apreendido em sua essência ou arquétipo. Galileu, revelando
sua inspiração platônica, irá defender resolutamente a predominância dessa realidade
esquemática, idealizada, sobre a realidade concreta; afirmação ardente de uma con-
cepção idealista em oposição ao senso comum fundado na experiência sensı́vel - como
se Platão fosse, ironicamente, o renovador de Aristóteles...
Mas nesse caso o movimento não seria governado por sua extinção: ambos, repouso e
movimento, tenderiam a se manter. Desaparece a diferença de natureza entre repouso
e movimento, e portanto a regência da causa final: o repouso é somente um caso
particular de movimento, o movimento com velocidade nula. Desaparece também, em
princı́pio, a distinção entre movimentos celestes e terrestres: uma vez que se conceba
a possibilidade de que um movimento possa ser impresso a um corpo sem buscar
extinguir-se no repouso, então, em princı́pio, esse movimento pode perdurar, quiçá in-
467
definidamente; ou seja, deixam de haver fronteiras invioláveis entre os orbes terrestre
e celeste, não há distâncias preestabelecidas que esse corpo não possa alcançar, movi-
mentos celestes e terrestres podem ambos ser perpétuos. Um movimento aberrante
de duração indefinida... Estilhaçam-se os contornos do mundo fechado medieval, e se
inaugura a extraordinária concepção de um espaço e de um tempo infinitos.
O Universo Infinito:
468
se a ’traição’ de seu amigo Andreas Osiander, que ainda assim apresenta a proposta
heliocêntrica como mera conjetura. Em breve, porém, a concepção de Copérnico irá
destronar a tradição ptolomaica.
A Ciência Moderna:
Vemos assim as grandes linhas esboçadas por Galileu para a nova maneira de empreen-
469
der as investigações da Filosofia Natural: a partir de estudos empı́ricos (experimentos
e observações) de cada classe de fenômenos (descartando a vinculação ’orgânica’ en-
tre local e global que vigorava na Grande Cadeia dos Seres), trata-se de elaborar
regras quantitativas (expressas, portanto, em linguagem matemática) que incorporem
os dados medidos (por exemplo, sobre velocidades, distâncias percorridas, durações,
no caso de um movimento), correlacionando as grandezas relevantes para a caracter-
ização teórica (ou seja, universal) desses eventos. É esta abordagem empı́rico-teórica
que Kepler, num dos maiores feitos da história das Ciências, emprega para extrair
das tabelas de observações astronômicas de Tycho Brahe as leis cinemáticas que de-
screvem as trajetórias dos planetas no Sistema Solar. Ironicamente, o próprio Galileu
não valorizará essa conquista, porque o método galileano de Kepler acabou por revelar
órbitas planetárias elı́pticas, e não circulares, como invocavam os venerandos preceitos
que entronizavam a esfericidade como imagem da perfeição celeste - que Galileu, ele
mesmo, não foi capaz de abandonar... A fidelidade às medições, porém, encarnará
o traço mais decisivo desta nova forma de dialogar com a Natureza: as observações
empı́ricas - ou seja, os próprios fenômenos - terão a última palavra acerca da validação
ou não de uma dada teorização, tornando o empreendimento cientı́fico auto-corretivo e,
portanto, progressivo. Novas observações serão sempre capazes de impor modificações
aos princı́pios e noções já estabelecidos.
Por exemplo, consoante à subordinação do local ao global, os acontecimentos da na-
tureza deviam estar sempre em harmonia com a ordem cósmica; assim, os ciclos que se
repetem na disposição dos astros fundavam a imagem de um tempo quotidiano, comez-
inho, submetido à determinação das esferas celestiais. Ao incorporar as medições dos
perı́odos dos acontecimentos às leis formais que doravante irão descrevê-los, Galileu
opera uma transmutação fundamental: de sintoma ou efeito do movimento, o tempo
se externaliza, passa a ser uma referência externa, um descritor autônomo e indepen-
dente para os fenômenos. O tempo se liberta do movimento: mal podemos imaginar as
dificuldades excruciantes com que seu espı́rito se defrontou para lograr essa autêntica
transição entre duas eras do pensamento.
A princı́pio, essa modificação vai se dar quase imperceptivelmente, a partir de uma
inovação no domı́nio da música. Nos conventos cristãos medievais perpetuava-se a
tradição judaica da ”salmodia”, que consiste em fazer uma leitura cantada do Evan-
gelho, do texto sagrado. Contudo, quando se procurou usar vários leitores, de modo
a que suas vozes se combinassem nessa fala cantada, surge o problema de como fazer
todos os cantores entrarem em compasso. Este é o problema da constituição da música
polifônica - como fazer todas as vozes atuarem em conjunto (que é o mesmo problema
do mestre de harmonia na escola de samba). Num pergaminho datado do século XIII,
encontrado em Notre Dame, surge uma solução: a elaboração de uma notação musical
inovadora, um signo abstrato que representa uma unidade arbitrária de duração. A
extensão dessa unidade não é definida, pode ser mais curta ou mais longa, de acordo
com a decisão do regente; o que importa é que as vozes irão entrar na canção numa
470
seqüência bem determinada, garantindo a harmonização dos diferentes cantores (mais
tarde, o metrônomo irá realizar precisamente essa função).
Foi dessa maneira tão pouco espetacular que foi concebida a idéia de que o tempo pode
ser dividido. Delineia-se agora a idéia de um tempo que seria essencialmente divisı́vel,
segmentável, e que portanto pode ser concebido como uma sucessão de unidades fixas.
Quando essa noção aparentemente inconseqüente encontrou-se com um dispositivo
igualmente revolucionário - o relógio mecânico - o resultado foi uma transformação
sem precedentes das próprias bases da cultura ocidental. No mundo medieval, a rigor,
a divisão do tempo não tinha um sentido profundo, porque o tempo cı́clico é um
fluir contı́nuo, o ciclo do dia e da noite encadeando-se com o das semanas, e com o
das estações, e com o dos anos. Ademais, os pedaços do dia, ou seja, as horas, eram
elásticas: mais compridas no verão, mais curtas no inverno, e assim só possuı́am,
desde a Antiguidade, um caráter meramente convencional. Uma vez que a verdadeira
natureza do tempo seria contı́nua, cortá-lo só podia ser encarado como um artifı́cio. O
relógio mecânico veio mudar tudo isso, graças à invenção, por um gênio desconhecido,
do escape, um dispositivo muito simples (como costumam ser as grandes invenções)
que permitia transformar um processo contı́nuo - a queda de um peso - num processo
descontı́nuo, repetidamente interrompido e retomado, que torna o ’fluir’ do tempo
numa sucessão de segmentos de duração fixa.
Até então os relógios eram grandes mecanismos que procuravam encarnar os ciclos
naturais. O curso dos planetas e da Lua, o dia, a noite, os relógios representavam
pictoricamente esses grandes ciclos naturais. Mas um gênio florentino desconhecido
teve a idéia de colocar num cantinho despretensioso um movimento que dependia ex-
clusivamente das engrenagens do próprio relógio, um movimento que não remetia a
nenhum ciclo natural. Uma medida de tempo puramente convencional, dependente
apenas da estrutura interna do relógio. Por exemplo, a divisão do dia em doze ho-
ras é uma herança da aritmética babilônia (que usava a base doze), que persistiu
através da astrologia; não representa qualquer aspecto particular da natureza. Graças
à colocação dos relógios no alto da torre das igrejas, esse ciclo puramente convencional
de tempo rapidamente vai se tornar a referência em relação à qual os ciclos naturais
serão medidos. Em conseqüência, o tempo natural passará a ser coordenado. Até então,
trabalhava-se do nascer ao por do sol; no verão esse perı́odo tem uma extensão, no
inverno outra - mas agora a independência com relação aos ciclos naturais, assegurada
pela convencionalidade do tempo do relógio mecânico, vai tornar possı́vel que meninos
de doze anos trabalhem nas minas de Gales, no final do século passado, um perı́odo
fixo: dezesseis horas por dia...
471
pintura Medieval para a Renascentista. Recordemos as Madonas medievais: as figuras
são bidimensionais, plasmadas na tela, suas proporções são estruturadas simbolica-
mente e definidas apenas pelos contornos. Não há qualquer intenção de se representar
’realisticamente’ as figuras: a Madona e o Menino são imensos (dada sua importância
religiosa) frente aos minúsculos pastores e animais presentes na base do quadro, a
paisagem de fundo é tão somente ornamental. Tampouco se pretende apresentar acon-
tecimentos: o objetivo é transmitir o sı́mbolo da sagrada Maternidade de Deus, e não
descrever as tensões musculares dos braços da Dama ao sustentar o corpo do Infante.
O tempo, portanto, está ausente: mesmo na Via Sacra, em que a história do martı́rio
de Cristo é narrada em sucessivas etapas, cada quadro retrata uma cena exemplar - e
essencialmente estática. Quando Simão o Cireneu se compadece do Cristo vergado sob
a cruz e lhe empresta o braço para aliviar Sua carga, trata-se da imagem paradigmática
da Caridade solidária, e não do movimento corporal requerido para a ação fı́sica de
rebalancear o peso do madeiro.
472
A Arte, então, preparou a passagem da antiqüı́ssima noção do tempo como um fluxo
contı́nuo para a nova noção do tempo como uma sucessão de unidades descontı́nuas
- que o relógio mecânico virá a implementar - e organizou geometricamente o espaço,
abrindo caminho tanto para a Mecânica quanto para a Óptica. Com o espaço iden-
tificado a um volume geométrico, as distâncias serão definidas pela separação entre
pontos geométricos, e da mesma maneira as durações serão medidas em termos de
unidades referidas a um tempo descritor, exteriorizado e autônomo.
O Corte Cartesiano:
O princı́pio de inércia afirma que quando não há agentes externos operando sobre
um corpo, esse corpo realizará um movimento retilı́neo e uniforme, com velocidade
constante, ou seja, a intensidade, a direção e a natureza do movimento serão man-
tidas. Descartes separa estes três aspectos do princı́pio de inércia: a quantidade de
473
movimento ser invariante, o corpo manter a direção, e o movimento ser retilı́neo.
Mas para nós modernos (para nós, cartesianos) esses três aspectos na verdade são
um só: um corpo deixado entregue a si mesmo move-se espontaneamente em movi-
mento retilı́neo e uniforme, ou seja, permanentemente com a mesma taxa. A noção de
inércia irá fundamentar a metáfora do mundo fı́sico como o análogo de uma máquina,
a metáfora-matriz da modernidade.
Essa associação vai permitir que a inovadora noção do tempo como uma seqüência de
unidades se torne ainda mais revolucionária, porque agora vai tornar possı́vel conceber-
se - e Descartes é o primeiro a fazê-lo - uma unidade de tempo de extensão nula; um
ponto de tempo (ou instante). Com efeito, se as etapas do movimento devem ser
referidas a frações sucessivas de tempo, como compatibilizar a continuidade suave do
deslocamento de um corpo com uma duração descontı́nua, segmentada? Dito de outro
modo, como encaixar as ’bordas’ dos perı́odos consecutivos? O que se passaria nas
extremidades de cada segmento unitário - e pior ainda, entre elas? O mundo se desfaria
para em seguida se reconstituir por inteiro? Para superar estes obstáculos Descartes
propõe que a noção de unidade de tempo seja levada ao limite infinitesimal, ou seja,
as durações são contraı́das até a aniquilação, até a extensão nula: o ponto. Ocorre
assim uma assimilação completa do tempo a uma imagem geométrica: identificado
a uma linha de pontos, o tempo torna-se denso - entre duas durações inextensas ou
instantes sempre há um outro instante - e portanto contı́nuo. Com Galileu o tempo
havia adquirido externalidade, mas é Descartes que arremata esta vasta operação de
geometrização do tempo, ao lhe conferir o atributo da densidade. Configura-se assim a
Imagem do tempo como uma linha infinita de pontos, percorrida uniformemente pelo
agora perpetuamente movente, desde um passado infinitamente remoto até um futuro
infinitamente ignoto, e correspondentemente o real, o mundo que está em ato, se acha
embarcado numa perene viagem ao longo desta linha dos instantes, deste tempo único.
474
Igualmente notável é o deslocamento seguinte: a identificação do espaço real no qual
os corpos se movem ao espaço abstrato da geometria euclidiana. Ou seja, um am-
biente concreto como uma sala, onde há cheiros, gostos, luzes, tensões, pressões,
onde fenômenos acontecem, passa a ser recoberto por um espaço abstrato de pon-
tos geométricos. Observemos que se trata de um feito extraordinário do pensamento,
absolutamente não trivial, o de recobrir o mundo sensı́vel com uma capa de pontos
geométricos. De tal maneira que doravante vai-se definir a relação de distância, a sep-
aração entre objetos, em termos da distância que existe entre pontos que representam
cada um dos objetos. Desse modo, o espaço fı́sico da sala será identificado a um vol-
ume geométrico, um paralelogramo, digamos. Seu principal atributo é a capacidade de
conter corpos, de ser preenchido - ou não - por corpos fı́sicos. Contudo, ainda que tais
corpos sejam retirados, o espaço dantes ocupado permanece; de fato, o espaço passa a
ser, fundamentalmente, espaço vazio, pura capacidade de continência. Essa noção de
espaço contentor é também o modelo do próprio universo; basta estender ilimitada-
mente as paredes dessa caixa. Habitado por corpos materiais que atuam uns sobre os
outros pela ação de forças - agentes da modificação de movimentos, que concretizam
a prevalência da causa eficiente - esse espaço geometrizado, neutro e abstrato, que
Newton chamará de ”absoluto”, será o substituto do espaço hierarquizado do cosmos
medieval.
A Mecânica:
Com todos estes componentes, não é de admirar que se possa de fato pensar o mundo
como um colossal mecanismo; tal como as engrenagens em uma máquina, o Universo
tem suas partes precisamente ajustadas de tal modo que o movimento de uma delas
implica nos movimentos de todas as demais. Todavia, não há mais aqui, na mod-
ernidade, uma ordem hierárquica entre o todo e a parte. Agora a parte é homogênea
ao todo, ambos têm a mesma natureza. Corpos em movimento, extensão em movi-
mento: apenas isto é o que existe. Entre o local e o global, entre o mundo terrestre e
o mundo celeste; por toda parte, vigora tão somente a uniformidade mecânica. Agora,
então, o pensamento deve procurar não mais os universais, aqueles nomes gerais que
dizem as classes de seres que existem no mundo; o que doravante interessa ao pensa-
mento é o simples, é a parte mais elementar à qual seja possı́vel reduzir-se um sistema,
um corpo, um todo.
475
tempo’ - a duração de um dado acontecimento, por exemplo - será caracterizado pela
diferença na distribuição espacial dos objetos. Todos os sistemas mecânicos periódicos
podem ser eleitos como ”relógio”, em função de cujo ritmo a evolução de outros sis-
temas mecânicos será descrita; como se, de fato, constituı́ssem encarnações distintas
de um único relógio universal. Assim, qualquer movimento escolhido como padrão
pode ser ’abstratizado’ para adquirir esta função de ’relógio cósmico’, que fornecerá
uma medida absoluta (global, única e independente) para os intervalos entre instantes
e para o qual as leis da Mecânica assumirão a forma mais simples. Todos os relógios,
uma vez sincronizados, manterão perpetuamente esse sincronismo concordando invari-
avelmente em assinalar o mesmo instante, independentemente de suas localizações ou
movimentos. Contudo, como as leis da Mecânica dependem apenas da extensão da sep-
aração temporal entre dois quaisquer eventos, o tempo Newtoniano é intrinsecamente
reversı́vel, ou seja, não é orientado, não define um sentido absoluto entre passado e
futuro. Cada estágio da ’história cósmica’ (as mudanças na constelação dos corpos)
determina (e é equivalentemente determinado por) todos os estágios precedentes e
subsequentes.
Os relógios, portanto, foram fundamentais na instalação da concepção mecanicista
do mundo natural, inclusive na medida em que forneceram a metáfora nuclear desta
Imagem de Mundo: a de que o Universo seria comparável a uma grande Máquina, a um
vasto mecanismo cujo funcionamento é rigorosamente determinado (e por conseguinte
inteiramente predizı́vel) em virtude da concatenação exata de suas peças, de suas
partes simples. Esta analogia não apenas privilegiou a postura analı́tica e reducionista
que se tornaria tı́pica do Mecanicismo, como deu também lugar àquela que talvez seja
a mais espantosa concepção de divindade jamais imaginada por qualquer sociedade
humana: a do Deus Relojoeiro, que monta o mecanismo do mundo e depois se afasta,
deixando o pobre aparelho entregue a si mesmo... Implı́cita nesta imagem maquı́nica do
mundo está a idéia de determinismo, tão cara ao século XIX: nenhum acontecimento
natural é ”livre”, cada parte da grande máquina universal está determinada, está
condicionada a mover-se em acordo com o movimento das outras peças, de tal modo
que se conhecemos uma configuração do conjunto das engrenagens num dado momento,
poderemos em princı́pio prever qualquer configuração futura ou retroceder a qualquer
configuração passada.
Por exemplo, se conhecemos a posição e a velocidade da Lua hoje, aplicando as leis da
Mecânica clássica poderemos prever a posição e a velocidade da Lua daqui a um mês ou
rever a posição que ocupava no mês passado, com a exatidão que desejarmos. Assim, se
fosse possı́vel tirar fotografias da totalidade - recordemos que fotografias, antigamente,
se chamavam ”instantâneos” - a história universal, a história do Cosmos, poderia ser
reduzida a uma série de ”instantâneos”, cada um retratando uma dada configuração,
uma dada distribuição dos corpos no espaço. Isto corresponde à idéia de que cada
instante é universal, é o mesmo em toda parte, a mesma badalada ressoa em todos os
confins do Universo, o infinito do espaço habita o infinitésimo do tempo. Não admira
476
que possamos então conceber o Universo como uma máquina, como um conjunto de
engrenagens perfeitamente ajustadas e azeitadas que, ao se movimentarem, assumem
de instante a instante uma disposição diferente. Na verdade, é discutı́vel a aplicação do
termo ’história’ - na medida em que este denotar uma autêntica progressão evolutiva
dos sistemas materiais - ao Cosmos mecânico. Perante uma imagem tão completa-
mente inumana da totalidade, não admira o espanto e o temor que acometem Pascal,
como nos recorda Jorge Luis Borges. Contemplando a frieza incomensurável do cos-
mos mecânico, Pascal se interroga: se o espaço é infinito, a rigor não há um onde; se
o tempo é infinito, a rigor não há um quando. Quem somos nós? O que somos nós?
Talvez não seja inútil observar, por fim, que no âmbito do determinismo mecanicista
a Vida, com seu repertório de contingências e imprevisibilidades, assume a feição de
uma anomalia.
477
- o objeto complexo, por referência ao que seria o objeto simples, tı́pico da forma
de conhecimento clássica vigente até o século passado. Evidentemente, a aparição
do objeto complexo será correlata à constituição de uma nova noção de sujeito do
conhecimento.
O objeto complexo perpassa os vários domı́nios ou modos de natureza, do mais ele-
mentar ao mais abrangente - e cada um deles parece se esmerar em nos surpreender.
A Microfı́sica quântica, na escala atômica, delineia uma matéria dessubstancializada,
elusiva, eivada de paradoxalidades, em relação à qual o observador se torna um par-
ticipador, configurando-se assim uma realidade elementar fundamentalmente incerta,
em que desaparece, por exemplo, a distinção entre corpúsculo e onda, entre corpo lo-
calizado e padrão extenso. Já no que podemos chamar de escala mesofı́sica, que exper-
imentamos diretamente pelos sentidos, o estudo dos Sistemas Dinâmicos não-lineares
conduz à concepção de estados longe do equilı́brio marcados pela imprevisibilidade,
mas aptos a engendrar hierarquias sofisticadas de organização, bem como comporta-
mentos ricos em potenciais de evolução, forçando assim o pensamento a abdicar da
pretensão mecanicista de lograr um controle absoluto, correlato de uma previsibili-
dade sem limites, sobre os processos do mundo natural. A Macrofı́sica relativı́stica,
enfim, na escala astronômica, possibilitou a maior descoberta que o homem já fez
sobre o mundo natural - a constatação de que habitamos e somos parte de um Todo
dinâmico, evolutivo, inacabado, em suma, de uma totalidade aberta. Tal concepção
de um Cosmos histórico leva-nos a identificar o Universo como o próprio reino da
complexidade.
Esta entidade tão peculiar - a Totalidade Evolutiva - é o objeto de estudo da Cos-
mologia contemporânea.
478
fundação conceitual para regular a comparação de medidas obtidas por diferentes ob-
servadores inerciais (ou seja, associados a corpos em movimento livre), centrada não
mais no postulado da invariância dos intervalos temporais introduzido por Galileu
(e que conduzia à noção de simultaneidade absoluta de eventos), e sim no caráter
invariante doravante conferido a uma razão entre medidas de espaço e de tempo -
a velocidade de propagação da radiação luminosa. A Relatividade Especial é assim
uma nova teoria da relação entre observadores, subordinada ao princı́pio de que as leis
fı́sicas devem ser indiferentes aos modos particulares com que cada observador procede
ao etiquetamento, por meio de medidas de distâncias e durações, dos fenômenos fı́sicos,
e resultou no que Géza Szamosi chama de ”ruptura da fundação mamı́fera”, pois suas
conseqüências para a compreensão da estrutura do mundo fı́sico se revelaram devas-
tadoras: as medidas de distância (que definem o espaço) e de duração (que definem
o tempo) não serão mais absolutas, seus valores deixam de ser os mesmos para todo
observador, ou seja, cada observador recorta de uma maneira própria, relativa ao seu
’ponto-de-vista’, a massa de acontecimentos do mundo - e esses recortes individuais, a
espacialização e a temporalização que os observadores realizam sobre seus dados, são
meras perspectivas, irrelevantes para a descrição concreta desses acontecimentos.
O que importa são as relações invariantes (que têm o mesmo valor para qualquer obser-
vador) que possam ser construı́das com esses dados, como a velocidade de propagação
da radiação eletromagnética no vácuo (ou velocidade da luz, denotada pela letra c),
que irá governar a comunicação entre os observadores e determinar uma estrutura
causal única para o mundo. Isto significa, por exemplo, que em geral a separação tem-
poral - a duração - entre dois eventos dados dependerá do observador: os intervalos de
tempo medidos por um observador se dilatam ou se contraem com respeito às medi-
das de outro, e por conseguinte fica por completo abolida a noção de simultaneidade
universal - eventos que são coincidentes para um observador serão descompassados
para outros. O mesmo vale para as distâncias, as separações espaciais: observadores
em diferentes estados de movimento obterão distintos valores ao medirem os compri-
mentos caracterı́sticos de um dado sistema - implicando que a distribuição espacial de
seus componentes, e portanto sua forma, será doravante relativa a cada observador.
A dilatação dos tempos, bem como a contração dos comprimentos, são fatos concre-
tos, determinados com grande precisão nos laboratórios - mas o tempo e o espaço
relativı́sticos, maleáveis e individualizados, não mais constituem uma regra métrica
unânime abrangendo a totalidade da existência: acabaram-se o instante global e a
forma unı́voca. O famoso paradoxo dos gêmeos ilustra a ruptura das noções rela-
tivı́sticas com o bom senso velho de guerra:
Os gêmeos X e Y têm, obviamente, a mesma idade. X permanece na Terra, enquanto
Y empreende uma viagem espacial numa nave muito rápida (capaz de mover-se quase
à velocidade da luz). Para X, a viagem do irmão dura dez anos, ao longo dos quais
seu coração bateu cerca de 36 milhões de vezes. Para Y, contudo, a viagem demorou
um ano, e seu coração bateu 3,6 milhões de vezes. Ao se reencontrarem, X está fisio-
479
logicamente 9 anos mais velho que seu irmão; deixaram de ser gêmeos...
Mais ainda, ao longo destes dez anos, todos os dias X levantava a vista para o Sol
e, vendo-o sempre com o mesmo aspecto - o de um cı́rculo dourado - não obstante
o movimento de translação da Terra durante todo o ano, concluiu com bem-fundada
convicção que nossa estrela é uma esfera amarela. Para Y, porém, ao dirigir-se em alta
velocidade em direção ao Sol, este lhe surgiu como se um disco achatado, semelhante
a uma panqueca, e azul; recordou-se então que, quando partiu, o Sol também lhe
parecera um disco achatado - só que vermelho. A gloriosa esfericidade áurea do Astro-
Rei, longe de definir sua essência, não passa de mero ponto-de-vista...
480
quadridimensionais, tais como os chamados hipercubos ou tesseracts; o espaço-tempo
pode ser concebido e compreendido, mas não pode ser visto. Quem sabe, no futuro,
um artista pós-mamı́fero se tornará no Giotto dos tesseracts?
Mas talvez, para nossa perspectiva lastreada no bom senso nosso de cada dia, a pos-
sibilidade mais perturbadora oferecida pelas abordagens relativı́sticas seja a admissi-
bilidade de ocorrerem circuitos cronológicos fechados, ou seja, caminhos que podem
retornar sobre si mesmos no espaço e no tempo - de tal modo que prosseguir rumo ao
futuro não significaria necessariamente afastar-se do passado! Caso existam de fato (no
momento só sabemos que não parecem ser impossı́veis), estas curvas ’fechadas’ rompe-
riam com um dos atributos mais estimados de nossa figuras tradicionais do tempo, a
globalidade temporal: linhas-de-universo de objetos fı́sicos devem ser monótonas, ou
seja, cruzar um ponto do espaço-tempo uma e só uma vez. A (presumı́vel) viabilidade
fı́sica de tais ”viagens no tempo”, para além de proporcionar material saboroso para
ficcionistas, coloca problemas agudos para nosso entendimento sobre a causalidade -
como exemplificado pelos paradoxos do tipo ’neto viaja no tempo e mata o próprio
avô, mas então não haveria neto para matar o avô, então o avô não morre, então
poderia haver um neto que o matasse’, e assim por diante, !!!!!
481
ometria do mundo) alteram suas caracterı́sticas interagindo consigo próprios. Em con-
seqüência, pode-se até mesmo gerar configurações não-deterministas (”caóticas”) em
que a evolução dinâmica do problema (inclusive no caso do sistema fı́sico ”Universo”)
apresentará bifurcações, ou seja, comportamento irredutivelmente imprevisı́vel.
A TRG pode ser resumida, de modo extremamente esquemático, à combinação de
duas idéias tão simples quanto poderosas. A primeira é o Princı́pio de Equivalência
(o ponto-de-vista de um observador acelerado não pode ser distinguido, por nenhum
experimento laboratorial, do ponto-de-vista de um observador inercial imerso em um
campo gravitacional), que vincula não-inercialidade e gravitação; a segunda é a rev-
olucionária associação entre a força gravitacional experimentada por um corpo e a
deformação (não-Euclidianicidade) que vigora na região do contı́nuo em que ele se en-
contra, que vincula gravitação (força) e geometria (curvatura). A geometria torna-se
um agente dinâmico, determinado em cada local pela distribuição de matéria-energia
ali presente, e simultaneamente prescrevendo o comportamento gravitacional desta
matéria. De acordo com a hipótese mais simples para a interação da gravitação com
os demais campos da fı́sica (o princı́pio do acoplamento mı́nimo), os espaços curvos de
Riemann (nos quais o comprimento de vetores permanece invariante sob transporte
infinitesimal) surgiram como generalização ’natural’ dos espaços de Minkowski para
situações em que a intensidade do campo gravitacional (ou seja, o grau de distorção das
linhas de universo na região sob exame) não pode ser desprezada. Na TRG, portanto,
a caracterização da estrutura do espaço-tempo como uma geometria não-Euclidiana de
Riemann permitirá conferir um conteúdo operacional à noção fundamental de intervalo
entre dois quaisquer eventos, pra quaisquer observadores inerciais ou acelerados.
Os notáveis sucessos da teoria no que tange a fenômenos à escala do sistema so-
lar (os chamados ”testes clássicos”) garantiram-lhe o estatuto de quadro conceitual
de fundo para a investigação dos fenômenos gravitacionais - planetários, estelares,
galáticos e, inclusive, os referentes à peculiar entidade fı́sica que denominamos de Uni-
verso. Com efeito, no escopo da Relatividade Geral torna-se possı́vel elaborar modelos
matemáticos capazes de representar a estrutura Riemanniana que, de acordo com as
equações geométrico-gravitacionais de Einstein, estaria associada ao conteúdo mate-
rial do Universo astronômico em larga escala. Coube à TRG, sobretudo, assimilar a
extraordinária observação de Edwin Hubble, de 1929, acerca do afastamento uniforme
das galáxias (ou seja, que o Universo encontra-se num estado dinâmico de expansão
global), que para muitos foi a maior descoberta já feita pelo Homem sobre o mundo
natural e assinala o nascimento da atual Cosmologia Relativı́stica.
O que mais nos interessa neste ponto é constatar a aparição no domı́nio das ciências
fı́sicas, graças aos modelos cosmológicos relativı́sticos, de uma nova figura de total-
482
idade: o espaço-tempo Riemanniano da Relatividade Geral, que pelas equações ge-
ometrodinâmicas de Einstein se articularia não-linearmente com a distribuição de
matéria-energia em escala cósmica, de modo a constituir um modelo matemático do
Universo que pode ser comparado às observações. Espaço-tempo-matéria-energia: eis
a nova face do Todo, de Tudo-o-que-existe. O caráter universal (ou seja, o alcance
infinito) da atração gravitacional lhe assegura a função de organizar essa totalidade,
que pode ser denominada, praticamente no sentido do termo original grego de todo-
ordenado, de Cosmos.
Particularmente notável é o fato de podermos dispor de evidências acerca de carac-
terı́sticas globais dessa entidade: por exemplo, seu conteúdo material visı́vel, segundo
a astronomia profunda têm nos revelado, se assemelha a um ”fluido cosmológico”
notavelmente homogêneo (mais ”liso”, ou uniforme, que a superfı́cie de uma bola de
bilhar), composto por cerca de cem bilhões de galáxias - cada uma contendo em média
cem bilhões de sóis - reunidas numa hierarquia crescente de grupos, aglomerados, su-
peraglomerados e, finalmente, estruturas em larga escala, tudo isso distribuı́do num
volume de cerca de doze bilhões de anos-luz - ou cem quintilhões de quilômetros - de
raio. Ainda mais significativo, porém, é seu caráter dinâmico, caracterizado pelo afas-
tamento mútuo das galáxias descoberto por Hubble: a configuração dessa totalidade
é mutável, ou seja, o Cosmos tem uma história. Em resumo, a Totalidade pode ser
observada, e é evolutiva. Todavia, ainda que legı́timo do ponto de vista da epistemolo-
gia das ciências naturais, o Todo Evolutivo, foco do estudo da Cosmologia, será um
objeto fı́sico deveras peculiar.
Curiosamente, ao principiar as aplicações da Relatividade Geral à Cosmologia o
próprio Einstein procurou desenvolver um modelo de um Cosmos finito e estático,
por ele considerado como o mais pertinente dos pontos de vista da simplicidade e
elegância filosófica. A natureza exclusivamente atrativa da gravitação, porém, impôs
a adição de um termo suplementar ”repulsivo” nas equações de Einstein, a chamada
”constante cosmológica”, para que um modelo estático pudesse ser logrado. A insta-
bilidade intrı́nseca do Universo de Einstein frente a perturbações e, mais ainda, as
observações de Hubble acerca do processo global de afastamento das galáxias - ev-
idenciado pelo desvio para o vermelho da luz por elas emitida, tão mais acentuado
quanto mais distante estiver a fonte - logo inviabilizaram o modelo de Einstein, que
cedeu lugar à concepção de Friedman de um Universo dinâmico. Trabalhos seguintes de
De Sitter, Lemâitre e Robertson motivaram a adoção das cosmologias espacialmente
homogêneas de Friedman-Robertson-Walker (FRW) como ”geometrias-padrão”. Os
modelos FRW admitem a ocorrência de um estágio primordial muito denso e quente
que, segundo os estudos de Gamow nos anos 50 permitiriam, em conjugação com as
teorias da Fı́sica Nuclear e das Partı́culas Elementares, a elaboração de uma ”história
térmica” da matéria cósmica, associada à evolução do cenário cósmico global, repro-
duzindo adequadamente as abundâncias globais observadas dos elementos quı́micos
(nucleossı́ntese); de acordo com esta proposta, a história do Cosmos se iniciaria com
483
um prodigioso ’disparo’ primordial que assinalaria a entrada em existência do próprio
Universo, e prosseguiria até o estágio homogêneo, pouco denso e moderadamente ex-
pansivo que testemunhamos hoje.
Bondi, Hoyle e Gold, por outro lado, criticaram a concepção de Gamow, batizando-a,
ironicamente, de modelo da ”Grande Explosão Quente”(Hot Big-Bang), e sugeriram
como alternativa o chamado ”Modelo do Estado Estacionário” (Steady-State cosmol-
ogy), em que periodicamente ocorreria criação de matéria adicional de modo a fazer
a densidade cósmica invariante, apesar da expansão de Hubble, tornando assim a
evolução cosmológica compatı́vel com o chamado ”Princı́pio Cosmológico Perfeito” (o
Universo é homogêneo no espaço e no tempo). O debate só seria resolvido ao final dos
anos 60, com a descoberta (acidental) de Penzias e Wilson da presença de uma radiação
térmica (ou seja, com espectro de corpo negro) que permearia o Cosmos de todas as
direções (a chamada ”radiação cósmica de fundo de 3◦ K”) e que pôde ser interpretada,
no escopo do modelo do Big-Bang, como uma radiação residual ou ”fóssil” remanes-
cente do perı́odo primordial de grande compressão (quando o Universo, devido à alta
densidade, era opaco para os fótons). Esses sucessos - a descrição da nucleossı́ntese
e a incorporação ra radiação cósmica de fundo - fundamentaram a consolidação, na
década de 1970, do modelo da Grande Explosão Quente como eixo paradigmático
(ou ”Modelo-Padrão”) dos estudos cosmológicos. Pela primeira vez, havia sido pro-
duzida uma cosmogonia legitimamente cientı́fica, porque verificável pela observação;
a Cosmologia tornou-se assim uma disciplina própria da Fı́sica.
484
não-solares) conduziram ao surgimento, nos últimos anos, de uma série de propostas
alternativas visando eliminar ou ao menos atenuar as caracterı́sticas problemáticas
exibidas pelo HBB, através da alteração ou substituição de alguns dos ingredientes
básicos em jogo - por exemplo, sugestões de reinterpretação da atual fase expansiva;
modificações dos atributos usuais da matéria; introdução de outros campos fı́sicos de
caráter primordial (como nos modelos inflacionários); abandono do requisito de estrita
homogeneidade; teorias alternativas da gravitação e/ou do espaço-tempo; esboços de
cosmologia quântica, etc. Recentemente, um número crescente de observações tem in-
dicado que as variedades de matéria luminosa presente no Cosmos constituiriam não
mais que escassos 5% (cinco por cento!) do conteúdo cósmico, sendo os 95% restantes
compostos por espécies de matéria e energia ”escuras” (não-luminosas) cujos atributos
e natureza são inteiramente desconhecidos. Este problema inesperado e perturbador é
sem dúvida o grande desafio para os cosmólogos na presente década.
Transição Paradigmática?
485
dos (pelo menos por nós), associados a outras flutuações? Alguns cientistas foram
obrigados por essa e outras questões análogas a reverem os dogmas da interpretação
tradicional da Escola de Copenhagen, para que a concepção de um Cosmos Quântico
(totalidade que se auto-observaria) pudesse ganhar sentido.
Caberia então indagar: estarı́amos a ponto de presenciar uma autêntica transição
ou revolução paradigmática na Cosmologia? Não obstante as óbvias dificuldades do
paradigma-padrão encarnado no HBB, suas bases observacionais não foram ainda
postas em dúvida, e as várias propostas alternativas presentemente sob exame procu-
ram incorporar essas bases, dispondo portanto de um estatuto observacional equiv-
alente. Assim, somente a obtenção de novas evidências cósmicas poderá regular a
seleção dentre as variadas abordagens em curso hoje em dia e definir as linhas gerais
de uma cosmovisão reconhecidamente mais aperfeiçoada. A inauguração, na presente
década e na próxima, de aparatos de medida inovadores - detectores de ondas gravita-
cionais e de neutrinos cósmicos, novos telescópios terrestres e espaciais - permitirá pôr
em teste muitas de nossas atuais concepções fundamentais sobre o Universo em larga
escala (inclusive a TRG), permitindo antecipar a excitante perspectiva de importantes
inovações a curto e médio prazos.
486
matéria-energia e o tecido do espaço-tempo, e é referido a uma classe privilegiada
de observadores ditos co-moventes ou ”fundamentais” - dos quais, curiosamente, a
Cosmologia não pôde ainda se desvencilhar de modo convincente.
Se, por outro lado, definimos ”existir” por ”acontecer no espaço e no tempo”, como
é costumeiro, então ”tudo-o-que-existe” se identifica à estrutura global do contı́nuo
espaço-tempo da TRG, que é a figura de totalidade representativa dos eventos espa-
ciotemporais (acontecimentos) introduzida por Einstein e assimilada, em seguida, ao
paradigma padrão unificacionista vigente. Mas a própria Relatividade Geral, funda-
mento conceitual de tal programa, implica na possı́vel ocorrência de uma variedade
de entidades bizarras que, paradoxalmente, elidem a capacidade de registro e rep-
resentação de eventos de qualquer observador - buracos negros (sorvedouros de que
nada foge), buracos brancos (nascedouros em que nada penetra), indescritı́veis sin-
gularidades ”nuas”; ou regiões do mundo para sempre alheias, mesmo em princı́pio,
a toda possibilidade de contato ou observação devido a horizontes causais (que de-
sconectariam por completo diferentes regiões do espaço-tempo); ou ainda a existência
de ”torpezas” topológicas (como monopolos, cordões cósmicos, paredes de domı́nio)
que equivaleriam a ’fraturas’ do tecido geométrico; e até mesmo a viabilidade da con-
strução de caminhos ”fechados” nos quais avançar para o futuro significaria, para um
viajante, aproximar-se de seu passado (”viagens no tempo”), graças a ”buracos de
minhoca” construı́dos com algum tipo de matéria ”exótica” e que possibilitariam por
em contato locais muitı́ssimo distantes do Universo (ou até, especulativamente, de
Universos diferentes...), e etcetera. Qual o estatuto de existência dessas configurações
peculiares que, embora postas em cena pela TRG (o quadro conceitual de fundo,
repetimos, para nossa descrição dos fenômenos em escala cósmica) acabam por se
evadir de toda representação espaciotemporal? Seria necessário, talvez, invocar uma
modalidade ainda mais abrangente de ”realidade”, ou mesmo uma nova ”totalidade
universal”, que subsumisse igualmente essas entidades exóticas? Ou um tal impasse
sugeriria uma crise dos próprios fundamentos metacosmológicos em que se apóia a cos-
mologia clássica, que assim demandaria uma profunda crı́tica da razão cosmológica?
Em relação aos problemas associados à noção de totalidade cabe ainda citar a busca por
uma formulação unificada da qual todos os fenômenos observados pudessem ser deriva-
dos, a qual remonta à antiga aspiração por uma unificação das causas dos fenômenos
fı́sicos (”Unidade do Mundo”) e que constitui o cerne do moderno Programa de Ein-
stein em prol da obtenção de uma ordem harmônica e determinada para o Universo.
Na atualidade, este objetivo se encarna na procura por uma base comum que permita
a fusão das linguagens próprias aos domı́nios Macro- e Microscópico da Fı́sica, através
da integração das quatro interações conhecidas - gravitação, eletromagnetismo, força
nuclear fraca, força nuclear forte - em um único corpo descritivo - uma Teoria de Tudo.
As chamadas Teorias de Cordas e Teorias de Branas são, na atualidade, as candidatas
mais bem consideradas para a viabilização deste programa.
487
Embora dominante em nossa época, principalmente em virtude dos sucessos al-
cançados pelas chamadas teorias de calibre da Fı́sica de Partı́culas, este projeto de
modo algum é o único perseguido pelos fı́sicos (como alternativas, podem ser cita-
dos por exemplo o Programa de Boltzmann de fundamentação do mundo fı́sico a
partir de um fecundo ”caos” originário, ou o Programa de Dirac de multiplicação das
variáveis cósmicas) e tem sido obstaculizado pela forte não-linearidade das equações da
gravitação, que impediu até aqui a elaboração de uma teoria satisfatória da gravitação
e do espaço-tempo em escalas quânticas. A aguda sensibilidade dos modelos de que
atualmente dispomos com relação a variações das (inacessı́veis) condições iniciais -
insinuando um ”design” cósmico primordial incrivelmente preciso para uma variedade
de cenários razoáveis - é outra dificuldade encontrada na implementação de uma to-
talização auto-suficiente do mundo. Como derradeira observação, sugerimos que o
próprio apogeu do programa cosmológico contemporâneo, seus impasses e realizações,
parecem demandar por uma reavaliação das diretrizes metodológicas e mesmo do ”te-
los” conceitual do atual corpo de modelizações totalizantes e auto-referentes acerca do
Universo em que habitamos, procurando ampliar o escopo de compreensão dos pro-
cessos cósmicos, já como pertinentes a um Universo contextualizado, incorporado a
um complexo ulterior de relações que o abrange e ultrapassa - uma totalidade aberta.
Bibliografia básica:
A. Novaes, Org., A Crise da Razão (MINC/Funarte - Companhia das Letras, São
Paulo, 1996).
A. Novaes, Org., O Homem-Máquina (Companhia das Letras, São Paulo, 2003).
Alexandre Koyré, Do Mundo Fechado ao Universo Infinito (Forense/EdUSP, São
Paulo, 1979).
Arthur Koestler, O Homem e o Universo (Ibrasa, São Paulo, 1989).
Craig Stanford, Como nos Tornamos Humanos (Campus, Rio de Janeiro, 2004)
Daniel Boorstin, Os Descobridores (Civilização Brasileira, Rio de Janeiro, 1989).
Edward Speyer, Seis Caminhos a partir de Newton, (Campus, Rio de Janeiro, 1995).
Ernesto Sábato, Nós e o Universo (Francisco Alves, Rio de Janeiro, 1985).
F. Balibar, Einstein: uma Leitura de Galileu e Newton, (Edições 70, Lisboa, 1988).
F. Durham & R. Purrington, Frame of the Universe (Columbia University Press, New
York, 1983).
Fayga Ostrower, A Sensibilidade do Intelecto (Campus, Rio de Janeiro, 1998).
G. C. Branco, Org., Descartes - A Ordem das Razões , A Ordem das Paixões (NAU
Editora, Rio de Janeiro, 1999).
George Withrow, O Tempo na História (Jorge Zahar, Rio de Janeiro, 1997).
Géza Szamosi, Tempo e Espaço - as Dimensões Gêmeas (J. Zahar, Rio de Janeiro,
1988).
488
Giorgio de Santillana & Hertha von Deschend, Hamlet’s Mill (David R. Godine,
Boston, 1983).
Heinz Pagels, O Código Cósmico (Gradiva, Lisboa, s/d).
Hubert Reeves, Um Pouco Mais de Azul (Martins Fontes, São Paulo, 1986).
Ian Stewart, Será que Deus joga dados? (J. Zahar, Rio de Janeiro, 1991).
Ilya Prigogine & Isabelle Stengers, Entre o Tempo e a Eternidade (Gradiva, Lisboa,
1990).
Jean Pierre Vernant, As Origens do Pensamento Grego (Difel, São Paulo, 1981).
Jorge Luı́s Borges, Ficções (Globo, São Paulo, 1997).
M. Doctors, Org., Tempo dos Tempos (J. Zahar, Rio de Janeiro, 2003).
Margaret Wertheim, Uma História do Espaço de Dante à Internet (J. Zahar, Rio de
Janeiro, 2002).
Mário Novello, Cosmos e Contexto (Forense Universitária, Rio de Janeiro, 1988).
Mário Novello, O Cı́rculo do Tempo (Campus, Rio de Janeiro, 1997).
Martin Rees, A Evolução do Universo, in Andrew C. Fabian, Org., A Evolução (Ter-
ramar, Lisboa, 2000).
Max Born, Einstein’s Theory of Relativity (Dover, New York, 1965).
Michael Friedman, Foundations of Space-Time Theories (Princeton University Press,
New Jersey, 1983).
Mircea Eliade, O Mito do Eterno Retorno (Edições 70, Lisboa, s/d).
Nigel Calder, O Universo de Einstein (Ed. UnB, Brası́lia, 1988).
P. Coveney & R. Highfield, A Flecha do Tempo (Siciliano, Rio de Janeiro, 1993).
Paul Davies, Space and Time in the Modern Universe (Cambridge University Press,
London, 1977).
Rudy Rucker, The Fourth Dimension (Houghton Mifflin, Boston, 1984).
Steven Weinberg, Os Primeiros Três Minutos (Gradiva, Lisboa, 1988).
Thomas S. Kuhn, A Estrutura das Revoluções Cientı́ficas (Perspectiva, São Paulo,
1975).
Timothy Ferris, O Despertar na Via-Láctea (Campus, Rio de Janeiro, 1990).
489