Você está na página 1de 90

Introdução a Relatividade Geral e Cosmologia

Prof. Dr. Saulo Henrique Pereira

21/02/2022

Apostila preparada para a disciplina “Introdução a Relatividade Geral e


Cosmologia”, ministrado para o curso de Fı́sica da UNESP, da Faculdade de
Engenharia de Guaratinguetá.
CONTENTS

1 Transformações de Galileu e a mecânica newtoniana 4


1.1 Transformações de Galileu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.1.1 Leis da mecânica newtoniana e as Transformações de Galileu . . . . . . . 8
1.1.2 Eletromagnetismo e as Transformações de Galileu . . . . . . . . . . . . . 8
1.2 Transformações de Galileu no formato matricial . . . . . . . . . . . . . . . . . . 8

2 Transformações de Lorentz e a mecânica relativı́stica 10


2.1 Postulados da relatividade restrita e as transformações de Lorentz . . . . . . . . 10
2.1.1 Postulados da relatividade . . . . . . . . . . . . . . . . . . . . . . . . . . 10
2.1.2 Transformações de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . 11
2.1.3 Limite de Galileu . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.2 Contração do espaço . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
2.3 Dilatação do tempo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16
2.4 Simultaneidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18

3 Composição de velocidades e a aceleração 19


3.1 Composição de velocidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
3.2 Aceleração . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23

4 Invariantes e Quadrivetores 24
4.1 Quantidades invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 24
4.1.1 Diferentes tipos de intervalo . . . . . . . . . . . . . . . . . . . . . . . . . 26
4.1.2 O intervalo de tempo próprio . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2 Quadrivetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2.1 4-vetor posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
4.2.2 A transformação de Lorentz do 4-vetor posição . . . . . . . . . . . . . . . 28
4.2.3 4-vetor velocidade e o invariante c . . . . . . . . . . . . . . . . . . . . . . 30
4.2.4 A transformação de Lorentz do 4-vetor velocidade . . . . . . . . . . . . . 31
4.2.5 4-vetor aceleração . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
4.2.6 4-vetor momento e a relação E = mc2 . . . . . . . . . . . . . . . . . . . . 33

5 Tensores na Relatividade Especial 35


5.1 Escalares, 4-vetores e Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5.1.1 Tensor de ordem 0 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 35
5.1.2 Tensor de ordem 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
5.1.3 Tensores de ordem 2 ou mais . . . . . . . . . . . . . . . . . . . . . . . . 37

1
5.2 Algumas propriedades gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
5.3 Derivadas e operador gradiente . . . . . . . . . . . . . . . . . . . . . . . . . . . 38
5.4 O tensor métrico de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . 39

6 O Princı́pio de Equivalência e as bases da relatividade geral 40


6.1 Forças gravitacionais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
6.2 Conexão Afim e o tensor métrico . . . . . . . . . . . . . . . . . . . . . . . . . . 43
6.3 Limite Newtoniano . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
6.4 Métrica de Schwarzschild . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 48
6.4.1 O desvio do periélio de Mercúrio . . . . . . . . . . . . . . . . . . . . . . 49

7 Tensores na Relatividade Geral 52


7.1 Análise tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
7.1.1 Regras de transformação . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
7.1.2 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 53
7.1.3 Derivada usual não é um tensor . . . . . . . . . . . . . . . . . . . . . . . 54
7.1.4 Conexão Afim não é um tensor . . . . . . . . . . . . . . . . . . . . . . . 54
7.1.5 Derivada covariante . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 55
7.1.6 Transformação do tensor métrico . . . . . . . . . . . . . . . . . . . . . . 57
7.2 Tensor de Riemann . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 58
7.2.1 Propriedades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.3 Tensor e Escalar de Ricci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
7.4 A equação de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

8 As equações de FRW e modelos cosmológicos simplificados 61


8.1 A métrica de Friedmann-Robertson-Walker . . . . . . . . . . . . . . . . . . . . . 61
8.1.1 Equação de Einstein para o vácuo . . . . . . . . . . . . . . . . . . . . . . 63
8.2 Tensor de energia-momento do fluido perfeito . . . . . . . . . . . . . . . . . . . 64
8.3 Equações de Friedmann-Robertson-Walker . . . . . . . . . . . . . . . . . . . . . 65
8.4 Modelos cosmológicos simples . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
8.4.1 Universo dominado por matéria . . . . . . . . . . . . . . . . . . . . . . . 66
8.4.2 Universo dominado por radiação . . . . . . . . . . . . . . . . . . . . . . . 67
8.4.3 Soluções dos casos com curvatura k . . . . . . . . . . . . . . . . . . . . . 67

9 O modelo padrão da cosmologia, ΛCDM 69


9.1 Equação de Einstein para o modelo ΛCDM . . . . . . . . . . . . . . . . . . . . . 69
9.2 Equações de FRW para o modelo ΛCDM . . . . . . . . . . . . . . . . . . . . . . 70
9.2.1 Universo dominado por constante cosmológica . . . . . . . . . . . . . . . 71
9.2.2 Universo plano dominado por constante cosmológica e matéria . . . . . . 72
9.3 A matéria escura no universo . . . . . . . . . . . . . . . . . . . . . . . . . . . . 73
9.4 Modelo ΛCDM em termos do parâmetro de Hubble H e do redshift z . . . . . . 74
9.4.1 Universo com bárions, radiação, matéria escura e constante cosmológica . 75
9.4.2 Dados de H(z) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
9.4.3 Dados de supernovas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
9.5 Distâncias de luminosidade e de diâmetro angular . . . . . . . . . . . . . . . . . 81
9.5.1 Distância de luminosidade dL . . . . . . . . . . . . . . . . . . . . . . . . 81
9.5.2 Distância de diâmetro angular dA . . . . . . . . . . . . . . . . . . . . . . 83
9.6 A idade do universo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 83

2
10 Modelos cosmológicos além do modelo padrão 85
10.1 Modelos de Energia Escura . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
10.1.1 Modelo XCDM . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
10.1.2 Modelo de Gás de Chaplygin . . . . . . . . . . . . . . . . . . . . . . . . . 86
10.1.3 Modelo de Quintessência ou Campo Escalar . . . . . . . . . . . . . . . . 87
10.2 Modelo inflacionário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87

3
CHAPTER 1
TRANSFORMAÇÕES DE GALILEU E A MECÂNICA
NEWTONIANA

A mecânica clássica do Século XIX era totalmente baseada na mecânica newtoniana e nas
transformações de Galileu, onde o espaço e o tempo eram considerados quantidades absolutas,
ou seja, não podiam variar dependendo do movimento do observador.

1.1 Transformações de Galileu


As transformações de Galileu relacionam as leis da mecância newtoniana entre dois refer-
enciais S e S 0 , tal que S 0 tem velocidade uniforme ~u em relação a S.

Considere o caso particular em que ~u = ux î em relação a S e em t = t0 = 0 os eixos


coincidem, ou seja x(0) = x0 (0), y(0) = y 0 (0), z(0) = z 0 (0), conforme Figura 1 a seguir.

As transformações de Galileu podem escritas como:

x0 = x(t) − ux t


y 0 = y(t)


Transformações de Galileu
z 0 = z(t) 


t0 = t

de onde fica evidente que, dada uma equação de movimento x(t) no referencial S, é possı́vel
obter a equação de movimento x0 (t0 ) no referencial S 0 por meio das transformações acima.
As transformações inversas são:

x = x0 (t0 ) + ux t0
y = y 0 (t0 )
z = z 0 (t0 )
t = t0

e da mesma forma, dada uma equação de movimento x0 (t0 ) no referencial S 0 , é possı́vel obter a
equação de movimento x(t) no referencial S por meio das transformações inversas.
A principal caracterı́stica das transformações de Galileu é que o tempo é considerado abso-
luto, ou seja, é sempre medido da mesma forma em qualquer que seja o sistema de referência,
por isso t0 = t. Isso vai mudar na relatividade restrita!

4
Figura 1

S S’
y y’

ux

x’
O’
O x

z’
z

Movimento relativo entre os referenciais S e S’

5
Agora considere um objeto em S 0 se movendo com velocidade v~0 em relação a S 0 , conforme
Figura 2 a seguir. ux é a velocidade do referencial S 0 em relação a S. Qual é a velocidade ~v
vista por S?

Na mecânica de Galileu, vale a definição usual de velocidade:


d ∆x d ∆y d ∆z
vx ≡ x(t) = , vy ≡ y(t) = , vz ≡ z(t) =
dt ∆t dt ∆t dt ∆t

onde ~v = vx î + vy ĵ + vz k̂ é o vetor velocidade no referencial S.

Usando as transformações de Galileu anteriores, temos:

∆x ∆x0 + ux ∆t0
vx = = = vx0 + ux
∆t ∆t0
∆y ∆y 0
vy = = 0
= vy0
∆t ∆t
∆z ∆z 0
vz = = = vz0
∆t ∆t0
Portanto a componente x da velocidade é somada da maneira usual, como esperamos intu-
itivamente.

Usando agora a forma do operador diferencial e o conceito de regra da cadeia em derivadas,


temos:
d d[x0 (t0 ) + ux t0 ] dt0
vx = x(t) = = vx0 + ux
dt dt0 dt
d dy 0 (t0 ) dt0
vy = y(t) = 0
= vy0
dt dt dt
d dz 0 (t0 ) dt0
vz = z(t) = = vz0
dt dt0 dt
Neste último método é fácil calcularmos a aceleração:

d d[vx0 (t) + ux ] dt0


ax = vx (t) = = a0x
dt dt0 dt
d dvy0 (t) dt0
ay = vy (t) = = a0y
dt dt0 dt
d dv 0 (t) dt0
az = vz (t) = z 0 = a0z
dt dt dt
e portanto vemos que a aceleração é a mesma em ambos os referenciais, independente da
velocidade relativa ux entre os referenciais. Vemos também que a aceleração é nula se ~v 0 for
constante no referencial S 0 .

6
Figura 2

S S’
y y’

v’

ux

x’
O’
O x

z’
z

Movimento relativo entre os referenciais S e S’, e uma partícula se


movendo com velocidade v’ no referencial S’.

7
1.1.1 Leis da mecânica newtoniana e as Transformações de Galileu
As leis da mecânica, em particular a 2a lei de Newton, é invariante pelas transformações
de Galileu, ou seja, mantém a mesma forma quando escrita tanto no referencial S quanto no
referencial S 0 .

Para mostrar isso vamos escrever a 2a lei de Newton na forma mais geral:

F~ = m~a = −∇U
~ (x, y, z)

onde U (x, y, z) é a energia potencial do sistema.


Por simplicidade vamos considerar apenas o eixo-x, que é onde ocorre a translação entre os
sistemas de referência:
d2 x ∂U
m 2 =−
dt ∂x
2 2
Do lado esquerdo temos a aceleração ax = d x/dt , e já vimos anteriormente que a aceleração
é a mesma quando vista no referencial S 0 , portanto ax = a0x . Mas como podemos transformar
o lado direito para o sistema S 0 para uma função pontencial qualquer?
Para isso precisamos usar a regra da cadeia:

∂U ∂U ∂x0 ∂U ∂y 0 ∂U ∂z 0 ∂U ∂t0
= + 0 + 0 + 0
∂x ∂x0 ∂x ∂y ∂x ∂z ∂x ∂t ∂x
0
e vemos que apenas o primeiro termo do lado direito é diferente de zero, com ∂x
∂x
= 1 das
transformações de Galileu.
Portanto:
d 2 x0 ∂U
m 02 = − 0
dt ∂x
e concluı́mos que a 2 lei de Newton mantém a mesma forma quando escrita no referencial S 0 .
a

1.1.2 Eletromagnetismo e as Transformações de Galileu


Embora as transformações de Galileu mantenham as leis da mecânica invariantes, o mesmo
não ocorre com as leis do eletromagnetismo.

Exercı́cio: Mostre que a equação de onda do eletromagnetismo para um campo φ(x, y, z, t)


qualquer,
∂ 2φ ∂ 2φ ∂ 2φ 1 ∂ 2φ
+ + =
∂x2 ∂y 2 ∂z 2 c2 ∂t2
não é invariante por transformações de Galileu. Para isto, mostre que ela se transforma da
seguinte maneira para o referencial S 0 :

∂ 2φ ∂ 2φ ∂ 2φ 1 ∂ 2 φ u2x ∂ 2 φ 2ux ∂ 2 φ
+ + = + −
∂x02 ∂y 02 ∂z 02 c2 ∂t02 c2 ∂x02 c2 ∂x0 ∂t0

onde S 0 se move com velocidade relativa u em relação a S na direção do eixo x.

1.2 Transformações de Galileu no formato matricial


Por fim, note que as transformações de Galileu podem ser escritas no formato “matricial”:

8
 0   
x 1 0 0 −ux x
 y 0  0 1 0 0  y 
 
 0 =  
 z  0 0 1 0  z 
t0 0 0 0 1 t
Supondo as variáveis x0 , y 0 , z 0 , t0 como variáveis dependentes de (x, y, z, t), as componentes da
matriz de transformação acima podem ser obtidas por meio de:
 ∂x0 ∂x0 ∂x0 ∂x0 
∂x ∂y ∂z ∂t
 ∂y0 ∂y 0 ∂y 0 ∂y 0 
 ∂x ∂y ∂z ∂t 
 ∂z0 ∂z 0 ∂z 0 ∂z 0 
 ∂x ∂y ∂z ∂t

∂t0 ∂t0 ∂t0 ∂t0
∂x ∂y ∂z ∂t

Exercı́cio: Verifique que as componentes da matriz acima reproduzem a matriz de trans-


formação de Galileu.

Uma matriz parecida (fazendo ux → −ux ) é obtida para a transformação inversa.

9
CHAPTER 2
TRANSFORMAÇÕES DE LORENTZ E A MECÂNICA
RELATIVÍSTICA

Veremos agora como devem ser as transformações entre sistemas de coordenadas S e S 0 na


mecânica relativı́stica.

2.1 Postulados da relatividade restrita e as transformações


de Lorentz
2.1.1 Postulados da relatividade

(a) As leis fı́sicas são as mesmas em todos os referenciais inerciais (princı́pio da relatividade
restrita);

(b) A velocidade da luz no vácuo, c, é a mesma em todas as direções e em todos os referenciais


inerciais (princı́pio da constância da velocidade da luz), c = 299.792.458 m/s ≈ 300.000 km/s

• o postulado (a) implica que as transformações de Galileu devem ser substituı́das e, con-
sequentemente, também as leis da mecânica de Newton!

• O postulado (b) implica que as novas transformações devem prever a contração do espaço
e a dilatação do tempo:

∆x
v=
∆t
Para que v não seja maior que c, ou ∆x diminui, ou ∆t aumenta, ou as duas coisas acontecem
simultaneamente!

Veremos adiante que estes dois fenômenos acontecem, e isso significa uma quebra do conceito
de espaço e tempo absolutos da mecânica de Galileu.

10
2.1.2 Transformações de Lorentz

Considere dois referenciais S e S 0 , tal que S 0 tem velocidade ~u = uî em relação a S e em


t = t0 = 0 os eixos coincidem, ou seja x = x0 , y = y 0 , z = z 0 :

Um sinal luminoso ocorre em O = O0 e t = t0 = 0, e se propaga com velocidade c em ambos


os referenciais, conforme Figura 2b.

O raio R da frente de onda no referencial S cresce com o tempo, sendo dado por R = ct, e
o raio R0 da frente de onda no referencial S 0 cresce com o tempo, sendo dado por R0 = ct0 . As
seguintes relações devem ser satisfeitas:

R2 = x2 + y 2 + z 2 = c2 t2

R02 = x02 + y 02 + z 02 = c2 t02

Queremos encontrar transformações lineares entre os referenciais S e S 0 tais que:

x2 + y 2 + z 2 − c2 t2 = 0 ⇐⇒ x02 + y 02 + z 02 − c2 t02 = 0

Para isso escrevemos a transformação mais geral possı́vel:

x0 (x, y, z, t) = a11 x + a12 y + a13 z + a14 t


y 0 (x, y, z, t) = a21 x + a22 y + a23 z + a24 t
z 0 (x, y, z, t) = a31 x + a32 y + a33 z + a34 t
t0 (x, y, z, t) = a41 x + a42 y + a43 z + a44 t

e temos 16 coeficientes aij a determinar.

Para determinar os 16 coeficientes seguimos os seguintes passos:

a) O movimento relativo só ocorre na direção x, portanto nada acontece nas direções dos
eixos y e z. Por simetria, podemos inferir que os eixos y, z e y 0 , z 0 são idênticos, portanto
a21 = a23 = a24 = 0 e a22 = 1. Da mesma forma para o eixo z, portanto a31 = a32 = a34 = 0 e
a33 = 1. Restando apenas:

x0 = a11 x + a12 y + a13 z + a14 t


t0 = a41 x + a42 y + a43 z + a44 t

b) Da mesma forma que y 0 e z 0 não dependem de x, também devemos ter x0 independente


de y e z, pois a transformação inversa deve preservar as mesmas simetrias. Portanto:

a12 = 0 , a13 = 0 =⇒ x0 = a11 x + a14 t

c) O tempo t0 nao deve depender de y e z, devido a isotropia do espaço (+y, −y), (+z, −z).
Portanto:
a42 = 0 , a43 = 0 =⇒ t0 = a41 x + a44 t

11
d) O ponto O0 (x0 = 0, y 0 = 0, z 0 = 0) se move com velocidade u para a direita, portanto
temos que x = ut visto de S e:

0 = a11 x + a14 t
a14
x = − t = ut
a11
a14
u=− =⇒ a14 = −a11 u
a11
Dessa forma:
x0 = a11 x − a11 ut = a11 (x − ut)
t0 = a41 x + a44 t
Resta-nos determinar a11 , a41 e a44 .

e) Chamemos a11 ≡ A, a44 ≡ B e a41 ≡ D. Usamos:


x02 + y 02 + z 02 − c2 t02 = 0 ⇐⇒ x2 + y 2 + z 2 − c2 t2 = 0
Substituindo:
A2 (x − ut)2 + y 2 + z 2 − c2 (Bt + Dx)2 = 0
A2 (x2 − 2xut + u2 t2 ) + y 2 + z 2 −c2 (B 2 t2 + 2BDxt + D2 x2 ) = 0
| {z }
c2 t2 −x2

x (A − 1 − c D ) + xt(−2A u − 2c2 BD) + t2 (A2 u2 + c2 − c2 B 2 ) = 0


2 2 2 2 2

Cada coeficiente deve ser nulo:



A 2 − c2 D 2 − 1 = 0  
−2A2 u − 2c2 BD = 0 3 equações e 3 incógnitas

A2 u2 + c2 − c2 B 2 = 0

f) Exercı́cio: Resolva o sistema acima e obtenha D = − cu2 B, A2 = B 2 e redefina essa quan-


tidade como γ 2 . Verifique que no limite u = 0 devemos ter A = B = 1 e D = 0. Desta forma
seguem as transformações de Lorentz, onde γ = √ 1 2 , β ≡ uc (parâmetro de velocidade).
1−β

Portanto:

x0 = γ(x − ut) 


y0 = y


Transformações de Lorentz
z0 = z 


t0 = γ t − cu2 x

γ é real se β < 1. Portanto c é a velocidade limite. As transformações inversas são:


x = γ(x0 + ut0 )
y = y0
z = z0
 u 
t = γ t0 + 2 x0
c
onde γ = √ 1 e β ≡ uc .
1−β 2

12
Figura 2b

S S’
y y’
u

R=ct R’= ct’

x’
O’
O x

z’
z

Uma onda luminosa se propaga nos referenciais S e S’

13
2.1.3 Limite de Galileu
O limite de baixas velocidades corresponde às transformações de Galileu. Para ver isso, faça
u << c, que corresponde a β << 1 e assim podemos usar a aproximação por taylor:
1 1
γ = (1 − β 2 )− 2 ≈ 1 + β 2 + ...
2
e portanto:
x0 ≈ x − ut.
Com isso a equação do tempo fica:
   
0 ux u vx
t ≈t 1− 2 ≈t 1− ≈t
c t c c

para qualquer velocidade vx .

Assim abtemos as transformações de Galileu:

x0 ≈ x − ut
y0 ≈ y
z0 ≈ z
t0 ≈ t

e a correspondente transformação inversa:

x ≈ x0 + ut0
y ≈ y0
z ≈ z0
t ≈ t0

Além disso, vemos que γ → 1 se c → ∞ (ou u → 0) e γ → ∞ se u → c.

2.2 Contração do espaço


Uma consequência direta das transformações de Lorentz é a contração do espaço.
O comprimento próprio L0 (ou l0 ) e o tempo próprio T0 (ou t0 ) são medidos no referencial
em que o objeto está em repouso, conforme Figura 3.

Uma barra tem comprimento L0 no referencial S 0 , tal que L0 ≡ x02 − x01 . Qual é o compri-
mento L = x2 − x1 observado em S?

14
Figura 3

S S’
y y’
T0 = t’2 - t’1

(t’1 , t’2)
ux

L0 = x’2 - x’1
x’1 x’2 x’
O’
O x

z’
z

Movimento relativo entre os referenciais S e S’, e as definições


de L0 e T0

15
Das transformações de Lorentz:

x1 = γ(x01 + ux t01 ); x2 = γ(x02 + ux t02 )



0 ux 0  
0 ux 0 
t1 = γ t1 + 2 x1 ; t2 = γ t2 + 2 x2
c c
Desta forma, os intervalos ∆x = x2 − x1 e ∆t = t2 − t1 serão dados por, com seus respectivos
inversos:

 ux 
∆x = γ(∆x0 + ux ∆t0 ) ∆t = γ ∆t0 + 2 ∆x0
c
 ux 
∆x0 = γ(∆x − ux ∆t) 0
∆t = γ ∆t − 2 ∆x
c
Temos uma maneira difı́cil e outra fácil de responder à pergunta formulada acima.

A maneira difı́cil (usando as TL de S 0 para S):

L ≡ x2 − x1 = ∆x = γ(∆x0 + ux ∆t0 )
= γ(L0 + ux ∆t0 )
h  ux i
= γ L0 + ux γ ∆t − 2 ∆x
c
u2x 2
= γL0 − 2 γ ∆x + ux γ 2 ∆t
c
∆t = t2 − t1 = 0, pois a medida das extremidades x2 e x1 em S devem ser simultâneas!
Portanto:
u2x 2
L = γL0 − γ L
c2
= γL0 + (1 − γ 2 )L
= γL0 + L − γ 2 L → γ 2 L = γL0
L0
L=
γ
A barra se contrai por um fator γ1 .

Agora, a maneira fácil (usando as TL de S para S 0 ):

L0 = x02 − x01 = ∆x0 = γ(∆x − ux ∆t)


:0
L0 = γ[L − ux  2 − t1 ) ]
(t  (simultâneo em S)
L0
L=
γ
A medida de um comprimento ∆x deve ser realizada simultaneamente em S, ou seja, ∆t = 0.

2.3 Dilatação do tempo


Outra consequência importante das transformações de Lorentz é a dilatação do tempo.
Dois cliques de um relógio acontecem nos instantes t01 e t02 em S 0 , num ponto fixo de S 0 (∆x0 =
0). Desta forma temos ∆t0 = t02 − t01 ≡ t0 . Qual é o intervalo de tempo medido em S?

16
Em S 0 o relógio está parado, ∆x0 = 0.
Em S o relógio se move, ∆x 6= 0.

Maneira difı́cil:
0
 ux 
∆t = γ ∆t − 2 ∆x
c 
0
 
ux 0 0
t0 = γ t − 2 γ  ∆x + ux ∆t
*

c
2
2 ux
= γt − γ 2 t0
c
= γt + (1 − γ 2 )t0
= γt + t0 − γ 2 t0
γ 2 t0 = γt
t = γt0

Ou:

∆x0 = γ(∆x − ux ∆t)

0 = γ(∆x − ux ∆t)
∆x = ux ∆t

 ux 
∆t0 = γ ∆t − 2 ∆x
c
 ux 
t0 = γ t − 2 ux t
 c 2
u
t0 = γt 1 − 2x
c
| {z }
1
γ2

t = γt0

Maneira fácil:

 t0 ux  0

0 0
∆t =γ ∆t ∆x
+ 2
*
 *

|{z} c
visto em S
t = γt0

O tempo t é maior quando visto por S.

17
Exemplo de contração do espaço e dilatação do tempo: Decaimento do múon, µ.
Estas partı́culas são produzidas na alta atmosfera (∼ 10.000m) quando raios cósmicos vindos
do Sol se chocam com moléculas de ar.

No laboratório o tempo de vida médio do múon é:

τ = t0 = 2, 2 × 10−6 s

Com velocidade u = 0, 9978c ≈ 300.000 km


s
, o múon percorre uma distância:

d = ut0 ≈ 659m

portanto eles não deveriam ser observados na superfı́cie da Terra!

Usando a relatividade temos a seguinte explicação: Os parâmetros relativı́sticos são:

β = u/c = 0, 9978 , γ = 15, 08

Portanto, visto da Terra o tempo de vida médio do µ deve se dilatar, t = γt0 = 3, 32×10−5 s.
Desta forma ele pode percorrer uma distância:

d = ut = 9931m,

que é suficiente para atingir o solo, do ponto de vista de quem está no solo.
Para o µ (que está parado) é a Terra que se aproxima, portanto a distância L0 entre a alta
atmosfera e o solo deve se contrair:
L0
L= = 663m,
γ
portanto do ponto de vista do muon também é possı́vel percorrer uma distância suficiente para
chegar ao solo.

2.4 Simultaneidade
0
Dois eventos que são simultâneos em S 0 (∆t
| {z= 0}), não serão simultâneos em S (∆x 6= 0):
∆x0 6=0

0
 
0 ux
∆t = γ ∆t

*

+ ∆x0
c2
ux
∆t = γ ∆x0 Somente se ∆x0 = 0 (mesmo lugar em S 0 ) então ∆t = 0.
c2

18
CHAPTER 3
COMPOSIÇÃO DE VELOCIDADES E A ACELERAÇÃO

Vamos ver agora como fica a composição de velocidades e a aceleração na relatividade


restrita.

3.1 Composição de velocidades


A composição de velocidades deve ser feita da seguinte forma na relatividade especial. Con-
sidere um objeto em S 0 se movendo com velocidade v~0 em relação a S 0 , conforme Figura 2. ux
é a velocidade do referencial S 0 em relação a S. Qual é a velocidade ~v vista por S?

Usando a definição em termos de ∆:


0
∆t0 ∆x

∆x γ(∆x0 + ux ∆t0 ) ∆t0 + u x
vx = = = 0
∆t γ ∆t0 + uc2x ∆x0 ∆t0 1 + uc2x ∆x
∆t0

portanto
vx0 + ux
vx =
1 + uc2x vx0
Para as componentes y e z fazemos da mesma forma:

∆y ∆y 0
vy = =
γ ∆t0 + uc2x ∆x0

∆t
1 ∆y 0 vy0
= =
γ ∆t0 1 + uc2x vx0 γ 1 + uc2x vx0
 

∆z vz0
vz = =
γ 1 + uc2x vx0

∆t

Note a diferença entre a componente x e as componentes y e z. Isso ocorre porque a


velocidade do sistema de referência é apenas na direção do eixo x.

19
Transformações de Lorentz inversas: ux → −ux
vx − ux
vx0 =
1 − uc2x vx
vy
vy0 =
γ 1 − uc2x vx

vz
vz0 =
γ 1 − uc2x vx


Consequências:

Exemplo 1: Um trem com velocidade ux = 2c passa por uma plataforma. Dentro do


trem uma pessoa caminha com velocidade vx0 = 2c , para a direita. Qual a velocidade vista da
plataforma?

Na mecânica de Galileu:
c c
vx = ux + vx0 = + =c
2 2
Na relatividade:
c
vx0 + ux + 2c
2
vx = 0 =
1 + uxc2vx 1 + 2c 2c c12
c c 4
= 1 = 4+1 = c = 0, 8c
1+ 4 4
5

vy = 0 , vz = 0

Portanto vx < c.

Exemplo 2: vx0 = c, ux = c, vx = ?

Na mecânica de Galileu:
vx = ux + vx0 = c + c = 2c
Na relatividade:
c+c 2c
vx = c2
= =c (limite)
1 + c2 2
vy = 0 , v z = 0

Exemplo 3: vx0 = 2c, ux = c, vx = ?

Na mecânica de Galileu:
vx = ux + vx0 = c + 2c = 3c
Na relatividade:

2c + c 3c
vx = c2c = =c
1 + c2 1+2

vy = 0 , vz = 0

20
Exemplo 4: vx0 = 0, vy0 = c, ux = c
Na relatividade:
0+c
vx = =c
1+0

q
c2
vy0 c c c 1− c2
vy =  = = = =0
ux vx0 γ(1 + 0) r 1 1
γ 1 + c2 u2
1− 2x
c

vz = 0

dx dy dz
Adição de velocidades usando a definição de diferencial: vx ≡ dt
, vy ≡ dt
, vz ≡ dt
.
Vamos usar ux = u por simplicidade.

Das transformações de Lorentz:

x0 = γ(x − ut) x = γ(x0 + ut0 )


y0 = y y = y0
z0 = z z = z0
0
 u  
0 u 0
t = γ t − 2x t = γ t + 2x
c c

1
γ=q
u2
1− c2

dt0
 
u dx
=γ 1− 2
dt c dt
 u 
= γ 1 − 2 vx
c
Portanto:

 0
dt0

dx dx
vx = =γ +u
dt dt dt
 0 0 0

dx dt dt
=γ 0
+u
dt dt dt
0
dt  u 
= γ(vx0 + u) = γ 2 1 − 2 vx (vx0 + u)
dt c

21
 u  u
vx = γ 2 1 − 2 vx (vx0 + u) = γ 2 (vx0 + u) − γ 2 2 vx (vx0 + u)
c c
 u 
vx 1 + γ 2 2 (vx0 + u) = γ 2 (vx0 + u)
c

γ 2 (vx0 + u) γ 2 (vx0 + u)
vx = = 0
1 + γ 2 cu2 (vx0 + u) 1 + γ 2 uc2 + γ 2 u vcx2
2

u2 u2
 
1 1
1+ γ2 2
=γ + 2
, γ2 = 2
c γ2 c2 1 − uc2
u2 u2
 
γ2 1 − 2 + 2 = γ2
c c
Finalmente:
vx0 + u
vx = 0
1 + u vcx2
Para as outras componentes:

dy dy 0 dy 0 dt0
vy = = = 0
dt  dt dt dt
0 u 
= vy γ 1 − 2 vx
c
0 vy
−→ vy =
γ 1 − cu2 vx


dy 0 dy dy dt
vy0 =0
= 0 =
dt  dt dt0
dt 
0
u dx  u 
= vy γ 1 + 2 0 = vy γ 1 + 2 vx0
c dt c
0
vy
−→ vy =
γ 1 + cu2 vx0


De forma análoga para vz .

22
3.2 Aceleração
Agora considere que no sistema S 0 a partı́cula também possua uma aceleração ~a. Como fica
a aceleração vista no referencial S?
Sabemos que deve valer a definição usual de aceleração:

dvx0 ∆vx0
a0x = =
dt0 ∆t0
dvx ∆vx vx0 + u
ax = = onde vx =
dt ∆t 1 + cu2 vx0

Portanto

 
dvx d 0 1 0 d  u 0 −1
= (vx + u) + (vx + u) 1 + 2 vx
dt dt 1 + cu2 vx0 dt c
0
u 0 −2 u dvx0
 
dvx 1 0

= + (vx + u)(−1) 1 + 2 vx
dt 1 + cu2 vx0 c c2 dt

dvx0 dvx0 dt0 0


 u 
= 0 = ax γ 1 − 2 v x
dt dt dt c
1 − cu2 vx

0 (vx0 + u) u 0  u 
ax = ax γ − a
2 2 x γ 1 − vx
1 + cu2 vx0 1 + cu2 vx0 c c2

!
u

1 − v 0
2 x v + u u
= a0x γ c  1− x
1 + cu2 vx0 1 + cu2 vx0 c2


a0x γ u (vx0 + u) u (vx0 + u)


  
= 1− 2 1− 2
1 + cu2 vx0 c 1 + cu2 vx0 c 1 + cu2 vx0
2
a0x γ u (vx0 + u) a0x γ

1 h u 0 u 0 i2
= 1− 2 =  1 + 2 vx − 2 (vx + u)
1 + cu2 vx0 c 1 + cu2 vx0 1 + cu2 vx0 1 + u2 vx0 2 c c
c
2
a0x γ u2
 
u 0 u 0
= 1 + v − v −
c2 x c2 x c2
3
1 + c2uv0 | {z }
x
1
γ4

a0x
ax =
u 0 3

γ3 1 + v
c2 x

Exercı́cio: Obtenha as expressões para as componentes y e z da aceleração, e mostre que:

a0y u vy0 a0x


ay = −
u 0 2 u 0 3
 
γ2 1 + c 2 vx c2 γ 2 1 + c 2 v x

e de forma análoga para az .

23
CHAPTER 4
INVARIANTES E QUADRIVETORES

Neste capı́tulo vamos introduzir de maneira mais formal o conceito de quantidades invari-
antes na relatividade. Já vimos, por exemplo, que a velocidade da luz é um invariante por
transformações de Lorentz, ou seja, tem o mesmo valor em qualquer referencial inercial. Vimos
também que a equação de onda do eletromagnetismo também é invariante por transformações
de Lorentz. Vamos definir melhor quantidades invariantes e obter outras quantidades que são
invariantes na relatividade. Para isso precisaremos do conceito de quadrivetores, que é a gene-
ralização para 4 dimensões dos vetores tridimensionais que conhecemos.

4.1 Quantidades invariantes


Sejam as tranformações de Lorentz:

x0 = γ(x − ut) x = γ(x0 + ut0 )


y0 = y y = y0
z0 = z z = z0
0
 u  
0 u 0
t = γ t − 2x t = γ t + 2x
c c

1
γ=q
u2
1− c2

Um evento ocorre em S nas coordenadas

x = 2, 0m , y = 1, 0m , z = 1, 0m , t = 3, 0s
~r = (x, y, z) = (2, 1, 1)

Distância à origem O:
√ p √ √
~r · ~r = |r| = x2 + y 2 + z 2 = 4 + 1 + 1 = 6m ≈ 2, 45m
r2 = x2 + y 2 + z 2 = 6m2 é um escalar

onde o produto escalar em 3-dimensões é definido da maneira usual, ~r · ~r = x2 + y 2 + z 2 .

24
Em S 0 :

x0 = γ(2 − 3u) r02 = x02 + y 02 + z 02


y 0 = 1m r02 = γ 2 (2 − 3u)2 + 12 + 12
z 0 = 1m r02 = γ 2 (4 − 12u + 9u2 ) + 2
 u 
t0 = γ 3 − 2 2 r02 = γ 2 (4 − 12u + 9u2 ) + 2
√ c
1
0
|r | = ~r · ~r = [γ (4 − 12u + 9u2 ) + 2] 2
0 0 2
é um escalar

Se u = 1m/s, γ ≈ 1

|r0 | = 3 ≈ 1, 7m é um escalar,

e além disso, à medida que o tempo passa, a coordenada x0 muda de valor, o que altera o valor
acima. No referencial S não tem alteração do valor de |r|, pois a partı́cula está parada.

Claramente |r| =6 |r0 |. Será que existe alguma quantidade invariante relacionada às coor-
denadas, similar ao produto escalar dos vetores, mas que também leve em conta a coordenada
temporal?

A resposta é Sim, existe uma quantidade invariante s, que não depende do sistema de
referência, além de ser válida para qualquer instante de tempo. Esta quantidade é:

s2 ≡ c2 t2 − x2 − y 2 − z 2

No exemplo:
s2 = c2 32 − 22 − 12 − 12 = 9c2 − 6

No referencial S 0 :
 u 2
s02 = γ 2 c2 t0 + 2 x0 − γ 2 (x0 + ut0 )2 − y 02 − z 02
c
u2 02
 
02 0 u 0
2 2
= γ c t + 2t 2 x + 4 x − γ 2 (x02 + 2x0 ut0 + u2 t02 ) − y 02 − z 02
c c
u2 02
 
2 02 0 0 02 0 0 2 02
2
= γ c t + 2t ux + 2 x − x − 2x ut − u t − y 02 − z 02
c
2
u2
    
2 02 u 02
2
=γ c t 1− 2 −x 1− 2 − y 02 − z 02
c c
1
usando γ 2 = 2 :
1− u2
c
s2 = c2 t02 − x02 − y 02 − z 02 = s02
Vemos que essa quantidade tem a mesma forma do valor de s2 calculado no referencial S.

25
Usando as quantidades explı́citas do exemplo:
 u 2
s02 = c2 γ 2 3 − 2 2 − γ 2 (2 − 3u)2 − 12 − 12
c
u2
 
u
= c γ 9 − 12 2 + 4 4 − γ 2 (4 − 12u + 9u2 ) − 2
2 2
c c
u2
 
2 2 2
= γ 9c − 12u + 4 2 − 4 + 12u − 9u − 2
c
2
u2
    
2 2 u
= γ 9c 1 − 2 − 4 1 − 2 −2
c c
= 9c2 − 6
Portanto s2 = c2 t2 − x2 − y 2 − z 2 é um invariante por transformações de Lorentz. Ele possui
o mesmo valor em qualquer sistema de referência.

p p
A quantidade ∆s = c2 ∆t2 − ∆x2 − ∆y 2 − ∆z 2 ou ds = c2 dt2 − dx2 − dy 2 − dz 2 é uma
“distância” ou “intervalo” no espaço-tempo de 4 dimensões, e tem um caráter absoluto.

4.1.1 Diferentes tipos de intervalo


Esse “intervalo” ou “distância” pode ser de 3 tipos:

a) Intervalo do tipo tempo:


Se ∆s2 > 0:
∆s2 = c2 ∆t2 − ∆x2 − ∆y 2 − ∆z 2 > 0
portanto
c2 ∆t2 > ∆x2 + ∆y 2 + ∆z 2

A separação espacial ∆x2 + ∆y 2 + ∆z 2 é menor que a distância percorrida por um sinal


luminoso com velocidade c. Existe uma relação causal entre eles, ou dito de outra forma, é
possı́vel enviar uma informação ou sinal luminoso entre os dois pontos.

b) Intervalo do tipo espaço:


Se ∆s2 < 0:
c2 ∆t2 < ∆x2 + ∆y 2 + ∆z 2

A separação espacial é maior que a distância percorrida pela luz. Não existe relação causal
entre os pontos, ou dito de outra forma, não é possı́vel enviar uma informação ou sinal luminoso
entre os dois pontos.

c) Intervalo nulo ou do tipo luz:


∆s2 = 0.
c2 t2 = ∆x2 + ∆y 2 + ∆z 2

Os dois pontos podem ser conectados por um sinal na velocidade da luz.

26
4.1.2 O intervalo de tempo próprio
Definimos o intervalo de tempo próprio dτ invariante como:
ds2 dx2 + dy 2 + dz 2
dτ 2 ≡ = dt2

c2 c2
2 2
dz 2
dτ 2 dx
dt2
+ dy
dt2
+ dt2
vx2 + vy2 + vz2 v2
= 1 − =1− = 1 −
dt2 c2 c2 c2
Portanto: r
dτ v2 dt 1
= 1− 2 =q = γ(v)
dt c dτ 1− v2
c2

dt = γdτ se v = 0, dt = dτ

dτ é um intervalo de tempo que é dilatado quando visto por S:

dt = γdτ dτ é o intervalo de tempo próprio,

aquele mesmo intervalo de tempo próprio t0 ou T0 visto no exemplo da dilatação do tempo.

4.2 Quadrivetores
Vimos que a quantidade ct tem dimensão de espaço e juntamente com as outras componentes
espaciais forma uma quantidade invariante.

Em analogia com os vetores tridimensionais, ~r = (x, y, z) por exemplo, vamos definir quan-
tidades vetoriais no espaço-tempo em 4 dimensões, chamados quadrivetores ou simplesmente
4-vetores.

4.2.1 4-vetor posição


O quadrivetor posição xµ (’ı́ndice em cima’) é definido como:

xµ = (ct, x, y, z) = (ct, ~r) ≡ (x0 , x1 , x2 , x3 )


onde µ = 0, 1, 2, 3 é um ı́ndice que representa cada componente do 4-vetor.
Se

(xµ )2 = (x0 )2 − (x1 )2 − (x2 )2 − (x3 )2 = c2 t2 − x2 − y 2 − z 2 = s2

é invariante, como vimos anteriormente, deve existir um produto escalar no espaço-tempo 4D


que é invariante em qualquer referencial.

O Produto escalar 4-dimensional é definido como:


3
X
x·x≡ xµ xµ = x µ xµ = x0 x0 + x1 x1 + x2 x2 + x3 x3 (soma sobre ı́ndices repetidos µ)
µ=0

e precisamos definir um novo tipo de 4-vetor, que é xµ (’ı́ndice embaixo’).

27
Definimos: xµ ≡ (x0 , x1 , x2 , x3 ) = (ct, −x, −y, −z).

O 4-vetor com ı́ndice ’em cima’, xµ , é chamado contravariante e o 4-vetor com ı́ndice ’em-
baixo’, xµ , é chamado covariante.

O chamado tensor métrico de Minkowski ηµν (ou gµν em alguns livros) definido por
 
1 0 0 0
0 −1 0 0 µν
ηµν = 
0 0 −1 0  = η

0 0 0 −1

onde os ı́ndices µ e ν podem ser pensados como os elementos ’linha’ e ’coluna’ da notação
matricial. No entanto é melhor tomar cuidado com essa analogia, como ficará mais claro mais
a frente.

O tensor métrico de Minkowski ηµν relaciona um vetor contravariante xν com o covariante


xµ por meio de:
3
X
xµ = ηµν xν = ηµν xν = ηµ0 x0 + ηµ1 x1 + ηµ2 x2 + ηµ3 x3 (soma sobre ı́ndices repetidos ν)
ν=0

de tal forma que temos os elementos:


x0 = x0 = ct,
x1 = −x0 = −x,
x2 = −x2 = −y,
x3 = −x3 = −z,
formando assim o 4-vetor covariante xµ ≡ (x0 , x1 , x2 , x3 ) = (ct, −x, −y, −z), conforme definido
acima.

Da mesma forma xµ = η µν xν . Note que η µν e ηµν são responsáveis por ‘levantar’ e ‘abaixar’
os ı́ndices de um 4-vetor covariante e contravariante, respectivamente.

Veja que no caso geral de dois 4-vetores aµ e bν quaisquer, o produto escalar entre eles é
dado por: a · b = aµ bµ = aµ ηµν bν = a0 b0 + a1 b1 + a2 b2 + a3 b3 .

4.2.2 A transformação de Lorentz do 4-vetor posição


A transformação de Lorentz pode ser reescrita como:

 cu 
ct0 = γ ct − 2 x
c
0 uc
x = γ(x − t)
c
0
y =y
z0 = z

28
ou simplesmente:

0 u
x0 = γ(x0 − x1 ) = γ(x0 − βx1 )
c
10 u 0
x = γ(x − x ) = γ(x1 − βx0 )
1
c
20 2
x =x
0
x3 = x3

onde β = u
c
e γ = √1 . Note a simetria que estas quantidades adquirem!
1−β 2
Em notação matricial, a transformação de Lorentz do 4-vetor posição é dada por:
 00     0
x γ −βγ 0 0 x
x10  −βγ γ 0 0   x1 
 
 0 =  
2
x   0 0 1 0 x2 
0
x3 0 0 0 1 x3

Note que esta transformação ’matricial’ é análoga à da Transformação de Galileu do final do


Capı́tulo 1.

Em notação tensorial:
0
xµ = Λµν xν = Λµ0 x0 + Λµ1 x1 + Λµ2 x2 + Λµ3 x3

onde a matriz de transformação de Lorentz é dada por:


 
γ −βγ 0 0
 −βγ γ 0 0
Λµν =  0

0 1 0
0 0 0 1

que pode ser obtida por meio da relação geral:


0
∂xµ
Λµν =
∂xν
Veja novamente o análogo para a transformação de Galileu!

Por exemplo:
00
Λ0 0 = ∂x
∂x0
= γ;
0
∂x0
Λ0 1 = ∂x1
= −γβ;
0
0 ∂x0
Λ 2 = ∂x2 = 0;
0
∂x0
Λ0 3 = ∂x3
= 0;
0
∂x1
Λ1 0 = = −γβ;
∂x0

.
.
.
etc. Calcule todas as 16 componentes de Λµν .

29
Da mesma forma a transformação inversa:

0 0
x0 = γ(x0 + βx1 )
0 0
x1 = γ(x1 + βx0 )
0
x2 = x2
0
x3 = x3

ou em notação matricial:  0    00 
x γ βγ 0 0 x
x1  βγ γ 0 0 x10 
 2 =    0
x   0 0 1 0   x2 
0
x3 0 0 0 1 x3
Em notação tensorial:
0 0
xµ = (Λµν )−1 xν = Λν µ xν
onde a matriz de transformação inversa de Lorentz é dada por:
 
γ βγ 0 0
βγ γ 0 0
Λν µ = (Λµν )−1 = 


0 0 1 0
0 0 0 1

que pode ser obtida por meio da relação geral:


∂xµ
Λν µ =
∂xν 0

Exercı́cio: Obtenha a matriz que representa Λµν = ηµα Λαν .

Exercı́cio: Obtenha a matriz que representa Λν µ = η αµ Λνα .

Exercı́cio: Verifique que Λµα Λµβ = δβα .

Todo 4-vetor (ou tensor de primeira ordem) se transforma da mesma maneira de um refer-
encial S para um referencial S 0 conforme a matriz de Lorentz Λµν .

4.2.3 4-vetor velocidade e o invariante c


O quadrivetor velocidade é definido como:

v µ = (v 0 , v 1 , v 2 , v 3 )

onde
dxµ dxµ dt dxµ
vµ ≡ = = γ(v)
dτ dt dτ dt
ou
d
v µ = γ(v) (ct, x, y, z) = γ(v)(c, vx , vy , vz ) = γ(v)(c, ~v )
dt
onde γ(v) = √ 1
e v = |~v |.
1−v 2 /c2

30
Note que a definição do 4-vetor velocidade é a derivada do 4-vetor posição xµ em relação
ao intervalo de tempo próprio dτ . Lembre-se que dτ é a medida de tempo no referencial de
repouso da partı́cula, portanto uma quantidade absoluta (veja Figura a seguir).
O fator γ(v) que aparece agora é como se um referencial hipotético S 00 fosse colocado em
cima da ’partı́cula hipotética’ que realiza o deslocamento infinitesimal dxµ com velocidade ~v
em relação a S.

4.2.4 A transformação de Lorentz do 4-vetor velocidade


A transformação de v µ para o referencial S 0 padrão (que possui velocidade u em relação a
S) é obtido por meio de:
0 0 0 0 0
v µ = (v 0 , v 1 , v 2 , v 3 ) = γ(v 0 )(c, vx0 , vy0 , vz0 ) = γ(v 0 )(c, ~v 0 )

tal que v 0 = |v~0 | e


0
v µ = Λµν v ν = Λµ0 v 0 + Λµ1 v 1 + Λµ2 v 2 + Λµ3 v 3 .
Em notação matricial:
0
v0
    0
γ −βγ 0 0 v
v 10  −βγ γ 0 0  v 1 
 
 0 =  
2
v   0 0 1 0 v 2 
0
v3 0 0 0 1 v3
Lembre-se que o fator γ que aparece dentro de Λµν é γ(u), sendo u a velocidade de S 0 em
relação a S, como anteriormente. Note que temos três fatores γ, quais sejam, γ(u), γ(v) e γ(v 0 ).
Entenda a diferença entre eles!
0
Componente v 0 :
0 uvx
v 0 = Λ0 0 v 0 + Λ0 1 v 1 + Λ0 2 v 2 + Λ0 3 v 3 = γ(u)γ(v)c − βγ(u)γ(v)vx = γ(u)γ(v)(c − ).
c
0
Por outro lado, da definição de 4-velocidade temos v 0 = γ(v 0 )c, portanto chegamos a uma
relação importante entre os fatores γ’s:
uvx
γ(v 0 )c = γ(u)γ(v)(c − )
c
ou
γ(v 0 ) uvx
= (1 − 2 ).
γ(u)γ(v) c
0
Componente v 1 :
0
v 1 = Λ1 0 v 0 + Λ1 1 v 1 + Λ1 2 v 2 + Λ1 3 v 3 = γ(u)γ(v)(vx − u) = γ(v 0 )vx0
Usando a relação entre os γ’s acima obtemos finalmente:
vx − u
vx0 = .
1 − uv
c2
x

0 0
Exercı́cio: Componentes v 2 e v 3 : Seguindo os passos acima, obtenha as transformações
para vy0 e vz0 .
0
Exercı́cio: Calcule o produto escalar v µ vµ0 no referencial de repouso S 0 da partı́cula.
Calcule o produto escalar v µ vµ no referencial S, e mostre que ambos são iguais a c2 , ou seja, a
velocidade da luz é um invariante, possui o mesmo valor em qualquer sistema de referência.

31
Movimento relativo entre os referenciais S e S’’

S S’’
y y’’

O’’ x’’

z’’

O x

Movimento relativo entre os referenciais S e S’

S S’
y y’

v’ γ(v’)v’)

v γ(v’)v)

u, γ(v’)u)

x’
O’
O x

z’
z
32
4.2.5 4-vetor aceleração
O quadrivetor aceleração é definido como:

aµ = (a0 , a1 , a2 , a3 )

onde
dv µ dv µ dt dv µ
aµ ≡ = = γ(v)
dτ dt dτ dt
ou  
µ d dγ(v) dγ(v)
a = γ(v) [γ(v)(c, vx , vy , vz )] = γ(v) c , ~v + γ(v)~a
dt dt dt
A transformação de aµ para o referencial S 0 é obtido por meio de:
0 0 0 0 0
aµ = (a0 , a1 , a2 , a3 )

tal que
0
aµ = Λµν aν ,
de forma totalmente análoga ao que foi feito para o 4-vetor velocidade. Obviamente também é
0
válida a notação matricial relacionando aµ e aµ .

4.2.6 4-vetor momento e a relação E = mc2


O quadrivetor momento é definido como:

P µ ≡ m0 v µ = m0 γ(v)(c, ~v ) = (mc, p~),

onde m0 é a massa de repouso da partı́cula, v µ a sua 4-velocidade, m ≡ m0 γ(v) é uma função


da velocidade v e p~ = m~v . Note a diferença entre m e m0 . No limite v = 0 temos γ(v) → 1 e
m → m0 . A massa de repouso m0 aumenta com a velocidade pelo fator γ.
Tendo em vista que o 4-vetor momento P µ é construı́do através do 4-vetor velocidade v µ ,
que por sua vez é construı́do através do 4-vetor posição xµ , podemos construir o invariante
P · P = P 2 ≡ P µ Pµ :
P µ Pµ = P 2 = m2 c2 − p2 ,
onde p2 = p~ · p~. A quantidade acima é um invariante, ou seja, possui o mesmo valor em
qualquer sistema de referência, em particular no sistema de repouso da partı́cula, onde ~v = 0,
e consequentemente p~ = 0.
0
Portanto, no referencial de repouso S 0 em que a partı́cula se encontra, temos P µ = (m0 c, 0, 0, 0).
Mas o que é essa primeira componente do 4-vetor momento? Mesmo em repouso parece
haver uma componente de ’momento’ da partı́cula que não é nula! E ela é o produto da
massa de repouso da partı́cula pela velocidade da luz, ou seja, de duas constantes. Verif-
icando a dimensão desta componente chega-se à conclusão que ela tem dimensão de Ener-
gia/velocidade. Desta forma, essa componente do 4-vetor momento deve estar associada com
a energia da partı́cula, mais especificamente, com a energia de repouso E0 dividida por c,
0
ou seja m0 c = E0 /c. Portanto podemos reescrever P µ = (E0 /c, 0, 0, 0), e da mesma forma
P µ = (γm0 c, p~) = (γE0 /c, p~) = (E/c, p~), e definimos a energia total E = γ(v)E0 = γ(v)m0 c2 .
0
Portanto, o invariante P µ Pµ0 = P µ Pµ nos leva a:

E2
m20 c2 = − p2 ,
c2
ou
E 2 = m20 c4 + p2 c2 ,

33
que representa a energia total da partı́cula em termos do seu momento p~ e da massa de repouso
m0 . Em particular, se a partı́cula está parada p~ = 0 obtemos a famosa relação

E0 = m0 c2 ,

que muitas vezes aparece apenas como E = mc2 , mas é preciso ficar claro que se trata da
energia de repouso E0 em função da massa de repouso m0 da partı́cula.
A energia total pode ser escrita como
r
v2
q q
2
E = m20 c4 + p2 c2 = m20 c4 + γ 2 m20 v 2 c2 = m0 c 1 + γ 2 2 ,
c
que por sua vez pode ser escrita em forma de uma expansão quando a velocidade v << c
(γ ' 1):
1 v2 1
E ' m0 c2 (1 + 2 + . . . ) ' m0 c2 + m0 v 2 + . . . ,
2c 2
e reconhecemos facilmente o segundo termo como a energia cinética usual da partı́cula somada
como a energia de repouso no primeiro termo.

34
CHAPTER 5
TENSORES NA RELATIVIDADE ESPECIAL

Nos capı́tulos anteriores introduzimos os principais conceitos que nos guiarão até a for-
mulação da Teoria da Relatividade Geral, são eles:

• As Transformações de Lorentz (TL) relacionam os referenciais S e S 0 que possuem uma


velocidade relativa constante u entre si;

• Os quadrivetores (vetores em 4-dimensões) formam quantidades escalares invariantes, que


não mudam de valor de um referencial para outro;

• Todo 4-vetor se transforma da mesma maneira de um referencial S para um referencial


S 0 conforme a matriz de transformação de Lorentz Λµν ;

• A nova definição de produto escalar a · b ≡ aµ bµ em 4 dimensões introduz o conceito de


4-vetores contravariantes aµ e covariantes bµ , que estão relacionados pelo tensor métrico
de Minkowski, aµ = ηµν aν e bµ = η µν bν .

Neste capı́tulo vamos generalizar os resultados válidos para 4-vetores e fazer um breve estudo
de 4-vetores e tensores na relatividade especial e designar a notação usada neste trabalho.

5.1 Escalares, 4-vetores e Tensores


Um quadrivetor V α é também chamado de tensor de primeira ordem, pois ele possui apenas
um ı́ndice α. Um objeto T αβ é chamado tensor de segunda orderm, pois possui 2 ı́ndices α, β.
Um objeto K αβγ é chamado tensor de terceira orderm, pois possui 3 ı́ndices α, β, γ, e assim por
diante. Um escalar, por sua vez, é um tensor de ordem 0, já que ele é representado por apenas
um número, ou escalar.

5.1.1 Tensor de ordem 0


Um escalar é um tensor de ordem 0, representado por apenas um número. A velocidade
da luz c e a massa de repouso m0 de uma partı́cula são exemplos de escalares, ou tensores de
ordem 0. Na relatividade geral encontraremos outro escalar importante, o escalar de Ricci R.

35
5.1.2 Tensor de ordem 1
Alguns exemplos de tensores de ordem 1 ou 4-vetores foram vistos anteriormente, como
4-vetor posição, 4-vetor velocidade, 4-vetor aceleração e 4-vetor momento.
Um tensor de ordem 1 ou 4-vetor possui apenas um ı́ndice e obedece à seguinte lei de
transformação:
0
V α → V α = Λαβ V β (5.1.1)
quando o sistema de coordenadas é transformado do referencial S para S 0 pelas TL por
0
xα → xα = Λαβ xβ . (5.1.2)
Mais precisamente, tal V α deve ser chamado de um vetor contravariante para distingui-lo
de um quadrivetor covariante, definido como Uα cuja regra de transformação é

Uα → Uα0 = Λαβ Uβ (5.1.3)


onde

Λαβ ≡ ηαγ Λγδ η βδ (5.1.4)


A matriz que representa η βδ é numericamente igual a ηβδ , mas escrevemos nosso ı́ndice em
cima para estar de acordo com nossa convenção de somatório:

η βδ ηαδ = δαβ . (5.1.5)


Além disso temos η βδ = η δβ . Concluı́mos então que Λαβ é o inverso da matriz Λβα , tal que:

Λαγ Λαβ = δβγ (5.1.6)


que pode ser demonstrado explicitamente tomando-se as componentes de Λαγ e Λαβ explicita-
mente e somando sobre o ı́ndice α.
Isso mostra que o produto escalar de um quadrivetor contravariante com um quadrivetor
covariante é um invariante por TL:

Uα0 V 0α = Λαγ Uγ Λαβ V β = Λαγ Λαβ Uγ V β = δβγ Uγ V β = Uβ V β (5.1.7)


Como já foi dito anteriormente, para todo quadrivetor contravariante V α há um quadrivetor
covariante correspondente

Vα ≡ ηαβ V β (5.1.8)
e para todo quadrivetor covariante Uα há um contravariante correspondente

U α ≡ η αβ Uβ (5.1.9)
tal que:

η αβ Vβ = η αβ ηβγ V γ = δγα V γ = V α (5.1.10)

ηαβ U β = ηαβ η βγ Uγ = δαγ Uγ = Uα . (5.1.11)


Note que Vα ≡ ηαβ V β produz um quadrivetor covariante, pois

Vα0 = ηαβ V 0β = ηαβ Λβγ V γ = ηαβ η γδ Λβγ Vδ = Λαδ Vδ (5.1.12)

36
em concordância com Uα0 = Λαβ Uβ . Do mesmo modo U α ≡ η αβ Uβ produz um quadrivetor
contravariante.
O vetor covariante está em um espaço e o contravariante está em um outro espaço. A
métrica faz a ponte entre esses dois espaços. O produto escala Vµ V µ resulta em um invariante
de Lorentz.

5.1.3 Tensores de ordem 2 ou mais


Muitas grandezas fı́sicas não são escalares nem vetoriais, mas objetos mais complicados
chamados de tensores de ordem 2 ou mais.
Por exemplo, as equações do eletromagnetismo podem ser escritas em termos de um tensor
de segunda ordem, F µν . Veremos que a quantidade que representa o conteúdo material de uma
teoria de gravitação ou da cosmologia são escritos em termos de um tensor de segunda ordem,
T µν . Na relatividade geral existem também dois tensores importantes, o tensor de Ricci Rµν e
o tensor de Riemann Rµνγδ .
No caso geral, um tensor pode ter vários ı́ndices contravariantes e/ou covariantes com cor-
respondentes propriedades da transformação de Lorentz, por exemplo:

K γαβ → K 0γαβ = Λγδ Λα Λβµ K δµ . (5.1.13)


Como regra geral, cada componente ou ı́ndice contravariante de um tensor se transforma pela
matriz de TL Λαβ e cada componente covariante se transforma pela matriz inversa Λαβ .
Mais adiante encotraremos uma quantidade de três ı́ndices Γαµν que não se transforma da
maneira simples acima pelas TL, portanto essa quantidade não é um tensor, como veremos.

Também pode-se subir e baixar ı́ndices de um tensor usando o tensor métrico de Minkowski,
por exemplo:

K γαβ = η γµ ηαν ηβδ Kµ νδ (5.1.14)

5.2 Algumas propriedades gerais


Existem várias maneiras de formar tensores a partir de outros tensores, e algumas pro-
priedades gerais válidas para todos os tensores são:

1 - Combinação linear: Uma combinação linear dos tensores com os mesmos ı́ndices supe-
riores e inferiores é um tensor com os mesmos ı́ndices. Por exemplo, se Rαβ e S αβ são tensores,
e a e b são escalares, e nós definimos T αβ ≡ aRαβ + bS αβ então T αβ é um tensor,

T 0αβ ≡ aR0αβ + bS 0αβ = aΛαγ Λβδ Rγδ + bΛαγ Λβδ S γδ = Λαγ Λβδ T γδ (5.2.1)

2 - Produto direto: o produto das componentes de dois tensores resulta em um tensor cujos
ı́ndices superior e inferior consistem de todos os ı́ndices superior e inferior dos dois tensores
originais. Por exemplo, se Aα e B γβ são tensores e

K αγβ ≡ Aα B γβ (5.2.2)

então K αγβ é um tensor:

37
K 0αγβ ≡ A0α B 0γβ = Λαδ Λγµ Λβ Aδ B µ = Λαδ Λγµ Λβ K δµ (5.2.3)

3 - Contração: definir um ı́ndice superior e inferior iguais e somando-os sobre seus valores
0,1,2,3 produz um tensor com esses dois ı́ndices ausentes. Por exemplo, se Rµν é um tensor de
ordem 2, a quantidade ηµν Rµν = Rµµ = R0 0 + R1 1 + R2 2 + R3 3 ≡ R é um tensor de ordem 0,
ou escalar.
Da mesma forma, para um caso mais geral, se Tβ αγδ é um tensor e T αγ = ηδβ Tβ αγδ = Tδ αγδ
então T αγ é um tensor,

T 0αγ ≡ Tβ0 αγβ


= Λαδ Λγµ Λβκ Λβ T δµκ = Λαδ Λγµ δκ T δµκ = Λαδ Λγµ T δµ (5.2.4)

4 - Simetria: Um tensor é simétrico se a troca de dois ı́ndices produz o mesmo tensor, por
exemplo, se Rµν = Rνµ dizemos que o tensor é simétrico. Também, para um tensor de ordem
mais alta, se Aαβγδ = Aγβαδ , dizemos que o tensor é simétrico nos ı́ndices α, γ.
Em particular, o tensor métrico de Minkowski é simétrico, η µν = η νµ , e portanto η µν =
ην µ ≡ ηνµ , e não é necessário indicar a separação dos ı́ndices referentes a linha e coluna na
representação matricial.

5 - Anti-simetria: Um tensor é anti-simétrico se a troca de dois ı́ndices produz um tensor com


sinal trocado, por exemplo, se F µν = −F νµ dizemos que o tensor é anti-simétrico. Também,
para um tensor de ordem mais alta, se Rαβγδ = −Rβαγδ , dizemos que o tensor é anti-simétrico
nos ı́ndices α, β.

5.3 Derivadas e operador gradiente


Embora qualquer vetor possa ser escrito na forma contravariante ou covariante, há alguns
vetores que aparecem mais naturalmente na forma contravariante e outros que aparecem com
mais naturalidade na forma covariante.
Em 3-dimensões o elemento diferencial de volume é d3 x = dx dy dz. No espaço-tempo de
4-dimensões a generalização é dxα , tal que o elemento dx0 ≡ cdt.
O diferencial dxα se tranforma como um 4-vetor contravariante:
∂x0α β
dxα → dx0α = dx (5.3.1)
∂xβ

pois como vimos anteriormente, ∂x ∂xβ
= Λαβ é a maneira que se transforma um 4-vetor con-
0
travariante, V α = Λαβ V β .
Em 3-dimensões o operador gradiente é dado por ∇ ~ = ∂ î + ∂ ĵ + ∂ k̂ = ( ∂ , ∂ , ∂ )
∂x ∂y ∂z ∂x ∂y ∂z
em componentes vetoriais. A generalização para o espaço-tempo de 4-dimensões é ∂x∂α =
( ∂x∂ 0 , ∂x∂ 1 , ∂x∂ 2 , ∂x∂ 3 ), tal que a primeira componente é ∂x∂ 0 = 1c ∂t

.
O operador gradiente ∂x∂α , por outro lado, obedece à regra de transformação de um 4-vetor
covariante:

∂ ∂ ∂xβ ∂
→ = (5.3.2)
∂xα ∂x0α ∂x0α ∂xβ
∂x β
β
e como vimos anteriormente, ∂x 0α = Λα é a maneira que se transforma um 4-vetor covariante,

Uα0 = Λαβ Uβ . Portanto o operador gradiente em 4 dimensões é covariante:

38
∂ ∂

= Λαβ β (5.3.3)
∂x ∂x
Uma notação mais compacta e intuitiva para o operador gradiente é:

≡ ∂β , (5.3.4)
∂xβ
deixando claro que o ı́ndice correspondente é covariante. Da mesma forma

≡ ∂β . (5.3.5)
∂xβ
α
Uma consequência é que a divergência de um vetor contravariante ∂V
∂xα
= ∂α V α é invariante.
Outra é que o produto escalar que representa o operador d’Alembertiano é também invariante,
∂ α ∂α ≡ .

5.4 O tensor métrico de Minkowski


O tensor de Minkowski η αβ ou ηαβ é um objeto bastante importante. Ele possui o mesmo
valor em qualquer sistema de referência, ou seja, assim como os escalares, ele também é um
invariante por TL.
Por uma transformação de Lorentz,

η γδ → η 0γδ = Λγα Λδ β η αβ (5.4.1)


multiplicando esta equação por ηδκ obtemos ηδκ η 0γδ = ηδκ Λγα Λδ β η αβ = Λγα Λκα = δκγ , e portanto
ηδκ η 0γδ = δκγ , de onde concluı́mos que η 0γδ = η γδ .

Exercı́cio: Mostre, componente a componente, que η 0γδ = η γδ = Λγα Λδ β η αβ .

Desta forma a relação entre o tensor métrico de Minkowski e a matriz de transformação de


Lorentz é: 0 0
0µν µ ν αβ ∂xµ ∂xν αβ
η = Λ αΛ β η = η . (5.4.2)
∂xα ∂xβ
Vale relembrar aqui o que são essas quantidades. η µν é uma quantidade puramente geométrica,
que define o produto escalar no espaço de Minkowski:
 
1 0 0 0
0 −1 0 0 µν
ηµν = 0 0 −1 0  = η
 (5.4.3)
0 0 0 −1
Λαβ é a matriz de transformação de Lorentz:
 
γ −βγ 0 0
0
∂xα −βγ γ 0 0 u 1
Λαβ = = 
 0
 β= γ=p , (5.4.4)
∂xβ 0 1 0 c 1 − β2
0 0 0 1
que é uma quantidade dinâmica, dependente da velocidade u entre os referenciais inerciais S e
S 0.
A relação acima mostra que uma transformação de coordenadas, no caso as TL, definem
uma métrica, no caso a métrica de Minkowski. Esta relação é bastante importante, e será
generalizada na relatividade geral.

39
CHAPTER 6
O PRINCÍPIO DE EQUIVALÊNCIA E AS BASES DA
RELATIVIDADE GERAL

O Princı́pio de equivalência da relatividade geral é uma generalização do princı́pio da


relatividade restrita.

De acordo com a discussão no livro de H. M. Nussenzveig: As leis da mecânica na pre-


sença de um campo gravitacional ~g uniforme são as mesmas que resultariam, na ausência do
campo, num referencial uniformemente acelerado, com aceleração ~g , ou seja, não é possı́vel
distinguir entre as duas situações por experiências de mecânica. Desta forma podemos enun-
ciar o Princı́pio de Equivalência (de acordo com Nussenzveig): Num recinto suficientemente
pequeno para que o campo gravitacional dentro dele possa ser tomado como uniforme, em queda
livre dentro desse campo, todas as leis fı́sicas são as mesmas que num referencial inercial, na
ausência do campo gravitacional.

Vale também enunciar o Princı́pio de Equivalência de acordo com Weinberg: Em todos os


pontos do espaço-tempo em um campo gravitacional arbitrário é possı́vel escolher um sistema
de coordenadas inercial local tal que, em uma região suficientemente pequena próxima desses
pontos, as leis da natureza possuem a mesma forma que em um sistema cartesiano não-acelerado
na ausência do campo gravitacional.

A ideia básica do Princı́pio de Equivalência pode ser melhor entendida com a ajuda figura
a seguir.

40
Sistemas de coordenadas xμ (laboratório) elaboratório) e ξμ (laboratório) eem queda livre, com aceleração g em relação a xμ)

ξμ

xμ g

41
6.1 Forças gravitacionais
Considere uma partı́cula livre movendo-se sob influência somente de forças gravitacionais.
De acordo com o Princı́pio de Equivalência, existe um sistema de coordenadas em queda livre
ξ α em que sua equação de movimento é o de uma linha reta no espaço-tempo, ou seja, sua
aceleração (ou 4-vetor aceleração) é nula:

d2 ξ α
= 0, (6.1.1)
dτ 2
em que dτ é o tempo próprio. No referencial ξ α valem as leis da relatividade restrita, em
particular as TL e o tensor métrico de Minkowski ηµν .

Agora suponha um outro sistema de coordenadas qualquer xµ , que pode ser um sistema de
coordenadas cartesiano em repouso no laboratório, mas também pode ser curvilı́neo, acelerado,
rotativo ou qualquer outro. O sistema de coordenadas em queda livre ξ α pode ser escrito em
função de xµ , e a equação (6.1.1) será:

d2 ξ α d  dξ α  d ∂ξ α dxµ
 
= = = 0. (6.1.2)
dτ 2 dτ dτ dτ ∂xµ dτ
α
∂ξ α
Note que o fator ∂x µ faz exatamente o mesmo papel da matriz de transformação de Lorentz Λ µ
0
entre um referencial S e S visto anteriormente. No entanto aqui não conhecemos a forma da
transformação, já que ela pode ser qualquer transformação. A derivada em relação ao tempo
próprio vai agir nos dois termos:
d  ∂ξ α dxµ  d  ∂ξ α  dxµ ∂ξ α d  dxµ 
= + µ
dτ ∂xµ dτ dτ ∂xµ dτ ∂x dτ dτ
∂  ∂ξ α  dxν dxµ ∂ξ α d2 xµ
= + µ
∂xν ∂xµ dτ dτ ∂x dτ 2
∂ 2 ξ α dxν dxµ ∂ξ α d2 xµ
= + µ = 0. (6.1.3)
∂xν ∂xµ dτ dτ ∂x dτ 2
∂xλ
Multiplicando pela transformação inversa ∂ξ α
:

∂xλ ∂ 2 ξ α dxν dxµ ∂xλ ∂ξ α d2 xµ


+ α µ = 0. (6.1.4)
∂ξ α ∂xν ∂xµ dτ dτ ∂ξ ∂x dτ 2

e usando a propriedade já conhecida (veja Exercı́cio 4 da Lista 2, para o caso particular das
TL):

∂xλ ∂ξ α
= δµλ
∂ξ α ∂xµ
obtemos:

d 2 xλ ∂ 2 ξ α ∂xλ dxµ dxν


+ =0 (6.1.5)
dτ 2 ∂xµ ∂xν ∂ξ α dτ dτ
que generaliza a Eq. (6.1.1) para o caso de um sistema de coordenadas generalizadas xµ .

Exercı́cio: Faça xµ = ξ µ na equação (6.1.5) e mostre que ela se reduz a (6.1.1).

42
6.2 Conexão Afim e o tensor métrico
A equação (6.1.5) é a generalização da 2a. lei de Newton para o espaço-tempo 4-dimensional
∂ξ α
para um sistema de coordenadas arbitrário xµ que se relaciona a ξ µ por meio de ∂x µ (ou sua

inversa). Essa equação pode ser escrita de forma mais simplificada se introduzirmos o objeto
conhecido como Conexão Afim ou sı́mbolo de Christofell:

λ ∂ 2 ξ α ∂xλ ∂  ∂ξ α  ∂xλ
Γµν ≡ = (6.2.1)
∂xµ ∂xν ∂ξ α ∂xµ ∂xν ∂ξ α
de tal forma que:
d2 x λ µ
λ dx dx
ν
+ Γ µν = 0. (6.2.2)
dτ 2 dτ dτ
Esta é a equação de movimento da partı́cula em um referencial generalizado xµ . É evidente
que a Eq. (6.1.1) é recuperada se Γλµν = 0, o que equivale a xµ → ξ µ . Lembre-se que ξ µ
representa o referencial particular onde não há aceleração. Note também que Γλµν é um objeto
de 64 componentes, no caso mais geral.
A equação de movimento (6.2.2) está escrita em função de dois sistemas de coordenadas, xµ e
µ
ξ , que estão presentes na Conexão Afim. Apenas se conhecêssemos qual é a transformação entre
ξ µ e xµ poderı́amos calcular todas as componentes da Conexão Afim e eventualmente resolver
a equação diferencial (6.2.2). No entanto nem sempre é simples obter a relação entre xµ e ξ µ .
É mais útil reescrever essa quantidade de forma independente de um sistema de coordenadas.
Para isso precisamos de um outro objeto que carregue a informação da transformação entre os
sistemas de coordenadas, e isso pode ser feito através do tensor métrico.
Na relatividade restrita o tensor métrico é o de Minkowski, ηµν , mas na relatividade geral,
onde as TL não são mais válidas (devido à possibilidade de aceleração entre os referenciais)
esperamos que exista um tensor métrico mais geral (válido em xµ ), que vamos chamar de gµν .

Para encontrarmos o novo tensor métrico generalizado gµν , a relação entre ηµν e gµν pode
ser obtida através do invariante ds2 , que pode ser escrito de duas maneiras:

ds2 = ηαβ dξ α dξ β = gµν dxµ dxν , (6.2.3)

ou:
∂ξ α µ ∂ξ β ν ∂ξ α ∂ξ β µ ν
ds2 = ηαβ dx dx = η αβ dx dx ,
∂xµ ∂xν ∂xµ ∂xν
onde usamos (5.3.1) para escrever dξ α e dξ β . Comparando com a Eq. (6.2.3), o tensor métrico
gµν é definido por:
∂ξ α ∂ξ β
gµν ≡ ηαβ . (6.2.4)
∂xµ ∂xν

Da mesma forma que na relatividade restrita temos uma relação entre o tensor métrico η µν
e as TL (dadas pela Eq. (5.4.2)), encontramos aqui uma relação entre o tensor métrico geral
∂ξ α
gµν e as transformações gerais ∂x µ . Esta, por sua vez, define a Conexão Afim através de (6.2.1).

Vemos, portanto, que tanto a Conexão Afim quanto o tensor métrico generalizado podem ser
∂ξ α
escritos em termos das transformações entre os sistemas de coordenadas ∂x µ. Desta forma
deve existir uma relação direta entre gµν e Γλµν , sem a necessidade de precisarmos conhecer
∂ξ α
explicitamente ∂x µ.

Para obter essa relação, vamos fazer a derivada do tensor métrico (6.2.4) em relação a xλ :

∂gµν ∂ 2 ξ α ∂ξ β ∂ξ α ∂ 2 ξ β
= η αβ + ηαβ
∂xλ ∂xλ ∂xµ ∂xν ∂xµ ∂xλ ∂xν
43
∂ 2 ξα α
∂ξ
e usamos a relação ∂xµ ∂xν
= Γκµν ∂x κ (veja exercı́cio abaixo):

α β β α
∂gµν κ ∂ξ ∂ξ κ ∂ξ ∂ξ
= Γλµ ηαβ + Γ λν ηαβ .
∂xλ ∂xκ ∂xν ∂xκ ∂xµ
Agora usamos a definição (6.2.4), obtendo:
∂gµν
= Γκλµ gκν + Γκλν gκµ .
∂xλ
Esta expressão já relaciona a métrica gµν com a Conexão Afim Γλµν , mas ainda podemos melhorar
essa relação, isolando Conexão Afim dessa expressão.

Para fazer isso vamos adicionar à equação acima a mesma equação com µ e λ trocados e
subtrair a mesma equação com ν e λ trocados:
∂gµν ∂gλν ∂gµλ
λ
+ µ
− = gκν Γκλµ + gκµ Γκλν + gκν Γκµλ + gκλ Γκµν − gκλ Γκνµ − gκµ Γκνλ .
∂x ∂x ∂xν
Esta expressão se simplifica se olharmos para a definição de Γλµν em (6.2.1) e verificarmos que a
Conexão Afim é simétrica pela troca dos ı́ndices covariantes, ou seja Γλµν = Γλνµ , de forma que
obtemos:
∂gµν ∂gλν ∂gµλ
λ
+ µ
− ν
= 2gκν Γκλµ
∂x ∂x ∂x
Para finalizar, supomos a existência de uma matriz g νσ como a inversa de gνσ (veja (5.1.5)
para o análogo na métrica de Minkowski):

g νσ gκν = δκσ , (6.2.5)


e multiplicando acima por g νσ obtemos finalmente:
 
σ 1 νσ ∂gµν ∂gλν ∂gµλ
Γλµ = g + − . (6.2.6)
2 ∂xλ ∂xµ ∂xν
A primeira consequência importante dessa definição da Conexão Afim em termos do tensor
métrico é que recuperamos o caso particular Γλµν = 0 se fizermos gµν → ηµν , e a equação (6.2.2) se
torna (6.1.1), como esperado. Por fim, note que agora não precisamos conhecer a transformação
∂ξ α µν
geral de coordenadas ∂x µ , basta conhecer a métrica g especı́fica para determinado sistema
fı́sico e a Conexão Afim fica completamente determinada.
∂ 2 ξα ∂ξα
Exercı́cio: Partindo da equação (6.2.1) obtenha a relação ∂xµ ∂xν
= Γλµν ∂x λ.

Exercı́cio: Escreva o inverso do tensor métrico como:


∂xν ∂xσ
g νσ ≡ g σν ≡ η αβ (6.2.7)
∂ξ α ∂ξ β

use (6.2.4) e mostre que:

g νσ gκν = δκσ .

44
6.3 Limite Newtoniano
Antes de prosseguirmos é útil estudarmos com um pouco mais de detalhes as principais
equações obtidas até agora, quais sejam, a equação de movimento de uma partı́cula em um
sistema de coordenadas geral:
d2 x λ µ
λ dx dx
ν
+ Γ µν = 0, (6.3.1)
dτ 2 dτ dτ
e a relação entre a Conexão Afim e o tensor métrico:
 
σ 1 νσ ∂gµν ∂gλν ∂gµλ
Γλµ = g + − . (6.3.2)
2 ∂xλ ∂xµ ∂xν

Olhando com atenção, vemos que tudo se baseia em se obter uma métrica gµν apropriada para o
problema. Para termos uma ideia da generalidade (e da complexidade) desses resultados, vamos
estudar como obter o limite Newtoniano da lei da gravitação, velha conhecida nossa. Dito de
outra forma, queremos obter qual é a métrica gµν que leva corretamente ao limite Newtoniano
que conhecemos.
Em primeiro lugar vamos considerar o limite quase estacionário, ou de baixas velocidades,
i 0
tal que dxdτ
<< dx

, onde i = 1, 2, 3 corresponde às coordenadas espaciais. A desigualdade pode
dxi dt 0 dt i
ser escrita como dt dτ << dx dt dτ
→ dx
dt
<< d(ct)
dt
→ v i << c.
dxµ dxµ dt
Isso pode ser melhor entendido se lembrarmos da relatividade restrita, onde dτ
= dt dτ
=
dxµ d
 
γ dt = γ dt ct, x, y, z = γ c, vx , vy , vz , e para baixas velocidades, |~v | << c, temos γ → 1 e
dxµ µ

∼ dxdt = (c, vx , vy , vz ).

dt
Pergunta: Por quê não podemos fazer dτ
= γ, como na relatividade restrita?

Desta forma, a Eq. (6.3.1) fica:

d2 xλ 0
λ dx dx
0 i
λ dx dx
j 0
λ dx dx
j
+ Γ 00 + Γ ij + 2Γ 0j =0
dτ 2 dτ dτ dτ dτ dτ dτ
que pode ser escrita aproximadamente como:

d2 xλ 0
λ dx dx
0
+ Γ 00 '0
dτ 2 dτ dτ
que por sua vez se simplifica para:
 2
d2 xλ 2 λ dt
2
+ c Γ00 ' 0. (6.3.3)
dτ dτ

A Eq. (6.3.3) é o equivalente da 2a lei de Newton escrita para baixas velocidades, na


relatividade geral. Precisamos encontrar Γλ00 . Usando (6.3.2) temos:
 
λ 1 νλ ∂g0ν ∂g0ν ∂g00
Γ00 = g + − (6.3.4)
2 ∂x0 ∂x0 ∂xν

Agora usamos a aproximação de que a métrica é estacionária (não depende do tempo), tal que

g = 1c ∂t
∂x0 αβ

gαβ ≈ 0, portanto:
1 ∂g00
Γλ00 = − g νλ ν . (6.3.5)
2 ∂x
Sabemos que o limite Newtoniano deve corresponder muito aproximadamente ao espaço plano
da relatividade restrita, onde a métrica deve ser a de Minkowski, ηµν .

45
Pergunta: Por quê é importante destacar que a correspondência é apenas aproximada?

Será mais útil introduzirmos a métrica de Minkowski ηµν em coordenadas esféricas xµ =


(ct, r, θ, φ). Ela é dada por:
 
1 0 0 0
0 −1 0 0 
ηµν = 
0 0 −r2
, (6.3.6)
0 
0 0 0 −r2 sin2 θ
Em coordenadas esféricas o elemento invariante ds2 = ηµν dxµ dxν é dado por ds2 = c2 dt2 +
dr2 + r2 dθ2 + r2 sin2 θdφ2 . Exceto pelo termo proporcional ao tempo, os termos restantes são
exatamente aqueles de um deslocamento infinitesimal em coordenadas esféricas.

Exercı́cio: Obtenha a métrica contravariante η µν tal que a relação η βδ ηαδ = δαβ seja satis-
feita.

Para termos alguma informação sobre a métrica mais geral, como um pequeno desvio da
métrica de Minkowski ηµν , fazemos uma expansão de gµν no limite chamado de campo fraco:
gµν = ηµν + hµν , tal que |hµν | << |ηµν |, (6.3.7)
onde vamos escrever
 
h00 h01 h02 h03
h10 h11 h12 h13 
hµν =
h20

h21 h22 h23 
h30 h31 h32 h33
Escrita na forma de uma expansão, vemos que nosso desconhecimento sobre a métrica que
procuramos está em hµν .

Substituindo ηµν e hµν em (6.3.7) e depois em (6.3.5) e nos restringindo apenas a termos
lineares em hµν :
   
λ 1 νλ νλ ∂
Γ00 = − η + h η00 + h00
2 ∂xν
1 ∂
' − η νλ ν h00 + . . . (6.3.8)
2 ∂x
e voltando à Eq. (6.3.3) obtemos:
 2
d2 xλ c2 νλ ∂h00 dt
− η ' 0. (6.3.9)
dτ 2 2 ∂xν dτ
Agora vamos analisar cada componente desta equação:

Componente 0:

 2
d 2 x0 c2 ν0 ∂h00 dt
' η
dτ 2 2 ∂xν dτ
" # 
2 2
c 00 ∂h00 i0 ∂h00 dt
' η +η ' 0, (6.3.10)
2 ∂x0 ∂xi dτ

46
pois a métrica foi assumida estacionária e os termos η i0 = 0. Note a soma em i = 1, 2, 3 no
segundo termo. Esta equação, portanto, nos diz que:
d 2 x0 d2 t
= c '0
dτ 2 dτ 2
dt
ou simplesmente que dτ
= constante (lembre-se da relatividade restrita!)

Componentes i = 1, 2, 3:

 2
d2 xi c2 νi ∂h00 dt
' η
dτ 2 2 ∂xν dτ
" # 
2
c2 0i ∂h00 ji ∂h 00 dt
' η + η . (6.3.11)
2 ∂x0 ∂xj dτ

O primeiro termo do lado direito é nulo. Note a soma em j = 1, 2, 3 no segundo termo, e o


fato de que η ij = −1 se i = j e zero se i 6= j. O lado esquerdo pode ser simplificado usando
dxi i dt 2 i 2 i dt 2

= dx
dt dτ
, e portanto ddτx2 = ddtx2 dτ . A Eq. (6.3.11) se simplifica para:
" #
d 2 xi c2 1i ∂h00 2i ∂h00 3i ∂h00
= η +η +η , (6.3.12)
dt2 2 ∂x1 ∂x2 ∂x3

ou, vetorialmente:
d2~r c2 ~
= − ∇h00 , (6.3.13)
dt2 2
onde ~r é o vetor posição da partı́cula.
A expressão acima está muito próxima da lei de gravitação Newtoniana, escrita na forma:
d2~r ~
m = −∇U,
dt2
onde U é a energia potencial gravitacional,
GM m
U =−
r
e portanto
d2~r ~ GM
= − ∇Φ, Φ ≡ − (6.3.14)
dt2 r
onde Φ é o potencial escalar gravitacional.
Finalmente, comparando (6.3.14) com (6.3.13) identificamos h00 :
2GM
h00 = − , (6.3.15)
c2 r
e portanto obtemos a componente da métrica que reproduz o resultado Newtoniano:
2GM
g00 = η00 + h00 = 1 − , (6.3.16)
c2 r
ou, de forma completa (de acordo com a aproximação adotada):
1 − 2GM
 
c2 r
0 0 0
 0 −1 0 0 
gµν '  . (6.3.17)
 0 0 −r2 0 
2 2
0 0 0 −r sin θ

47
Esta é métrica da relatividade geral responsável por reproduzir os resultados da gravitacão
Newtoniana.
Apenas por curiosidade, a correção a esta métrica capaz de explicar o desvio do periélio de
Mercúrio vem do termo h11 da expansão da métrica, que será:

1 − 2GM
 
2
c r
0 0 0
 0 −1 − 2GM
c2 r
0 0 
gµν '  2
. (6.3.18)
 0 0 −r 0 
0 0 0 −r2 sin2 θ

GM
Exercı́cio: Analise a dimensão (em unidades do S.I. por exemplo) do termo c2 r
, e mostre
que é adimensional.

6.4 Métrica de Schwarzschild


As métricas acima são casos particulares da métrica mais geral com simetria esférica,
chamada métrica de Schwarzschild, que é a métrica que descreve problemas do movimento
de partı́culas em torno de uma massa central, e também é o ponto de partida para se estudar
buracos negros. A métrica de Schwarzschild é dada por:
 
1 − 2GM
c2 r
0 0 0
1
 0 − 1− 2GM 0 0 
gµν =  . (6.4.1)
 
c2 r
2
 0 0 −r 0 
0 0 0 −r2 sin2 θ

Esta métrica corresponde a um elemento invariante ds2 = gµν dxµ dxν dado por:
 
2 2GM 2 2 1
ds = 1 − 2 c dt − 2GM
dr2 − r2 dθ2 − r2 sin2 θdφ2 . (6.4.2)
cr 1 − c2 r

Exercı́cio: Obtenha a métrica contravariante de Schwarzschild g µν tal que a relação g βδ gαδ =


δαβ seja satisfeita.

Exercı́cio: Considere o limite 2GM


c2 r
<< 1 e mostre que a expansão da métrica de Schwarzschild
até primeira ordem é a métrica usada no cálculo do desvio do periélio de Mercúrio.

Tendo a métrica, o próximo passo é calcular todas as componentes não-nulas da Conexão


Afim (6.3.2). Para a métrica de Schwarzschild são 13 componentes não nulas.

Exercı́cio: Obtenha as 13 componentes não-nulas da Conexão Afim Γλµν . Use as coorde-


nadas xµ = (t, r, θ, φ), fazendo c = 1 por simplicidade. Mostre que:
GM
Γ001 = Γ010 =
r2
− 2GM r
GM (r − 2GM )
Γ100 =
r3
GM
Γ111 = − 2
r − 2GM r
Γ122 = −r + 2GM

48
Γ133 = (−r + 2GM ) sin2 (θ)
1
Γ212 = Γ221 =
r
2
Γ33 = − sin(θ) cos(θ)
1
Γ313 = Γ331 =
r
cos(θ)
Γ323 = Γ332 =
sin(θ)
Todas as outras componentes são nulas.

6.4.1 O desvio do periélio de Mercúrio


Agora que temos todas as componentes não-nulas da Conexão Afim para a métrica de
Schwarzschild, podemos obter quais são as equações que descrevem o movimento de uma
partı́cula em torno de uma massa central M . São estas equações que vão explicar correta-
mente o movimento de um planeta em torno do Sol por exemplo, e em particular as equações
que descrevem a precessão da órbita do planeta Mercúrio em torno do Sol. Para isso precisamos
obter as 4 equações (6.3.1). São elas:

Componente 0:
d 2 x0 µ
0 dx dx
ν
+ Γ µν = 0,
dτ 2 dτ dτ
que assume a seguinte forma, considerando as componentes não-nulas da Conexão Afim:
d2 x0 0
0 dx dx
1 1
0 dx dx
0
+ Γ 01 + Γ 10 = 0,
dτ 2 dτ dτ dτ dτ
e finalmente:
d2 t GM dt dr
+ 2 = 0, (6.4.3)
dτ 2 r(r − 2GM ) dτ dτ

Componente 1:
d 2 x1 µ
1 dx dx
ν
+ Γ µν = 0,
dτ 2 dτ dτ
d 2 x1 0
1 dx dx
0 1
1 dx dx
1 2
1 dx dx
2 3
1 dx dx
3
+ Γ00 + Γ11 + Γ22 + Γ33 = 0,
dτ 2 dτ dτ dτ dτ dτ dτ dτ dτ
" #
d2 r GM (r − 2GM )  dt 2 GM  dr 2  dθ 2
2
 dφ 2
+ − − (r − 2GM ) + sin (θ) = 0,
dτ 2 r3 dτ r(r − 2GM ) dτ dτ dτ
(6.4.4)

Componente 2:
d 2 x2 µ
2 dx dx
ν
+ Γ µν = 0,
dτ 2 dτ dτ
d 2 x2 1
2 dx dx
2 2
2 dx dx
1 3
2 dx dx
3
+ Γ 12 + Γ 21 + Γ 33 = 0,
dτ 2 dτ dτ dτ dτ dτ dτ
d2 θ 2 dr dθ  dφ 2
+ − sin(θ) cos(θ) = 0, (6.4.5)
dτ 2 r dτ dτ dτ

49
Componente 3:
d 2 x3 µ
3 dx dx
ν
+ Γ µν = 0,
dτ 2 dτ dτ
d 2 x3 1
3 dx dx
3
dx3 dx1 dx2 dx3 dx3 dx2
+ Γ 13 + Γ331 + Γ323 + Γ332 = 0,
dτ 2 dτ dτ dτ dτ dτ dτ dτ dτ
d2 φ 2 dr dφ cos(θ) dθ dφ
+ +2 = 0. (6.4.6)
dτ 2 r dτ dτ sin(θ) dτ dτ

A solução deste complicado sistema de equações diferenciais acopladas é que vai fornecer a
trajetória da partı́cula sob ação de uma massa central. Não é nosso objetivo resolver esse sistema
completamente, mas podemos avançar um pouco para entender como se dá a contribuição para
o desvio do periélio de Mercúrio.

Exercı́cio: Obtenha as Eqs. (6.4.3)-(6.4.6).

As Eqs. (6.4.3)-(6.4.6) podem ser simplificadas se considerarmos o movimento acontecendo


no plano caracterizado por θ = π/2 (em coordenadas esféricas). Desta forma a Eq. (6.4.5) se
anula e as demais ficam:
d2 t GM dt dr
+ 2 = 0, (6.4.7)
dτ 2 r(r − 2GM ) dτ dτ

d2 r GM (r − 2GM )  dt 2 GM  dr 2  dφ 2
+ − − (r − 2GM ) = 0, (6.4.8)
dτ 2 r3 dτ r(r − 2GM ) dτ dτ

d2 φ 2 dr dφ
+ = 0. (6.4.9)
dτ 2 r dτ dτ

A Eq. (6.4.7) possui uma primeira integral (em relação a dτ ) dada por:
 −1
dt 2GM
=k 1− , (6.4.10)
dτ r

onde k é uma constante de integração. Da mesma forma, a Eq. (6.4.9) possui uma primeira
integral (em relação a dτ ) dada por:
dφ h
= 2, (6.4.11)
dτ r
onde h é uma constante de integração.

Exercı́cio: Derive as equações (6.4.10) e (6.4.11) em relação a τ para obter (6.4.7) e (6.4.9).

A Eq. (6.4.8) não está num formato apropriado para fornecer uma solução para a parte
radial. É mais fácil usarmos a expressão para o elemento invariante ds2 dado por (6.4.2), e
difinir o intervalo de tempo próprio dτ 2 = ds2 /c2 (assim como foi feito na Seção 4.1.2). Desta
forma obtemos a relação:
  2  2  2
2GM dt 1 dr 2 dφ
1= 1− − −r . (6.4.12)
r dτ 1 − 2GM
r
dτ dτ

50
Substituindo (6.4.10), (6.4.11) e rearranjando os termos obtemos:
2
h2
  
dr 2GM 2GM
+ 2 1− − = k2 − 1 . (6.4.13)
dτ r r r

Exercı́cio: Obtenha (6.4.12) e (6.4.13).

Agora usamos a relação (6.4.11) para escrever a relação:

dr dr dφ h dr
= = 2 ,
dτ dφ dτ r dφ

substituimos de volta em (6.4.13) e fazemos a mudança de variáveis u = 1/r, obtendo:


2
k 2 − 1 2GM

du
+ u2 = + u + 2GM u3 .
dφ h2 h2

Finalmente, derivamos essa expressão em relação a φ para obtermos o resultado que querı́amos:

d2 u GM
2
+ u = 2 + 3GM u2 . (6.4.14)
dφ h
O último termo é o responsável por modificar a equação usual obtida por meio da mecânica
newtoniana, e será o responsável pela precessão da órbita do planeta. Este último termo é a
correção que se obtém na relatividade geral.

Exercı́cio: Obtenha (6.4.14).

51
CHAPTER 7
TENSORES NA RELATIVIDADE GERAL

Vamos iniciar este capı́tulo definindo as propriedades dos tensores na relatividade geral e
mostrar que a derivada usual não é um tensor, da mesma forma que a Conexão Afim não é
um tensor. De posse destas duas quantidades que não são tensores vamos construir a Derivada
Covariante, que é um tensor, sendo uma quantidade muito importante na construção de outros
tensores. Por fim vamos construir outros tensores importantes na relatividade geral.

7.1 Análise tensorial


Podemos dizer que existe uma analogia profunda entre a geometria não-euclideana e a
teoria da Gravitação. Uma linguagem comum a ambas é a análise tensorial, portanto fare-
mos novamente um esboço dessa linguagem para sistemas de coordenadas gerais nesta seção,
análogo ao que foi feito no Capı́tulo 5 para sistemas de coordenadas que se transformam pelas
transformações de Lorentz.

7.1.1 Regras de transformação


A regra de transformação para um vetor contravariante V µ , sob uma transformação de
coordenada xµ → x0µ (análogo da transformação do referencial S para S’ na relatividade restrita,
no entanto aqui estamos considerando uma transformação geral qualquer) é:

∂x0µ ν
V 0µ = V (7.1.1)
∂xν
Da mesma forma, para vetores covariantes Uµ temos uma regra de transformação intima-
mente relacionada, que sob uma transformação de coordenadas xµ → x0µ é:
∂xν
Uµ0 = Uν . (7.1.2)
∂x0µ
Note que as regras de transformação acima são exatamente análogas àquelas das trans-

formações dos tensores da relatividade restrita, agora com Λµν → ∂x
∂x ν para a transformação
ν ∂xν
entre os sistemas de coordenadas e Λµ → ∂x0µ para a transformação inversa.
Podemos, assim, generalizar para tensores de qualquer ordem e com qualquer número de
ı́ndices contravariantes e covariantes. Apenas como exemplo, por uma transformação de coor-
denadas xµ → x0µ um tensor Tν µλ (tensor de 3a ordem com 2 ı́ndices contravariantes e 1 ı́ndice
covariante) será transformado como:

52
∂xρ ∂x0µ ∂x0λ κσ
Tν0 µλ
= T . (7.1.3)
∂x0ν ∂xκ ∂xσ ρ
Cada ı́ndice se transforma de acordo com (7.1.1) ou (7.1.2).

7.1.2 Propriedades
Vejamos como ficam algumas propriedades, como combinação linear, produto direto e con-
tração.

1 - Combinação linear: Sejam Aµν e Bνµ tensores mistos. Definindo Tνµ ≡ aAµν + bBνµ , a e b
são escalares, então Tνµ é um tensor:

Tν0µ ≡ aA0µ 0µ
ν + bBν
e

∂x0µ ∂xσ ρ
A0µ
ν = A
∂xρ ∂x0ν σ
∂x0µ ∂xσ ρ
Bν0µ = B
∂xρ ∂x0ν σ
então

∂x0µ ∂xσ ρ ∂x0µ ∂xσ ρ


Tν0µ = a A + b B
∂xρ ∂x0ν σ ∂xρ ∂x0ν σ
ou

∂x0µ ∂xσ ∂x0µ ∂xσ ρ


Tν0µ = (aAρ
σ + bBσ
ρ
) = T . (7.1.4)
∂xρ ∂x0ν ∂xρ ∂x0ν σ

2 - Produto direto: Sejam Aµν e B ρ tensores, então T µν ρ ≡ Aµν B ρ é um tensor:

T 0µν ρ ≡ A0µν B 0ρ
e

∂x0µ ∂xκ λ
A0µν = A
∂xλ ∂x0ν κ
∂x0ρ σ
B 0ρ = B
∂xσ
então

∂x0µ ∂xκ λ ∂x0ρ σ ∂x0µ ∂xκ ∂x0ρ λ σ ∂x0µ ∂xκ ∂x0ρ λ σ


T 0µν ρ = A B = A B = T . (7.1.5)
∂xλ ∂x0ν κ ∂xσ ∂xλ ∂x0ν ∂xσ κ ∂xλ ∂x0ν ∂xσ κ

3 - Contração: A contração (ou soma) de um ı́ndice superior e um inferior iguais produz um


novo tensor com estes dois ı́ndices ausentes. Se T µαρν é um tensor, e T µρ ≡ gαν T µαρν = T µνρν
então T µρ é um tensor:

T 0µρ = T 0µν ρν

∂x0µ ∂xλ ∂x0ρ ∂x0ν κ ητ ∂x0µ ∂x0ρ λ κ ητ ∂x0µ ∂x0ρ κ ηλ


T 0µρ = T = δ T = T . (7.1.6)
∂xκ ∂x0ν ∂xη ∂xτ λ ∂xκ ∂xη τ λ ∂xκ ∂xη λ
53
7.1.3 Derivada usual não é um tensor
Veremos agora que a derivada usual, ∂x∂ ν , não é um tensor, ou seja, não se transforma como
um tensor.
Vimos em (7.1.1) que um 4-vetor V µ se transforma corretamente como um tensor para um
sistema de coordenadas S 0 :
0µ ∂x0µ ν
V = V ,
∂xν
no entanto a derivada deste 4-vetor não se transforma como um tensor:
∂V 0µ
 0µ 
∂ ∂x

= 0λ

∂x ∂x ∂xν
 0µ 
∂x0µ ∂V ν
 
∂ ∂x ν
= V +
∂x0λ ∂xν ∂xν ∂x0λ
 0µ  ρ
∂x ν ∂x0µ ∂V ν ∂xρ
 
∂ ∂x
= V +
∂xρ ∂xν ∂x0λ ∂xν ∂xρ ∂x0λ
∂ 2 x0µ ∂xρ ν ∂x0µ ∂xρ ∂V ν
= V + (7.1.7)
∂xν ∂xρ ∂x0λ ∂xν ∂x0λ ∂xρ
devido à presença do primeiro termo do lado direito. Note que o segundo termo se trans-
forma corretamente como um tensor. E note também que, se a tranformação for linear, como
ocorre nas transformações de Lorentz, o primeiro termo do lado direito é nulo, e recuperamos
a transformação (5.3.3) quando aplicada a V 0µ .

Exercı́cio: Aplique a derivada (5.3.3) a um 4-vetor V 0µ da relatividade restrita e mostre


que é equivalente ao segundo termo de (7.1.7).

7.1.4 Conexão Afim não é um tensor


A seguir vamos verificar como a Conexão Afim se transforma, e veremos que esse objeto
também não é um tensor. Da definição (6.2.1), Γλµν é dado por:

∂xλ ∂ 2 ξ α
Γλµν = , (7.1.8)
∂ξ α ∂xµ ∂xν
onde ξ α (x) é um sistema de coordenadas inercial local. Se a Conexão Afim fosse um tensor por
uma transformação xµ → x0µ , terı́amos cada ı́ndice se transformando da forma correspondente,
o que significaria dizer que:
∂x0λ ∂xτ ∂xσ ρ
Γ0λ
µν = Γ . (7.1.9)
∂xρ ∂x0µ ∂x0ν τ σ
Para mostrar que isso não é satisfeito, vamos inicialmente supor que a definição de Γλµν
possui o mesmo formato no referencial transformado:

∂x0λ ∂ 2 ξ α
Γ0λ
µν = .
∂ξ α ∂x0µ ∂x0ν

54
Manipulando adequadamente esta expressão:

∂x0λ ∂xρ ∂
 α σ
0λ ∂ξ ∂x
Γµν = 0µ
ρ α
∂x ∂ξ ∂x ∂xσ ∂x0ν
"  σ #
∂x0λ ∂xρ ∂
 α σ
∂ξ ∂x ∂ξ α ∂ ∂x
= 0µ 0ν
+ σ 0µ
ρ α
∂x ∂ξ ∂x ∂x σ ∂x ∂x ∂x ∂x0ν
∂x0λ ∂xρ
 2 α
∂ ξ ∂xτ ∂xσ ∂ξ α ∂ 2 xσ

= +
∂xρ ∂ξ α ∂xτ ∂xσ ∂x0µ ∂x0ν ∂xσ ∂x0µ ∂x0ν
∂x0λ ∂xρ ∂xτ ∂xσ ∂ 2 ξ α ∂x0λ ∂xρ ∂ξ α ∂ 2 xσ
= +
∂xρ ∂ξ α ∂x0µ ∂x0ν ∂xτ ∂xσ ∂xρ ∂ξ α ∂xσ ∂x0µ ∂x0ν
∂x0λ ∂xτ ∂xσ ∂xρ ∂ 2 ξ α ∂x0λ ρ ∂ 2 xσ
= + δ
∂xρ ∂x0µ ∂x0ν ∂ξ α ∂xτ ∂xσ ∂xρ σ ∂x0µ ∂x0ν
∂x0λ ∂xτ ∂xσ ρ ∂x0λ ∂ 2 xρ
= Γ + . (7.1.10)
∂xρ ∂x0µ ∂x0ν τ σ ∂xρ ∂x0µ ∂x0ν
O primeiro termo à direita é o esperado (veja 7.1.9) se Γλµν fosse um tensor, mas a presença do
segundo termo nos indica que a Conexão Afim não se transforma como um tensor, portanto
não é um tensor.
O segundo termo da expressão acima ainda pode ser manipulado, e isso será feito na forma
do exercı́cio a seguir. Usando o resultado do exercı́cio temos:

∂x0λ ∂xτ ∂xσ ρ ∂ 2 x0λ ∂xσ ∂xδ


Γ0λ
µν = Γ − . (7.1.11)
∂xρ ∂x0µ ∂x0ν τ σ ∂xδ ∂xσ ∂x0ν ∂x0µ
Esta é a expressão para a Conexão Afim que usaremos quando precisar.

Exercı́cio: Use a definição da função delta:

∂xρ ∂x0λ
δσρ =
∂x0λ ∂xσ
e o fato de que sua derivada deve ser nula:
∂δσρ
=0
∂x0µ
e mostre que
∂x0λ ∂ 2 xρ ∂xσ ∂xδ ∂ 2 x0λ
= − .
∂xρ ∂x0µ ∂x0ν ∂x0ν ∂x0µ ∂xδ ∂xσ

7.1.5 Derivada covariante


Agora vamos definir um tipo de derivada que se transforma corretamente como tensor. É a
chamada Derivada Covariante. Para isso, note que o segundo termo do lado direito de (7.1.11)
pode ser reescrito:

∂ 2 x0λ ∂xσ ∂x0µ 0λ ∂x0µ ∂x0λ ∂xτ ∂xσ ρ


− = Γ − Γ
∂xδ ∂xσ ∂x0ν ∂xδ µν ∂xδ ∂xρ ∂x0µ ∂x0ν τ σ
∂x0µ 0λ 0λ
τ ∂x ∂x
σ
= δ
Γµν − δ δ ρ 0ν
Γρτσ
∂x ∂x ∂x
∂x0µ 0λ ∂x0λ ∂xσ ρ
= Γ − Γ .
∂xδ µν ∂xρ ∂x0ν δσ
55
Agora multimplicamos a expressão acima por -1, rearranjamos apropriadamente os ı́ndices
(λ → µ, δ → ν, ν → λ e notando que os outros ı́ndices são somados) e multiplicamos dos dois
lados por V ν , obtemos:

∂ 2 x0µ ∂xρ ν ∂x0δ 0µ ν ∂x0µ ∂xσ ρ ν


V = − Γ V + Γ V
∂xν ∂xρ ∂x0λ ∂xν δλ ∂xρ ∂x0λ νσ

0µ ∂x ν ∂x0µ ∂xσ ρ ν
= −Γδλ ν V + Γ V
∂x ∂xρ ∂x0λ νσ
∂x0µ ∂xσ ρ ν
= −Γ0µ V 0δ
+ Γ V .
δλ
∂xρ ∂x0λ νσ
Agora substituı́mos essa expressão na transformação da derivada usual, primeiro termo de
(7.1.7):
∂V 0µ 0µ 0δ ∂x0µ ∂xσ ρ ν ∂x0µ ∂xρ ∂V ν
= −Γδλ V + Γ V +
∂x0λ ∂xρ ∂x0λ νσ ∂xν ∂x0λ ∂xρ
e reagrupando do lado esquerdo os termos no referencial S 0 e do lado direito os termos no
referencial S, obtemos:
∂V 0µ 0µ 0δ ∂x0µ ∂xσ ρ ν ∂x0µ ∂xρ ∂V ν
+ Γ V = Γ V + .
∂x0λ δλ
∂xρ ∂x0λ νσ ∂xν ∂x0λ ∂xρ
Agora note que os ı́ndices ν, ρ e σ no primeiro termo do lado direito são ı́ndices mudos (soma-
dos), e portanto podem ser trocados apropriadamente:
∂V 0µ 0µ 0δ ∂x0µ ∂xρ ∂V ν ∂x0µ ∂xρ ν δ
+ Γ V = + Γ V ,
∂x0λ δλ
∂xν ∂x0λ ∂xρ ∂xν ∂x0λ δρ
e obtemos finalmente:
∂V 0µ ∂x0µ ∂xρ ∂V ν
 
0µ 0δ ν δ
+ Γδλ V = + Γδρ V . (7.1.12)
∂x0λ ∂xν ∂x0λ ∂xρ
Note que o termo entre parênteses do lado direito é um objeto no referencial S e tem exata-
mente a mesma forma que o mesmo objeto do lado esquerdo, sendo este no referencial S 0 . A
transformação agora é exatamente aquela esperada para um tensor. Este objeto é chamado de
Derivada Covariante, que é formalmente definida por:

∇µ ≡ + Γαµσ = ∂µ + Γαµσ , (7.1.13)
∂xµ
onde utilizaremos daqui por diante a notação mais compacta para derivadas ∂µ ≡ ∂x∂ µ . Eu disse
formalmente, pois claramente os ı́ndices precisam ser aplicados corretamente. Por exemplo,
quando agindo em um vetor V α , temos:
∂V α
∇µ V α ≡ + Γασµ V σ = ∂µ V α + Γασµ V σ . (7.1.14)
∂xµ
Vamos recapitular rapidamente o que foi feito. Em (7.1.7) verificamos que a derivada usual
não se transforma corretamente como um tensor, e o primeiro termo é o responsável por isso.
No entanto este termo foi reescrito em termos da Conexão Afim, e em (7.1.12) obtivemos uma
nova forma de derivada que se transforma corretamente como um tensor. O termo adicional,
proporcional à Conexão Afim, leva em conta uma possı́vel curvatura do espaço-tempo. Dito de
outra forma, quando você faz uma derivada no espaço-tempo plano, onde a curvatura é nula,
basta o primeiro termo, ∂x∂ µ , para realizar a derivação corretamente. Já num espaço-tempo que

56
apresente alguma curvatura, a derivada precisa ser corrigida naquele ponto do espaço-tempo,
para levar em conta essa curvatura, e isso é feito através do segundo termo, contendo a Conexão
Afim.
Da mesma forma, quando agindo em um tensor de segunda ordem com ı́ndices contravari-
antes, devemos ter um termo de Conexão Afim para cada ı́ndice, ou seja:

∇µ T αβ ≡ ∂µ T αβ + Γασµ T σβ + Γβσµ T ασ . (7.1.15)

A derivada covariante de uma função escalar qualquer é simplesmente a derivada usual, já
que não existe ı́ndice tensorial na função escalar para a conexão se acoplar:

∇ µ φ ≡ ∂µ φ . (7.1.16)

Também podemos fazer a mesma construção para definir a derivada covariante de um tensor
covariante. Deixamos como exercı́cio.

Exercı́cio: Mostre que a derivada covariante de um 4-vetor covariante Uα é dado por:

∇µ Uα ≡ ∂µ Uα − Γσµα Uσ . (7.1.17)

Da mesma forma, quando agindo em um tensor de segunda ordem com ı́ndices covariantes,
devemos ter um termo de Conexão Afim para cada ı́ndice, ou seja:

∇µ Tαβ ≡ ∂µ Tαβ − Γσαµ Tσβ − Γσβµ Tασ . (7.1.18)

7.1.6 Transformação do tensor métrico


Por fim, vamos verificar que o tensor métrico gµν para um sistema de coordenadas geral xµ
se transforma como um tensor. Usando a sua definição:

∂ξ α ∂ξ β
gµν ≡ ηαβ , (7.1.19)
∂xµ ∂xν
tal que em um sistema de coordenadas diferente o tensor métrico é

0 ∂ξ α ∂ξ β ∂ξ α ∂xρ ∂ξ β ∂xσ
gµν = ηαβ = ηαβ , (7.1.20)
∂x0µ ∂x0ν ∂xρ ∂x0µ ∂xσ ∂x0ν
então

0 ∂xρ ∂xσ
gµν = gρσ , (7.1.21)
∂x0µ ∂x0ν
e vemos que gµν é de fato um tensor covariante. Seu inverso é um tensor contravariante. Se
definirmos g λµ , então:

g λµ gµν = δνλ . (7.1.22)


Podemos verificar também que g 0λµ gµν
0
= δνλ

∂x0λ ∂x0µ ρσ 0 ∂x0λ ∂x0µ ρσ ∂xκ ∂xη ∂x0λ ρσ κ ∂xη ∂x0λ ∂xρ
g gµν = g gκη = g δσ gκη = = δνλ .
∂xρ ∂xσ ∂xρ ∂xσ ∂x0µ ∂x0ν ∂xρ ∂x0ν ∂xρ ∂x0ν
Finalmente, podemos mostrar que o sı́mbolo de Kronecker δνµ é um tensor misto:

57
∂x0ρ ∂xν ∂x0ρ ∂xµ
δνµ = = δσρ . (7.1.23)
∂xµ ∂x0σ ∂xµ ∂x0σ
Além dos escalares e o zero, o δνµ (junto com seus produtos diretos) é o único tensor na
relatividade geral cujas componentes são as mesmas em todos os sistemas de coordenadas.

Exercı́cio: Mostre que a derivada covariante do tensor métrico é nulo:

∇µ gαβ = 0 . (7.1.24)

7.2 Tensor de Riemann


Agora vamos usar a derivada covariante para se construir o objeto fundamental da geometria
σ
Riemaniana, a saber, o tensor de Riemann Rµνκ , definido por meio da diferença na aplicação
de duas derivadas covariantes em um objeto qualquer, como um 4-vetor Uµ por exemplo:
σ
(∇κ ∇ν − ∇ν ∇κ )Uµ = Rµνκ Uσ . (7.2.1)

Desenvolvendo o lado esquerdo usando (7.1.17) e (7.1.18) obtém-se a forma explı́cita do tensor
de curvatura de Riemann:
σ
Rµνκ ≡ ∂ν Γσµκ − ∂κ Γσµν + Γηµκ Γσνη − Γηµν Γσκη . (7.2.2)

Exercı́cio: Desenvolva o lado esquerdo de (7.2.1) usando (7.1.17) e (7.1.18) e obtenha a


forma explı́cita do tensor de curvatura de Riemann (7.2.2).

Uma maneira intuitiva de se entender a definição do tensor de curvatura de Riemann dada


por (7.2.1) é uma analogia com o espaço plano. Imagine o plano x-y usual. Fazer a derivada de
uma função vetorial ~v (x, y) primeiro em relação a y e depois em relação a x, e depois subtrair
da derivada em x e depois em y, espera-se que seja nula essa operação no espaço plano usual:
   
∂ ∂ ∂ ∂
~v (x, y) − ~v (x, y) = 0
∂y ∂x ∂x ∂y

já que as derivadas comutam e não importa em qual ordem elas são realizadas. De fato, isso é
verdade para o espaço plano. No caso do espaço conter alguma curvatura, a ordem com que as
derivadas são realizadas pode mudar o seu resultado, e isso deve ocorrer em um espaço curvo.
Desta forma, o tensor de Riemann mede de fato se existe alguma curvatura no espaço-tempo
naquele ponto onde se deseja realizar a diferenciação.

Antes de prosseguirmos, vale a pena escrever o tensor de Riemann em termos da métrica,


para termos uma visão melhor da sua complexidade e riqueza de informação:

" #
1 ∂ 2 gσν ∂ 2 gµν ∂ 2 gσκ ∂ 2 gµκ
 
η α η α
Rσµνκ = − − + + gησ Γνα Γµκ − Γκα Γµν (7.2.3)
2 ∂xκ ∂xµ ∂xκ ∂xσ ∂xν ∂xµ ∂xν ∂xσ

onde !
1 ∂gµν ∂gλν ∂gµλ
Γσλµ = g νσ λ
+ µ
− (7.2.4)
2 ∂x ∂x ∂xν

58
No caso de uma métrica geral, o tensor de Riemann é um objeto com 256 componentes,
escritas em termos de derivadas de primeira e segunda ordem da métrica. É ele que de fato diz se
um espaço possui curvatura ou não. Mesmo que as componentes da Conexão Afim não se anulem
em alguns casos, é o tensor de Riemann que vai dizer se o espaço-tempo em questão possui
curvatura ou não. Isso acontece com a métrica de Minkowski escrita em coordenadas esféricas,
onde algumas componentes da Conexão Afim são diferentes de zero, mas isso não significa que
o espaço seja curvo, pois o tensor de Riemann neste caso possui todas as componentes nulas.

Exercı́cio: Escolha aleatoriamente algumas componentes do tensor de Riemann e verifique


que são todas nulas para o caso da métrica de Minkowski em coordenadas esféricas.

7.2.1 Propriedades
O tensor de Riemann possui algumas propriedades importantes, que são melhores descritas
α
em termos do tensor com todos os ı́ndices covariantes, Rσµνκ = gσα Rµνκ :

Simetria
É simétrico na troca dos dois primeiros pelos dois últimos ı́ndices:

Rσµνκ = Rνκσµ (7.2.5)

Anti-simetria
É anti-simétrico na troca de dois ı́ndices consecutivos (dois primeiros e dois últimos):

Rσµνκ = −Rµσνκ = −Rσµκν (7.2.6)

Ciclicidade
Mantendo o primeiro ı́ndice fixo, vale a relação de ciclicidade entre os outros ı́ndices:

Rσµνκ + Rσκµν + Rσνκµ = 0 (7.2.7)

7.3 Tensor e Escalar de Ricci


A contração do primeiro e terceiro ı́ncides do tensor de Riemann leva a outro tensor impor-
tante, o tensor de Ricci:

Rµκ ≡ Rν µνκ = g σν Rσµνκ . (7.3.1)


Contraindo novamente os ı́ndices restantes, obtemos o escalar de Ricci:

R ≡ Rκκ = g µκ Rµκ . (7.3.2)


O tensor e o escalar de Ricci são quantidades fundamentais na construção da equação de
Einstein, a seguir.

59
7.4 A equação de Einstein
Vimos no capı́tulo anterior que, dada uma métrica gµν , temos toda a informação sobre
nosso sistema, e a princı́pio somos capazes de determinar e resolver a equação de movimento
de uma partı́cula nesse campo gravitacional. Estamos associando um campo gravitacional a
uma métrica dada, sendo a lei de gravitação de Newton apenas um exemplo para o caso de
uma métrica em torno de um objeto esférico de massa M , como acontece com os planetas e
o Sol por exemplo. No entanto a obtenção da métrica que reproduz o limite Newtoniano foi
obtida por comparação com o que já conhecemos da lei de Newton, ou seja, determinamos a
componente h00 da métrica comparando-a com a teoria que já conhecemos. A métrica que
reproduz a lei da gravitação de Newton é apenas uma entre muitas outras métricas possı́veis
na relatividade geral, e a pergunta que nos fazemos agora é: Como obter uma equação que
determine corretamente uma métrica, dadas algumas suposições fı́sicas a serem satisfeitas pelo
sistema?
Para obter a resposta a essa pergunta podemos nos guiar pelo que já conhecemos da
mecânica clássica. A equação de movimento de uma partı́cula na mecânica clássica é rep-
resentada pela 2a lei de Newton, cuja correspondente na relatividade é a Eq. (6.2.2) para um
sistema de coordenadas generalizado. Na mecânica clássica sabemos que a 2a lei de Newton é
obtida através de uma função Lagrangeana por meio da equação de Euler-Lagrange, que por
sua vez se é obtida pelo princı́pio variacionalRde uma quantidade chamada Ação, definica como
a integral no tempo da Lagrangeana, S ≡ Ldt, procedimento conhecido como princı́pio de
mı́nima ação.
Gostarı́amos de determinar uma quantidade equivalente à ação na mecânica clássica, de
onde pudéssemos derivar uma equação que nos fornecesse as possı́veis métricas da relatividade
geral, dadas algumas propriedades fı́sicas satisfeitas pelo sistema. Esta é a chamada Equação
de Einstein, e veremos agora como construı́-la. Em primeiro lugar queremos que seja uma
equação tensorial, desta forma garantimos a invariância de sua forma independente do sistema
de coordenadas. É o chamado princı́pio de covariância da relatividade geral.
A equação de Einstein no vácuo é dada por uma relação entre a métrica, o escalar de Ricci
e o tensor de Ricci:
1
Rµν − gµν R = 0 . (7.4.1)
2
Como foi dito, uma forma de deduzir esta equação está relacionada com o princı́pio de mı́nima
ação da mecânica, mas não faremos isso aqui.
Em alguns casos é conveniente se definir o tensor de Einstein:
1
Gµν ≡ Rµν − gµν R , (7.4.2)
2
de tal forma que uma condição a ser satisfeita pelo tensor contravariante é sua conservação pela
derivada covariante:
∇µ Gµν = 0 . (7.4.3)
Resolver a equação de Einstein significa encontrar métricas gµν que satisfaçam a equação
(7.4.1).

60
CHAPTER 8
AS EQUAÇÕES DE FRW E MODELOS COSMOLÓGICOS
SIMPLIFICADOS

Agora que já temos os ingredientes necessários para construir uma teoria de gravitação, ou
seja, temos a equação de Einstein que deve ser satisfeita por uma dada métrica gµν , estamos em
condições de construir um modelo cosmológico adequado para entender a evolução do universo.
Primeiro vamos ver qual é a métrica adequada para descrever nosso universo, e em seguida
vamos entender como levar em conta o conteúdo material do universo.
A métrica que vamos utilizar é a chamada métrica homogênea e isotrópica de Friedmann-
Robertson-Walker (FRW) e o conteúdo material será representado pelo tensor de energia-
momento de um fluido perfeito.

Neste capı́tulo e nos demais utilizaremos a velocidade da luz c = 1.

8.1 A métrica de Friedmann-Robertson-Walker


Devido à homogeneidade e isotropia do universo em grande escala, a métrica de Friedmann-
Robertson-Walker (FRW) é a mais apropriada para descrever a parte geométrica do universo,
com ds2 = gµν dxµ dxν dado por:
" #
2
dr  
ds2 = dt2 − a(t)2 + r2 dθ2 + sin2 θdφ2 , (8.1.1)
1 − kr2

onde a(t) é o fator de escala do universo e k representa o tipo de curvatura espacial, com
k = 0, +1, −1 para curvatura plana (euclideana), esféria (ou fechada) e hiperesférica (ou
aberta), respectivamente. O fator de escala a(t) é uma função a ser determinada, e será ela que
ditará como o universo evoluirá com o tempo.
Escrita em formato matricial, a métrica covariante gµν de FRW em coordenadas esféricas é
dada por:  
1 0 0 0
0 − a(t)22 0 0 
gµν =  1−kr  (8.1.2)
0 0 −a(t)2 r2 0 
0 0 0 −a(t)2 r2 sin2 θ
A interpretação fı́sica desta métrica é mais clara se tomarmos o caso particular k = 0, que

61
corresponde a uma curvatura plana:
 
1 0 0 0
0 −a(t)2 0 0 
gµν =  2 2
 (8.1.3)
0 0 −a(t) r 0 
2 2 2
0 0 0 −a(t) r sin θ

Note que este caso corresponde exatamente à métrica de Minkowski com um fator de escala
temporal a(t)2 multiplicando todos os termos da parte espacial da métrica. Desta forma fica
evidente que se trata da métrica de Minkowski com a possibilidade agora de haver uma expansão
temporal uniforme nos eixos x-y-z da métrica, ou seja, é a possibilidade de a parte espacial
se expandir com o tempo. Como não há diferença entre as componetes x-y-z, significa uma
expansão homogênea em todas as direções, e como nenhuma direção é privilegiada, significa que
há isotropia do espaço. Trata-se da métrica mais simples que admite uma evolução temporal.
No caso particular da métrica plana de FRW é mais simples escrevê-la em coordenadas
cartesianas:  
1 0 0 0
0 −a(t)2 0 0 
gµν =  2
 (8.1.4)
0 0 −a(t) 0 
0 0 0 −a(t)2
onde fica evidente a homogeneidade e isotropia da métrica. Em uma visão clássica tridimen-
sional, a função temporal a(t)2 faz o papel do quadrado do ’raio’ do universo em um dado
instante de tempo. Esta métrica é muito utilizada, pois várias observações apontam para um
universo com curvatura espacial nula.

Exercı́cio: Escreva a métrica contravariante de FRW, g µν , em coordenadas esféricas.

Exercı́cio: Escreva a métrica contravariante de FRW, g µν , em coordenadas cartesianas.

Dada a métrica, agora podemos construir as quantidades importantes, quais sejam: As


componentes da Conexão Afim, o tensor de Riemann, o tensor de Ricci e o escalar de Ricci,
com os quais obtemos a equação de Einstein.

Exercı́cio: Mostre que as componentes não-nulas da Conexão Afim para a métrica de FRW
em coordenadas esféricas são:
aȧ
Γ011 = Γ022 = aȧr2 Γ033 = aȧr2 sin2 θ
1 − kr2
kr
Γ111 = Γ122 = −(1 − kr2 )r Γ133 = −(1 − kr2 )r sin2 θ
1 − kr2
1
Γ212 = Γ221 = Γ313 = Γ331 =
r

Γ101 = Γ202 = Γ303 = Γ110 = Γ220 = Γ330 =
a
cos θ
Γ233 = − sin θ cos θ Γ323 = Γ332 =
sin θ
onde ȧ = da/dt.

62
Exercı́cio: Calcule as 12 componentes não-nulas do tensor de Riemann para a métrica de
FRW em coordenadas esféricas. São elas:
0 0 0 1 1 1 2 2 2 3 3 3
R101 , R202 , R303 , R001 , R212 , R313 , R002 , R112 , R323 , R003 , R113 , R223

Exercı́cio: Mostre que as únicas componentes não-nulas do tensor de Ricci covariante para
a métrica de FRW em coordenadas esféricas são:
ä (aä + 2ȧ2 + 2k)
R00 = −3 R11 =
a 1 − kr2
R22 = (aä + 2ȧ2 + 2k)r2 R33 = (aä + 2ȧ2 + 2k)r2 sin2 θ

Exercı́cio: Mostre que o escalar de Ricci para a métrica de FRW em coordenadas esféricas
é dado por:
6(ȧ2 + aä + k)
R=−
a2

8.1.1 Equação de Einstein para o vácuo


Com os coeficientes não-nulos calculados acima, somos capazes de construir as componentes
da equação de Einstein no vácuo:
1
R00 − g00 R = 0 ,
2
1
Rii − gii R = 0 , i = 1, 2, 3
2

Exercı́cio: Escreva explicitamente as 4 equações de Einstein covariantes no vácuo em


coordenadas esféricas.

Em alguns casos é mais simples escrever a equação de Einstein com ı́ndices mistos, ou
seja, contravariante e covariante, usando a métrica contravariante g µν para levantar os ı́ndices
correspondentes:
1
R00 − g00 R = 0 ,
2
1
R11 − g11 R = 0 ,
2
2 3
e equações análogas para R2 e R3 . Fazendo isso para a métrica em coordenadas esféricas
obtém-se:
6(ȧ2 + aä + k)
 
0 1 0 ä 1
R0 − g0 R = 0 =⇒ −3 − − = 0,
2 a 2 a2
que pode ser simplificada para:
ȧ2 k
2
+ 2 = 0. (8.1.5)
a a
1 2 3
As equações para R1 , R2 e R3 ficam todas iguais, dadas por:
(aä + 2ȧ2 + 2k) 1 6(ȧ2 + aä + k)
 
1 1 1
R1 − g1 R = 0 =⇒ − − − = 0,
2 a2 2 a2
que pode ser simplificada para:
ä ȧ2 k
2 + 2 + 2 = 0. (8.1.6)
a a a
63
Usando a equação (8.1.5) em (8.1.6) obtemos simplesmente ä = 0, cuja solução é óbvia, a(t) =
a0 t + a1 , com a0 e a1 constantes. Isto representa um fator de escala que cresce linearmente
com o tempo, portanto capaz de descrever um universo em expansão, onde as componentes
espaciais da métrica evoluem com uma função quadrática no tempo. Trata-se de uma solução
bem particular e simples para a evolução do universo, mas lembre-se que isso foi obtido para
um universo sem nenhum conteúdo material, portanto não representa nosso universo fı́sico.
Embora seja uma solução simplificada, ela mostra todos os passos para se obter o fator de
escala a(t), que deve vir da solução de uma equação diferencial no tempo.

Exercı́cio: Calcule os coeficientes não-nulos da Conexão Afim, do tensor de Riemann, do


tensor de Ricci e o escalar de Ricci para a métrica de FRW plana em coordenadas cartesianas
(8.1.14), obtenha as componentes da equação de Einstein correspondente, e mostre que são
idênticas às obtidas anteriormente em coordenadas esféricas com k = 0.

8.2 Tensor de energia-momento do fluido perfeito


Agora que já sabemos qual deve ser a métrica apropriada para descrever a parte geométrica
do universo, vamos ver como incluir o conteúdo material do universo, já que sabemos que
o universo onde vivemos possui matéria de diferentes tipos, distribuı́da na forma de estre-
las, galáxias, aglomerados de galáxias, radiação eletromagnética, etc. Como levar em conta a
matéria do universo na equação de Einstein (7.4.1)?
A análise da equação de Einstein (7.4.1) nos dá uma dica de como incluir o conteúdo material
do universo. O lado esquerdo da equação é identificado como o conteúdo geométrico, e o lado
direito deve ser identificado como o conteúdo material. Neste caso ainda estamos no vácuo, não
há matéria presente, mas se incluirmos o conteúdo material na forma de um tensor de segunda
ordem do lado direito, manteremos a equação de Einstein na seguinte forma:
1
Rµν − gµν R = 8πGTµν , (8.2.1)
2
onde G é a constante de gravitação de Newton, necessária para manter as unidades corretas da
equação e permitir que o limite Newtoniano seja recuperado no caso de campo gravitacional
fraco, e Tµν é o tensor que vai carregar o conteúdo material do universo, chamado tensor de
energia-momento (que também pode ser representado por T µν ou Tνµ ).
Para o caso de uma fluido perfeito, o tensor de energia-momento tem a seguinte forma,
escrito como um tensor misto de ı́ndices covariante e contravariante:
 
ρ(t) 0 0 0
 0 −P (t) 0 0 
Tνµ =   (8.2.2)
 0 0 −P (t) 0 
0 0 0 −P (t)
onde ρ(t) é a densidade de energia da matéria e P (t) a pressão exercida pela matéria.

Exercı́cio: Verifique que a dimensão de pressão (definida como força/área) é exatamente


a mesma de densidade de energia (energia/volume).

A equação de conservação covariante do tensor de energia-momento é:


∇µ T µν = 0 ,
e ela fornece a importante relação de conservação de energia em um universo em expansão pelo
fator de escala a(t):

ρ̇(t) + 3 [ρ(t) + P (t)] = 0 . (8.2.3)
a
64
8.3 Equações de Friedmann-Robertson-Walker
As equações de Einstein que seguem do tensor de energia-momento são conhecidas como
equações de Friedmann-Robertson-Walker. São elas:

1 ȧ2 k 8πG
R00 − g00 R = 8πGT00 =⇒ 2 + 2 = ρ(t) (8.3.1)
2 a a 3
1 ä ȧ2 k
R11 − g11 R = 0 =⇒ 2 + 2 + 2 = −8πGP (t) . (8.3.2)
2 a a a
Note que temos duas equações e 3 incógnitas, que são as funções a(t), ρ(t) e P (t). Dada uma
equação de estado relacionando a densidade de energia com a pressão, ficamos com 3 equações
e 3 incógnitas, e o sistema pode ser resolvido. Isto será estudado com mais detalhes no próximo
capı́tulo.
Apenas para finalizar, vamos ver como obeter uma equação que descreva a aceleração (ou
desaceleração) do universo.
Para valores fixos da curvatura k as equações (8.2.3)-(8.2.4) possuem 3 quantidades a serem
determinadas, quais sejam, a(t), ρ(t) e P (t). É necessário uma terceira equação, relacionando
a densidade de energia com a pressão do fluido,

P = ωρ , (8.3.3)

chamada equação de estado. Isso fecha o sistema de 3 equações e 3 incógnitas, e o sistema


tem solução, ainda que em alguns casos apenas numericamente. O parâmetro ω é chamado
parâmetro da equação de estado, e possui diferentes valores para diferentes tipos de fluidos.
Por exemplo, ω = 0 para matéria usual ou poeira e ω = 1/3 para radiação eletromagnética.
As equações (8.2.3)-(8.2.4) podem ser combinadas para entendermos como estudar uma
fase acelerada, ou não, para o universo. Eliminando o termo de curvatura da segunda equação
utilizando a primeira, obtém-se
ä 4πG
=− (ρ + 3P ) . (8.3.4)
a 3
Desta equação fica evidente que o lado direito é sempre negativo para fluidos que satisfaçam
as condições usuais de energia e pressão positivas. Portanto o universo não pode ser acelerado
nesse modelo, ou seja, se P ≥ 0 e ρ ≥ 0 temos necessariamente ä ≤ 0. Isso representa
um universo desacelerado, porém em expansão, guiado pelo fator de escala a(t). Esse era o
panorama da cosmologia no inı́cio do Século XX, quando Hubble descobriu que o universo
estava se expandindo, por meio da observação do espectro das galáxias próximas à nossa.
A análise acima é um tanto quanto simplificada, tendo em vista que o conteúdo material do
universo não é único. Porém ela nos permite entender como proceder para implementar uma
fase acelerada para o universo, seja através da constante cosmológica (que é o modelo padrão)
ou através de um fluido de energia escura (chamado de quintessência algumas vezes). Para um
modelo mais completo, devemos ainda incluir matéria bariônica (ω = 0) e radiação (ω = 1/3)
por exemplo, tendo em vista que estes são dois ingredientes básicos presentes no universo desde
seus primórdios.

8.4 Modelos cosmológicos simples


Agora vamos estudar alguns modelos cosmológicos simples, levando em conta aloguns possı́veis
conteúdos materiais para o universo.

65
Vamos supor inicialmente que o universo é composto por apenas um tipo de conteúdo
material, satisfazendo a equação de estado P = ωρ. Neste caso as equações (8.3.1) e (8.2.3)
ficam:
ȧ2 k 8πG
2
+ 2 = ρ (8.4.1)
a a 3

ρ̇ + 3 ρ(1 + ω) = 0 . (8.4.2)
a
Para entendermos melhor como construir nosso primeiro modelo cosmológico, vamos supor
uma métrica plana de FRW (k = 0). Neste caso a primeira equação se simplifica para:
ȧ2 8πG
2
= ρ. (8.4.3)
a 3
A segunda equação pode ser escrita como:
ρ̇ ȧ
= −3 (1 + ω) . (8.4.4)
ρ a
Agora precisamos definir qual o conteúdo material do nosso modelo de universo.

8.4.1 Universo dominado por matéria


No caso de um universo dominado por matéria, temos ω = 0, já que a matéria usual não
exerce mais pressão. Neste caso:
ρ̇ ȧ
= −3 , (8.4.5)
ρ a
cuja solução para ρ(a) é:
 −3
a(t)
ρ(a) = ρ0 , (8.4.6)
a0
onde ρ0 e a0 são constantes referentes ao tempo atual t = t0 , ou seja, hoje. Isto mostra que a
densidade de energia da matéria diminui a medida que o fator de escala cresce, escalando com
a−3 .

Exercı́cio: Verifique que (8.4.6) é solução da equação (8.4.5).

Substituindo de volta em (8.4.3) obtemos uma equação para a(t):


ȧ = Ca(t)−1/2 , (8.4.7)
onde C é uma constante envolvendo G, ρ0 e a0 , cuja solução é:
 2/3
t
a(t) = a0 . (8.4.8)
t0

Exercı́cio: Verifique que (8.4.8) é solução da equação (8.4.7).

A solução (8.4.8) claramente mostra um fator de escala que cresce com o tempo, mas de
forma desacelerada, já que ä < 0.

Exercı́cio: Calcule ä para o modelo dominado por matéria.

Os casos com curvatura, k = ±1, não possuem solução analı́tica para a(t), mas o comporta-
mento é bem determinado parametricamente. Obtém-se que para k = +1 a solução para a(t) é
de um fator de escala que oscila, crescendo e se contraindo com o tempo. Para o caso k = −1
a evolução também é contı́nua e desacelerada. Estes casos serão tratados mais adiante.

66
8.4.2 Universo dominado por radiação
No caso de um universo dominado por radiação, temos ω = 1/3, já que a radiação exerce
uma pressão que é 1/3 da densidade de energia. Neste caso:
ρ̇ ȧ
= −4 , (8.4.9)
ρ a

cuja solução para ρ(a) é:


 −4
a(t)
ρ(a) = ρ0 , (8.4.10)
a0
onde ρ0 e a0 são constantes referentes ao tempo atual. Isto mostra que a densidade de energia
da matéria diminui a medida que o fator de escala cresce, escalando com a−4 .

Exercı́cio: Verifique que (8.4.10) é solução da equação (8.4.9).

Substituindo de volta em (8.4.3) obtemos uma equação para a(t):

ȧ = Ca(t)−1 , (8.4.11)

onde C é uma constante envolvendo G, ρ0 e a0 , cuja solução é:


 1/2
t
a(t) = a0 . (8.4.12)
t0

Exercı́cio: Verifique que (8.4.12) é solução da equação (8.4.11).

A solução (8.4.12) claramente mostra um fator de escala que cresce com o tempo, mas de
forma desacelerada, já que ä < 0.

Exercı́cio: Calcule ä para o modelo dominado por radiação.

Para k = ±1 obtém-se soluções semelhantes ao caso dominado por matéria, com universo
oscilante e crescimento contı́nuo, todos os casos desacelerados.

8.4.3 Soluções dos casos com curvatura k


As soluções dos casos com k = ±1 podem ser estudados parametricamente por meio de uma
mudança de variáveis, conforme exercı́cio abaixo.

Exercı́cio: Considere as equações de Friedmann com ou sem curvatura k = 0, ±1. Suponha


uma equação de estado na forma geral P = ωρ, com ω constante.

(a) Mostre que a densidade de energia pode ser escrita como:


 3(ω+1)
a0
ρ = ρ0
a

(b) Para o caso k = 0 mostre que a solução para o fator de escala é dada por:
2
a(t) = a0 t 3(ω+1)

67
(c) Para os casos k = ±1, use o tempo conforme η definido por dt = a(η)dη, de tal forma
que dη/dt = 1/a, e as equações (8.3.1)-(8.3.3) para encontrar a seguinte equação:
00 0
aa + (∆ − 1)a 2 + ∆ka2 = 0 ,

onde a0 = da/dη e
3(ω + 1)
∆= −1
2
(d) Faça as mudanças de variáveis:

Z(η) = ln a se ∆ = 0 ,

Z(η) = a∆ se ∆ 6= 0 ,
e obtenha as equações:
00
Z = 0 se ∆ = 0 ,
00
Z + k∆2 Z = 0 se ∆ 6= 0 .
(e) Verifique que as soluções são dadas por:

Z = z0 η + c0 se ∆ = 0 ,

Z = z0 sin[ k∆η + δ] se ∆ 6= 0 e k = +1
p
Z = z0 sinh[ |k|∆η + δ] se ∆ 6= 0 e k = −1
(f) Faça gráficos da função a(Z(η)) para diferentes valores de k e ω e interprete a evolução
do fator de escala em cada caso.

68
CHAPTER 9
O MODELO PADRÃO DA COSMOLOGIA, ΛCDM

O modelo padrão da cosmologia se chama ΛCDM devido ao acrônimo inglês para “cold
dark matter” ou matéria escura fria, na presença de um termo de constante cosmológica Λ.
Portanto, é um modelo que supõe a existência de matéria escura fria e um termo de constante
cosmológica, como ficará mais claro adiante.
A necessidade da presença de matéria escura, além da matéria usual observada no universo,
vem de observações de curvas de rotação de galáxias, entre outras. As observações de galáxias
mostram que a velocidade com que as estrelas longe do centro galático se movem é maior que
o esperado caso o conteúdo material da galáxia fosse apenas a matéria bariônica padrão. Isso
mostra a necessidade de cerca de 5 vezes mais matéria permeando as galáxias do que aquela
que realmente é observada. Essa matéria ”invisı́vel” recebe o nome de Matéria Escura Fria
(Cold Dark Matter).
O termo Λ se refere à constante cosmológica, necessária no modelo padrão para explicar a
aceleração recente do universo, como veremos a seguir. É uma constante que deve ser colocada
à mão nas equações, tendo em vista que seu pequeno valor não pode ser atribuı́do a efeitos
quânticos. Apesar de explicar bem os dados observacionais recentes, principalmente de super-
novas, a constante cosmológica apresenta problemas no cálculo do espectro de perturbações
iniciais no universo primordial. Nas teorias mais modernas a constante cosmológica dá lugar
à energia escura, um novo fluido com pressão negativa necessário para explicar a aceleração
recente do universo.

9.1 Equação de Einstein para o modelo ΛCDM


A equação de Einstein da relatividade geral no modelo padrão da cosmologia é dada por1 :
1
Rµν − gµν R − Λgµν = 8πGTµν (9.1.1)
2
onde Rµν e R são, respectivamente, o tensor de Ricci e o escalar de Ricci, e Tµν é o tensor de
energia momento da teoria, dependente do tipo de conteúdo material que preenche o universo.
Note que se fizermos Λ = 0 voltamos ao caso das equações obtidas anteriormente.
Para um universo preenchido com um fluido perfeito com densidade de energia ρ e pressão
P , as componentes não-nulas do tensor de energia momento são dadas pelo tensor (8.2.2), que
possui ı́ndices mistos contravariantes e covariantes. Por isso é necessário escrevermos a equação
1
Estamos usando c = 1

69
de Einstein também neste formato:
1
Rνµ − gνµ R − Λgνµ = 8πGTνµ . (9.1.2)
2
Da mesma forma que nos casos anteriores, podemos separar as componentes 00 e ij da
equação de Einstein:
1
R00 − g00 R − Λg00 = 8πGT00 , (9.1.3)
2
1
Rji − gji R − Λgji = 8πGTji . (9.1.4)
2

9.2 Equações de FRW para o modelo ΛCDM


Devido à homogeneidade e isotropia do universo em grande escala, a métrica de Friedmann-
Robertson-Walker (FRW) é a mais apropriada para descrever a parte geométrica do universo,
com ds2 dado por:
" #
2
dr  
ds2 = dt2 − a(t)2 + r2 dθ2 + sin2 θdφ2 , (9.2.1)
1 − kr2

onde a(t) é o fator de escala do universo e k representa o tipo de curvatura espacial, com
k = 0, +1, −1 para curvatura plana (euclideana), esféria (ou fechada) e hiperesférica (ou
aberta), respectivamente.
Note que a função a(t) para o fator de escala ainda está indeterminada, embora a métrica
obedeça as condições de homogeneidade e isotropia, a métrica ainda não foi determinada com-
pletamente. Precisamos resolver um sistema de equações para determinar a(t).
Usando os mesmos resultados anteriores, as equações de Friedmann que descrevem a evolução
do fator de escala a(t) são dadas por:

ȧ2 k 8πG Λ
2
+ 2 = ρ+ , (9.2.2)
a a 3 3
2ä ȧ2 k
+ 2 + 2 = −8πGP + Λ . (9.2.3)
a a a
Escritas desta forma fica evidente que o lado esquerdo das equações representa o conteúdo
geométrico do universo, enquanto o lado direito representa o conteúdo material, com a ressalva
que a constante cosmológica foi incluı́da do lado direito para o caso de representar a energia
escura. Tomando a derivada temporal da equação (9.2.2) e usando a (9.2.3) obtemos a chamada
equação de conservação de energia:

ρ̇ + 3 (ρ + P ) = 0 , (9.2.4)
a
que é um reflexo da conservação do tensor de energia momento ∇µ Tµν = 0. Esta equação não
é uma nova equação, ela é apenas obtida da combinação adequada da primeira e da segunda
equações de Friedmann.

Exercı́cio: Obtenha as equações de Friedmann (9.2.2)-(9.2.3).

Exercı́cio: Obtenha a equação de conservação de energia (9.2.4).

70
Para valores fixos da curvatura k e da constante cosmológica Λ, as equações (9.2.2)-(9.2.3)
possuem 3 quantidades a serem determinadas, quais sejam, a(t), ρ(t) e P (t). Uma terceira
equação, relacionando a densidade de energia com a pressão do fluido,

P = ωρ , (9.2.5)

chamada equação de estado, fecha o sistema de 3 equações e 3 incógnitas, e o sistema tem solução
fechada, ainda que em alguns casos apenas numericamente. O parâmetro ω é o parâmetro da
equação de estado, e possui diferentes valores para diferentes tipos de fluidos. Por exemplo,
ω = 0 para matéria usual ou poeira e ω = 1/3 para radiação eletromagnética.
As equações (9.2.2)-(9.2.3) podem ser combinadas para entendermos como implementar
uma fase acelerada para o universo. Eliminando o termo de curvatura da segunda equação
utilizando a primeira, obtém-se
ä 4πG Λ
=− (ρ + 3P ) + . (9.2.6)
a 3 3
Desta equação fica evidente que o primeiro termo do lado direito é sempre negativo para fluidos
que satisfaçam as condições usuais de energia e pressão positivas. Portanto, na ausência do
termo de constante cosmológica o universo não pode ser acelerado nesse modelo, ou seja, se
Λ = 0, P ≥ 0 e ρ ≥ 0 temos necessariamente ä < 0.
Já a presença da constante cosmológica leva naturalmente a uma aceleração, ä > 0, se
o segundo termo do lado direito for maior que o primeiro. Vale lembrar que um valor não
nulo para a constante cosmológica foi adotado por Einstein para obter uma solução estática
para o universo, ä = 0 e ȧ = 0, mediante um ajuste fino da constante cosmológica para
satisfazer esta condição. Naquela época ainda não haviam os dados observacionais de Hubble,
que comprovaram que o universo de fato estava se expandindo. Após as observações de Hubble,
Einstein abandonou a hipótese de universo estático, quando teria afirmado que a constante
cosmológica foi o maior erro de sua vida.

9.2.1 Universo dominado por constante cosmológica


Agora vamos considerar um universo dominado apenas pela constante cosmológica Λ na
equação de Friedmann (9.2.2), e com curvatura nula, k = 0:

ȧ2 Λ
2
= .
a 3
Λ
Podemos associar uma densidade de energia à constante cosmológica, ρΛ = 8πG
= const, de tal
forma que a Eq. (9.2.2) pode ser escrita como:

ȧ2 8πG
2
= ρΛ . (9.2.7)
a 3
Isto significa que ω = −1, já que a densidade de energia associada à constante cosmológica
é constante, portanto ρ̇ = 0 na equação de conservação de energia (9.3.2), que só pode ser
satisfeita se ω = −1. Isso significa que a pressão exercida pela constante cosmológica é negativa,
o que é um comportamento totalmente diferente da matéria usual com pressão positiva. Essa
pressão negativa seria o responsável por fazer o universo se expandir aceleradamente, como
veremos a seguir.
Uma outra possibilidade de satisfazer a Eq. (9.2.4) com ρ = const e ω 6= −1 seria ȧ = 0,
mas isso só é possı́vel em um universo estático, e as observações mostram que não é este o caso.

71
A equação de Friedmann (9.2.7) é do tipo
r
8πG
ȧ = ± ρΛ a(t) , (9.2.8)
3
cuja solução é: r
 
8πG
a(t) = C exp ± ρΛ t . (9.2.9)
3
A solução com exponencial positiva claramente indica uma expansão acelerada para o fator de
escala a(t), portanto seria uma maneira de explicar a aceleração recente do universo.

Exercı́cio: Verifique que (9.2.9) é solução da equação (9.2.8).

Exercı́cio: Calcule ä para o modelo dominado por constante cosmológica.

9.2.2 Universo plano dominado por constante cosmológica e matéria


A solução geral do caso plano ou sem curvatura (k = 0) e dominado por matéria satisfazendo
a equação de estado na forma P = ωρ e constante cosmológica, com equações de FRW dadas
por:
ȧ2 8πG Λ
2
= ρ+ . (9.2.10)
a 3 3
2ä ȧ2
+ 2 = −8πGP + Λ (9.2.11)
a a
pode ser melhor estudada conforme exercı́cio abaixo.

Exercı́cio: Considere as equações de Friedmann sem curvatura (k = 0) e com constante


cosmológica Λ. Suponha uma equação de estado na forma geral P = ωρ, com ω constante.

(a) Derive a primeira equação em função do tempo, use a equação de estado para substituir
ρ em função de P , use a segunda equação para P , e mostre que a equação resultante pode ser
escrita como:
Λ(ω + 1)a2
aä + ∆ȧ2 =
2
3ω + 1
∆=
2
(b) Verifique que a solução desta equação é dada por:
" 2
# 3(ω+1)

 
1
! 3(ω+1) exp (ω + 1) 3Λt − 1
3
a(t) = q 
4Λ Λ
exp 3
t

(c) Atribua valores a Λ e ω e plote gráficos para ver o comportamento de a(t).

72
9.3 A matéria escura no universo
Além dos constituintes materias que falamos anteriormente e também da constante cos-
mológica, veremos que o universo precisa ainda de mais um conteúdo material, a matéria
escura. Ao contrário da constante cosmológica que tem um caráter de pressão negativa, ou
repulsão gravitacional, a matéria escura é semelhante à matéria bariônica usual, com atração
gravitacional agindo da mesma forma entre todas as partı́culas. A única diferença é que ela
é invisı́vel a qualquer experimento, o que significa dizer que ela não interage eletromagnetica-
mente. Seus efeitos são visı́veis apenas devido à atração gravitacional que ela exerce na matéria
usual, por exemplo na curva de rotação das galáxias e efeitos de lentes gravitacionais.
Em resumo, algumas caracterı́sticas da matéria escura são:

• É “invisı́vel” (não interage eletromagneticamente).

• É gravitacionalmente atrativa.

• É responsável pela dinâmica local das galáxias e aglomerados de galáxias.

• Age no Universo em curta escala.

No caso das curvas de rotação das galáxias, é fácil entender a necessidade da matéria escura.
Considere uma galáxia de massa total Mtot e uma estrela de massa m em órbita em torno do
núcleo galático. A velocidade de rotação da estrela em torno do núcleo da galáxia deve satisfazer
a segunda lei de Newton:
Fg = macp (9.3.1)
ou
GM (r)m v2
= m (9.3.2)
r2 r
onde M (r) é a distribuição de massa da galáxia até a posição r, m é a massa da estrela, G é a
constante gravitacional, v é a velocidade escalar de rotação da estrela e r é a distância radial
do centro da galáxia.
Na região central, onde a densidade ρ é aproximadamente constante, M (r) = ρV ' ρ 43 πr3 ,
onde V = 43 πr3 é o volume até a distância r, de tal forma que a velocidade da estrela é:
r
4
v= πGρ r ∼ r (9.3.3)
3
Longe da região central, a estrela sente a força gravitacional equivalente a uma massa total
M (r) = Mtot no centro da galáxia, de tal forma que:
r
GMtot 1
v= ∼√ (9.3.4)
r r

Isto mostra que a velocidade de rotação das estrelas em torno da galáxia deve crescer linear-
mente com a distância para estrelas próximas do centro galático e cair com a raiz quadrada da
distância para estrelas longe do núcleo galático. Mas não é isso que as observações mostram!
As observações mostram que a velocidade se mantém aproximadamente constante longe do
núcleo galático, após crescer perto do centro. Isso só é possı́vel se a quantidade de matéria
presente entre a estrela e o núcleo galático for muito maior que o observado, responsável por
uma velocidade radial muito maior que a esperada pela gravitacão newtoniana. Esse problema
já era conhecido desde a década de 1930, quando a observação das primeiras galáxias indicava
a necessidade de mais matéria do que a observada pela velocidade de rotação das estrelas.

73
9.4 Modelo ΛCDM em termos do parâmetro de Hubble
H e do redshift z
As equações anteriores estão todas em termos do fator de escala a(t), que determina com-
pletamente a métrica que guia a evolução do universo. No entanto esta não é a melhor forma
de expressar as quantidades cosmológicas de interesse.
A formulação correta para o modelo padrão da cosmologia deve ser feita com base em
quantidades que possam ser comparadas com a observação. Uma das primeiras observações a
respeito da evolução do universo foi feita por Edwin Hubble por volta de 1929. Ele observou que
algumas galáxias próximas à nossa estão se afastando com uma velocidade v que é proporcional
à distância D:
v = H0 D , (9.4.1)
onde H0 é hoje conhecido como constante de Hubble, e possui um valor aproximado de H0 ∼
70km/s.Mpc. Essa é a lei de Hubble, indicando que uma galáxia a uma distância D = 1Mpc
está se afastando de nós a uma velocidade de 70km/s, enquanto uma galáxia a uma distância
D = 2Mpc está se afastando de nós a uma velocidade de 140km/s, e assim por diante. Isso
mostra que objetos mais distantes estão se afastando a velocidades maiores de nós.
Para escrever a lei de Hubble em termos do fator de escala a(t), vamos considerar o seguinte.
A distâcia D entre dois objetos no universo em expansão deve estar mudando com o tempo,
D(t), por isso é chamada distância própria. Deve valer a seguinte relação entre a distância
própria D(t) e o fator de escala a(t):

D(t) a(t)
= (9.4.2)
D(t0 ) a(t0 )

onde D(t0 ) e a(t0 ) são os valores dessa distância hoje, em t0 , e do fator de escala hoje. Isso
mostra que qualquer distância D(t) cresce na mesma proporção que o fator de escala, D(t) =
D(t0 )
a(t0 )
a(t). Um outro conceito de distância que aparece comumente em cosmologia é a distância
comóvel, definida como DC = D(t)
a(t)
.
A velocidade de recessão de uma galáxia a uma distância D(t) devido à expansão do universo
pode ser escrita como:

dD(t) D(t0 ) da(t) D(t) da(t) ȧ(t)


v= = = = D(t) = H(t)D(t) , (9.4.3)
dt a(t0 ) dt a(t) dt a(t)

onde definimos a quantidade


ȧ(t)
H(t) ≡ (9.4.4)
a(t)
como o parâmetro de Hubble em um tempo t qualquer, de forma que fica evidente que para o
tempo atual, t0 , temos
ȧ(t0 )
H0 ≡ ,
a(t0 )
e reconhecemos a equação (9.4.1) como caso particular da (9.4.3) para o tempo atual.
As equações de Friedmann (9.2.2), (9.2.3) e equação de conservação (9.2.4) ficam da seguinte
forma em termos do parâmetro de Hubble H(t) ≡ H:
k 8πG Λ
H2 + 2
= ρ+ , (9.4.5)
a 3 3
k
2Ḣ + 3H 2 + 2 = −8πGP + Λ (9.4.6)
a

74
ρ̇ + 3H(ρ + P ) = 0 . (9.4.7)

Exercı́cio: Obtenha as equações (9.4.5)-(9.4.7).

Agora que temos a relação de Hubble (9.4.3) ou (9.4.1) válida para o tempo presente,
precisamos saber como medir efetivamente a velocidade v de recessão de uma galáxia. A
resposta está do chamado redshift (desvio para o vermelho), caracterizado pelo parâmetro z.
Este parâmetro obtido por meio da observação das linhas espectrais de emissão ou absorção
dos átomos que compõe as galáxias. É um fenômeno semelhante ao efeito Doppler do som,
caracterizado por uma diferença na medida da frequência ou do comprimento de onda da onda
sonora, dependendo se a fonte sonora está se aproximando ou se afastando do observador.
Para a luz ocorre um efeito parecido com as linhas espectrais dos elementos quı́micos. Se
λ0 é o comprimento de onda da luz quando o átomo está em repouso no laboratório e λ é o
comprimento de onda observado quando a fonte está em movimento, definimos o redshift z
como:
λ − λ0
z=
λ0
Quando um objeto está se afastando, o deslocamento das linhas espectrais é em direção ao ver-
melho, e quando o objeto está se aproximando é em direção ao azul. Como a maioria dos objetos
observados no universo estão se afastando uns dos outros, devido à expansão cosmológica, essa
medida ficou conhecida como medida de redshift de um objeto.
Tendo a medida do redshift, sua relação com a velocidade v do objeto é obtida por meio da
relação relativı́stica s
1 + vc
1+z = , (9.4.8)
1 − vc
onde c é a velocidade da luz.
Por fim precisamos relacionar o redshift z com o fator de escala a(t):
a0
≡ 1+z. (9.4.9)
a(t)

É fácil ver que z = 0 corresponde ao tempo atual, quando t = t0 e a(t0 ) = a0 . O passado é


indicado por z > 0, onde a(t) < a0 . Em particular, o inı́cio do universo é representado por
z → ∞, quando a(t) → 0, e o universo tem um ’raio’ nulo.

9.4.1 Universo com bárions, radiação, matéria escura e constante


cosmológica
Agora estamos em condições de formular de maneira correta o modelo padrão da cosmologia,
que como já foi dito, compreende um universo com matéria bariônica, radiação, matéria escura
e constante cosmológica.
A generalização para mais fluidos pode ser facilmente feita, bastando acrescentar a densidade
de energia e pressão de todos os fluidos nas equações de Friedmann (9.4.6)-(9.4.7):
k 8πG Λ
H2 + = (ρ b + ρ DM + ρ r ) + , (9.4.10)
a2 3 3
k
2Ḣ + 3H 2 + = −8πG(Pb + PDM + Pr ) + Λ (9.4.11)
a2
onde ρb representa a densidade de energia dos bárions, ρDM da matéria escura e ρr da radiação
eletromagnética, com as respectivas pressões Pb , PDM e Pr . Note que o conteúdo de matéria

75
escura foi adicionado a mão, tendo em vista que não conhecemos sua natureza e ela é diferente
da matéria bariônica usual no sentido de que não interage com ela. Uma simplificação aparece
quando consideramos Pb = PDM = 0 e Pr = 13 ρr e supomos que os fluidos evoluem de forma
independente um do outro, não havendo nenhum tipo de interação entre eles. Neste caso a
equação de conservação (9.4.8) para cada fluido fica fácil de resolver em termos do fator de
escala a(t), sendo as densidades de energia dadas por:
!3 !3 !4
a0 a0 a0
ρb (t) = ρb0 , ρDM (t) = ρDM 0 , ρr (t) = ρr0 , (9.4.12)
a(t) a(t) a(t)

onde o sub-ı́ndice ”0” diz respeito a quantidades medidas hoje, ou seja, representam as den-
sidades de energia hoje, quando a0 = 1. Esses valores devem vir das observações. Definindo
Λ
também uma densidade de energia para a parte de constane cosmológica, ρΛ ≡ 8πG , e substi-
tuindo tudo em (9.4.10) obtemos
" !3 !3 !4 #
8πG a 0 a 0 a 0 k
H2 = ρb0 + ρDM 0 + ρr0 + ρΛ − 2 . (9.4.13)
3 a a a a

A expressão acima nos diz que hoje, quando a = a0 e H = H0 , existe uma relação entre a
densidade total ρ0 = ρb0 + ρDM 0 + ρr0 + ρΛ , o parâmetro de Hubble H0 e a curvatura k:
3H02 3k
= ρ0 − ,
8πG 8πGa20
de tal forma que se definirmos o lado esquerdo como um novo parâmetro de densidade, chamado
densidade crı́tica,
3H02
ρcrit ≡ ,
8πG
3k
a relação ρ0 = ρcrit + 8πGa 2 nos diz que, se a densidade total de matéria do universo hoje for
0
maior que a densidade crı́tica, ρ0 > ρcrit , o universo é necessariamente fechado (k > 0), e se
ρ0 < ρcrit , o universo é necessariamente aberto (k < 0). A densidade crı́tica corresponde ao
caso limite entre universo aberto e fechado.
Com isso definimos os novos parâmetros de densidade:
ρb0 ρDM 0 ρr0 ρΛ k
Ωb = , ΩDM = , Ωr = , ΩΛ = , Ωk = − , (9.4.14)
ρcrit ρcrit ρcrit ρcrit a20 H02
que representam as frações de cada conteúdo material em relação à densidade crı́tica, cujo valor
é aproximadamente ρcrit ' 9, 3 × 10−30 g/cm3 . Com isto a equação (9.4.13) se torna:
" #
 a 3  a 3  a 4  a 2
0 0 0 0
H 2 = H02 Ωb + ΩDM + Ωr + ΩΛ + Ωk , (9.4.15)
a a a a

Como já dissemos anteriormente, não somos capazes de medir a(t) explicitamente, portanto
escrevemos o fator de escala em termos do redshift cosmológico z através de aa0 = 1 + z.
Temos então uma maneira de expressar a equação de Friedmann em termos dos parâmetros de
densidade e do redshift z:
h i
H 2 (z) = H02 Ωr (1 + z)4 + Ωb (1 + z)3 + ΩDM (1 + z)3 + Ωk (1 + z)2 + ΩΛ . (9.4.16)

É fácil ver que hoje, com z = 0, temos o chamado vı́nculo de Friedmann

Ωr + Ωb + ΩDM + Ωk + ΩΛ = 1 , (9.4.17)

76
que estabelece que a soma dos parâmetros representando as densidades de energia de todos os
fluidos que compõem o universo deve ser igual à unidade.
A equação (9.4.16) representa o modelo padrão da cosmologia, conhecido como modelo
ΛCDM, onde Λ se refere à constante cosmológica e CDM se refere a Cold Dark Matter, ou
matéria escura fria, que é a hipótese feita sobre a parte de matéria escura, ρDM tal que PDM = 0,
representando um fluido não relativı́stico e não-interagente, assim como a matéria bariônica.
Se formos capazes de medir com precisão a quantidade de cada fluido que compõe o universo
hoje, somos capazes obter como será sua evolução.
Outro aspecto interessante que podemos ver da equação (9.4.15) é que diferentes tipos de
fluidos dominam em diferentes fases do universo. No passado, quando a << a0 , era a radição
que dominava. À medida que o fator de escala foi crescendo, o universo passou a ser dominado
pela curvatura, depois pela matéria e finalmente hoje é a constane cosmológica que domina.

9.4.2 Dados de H(z)


Os dados observacionais de H(z) estão diretamente relacionados a velocidade de recessão
dos objetos em que são medidos, na grande maioria das vezes envolvendo galáxias. Este dados
observacionais são de extrema importância para testarmos o modelo cosmológico padrão, assim
como outros modelos cosmológicos.
Na figura a seguir são apresentados alguns valores de H(z) com a respectiva incerteza padrão
σH .
A pergunta que fazemos agora é: Quais os valores de Ωb , Ωr , ΩDM , Ωk e ΩΛ melhor se
ajustam ao modelo teórico da equação (9.4.16)?
Antes de respondermos, vamos simplificar um pouco o problema. A densidade de radiação
eletromagnética presente no universo atual é muito pequena no universo atual, ela foi domi-
nante apenas no passado quando o universo era muito quente. Hoje a temperatura de aproxi-
madamente 2.75K da radiação cósmica de fundo confirma que a contribuição da radiação para
a evolução do universo atual é despresı́vel. Portanto podemos desprezar este termo. Outra
observação importante é que não somos capazes de diferenciar com precisão os efeitos gravita-
cionais entre matéria bariônica e matéria escura. Sabemos apenas que a última é dominante
sobre a primeira, mas os efeitos gravitacionais de ambas são idênticas. Veja por exemplo
(9.4.13), onde a lei de evolução de ambas é idêntica. Em alguns modelos, podemos simples-
mente considerar uma única componente de matéria, que inclui tanto matéria bariônica quanto
matéria escura. Se fizermos isso na equação (9.4.16) simplificamos um pouco a expressão:
h i
H 2 (z) = H02 ΩDM (1 + z)3 + Ωk (1 + z)2 + ΩΛ . (9.4.18)

Neste caso temos estritamente o modelo ΛCDM, composto apenas por matéria escura e con-
stante cosmológica Λ, além da curvatura. Note que o termo de curvatura pode ser escrito em
termos dos outros parâmetros através de (9.4.17), Ωk = 1 − ΩDM − ΩΛ .
Alguns valores de ΩDM , Ωk e ΩΛ são apresentados na figura a seguir. Eles mostram que o
universo deve ser composto basicamente de cerca de 30% de matéria escura, ΩDM ' 0.30, 70%
de constante cosmológica, ΩΛ ' 0.70 e curvatura aproximadamente nula, Ωk ' 0.0. São estes
valores que melhor se ajustam ao modelo teórico (9.4.18). Note que mudar muito estes valores
faz com que a função (9.4.18) não se ajuste aos dados observacionais da tabela.

77
Parameters of cosmological models and recent astronomical observations,
G.S. Sharov and E.G. Vorontsova, JCAP10(2014)057

34 dados de H(z):

Valores de H0 obtidos por diferentes grupos observacionais:

Valores dos parâmetros de densidade obtidos por diferentes grupos observacionais:

78
9.4.3 Dados de supernovas
Um outro conjunto de dados observacionais muito importante em cosmologia são os dados
de supernovas do tipo Ia. Supernovas são estrelas que chegam ao final da vida na forma de uma
grande explosão, com um brilho que pode ser maior que de toda a galáxia em que ela vive, em
alguns casos por alguns dias. Por se tratar de um brilho tão intenso, é possı́vel observar estes
objetos mesmo em galáxias distantes.
As supernovas do tipo Ia são um tipo bem especı́fico de supernovas, o que garante que o
brilho ou luminosidade total emitida seja muito aproximadamente constante para todas elas,
o que permite utilizá-las como medidores de distância com bastante precisão. Basicamente, se
uma lâmpada de potência conhecida ilumina uma sala, é sabido que a intensidade da lâmpada ou
o seu brilho cai com o quadrado da distância. Assim é possı́vel estimar a distância da lâmpada
se você souber qual é sua luminosidade total de emissão, e comparar com a luminosidade medida
a uma certa distância.
Vamos apenas apresentar a equação que mede a distância de uma supernova em funçao do
redshift, sem entrar nos detalhes envolvidos no cálculo. O chamado módulo de distância µ é
definido como a diferença entre a magnitude aparente mS e a magnitude absoluta MS de uma
supernova, µ = mS − MS , que por sua vez pode ser escrito em termos da chamada distância de
luminosidade dL através da relação:

µ(z) = mS − MS = 5 log dL (z) + 25 , (9.4.19)

onde dL é a distância de luminosidade medida em Mpc, dada por:


" #
(1 + z) p Z z H0
dL (z) = √ sinh c Ωk 0)
dz 0 . (9.4.20)
H0 Ωk 0 H(z

A tabela a seguir mostra alguns dados de supernovas, de onde podemos extrair os valores
de µ e z necessários para comparar com o modelo teórico acima.

79
IMPROVED COSMOLOGICAL CONSTRAINTS FROM NEW, OLD AND COMBINED
SUPERNOVA DATASETS

M. Kowalski1 , D. Rubin2,3 , G. Aldering2 , R. J. Agostinho4 , A. Amadon5 , R. Amanullah6 , C.


Balland7 , K. Barbary 2,3 , G. Blanc8 , P. J. Challis9 , A. Conley10 , N. V. Connolly 11 , R.
Covarrubias12 , K. S. Dawson2 , S. E. Deustua13 , R. Ellis14 , S. Fabbro 15 , V. Fadeyev16 , X.
Fan17 , B. Farris18 , G. Folatelli12 , B. L. Frye19 , G. Garavini20 , E. L. Gates21 , L. Germany22 ,
G. Goldhaber2,3 , B. Goldman23 , A. Goobar20 , D. E. Groom2 , J. Haissinski24 , D. Hardin7 , I.
Hook25 , S. Kent26 , A. G. Kim2 , R. A. Knop27 , C. Lidman28 , E. V. Linder6 , J. Mendez29,30 ,
J. Meyers2,3 , G. J. Miller31 , M. Moniez24 , A. M. Mourao˜ 15 , H. Newberg 32 , S. Nobili20 , P.
E. Nugent2 , R. Pain7 , O. Perdereau 24 , S. Perlmutter2,3 , M. M. Phillips33 , V. Prasad2 , R.
Quimby14 , N. Regnault 7 , J. Rich5 , E. P. Rubenstein34 , P. Ruiz-Lapuente30 , F. D. Santos35 , B.
E. Schaefer36 , R. A. Schommer37 , R. C. Smith38 , A. M. Soderberg 14 , A. L. Spadafora2 , L.-G.
Strolger39 , M. Strovink2,3 , N. B. Suntzeff40 , N. Suzuki2 , R. C. Thomas2 , N. A. Walton41 , L.
Wang40 , W. M. Wood-Vasey9 , J. L. Yun4 (The Supernova Cosmology Project)

The Astrophysical Journal, Volume 686, Issue 2, pp. 749-778 (2008).

Dados de 414 supernovas do grupo The Supernova Cosmology Project

A tabela continua ...

80
9.5 Distâncias de luminosidade e de diâmetro angular
9.5.1 Distância de luminosidade dL
A luminosidade ou fluxo luminoso F de uma fonte luminosa qualquer cai com o quadrado
da distância r até a fonte:
L
F = , (9.5.1)
4πr2
sendo L a potência ou taxa de produção de energia da fonte.
No espaço-tempo em expansão esta expressão continua válida, no entanto a distância no
denominador deve ser substituı́da pela distância corrigida pelo fator de escala, r → a(t)r:
Lem
Fem = , (9.5.2)
4πa(t)2 r2
sendo Lem a taxa de energia emitida pela fonte por unidade de tempo no tempo t. Em particular,
o fluxo luminoso de uma fonte qualquer recebido hoje, em t = t0 , é dado por:
L0
F0 = . (9.5.3)
4πa(t0 )2 r2
Para obter uma expressão para a distância de luminosidade, precisamos entender primeiro
alguns conceitos referentes à evolução temporal da energia emitida pela fonte luminosa. Uma
certa quantidade de energia ∆Eem emitida pela fonte luminosa durante um intervalo de tempo
∆tem define a potência de emissão luminosa da fonte, Lem = ∆Eem /∆tem . A energia de um
fóton, por sua vez, é proporcional à sua frequência, que por sua vez é proporcional ao inverso
do comprimento de onda λem no momento da emissão, ∆Eem ∼ 1/λem . Estes fótons vão viajar
pelo espaço-tempo até serem detectados hoje, e devido à expansão do universo, o comprimento
de onda desses fótos sofrerão uma alteração para um valor λ0 , de forma que a energia detectada
hoje deve ser ∆E0 ∼ 1/λ0 . Portanto deve valer a seguinte relação:
∆Eem λ0 a(t0 )
= = = 1+z, (9.5.4)
∆E0 λem a(tem )
onde usamos a relação (9.4.2) na penúltima igualdade e estamos considerando que tem corre-
sponde a um tempo t qualquer para a última igualdade, que segue de (9.4.9).
A taxa (ou intervalo de tempo) ∆tem com a qual os fótons são emitidos também é modificada
devido a expansão, de forma que a taxa de recebimento dos fótons hoje, ∆t0 , deve satisfazer
uma relação análoga a (9.4.2):
∆tem a(tem ) 1
= = , (9.5.5)
∆t0 a(t0 ) 1+z
de tal forma que a razão entre a potência observada hoje e a potência de emissão deve satisfazer
L0 1
Lem
= (1+z) 2 . Portanto, o fluxo luminoso observado hoje é:

Lem
F0 = . (9.5.6)
4πa(t0 )2 r2 (1 + z)2
A quantidade
dL ≡ a(t0 )r(1 + z) (9.5.7)
define a distância de luminosidade de uma fonte localizada no reshift z, de tal forma que a
expressão (9.5.1) é um caso particular se z = 0 e a(t0 ) = 1. Precisamos agora obter uma
expressão para a(t0 )r.

81
Vamos partir da métrica de FRW (8.1.1), agora colocando explicitamente a velocidade da
luz c para ficar claro as unidades envolvidas:
" #
2
dr  
ds2 = c2 dt2 − a(t)2 2
+ r2 dθ2 + sin2 θdφ2 . (9.5.8)
1 − kr

Um fóton de luz ou um raio luminoso emitido em algum instante de tempo t deve se propagar
em linha reta no espaço-tempo 4-dimensional, descrevendo um caminho chamado geodésica,
satisfazendo ds2 = 0, o que equivale a:
dr
cdt = ±a(t) √ . (9.5.9)
1 − kr2
O lado esquerdo claramente possui dimensão de comprimento, assim como o lado direito, se
considerarmos o fator de escala a(t) como uma quantidade adimensional. Um raio luminoso
partindo de algum ponto r no instante de tempo t vai se propagar até um ponto r0 nos tempos
atuais t0 , de tal forma que podemos integrar os dois lados:
Z t0 Z r0
dt dr
c =− √ . (9.5.10)
t a(t) r 1 − kr2
Se nos colocarmos no centro do sistema de coordenadas de tal forma que r0 = 0, a integral do
lado direito pode ser resolvida facilmente:

−1
Z r
dr  sin r, k = +1

√ = r, k = 0 (9.5.11)
0 1 − kr2  −1
sinh r, k = −1

Do lado esquerdo, usando a relação (9.4.9) para escrever ȧdt = −a0 (1 + z)−2 dz, obtemos:
Z t0 Z z
dt c 1
c = 0)
dz 0 , (9.5.12)
t a(t) a 0 0 H(z
onde definimos a(t0 ) = a0 por simplicidade.
O lado direito de (9.5.10) pode ser invertido com ajuda de (9.5.11) para fornecer uma
expressão para r, que será função do redshift z devido ao lado esquerdo:
Z z !
c 1
r(z) = S dz 0 , (9.5.13)
a0 0 H(z 0 )

sendo S(y) uma função do seu argumento, dada por:



 sin y, k = +1

S(y) = y, k = 0 (9.5.14)

sinh y, k = −1

Multiplicando apropriadamente por H0 e usando (9.4.15) para escrever em termos de Ωk , obte-


mos finalmente: " Z z #
1 1/2 H0 0
a0 r(z) = 1/2
sinh c Ωk 0
dz , (9.5.15)
H0 Ωk 0 H(z )

de onde segue a expressão para distância de luminosidade (9.5.7):


" Z z #
(1 + z) p H0
dL (z) = √ sinh c Ωk 0
dz 0 . (9.5.16)
H0 Ωk 0 H(z )

82
9.5.2 Distância de diâmetro angular dA
A relação entre a distância de luminosidade dL e a distância de diâmetro angular dA é:
dL
dA = , (9.5.17)
(1 + z)2
sendo que a distância de diâmetro angular leva em conta o tamanho angular de um objeto no
céu.

9.6 A idade do universo


Por fim, vamos ver como podemos calcular a idade do universo.
Definindo o tempo zero como aquele que corresponde ao fator de escala zero (redshift in-
finito). Já o tempo em que a luz foi emitida por uma fonte que está no redshift z pode ser
encontrado a partir da relação (9.4.9):
da da dz
dt = = =− . (9.6.1)
ȧ aH (1 + z)H(z)
Integrando entre 0 e t(z) obtemos:

dz 0
Z
t(z) = (9.6.2)
z (1 + z 0 )H(z 0 )
Essa é a idade do universo no redshift z. A idade total é dada por t(0):
Z ∞
dz 0
t(0) = t0 = , (9.6.3)
0 (1 + z 0 )H(z 0 )
e depende portanto dos valores dos parâmetros de densidade.
Para o modelo (9.4.18) temos:
Z ∞
1 dz 0
t0 = p . (9.6.4)
H0 0 (1 + z 0 ) ΩDM (1 + z 0 )3 + Ωk (1 + z 0 )2 + ΩΛ

A integral fornece um valor adimensional, já o fator 1/H0 pode ser expresso em unidades de
tempo.
Por exemplo, em segundos:
1 1 1 M pc 1 3, 0864 × 1019 km
= = s= s = 4, 41 × 1017 s
H0 70km/s.M pc 70 km 70 km
A integral em (9.6.4) para o modelo ΛCDM com ΩDM ' 0.30 e ΩΛ ' 0.70 fornece:
Z ∞
dz 0
p = 0, 9641
0 (1 + z 0 ) ΩDM (1 + z 0 )3 + Ωk (1 + z 0 )2 + ΩΛ
de tal forma que a idade em segundos é:
1
t0 = × 0, 9641 = 4, 25 × 1017 s ,
H0
ou em anos, que é mais comum:
4, 25 × 1017 s
t0 = = 13, 48 × 109 anos.
31.536.000s/ano

83
Esta é a idade estimada do universo no modelo ΛCDM.

Exercı́cio: Calcule a idade do universo dominado apenas por matéria, Ωm = 1.

Exercı́cio: Calcule a idade do universo dominado apenas por radiação, Ωr = 1.

84
CHAPTER 10
MODELOS COSMOLÓGICOS ALÉM DO MODELO PADRÃO

Neste capı́tulo final vamos apresentar brevemente alguns modelos cosmológicos que são
alternativas ao modelo padrão ΛCDM, tendo em vista que este modelo falha em explicar al-
guns dados relacionados às fases iniciais do universo. Em particular, o modelo com constante
cosmológica não prevê corretamente as perturbações iniciais necessárias para explicar a atual
distribuição de aglomerados e superaglomerados de galáxias no universo.
Os modelos alternativos podem ser de dois tipos principalmente. O primeiro tipo mantém
as equações da relatividade geral de Einstein como sendo a verdadeira teoria da gravitação, e
apenas adicionam algum conteúdo material exótico ao universo, como partı́culas fora do modelo
padrão da fı́sica de partı́culas elementares, para explicar o comportamento desejado no modelo.
Exemplos desse tipo são as teorias de matéria X, Gás de Chaplygin, modelos de quintessência,
modelos de Wang-Meng, modelos de decaimento do vácuo e de criação de partı́culas, modelos
com campos espinoriais de dimensão de massa 1, etc. Uma outra classe de teorias modifica a
teoria da gravitação de Einstein, tomando esta última apenas como um caso particular. São
as teorias de gravidade modificada do tipo F (R) por exemplo, modelos de Kaluza-Klein em
5 dimensões, teorias de Brans-Dike, modelos de gravidade newtoniana modificada (MOND),
entre outras.
No que segue apresentaremos apenas modelos do primeiro tipo.

10.1 Modelos de Energia Escura


Tendo em vista que o fator constante Λ do modelo padrão apresenta algumas inconsistências
em medidas mais precisas relacionadas aos primórdios do universo, alguns modelos alternativos
surgiram para substituir a constante cosmológica, são os chamados modelos de Energia Escura.

10.1.1 Modelo XCDM


Neste modelo, ao invés de uma constante cosmológica Λ, admite-se que exista um novo
conteúdo material do universo chamado matéria-X, com densidade de energia ρX e pressão PX
satisfazendo uma equação de estado do tipo PX = ωX ρX , com ωX < 0, mas não necessariamente
igual a −1, que é o caso do modelo com constante cosmológica. Esse novo conteúdo material
seria um tipo de matéria que não é observada mas produz um efeito de acelerar o universo,
assim como a constante cosmológica.
A equação de Friedmann para este modelo é:

85
k 8πG
H2 + 2
= (ρm + ρX ), (10.1.1)
a 3
com a equação de conservação para a componente X dada por:
ρ˙X + 3HρX (1 + ωX ) = 0 , (10.1.2)
e a equação do tipo (9.4.7) satisfeita pela matéria usual ρm . Note que o conteúdo de matéria
usual bariônica, matéria escura, radiação, etc continua em ρm . Note também que para ωX 6= −1
a densidade ρX evolui com o tempo, permitindo resolver alguns problemas que o modelo ΛCDM
não é capaz. A solução de (10.1.2) é:
 3(1+ωX )
a0
ρX = ρX0 , (10.1.3)
a
o que permite escrever a Eq. (10.1.1) como:
h i
2 2 3 2 3(1+ωX )
H (z) = H0 Ωm (1 + z) + Ωk (1 + z) + ΩX (1 + z) , (10.1.4)
com ΩX definido de forma apropriada e representando o parâmetro de densidade da componente
X.

Exercı́cio: Verifique que a Eq. (10.1.3) é solução de (10.1.2).

Exercı́cio: Obtenha a Eq. (10.1.4) para o modelo XCDM.

10.1.2 Modelo de Gás de Chaplygin


O modelo de Gás de Chaplygin é definido por uma equação de estado da forma PC = − ρAα ,
C
com A e α constantes a serem determinadas com os vı́nculos observacionais.
A equação de Friedmann para este modelo é:
k 8πG
H2 + 2
= (ρm + ρC ), (10.1.5)
a 3
com a equação de conservação para a componente de Chaplygin dada por:
ρ˙C + 3H(ρC + PC ) = 0 . (10.1.6)
A solução desta equação é:
 1
 3(1+α)  1+α
a
ρC = ρC0 As + (1 − As ) , (10.1.7)
a0
onde As = A/ρ1+α
C0 é uma constante e os ı́ndices ”0” se referem a quantidades nos dias de hoje.
Isto permite escrever a Eq. (10.1.5) como:
" #
1
H 2 (z) = H02 Ωm (1 + z)3 + Ωk (1 + z)2 + ΩC As + (1 − As )(1 + z)3(1+α) 1+α ,
 
(10.1.8)

com ΩC definido de forma apropriada e representando o parâmetro de densidade da componente


de Chaplygin.

Exercı́cio: Verifique que a Eq. (10.1.7) é solução de (10.1.6).

Exercı́cio: Obtenha a Eq. (10.1.8) para o modelo de Gás de Chaplygin.

86
10.1.3 Modelo de Quintessência ou Campo Escalar
Um outro modelo estudado recentemente é o chamado modelo de Quintessência ou modelo
de Campo Escalar. Ele é baseado na introdução de uma nova partı́cula (ou campo) na natureza,
representado por uma função escalar φ(t).
As equações de Friedmann para este modelo são (no caso plano, k = 0):

8πG
H2 = (ρm + ρφ ), (10.1.9)
3
2Ḣ + 3H 2 = −8πG(Pm + Pφ ) , (10.1.10)
onde ρρ e Pφ representam a densidade de energia e pressão do campo escalar φ. No caso de um
campo escalar distribuı́do homogeneamente em todo o universo, temos:
1 1
ρφ = φ̇2 + V (φ) , Pφ = φ̇2 − V (φ) . (10.1.11)
2 2
Derivando a Eq. (10.1.9) em relação ao tempo e usando a Eq. (10.1.10) obtém-se a equação
diferencial que deve ser satisfeita pelo campo escalar:
dV
φ̈ + 3 H φ̇ + = 0. (10.1.12)

Além disso podemos impor uma relação de equação de estado entre a pressão e densidade de
energia para o campo, Pφ = ωφ ρφ , onde
1 2
Pφ φ̇ − V (φ)
ωφ = = 21 , (10.1.13)
ρφ 2
φ̇2 + V (φ)

de tal forma que o sistema formado por (10.1.9)-(10.1.13) pode ser resolvido, dado algum
potencial V (φ) para o campo. Desta forma fica evidente que, dependendo do potencial V (φ),
o campo escalar pode agir como um tipo de energia escura no universo.

Exercı́cio: Derive a Eq. (10.1.9), use as Eqs. (10.1.10), (10.1.11) e obtenha a Eq. (10.1.12).

10.2 Modelo inflacionário


Outro modelo importante e necessário em cosmologia é o chamado modelo de inflação. A
inflação cósmica é um perı́odo de rápida expansão do universo que deve ter ocorrido entre t = 0
e t ∼ 10−32 s. Durante esse curto intervalo de tempo o fator de escala do universo deve crescer
por um fator da ordem de 1070 ∼ 1074 . Esta rápida expansão é necessária para explicar alguns
ploblemas que o modelo padrão ΛCDM sozinho não é capaz de resolver.
Um exemplo é o problema da homogeneidade do universo. Pelos cálculos do modelo padrão,
quando voltamos no tempo as equações correspondentes, encontramos que não deve haver
contato causal entre as partı́culas na época de domı́nio da radiação. Desta forma não é possı́vel
explicar a grande homogeneidade da radiação cósmica de fundo medida hoje em dia. Outro
exemplo é o porquê de o universo ter uma densidade tão próxima da densidade crı́tica. Esses e
outros problemas podem ser explicados através de modelos inflacionários. O mais comum deles
é explicado brevemente abaixo.

87
Considere que o universo era dominado por algum tipo de campo escalar formado por
partı́culas chamadas ı́nflaton. No inı́cio do universo somente esse campo dominava, de forma
que as equações de Friedmann são análogas as equações do modelo de quintessência:
8πG
H2 = ρφ , (10.2.1)
3
2Ḣ + 3H 2 = −8πGPφ , (10.2.2)
onde
1 1
ρφ = φ̇2 + V (φ) , Pφ = φ̇2 − V (φ) , (10.2.3)
2 2
satisfazendo:
1 2
Pφ 2
φ̇ − V (φ)
ωφ = = 1 . (10.2.4)
ρφ 2
φ̇2 + V (φ)
A equação diferencial satisfeita pelo campo φ é:
dV
φ̈ + 3 H φ̇ + = 0. (10.2.5)

Exercı́cio: Obtenha a Eq. (10.2.5) por meio da diferenciação da Eq. (10.2.1) em relação
ao tempo e usando as Eqs. (10.2.2), (10.2.3).

A principal diferença em relação aos modelos de quintessência está no potencial escolhido


para guiar o perı́odo inflacionário de forma adequada. Os potenciais tı́picos devem conter um
mı́nimo local ou global, como as funções:
2
φ2

1 2 2 4
V (φ) = m φ , V (φ) = λφ , V (φ) = A 1 − 2 , (10.2.6)
2 φ0
onde m, λ, A e φ0 são constantes a serem ajustadas pelo modelo para satisfazer os dados ob-
servacionais. Todas estas funções possuem algum ponto de mı́nimo, de tal forma que, enquanto
o campo se desloca para a posição do mı́nimo, a inflação ocorre. Após alcançar o mı́nimo,
o processo inflacionário acaba, e o universo segue a evolução de acordo com as equações do
modelo padrão.
Podemos entender qualitativamente como isso ocorre da seguinte maneira. Suponha um
potencial V (φ) tal que seu valor durante as fases iniciais do universo seja muito maior que a parte
2
cinética, V >> φ̇2 . Além disso supõe-se que o campo varia muito lentamente no inı́cio, φ̇ ∼ 0.
Neste caso a densidade de energia incial é aproximadamente constante, ρ ∼ V (φ). Isto significa
que o parâmetro da equação de estado deve satisfazer ωφ ' −1, o que é análogo ao que acontece
com o modelo  de 8πG
constante cosmológica da Seção 9.3.3. Analisando a equação de Friedmann
ȧ 2
 
(10.2.1), a ' 3 V , encontramos uma solução do tipo a(t) ' C exp (8πGV /3)1/2 t , que
representa um crescimento exponencial do fator de escala durante a fase inflacionária, que deve
durar até cerca de 10−32 s após o inı́cio do universo. Este é o comportamento tı́pico esperado
para modelos inflacionários.
A análise acima pode ser refinada para dar uma dica de como deve ser a forma do potencial
responsável pela inflação. As equações de Friedmann podem ser reescritas como:
κ2 1 2
H2 = [ φ̇ + V (φ)] , (10.2.7)
3 2
κ2 2
Ḣ = − φ̇ , (10.2.8)
2
88
φ̈ + 3H φ̇ + V 0 (φ) = 0 , (10.2.9)
onde V 0 (φ) ≡ dV /dφ e κ2 ≡ 8πG. Fazendo a suposição φ̇2 /2  V (φ), obtemos

κ2
H2 ' V (φ) , (10.2.10)
3
de tal forma que a condição Ḣ  H 2 também é satisfeita. Isso permite definir o chamado
parâmetro de slow-roll (φ) ≡ |Ḣ|/H 2  1.
Uma outra condição necessária para a inflação é que a taxa de variação do campo com o
tempo também seja muito pequena, φ̈  H φ̇, o que define um novo parâmetro de slow-roll,
η(φ) ≡ φ̈/H φ̇  1, de tal forma que a Eq. (10.2.9) fornece φ̇ ' −V 0 /3H.
Analisando as equações acima com as aproximações correspondentes, obtemos as seguintes
condições para os parâmetros  e η:
2
1 V 0 (φ)

|Ḣ|
(φ) ≡ 2 ' 2  1, (10.2.11)
H κ V (φ)

φ̈ 1 V 00 (φ)
|η(φ)| ≡ ' 2  1. (10.2.12)

H φ̇ κ V (φ)
Essas relações permitem escolher potenciais apropriados para satisfazer as condições da inflação
cósmica. Exitem muitos potenciais que satisfazem essas condições, de forma que o modelo
inflacionário pode ser implementado para uma gama muito grande de potenciais.
Como exemplo, para o potencial do tipo V = 12 m2 φ2 , as duas condições de slow-roll fornecem

2 1
=η=  1, (10.2.13)
κ2 φ2
√ √
o que impõe ao campo a condição φ  κ2 = √8πG 2
' 1019 GeV. Este valor é da ordem da
escala de energia da massa de Planck, que é exatamente a escala de energia que deve agir no
universo nos seus primórdios. Aliás, essa é também a escala de energia onde a própria fı́sica
quântica deixa de ser aplicada, necessitando de um modelo de gravidade quântica para atacar
o problema corretamente.

Exercı́cio: Obtenha as Eqs. (10.2.7) e (10.2.8).

Exercı́cio: Obtenha as Eqs. (10.2.11) e (10.2.12) para os parâmetros de slow-roll, usando


as aproximações necessárias.

Exercı́cio: Obtenha a condição (10.2.13) para o potencial V = 12 m2 φ2 .

Exercı́cio: Obtenha a condição equivalente a (10.2.13) para o potencial V = λφ4 .

Por fim, vale dizer que o modelo inflacionário para o inı́cio do universo somado ao modelo
padrão ΛCDM ou algum modelo de energia escura equivalente dão conta de explicar pratica-
mente toda a história do universo, com pequenos ajustes e detalhes que ainda precisam ser
melhor esclarecidos.

89

Você também pode gostar