Você está na página 1de 94

S Í LV I O R .

D A H M E N

BREVIÁRIO DE CÁLCULO TENSORIAL


Copyright © 2022 por S.R. Dahmen

s.r. dahmen
instituto de física
ufrgs

Versão de Julho 2022


Sumário


1 Tensores N: um relato pessoal 11
1.1 No início 11
1.2 E la nave va 13
1.3 E os tensores de antes? 17
1.4 O porquê de estudarmos tensores 19
1.5 A título de conclusão 21

2 Tensores I: definição e propriedades 23


2.1 Transformações de coordenadas 23
2.2 Definição formal de tensores 24
2.3 Interpretação geométrica 25
2.4 O tensor métrico gµν 29
2.5 Subir e baixar índices: nem tudo é o que parece 30
2.6 Algumas operações elementares com tensores 31
2.7 Acerca de tensores e variedades ∗ 32

3 Propriedades métricas do espaço 35


3.1 Distâncias e ângulos 35
3.2 O comprimento de uma curva 38
3.3 Partícula livre no espaço curvo: geodésicas 39
4

4 O Cálculo Tensorial 47
4.1 Acerca de abstração, poesia e física ∗ 47
4.2 Derivada parcial de um tensor 48
4.3 O transporte paralelo e a derivada covariante 52
4.4 Os símbolos de Christoffel ∗ 54
4.5 Derivada absoluta ∗ 55
4.6 Operadores em forma tensorial: grad, div e rot 57

A Vetores contravariantes e covariantes: uma visão


geométrica 63

B Os símbolos de Christoffel e coordenadas curvilíneas 69

C Dedução do caráter tensorial da derivada covariante 79

D Dedução da equação (3.34) 81

E A base tangente e a base dual 85

F Dois exemplos de transporte paralelo 91


Tolle numerum omnibus rebus et omnia pereunt.
Tire de todas as coisas os números e elas perecerão.
Isidoro de Sevilha, ca. 560 – 636 AD.

Ní dhéanfaidh smaoineamh an treabhadh duit.


Thinking won’t do the ploughing for you.
Provérbio irlandês.
A título de introdução

Quando abrimos um livro típico de Relatividade Geral para aprender


aquela que é para muitos a mais fascinante teoria da Física, chega um
momento no qual nos deparamos com um obstáculo aparentemente
instransponível: o cálculo tensorial. A teoria parece ser descrita em
termos de uma linguagem impenetrável, acessível apenas a um grupo
seleto de iniciados. Ao nos depararmos com uma expressão do tipo
1 µν
Γ
µ 
≡ g gαν ,β + g βν ,α − gαβ ,ν (1)
αβ 2
ou
Rνµαβ = Γντα Γτµβ − Γντβ Γτµα + Γνµβ ,α − Γνµα ,β (2)
vem a pergunta: o que estas expressões estão nos dizendo, exatamente?
Por que há índices ora em cima, ora embaixo, e alguns têm até uma
vírgula? Haveria uma maneira de ’traduzí-las’ para uma linguagem
menos críptica, mais mundana? A sensação de desconforto talvez só
seja maior quando vemos a mais famosa equação da Relatividade Geral,
as Equações de Campo de Einstein sem termo cosmológico

1 8π G
Rµν − R gµν = − 4 Tµν (3)
2 c
e percebemos que nada que vimos no curso regular de Física nos
preparou para entender exatamente o seu significado. Não se trata
tanto do que são as grandezas mas da estrutura da equação em si: é
uma igualdade entre matrizes? Sim, é. Seria uma equação diferencial?
Também, embora à primeira vista nada nos indique que o seja. Deve
haver mais de uma equação, dado os diferentes índices. Quantas são
exatamente? No total 10.
Surgem então as perguntas: precisamos realmente de tudo isto para
entender a Relatividade Geral de Einstein? Não haveria um caminho ao
largo desta linguagem tensorial? A resposta à primeira questão é ’sim,
precisamos’, e à segunda é ’não, não tem’. As Equações de Einstein
descrevem a física do fenômeno que conhecemos por gravitação como
sendo a geometria do espaço-tempo codificada no tensor métrico gµν .
Se pudéssemos descrever a Teoria da Relatividade Geral em poucas
palavras, a faríamos como fez Einstein:
8 uma introdução à teoria do espaço e do tempo

Gravidade não é uma força externa e física transmitida através do espaço


e tempo. Ela é uma manifestação da curvatura do espaço 1 . 1
A. Einstein, Die Grundlage der Allgemeine
Relativitätstheorie, Annalen der Physik 49
Uma teoria fundamentada em Geometria não pode depender do sis- (1916), pp. 769 - 822.
tema de coordenadas pois objetos geométricos têm uma existência in-
dependentes destes. Portanto uma teoria geometridinâmica do espaço-
tempo só pode ser formulada numa linguagem que independa deste
ou daquele sistema de coordenadas: a linguagem de tensores e do
cálculo tensorial (ou cálculo diferencial absoluto) de Christoffel, Bel-
trami, Bianchi, Ricci e Levi-Civita. Não se trata portanto de uma criação
extravagante de físicos e matemáticos, mas sim da própria essência
do espaço-tempo que nos cerca. Para entender a teoria é portanto
necessário entender sua linguagem.
Estas notas de aula estão organizadas da seguinte forma:
 No capítulo 1 eu descrevo minha própria perplexidade quando,
ainda estudante, vi tensores sob um ponto de vista mais abstrato
pela primeira vez. A leitura deste capítulo não é obrigatória para o
entendimento dos outros capítulos e tem por objetivo apenas con-
textualizar o assunto. Tensores aparecem em diferentes momentos
no curso de Física, mas em contextos muito específicos e em espaços
planos, sendo que a ênfase é sempre na física que eles descreviam e
não naquilo que os define enquanto objetos matemáticos.

 No capítulo 2 tensores são definidos rigorosamente em termos de


suas propriedades de transformação por mudança de coordenadas.
Além de discutir a interpretação geométrica de bases covariantes e
contravariantes, introduzo o importante conceito de tensor métrico
ou forma métrica fundamental, o famoso gµν . Esta é a grandeza
mais importante da Relatividade Geral. Discuto também a idéia de
variedades Riemannianas M de n dimensões e a idéia de espaços
tangentes TP (M) e espaços cotangentes TP∗ (M) à variedade no
ponto P ∈ M.

 Com o objetivo de familiarizarmo-nos com as novas idéias, discuto


no capítulo 3 as propriedades métricas do espaço e o movimento
de uma partícula livre no espaço curvo. Isto nos leva à formulação
da equação de movimento em linguagem tensoriale portanto inde-
pendente de qualquer sistema de coordenadas. Aqui é discutido o
importante conceito de geodésica.

 No capítulo 4 são discutidos os importantes conceitos de transporte


paralelo, conexão afim, derivada covariante e curvatura do espaço. Em
suma, os principais conceitos de cálculo sobre variedades são descri-
tos neste capítulo.

 Ao final das notas há uma série de apêndices onde alguns dos


conceitos discutidos são revisitados em espaços planos com sistemas

© s.r. dahmen 2022


SUMÁRIO 9

de coordenadas curvilíneas. A analogia entre espaços curvos e espa-


ços planos com coordenadas curvilíneas nos dá uma noção mais
intuitiva das grandezas definidas, em particular os símbolos de Ch-
ristoffel. Estes apêndices fazem parte das notas de aula do curso de
Fundamentos de Relatividade por mim ministrado.

Os capítulos ou seções que podem ser pulados sem afetar o conteúdo


principal são marcados por um asterisco (*).

Notação usada

Usaremos aqui a notação de Einstein para somas: sempre que numa


expressão aparecerem 2 índices repetidos, há sobre eles uma soma
implícita, ou seja

N
Ai Bi ≡ ∑ Ai Bi Notação de Einstein para somas (4)
i =1

É muito importante prestarmos atenção a isto pois embora pareça


algo sem muita relevância, muitos erros ou compreensão errada de
equações vêm pelo fato de muitas vezes esquecermo-nos deste detalhes.
Em alguns casos, por uma questão de clareza, o símbolo Σ para uma
somatória pode aparecer explicitamente. Isto não implica que se Σ não
aparece, ele não esteja lá!
Seguindo a convenção da área, um ponto P num espaço n-dimensional
é especificado pelo uso de n coordenadas representadas pelo n-tuplo
{ xi } = ( x1 , x2 , · · · , x n ). Cada x k é portanto uma variável e não a k-
ésima potência da variável x. Para o espaço-tempo 4-dimensional da Fí-
sica, um quádruplo de coordenadas é representado por { x0 , x1 , x2 , x3 }
ou, dependendo do autor, por { x1 , x2 , x3 , x4 }. No primeiro tem-se
x0 = ct e no segundo, x4 = ict. As coordenadas { x1 , x2 , x3 } sempre se
referem à parte puramente espacial do espaço-tempo. Alguns autores
reservam o alfabeto grego para índices que representam as 4 coordena-
das do espaço-tempo, ou seja { x µ }, µ = 0, 1, 2, 3 ou µ = 1, 2, 3, 4. Estes
mesmos autores reservam o alfabeto latino para se referir especifica-
mente aos eixos espaciais, isto { x k }, k = 1, 2, 3. Não existe porém uma
convenção universal quanto a isto e cada autor usa a notação que acha
mais conveniente. Isto geralmente não causa maiores problemas de
interpretação pois os valores que os índices assumem ficam sempre
claros pelo contexto.

© s.r. dahmen 2022


10 uma introdução à teoria do espaço e do tempo

A filosofia deste curso

Todo curso deve ter um objetivo e alguns princípios ou valores que o


norteiam.

Objetivo: aprender Relatividade Geral mas, em o fazendo, expandir


nosso potencial e nos ensinar a humildade perante nossa própria igno-
rância.

Valores:

i. Integridade: seja honesto, justo e tenha respeito para com todos.

ii. Curiosidade: seja curioso, explore, pergunte. Não tenha vergonha


de não saber.

iii. Inclusão: aproveite o imenso potencial que a inclusão representa.


Busque o que nos une, não o que nos diferencie.

iv. Dedicação: dê o melhor de si.

v. Compaixão: importe-se com os outros.

Estes valores se aplicam a todos nós.

© s.r. dahmen 2022


1

Tensores N: um relato pessoal

“Professor, o que é um tensor?”, perguntei.


“Pense numa matriz!”, foi a reposta.

1.1 No início
1
A. Z. Petrow, Einstein-Räume. Akademie-
Verlag, Berlin, 1964, p. 4. Aleksei Zi-
A primeira vez que vi a definição de tensor num contexto mais abstrato
novyevich Petrov (1910–1972) foi um ma-
fiquei perplexo, pois aquilo não guardava qualquer semelhança os temático russo que muito contribui para
tensores que eu conhecia. Reproduzo aqui a definição de um dos a classificação de tipos de soluções das
Equações de Einstein, a chamada classi-
clássicos da Relatividade Geral1 , descrição esta muito parecida com a ficação de Petrov. Existe uma edição em
do livro onde a vi pela primeira vez 2 : inglês, Einstein Spaces, publicado pela edi-
tora Elsevier.
Por um tensor de ordem (r + s) em um espaço n-dimensional entendemos um 2
G. B. Arfken, H. J. Weber e F. E. Harris,
objeto geométrico de n (r+s) componentes Mathematical Methods for Physicists, Aca-
demic Press, Boston, 2013.
··· αr
Tβα11 ··· βs (x) (α1 · · · αr , β 1 · · · β s = 1, · · · , n) (1.1)
0
as quais, por uma mudança de coordenadas ( x α ) → ( x α ), se transformam
segundo a regra
0 0
α0 ··· α0 ∂x α1 ∂x αr ∂x δ1 ∂x δs γ1 ··· γr
Tβ01 ··· β0r ( x 0 ) = · · · γr 0 ··· 0 T (x) (1.2)
1 s ∂x γ1 ∂x ∂x 1 β ∂x β s δ1 ··· δr

Nas palavras do físico americano D.E. Neuenschwander, definir tenso-


res deste modo é como tentar explicar o conceito “dinheiro” usando a
taxa de conversão entre diferentes moedas. Duas coisas porém me sal-
taram aos olhos quando vi esta definição pela primeira vez: há alguns
índices superscritos (índices contravariantes, como eu viria descobrir
mais tarde) e subescritos (índices covariantes). Também notei que o
tipo de derivada parcial estava relacionada à posição do índice: dx 0 /dx
para índices contravariantes e dx/dx 0 para os covariantes (devemos
tomar cuidado pois, ao contrário do que parece, dx 0 /dx 6= (dx/dx 0 )−1 .
Discutiremos isto mais para a frente). Embora notasse a consistência
da definição e pudesse fazer contas seguindo as regras conhecidas, não
era claro o motivo de definir algo pelas regras de transformação. Era
12 uma introdução à teoria do espaço e do tempo

como conhecer as regras para mover peças no tabuleiro de xadrez sem


saber exatamente qual o objetivo do jogo.
Minha perplexidade se devia em parte ao fato que eu já conhecia ou-
tros tensores. Um deles era o momento de inércia de uma distribuição
de N massas discretas:
N  

(k) (k)
Iij = mk ||rk ||2 δij − xi xj , (1.3)
k =1

e outro o tensor momento de quadrupolo de uma distribuição contínua


de cargas de densidade ρ(r):
Z  
Qij = ρ(r) 3ri r j − krk2 δij d3 r. (1.4)

Estes tensores têm 2 índices, mas havia um de 3, o momento de octupolo


da distribuição contínua de cargas :
Z   
2
Ωijk = 12 ρ(r) 5ri r j rk − r δij rk + δik r j + δjk ri . (1.5)

Estas grandezas me eram conhecidas de um contexto específico, que


lhes dava um sentido físico. Mas qual a relação entre eles e a definição
de Petrov? Foi pensando na expansão de multipolo do potencial elétrico
que comecei a perceber um padrão, primeiro com relação aos número
de índices: a expansão começa com um escalar, o monopolo (carga).
Escalares não tem componentes e portanto não precisam de índices. O
segundo termo é proporcional ao momento de dipolo p, um vetor, e
vetores tem um índice para as componentes. O número de índices – a
ordem ou rank do tensor – está relacionado ao número de componentes
que precisamos para descrever a grandeza na sua totalidade. Escalares
são portanto ’tensores de ordem 0’ e vetores são ’tensores de ordem 1’.
Em segundo lugar percebi também uma relação, ainda que vagamente,
com o fato que escalares serem grandezas invariantes (carga elétrica)
mas que vetores (momento de dipolo) mudem de acordo com o sistema
de coordenadas que escolhemos para representá-los. Na realidade
os vetores enquanto objetos físicos não mudam, o que muda é a sua
representação e não devemos confundir a natureza com a representação
de um objeto. A definição de Petrov e tantos outros fazia assim mais
sentido: definir uma grandeza pela sua regra de transformação está
relacionado ao fato que a física não pode depender do sistema de
coordenadas escolhido. Trata-se portanto de uma definição de cunho
muito mais fundamental que as definições operacionais de contextos
específicos que eu conhecia.
Faltava ainda entender a diferença entre índices covariantes e contra-
variantes, em particular entre o nome e significado: eles variam “junto”
ou “contra” o quê, exatamente? Quando damos nomes às coisas na

© s.r. dahmen 2022


tensores n: um relato pessoal ∗ 13

ciência esperamos que estes mesmos nomes façam algum sentido ló-
gico 3 . Se eles tinham este nome, havia um motivo para que tivessem 3
Embora não discutamos muito isso no
sido assim chamados. Mas foi preciso um pouco mais de tempo para curso de Física, um pouco de etimolo-
gia nos ajudaria entender a idéia por trás
que eu conseguisse desatar este nó e ligar os pontos corretamente. de certos conceitos. O termo átomo, por
exemplo, vem da combinação das raízes
gregas a (não) com temnein (cortar). Por-
1.2 E la nave va tanto átomo é aquilo que não pode ser
cortado, dividido. Os átoms seriam assim
indivisíveis. Pelo mesmo motivo obras
Faltava ainda entender a questão da relação entre os índices superiores
podem ser publicadas em tomos.
e inferiores e as regras de transformação. Haveria um maneira de
entender isto geometricamente? Tentei imaginar um caso simples para
entender o que realmente estava acontecendo. O caso mais simples
não é interessante pois escalares são invariantes. Pensemos então em
vetores, que são os próximos da lista. Segundo Petrov a regra de
transformação é a seguinte:

∂x 0 a b
A0 a = A vetor contravariante (1.6)
∂x b
∂x b
A0a = A vetor covariante ou covetor (1.7)
∂x 0 a b
Quanto mapeamos um espaço nós o fazemos usando um sistema
de coordenadas. Quando pensamos nas componentes de um vetor,
ou seja, em suas projeções no eixo de coordenadas, devemos ter em
mente que os valores numéricos destas projeções só fazem sentido
em relação aos eixos escolhidos e não têm um significao intrínsico
independende destes. Um vetor não pode deixar de ser um vetor
quando escolhemos bases diferentes. Tomemos o caso simples de um
espaço plano bidimensional. Vamos supor que optemos por uma outra
base {e10 , e20 }, obtida a partir de uma base original {e1 , e2 } através de
uma transformação de coordenadas bem comportada. A relação entre
os vetores da base antiga e os da base nova pode ser escrita na forma

e10 = Λ11 e1 + Λ12 e2


e20 = Λ21 e1 + Λ22 e2 (1.8)

ou, se preferirmos
! ! !
e10 Λ11 Λ12 e1
= . (1.9)
e20 Λ21 Λ22 e2
Em palavras poderíamos descrever a matriz acima como

! ! !
e10 projeção de e10 sobre e1 projeção de e10 sobre e2 e1
=
e20 projeção de e20 sobre e1 projeção de e20 sobre e2 e2

Por outro lado, um vetor v de componentes v1 e v2 pode ser escrito na


nova base em termos de duas componentes v10 e v20 que representam

© s.r. dahmen 2022


14 uma introdução à teoria do espaço e do tempo

suas projeções nos versores e10 e e20 respectivamente. Ou seja, partindo


da representação na base original

v = v1 e1 + v2 e2 (1.10)

precisamos expressar e1,2 em termos de e1,2 0 . Isto nada mais é que

inverter (1.9) e substituir o resultado na expressão acima. Em outras


palavras, escrevemos uma relação matricial cujos elementos são os vetores
da base antiga expresso em termos dos vetores da base nova:

! ! !
v10 projeção de e1 sobre e10 projeção de e2 sobre e10 v1
=
v20 projeção de e1 sobre e20 projeção de e2 sobre e20 v2

Estas matrizes obviamente não são as mesmas. Uma análise um pouco


mais detalhada nos mostra que a segunda matriz é obtida tomando a
transposta da inversa da primeira matriz. Chamando a primeira matriz
de Λ, a segunda é Λ̄ = [Λ−1 ] T , temos
! ! ! !
e10 e v10 v1
=Λ 1 ; = Λ̄ (1.11)
e20 e2 v20 v2
Vetores que assim se transformam são por este motivo chamados de
contravariantes, uma vez que se transformam de maneira contrária
(inversa) àquela pela qual os vetores da base se transformam. Um
exemplo simples onde podemos ver isto claramente é na transformação
de referenciais segundo a seguinte regra:

1
e10 = e ; e20 = e2 , (1.12)
2 1
ou, em forma matricial:
! ! !
e10 1
2 0 e1
= . (1.13)
e20 0 1 e2

Nesta nova base temos um vetor e10 cuja magnitude é metade do vetor
e1 ao passo que e20 = e20 . Portanto, um vetor v tem, segundo a regra
v0 = Λ̄v, a seguinte forma:
! " ! −1 # T !
v10 1
20 v1
=
v20 0 1 v2
! !
2 0 v1
= (1.14)
0 1 v2

Isto implica que por exemplo um vetor v = (v1 , v2 ) = (1, 1) = e1 + e2


tem, na nova base, a forma v0 = (v10 , v20 ) = (2, 1) = 2e10 + e20 . Para que o
vetor continue o mesmo, se diminuimos o vetor da base pela metade, a

© s.r. dahmen 2022


tensores n: um relato pessoal ∗ 15

Figura 1.1: Ao transformarmos uma base


em outra, para que o vetor não mude, so-
mos obrigados a mudar suas componen-
tes de maneira contrária à mudança do
vetor da base. Assim, se e10 tem a metade
v = (1,1) v = (2,1) da magnitude do vetor e1 , a componente
v10 tem que ter o dobro da magnitude
e e’ para que o vetor não mude de tamanho.
2 2

e e’
1 1

componente v10 tem que dobrar de tamanho para que o vetor continue
igual. A figura abaixo ilustra esta situação. Um outro exemplo simples
onde podemos claramente entender a idéia de vetor contravariante é o
de uma rotação passiva: quando giramos os eixos ordenados por um
ânguloθ, um vetor que é fixo no espaço parecerá ter girado por um
ângulo de −θ quando visto deste novo sistema de coordenadas 4 . 4
Existe uma diferença grande entre trans-
A pergunta que nos fazemos agora é se haveria vetores que mudam formações passivas e ativas: as passivas
são aquelas em que os eixos de coordena-
da mesma maneira que a base. Considerando ainda o exemplo acima: das mudam, mas o objeto permanece inal-
seria possível achar um vetor cuja componente v1 mudasse para v10 = terado. Uma transformação ativa ocorre
1 0 quando o objeto em si muda, mas os ei-
2 v1 e v2 = v2 ? A resposta é sim: na verdade é exatamente isto o que xos não. No exemplo da rotação, a trans-
ocorre com o gradiente de uma função. O gradiente nada mais é que uma formação passiva é quando giramos os
medida da variação da função por unidade de comprimento na direção eixos. A ativa, é quando o vetor gira, mas
os eixos permanecem inalterados. Por via
dos vetores da base. Se a unidade encolhe como no caso ilustrado de regra as transformações a que estamos
acima, a variação também deve encolher. Imaginemos o caso em que a nos referindo aqui são sempre passivas,
pois estamos interessados em mudanças
função T ( x, y) represente a temperatura de uma sala. O gradiente mede de coordenadas.
simplesmente o quanto a temperatura muda a medida que caminhamos
por ela. Se houver um incremento de distância de, digamos, ∆x = 10−2 ,
o mesmo incremento ∆x 0 = 10−2 corresponde, fisicamente falando,
a metade do incremento de unidades de x e portanto a variação de
temperatura – o gradiente – será metade do valor. Portanto o gradiente
é um vetor que muda da mesma maneira que a base, razão pela qual
é mais apropriadamente chamado de um vetor covariante ou covetor.
Tomemos um exemplo simples. Consideremos T ( x, y) = x + y, cujo
gradiente é dado por

∂T ∂T
∇ T ( x, y) = i+ j = Tx i + Ty j = i + j. (1.15)
∂x ∂y

Aplicando as regras de derivação parcial temos

∂T ∂x ∂T 1
= = × Tx
∂x 0 ∂x 0 ∂x 2
∂T ∂y ∂T
= = 1 × Ty . (1.16)
∂y0 ∂y0 ∂y

© s.r. dahmen 2022


16 uma introdução à teoria do espaço e do tempo

Em notação matricial
! ! !
1
Tx0 2 0 Tx
= , (1.17)
Ty0 0 1 Ty

Ou seja, o gradiente de transforma pela mesma matriz Λ da transfor-


mação dos vetores da base. Resumindo temos:

e0 = Λ e −→ mudança da base. (1.18)


v0 = Λv −→ vetor covariante. (1.19)
0 −1 T
v = (Λ ) v −→ vetor contravariante. (1.20)

Nota-se também uma diferença importante entre vetores “usuais” e


gradientes. Pensemos na velocidade como exemplo típico de um vetor
“usual”
dr
v= . (1.21)
dt
Muitos dos vetores “usuais” da Física representam a variação de um
vetor como função da variação de um parâmetro escalar. Eles são
a razão, por assim dizer, de um vetor infinitesimal por um escalar
infinitesimal. Por outro lado, com os gradientes ocorre o contrário:
eles representam a variação de uma função escalar pela variação de
um deslocamento no espaço, isto é um vetor. Por isto nos referimos
comumente ao gradiente como uma derivada direcional. Isto me ajudou
inicialmente a memorizar a posição dos índices, embora esta analogia
não deva ser tomada literalmente:
dx  ∆ vetor 
vx = → → índice em cima (1.22)
dt  ∆ escalar
df ∆ escalar
∇x f = → → índice embaixo (1.23)
dx ∆ vetor

Normalmente se diz em linguagem técnica que vetores covariantes


são os duais dos vetores contravariantes. Isto está relacionado, como
veremos, ao fato que vetores contravariantes viverem, rigosamente
falando, num espaço tangente ao espaço no ponto P onde são defini-
dos. A velocidade é um bom exemplo disso: quando dizemos que
a velocidade é tangente ao deslocamento – por mais óbvio que isto
possa parecer – geometricamente estamos falando que a velocidade
não “vive” no mesmo espaço unidimensional que a curva que define a
trajetória do corpo em questão, mas num espaço (uma reta) tangente
a este. É óbvio que se o movimento é retilíneo, o espaço tangente e o
espaço da trajetória são idênticos. Isto explica o porquê de dizermos
em Relatividade Geral que só quando uma variedade Riemanniana tem
uma métrica Euclideana ou Minkowskiana ela e seu espaço tangente
coincidem. Analogamente, os vetores covariantes vivem no chamado
espaço cotangente. Isto ficará mais claro ao longo do curso.

© s.r. dahmen 2022


tensores n: um relato pessoal ∗ 17

Um dos problemas que vamos encontrar no curso de Relatividade


Geral é que o termo covariante é usado de três maneiras diferentes e a
distinção se faz pelo contexto em que são usados.

(i) Covariante pode se referir à invariância da forma de uma lei ou


equação. Basicamente o que estamos dizendo é que a forma da
equação independe do sistema de coordenadas escolhido.

(ii) Covariante pode se referir à posição dos índices de um tensor, neste


caso a suas propriedades de transformação.

(iii) Covariante pode se referir a um tipo de derivada. A derivada


usual de um tensor não é necessariamente um tensor. Para que seja,
é necessário definir uma derivada especial, a derivada covariante. Por
isto falamos da derivada covariante de um vetor covariante ou da
derivada covariante de um vetor contravariante.

1.3 E os tensores de antes?

Nossa dificuldade com tensores se deve em parte ao fato que lida-


mos com estes conceitos em situações bastante particulares e não nos
preocupamos em entendê-los na sua generalidade. Lembro-me bem
disto quando, na Eletrodinâmica, descobri a existência do tensor das


tensões de Maxwell, muitas vezes representado pelo símbolo T . Ele é
construído a partir dos vetores fundamentais E e H da Eletrodinâmica
via um produto tensorial ou diádico, representado muitas vezes pelos
símbolos ⊗ ou ∧:

→ eE2 + µH2
T = eE ⊗ E + µH ⊗ H − I. (1.24)
2
A matriz I é a matriz identidade 9 × 9 e representa o produto tensorial
de duas matrizes identidade 3 × 3, ou seja I = I3×3 ⊗ I3×3 . Isto significa
que o produto de tensorial de dois vetores de componentes Ea e Hb
produz um tensor que também pode ser escrito como

eE2 + µB2
Tab = eEa Eb + µHa Hb − δab (1.25)
2

O produto diádico entre os vetores

a = a1 i + a2 j + a3 k
b = b1 i + b2 j + b3 k

é definido via:
a∧b = a1 b1 (i ∧ i) + a1 b2 (i ∧ j) + a1 b3 (i ∧ k)
+ a2 b1 (j ∧ i) + a2 b2 (j ∧ j) + a2 b3 (j ∧ k) (1.26)
+ a3 b1 (k ∧ i) + a3 b2 (k ∧ j) + a3 b3 (k ∧ k)

© s.r. dahmen 2022


18 uma introdução à teoria do espaço e do tempo

Podemos representá-los diretamente na forma de um produto externo de


matrizes:
 
a1
a ∧ b ≡ a ⊗ b ≡ abT =  a2  (b1 b2 b3 )
 
a3
 
a1 b1 a1 b2 a1 b3
=  a2 b1 a2 b2 a2 b3  (1.27)
 
a3 b1 a3 b2 a3 b3

Em termos da representação matricial, da mesma maneira que os vetores da


base i, j, k são representados por:
     
1 0 0
i = 0, j = 1, k = 0 (1.28)
     
0 0 1

os elementos de base diádicos são dados por:


     
1 0 0 0 1 0 0 0 1
i ∧ i = 0 0 0, i ∧ j = 0 0 0, i ∧ k = 0 0 0
     
0 0 0 0 0 0 0 0 0
     
0 0 0 0 0 0 0 0 0
j ∧ i = 1 0 0, j ∧ j = 0 1 0, j ∧ k = 0 0 1 (1.29)
     
0 0 0 0 0 0 0 0 0
     
0 0 0 0 0 0 0 0 0
k ∧ i = 0 0 0, k ∧ j = 0 0 0, k ∧ k = 0 0 0
     
1 0 0 0 1 0 0 0 1

Tudo isto obviamente era feito numa linguagem um pouco diferente daquela
que eu viria a encontrar futuramente. Porém, isto esclarecia o porquê de eu
ter visto em um livro que uma das propriedades de tensores era criar novos
tensores de ordem mais alta multiplicando tensores de ordem mais baixa, por
exemplo

C ab = A a Bb ou Cab = A a Bb ou ainda C ab = A a Bb (1.30)

Na expressão acima A e B são vetores (covariantes ou contravariantes, a de-


pender do caso) e isso nada mais era que aquilo que eu aprendera na Eletro-
dinâmica, embora expresso de uma outra forma. Qual foi a minha surpresa
quando, mais tarde, reencontrei estas mesmas idéias na Mecânica Quântica
com a notação de Dirac – os bras hΨ| e os kets |Ψi – que nada mais são que
tensores no espaço de Hilbert! A mesma estrutura, a mesma linguagem – os
bras como sendo os duais dos kets – e a mesma maneira de os compor:

|iji = |i i ⊗ | ji = |i i | ji ou hij| = hi | ⊗ h j| = hi | h j| (1.31)

Isso fez com que eu visse com mais clareza o poder da notação tensorial. O
que torna a notação de Dirac especial é sua generalidade e poder de síntese
pois se soubermos manipular corretamente os bras e kets, é possível fazer contas
sem nos preocuparmos com sua representação. Apenas quando precisamos
trazer o resultado para o espaço e tempo do nosso laboratório é que fazemos

© s.r. dahmen 2022


tensores n: um relato pessoal ∗ 19

a opção pela representação que melhor nos aprouver. A filosofia por trás
da geometria diferencial é exatamente a mesma. Há porém uma diferença
importante: podemos aprender Mecânica Quântica sem sequer ouvirmos falar
da notação de Dirac. Ela é de uma grande beleza e praticidade, mas não
é necessária. Em Relatividade Geral tensores não são uma opção, são uma
necessidade, e isto por questões mais fundamentais. É um erro acreditar que
seja possível aprender Relatividade Geral sem tensores 5 . 5
Poderia se argumentar contra esta afir-
mação: há um livro bastante interessante
de Relatividade Geral intitulado Einstein
1.4 O porquê de estudarmos tensores in Matrix Form: Exact Derivation of the The-
ory of Special and General Relativity without
O uso de tensores na Relatividade Geral está diretamente associado à geometri- Tensors, de G. Ludyk (Springer Verlag,
Heidelberg, 2013). Ludyk escreveu o li-
zação do espaço-tempo. Objetos geométricos têm uma realidade independente
vro pensando em estudantes de Exatas,
das coordenadas usadas para descrevê-los algebricamente. Por isso as equações mas mais particularmente para as Enge-
da Relatividade Geral e, pelo princípio da equivalência de Einstein, todas as nharias, um público mais habituado à
equações da Física precisam ser escritas de forma covariante. A linguagem linguagem de produtos diádicos entre
tensorial é portanto a linguagem natural da TRG. O caráter generalista ex- vetores. Portanto é possível não usar a
linguagem tensorial dos físicos e matemá-
plica também o nome originalmente dado ao cálculo de tensores por Gregorio
ticos, como faz Ludyk, escolhendo uma
Ricci-Curbastro e popularizado por seu estudante Tullio Levi-Civita: cálculo representação mais voltada para um pú-
diferencial absoluto, hoje mais comumente chamado de cálculo de Ricci 6 . Na blico específico. Porém, a notação esco-
sua forma moderna o cálculo tensorial deve muito ao matemático holandês Jan lhida torna os cálculos tão extensos que
A. Schouten que publicou um livro intitulado O Cálculo de Ricci 7 . fica claro como uma notação tensorial de
índices não apenas é elegante como nos
Tensores, historicamente falando, surgiram do estudo de objetos geomé-
poupa um enorme trabalho.
tricos em espaços generalizados, não tendo a física como objetivo ulterior. A 6
G. Ricci, T. Levi-Civita, Méthodes de cal-
Geometria é o ramo mais antigo da matemática mas sistemas de coordenadas cul différentiel absolu et leurs applications,
só foram introduzidos no século XVII. Foi a partir da sua invenção que os ma- Mathematische Annalen 54 (1–2) (1900),
temáticos puderam usar a Álgebra para descrever a Geometria. Isto permitiu, pp. 125–201. T. Levi-Civita
entre outras coisas, que o Cálculo fosse criado. Não obstante sua praticidade, 7
J.A. Schouten, Der Ricci-Kalkül: Einfüh-
sistemas de coordenadas não estão livres de armadilhas e pagamos um preço rung in die neueren Methoden und Probleme
quando associamos a Álgebra à Geometria: perdemos em alguns casos a visão der mehrdimensionalen Differentialgeometrie
[O cálculo de Ricci: introdução aos novos
geométrica do problema que estejamos eventualmente estudando. Um dos métodos e problemas da geometria diferencial
exemplos que melhor ilustra esta ponto é o da minimização da superfície multidimensional], Springer, Berlin, 1924.
cujo contorno é uma curva C em R3 conhecida. Matematicamente temos um Este livro é o volume 10 da famoso série
problema de minimização de uma área de manuais de matemática com aplica-
ções editadas por Richard Courant, Carl
Z
Runge, Max Born e Wilhelm Blaschke:
A= dS (1.32) Die Grundlehren der Mathematischen Wis-
S(C )
senschaften in Einzeldarstellung mit besonde-
sobre todas as possíveis superfícies S do contorno C fixo, ou seja um problema rer Berücksichtigung der Anwendungsgebiete
de cálculo variacional [Estudos fundamentais das Ciências Matemá-
ticas em Monografias com particular conside-
Z 
δA = δ dS = 0. (1.33) ração às Áreas de Aplicação.

Este problema foi resolvido por Lagrange em 1762. Ele mostrou que se a
superfície é dada pela expressão

z = F ( x, y) (1.34)

em coordenadas cartesianas, então a superfície de área mínima é aquela cuja


equação F ( x, y) satisfaz

Fxx + Fyy + Fxx Fy2 + Fyy Fx2 − 2Fx Fy Fxy = 0 , (1.35)

onde os Fxi x j representam as derivadas parciais de F. Esta nada mais é que a


equação de Euler-Lagrange para o funcional (1.32), em completa analogia com

© s.r. dahmen 2022


20 uma introdução à teoria do espaço e do tempo

as equações de Euler-Lagrange da Mecânica Clássica. Lagrange não tinha como


saber o que a expressão acima realmente significava e foi apenas em 1776 que
o matemático Jean Baptiste Meusnier (1754 – 1793) mostrou que a superfície
mínima é aquela que tem a curvatura média igual a zero, onde a curvatura média
Bαα é dada por 8 8
A curvatura média é o traço do tensor
de curvatura extrínseca Bβα . Ela difere da
Fxx + Fyy + Fxx Fy2 + Fyy Fx2 − 2Fx Fy Fxy curvatura intrínseca da Relatividade Ge-
. (1.36) ral Rαβ que aparece nas Equações de Eins-
(1 + Fx2 + Fy2 )3/2
tein. As duas porém estão relacionadas
A equação (1.35) ganha assim um sentido físico, palpável. Imagine agora um pelo célebre Teorema Egrégio de Gauss de
outro problema que é de extrema importância na biologia de membranas: a 1827.
minimização do quadrado da curvatura média 9 . Em coordenadas cartesianas 9
Este problema está relacionado à mini-
temos mização da energia de superfície de mem-
Z ( Fxx + Fyy + Fxx Fy2 + Fyy Fx2 − 2Fx Fy Fxy )2 branas de lipídeos que, em primeira apro-
E≈ dxdy . (1.37) ximação, é proporcional ao quadrado da
(1 + Fx2 + Fy2 )3 curvatura média. F. David, em Statisti-
Se aplicarmos as técnicas do cálculo variacional diretamente neste expressão, cal Mechanics of Membranes and Surfaces,
surge um termo difícil de ser interpretado em função de conceitos conhecidos, D. Nelson, T. Piran, and S. Weinberg
(eds), 2nd ed., World Scientific, Singa-
como a figura abaixo deixa claro. Aplicando o cálculo variacional à curvatura
pore, 2004.

Figura 1.2: O Laplaciano da curvatura


média Bαα em coordenadas cartesianas.
Fonte: P. Grinfeld, Introduction to Tensor
Analysis and the Calculus of Moving Surfa-
ces, Springer Verlag, New York, 2013, p.
26.

média definida diretamente a partir de Bβα obtemos

1 α 3
∇ β ∇ β Bαα − Bαα Bγα Bαγ − (B ) , (1.38)
2 α
onde, se compararmos as expressões obtidas por diferentes métodos, veremos
que o termo da figura corresponde ao laplaciano da curvatura média. Notem
que não existe na expressão acima qualquer referência a um sistema de coorde-
nadas. O que fica claro neste exemplo é que o cálculo tensorial nos propicia

© s.r. dahmen 2022


tensores n: um relato pessoal ∗ 21

ferramentas com as quais podemos escrever expressões analíticas de interesse


que não são válidas apenas para um sistema de coordenadas específico mas
para todos os sistemas de coordenadas e portanto representam a essência do
problema. O que é mais importante, e isto é um ponto normalmente esquecido,
é que se existe uma expressão que vale para todo e qualquer sistema de coorde-
nadas, esta expressão tem que ter um significado geométrico. Os tensores nos
ajudam portanto a recuperar a perspectiva geométrica de muitos problemas.
Como a teoria da gravitação de Einstein é uma teoria geometro-dinâmica do
espaço-tempo, sua linguagem natural é a dos tensores.
Em sua resenha do livro de Petrov, o físico irlandês J. L. Synge (1897 – 1995)
afirma 10 : 10
J. L. Synge, Einstein Spaces, Nature 4998,
August 14 1965, p. 673.
In the days when physicists made crucial experiments with the aid of sealing-wax
and string, their physical concepts were merely refined analogues of things in the
world about them. Those happy days are gone. Unless one is a mathematician,
enjoying mathematics for its own sake, the choice is between a guilty conscience
and a headache when it comes to the concepts on which gravitational theory is
based. Most people prefer to batten down their consciences and use Newtonian
concepts – absolute space and time, action at a distance with the inverse square
law, the laws of motion – all indefensible. The conscientious mind must grapple
with a mathematical theory which is impeccable in concept, but so complicated
that what little comes out of it may seem scarcely worth the trouble. Some
people compromise: working with Einstein’s concepts, they try to fit Newtonian
language to the results – for example, they see a ’force’ in the quadratic term
in the equations of a geodesic. Prof. Petrow does not go in for compromise of
that sort [...] he has hit the nail on the head for physicists by insisting that
the 4-index Riemann tensor lies at the heart of the matter. This tensor is the
gravitational field, just as Maxwell’s vectors are an electromagnetic field. For
a long time physicists did not like Maxwell’s theory, but they have learned to
think as he did. Any physicist who wants to think seriously about gravitation
must think in terms of the Riemann tensor 11 . 11
Os itálicos são meus. O tensor de Rie-
mann ao qual Synge se refere é a gran-
deza expressa na eq. (2) no início destas
1.5 A título de conclusão notas. O tensor da equação (1) é o conhe-
cido símbolo de Christoffel do 2º tipo.
Para concluir, um breve esclarecimento sobre o N no título deste capítulo. Ele é
seguido pelos capítulos Tensores I, Tensores II, e assim por diante. Mas antes do 1
(I romano) vem o 0. Mas como escrever 0 em algarismos romanos se os próprios
não tinham uma letra que representasse este número? Aliás, os algarismos
romanos só servem para dar um certo ar de erudição e respeitabilidade –
justificada ou não – a quem os usa, pois do ponto de vista de cálculo, sua
praticidade é nula. Quando alguns matemáticos da Alta Idade-Média – monges,
em sua maioria – começaram a se ocupar do cálculo de calendários (conhecido 12
As letras têm seu [próprio] destino. A
tecnicamente como computus) eles se viram diante da necessidade de representar frase é uma adaptação do original de Te-
o 0 e por isso recorreram à letra n do alfabeto latino como abreviação de nulla. renciano Mauro, um gramático latino do
Assim, por uma adição tardia, os algarismos romanos passaram a ter uma século 2 d.C. que tornou famosa a frase
’Pro captu lectoris habent sua fata libelli’, que
representação para o 0 e ficamos assim com n, i, ii, · · · = 0, 1, 2, · · · . Habent sua
significa ’da capacidade do leitor depende
fata litterae 12 . o destino dos livros’. Geralmente muitas
obras citam apenas ’habent sua fata libelli’,
traduzida como ’livros tem [cada um] seu
próprio destino’

© s.r. dahmen 2022


2
Tensores I: definição e propriedades

As leis da física são relações entre grandezas tensoriais que expressam, muitas delas,
princípios fundamentais da Natureza. Um destes é o chamado princípio geral da cova-
riância, que afirma que todas as leis da física devem ter a mesma forma em diferentes
sistemas de coordenadas que estejam relacionados entre si por transformações diferen-
ciáveis e que admitam uma inversa. Por trás desta idéia está o fato que coordenadas são
apenas representações, rótulos que usamos para descrever grandezas de interesse e o
espaço-tempo no qual os fenômenos ocorrem. Coordenadas não tem existência a priori e
portanto não podem ter qualquer papel na formulação das leis fundamentais da física.
Sendo assim, se quisermos expressar leis que independam das coordenadas usadas nas
representações dos tensores, é necessário entendê-los enquanto grandezas definidas em
termos de suas regras de transformação.

2.1 Transformações de coordenadas


Uma vez que definimos tensores por seu comportamento sob uma transfor-
mação de coordenadas, precisamos definir exatamente a que tipo de transfor-
mações estamos nos referindo. Suponha que um tenhamos dois sistemas de
coordenadas ( x1 , x2 , · · · x n ) e ( x 01 , x 02 , · · · x 0n ) para descrever um mesmo espaço
físico. Além disso, suponhamos que estes dois sistemas estejam relacionados
via n equações da forma:

x 0 a = x 0 a ( x ) = f a ( x1 , x2 , · · · x n ) (2.1)

Este tipo de mudança de variáveis é chamada de transformação passiva, pois o


sistema físico não muda, apenas as coordenadas que o descrevem. Uma vez
que tensores são também definidos vias suas propriedades de transformaçãm e
envolvem as derivadas de ( x 01 , x 02 , · · · x 0n ) em relação à ( x1 , x2 , · · · x n ) e vice-
versa, é importante que estas transformações sejam diferenciáveis. A matriz
de transformação Λ ou Jacobiana J, que reúne as diferenciais de todas as
coordenadas x 0 a em relação às coodenadas x b , é definida via:

 ∂x01 ∂x 01 ∂x 01

∂x1 ∂x2
··· ∂x n
 ∂x02 ∂x 02 ∂x 02 

∂x 0 a

def  ∂x2
··· ∂x n 
J =  ∂x1
=  . .. ..  . (2.2)

∂x b  .. . ··· . 
∂x 0n ∂x 0n ∂x 0n
∂x1 ∂x2
··· ∂x n
24 uma introdução à teoria do espaço e do tempo

É importante considerarmos também o determinante J = det J


0a
def ∂x
J = b (2.3)
∂x

como sendo diferente de zero ao menos nas proximidades de alguma região do


espaço. Isto implica que a transformação tem uma inversa. Embora saibamos
que
 0a 
∂x def
Λ = = J. (2.4)
∂x b
usaremos o termo Jacobiana muitas vezes pois ele é comumente usado na
literatura da TRG. Também, representaremos daqui por diante os elementos de
Λ por
0 ∂x 0i ∂xi
Λi k = k
Λi k0 = 0 j (2.5)
∂x ∂k
Isso nos permitirá escrever equações de maneira mais clara. As diferenciais dxi
das coordenadas se transformam segundo

∂x 0i 1 ∂x 0i 2 ∂x 0i
dx 0i = 1
dx + 2 dx + · · · + n dx n
∂x ∂x ∂x
∂x 0 i
= dx j
∂x j
0
= Λi j dx j (2.6)

2.2 Definição formal de tensores


Com as transformações definidas acima, podemos agora definir tensores for-
malmente.

Definição 1. Um vetor A ou tensor de ordem (rank) 1 é contravariante se suas


componentes ( A01 , A02 , · · · A0n ) no referencial x 0 estão relacionadas às componentes
( A1 , A2 , · · · An ) no referencial x através de

∂x 0i j 0
A 0i = A = Λi j A j (i = 1, 2, · · · n). (2.7)
∂x j

Definição 2. Um vetor A ou tensor de ordem (rank) 1 é covariante se suas componen-


tes ( A10 , A20 , · · · A0n ) no referencial x 0 estão relacionadas às componentes ( A1 , A2 , · · · An )
no referencial x segundo

∂x j j
Ai0 = A j = Λ i0 A j (i = 1, 2, · · · n). (2.8)
∂x 0i

Como no caso de tensores de ordem 1, podemos definir tensores de ordem


mais alta seguindo a mesma linha de raciocínio.

Definição 3. Considere as grandezas T abcklm··· onde os índices contravariantes formam


um conjunto A = { a, b, c, · · · } de cardinalidade p e o conjunto B = {k, lm, · · · } de
índices covariantes tem cardinalidade q. As n( p+q) grandezas T abcklm··· definidas em
um ponto P de uma variedade M n-dimensional representam as componentes de um
tensor se para cada índice superior (contravariante) elas se transformam como um vetor

© s.r. dahmen 2022


tensores i: definição e propriedades 25

contravariante e para cada índice inferior (covariante) se transformam como um vetor


covariante:

∂x 0 a ∂x 0b ∂x 0c ∂xr ∂x s ∂x t hij···
T 0 abcklm
··· 0
··· ( x ) = · · · T rst··· ( x )
∂x h ∂xi ∂x j ∂x 0k ∂x 0l ∂x 0m
0 0 0 hij···
= Λ ah Λbi Λcj · · · Λrk0 Λsl 0 Λt m0 T rst··· ( x ) (2.9)

Tensores com p índices contravariantes e q índices contravariantes são comu-


mente chamados de tensores do tipo ( p, q).
Embora a grande vantagem da notação tensorial seja a sua generalidade, na
Relatividade Geral nos deparamos a todo instante com tensores de ordem 2.
Isto se deve ao fato que a equação fundamental da Relatividade Geral, a famosa
Equação de Campo de Einstein, é uma equação diferencial parcial não linear
que relaciona o tensor métrico gµν com uma fonte, o tensor energia-momento
Tµν . Devido a sua ubiquidade definiremos abaixo explicitamente as regras de
transformação de tensores contravariantes, covariantes e mistos, isto é dos tipos
(2, 0), (0, 2) e (1, 1) respectivamente.
Um tensor contravariante de ordem 2, denotado por T ab é um conjunto de
n2 grandezas, definidos em um ponto P de coordenadas x a , que se transforma
segundo
∂x 0 a ∂x 0b cd 0 0
T 0 ab = T = Λ ac Λbd T cd . (2.10)
∂x c ∂x d
Já os tensores covariantes de ordem 2, denotado por Tab , se transformam
segundo
0 ∂x c ∂x d
Tab = 0a T = Λca0 Λdb0 Tcd . (2.11)
∂x ∂x 0b cd
Um tensor misto de ordem 2, denotado por T ab é um conjunto de n2 grandezas,
definidos em um ponto P de coordenadas x a , que se transforma segundo

∂x 0 a ∂x d c 0
T 0 ab = T = Λ ac Λdb0 T cd . (2.12)
∂x c ∂x 0b d

2.3 Interpretação geométrica


Baseados na discussão no capítulo anterior, é relativamente fácil entender a
origem da regra de transformação que define vetores e tensores. Um vetor
pode ser representado por suas componentes contravariantes ou covariantes:

A = Ai ei = A0i ei0 (2.13)

A base coordenada é definida por meio de

∂r
ei = (2.14)
∂xi

ou seja, por vetores tangentes às curvas coordenadas, motivo também pelo


qual é chamada de base tangente. Esses vetores são ainda chamados de base
covariante pois como sabemos, se mudarmos para um sistema de coordendas
x 0 vale
∂r ∂r ∂x j ∂x j
ei0 = 0i = j 0 i
= e j 0i (2.15)
∂x ∂x ∂x ∂x

© s.r. dahmen 2022


26 uma introdução à teoria do espaço e do tempo

Esta é a razão destes vetores terem o índice grafado embaixo (índice covariante).
Substituindo este resultado na equação (2.13) obtemos:
!
i 0i ∂x j
A ei = A e j 0i . (2.16)
∂x

Como o índice i do lado esquerdo da expressão acima é mudo, podemos fazer


a substituição i → j e escrever
!
0i ∂x j ∂x j
j
A ej = A e j 0i −→ A j = A0i 0i . (2.17)
∂x ∂x

Disto segue que as componentes estão relacionadas via

∂x 0 j j
A 0i = A (2.18)
∂x j
Podemos também representar um mesmo vetor usando suas componentes
covariantes Ai expandidos numa base contravariante i cuja definição é:

ei = ∇ x i . (2.19)

Portanto, um mesmo vetor A admite duas representações:

A = Aµ eµ = A1 e1 + A2 e2 + · · · + An en forma contravariante
µ 1 2 n
A = A µ e = A1 e + A2 e + · · · + A n e forma covariante (2.20)

2.3.1 Base tangente ou direta e base cotangente ou dual


É natural querermos visualizar as bases formadas pelos vetores eµ e eµ compa-
rando-as com bases com as quais estamos acostumados a trabalhar. Quando
estamos lidando com sistemas de coordenadas ortogonais, a visualização das
bases é relativamente simples. No Apêndice E isto é feito para os casos das
coordenadas cartesianas e esféricas no plano. Em se tratando de sistemas não
ortogonais, a coisa se torna um pouco menos intuitiva mas ainda conseguimos
ter uma boa idéia do que acontece. Aqui discutiremos a idéia mais geral de
base direta e base dua.
ev
Vimos que a forma contravariante do vetor A = Aµ eµ é expressa pelo uso
do conjunto de vetores {eµ }. Estes vetores formam a chamada base direta P
eu
ou tangente pois a variação de r quando a variável x µ varia segundo (2.14)
é tangente à linhas de coordenada x µ . No caso de coordenadas cartesianas v = v0

podemos visualizar isto facilmente, pois os vetores i, j, k são tangentes aos eixos u=u
0

x, y, z respectivamente. O mesmo se aplica às coordenadas esféricas r̂, θ̂, ϕ̂, que


formam também uma base ortogonal. Para um sistema não ortogonal, a figura
ao lado ilustra a situação: o vetor tangente à linha de u = uo constante indica
uma variação da coordenada v. Portanto o vetor tangente a esta linha só pode
Figura 2.1: A base tangente de um sis-
ser ev . O mesmo se aplica à linha de v = vo constante, onde apenas u varia e tema de coordenadas curvilíneas em uma
portanto o vetor nesta direção é eu . Fica claro pela ilustração ao lado que para superfície curva qualquer.
bases não ortogonais, o produto escalar dos vetores da base não é nulo.
Quanto representamos um vetor na forma covariante A = Aµ eµ , os vetores
usados como base são agora os vetores contravariantes {eµ }. Isto pode parecer
confuso mas faz sentido se lembrarmos que ao mudarmos as coordenadas, o
vetor em si não pode mudar. Se ele é representado numa base eµ contrava-
0
riante, que muda segundo uma matriz Λij , as componentes covariantes Aµ

© s.r. dahmen 2022


tensores i: definição e propriedades 27

j
tem que mudar segundo a matriz inversa Λi0 para que uma transformação
’cancele’ a outra e o vetor permaneça inalterado enquanto grandeza física. Esta
mesma observação vale para a forma contravariante Aµ , expandida numa base
covariante eµ .
A chamada base dual ou cotangente é, segundo sua definição (2.19), baseada y
superficies de nivel

num gradiente. O gradiente ∇i é perpendicular à linha xi = constante e aponta


na direção de xi crescente. Em sistemas de coordenadas ortogonais, as normais
às superfícies coordenadas coincidem com as tangentes às curvas coordenadas.
Neste caso, a diferença entre {e1 , e2 , · · · , en } e {e1 , e2 , · · · , en } é apenas uma
direcao do gradiente
e’ a mesma
do eixo x

questão de normalização. Se os vetores são normalizados, então a diferença


gradiente

desaparece. Pense no sistema de eixos i, j, k. O gradiente ∇ x é perpendicular à x

familia de planos yz e portanto aponta na mesma direção do eixo x crescente.


Portanto e1 = e1 = i. Isto está ilustrado na figura ao lado e vale para qualquer
sistema de coordenadas ortogonais. z
x=1 x=2 x=3

No caso de sistemas não ortogonais, é possível visualizar a direção dos


Figura 2.2: Em sistemas de coordenadas
vetores duais da seguinte maneira: imagine uma curva de nível u = uo da
ortogonais, a base direta e a base dual
coordenada u no ponto P. O gradiente eu é perpendicular à curva de nível e coincidem pois o gradiente às superfícies
aponta na direção de u crescente. Sendo perpendicular à curva de nível e dado de nível estão na mesma direção os eixos
que ev é tangente a u = uo , segue que eu e ev são perpendiculares entre si. O coordenados correspondentes.
mesmo argumento vale para o par ev e eu . A figura ao lado representa isto
geometricamente. ev

ev

2.3.2 Supérfluo ou necessário? P

eu
v = v0
A pergunta que se faz então é a seguinte: precisamos diferenciar entre eµ e eµ
eu
se até o momento vivemos felizes sem fazer esta distinção? Afinal, como foi ta
en
u=u um
dito acima, em referenciais ortogonais não há diferença entre as duas bases, ua
um
0 va
en
ta
a menos de fatores de normalização. É justamente neste ponto crucial mas
muitas vezes ignorado que está a chave para a resposta: precisamos diferenciar
entre as bases pois em espaços curvos nem sempre podemos escolher sistemas
de coordenadas ortogonais – estes ainda existem, mas apenas numa vizinha Figura 2.3: A base cotangente ou dual de
de um sistema de coordenadas curvilí-
aberta e finita em torno de um ponto P da variedade M. Mesmo em espaços
neas em uma superfície curva qualquer.
planos muitas vezes optamos por sistemas de coordenadas oblíquas, como é Note que o vetor eu que dá o gradiente
o caso quando estudamos a mecânica de corpos deformáveis. Isto explica a na direção de u crescente é, por constru-
existência de muitos livros de cálculo tensorial voltados especificamente para ção, perpendicular ao vetor da base ev . O
aplicações nesta área. mesmo vale para ev e eu . Os ângulos de
π/2 entre estes pares são representados
A discussão acima é um indicativo que entre as duas bases há certas pro-
pelas linhas pontilhadas.
priedades, como a ortogonalidade entre eµ e eν para µ 6= ν. Tomemos um
exemplo simples de coordenadas não ortogonais no plano para ilustrar algumas
propriedades interessantes que relacionam a base direta a sua base dual.

Consideremos o espaço R3 de coordenadas ( x, y, z). Considere um sistema de


coordenadas (u, v, w) não ortogonal definido segundo

1 1 1 2
u= ( x + y) v= ( x − y) w = z− ( x − y2 ), (2.21)
2 2 2

onde −∞ < u, v, w < ∞. Também é fácil ver que r = xi + yj + zk pode ser


escrito como
r = (u + v)i + (u − v)j + (2uv + w)k. (2.22)

© s.r. dahmen 2022


28 uma introdução à teoria do espaço e do tempo

Nestas coordenadas a base tangente eµ vale, segundo sua definição

∂r
eu = = i + j + 2vk
∂u
∂r
ev = = i − j + 2uk
∂v
∂r
ew = =k (2.23)
∂w
Como não são perpendiculares entre si, seu produto escalar não é nulo:

eu · ev = 4uv ev · ew = 2u eu · ew = 2v. (2.24)

Estes vetores também não são necessariamente unitários (com exceção de ew


neste caso):

eu · eu = 2 + 4v2 ev · ev = 2 + 4u2 ew · ew = 1. (2.25)

A base dual é
1
eu = ∇u = (i + j)
2
1
ev = ∇ v = (i − j)
2
w
e = ∇w = −(u + v)i + (u − v)j + k (2.26)

Estes vetores não são necessariamente perpendiculares entre si, embora no


presente caso eu e ev sejam:

eu · ev = 0 ev · ew = − u eu · ew = −v. (2.27)

Eles, a exemplo dos vetores da base direta, não são unitários:


1 1
eu · eu = ev · ev = ew · ew = 2u2 + 2v2 + 1. (2.28)
2 2
Porém, podemos notar que entre as duas bases existe a relação

eu · ev = ev · eu = 0
ev · ew = ew · ev = 0
eu · ew = ew · eu = 0 (2.29)

Do mesmo modo
eu · eu = ev · ev = ew · ew = 1. (2.30)

Um resultado importante do exemplo acima é que

µ
eµ · eν = δ ν (2.31)

µ
onde δ ν é o delta de Kronecker. Este resultado vale na verdade para qualquer
conjunto de base {eµ } com sua base dual {eµ } em função da definição de cada
uma delas:
 
∂r ∂r ∂x µ ∂x ρ ∂x µ µ
eµ · eν = ∇ x µ · ν = [∇ x µ ]ρ ν
= ρ ν
= ν = δ ν. (2.32)
∂x ∂x ρ ∂x ∂x ∂x

Esta relação entre os vetores das bases nos leva a outro conceito importante: o
tensor métrico.

© s.r. dahmen 2022


tensores i: definição e propriedades 29

2.4 O tensor métrico gµν


Talvez o tensor mais importante que veremos neste curso é o tensor métrico gµν ,
também chamado de forma métrica fundamental. O sistema de coordenadas,
embora arbitrário, deve refletir as propriedades geométricas do espaço onde
é definido. Por propriedades geométricas queremos dizer a possibilidade de
medirmos distâncias e ângulos entre diferentes pontos, e isto só é possível em
espaços dotados de uma métrica. Esta informação está codifica nos vetores
da base coordenada {eµ }, ou seja, os vetores que dão as direções dos eixos
coordenados ou, sendo mais explícitos, nos produtos escalares entre os vetores
da base:
eµ · eν = keµ kkeν k cos(e[
µ , eν ) = gµν (2.33)
onde cos(e[µ , eν ) é o cosseno do ângulo formado entre eµ e eν . A equação acima
define a forma covariante do tensor métrico:

eµ · eν = gµν , (2.34)

que é simétrico pela troca de índices, ou seja gµν = gνµ . Isto significa que
dos n2 elementos, apenas n(n + 1)/2 são independentes. No espaço-tempo
curvo da física, isto significa que dos 16 possíveis valores gµν , apenas 10 são
independentes.
O primeito resultado importante que obtemos fazendo uso do tensor mé-
trico é a relação entre as projeções covariantes e contravariantes de um vetor
arbitrário A. Por definição, a projeção covariante de A é dada pela projeção
ortogonal deste sobre os vetores tangentes:

Aν = A · eν = ( Aµ eµ ) · eν = Aµ eµ · eν = gµν Aµ (2.35)
| {z }
gµν

Esta expressão nos mostra como passar de coordenadas contravariantes para


coordenadas covariantes para tensores de qualquer ordem 1 . Esta transforma- 1
Se neste dedução tivéssemoss usado
ção de índice contravariante para covariante é conhecida como abaixamento do Aµ eµ no lugar de Aµ eµ teríamos obtido
índice: o resultado trivial Aν = Aν

Aµ = gµν Aν (2.36)
A versão contravariante do tensor métrico fundamental é definida via

eµ · eν = gµν (2.37)

A relação que existe entre as duas matrizes é

ρ
gρµ gµν = δν (2.38)

ou seja, uma é o inverso da outra. Isto também nos dá a regrar para subir o
índice
Aµ = gµν Aν . (2.39)
pois multiplicando os dois lados de (D) por gρν temos

gρν Aν = gρν gµν Aµ


ρν ρ
g Aν = δµ Aµ
gρν Aν = Aρ (2.40)

© s.r. dahmen 2022


30 uma introdução à teoria do espaço e do tempo

A regra para baixar ou subir índices se aplica a tensores de qualquer ordem.


Alguns exemplos:
αβ
gγλ gδσ T αβλσ = T γδ (baixar λ e σ)
αλ
g T λβγδ = T αβγδ (subir λ)
A prova que a forma métrica fundamental realmente é um tensor pode ser
facilmente obtida estudando a regra de transformação dos vetores da base. No
caso da base coordenada temos:
∂xκ ∂x λ
e0µ · e0ν = eκ · e
∂x 0µ ∂x 0ν λ
∂xκ ∂x λ
= eκ · e λ
∂x 0µ ∂x 0ν
0 ∂xκ ∂x λ
gµν = g (2.41)
∂x 0µ ∂x 0ν κλ
A prova para gµν ≡ eµ · eν é análoga.

Como exemplo do tensor métrico, retomemos as coordenadas (u, v, w) do


exemplo anterior, cuja base direta e dual são dadas respectivamente por
1
eu = i + j + 2vk eu = (i + j)
2
1
ev = i − j + 2uk ev = (i − j)
2
ew = k ew = −(u + v)i + (u − v)j + k
Usando a definição gij = ei · e j , gij = ei · e j é fácil mostrar que
 
2 + 4v2 4uv 2v
gij =  4uv 2 + 4u2 2u (2.42)
 
2v 2u 1
 
1/2 0 −v
gij =  0 1/2 −u , (2.43)
 
− v − u 2( u + v ) + 12 2

e também que gij g jk = δik .

2.5 Subir e baixar índices: nem tudo é o que parece


A questão de subir ou baixar índices parece mais um exagero de nossa parte
que realmente uma necessidade, afinal vetores ou são covariantes ou são contra-
variantes, certo? Se ele for um gradiente, é covariante. Se não, é contravariante.
Bem, pense no campo elétrico E. O campo elétrico pode ser escrito como o
gradiente de um potencial V
∂V
E = −∇V =⇒ Eµ = − (2.44)
∂x µ
e portanto é natural que representemos as componentes como aquelas de um
vetor covariante Eµ . Por outro lado, ele é, por definição proporcional a uma
força e portanto a uma aceleração
1 m q µ
E= F = a =⇒ Eµ = a (2.45)
q q m

© s.r. dahmen 2022


tensores i: definição e propriedades 31

ou seja, ele tem uma representação contravariante ’natural’. Mas como pode
ser isso? Bem, a resposta pragmática é relativamente simples: quando usamos
sistemas de coordenadas ortogonais, não há diferença entre vetores covariantes
e contravariantes: Eµ = Eµ . Eles são exatamente a mesma coisa, por isso
podemos simplesmente escrever a equação acima na forma
∂V
m ai = − q (2.46)
∂xi
onde i é um índice que indica a componente. Quando tivermos porém um
sistema não ortogonal de coordenadas, quer o espaço seja plano ou curvo,
daí precisamos considerar que Eµ e Eµ são diferentes. Mas como lidar com
a equação acima? Afinal física é física, e campos elétricos são grandezas que
existem independente da base que escolhemos para representá-los. O cuidado
que devemos tomar é que não podemos simplesmente escrever a equação como

m aµ = −q (∇V )µ (2.47)
pois ela não é covariante, no sentido de ter a mesma forma para todos os siste-
mas de coordenadas, pois os dois lados se transformam de maneira diferente
por mudança de coordenadas. De novo,a resposta pragmática é a seguinte: se
tivermos um potencial, calculamos a componente covariante Eν e subimos o
índice usando o tensor métrico:
 
Eµ = gµν Eν −→ m aµ = −q gµν (∇V )ν = −q Eµ (2.48)

Esta equação é correta pois ela é covariante, ou seja, vale em qualquer sistema
de coordenadas.
Mas fica a questão: o campo elétrico é um vetor ou um covetor? A lite-
ratura no assunto é relativamente confusa mas, assumindo o ponto de vista
pragmático, isso depende da situação. Do ponto de vista matemático mais
moderno, ele é um covetor (ou 1-forma), pois basicamente atua sobre um vetor
deslocamento para produzir um escalar E · dr = Eµ dx µ = dW/q da mesma
maneira que um bra atuando sobre um ket dá uma amplitude de probabilidade
Z
hφ|ψi = dx φ∗ ( x )ψ( x ) (2.49)
Além do mais, sabemos que existe a relação entre |ψi e hψ|:

|ψi† = hψ| (2.50) 2


Esta opinião é pessoal. A formas di-
que é análoga à Eµ = gµν Eν . Resumindo: não ganhamos nada em tentar ferenciais são extremamente elegantes e
classificar vetores como sendo naturalmente isto ou aquilo. poderosas, mas meu ponto aqui é sim-
plesmente o fato que se você quer apren-
Alguns livros mais modernos de Relatividade Geral preferem a linguagem
der inglês, ler Shakespeare no original
de formas diferenciais, as chamadas p-formas, embora para um primeiro curso de não é o melhor lugar para se começar.
Relatividade Geral esta forma de apresentar o cálculo tensorial não representa
3
William L. Burke (1941 – 1996) foi um
um ganho na clareza ou compreensão do assunto 2 . A abordagem na linguagem
fisico americano que fez contribuições
de formas diferenciais é melhor detalhado no livro de Bill Burke: Grad, Div, significativas à Relatividade Geral mas
Curl are Dead 3 . morreu em consequência de um acidente
automobilístico antes de poder publicar
este livro. No entanto ele está disponí-
2.6 Algumas operações elementares com tensores vel em forma preliminar na internet. Ele
também escreveu um livro muito influ-
Há várias operações simples que podem ser feitas com tensores, de modo ente, Spacetime, Geometry, Cosmology, Do-
que o tensor resultante é também um tensor. Algumas delas tem particular ver, New York, 2020. Ele fez seu douto-
rado na Caltech sob a orientação de Kip
importâncias na Relatividade Geral
Thorne.

© s.r. dahmen 2022


32 uma introdução à teoria do espaço e do tempo

1. Adição
A operação mais é a adição de 2 tensores do mesmo tipo ( p, q):

T a bc = c1 U a bc + c2 V a bc (2.51)

onde c1 e c2 são duas constantes arbitrárias. A soma é feita elemento a elemento.


É simples mostrar que se U e V são tensores, então = U + V também é.

2. Produto
É possível multiplicar vetores de ordem m e n para obter um vetor de ordem
m + n. Também, se um vetor é do tipo ( a, b) e outro do tipo (c, d), o tensor
resultante é do tipo ( a + c, b + d). O chamado produto direto de vetores é
então definido como no exemplo abaixo, onde multiplica-se componente a
componente
C abcde = A ad Bbce (2.52)
O produto direto de tensores é uma maneira de gerar tensores de ordem mais
alta que seus fatores. Também é relativamente simples mostrar que o produto
direto de tensores é um tensor. Para isto usamos um exemplo simples e as
definições acima:

∂x 0i k ∂x l ∂x 0i ∂x l k ∂x 0i ∂x l k
C 0i j = A0i B0j = A 0
Bl = 0
A Bl = C l (2.53)
∂x k ∂x j l
∂x ∂x j ∂x l ∂x 0 j

3. Contração de índices
Uma das operações mais importantes que podemos realizar sobre tensores é a
contração de índices. O produto escalar de dois vetores

Ai Bi = A · B (2.54)

é um exemplo típico de uma contração: um índice covariante e um contrava-


riante são igualados e pela convenção de Einstein soma-se sobre o índice. A
contração só pode ser feita entre um índice covariante a um contravariante. É
importante notar que a contração diminui a ordem do tensor em 2. Se o tensor
é do tipo ( p, q), com a contração se obtém um novo tensor do tipo ( p − 1, q − 1).

T abcd −→ T aacd = Vcd (2.55)


Olhando para o produto escalar, em linguagem tensorial o que temos é um
tensor de ordem 2 formado pelo produto direto de dois vetores

T ab = A a Bb −→ T aa = A a Ba = A · B (2.56)

Em outras palavras, o produto escalar é o traço da matriz T ab .

2.7 Acerca de tensores e variedades ∗


Embora seja conveniente pensarmos em vetores como sendo setas orientadas e
tensores como sendo matrizes, grandezas tensorias são definidas em termos de
suas propriedades de transformação e não pela maneira como as representamos. 4
Devemos muito a Hermann Weyl nossa
É também importante entender em que espaços matemáticos estes entes são compreensão acerca destes espaços pois
definidos 4 . em seu livro Raum, Zeit, Materie [Espaço,
Tempo, Matéria] ele estabeleceu a conexão
Até o momento, na Física clássica, trabalhos com espaços vetoriais onde,
entre variedades Riemannianas e propri-
a cada ponto do espaço, podemos associar um vetor posição. No caso do edades de espaços vetoriais tangentes e
espaço-tempo quadridimensional da Relatividade Restrita, esta idéia continua cotangentes.

© s.r. dahmen 2022


tensores i: definição e propriedades 33

válida. Porém, na Relatividade Geral, onde o espaço-tempo se torna um objeto


curvo e dinâmico, esta idéia precisa ser revista. Na Relatividade Geral o espaço-
tempo é representado por uma variedade. A parte da matemática que estuda
as propriedades de variedades se chama geometria diferencial.
Variedade ou manifold foi um termo criado pelo famoso matemático Bernhard
Riemann para se referir aos espaços de n dimensões que localmente (a dis-
tâncias infinitesimais) se parecem com um espaço Euclideano plano Rn . Os
matemáticos também chamam tal espaço de uma n-variedade 5 . Em outras 5
O termo original alemão é Mannigfal-
palavras, uma variedade M carece de uma estrutura global de espaço vetorial tigkeit. Riemann introduziu o termo em
mas no entorno de qualquer ponto P ∈ M podemos definir uma. Isto significa sua famosa defesa de tese de livre do-
cência – a chamada venia legendii – em
que para pequenas distâncias a variedade se parece muito com um espaço 1854 em Göttingen. A livre-docência
plano. Localmente é possível então usar vetores para indicar direções. (chamada na Alemanha de Habilitation é
ainda hoje uma condição necessária para
Uma variedade n-dimensional M real (ou complexa) é um espaço de que um(a) doutor(a) possa se tornar pro-
Hausdorff no qual a vizinhança de qualquer ponto P é homomórfica ao fessor(a) numa universidade.
espaço vetorial Rn (Cn ). Um homomorfismo é um mapa contínuo que
possui uma inversa também contínua. Um espaço de Hausdorff é um
espaço topológico onde para quaisquer dois pontos distintos P e Q existe
vizinhanças disjuntas, ou seja, sem intersecção.

É importante notar que sendo homomórfica à Rn em todo ponto P, sua métrica


é positiva definida. Isto quer dizer que se após a diagonalização, todos os
elementos da métrica são positivos. O espaço-tempo da física tem portanto
uma assinatura pseudo-Riemanniana. A grande maioria dos físicos porém não
se preocupa com esta distinção e simplesmente diz que o espaço-tempo é uma
variedade Riemanniana.

Imersão e variedades abstratas

Em muitas situações, para podemos visualizar uma variedade, recorremos


a uma imersão (embedding) em um espaço vetorial plano de dimensão mais Figura 2.4: Georg Friedrich Bernhard Ri-
alta, como a 2-esfera S2 imersa no R3 . Porém, já nos primórdios da geometria emman (1826 – 1866), matemático ale-
diferencial no final do século XIX, descobriu-se que há variedades abstratas que mão, foi professor nas Universidades de
Göttingen e Berlin. Fonte: wikipedia.
não podem ser imersas em espaços vetoriais de dimensão mais alta. Isto vale
para o espaço-tempo curvo da Relatividade Geral, que não pode ser imerso
num superespaço 5-dimensional plano. Para que fosse capaz de descrever
matematicamente estas variedades abstratas sem recorrer a uma imersão em
espaços planos de dimensão superior, a geometria diferencial teve que ser
formulado sem que se fizesse uso da idéia de imersão. O que isto significa,
pragmaticamente falando, é que foi preciso desenvolver ferramentas que per-
mitiam estudar a curvatura do espaço sem dela se afastar. Imaginemos seres
bidimensionais que vivessem sobre uma esfera: como eles podem determinar
a curvatura de seu mundo se não tem como visualizá-lo de fora? Por isso as Figura 2.5: Uma 2-variedade imersa no
ferramentas desenvolvidas na geometria diferencial nos dão uma descrição espaço R3 . Podemos imaginar uma va-
intrínseca da curvatura da variedade, sem recorrer a um espaço no qual ela riedade bidimensional como sendo uma
superfície curva mas suave imersa no es-
está imersa. Esta idéia não é difícil de entender: se quisessem determinar
paço tridimensional usual.
a curvatura de sua superfície, bastaria os seres bidimensionais mediram os
ângulos internos de um triângulo suficientemente grande e verificar que sua
soma é maior que π. Como veremos, o valor que excede (ou falta até) π é
proporcional à curvatura.
Um cuidado, porém: uma figura imersa num espaço plano que nos pareça
curva não necessariamente é intrinsicamente curva. O exemplo mais simples é

© s.r. dahmen 2022


34 uma introdução à teoria do espaço e do tempo

aquele de um cilindro. Um ser bidimensional que vivesse sobre ele mediria que
a soma dos ângulos internos de um triângulo tem o valor correto de π (v. figura
ao lado). Ela não conseguiria detectar uma curvatura, o que em outras palavras
significa que a curvatura intrínseca é zero. Isso pode ser melhor entendido
pois podemos construir um cilindro enrolando uma folha de papel, sem esticá-
la ou amassá-la. Isto seria impossível para uma esfera, motivo pelo qual
as projeções de mapas da superfície terrestre apresenta distorções.Há porém
um fato importante: embora o ser bidimensional não detecte uma curvatura,
no seu mundo é possível contorná-lo, retornando ao ponto de partida. Esta
propriedade está relacionada à topologia do espaço.
Figura 2.6: Um mundo bidimensional
Espaços tangentes e vetores da base coordenada cilíndrico não tem curvatura intrínseca.

A idéia geométrica de projeções covariantes e contravariantes, ilustrada


no caso de um plano usando sistemas de coordenadas não ortogonais (v.
Apêndice A) é bastante útil e nos mostra que em espaços de dimensão maior,
a ideia de vetor covariante e contravariante diz respeito ao espaço onde estes
vetores são definidos. Todos os vetores contravariantes definidos em um
ponto P de uma variedade Riemanniana n-dimensional M definem um espaço
vetorial n-dimensional T P M denominado espaço tangente ao ponto P da
variedade M. De um modo geral o espaço tangente não é idêntico à variedade
em cujo ponto P ele está definido. Apenas no caso do espaço Euclideano e
Minkowskiano o espaço tangente e a variedade coincidem. Por isto devemos
ter cuidado quando pensamos em vetores como “flechas”pois, rigorosamente
falando, eles não pertencem ao espaço definido pela variedade. É por isto que
em espaços curvos – na Relatividade Geral em especial – trabalhamos com Figura 2.7: O espaço tangente T X M defi-
grandezas tensorias de modo abstrato e se faz necessário manipular estes entes nido no ponto X da variedade Riemanni-
sem muitas vezes termos uma visão clara (geométrica) de como são. ana M. Os vetores contravariantes vivem
O que é importante notarmos é o seguinte a respeito de espaços tangentes: neste espaço tangente e, rigorosamente
falando, não na variedade, pois apenas
i. eles são sempre planos; em casos excepcionais a variedade M e
ii. não requerem a existência de um espaço de dimensão superior no qual este- T P M coincidem para todos os pontos P.
jam imersos e portanto não devem ser interpretados como um subsespaco Isto ocorre quanto a variedade é plana.
de um embedding space;
iii. eles são isomórficos ao Rn .
A soma de todos os espaços tangentes de uma variedade é chamado de feixe
tangente (tangent bundle) da variedade e representado pela letra T M.
Os vetores covariantes (covetores) são definidas no espaço dual à T P M, ou
espaço cotangente T P∗ M. A idéia é semelhante àquela do espaço recíproco (ou
espaço-k) do estado sólido, onde descrevemos uma rede periódica no espaço Figura 2.8: O feixe tangente de uma va-
riedade formado pela soma disjunta de
de vetores de onda k com os índices de Miller (h, k, l ). Como do ponto de vista
todos os espaços a ele tangentes.
quântico o momento da partícula é proporcional à seu número de onda k, o
espaço recíproco é o espaço do momento da partícula em questão. Por isto,
junto com o espaço direto de posição r, ele forma o chamado espaço de fase. O
espaço cotangente tem a mesma dimensão da variedade e é também isomórfico
ao Rn , ou seja, isomórfico ao espaço tangente T P M. Podemos visualizá-lo
recorrendo ao gradiente: estes vetores são perpendiculares às superfícies de
nível ( x0 = cte, x1 = cte, · · · ) que passam pelo ponto P da variedade M. Da
mesma maneira que o espaço tangente é gerado por vetores que são tangentes
às curvas coordenadas (pense nos versores r̂, θ̂ e ϕ̂ em coordenadas polares, v.
apêndice B), podemos escolher como base os vetores perpendiculares às curvas
de nível de coordenadas.

© s.r. dahmen 2022


3
Propriedades métricas do espaço

Em um espaço com métrica podemos medir distâncias e ângulos. Exploraremos aqui


algumas das propriedades mais importantes de espaços métricos e sua importância na
Relatividade Geral.

3.1 Distâncias e ângulos


A Física mede grandezas e entre as mais fundamentais estão distâncias e in-
tervalos de tempo. Como toda a Física acontecendo dentro de um espaço e
durante um tempo, é preciso definir precisamente o que é a métrica do es-
paço e do tempo, ou seja, dado um conjunto de coordenadas x0P , x1P , x2P , x3P e
x0Q , x1Q , x2Q , x3Q dos pontos P e Q, é preciso dizer como as distâncias e inter-
valos de tempo devem ser calculados a partir deste conjunto de coordendas.
Esta medida depende da chamada métrica fundamental ou tensor métrico
fundamental gµν definido por meio de

gµν = eµ · eν (3.1)

onde eµ e eν representam o vetor tangente às linhas coordenadas x µ e x ν ,


respectivamente. No caso do sistema de cordenadas cartesianas, {eµ } = {i, j, k).
Se estivermos usando um sistema de coordenas esféricas, estes vetores são
r̂ = er , θ = eθ e φ = eφ . Se os vetores da base são unitários, então

gµν = cos(eµ , eν ) = cos θ (3.2)

onde θ é o ângulo entre os vetores eµ e eν . Nem sempre os vetores da base são


unitários, como no caso dos vetores eθ e eφ . Todas as propriedades geométricas
do espaço estão codificadas nos elementos da matriz que representa gµν .
Da mesma maneira que temos uma base tangente, formada pelos eµ , temos
a base dual formada pelos eµ . A definição é a mesma e podemos definir a
representação covariante da métrica fundamental na forma

gµν = eµ · eν (3.3)

Um resultado importante diz respeito à distância entre dois pontos infinite-


simalmente próximos, em r e r + dr. Sabemos que o quadrado da distância
infinitesimal é

dr2 = dr · dr = (dx µ eµ ) · (dx ν eν ) = dx µ dx ν (eµ · eν ) = gµν dx µ dx ν (3.4)


= gµν
36 uma introdução à teoria do espaço e do tempo

Com a equação acima podemos calcular a distância entre dois pontos qualquer
que seja o sistema de coordenadas usado e independente da superfície ser
plana ou não. Em gµν ou gµν está toda a informação que precisamos codificada
nos valores de cada combinação de pares µ e ν. O tensor métrico gµν nos
permite definir um produto escalar entre vetores, que podemos escrever de
várias formas:

gµν Aµ Bν = gµν Aµ Bν = Aµ Bµ = Aµ Bµ (3.5)

onde usamos a regra segundo a qual podemos subir um índice usando gµν ou
baixar um índice usando gµν .
O cuidado que devemos tomar na Teoria da Relatividade é que o espaço-
tempo é quadridimensional e portanto há um termo a mais na expressão acima
que corresponde à componente x0 = ct dos vetores e tensores. Na física clássica
desprezamos esta componente pois o tempo é um parâmetro não afetado pela
fenômenos físicos que descreve. A Teoria da Relatividade mudou isto, de
modo que devemos considerar no produto escalar todas os termos, incluindo
os relativos à x0 . É por este motivo que na Relatividade chamamos o elemento
de linha não mais dr2 mas sim ds2 , pois este tem um termo a mais.
A regra usual para o produto interno (escalar) é que ele seja positivo definido,
isto é gµν Aµ Aν ≥ 0 para todo A 6= 0 e seja zero apenas quando A = 0. Porém,
em se tratando da geometria do espaço-tempo, este condição não pode ser
mais imposta pois a assinatura da métrica pode ser negativa. A assinatura é a
diferença entre o número de elementos positivos e negativos da métrica. Por
exemplo, na Relatividade Especial a assinatura pode ser −2 = 1 − 1 − 1 − 1
quando usamos a convenção (+, −, −, −) ou 2 = 1 + 1 + 1 − 1 quando usamos
(−, +, +, +). Estas diferentes escolhas correspondem às diferentes formas
quadráticas

ds2 = c2 dt2 − dx2 − dy2 − dz2


ds2 = −c2 dt2 + dx2 + dy2 + dz2

para a distância no espaço de Minkowski. Quando a métrica não é positiva


definida, diz-se que ela é indefinida, que é o que ocorre tanto na Relatividade
Restrita quanto na Relatividade Geral. Isto leva à condição aparentemente
bizarra que o intervalo ds2 pode ser nulo (mesmo que as componentes de
dx µ sejam diferentes de zero), como pode ser negativo. Por isto o intervalo
ds2 não pode ser entendido como uma distância no sentido usual do termo,
mas ele é sim uma distância no espaço quadridimensional entre dois pontos
que podem estar espacialmente e temporalmente separados. Por exemplo, um
corpo parado, que não sai do lugar, tem dx = dy = dz = 0 mas tem

ds2 = c2 dt2 (3.6)

que basicamente diz que o corpo descreve uma trajetória no espaço-tempo pois
ele existe durante um intervalo.
A pergunta é: mas de onde vem esta equação? Voltando para a Relatividade
Restrita, lembremos que um dos seus fundamentos é a constância da velocidade
da luz no vácuo, ou seja, a independência desta da velocidade da fonte ou do
observador. Imagine agora o caso simples. No instante t = 0 um pulso de
luz (esférico) é emitido da origem de um sistema de coordenadas ( x, y, z). Um
outro referencial inercial com coordenadas (t0 , x 0 , y0 , z0 ) se move com velocidade
constante v na direção x, de tal maneira que sua origem coincide com a

© s.r. dahmen 2022


propriedades métricas do espaço 37

origem do referencial de onde parte o sinal luminoso. Segundo o postulado da


constância da luz, passado um tempo t um observador no primeiro referencial
verá que onda é uma esfera de raio ct cuja equação vale

x 2 + y2 + z2 − c2 t2 = 0 (3.7)

Por outro lado, o segundo observador vê a mesma coisa, só que do seu referen-
cial (assumindo c constante) a equação é

x 02 + y02 + z02 − c2 t02 = 0, (3.8)

e portanto
x 2 + y2 + z2 − c2 t2 = x 02 + y 02 + z 02 − c2 t 02 . (3.9)
A transformação de coordenadas de um referencial (t, x, y, z) para um referen-
cial (t0 , x 0 , y0 , z0 ) que faz com que esta identidade seja verdadeira é a transfor-
mação de Lorentz. Ela obviamente vale para um deslocamento infinitesimal
como descrito em (3.6) onde os sinais (+, −, −, −) ou (−, +, +, +) são apenas
uma questão de convenção. O deslocamento ds é um quadrivetor invariante,
e a partir dele podemos definir uma quadrivelocidade, uma quadriaceleração
ou um quadrimomento, por exemplo. Uma das consequências da Teoria da
Relatividade Especial de Einstein é que os quadrivetores são grandezas invari-
antes, ou seja, elas tem o mesmo módulo quadrado independente do referencial
inercial escolhido. Em outras palavras, pensando na quadrivelocidade, temos

U = (γ c, γ u x , γ uy , γ uy ) (3.10)

onde γ é o fator de Lorentz e ui é a velocidade usual da mecânica. No caso da


quadrivelocidade em especial

U 2 = gµν U µ U ν = (U 0 )2 − (U 1 )2 − (U 2 )2 − (U 3 )2 = c2 (3.11)

No limite não relativístico γ → 1 a quadrivelocidade se tornar

U = (c, u x , uy , uy ) (3.12)

e sua parte espacial se torna a velocidade da mecânica clássica.

A expressão ds2 não deve ser interpretada mais como a distância (medida
com régua) entre dois pontos mas uma distância no espaço-tempo, entre
dois pontos de coordenadas espaciais diferentes e que ocorrem em tempos
diferentes. A distância espacial continua sendo dada do mesmo modo que
estamos habituados a calcular. A parte espacial da métrica fundamental de
Minkowski é Euclideana. De um modo geral podemos então escrever

ds2 = c2 dt2 − dr2 . (3.13)

É importante notar que ds2 pode ser negativo e portanto ds pode ser imaginário.
A interpretação disto será dada logo abaixo.

Rigorosamente falando, um espaço que tenha uma métrica positiva definida é


chamado de Riemanniano. Se a métrica é indefinida, como no nosso caso, o
espaço é chamado de pseudo-Riemanniano, semi-Riemanniano. Muitos livros
de física não fazem esta distinção e chamam o espaço da Relatividade Geral
ou Especial simplesmente de Espaço Riemanniano (o espaço de Minkowski da
Relatividade Especial é um caso especial de espaço curvo de curvatura nula).

© s.r. dahmen 2022


38 uma introdução à teoria do espaço e do tempo

O ângulo entre dois vetores não nulos é dado por


gµν Aµ Bν
cos θ = q , (3.14)
k gκι Aκ Aι k k gρσ Bρ Bσ k

que nada mais é que a generalização da conhecida fórmula do produto escalar


no espaço plano
A·B
cos θ = (3.15)
kAk kBk

3.2 O comprimento de uma curva


Estamos interessados em descrever trajetórias numa variedade. Vamos assim
imaginar que temos uma curva γ parametrizada por uma variável t de tal
maneira que cada ponto sobre a curva possa ser descrito conhecendo-se as n
variáveis
x α = x α ( t ). (3.16)
Normalmente em física associamos t ao tempo mas em Relatividade Geral, em
muitas situações, t não pode ser identificado com o tempo medido por um
relógio. Por isso alguns autores preferem chamar a variável que parametriza
a curva de λ. Por exemplo, o parâmetro t pode ser ângulo θ que descreve a
trajetória de um objeto que oscula um astro, sendo que θo = 0 é o ângulo que
corresponde à vertical de um observador sobre a superfície do astro. Manterei
aqui a notação t mas devemos ter sempre este ponto em mente bastante claro,
não tomando-o necessariamente por um tempo. Ao longo de toda a trajetória,
x˙α = dx
α
dt representa a tangente à curva γ em cada ponto onde a derivada é
calculada. Se o parâmetro t varia num intervalo, digamos a ≤ t ≤ b, então o
comprimento L de γ entre os extremos de t vale
Z b
1
L= k gµν x˙µ x˙ν k 2 dt (3.17)
a

Notem que esta equação independe de uma escolha particular de coordenadas e


o módulo aparece pois para uma métrica indefinida gµν x˙µ x˙ν pode ser negativo.
A distância assim definida não representa a distância entre pontos mas sim a
distância entre os pontos se percorremos a curva λ. No caso de dois pontos
infinitesimalmente próximos, podemos definir a distância entre os dois pontos
através do elemento de linha

ds2 = gµν dx µ dx ν . (3.18)

Na Relatividade Geral e também na Especial usamos uma variedade pseudo-


Riemanniana cujo gµν é indefinido pela escolha da assinatura (+, −, −, −). De
maneira análoga à Relatividade Especial, onde o intervalo ds2 pode ser positivo,
nulo ou negativo, na Relatividade Geral qualquer vetor A 6= 0 pode ser de 3
diferentes tipos:
 
tipo-tempo > 0

 

µ ν
tipo-luz ou nulo se gµν dx dx =0 (3.19)

 

tipo-espaço < 0

Esta nomenclatura se aplica também à curvas se seus vetores tangentes (or


parte deles) são tipo-tempo, tipo-luz ou tipo-espaço. Partículas com massa

© s.r. dahmen 2022


propriedades métricas do espaço 39

seguem trajetórias tipo-tempo, ao passo que partículas sem massa seguem


trajetórias cujas curvas são nulas. Por isso estas curvas são chamadas também
de tipo-luz, pois são as trajetórias seguidas pelos fótons.

3.3 Partícula livre no espaço curvo: geodésicas


A métrica nos permite escrever equações conhecidas da mecânica em uma
linguagem que independe das coordenadas escolhidas e do espaço ser ou não
curvo. Até o momento estávamos acostumados a trabalhar com coordenadas
cartesianas, cilíndricas ou esféricas, para as quais a distância entre dois pontos
infinitesimalmente próximos vale:

ds2 = dx2 + dy2 + dz2 ,


ds2 = dρ2 + ρ2 dϕ2 + dz2 ,
ds2 = dr2 + r2 dθ 2 + r2 sin2 θdϕ2 .

Quando olhamos o problema sob a perspectiva de uma métrica que nos dá um


ds2 cuja forma geral é

ds2 = gαβ ( x ν )dx α dx β ; α, β, ν = 1, 2, 3. (3.20)

estamos abrindo um caminho que nos permite também descrever todas as gran-
dezas mecânicas que de alguma maneira estejam relacionadas a deslocamentos
de forma covariante, ou seja, independente das coordenadas escolhidas e da
curvatura do espaço. Dentre estas grandezas uma das mais importantes é sem
dúvida a velocidade v ou, mais particularmente, v2
 2
ds dx α dx β
v2 = = gαβ (3.21)
dt dt dt

pois com v2 podemos construir o Lagrangeano de uma partícula livre e deduzir


então as equações de movimento. O formalismo se aplica tanto ao plano
quando à superfície de uma esfera. Para tornar esta idéia um pouco mais
concreta, calculemos v2 em coordenadas esféricas usando este formalismo.
Temos neste caso para a métrica fundamental gαβ do R3 na forma
 
1 0 0
gαβ = 0 r2 0 , (3.22)
 
0 0 2 2
r sin θ

e portanto

dr dr dθ dθ dϕ dϕ
v2 = grr + gθθ + g ϕϕ
dt dt dt dt dt dt
= ṙ2 + r2 θ̇ 2 + r2 sin2 θ ϕ̇2 (3.23)

Se a partícula puder se mover apenas sobre a superfície de uma esfera (r =


R = constante), então o termo em ṙ é nulo e sobra apenas as velocidades
angulares. Este resultado era nosso conhecido mas o ponto fundamental aqui
é ter mostrado como, dado um gαβ , podemos deduzir uma expressão para v2
que tenha sentido físico, embora muitas vezes nos falte a visão geométrica do
que realmente está acontecendo. É justamente neste ponto que reside a força do
método: uma vez que temos uma expressão covariante para a velocidade em

© s.r. dahmen 2022


40 uma introdução à teoria do espaço e do tempo

termos da métrica fundamental, podemos deduzir as equações de movimento


da partícula livre para espaços curvos, dado que temos o Lagrangeano de uma
partícula livre de massa m
1 2 m
L= mv = gαβ ẋ α ẋ β . (3.24)
2 2
e as equações de Euler-Lagrange do segundo tipo são, como sabemos
d ∂L ∂L
− ν = 0. (3.25)
dt ∂ ẋ ν ∂x
Mas surge aqui uma pergunta: como sabemos que ainda é possível usar a
equação de Euler-Lagrange em espaços curvos? As equações de Euler-Lagrange
são fruto de algo mais fundamental: o princípio da ação mínima, onde a ação é
R
definida como S = L( x, ẋ ) dt. Com a ajuda do cálculo variacional
Z
δS = 0 = δ L( x, ẋ ) dt (3.26)

obtemos a equação (3.25). Portanto podemos sim usar as equações de Euler-


Lagrange em espaços curvos pois eles são reflexo de um princípio mais funda-
mental 1 . 1
Esta dedução pode ser vista, por exem-
Vamos calcular explicitamente as derivadas em (3.25). Para manter a notação plo, no livro de Mechanics de Lan-
mais clara, abriremos por uns instantes a notação de Einstein e escreveremos dau e Lifshitz, Editora Butterworth-
Heinemann, 3rd Edition, Oxford, 1976,
as somas explicitamente. Para a primeira derivada temos p. 2.
∂L ∂ m 
∂ ẋ ν
= ∑
∂ ẋ ν α,β 2
g αβ ẋ α β

 α β
m ∂ ẋ β α ∂ ẋ
2 ∑
= g αβ ẋ + ẋ
α,β
∂ ẋ ν d ẋ ν
 
m

β
= gαβ δνα ẋ β + δν ẋ α
2 α,β
m m
=
2 ∑ gνβ ẋ β + 2 ∑ gαν ẋα (3.27)
β α

Como os índices α e β das somatórias são mudos e gνβ = g βν podemos


simplesmente substituir na primeira somatória β → α e escrever
m m m m
2 ∑ gνβ ẋ β + 2 ∑ gαν ẋα =
2 ∑ gαν ẋα + 2 ∑ gαν ẋ α
β α α α
m
= 2
2 ∑ gαν ẋ α
α
m gαν ẋ α = (3.28)
 
d ∂L
Falta agora calcularmos a derivada temporal dt ∂ ẋ ν . Temos
 
d ∂L d
= m ( gαν ẋ α )
dt ∂ ẋ ν dt
dgαν α d ẋ α
= m ẋ + m gαν
dt dt
∂gαν dx β α
= m ẋ + m gαν ẍ α
∂x β dt
= m gαν ,β ẋ β ẋ α + m gαν ẍ α
(3.29)

© s.r. dahmen 2022


propriedades métricas do espaço 41

Substituindo estes resultados na equação de Lagrange do segundo tipo e


dividindo tudo pela massa m temos
1
gαν ẍ α + gαν ,β ẋ α ẋ β − g ẋ α ẋ β = 0 (3.30)
2 αβ ,ν
Podemos escrever o segundo termo do lado esquerdo da equação acima de
forma mais simétrica
1  
gαν ,β ẋ α ẋ β = gαν ,β + g βν ,α ẋ α ẋ β (3.31)
2
que substituido em (3.32) nos dá
1  
gαν ẍ α + gαν ,β + g βν ,α − gαβ ,ν ẋ α ẋ β = 0 (3.32)
2
Finalmente um último passo: vamos multiplicar toda a expressão acima por
gµν . Obtemos
1  
gµν gαν ẍ α + gµν gαν ,β + g βν ,α − gαβ ,ν ẋ α ẋ β = 0
2
µ
δα
1 µν  
ẍ µ + g gαν ,β + g βν ,α − gαβ ,ν ẋ α ẋ β = 0 (3.33)
2
O termo que multiplica o fator ẋ α ẋ β é conhecido como símbolo de Christoffel
do 2º tipo e é representado por Γ αβ
µ

1 µν  
gαν ,β + g βν ,α − gαβ ,ν ≡ Γ
µ
g αβ . (3.34)
2
Os símbolos de Christoffel exercem um importante papel na Relatividade Geral
e os discutiremos mais detalhadamente no capítulo seguinte, interpretando-os
geometricamente. Com esta definição podemos escrever a equação (3.33) de
maneira mais sintética:
ẍ µ + Γ αβ ẋ α ẋ β = 0.
µ
(3.35)
Esta é a equação de movimento de uma partícula livre escrita em forma
covariante. Ela se aplica em qualquer sistema de coordenadas e em espaços
de qualquer curvatura, pois a métrica fundamental gµν está codificada via
símbolos de Christoffel.

Podemos simplesmente obter as equações de movimento de uma partícula


livre colocando os símbolos de Christoffel na equação acima. Na prática o que
se faz na verdade é exatamente o contrário: na maior parte das situações se
escreve as equações de movimento partindo da equação de Lagrange e dela
lemos diretamente os símbolos de Christoffel, pois este procedimento é mais
simples. Por exemplo no caso de uma partícula livre cuja velocidade é expressa
em coordenadas esféricas temos
m 2 
L= ṙ + r2 θ̇ 2 + r2 sin2 θ ϕ̇2 (3.36)
2
A partir desta Lagrangeana obtemos o seguinte conjunto de equações de
movimento:

r̈ − r θ̇ 2 − r sin2 θ ϕ̇2 = 0
2
θ̈ + ṙ θ̇ − sin θ cos θ ϕ̇2 = 0
r
2
ϕ̈ + ṙ ϕ̇ + 2 cot θ ϕ̇ θ̇ = 0 (3.37)
r

© s.r. dahmen 2022


42 uma introdução à teoria do espaço e do tempo

de onde, comparando com a equação (3.35) podemos obter diretamente os


símbolos de Christoffel por nós calculados na equação (B.-17) do Apêndice B.
O caminho percorrido por uma partícula livre é o de menor distância entre
dois pontos (uma reta no espaço plano). Com esta observação chegamos ao
importante conceito de curva geodésica ou simplesmente geodésica.

3.3.1 Geodésicas
Imagine-se dirigindo seu carro num espaço curvo. Deixe o volante na posição
neutra e siga em frente. Qual a trajetória que seu carro irá descrever? Seu
carro descreverá aquilo que na geometria diferencial é chamado de geodésica. A
posição neutra do volante significa em termos físicos um corpo não sujeito a
forças. Um corpo não sujeito a forças descreve uma trajetória “reta”do espaço
curvo. Em geometria diferencial a geodésica é a menor distância entre os
pontos A e B. Seguir uma geodésica significa andar em linha “reta”.
Numa superfície esférica bidimensional as geodésicas são os grandes círculos.
O Equador é um grande círculo, da mesma maneira que você se move sobre
parte de um grande círculo se andar de sul para norte mantendo sua longitude
constante. É por isto que aviões seguem, na medida do possível, trajetórias
que são partes de grandes círculos. Por exemplo, no vôo entre Frankfurt para Figura 3.1: Trajetória mais curta entre os
Tóquio voa-se primeiro em direção nordeste paralelo à costa da Suécia com aeroportos de Frankfurt (FRA) e Tóquio-
Haneda (HND). Mapa gerado pelo site
a proa em Murmansk, para depois fazer um desvio para sudoeste, sobre a
gcmap.com.
Sibéria, com a proa em Tóquio. A figura ao lado ilustra a trajetória seguida
que, vista na representação plana do mapa terrestre, parece um arco.
Para acharmos agora a menor distância entre dois pontos usaremos o for-
malismo Lagrangiano já usado por nós no capítulo anterior. Esta abordagem se
justifica pois as equações do movimento no formalismo Lagrangeano vêm da
R
minimização a ação L(ẋ, x) dt. Substituindo o tempo t pela parametrização λ
de uma curva genérica chegaremos ao mesmo conjunto de equações.

A menor distância entre dois pontos

Queremos achar a menor distância entre os pontos A e B numa variedade


curva. O comprimento total da conexão entre os ponto é
Z Figura 3.2: Trajetória típica do vôo LH-
716 da empresã aérea alemã Lufthansa,
`= ds (3.38)
C que liga as cidades de Frankfurt e Tóquio-
Haneda. Quando projetada no plano, a
onde C é uma curva entre os pontos A e B e ds um elemento de comprimento geodésica (grande círculo, em verde) pa-
ao longo da curva. Dada uma métrica gµν ( x ) sabemos que o intervalo é dado rece curva, quando na verdade é uma
por ’reta’ na superfície da esfera. A reta (ver-
melho) na verdade é curva.
ds2 = gµν ( x ) dx µ dx ν (3.39)
Uma curva sobre a qual queremos fazer a integral precisa ser definida, ou seja,
parametrizada. Sendo uma curva e portanto unidimensional, necessitamos
em princípio de um parâmetro apenas. Vamos chamar este parâmetro de λ.
Podemos assim definir ds como
s
gµν dx dx dλ2
µ ν
ds = dλ dλ
q
= gµν ẋ µ ẋ ν dλ (3.40)

Isto nos permite escrever a distância entre os pontos A e B onde o parâmetro

© s.r. dahmen 2022


propriedades métricas do espaço 43

assume os valores λ A e λ B na forma


Z λB q
`= gµν ẋ µ ẋ ν dλ (3.41)
λA

Esta parametrização pode nos parecer à primeira vista um pouco estranha


mas a utilizamos constantemente na mecânica. Vamos lembrar do exemplo do
lançamento oblíquo no campo gravitacional de uma massa m com velocidade
inicial v0 = (v0x , v0y ). Nós sabemos do curso de física básica que as posições
x (t) e y(t) são dadas por

1 2
x (t) = x0 + v0x t ; y(t) = y0 + v0y t − gt . (3.42)
2
A equação da parábola é obtida eliminando o t da primeira equação e substi-
tuindo na segunda:
v0y 1 g
y ( x ) = y0 + ( x − x0 ) − ( x − x0 )2 (3.43)
v0x 2 v20x

Se quisermos calcular a distância percorrida ao longo da parábola, tomando


t0 = 0 e na equação (3.41) os termos
!
1 0
gµν = ; ẋ1 ẋ1 = v2x e ẋ2 ẋ2 = v2y . (3.44)
0 1

ficamos com
Z t q
` = v2x + v2y dt0
0
Z t q 2
= v20x + v0y + gt0 dt0
0
(3.45)

cuja solução é

2 t
 
1
q
` = (v0y − gt0 ) v20x + v0y − gt0
2g 0
2 t
 2 
v0x
q
+ ln (v0y − gt0 ) + v20x + v0y − gt0
2 0
(3.46)

Substituindo os valores dos limites de integração obtemos finalmente

1
q 2
` = (v0y + gt) v20x + v0y − gt
2g
v20x
 q 
2
+ ln v0y + gt + v20x + v0y − gt
2
1 q v2  q 
− v0y v20x + v20y − 0x ln v0y + v20x + v20y (3.47)
2g 2

Caso deixemos a massa cair verticalmente a partir do repouso v0 = 0, obtemos


o resultado trivial ` = 1/2 gt2 que é a distância percorrida em linha reta pela
massa ao cair.

© s.r. dahmen 2022


44 uma introdução à teoria do espaço e do tempo

Do cálculo variacional sabemos que o menor caminho é aquele para o qual


a variação δ` = 0. Podemos assim usar o formalismo Lagrangiano escrevendo
a expressão acima na forma da integral de uma função de Lagrange
q
L( x, ẋ ) = gµν ẋ µ ẋ ν (3.48)

de tal modo que


Z λB q
δ` = δ gµν ẋ µ ẋ ν dλ = 0. (3.49)
λA
Esta variação nos dá nada mais nada menos que a equação de Lagrange do
segundo tipo da mecânica (onde substituímos λ por t):

d ∂L ∂L
− u =0 (3.50)
dλ ∂ ẋ u ∂x

Como a métrica do espaço Riemanniano codifica a curvatura da variedade em


cada ponto p e na Teoria da Gravidade de Einstein a métrica gµν que muda de
ponto a ponto codifica a gravidade, a equação acima diz como é a geodésica de
uma partícula num campo gravitacional. Mostramos na seção anterior, depois
de fazermos uma quantidade razoável de conta, que a equação de Lagrange
acima leva à equação

1 µν  
ẍ µ + g gαν ,β + g βν ,α − gαβ ,ν ẋ α ẋ β = 0 (3.51)
2

que, quando usamos a definição do símbolos de Christoffel como função da


métrica
1 µν  
gαν ,β + g βν ,α − gαβ ,ν ≡ Γ αβ
µ
g (3.52)
2
somos levados finalmente à expressão

ẍ µ + Γ
µ
αβ ẋ α ẋ β = 0 (3.53)
Esta equação é a mesma equação de movimento de uma partícula livre cuja
Lagrangeana é L = (m/2) gµν ẋ µ ẋ ν . A beleza da teoria é capturada por esta
equação simples, mas profunda: a mesma equação que descreve o movimento
de uma partícula livre descreve o caminho de menor distância entre dois
pontos num espaço cuja curvatura está codificada na métrica via os Γ αβ .
µ

Se, segundo Einstein, a massa e energia são então a causa da curvatura, a


conclusão é que uma partícula sob a ação da gravidade não está sujeita a uma
força: ela é na verdade uma partícula livre que se move ao longo de uma
geodésica no espaço curvo. A gravidade não é portanto uma “força”, mas é
uma manifestação da curvatura do espaço.

Exemplo: retas no R2 em coordenadas polares.

Como vimos, o plano R2 pode ser descrito em termos das coordenadas polares
r, ϕ com a métrica
! !
1 0 µν 1 0
gµν (r ) = , g (r ) = (3.54)
0 r2 0 r −2

Nos símbolos de Christoffel aparecem as derivadas da métrica na forma gµν ,α .


O único elemento de gµν que não é constante é o termo g22 que é uma função

© s.r. dahmen 2022


propriedades métricas do espaço 45

da variável x1 = r e portanto a única derivada diferente de zero é g22, 1 . Isto


significa que temos apenas três símbolos de Christoffel diferentes de zero:

1 1 11 1
Γ 22 = g ( g12 ,2 + g12 ,2 − g22 ,1 ) = − g11 g22 ,1 = −r
2 2
1 1 22 1 1
Γ 12 = Γ 21 = g ( g21 ,2 + g22 ,1 − g12 ,2 ) = g22 g22 ,1 = .
2
2 2 r
Neste caso as equações das geodésicas são:

ẍ1 + Γ 1 2 2
22 ẍ ẍ = r̈ − rϕ2 = 0
2
ẍ2 + Γ 2 1 2
22 ẍ ẍ = ϕ̈ + ṙ ϕ̇ = 0 (3.55)
r
Paradoxalmente, esta é talvez a pior maneira possível de se escrever a equa-
ção de uma reta em R2 ! Se aplicarmos o formalismo acima às coordenadas
cartesianas x1 = x e x2 = y somos levados ao resultado trivial ẍ = ÿ = 0.

Exemplo: geodésicas na superfície da esfera.

Podemos utilizar o mesmo procedimento para determinar a geodésica na


superfície da esfera, ou seja, a equação de um grande círculo.
A superfície da esfera S2 ⊂ R3 de raio unitário R = 1 pode ser parametri-
zada pelos ângulos ( x1 , x2 ) = (θ, ϕ). O tensor métrico vale
! !
1 0 µν 1 0
gµν (θ ) = , g (r ) = (3.56)
0 sin2 θ 0 sin−2 θ

e a única deriva parcial diferente de zero é g22 ,1 . Os símbolos de Christoffel


são:

1 1 11 1
Γ 22 = g ( g12 ,2 + g12 ,2 − g22,,1 ) = − g11 g22 ,1 = − sin θ cos θ
2 2
2 1 1
Γ 12 = Γ 221 = g22 ( g21 ,2 + g22 ,1 − g12,,2 ) = g22 g22 ,1 = cot θ.
2 2
As geodésicas são dadas pelas equações Figura 3.3: UM grande círculo na esfera
e no mapa. Se você já acompanhou a
ẍ1 + Γ 1 2 2
22 ẍ ẍ = θ̈ − sin θ cos θ ϕ̇2 = 0 trajetória da ISS num mapa, esta figura
deve ser familiar.
ẍ2 + Γ 2 1 2
12 ẍ ẍ = ϕ̈ + 2 cot θ θ̇ ϕ̇ = 0 (3.57)

Estas são as equações de um grande círculo na esfera. Como podemos ver isto?
Primeiro temos que observar que uma curva geodésica é sempre a interseção
de um plano e a superfície esférica pois é a curva mais “reta” possível entre
dois pontos. E, sendo a intersecção de um plano com uma esfera, ela deve
ser um círculo. Uma vez que a esfera é a figura mais simétrica possível, não
há uma direção preferencial e todas as direções são equivalentes. Portanto
podemos escolher uma curva para quem θ tem um valor constante (latitude
constante), isto é paralela ao plano equatorial. Neste caso θ̈ = 0 e portanto o
segundo termo da equação (3.57) acima deve ser identicamente nulo:

sin θ cos θ ϕ̇2 = 0 (3.58)

Porém, ϕ̇ = dϕ/dλ 6= 0 pos a solução trivial ϕ̇ = 0 implicaria estarmos presos


a um ponto. Sendo assim concluímos que
π
sin θ cos θ = 0 → θ= (3.59)
2

© s.r. dahmen 2022


46 uma introdução à teoria do espaço e do tempo

é a única solução possível para θ ∈ [0, π/2]. Portanto a geodésica é um grande


círculo e coincide com a linha do Equador. Se θ = π/2 o 2º termo da segunda
equação (3.57) nos dá

ϕ̈ = 0 → ϕ̇ = K → ϕ = λK (3.60)

Se medirmos ϕ em radianos, K = 1/R e a solução nos dá longitude medida


ao longo da linha do Equador. Agora, sendo a orientação dos eixos a partir
dos quais definimos os ângulos θ e ϕ arbitrários, todos as possíveis “linhas
equatoriais” são soluções e portanto os grandes círculos são todos os círculos
desenhados sobre a superfície de uma esfera cujos centros coincidem com o
centro da esfera, como havíamos afirmado anteriormente. Além do mais, é fácil
ver também que para quaisquer 2 cidades na superfície da Terra sempre existe
um grande círculo que passa pelas duas.

© s.r. dahmen 2022


4
O Cálculo Tensorial

O formalismo tensorial é a linguagem natural da Teoria da Relatividade Geral. Discu-


tiremos aqui o cálculo diferencial e integral para grandezas tensoriais. Este capítulo
pode ser substituído pela leitura do Apêndice B onde as mesmas idéias são apresentadas
usando coordenadas curvilíneas no R2 .

4.1 Acerca de abstração, poesia e física ∗


Para entendermos um pouco o que torna a Teoria da Relatividade Geral tão
especial e o cálculo tensorial tão útil, vamos começar com uma frase de um dos
livros da coleção de de L. D. Landau e E. M. Lifshitz 1 : 1
L. D. Landau and E. M. Lifshitz, The
Classical Theory of Fields, vol. 2, Pergamon
Press, 1971, p. 227.
A teoria dos campos gravitacionais, construida sobre os fundamentos da
teoria da relatividade, é chamada de teoria da relatividade geral. Ela foi criada
por Einstein (e por ele finalizada em 1916) e representa, provavelmente, a
mais bela de todas as teorias da física. O que é mais extraordinário é que ele
a desenvolveu de maneira puramente dedutiva e só posteriormente ela foi
corroborada por observações astronômicas.

As raízes desta beleza à qual Landau e Lifshitz se referem pode ser explicada
pelas palavras do físico e escritor inglês Femi Fadugba, segundo o qual a física
é “poesia ao inverso” 2 : 2
F. Fadugba, entrevista a Agnes Sonntag,
revista Spiegel, seção Kultur, edição 48,
novembro de 2021.
Tudo na física necessita de uma metáfora para poder ser descrito. Por isso
a física é como a poesia, só que invertida: na poesia tudo é descrito em um
nível mais abstrato, seja ele o amor, o mar, ou um relacionamento. Na física
procedemos de modo parecido, mas inverso: pegamos algo abstrato, o universo
invisível e matemático da física, e recorremos à metáforas para trazê-lo para
[um nível mais] baixo, para o concreto, e assim conseguirmos entendê-lo .

A poesia toma o concreto e o sublima. A física traz o sublime para o concreto.


A Teoria da Relatividade Geral é o melhor exemplo disto, pois ela é diferente
de todas as teorias que conhecemos. Na Física que fizemos até agora, o espaço
e tempo têm existência a priori, são como recipientes que lá estão, o palco onde
os fenômenos físicos se desenrolam. Tudo existe no espaço e no tempo, razão
pela qual Hermann Weyl (1885 - 1955) disse serem o espaço e tempo uma
das formas de existência da matéria 3 . Sua existência independe da existência 3
H. Weyl, Raum, Zeit, Materie: Vorle-
sungen über Allgemeine Relativitätstheorie,
Springer Verlag, Berlin, 1919.
48 uma introdução à teoria do espaço e do tempo

qualquer corpo ou fenômeno físico e não é por eles influenciado. Eles não tem
uma estrutura física, motivo pelo qual podemos dotar o espaço de uma métrica
Euclideana e identificar o eixo temporal com o espaço de números reais R.
Na Relatividade Geral ocorre justamente o contrário: segundo a Relatividade
Geral, o campo gravitacional – um campo de forças da física clássica – pode ser
identificado com a métrica do espaço e do tempo. A métrica é quem determinao
estado de movimento dos corpos e campos” 4 . Por outro lado, a teoria de 4
H.-J. Treder, Relativität und Kosmos:
Einstein também nos ensina que os processos físicos que ocorrem no espaço- Raum und Zeit in Physik, Astronomie
tempo influenciam suaa estrutura. Isto significa que a geometria do espaço e do und Kosmologie, Akademie-Verlag, Berlin,
1968, p. 54.
tempo, no qual os fenômenos acontecem, é definida a partir das equações que
descrevem estes mesmos fenômenos. Isto faz da Relatividade Geral uma teoria
sem paralelos na física. Espaço e tempo são definidos pelas equações, e não são
pré-condições para que estas equações existam. A Teoria da Relatividade Geral
de Einstein não é portanto apenas uma teoria NO espaço-tempo mas acima de
tudo uma teoria DO espaço-tempo.
Do ponto de vista matemático, uma das principais consequências disto é
que as equações fundamentais da Relatividade Geral não podem depender de
uma estrutura espaço-temporal a priori, pois são justamente elas que definirão
quem são estas estruturas. Isto, aliado ao fato da gravitação ser universal, pois
atua sobre todas as partículas, e de longo alcance, atingindo os confins do
Cosmos, dão à Relatividade Geral uma posição única dentro de toda a física.
Na verdade, como o espaço e tempo são afetados por todos os processos que
nele ocorrem, todas as equações da física devem ser covariantes, ou seja, escritas
de uma forma que independa de uma estrutura espaço-temporal definida a
priori.
A necessidade de escrever equações que fossem válidas em qualquer geo-
metria e qualquer sistema de coordenadas foi um dos grandes desafios que
Einstein teve que enfrentar durante a criação da teoria. O fato que já existia
uma linguaguem – o cálculo tensorial – que lhe permitiu escrever as equações
sem fazer referência a qualquer espaço lhe foi mostrado por seu amigo e cola-
borador Marcel Grossmann (1878 – 1936), um especialista em cálculo tensorial
e geometria diferencial. Neste capítulo discutiremos alguns pontos básicos do
cálculo tensorial, sem o qual não é possível entender a Relatividade Geral.
Nosso objetivo neste capítulo será portanto o de entender como definir
derivadas e integrais de tensores em espaços curvos. Isto será feito de forma
abstrata pois não temos como visualizar geometricamente um espaço-tempo
quadridimensional, quanto mais se ele for curvo. Por isso é importante en-
tendermos como trabalhar com tensores e empregar as regras de maneira
correta pois boa parte dos cálculos da Relatividade Geral são feitos em um
nível de abstração com o qual devemos nos acostumar. Uma fez feitas as contas
corretamente, “projetamos” os resultados em 2 ou 3 dimensões para então
interpretá-los fisicamente, do mesmo modo que na Termodinâmica olhamos
projeções de uma equação de estado em 2 ou 3 dimensões para podemos visua-
lizar o que realmente está acontecendo. A vantagem do método abstrato é que
ele se aplica a qualquer número de dimensões. É com isto que nos ocuparemos
neste capítulo.

4.2 Derivada parcial de um tensor


Antes de embarcarmos na questão das derivadas de tensores, é importante
que nos familiarizemos com a notação usada nos livros e artigos sobre cálculo

© s.r. dahmen 2022


o cálculo tensorial 49

tensorial. Na literatura encontramos várias maneiras de representar a derivada


parcial da componente A a um vetor em relação à coordenada x b . As mais
comuns são:

∂A a
∂b A a A a, b A a|b (4.1)
∂x b

As duas últimas são mais comumente usadas em livros de Relatividade Geral.


O mesmo vale obviamente para tensores de ordem mais alta

∂A ab···
∂m A ab··· A ab···
,m A ab|m··· (4.2)
∂x m

A notação vale também para índices covariantes ou mistos: A a,b = A a|b ou


ab··· ab···
Acd ··· , m = Acd··· |m .
O que haveria de tão diferente na derivada de um tensor para que tenhamos
que dedicar um capítulo especial ao assunto? Para que entendamos isto
precisamos entender duas coisas. A primeira tem um cunho mais fundamental:
não nos esqueçamos que um dos pilares da Relatividade Geral é a covariância
das equações, ou seja, o fato de elas terem a mesma forma quaisquer que
sejam as coordenadas escolhidas. Equações da Física envolvem tensores e suas
derivadas e por conseguinte, surge a pergunta: quais as regras de transformação
de derivadas de tensores? Elas se transformam como tensores, ou seja, são
também tensores ou não? Caso a resposta seja negativa, como ’modificar’ a
derivada para que obtenhamos um tensor? O segundo ponto a ser considerado
é de ordem prática: quando fazemos a derivada de um vetor, por exemplo,
temos que comparar o vetor num ponto de coordenada x α com o vetor em
x α + δx α . Em outras palavras, temos que transladar o primeiro vetor até o
ponto onde está o segundo vetor, mantendo-o paralelo a si mesmo, e então
calcular a diferença os dois vetores:

A( x α + δx α ) − A( x α )
lim (4.3)
δx α →0 δx α

A cor diferente para A( x α ) é para que nos lembremos que estamos lidando
com um vetor transladado paralelamente até o ponto onde se encontra o vetor
A( x α + δx α ). Isto é uma das primeiras coisas que aprendemos nos cursos
básicos de cálculo sem que na verdade atentemos para o procedimento em
si. É justamente aí que surge a questão de ordem prática: num espaço curvo,
como transladar um vetor paralelamente se em cada ponto do espaço o vetores
da base apontam em direções diferentes? Em outras palavras, o que significa
paralelo em um espaço curvo? A resposta é um pouco mais complicada que
nossa intuição com vetores em espaços planos possa sugerir.
Poderíamos olhar este problema de um ponto de vista estritamente ma-
temático: consideremos com um pouco mais de cuidado a expressão para a
derivada parcial das componentes de um vetor A no sistema de coordena-
das ( x 00 , x 01 , · · · ), obtidas pela transformação das coordenadas ( x0 , x1 , · · · ) da

© s.r. dahmen 2022


50 uma introdução à teoria do espaço e do tempo

forma x0 = x0 (x). Aplicando as regras usuais de derivação temos


 0a 
∂ ∂x
∂0c A0 a = A b
∂x 0c ∂x b
 0a
∂x d ∂

∂x b
= A → regra da cadeia y
∂x 0c ∂x d ∂x b
∂x d ∂x 0 a
 0a  
∂x d
  
∂ b ∂ ∂x
= A + Ab
∂x 0c ∂x b ∂xd ∂x 0c ∂x d ∂x b
 
0
  ∂ a0
= Λdc0 Λ ab Ab|d + Λdc0 Λ Ab
∂x d b
0 0
  0
A a|c0 = Λdc0 Λ ab Ab|d + Λdc0 Λ ab | d Ab (4.4)
↓ ↓ ↓
2-tensor ? transf. 2-tensor ?

0
Como fica claro pelo resultado acima, para que a derivada parcial A a|c0 seja
um tensor de ordem 2, o segundo termo do lado direito da expressão deve ser
nulo. O único caso onde isto ocorre é quando a matrix de transformação Λ ab0
independe da posição
0
0 0 ∂2 x a
Λ ab | d = ∂d Λ ab = b d = 0, (4.5)
∂x ∂x
ou seja, quando as transformações são lineares. Este é o caso por exemplo
da Transformação de Lorentz, motivo pelo qual na Relatividade Especial não
precisamos nos preocupar com o caráter tensorial das derivadas.
Desta discussão concluímos que a derivada parcial de um tensor não é um
5
No contexto do cálculo tensorial a de-
rivada parcial de uma tensor é chamada
tensor5 . Podemos agora retomar a discussão anterior com relação à interpre-
de derivada ordinária.
tação geométrica deste problema. Quando estudamos a variação de alguma
grandeza, estamos comparando seus valores em dois pontos P e Q distintos
6
O parâmetro da curva pode ser o tempo
t, mas não necessariamente. No caso de
divididos por um parâmetro que representa a separação entre os pontos6 . Em
uma órbita de um planeta, pode ser o
outras palavras, considerando o vetor A temos ângulo θ em relação a um θo = 0 previa-
mente definido.
[ Aa ]P − [ Aa ]Q
lim (4.6)
δu→0 δu
onde δu é a variação do parâmetro que mede a separação entre os pontos
P e Q. Se considerarmos porém as regras de transformação para vetores
contravariantes neste caso temos
 0  0a 
0a ∂x a b 0a ∂x
[ A ]P = [ A ]P e [ A ]Q = [ Ab ] Q (4.7)
∂x b P ∂x b Q

o que significa que não podemos transformar a derivada diretamente pois no


cálculo da derivada de A0 estamos usando uma matriz de transformação que
tem valores diferentes para diferentes pontos do espaço. Uma maneira bastante
simples de ver isto é quando consideramos a derivada de um campo vetorial
uniforme em coordenadas polares. Sabemos que a variação do vetor entre 2
pontos qualquer é nula. Porém, na figura ao lado fica claro que a componente
radial do vetor é diferente em diferentes pontos do espaço. Se não levarmos em
conta este fato na hora de calcularmos a variação de , obteremos um dA 6= 0
Figura 4.1: As componentes radiais (ver-
quando na verdade sabemos que dA = 0. melho) de um campo vetorial constante
A conclusão é que se quisermos definir uma derivada de um tensor que seja (azul) mudam em função do ponto onde
também um tensor, temos que incluir algo a mais na definição da derivada. Há o vetor está.

© s.r. dahmen 2022


o cálculo tensorial 51

três maneiras de fazer isto, definindo três tipos diferentes de derivadas. No


primeiro caso começamos com a inclusão de uma grandeza conhecida como
conexão afim, que nos permite definir a derivada covariante de um tensor. O
segundo caso consiste em introduzir a métrica, que define um tipo um tipo
particular de conexão afim conhecida como conexão métrica. Com ela definimos
um tipo especial de derivada covariante. Ainda é possível introduzir um campo
vetorial contravariante e com ele definirmos a chamada derivada de Lie. Nos
ocuparemos aqui da primeira derivada pois ela será usada extensivamente no
nosso curso.

4.2.1 Conexão afim e paralelismo


O que devemos então acrescentar à derivada parcial para obter uma derivada
que, aplicada num tensor, dê outro tensor? A derivada parcial ∂α (como qual-
quer derivada) pode ser entendida como o gerador de translações infinitesimas
na direção da coordenada x α . Isto explica por exemplo o motivo do operador
momento na Mecânica Quântica ser


p̂i = −ih̄ . (4.8)
∂xi
Como ilustra a figura (4.2.1), a derivada parcial corresponde à translação
infinitesimal do vetor Z ao longo da curva até uma nova posição, representado
pela linha verde pontilhada. Porém, o vetor Z assim transladado não é paralelo
a si mesmo e consequentemente não pode ser usado no cálculo da derivada.
Mas como assim, não é paralelo? Em espaços curvos paralelo significa manter
inalterado o ângulo entre o vetor e a tangente à curva. Para um ser unidimensional, d Γ

os vetores paralelos são Z0 e Z (linhas verdes cheias) pois Ztangente


0 = Ztangente .
Z
Como a derivada parcial corresponde a um deslocamento cujo paralelismo é Z
apenas aparente, precisamos acrescentar um termo Γ à derivada parcial que Z’

nos dá o vetor Z0 correto. É com este vetor Z0 que comparamos o novo vetor
Ztangente
no ponto desejado. Geometricamente falando Z = Z0 . É muito importante notar Z’tangente

que o conceito de paralelismo é sempre definido em relação à uma curva sobre


a qual se faz o deslocamento do vetor.
O deslocamento paralelo é um problema conhecido por navegadores. Se
alguém quiser navegar levando consigo um vetor e mantendo a direção do Figura 4.2: A derivada covariante contém um
vetor sempre a mesma, ele deve navegar em linha ’reta’ e garantir que o vetor termo de derivada parcial ∂ que corresponde à
translação do vetor até o ponto desejado mais
faça sempre o mesmo ângulo com a reta escolhida. Isto está ilustrado na figura um termo Γ de correção que mantém o parale-
abaixo para um barco que navegue pelo oceano mantendo sempre a mesma lismo. Para efeito de visualização a translação
infinitesimal não está em escala. No espaço
direção. O problema é que quando queremos mapear esta trajetória num plano, plano os dois vetores Z (linha verde cheia e
temos a impressão errônea que o vetor mudou de direção, quando na verdade verde pontilhada) são paralelos, mas não no
espaço curvo unidimensional da curva sobre a
não mudou. É isto que nos dá a impressão na figura (4.2.1) que a linha verde qual o vetor se desloca.
cheia e a linha verde pontilhada são paralelas, quando na verdade não são.

Figura 4.3: Um barco que circumnavega a


Terra mantendo sempre a mesma direção. Na
representação no plano, temos a impressão
que a direção mudou.

© s.r. dahmen 2022


52 uma introdução à teoria do espaço e do tempo

Figura 4.4: A idéia de transporte paralelo em


espaços curvos difere de nossa intuição eucli-
deana de paralelismo, como ilustram as figu-
ras. As figuras de cima mostram 2 vetores pa-
ralelos no espaço euclidiano R2 (em vermelho)
mas que não são paralelos para um ser unidi-
mensional que se desloca sobre uma geodésica
neste espaço. Para este ser o ângulo entre o
vetor e a curva muda a medida que o vetor
se desloca, diferente dos vetores em azul, que
são paralelos pois mantém sempre a mesma
direção em relação à geodésica. No espaço R2 ,
as retas que dão as direções destes vetores se
cruzam. A mesma idéia é ilustrada no caso
de uma esfera: vetores transportados de P a
(1)
Q de modo a manterem sua direção sobre a
(2)
curva resultam em vetores diferentes caso es-
colhamos a trajetória (1) ou (2). Esta propri-
edade, da diferença dos vetores finais depen-
dendo do caminho escolhido é um indicativo
da curvatura do espaço. Finalmente, a figura
(2) à direita mostra o transporte paralelo de um
(1)
vetor em R3 : para um ser que vivesse sobre a
esfera, este vetor começaria tangente à superfí-
cie no polo norte e iria se verticalizando à me-
dida que se movesse para o equador. Para ele
também o vetor mudaria de magnitude pois
sendo bidimensional só consegue medir a pro-
jeção deste vetor sobre a curva e no equador o
vetor se tornaria, para ele, um ponto.
Mas quem seria este Γ que devemos acrescentar para fazer a derivada correta e
qual seu significado? Nos ocuparemos disto agora.

4.3 O transporte paralelo e a derivada covariante


Para além da sua importância na definição da derivada covariante, o conceito de
transporte paralelo é muito importante na Física de espaços curvos pois as propriedades
do vetor ao ser transportado paralelamente ao longo de uma curva fechada determinam
se o espaço em questão é plano ou curvo. Estudamos aqui este conceito com alguns
detalhes e exemplos.
O transporte paralelo está intimamente relacionado ao que chamamos em
geometria diferencial de conexão afim (affine connection). Basicamente é uma
maneira de conectar diferentes planos tangentes sobre uma superfície curva de
maneira suave, permitindo assim que grandezas físicas sejam diferenciadas. Os
símbolos de Christoffel, por exemplo, definem matematicamente uma conexão
afim, motivo pelo qual são também chamados de coeficientes afins ou coeficientes
de conexão. Como estamos interessados em aplicações na física, vejamos como
estas ideias se refletem nas grandezas que nos interessam: vetores.
A diferencial total de um campo vetorial Ai ( x )

dAi = A,p
i
dx p = Ai ( x + dx ) − Ai ( x ) (4.9)

não é, em casos mais gerais, um vetor pois Ai ( x + dx ) e Ai ( x ) obedecem di-


ferentes propriedades de transformação. Isso tem a ver com o fato que em
espaços curvos os vetores da base ei variam em função das coordenadas. Isso
vai um pouco contra nossa intuição de espaços planos com os quais lidamos
até agora pois para fazer a diferença de vetores basta fazer diretamente a dife-
rença das componentes. Fossem nossas coordenadas cartesianas, o processo é
conhecido: se temos um vetor em x e outro em x + dx , deslocamos o primeiro
vetor paralelamente a si mesmo até o ponto x + dx e daí subtraímos os dois
vetores componente a componente. Notem que neste processo podemos fazer
a diferença “componente a componente” pois os versores que usamos para

© s.r. dahmen 2022


o cálculo tensorial 53

expressar os dois vetores são idênticos. Quando vamos para um espaço curvo,
temos que garantir que ao transportar o vetor descontemos a variação dos
vetores da base pois não é o vetor em si que muda mas sua representação. É
neste sentido que devemos entender em espaços curvos a idéia de “transporte
paralelo”. Um exemplo prático seria você se descolar ao longo de um meri-
diano sobre a superfície da Terra em direção ao Polo Norte. Durante todo o
deslocamento o vetor que dá sua direção e sentido de deslocamento é sempre
o mesmo. Rigorosamente falando o vetor existe no plano tangente a superfície
esférica do planeta, pois para existir na superfície ele teria que ser curvo, o que
não faz sentido. A figura ao lado exemplifica um deslocamento paralelo de um
vetor sobre a superfície de uma esfera imersa no R3 . Notem que para um ser
bidimensional, que vive sobre a superfície da esfera, as componentes do vetor
projetadas num eixo local não mudam e portanto o vetor não muda de direção:
ele foi transportado paralelamente a si mesmo. É importante também notar
que o transporte paralelo aqui ilustrado (e em muitos livros) é sempre descrito
sobre geodésicas, pois neste caso a visualização é mais fácil: no transporte
paralelo sobre uma geodésica o vetor mantém sempre o mesmo ângulo com a
tangente à curva. Isto não é verdade se o transporte se dá sobre uma curva que
não é uma geodésica. Nestas situações o ângulo do vetor muda em relação à
tangente à curva à medida que nos deslocamos. Um exemplo prático disto é
dado no Apêndice F, onde se calcula o transporte paralelo ao longo de uma
curva não geodésica. Ali podemos ver claramente como o vetor muda suas
componentes para poder compensar a mudança da base dos diferentes planos
tangentes.
Temos que considerar que ao transladarmos um vetor, os vetores da base
mudam e devemos “descontar”esta mudança na hora de fazer as contas. Esta Figura 4.5: Um vetor é transportado pa-
mudança será por nós chamada de δAi : ralelamente sobre uma geodésica de um
ponto sobre a superfície de uma esfera
até outro, mantendo inalteradas as pro-
δAi = mudança de Ai devido ao deslocamento paralelo por dx jeções do vetor sobre os eixos de coorde-
nadas que definem o plano tangente. As
devido à mudança da base (4.10)
linhas azuis, vistas por um ser em uma
dimensão mais alta, mostram que o para-
lelismo é relativo apenas à superfície da
Com isto podemos calcular a diferença infinitesimal entre dois vetores no
esfera S2 imersa no espaço tridimensio-
mesmo ponto nal.

DAi = [ Ai ( x ) , deslocado paralelalmente] − Ai ( x )


= Ai ( x + dx ) − δAi − Ai ( x ) = dAi − δAi (4.11)

Esperamos que a grandeza δAi seja proporcional às componentes Ak do vetor


e dos incrementos dx p . Podemos escrever esta mudança como sendo

δAi = −Γi kp Ak dx p (4.12)

Os Γikp são os mesmos símbolos de Christoffel do capítulo anterior. O que


conseguimos aqui foi uma interpretação geométrica: eles nos dizem como os
vetores da base mudam quando mudamos as coordenadas. Eles são de extrema
importância na Relatividade Geral, como veremos mais adiante. O sinal de
’−’ na expressão acima vem do fato que vetores contravariantes mudam no
sentido contrário à mudança da base, que são vetores tangentes na direção de

© s.r. dahmen 2022


54 uma introdução à teoria do espaço e do tempo

dx p . Com isto ficamos com

DAi = Ai ( x + dx ) − δAi − Ai ( x ) = [ Ai ( x + dx ) − Ai ( x )] − δAi


∂Ai
= dx p − (−Γi kp Ak dx p )
∂x p
i
= ( A,p + Γi kp Ak ) dx p
i
= A;p dx p = Aik p dx p (4.13)

O termo A;pi ou Ai da expressão acima é a chamada derivada covariante do


kp
vetor A e vale
i
A;p = Aik p = A,p
i
+ Γi kp A
k
(contravariante)
p
Ai;p = Ai k p = Ai,p − Γ ik A p (covariante) (4.14)

O sinal contrário da componente covariante se explica pelo fato que estas


componentes mudam com o mesmo sinal da base, isto é

p
δAi = Γ ik A p dx k (4.15)

e ao seguirmos os memos passos usados em (4.13) o sinal negativo aparece. A


generalização para tensores de ordem mais alta é simples: devemos considerar
a derivada covariante para cada índice separadamente:

∂Aµν
+ Γ γα Aγν + Γ νγα Aµγ
µν µ
A ;α =
∂x α
∂Aµν
Aµν ;α = − Γ γµα Aγν − Γ γνα Aµγ
∂x α
µ
∂A ν
+ Γ γα Aγν − Γ γνα Aγ
µ µ µ
A ν ;α = (4.16)
∂x α

4.4 Os símbolos de Christoffel ∗

Uma outra maneira de ver o mesmo resultado nos dá uma idéia mais intuitiva
do que os símbolos de Christoffel representam.
Quando variamos um vetor qualquer A variando uma das coordenadas
x p temos que levar em conta não só a dependência funcional do vetor com a
posição como também a variação dos vetores da base. Logo temos:

dA d ( A i ei ) ∂Ai ∂ei
= = e + Ai . (4.17)
dx p dx p ∂x p i ∂x p
var. das componentes var. da base

Quando um vetor ek da base muda devido à variação infinitesimal da variável


x p , o vetor diferença

dek = ek ( x p + dx p ) − ek ( x p ) (4.18)

deve ser proporcional à dx p e, sendo um vetor, ter componentes nas outras


direções ei :
dek = Γ i kp dx p ei (4.19)

onde os Γ i
kp são funções das coordenadas. Portanto o símbolo de Christoffel
Γ kp mede a componente i da mudança do vetor de base ek quando variamos
i

a coordenada x p . Um exemplo seria a variação de um vetor de base e1 num

© s.r. dahmen 2022


o cálculo tensorial 55

espaço bidimensional com vetores de base {e1 , e2 }. A expressão acima se reduz


à:
de1 = Γ111 dx1 e1 + Γ112 dx2 e1 + Γ211 dx1 e2 + Γ212 dx2 e2 (4.20)
No Apêndice B um exemplo prático é apresentado em detalhes para 2 casos:
os símbolos de Christoffel para coordenadas polares em R2 e coordenadas
esféricas em R3 . Para que fixemos bem a ideia vale a pena reforçar a definição:


 i→ i representa a componente do vetor diferença


 (neste caso a componente na direção ei de dek )
Γikp =


 kp → k representa qual vetor da base que varia (ek )

p representa a coordenada que varia (x p )

Isto portanto implica que para um vetor arbitrário A, sua variação quando a
base também varia vale, segundo a eq. (4.17)

dA ∂Ai
p = p ei + A i Γ k
ip ek (4.21)
dx ∂x
Uma vez que índices somados são mudos, podemos no 2º termo da expressão
acima fazer a troca i ↔ k, permitindo assim que escrevamos a expressão acima
de forma mais compacta:

dA ∂Ai
= e + Ai Γ k e
dx p ∂x p i | {zip }k
(i ↔ k )
i k i
= A,p ei +A Γ kp ei
h i
i
= A,p + Ak Γ i
kp ei . (4.22)

O termo entre chaves é o resultado por nós obtido na seção anterior.


No apêndice F são ilustrados dois exemplos de transporte paralelo: o
primeiro exemplo é o do transporte paralelo de um vetor no espaço plano. O
segundo exemplo é aquele do transporte paralelo sobre uma superfície curva,
neste caso de uma esfera.

4.5 Derivada absoluta ∗


Intimamente ligado à derivada covariante é o conceito da derivada absoluta.
A primeira é simplesmente a variação do tensor pela variação infinitesimal
das coordenadas. Quanto porém temos uma curva uα = uα (λ) parametrizada
por λ e queremos estudar a variação do tensor ao longo da curva, ou seja, sua
derivada em λ, temos a chamada derivada absoluta (alguns autores a chamam
de derivada covariante direcional). Ela nada mais é que o produto escalar da
derivada covariante do tensor pela tangente à curva uα (λ). A variação do vetor
A, como discutida anteriormente, pode ser escrita

dA dAµ eµ dAµ deµ


= = eµ + Aµ (4.23)
dλ dλ dλ dλ
var. componente var. base

Sabemos, por outro lado, que

deµ ν dx
α
=Γ µα eν . (4.24)
dλ dλ

© s.r. dahmen 2022


56 uma introdução à teoria do espaço e do tempo

Podemos assim reescrever a derivada de A em λ como

dA dAµ ν dx
α
= eµ + A µ Γ µα eν (4.25)
dλ dλ dλ

O que representa a grandeza dx


α
dλ na expressão acima? Sabemos que quando
derivamos um escalar f ao longo da direção de um vetor u = uν eν , ou seja
calculamos a derivada direcional de f , podemos escrever

df df
= uν ν (4.26)
dλ dx

que, em linguagem mais tradicional nada mais é que o produto escalar do


gradiente de f na direção do vetor u

df
=∇f·u (4.27)

Portanto o termo dx
α
α
dλ = u define a componente α do vetor tangente à curva.
Usando este resultado em (4.25) podemos escrever

dA dAµ
= eµ + A µ Γ ν α
µα u eν (4.28)
dλ dλ

Se já não bastasse esta expressão, os livros da área reescrevem-na de modo um


pouco diferente. Notando que

dAµ dAµ ∂x ν dAµ ν


= = u (4.29)
dλ ∂x ν dλ ∂x ν

escrevemos, finalmente

dA d Aµ ν
= u eµ + Aµ Γ νµα uα eν
dλ dx ν
A ,ν uν eµ + Aµ Γ νµα uα eν .
µ
= (4.30)

Uma vez que os índices são mudos, podemos no 2º termo do lado direito trocar
ν → µ para que assim o vetor de base possa ser colocado em evidência, e fazer
simultaneamente a troca µ → α e α → ν. Isto nos permite escrever a expressão
acima de forma mais compacta:

dA  
= A ,ν + Aα Γ
µ µ
αν u ν eµ (4.31)

ou seja
dA µ
= A ;ν uν eµ (4.32)

Ficamos assim com
 dA
dλ → derivada absoluta do vetor A ao longo da curva parametrizada por λ.
µ
 A ;ν → derivada covariante da componente Aµ do vetor A.
Do ponto de vista prático, a beleza deste formalismo está na maneira
sintética através da qual as expressões podem ser escritas. Isto nos permite
manipular as fórmulas de maneira mais rápida quando se está familiarizado
com a ginástica de índices 7 . Isso não significa que seja fácil “abrir” as contas 7
O termo index gymnastics foi introduzido
por Misner, Wheeler e Thorpe em seu
livro clássico, o Gravitation.
© s.r. dahmen 2022
o cálculo tensorial 57

na hora que precisamos delas. Mesmo no caso bidimensional mais simples,


a equação (4.30) contém 12 termos

dA ∂A1 dx1 dx1


= e1 + A1 Γ 111 e
dλ 1
∂x dλ dλ 1
dx1 ∂A1 dx2
+ A2 Γ 112 e1 + e1
dλ ∂x2 dλ
dx 2 dx2
+ A1 Γ 112 e1 + A2 Γ 122 e
dλ dλ 1
2
∂A dx 1 dx 1
+ 1 e2 + A1 Γ 211 e
∂x dλ dλ 2
dx1 ∂A2 dx2
+ A2 Γ 221 e + e2
dλ 2 ∂x2 dλ
dx2 dx2
+ A1 Γ 212 e2 + A2 Γ 222 e (4.33)
dλ dλ 2
Em 3-d há 36 termos, em 4-d um total de 80. De um modo geral temos
n2 (n + 1) termos em n dimensões A interpretação geométrica da expressão
A ;ν uν = ∑3ν=1 A ;ν uν é a seguinte: ele nos dá a componente µ da variação
µ µ

do vetor A quando fazemos um deslocamento infinitesimal na direção da


curva. Como dissemos a vantagem deste formalismo é quando estamos
estudando derivadas de funções (velocidades, acelerações) em espaços mais
gerais. Porém este formalismo contém em si resultados por nós conhecidos
mas que evidentemente estudamos usando uma roupagem diferente.

4.6 Operadores em forma tensorial: grad, div e rot


Nas equações da física, particularmente do eletrogmanetismo e mecânica de
fluidos, nos deparamos a todo momento com o gradiente ∇ ~ f ou o laplaciano
~ 2 f de uma função f ou com o divergente e rotacional de um vetor A,

isto é com ∇ · A e ∇ × A respectivamente. Discutimos aqui brevemente a
generalização destas idéias para o espaço de Riemann em uma notação mais
enxuta. As definições aqui não apresentam maiores dificuldades, mas um
detalhe pode chamar a atenção daqueles ainda pouco habituados com o
cálculo tensorial: muitos livros definem o divergente, por exemplo, como
sendo exatamente o divergente por nós conhecido mas trocando a derivada
parcial pela derivada covariante, isto é

∇ · A = Akµ = A|µ + Γ
µ µ µ
µν Aν (4.34)

Há um detalhe importante importante nesta equação: o fato de no símbolo


de Christoffel aparecer um índice ν repetido – e portanto somado – nos
permite simplificar a expressão acima e escrevê-la na forma
 q 
1
An | g|
µ
A kµ = p (4.35)
| g| |µ

que, aparentemente, não tem nada a ver com a expressão original. Esta forma
é muito comum em livros de Relatividade Geral pois nos permite calcular
o divergente sem ter que calcular antes os símbolos de Riemann. Para que
possamos entender esta maneira de definir o divergente (e outros operadores
diferenciais) é importante entendermos primeiro algumas propriedades do
determinante g do tensor métrico gµν .

© s.r. dahmen 2022


58 uma introdução à teoria do espaço e do tempo

4.6.1 O determinante do tensor métrico gij . Dedução geral


O determinante do tensor métrico gij é, por definição, igual à

g11 g12 · · · g1N

21 g22 · · · g2N
g
i i ···i
det ( gij ) = . .. .. .. = e 1 2 N g1i1 g2i2 · · · g Ni N 6= 0 (4.36)
.. . . .

g N1 g N2 · · · g NN

onde o fato de det ( gij ) se diferente de zero é uma condição imposta para
que o tensor tenha inversa. O símbolo ei1 i2 ···i N é a generalização do tensor
de Levi-Cività para N dimensões. É importante notar que pela convenção
de Einstein a expressão acima representa uma soma

∑ ∑ ··· ∑ (4.37)
i1 i2 iN

sobre os N valores de cada índice ik onde, devido às propriedades do tensor


de Levi-Cività, a expressão acima só difere de zero quando todos os índices
são diferentes entre si.
Calculemos a derivada do determinante:
N ∂gkik
∂g
l
= ∑ ei1 i2 ···i N g1i1 g2i2 · · · · · · g Ni N . (4.38)
∂x k =1 ∂x l

Podemos escrever o termo em derivada dentro da somatória como


∂ ∂   ∂g ∂g
m
= km δmik == km gmr grik

g ki = g km δ i (4.39)
∂x l k
∂x l k
∂x l ∂x l
onde, na última passagem, substituimos δmik por gmr grik pois, pela definição
do tensor métrico sabemos que

δ ab = g ac gcb . (4.40)

No lugar de gkik em (4.38) aparece, com a substituição acima, um termo com


grik
N
∂g ∂gkm mr
∂x l
= ∑ ei1 i2 ···i N g1i1 g2i2 · · · l
g grik · · · g Ni N (4.41)
k =1 | ∂x {z }
∂gki
k
∂x l

Toda vez que r 6= k aparece na equação acima o produto do tipo grir grik .
Como existe uma soma sobre r e outra sobre k, teremos sempre a soma de
termos do tipo

ei1 i2 ···ik ···ir ···i N · · · gkik grik · · · + ei1 i2 ···ir ···ik ···i N · · · grik gkik · · ·

O produto dos g é simétrico em ir e ik pois o tensor métrico é simétrico em


seus índices. Porém, o tensor e é por definição antissimétrico nestes índices
e portanto termos deste tipo se cancelam mutuamente. Só sobra assim na
expressão o termo r = k. Isto significa que a expressão acima se torna
∂g ∂gkm mk
= ei1 i2 ···i N g1i1 g2i2 · · · g gkik · · · g Ni N
∂x l ∂x l  
∂gkm mk
= ei1 i2 ···i N g1i1 g2i2 · · · gkik · · · g Ni N g
| {z } ∂x l
=g
∂g
= g km gmk (4.42)
∂x l

© s.r. dahmen 2022


o cálculo tensorial 59

Se tomarmos o símbolo de Christoffel com um índice repetido (uma contra-


ção) temos

gkm gkm ∂gmk


 
∂gmk ∂g ∂g
Γkkl = + ml − kl = (4.43)
2 ∂x l ∂x k ∂x m 2 ∂x l

pois os termos
∂gmk ∂g
e − kl (4.44)
∂x l ∂x m
da expressão logo acima cancelam-se mutuamente pela troca de índices
m ↔ l (há uma soma sobre estes índices!). Substituindo agora a expressão
(4.42) em (4.43) ficamos com
p p
1 ∂g 1 ∂| g| 1 ∂ | g| ∂ ln | g|
Γkkl = = = = (4.45)
2g dx l 2| g| dx l | g| dx l ∂x l
p

A expressão acima com o módulo é geral e independe do sinal de g, pois em


Física usamos uma métrica indefinida e seu determinante
p pode ser negativo.
É por este motivo que alguns autores substituem a | g| por
p
−g (4.46)

para det ( gij ) < 0. Olhemos agora para a atuação do operador ∇ no espaço
de Riemman.

4.6.2 Gradiente
Qualquer operação diferencial vetorial, seja ela um gradiente, um divergente
ou um rotacional, envolve a derivada parcial de primeira ordem dos campos.
Quando vamos para o espaço de Riemann esta derivada é substituida pela
derivada covariante. Vejamos quais as modificações que isto acarreta nas
expressões por nós conhecidas, começando pelo gradiente.
A derivada covariante de um escalar é idêntica à derivada parcial. Por isso
podemos expressar o gradiente através das suas componentes segundo

∂S
S kk = S |k = k (4.47)
∂x

Devemos porém ter muito cuidado pois em geral S|2 6= S|2 . Por exemplo,
se estamos tratando de coordenadas polares ( x1 , x2 ) = (ρ, φ) temos, por
exemplo
∂S ∂S ∂S 1 ∂S
S |2 = 2 = e S |2 = = 2 (4.48)
∂x ∂φ ∂x2 ρ ∂φ
Isto normalmente é diferente de nossa prática habitual quando usamos
coordenadas ortogonais no espaço Euclideano pois nestes casos trabalhamos
comumente com uma base de vetores normalizados. Neste caso temos por
exemplo
1 ∂S
(gradS)φ = (4.49)
ρ ∂φ
que é diferente de S|2 ou S|2 . Esta diferença entre notação covariante
e contravariante de vetores da base e versores no espaço Euclideano se
estendem também para o divergente e o rotacional.

© s.r. dahmen 2022


60 uma introdução à teoria do espaço e do tempo

4.6.3 Divergente
Os resultados por nós deduzidos nos permitem escrever o divergente de um
vetor de modo compacto, pois pela definição de derivada covariante temos

Aiki = Ai | i + Γi ip A p
∂Ai
p
1 ∂ | g| p
= + A
∂xi | g| dx p
p
q 
1 ∂ i
= | g | A (4.50)
| g| dxi
p

Pelo fato que


Z q  Z q

dx1 dx2 · · · dx n | g | Ai = dSi | g | Ai (4.51)
V ∂xi S (V )

segue imediatamente o Teorema de Gauss-Ostrogradski no espaço de Riemman


N-dimensional:
Z q Z q
d N x | g| Aiki = dSi | g| Ai (4.52)
V S (V )

O Teorema de Gauss-Ostrogadski nos é conhecido do cálculo vetorial


Z Z
d3 x ∇ · A = A· d (4.53)
V S (V )

onde S é a superfície que contém o volume V. É um exercício interessante


mostrar que em uma dimensão este teorema se reduz à conhecida regra de
integração por partes:
Z b b Z b
u( x ) v0 ( x ) dx = u( x )v( x ) a − u0 ( x ) v( x ) dx
a a

4.6.4 Rotacional
Para calcular o rotacional de um vetor temos partimos da expressão
p p
Ai k k − A k ki = Ai | k − Γ ik A p − A k |i + Γ ki A p = Ai | k − A k |i . (4.54)

Na última passagem usamos o fato que os termos proporcionais aos símbolos de


Christoffel se cancelam. Em coordenadas cartesianas a definição de rotacional é

(rot A)i = eijk Al |k (4.54)

O rotacional no espaço de Riemman pode ser obtido de maneira análoga,


escrevendo
eijk 1   eijk
(rot A)i = p Ai k k − A k ki = p Al |k (4.54)
| g| 2 | g|
Uma dedução mais didática destas equações serão apresentadas abaixo.
Não tive ainda tempo de fazer isto no espaço euclideano 3-d onde mostramos
como deduzir isto para coordenadas curvilíneas. A idéia é que muitos dos
resultados para o espaço de Riemman podem ser mais didaticamente deduzidas
a partir da generalização dos conceitos de gradiente e rotacional no espaço
plano descrito por coordenadas curvilíneas. Quando por exemplo alguns livros

© s.r. dahmen 2022


o cálculo tensorial 61

de física-matemática nos apresentam o divergente em coordenadas arbitrárias


u( x, y, z), v( x, y, z), w( x, y, z) na forma
 
1 ∂(hv hw au ) ∂(hu hw av ) ∂(hu hv aw )
∇·a = + + (4.54)
hu hv hw ∂u ∂v ∂u

o que eles estão fazendo nada mais é que aplicar as fórmulas gerais que
acabamos de deduzir mas usando uma notação diferente. No presente caso
temos que q
hu hv hw = | g| (4.54)
O termo nas derivadas parece ser diferente pois falta um h na multiplicação,
mas isto se deve ao fato que no espaço euclideano usamos bases ortonormais
ao passo que no caso Riemanniano as bases não são e quando mudamos
de representação (de covariante para contravariante) os termos au e au estão
relacionados por
ai = gij a j (4.54)
e portanto aparece um fator de métrica a mais no interior da derivada.

© s.r. dahmen 2022


A
Vetores contravariantes e covariantes: uma visão
sistema de eixos ortogonais

geométrica x
2
x
2

~
sistema de eixos nao ortogonais

ortogonal

par. = ort.

1
x
paral.

Um vetor é um vetor. Quando dizemos isto estamos nos referindo ao fato que
ortogonal
um vetor representa uma grandeza física e tem uma existência independente
paralelo
do sistema de coordenadas que escolhemos para representá-lo. As propriedades x
1

paralelo = ortogonal
de um vetor não podem depender do sistema de coordenadas escolhido. Coordenadas
são etiquetas, nada mais que isso. Porém, em se tratando de um sistema de
coordenadas arbitrário, arbitrária também é a maneira como projetamos o vetor Figura A.1: As duas maneiras de se pro-
nos eixos ordenados. É em função da maneira como fazermos esta projeção jetar um vetor sobre dois eixos de coor-
denadas que não são ortogonais entre si.
que estão relacionados os conceitos de vetores contravariantes e covariantes.
A projeção pode ser paralela (contravari-
Na representação de Minkowski para dois referenciais inerciais que se movem ante) ou ortogonal (covariantes). Quando
com velocidade relativa v, o referencial que se “move” é representado por um os eixos são ortogonais entre si, a proje-
ção paralela e ortogonal coincidem.
sistema de coordenadas oblíquo, ao passo que o referencial “parado” como
eixos perpendiculares entre si. Quando temos um sistema de coordenadas x
2

oblíquas (skew coordinates) é importante definirmos como as projeções de um


vetor devem ser feitas, pois há duas maneiras de fazê-las: ou projetamos o
vetor paralelamente ou perpendicularmente aos eixos. A projeção de um vetor
paralela aos eixos recebe o nome de contravariante e as respectivas coordenadas T
2 cova
riante
são designadas por sobrescritos x1 e x2 . A projeção perpendicular recebe o 2
T
T
nome de covariante e as respectivas coordenadas são designadas por índices contravariante
covariante

subscritos x1 e x2 . Quanto os eixos são ortogonais entre si, não há diferença


nte
aria

entre projeções covariantes e contravariantes. Logo ficará claro como estas


trav
con

diferentes projeções eles estão relacionados às propriedades de transformação x


1
1
dos eixos discutidos na seção anterior. T T
1

Figura A.2: As projeções paralelas de um


vetor T sobre os eixos x1 e x2 dão origem
A.0.1 Como calcular as componentes à componentes contravariantes ( T 1 , T 2 ).
As projeções ortogonais sobre estes mes-
Componentes Contravariantes. Antes de discutirmos de forma mais geral as mos eixos geram as componentes covari-
definições de vetores contravariantes e covariantes como encontradas nos livros, antes ( T1 , T2 ) .
que tendem muitas vezes a serem bastante abstratas, vamos ver num exemplo
simples como calcular as diferentes componentes dado um vetor r. Achar as
componentes contravariantes de um vetor, dado o módulo r de r, o ângulo α
formado pelos eixos gerados pelos versores a1 e a2 e o ângulo θ que o vetor r
64 uma introdução à teoria do espaço e do tempo

r sin
(α −
Figura A.3: Relações entre ângulos e
θ)
x 1 cos α
α I
diferentes triângulos que nos permitem
achar as componentes contravariantes x1
x1
x
e x2 projetadas paralelalmente aos ei-
2 .
r sin
x 1 cos α (α −
θ)
xos oblíquos gerados pelos versores a1
α
x
2
I
x
2 e a2 . o vetor r pode ser escrito como
r
II
r sin θ
r
r = x1 a1 + x2 a2 , ou seja, a regra do para-
α
α−θ
II
r sin θ 2
x a
2
lelogramo é válida.
a
2 θ α x 2 cos α θ
.

a x1 x x1 a
1
α 1 α 1

x 2 cos α

faz com o eixo x1 é uma questão de simples geometria.

r sin(α − θ )
x1 sin α = r sin(α − θ ) −→ x1 =
sin α
r sin θ
x2 sin α = r sin θ −→ 2
x = (A.0)
sin α
Um detalhe muito importante desta decomposição é que o vetor r é dado pela
soma dos vetores x1 a1 e x2 a2 como era de se esperar. Em outras palavras,
a regra do paralelogramo para soma de vetores é mantida e podemos então
escrever
r = x1 a1 + x2 a2 (A.0)

Exemplo. Consideremos o caso onde r = 5.0, θ = 30° e α = 70°. Temos

sin(70˚ − 30˚)
x1 = 5.0 × = 3.42
sin 70˚
sin 30˚
x2 = 5.0 × = 2.66
sin 70˚

r = 3.42 a1 + 2.66 a2 (A.-2)

É fácil verificar também que, pela lei dos cossenos


q
r = ( x1 )2 + ( x2 )2 − 2 x1 x2 cos(π − α)
q
r = (3.42)2 + (2.66)2 − 2 × 3.42 × 2.66 × cos 110˚
r = 5 (A.-3)

Componentes Covariantes. O caso covariante é também simples se pensarmos


em termos de como calcular as componentes. Porém, devemos ter bastante
cuidado na hora de escrever o vetor como a soma de duas componentes, pois
neste caso, tomando os vetores da base a1 e a2 que geram os eixos x1 e x2 ,
ficamos com
r 6= x1 a1 + x2 a2 (A.-3)
ou seja, a regra do paralelogramo quando aplicada à soma dos dois vetores
x1 a1 e x2 a2 não mais reproduz o vetor r original mas um outro vetor, como
podemos ver explicitamente na figura abaixo. Por este motivo, para que
possamos ter duas diferentes maneiras de representar o mesmo vetor r, a forma

© s.r. dahmen 2022


vetores contravariantes e covariantes: uma visão geométrica 65

Figura A.4: As componentes x1 a1 e x2 a2


definidas a partir das componentes cova-
riantes (projeções ortogonais) não repro-
x
2 .
duzem o vetor r quando somadas, mas
um outro vetor, representado na figura
à direita por uma linha azul claro ponti-
x a
2 2
r
r lhada.
x a
2 2

a
2 θ θ
.
x x a
a 1
1 1
1
α α

contravariante e a forma covariante, e de tal maneira que suas componentes se


somem corretamente, somos obrigados a definir dois novos vetores a1 e a2 para
que a regra do paralelogramo se aplique às componentes covariantes, ou seja
r = x1 a1 + x2 a2 (A.-3)
A regra para definir estes vetores é bastante simples: projetamos a linha que
define a componente x2 até um eixo paralelo à linha que define a projeção x1 e
vice-versa. Como podemos facilmente ver na figura abaixo, o novo eixo x2 é
perpendicular ao vetor a1 e o novo eixo x1 é perpendicular ao vetor a2 . Notem
que definimos dois vetores unitários e1 e e2 , e não a1 e a2 pois uma razão
que ficará clara em breve. Podemos obter as componentes covariantes x1,2 em

x
2 x
2
Figura A.5: As componentes x1 e x2 pro-
2 2
x x jetadas nos eixos definidos pelos versores
L
2 x x / sin α
e1 e e2 . Note que os vetores sobre es-
2 2 x
. 2 tes eixos, cuja soma reproduz o vetor r,
α
não é dado por x1 e1 + x2 e2 mas sim por
( x1 / sin α)e1 + ( x2 / sin α)e2 . Isto é expli-
r
a
2 a
r cado em mais detalhes no texto.
2

θ e
2
. 1 1
a x a x
1
x 1
1 x
1
α e α
α 1

L x / sin α
1 1

x
1 x
1

função das componentes contravariantes x1,2 diretamente da figura (A.3):


x1 = x1 + x2 cos α
x2 = x2 + x1 cos α , (A.-3)
ou, o que é mais simples ainda (vide fig. A.3),
x1 = r cos θ
x2 = r cos(α − θ ). (A.-3)
Também, da figura acima podemos ver que as projeções L1 e L2 até os novos
eixos definidos pelos vetores unitários e1 e e2 valem respectivamente
x1 x2
L1 = ; L2 = (A.-3)
sin α sin α

© s.r. dahmen 2022


66 uma introdução à teoria do espaço e do tempo

E portanto podemos escrever o vetor r em termos de componentes covariantes


como
x1 1 x
r = e + 2 e2
sin α !sin α 
e1 e2

r = x1 + x2
sin α sin α
| {z } | {z }
≡ a1 ≡a2

r = x1 a1 + x2 a2 (A.-5)

Notem que podemos expressar o vetor em componentes covariantes da mesma


forma que a equação (A.0.1) mas não podemos nos esquecer que os vetores a1
e a2 não são unitários.
Portanto ao expressarmos um vetor r na forma covariante, devemos ter sempre
o cuidado de escolhermos as expressões apropriadas caso estejamos usando a
base de versores {e1 , e2 } ou a base {a1 , a2 }. Devemos tomar apenas um certo
cuidado com o nome da base: a representação contravariante do vetor usa a
base {e1 , e2 } de vetores covariantes. A representação covariante usa a base
{e1 , e2 } de vetores contravariantes. Estas duas bases são também chamadas de
base direta e base recíproca.

Exemplo. Consideremos o caso onde r = 5.0, θ = 30° e α = 70°. Vamos achar a


representação deste vetor na forma de componentes covariantes. Pela definição
temos

x1 = r cos θ = 5.0 × cos 30˚ = 4.33


x2 = r cos(α − θ ) = 5.0 × cos 40˚ = 3.83 (A.-5)

de onde segue que

r = 4.33 a1 + 3.83 a2
e1 e2
r = 4.33 + 3.83
sin 70˚ sin 70˚
r = 4.08 e1 + 3.61 e2 (A.-6)

É fácil verificar também que, pela lei dos cossenos que r = 5.0.

A.0.2 A relação entre as projeções e as transformações

Vamos mostrar agora como as projeções paralelas (contravariantes) e perpendi-


culares (covariantes) estão de fato relacionados à transformação contrária à base
e junto com ela, respectivamente 1 . A figura abaixo diz respeito às variáveis 1
S.R. Deans, Covariant and Contravariant
que definiremos. Vectors, Mathematics Magazine, vol. 44,
no. 1, January 1971.
Denotaremos as projeções do ponto P sobre o eixos ortogonais x pela letra α e
aquelas sobre os eixos oblíquos y pela letra β. Vamos olhar primeiro para as
coordenadas contravariantes sobre os dois sistemas de eixos e as relações entre
elas.

© s.r. dahmen 2022


vetores contravariantes e covariantes: uma visão geométrica 67

Figura A.6: O plano representado por


um sistema de coordenadas ortogonais
x
2 y2
( x1 , x2 ) e por um sistema de coordenadas
oblíquo (y1 , y2 )

K G P
B

y1
φ θ
F
J
C
E
φ

θ
1
x
O H A

Componentes contravariantes. No caso das componentes contravariantes temos,


pela figura acima:

( α1 , α2 ) = (α1 , α2 ) = (OA, OB);


1 2
(β , β ) = (OE, OF );
( β1 , β2 ) = (OC, OD ) (A.-7)

Desta figura podemos claramente ver que

α1 = OH + GP = β1 cos θ + β2 sin φ
2
α = HE + EG = β1 sin θ + β2 cos φ (A.-7)

onde usamos o fato que ( GP) = ( H A). Podemos destas expressões calcular os
valores de β1 e β2 em função das variáveis dos eixos ortogonais:

α1 cos φ − α2 sin φ
β1 =
cos(θ + φ)
−α1 sin θ + α2 cos θ
β2 = (A.-7)
cos(θ + φ)
Em notação matricial podemos escrever isto como:
! ! !
β1 1 cos φ − sin φ α1
= (A.-7)
β2 cos(θ + φ) − sin θ cos θ α2

Componentes covariantes. No caso das componentes covariantes, as equações


se tornam:

β1 = OC = OJ + JC = OJ + JP sin θ
= α1 sec θ + ( AP − AJ ) sin θ
= α1 sec θ + α2 sin θ − α1 sin θ tan θ
= α1 cos θ + α2 sin θ , (A.-9)

© s.r. dahmen 2022


68 uma introdução à teoria do espaço e do tempo

e também
β2 = OD = OK + KD = OK + KP sin φ
= α2 sec φ + ( BP − BK ) sin φ
= α2 sec φ + α1 sin φ − α2 tan φ sin φ
= α1 sin φ + α2 cos φ . (A.-11)
Em notação matricial:
! ! !
β1 cos θ sin θ α1
= (A.-11)
β2 sin φ cos φ α2
Agora, se olharmos para as transformações das coordenadas dos eixos (em
outras palavras, dos vetores da base), teremos
x1 = y1 cos θ + y2 sin φ
x2 = y1 sin θ + y2 cos φ (A.-11)
onde seguimos a regra
x1 = y1 cos( x1 , y1 ) + y2 cos( x1 , y2 )
2
x = y1 cos( x2 , y1 ) + y2 cos( x2 , y2 ) (A.-11)
sendo que cos( xi , y j ) representa o cosseno entre os eixos xi e y j . Seguindo as
definições formais (2.7) e (2.8) aplicadas ao nosso caso temos
2
∂yi j
βi = ∑ j
α (componentes contravariantes)
j=1 ∂x
2
∂x j
βi = ∑ α
i j
(componentes covariantes)
j=1 ∂y

Da equação (A.-10) podemos calcular


! !
∂x j cos θ sin φ
= , (A.-13)
∂yi sin θ cos φ
bem como sua inversa
! !
∂yi 1 cos φ − sin φ
= . (A.-13)
∂x j cos(θ + φ) − sin θ cos θ
Aplicando esta definição às componentes contravariantes temos
∂y1 1 ∂y1 2 α1 cos φ − α2 sin φ
β1 = 1
α + 2α =
∂x ∂x cos(θ + φ)
∂y2 1 ∂y2 2 −α1 sin θ + α2 cos θ
β2 = α + α = (A.-13)
∂x1 ∂x2 cos(θ + φ)
Já para as componentes covariantes
∂x1 ∂x2
β1 = α 1 + α2 = α1 cos θ + α2 sin θ
∂y1 ∂y1
∂x1 ∂x2
β2 = 2
α1 + 2 α2 = α1 sin φ + α2 cos φ (A.-13)
∂y ∂y
Estas equações são idênticas à (A.-6), (A.-6 e (A.-8).

Em resumo, a construção geométrica de projeções paralelas ou ortogonais das


componentes de um vetor sobre os eixos ordenados é equivalente às definições
formais (2.7) e (2.8) de vetores contravariantes e covariantes, respectivamente.

© s.r. dahmen 2022


B
Os símbolos de Christoffel e coordenadas curvilíneas

O objetivo deste apêndice é exemplificar alguns dos conceitos do cálculo tensorial


fazendo uso de coordenadas curvilíneas no plano R2 e entender geometricamente o que
os símbolos de Christoffel representam.

Os símbolos de Christoffel são fundamentais quando estamos tentando enten-


der a geometria de espaços curvos. Vamos por este motivo, antes de definí-los
de maneira formal, tentar entender o que significam exatamente num contexto
mais conhecido.
Comecemos por uma motivação física: imagine que queiramos ver como um
campo vetorial varia no espaço, no caso um campo vetorial A que varia ao longo
de uma curva, como ilustrado na figura abaixo. Este campo pode por exemplo
representar a velocidade do vento numa região montanhosa. Normalmente

Figura B.1: Figura superior: a variação


do vetor A ao longo de uma curva em
função dos vetores cartesianos ex e ey . O
vetor A pode representar por exemplo
um campo de velocidade do vento so-
bre uma determinada topografia. Fonte:
Grøn e Næss.

quando queremos descrever a variação do vetor ao longo de uma curva S que


contém os pontos P e Q acima, é importante termos em mente que a curva
é parametrizada em termos de uma variável λ, isto é x α = x a (λ). No caso
mais simples possível de um sistema de coordenadas cartesianas, temos que a
diferença entre os vetores AP e AQ

A P = A P x e x + A P y ey ; A Q = A Q x e x + A Q y ey , (B.0)

ou seja
(∆A) PQ = AP − AQ (B.0)
se torna, no limite de uma variação infinitesimal

dA d( A x ex ) d ( A y ey )
= + (B.0)
dλ dλ dλ
70 uma introdução à teoria do espaço e do tempo

No caso do sistema cartesiano este resultado é trivial, pois os vetores da base


são constantes no espaço:
dA dA x dex dAy dey
= ex + A x + ey + A y
dλ dλ dλ dλ dλ
=0 =0
dA x dAy
= ex + ey (B.0)
dλ dλ
Porém, se temos um sistema de coordenadas curvas, não cartesianas, a derivada
total dA/dλ de um campo vetorial tem duas contribuições:
dA dAµ eµ dAµ deµ
= = eµ + Aµ . (B.0)
dλ dλ dλ dλ
var. das componentes var. da base
Em outras palavras, a variação de um campo vetorial nada mais é que a
derivada usual de um campo vetorial pela variação das coordenadas (parame-
trizadas por λ que define uma curva) mais um termo de correção que diz como
as coordenadas mudam. Como calcular esta mudança dos vetores da base? É
justamente este o ponto onde a figura de Christoffel entra: ele determinou a
variação total de um vetor numa linguagem que nos permite calcular a derivada
acima independente da curvatura do espaço ou da base de vetores por nós
usada.
Tomemos o plano euclideano em duas dimensões mas onde, no lugar dos tra-
dicionais vetores unitários da base cartesiana ex e ey introduzimos o conhecido
sistema de coordenadas polares (r, θ ) como na figura abaixo. Nosso objetivo
aqui é entender como os vetores da base mudam com a mudança de posição
no plano.
Desenhamos os vetores radiais er e os tangenciais eθ nos pontos P, Q, R e
S. Vamos considerar primeiro a mudança do vetor eθ quando mudamos sua Figura B.2: Elwin Bruno Christoffel (1829
posição. – 1900).

Antes lembremos que a mudança da base ex , ey para a base er e eθ é dada por

er = cos θex + sin θey


eθ = −r sin θex + r cos θey (B.0)

O vetor de base er é unitário, independente da sua posição. Já a magnitude


de eθ varia de acordo com a distância deste vetor à origem: para um mesmo
deslocamento angular ∆θ, o arco descrito é maior quanto maior a distância à
origem do eixo de coordenadas.
p
| er | = cos2 θ + sin2 θ = 1
p
|eθ | = r2 sin2 θ + r2 cos2 θ = r. (B.0)

O vetor ∆θ eθ é obtido pela diferença entre o vetor eθ (S) e o vetor eθ ( P) q como


ilustra a figura ao lado. O arco de círculo L, segundo a definição de ângulo em
radianos, vale:
L = |eθ | ∆θ (B.0)
e como |eθ | = r temos
L = r∆θ (B.0)
como era esperado. No limite em que ∆θ → 0 podemos escrever a expressão
no infinitesimal dθ
d
eθ = |dθ eθ | = rdθ (B.0)

© s.r. dahmen 2022


os símbolos de christoffel e coordenadas curvilíneas 71

Figura B.3: Vetores da base de coordena-


das polares (r, θ ) no plano. Fonte: Grøn
e Næss.

e como o vetor dθ eθ aponta na direção contrária so vetor er podemos escrever


dθ eθ = −rdθ er (B.0)

Este resultado nos mostra que o vetor eθ (S) está conectado ao vetor eθ ( P) através
de um “vetor diferença” ou “vetor de conexão”
d θ eθ = eθ ( S ) − eθ ( P ) (B.0)
As componentes deste vetor por unidade de comprimento na respectiva direção
são chamados de coeficientes de conexão (connection coefficients) e são, neste
caso, denotados por Γr θθ e Γθ θθ :

∂eθ r ∂eθ θ
   
deθ
= er + eθ
dθ ∂θ ∂θ
r
= Γ θθ er +Γ θ
θθ eθ (B.0)
onde definimos
 r  θ
r ∂eθ ∂eθ
Γ θθ = ; Γ θ
θθ = (B.0)
∂θ ∂θ
Um certo cuidado aqui se faz necessário: os sobrescritos r e θ não indicam
potência mas a componente contravariante do vetor. Γ rθθ e Γ θθθ são mais co- Figura B.4: Figura superior: a variação
mumente conhecidos na Teoria da Relatividade como símbolos de Christoffel do vetor eθ devido a um deslocamento
e foram aqui calculados de forma puramente geométrica numa geometria por angular ∆θ. Figura inferior: a diferença
nós conhecida. Porém sua definição, como veremos abaixo, é geral e se aplicam do vetor eθ em duas posições diferentes
do espaço. A variação é dada pela dife-
a espaços curvos multidimensionais e portanto mais abstratos. Antes porém rença de vetores eθ (S) − eθ ( P) q, onde o
é importante enfatizarmos exatamente o significado da notação para que não último representa o vetor eθ ( P) transpor-
nos confundamos quando seu uso se fizer necessário. Em palavras podemos tado paralelamente a si mesmo do ponto
escrever: P ao ponto S. Fonte: Grøn e Næss.

θθ → 1º subíndice: qual vetor da base varia (eθ )


r
Γ θθ = 2º subíndice: o quê varia (coordenada θ).

r →

a componente do vetor (radial).

© s.r. dahmen 2022


72 uma introdução à teoria do espaço e do tempo

Os índices inferiores indicam qual vetor da base está sendo variado pela mu-
dança infinitesimal de qual coordenada. O índice superior indica a componente
do vetor diferença ao qual o símbolo de Christoffel se refere. No caso específico
que acabamos de estudar temos
r
Γ θθ = −r ; Γ θ
θθ =0 (B.-1)

Definição: o símbolo de Christoffel Γνµα é a ν-ésima componente do vetor


que mede a variação, por unidade de comprimento, do vetor da base eµ
causado pela variação infinitesimal da coordenada x α .

Para melhor fixar o conceito, vamos agora calcular geometricamente os outros


símbolos de Christoffel. Uma vez que o vetor eθ varia com a distância à origem
do sistema de coordenadas, vejamos como ele varia por um deslocamento
infinitesimal dr. Para isso recorremos à figura ao lado:
O vetor ∆r eθ representa a variação do vetor eθ quando deslocado do ponto P
ao ponto Q por uma distância ∆r. Pela semelhança de triângulos representados
na figura podemos ver que
| ∆ r eθ | |e |
= θ (B.-1)
∆r r
e portanto Figura B.5: a variação do vetor eθ devido
∆r a um deslocamento radial infinitesimal
| ∆ r eθ | = |eθ | . (B.-1)
r ∆r. Fonte: Grøn e Næss.
No limite ∆r → 0 obtemos
dr
| d r eθ | = |eθ | (B.-1)
r
e sendo que o vetor dr eθ aponta na mesma direção e sentido de eθ podemos
escrever
1
dr eθ = dreθ . (B.-1)
r
Com estas equações e a definição dos símbolos de Christoffel fica fácil ver que:
 r
r ∂eθ
Γ θr = =0
∂r
 θ
∂eθ 1
Γ θ
θr = = (B.-1)
∂r r

Vamos agora repetir os cálculos para a variação infinitesimal do vetor de base


er . Como o vetor é unitário e não depende da distância à origem do sistema de
coordenadas, temos imediatamente que

∆r er = 0 (B.-1)

o que já nos dá diretamente que Γ rrr = Γ θrr = 0 pois se o vetor ∆r er é zero,


suas componentes tem que ser zero. Vamos calcular a variação de er em função Figura B.6: a variação do vetor er devido
do deslocamento infinitesimal ∆θ (figura abaixo). a um deslocamento radial infinitesimal
∆θ. O vetor er( P) é deslocado paralela-
O círculo de arco L e raio |er | = 1 vale, neste caso mente a si mesmo até o ponto S, onde
temos er ( P) k. A variação é dada pela
L = |er |∆θ = ∆θ (B.-1) diferença er (S) − er ( P) k. A figura infe-
rior mostra a variação em maior detalhe.
cujo valor, no limite infinitesimal ∆θ → 0 se reduz à Fonte: Grøn e Næss.

|dθ er | = dθ (B.-1)

© s.r. dahmen 2022


os símbolos de christoffel e coordenadas curvilíneas 73

Pela figura vemos que o vetor dr er tem a mesma direção e sentido do vetor eθ
e portanto pode ser escrito em termos do versor êθ = (1/r ) eθ como

1
dθ er = dθ êθ = dθ eθ (B.-1)
r

Disto concluímos diretamente que


 r
r ∂er
Γ rθ = =0
∂θ
 θ
∂er 1
Γ θ
rθ = = (B.-1)
∂θ r

É importante enfatizarmos que os símbolos de Christoffel estão relacionados


às regras de mudança da base de vetores por variações das coordenadas e
não descrevem o espaço em si pois, como já pudemos discorrer ao longo
deste curso, uma coisa é o espaço e outra é a maneira que o representamos:
coordenadas são etiquetas que podemos mudar à vontade. No caso mais geral
possível de um sistema de coordenadas x1 e x2 onde as curvas de coordenadas
são realmente curvas (em nosso caso apenas uma delas era curva), temos 8
símbolos de Christoffel

Γ 1
11 , Γ 1
12 , Γ 1
21 , Γ 1
22 ,
Γ 2
11 , Γ 2
12 , Γ 2
21 , Γ 2
22 . (B.-1)

No espaço n-dimensional o número de símbolos de Christoffel é n3 mas, devido


a certas propriedades de simetria, o número de Γ να que devemos efetivamente
µ

calcular é menor. Resumindo temos:

r r
deθ = Γ θr dr er + Γ θ
θr dr eθ + Γ θθ dθ er + Γ θ
θθ dθ eθ , ,
r r
der = Γ rr dr er + Γ θ
rr dr eθ + Γ rθ dθ er + Γ θ
rθ dθ eθ , . (B.-1)

Usando a convenção de Einstein podemos escrever as expressões acima de


forma mais elegante:
deµ = Γ ν
µα dx α eν (B.-1)

O procedimento adotado para calcular os símbolos de Christoffel é o seguinte:

(1) escreva os vetores da nova base eµ em termos dos vetores da base


original em . No nosso caso (eθ , e ϕ ) em termos de (ex , ey ).

(2) calcule as derivadas dos vetores eµ como função das suas variáveis
naturais, no caso acima as derivadas de (eθ , e ϕ ) como função de (θ, ϕ).

(3) O resultado do item (2) ainda está expresso em termos da base em . Rees-
creva o resultado em termos da base eµ . Os coeficientes que multiplicam
os vetores da base são os símbolos de Christoffel procurados.

Em situações mais gerais os símbolos de Christoffel são calculados diretamente


a partir da métrica gµν , segundo
 
1 µν ∂gαν ∂g βν ∂gαβ
Γ
µ
≡ g + − n . (B.-1)
αβ 2 ∂x β ∂x α ∂x u

© s.r. dahmen 2022


74 uma introdução à teoria do espaço e do tempo

Figura B.7: Sistema de coordenadas es-


féricas com seus respectivos vetores nas
direções (r, θ, φ). Fonte: Grøn e Næss.

B.0.1 Coordenadas esféricas


Um outro exemplo importante que nos ajuda a fixar melhor a idéia dos símbolos
de Christoffel é quando temos o caso de coordenadas esféricas. Olhando para a
figura abaixo onde representamos os vetores er , eθ e e ϕ sabemos que as relações
entre estas coordenadas e as coordenadas cartesianas ( x, y, z) são dadas por

x = r sin θ cos ϕ ; y = r sin θ sin ϕ ; z = r cos θ . (B.-1)


1
Note que vetores da base se transfor-
Precisamos calcular as variações dos respectivos vetores er , eθ e e ϕ com a varia-
mam de maneira covariante, em acordo
ção das coordenadas (r, θ, φ). Para isto recorremos à coordenadas cartesianas com o que já foi discutido anteriormente.
escrevendo 1 :

∂x ∂y ∂z
er = ex + ey + ez
∂r ∂r ∂r
∂x ∂y ∂z
eθ = ex + ey + ez
∂θ ∂θ ∂θ
∂x ∂y ∂z
eϕ = ex + ey + ez (B.-2)
∂ϕ ∂ϕ ∂ϕ

ou
(
∂x m xm ∈ { x, y, z}
eµ = em com (B.-1)
∂x µ xµ ∈ {r, θ, φ}

Aplicando as definições temos

er = sin θ cos ϕ ex + sin θ sin ϕ ey + cos θ ez ,


eθ = r (cos θ cos ϕ ex + cos θ sin ϕ ey − sin θ ez ) ,
eϕ = r (− sin θ sin ϕ ex + sin θ cos ϕ ey ) . (B.-2)

Queremos ver como estes vetores da base variam quando variamos r, θ e φ


. Por isso derivamos mais uma vez a expressão acima nas variáveis (r, θ, φ)
temos 2 2
A vantagem de usar a base cartesiana
aqui fica clara pois os versores ex , ey e ez
não mudam com a posição no espaço!
© s.r. dahmen 2022
os símbolos de christoffel e coordenadas curvilíneas 75

der = (cos θ cos ϕ ex + cos θ sin ϕ ey − sin θ ez ) dθ


+(− sin θ sin ϕ ex + sin θ cos ϕ ey ) dϕ

deθ = (cos θ cos ϕ ex + cos θ sin ϕ ey − sin θ ez ) dr


+(−r sin θ cos ϕ ex − r sin θ sin ϕ ey − r cos θ ey ) dθ
+(−r cos θ sin ϕ ex + r cos θ cos ϕ ey ) dϕ ,

de ϕ = (− sin θ sin ϕ ex + sin θ cos ϕ ey ) dr


+(−r cos θ sin ϕ ex + r cos θ cos ϕ ey ) dθ
−(r sin θ cos ϕ ex + r sin θ sin ϕ ey ) dϕ . (B.-10)

Para calcular os símbolos de Christoffel precisamos expressar estas variações


em função dos vetores er , eθ e e ϕ , ou seja, precisamos expressar (ex , ey , ez )
como função de (er , eθ , e ϕ ) invertendo a equação (B.0). Com um pouco de
manipulação algébrica é possível chegar à
1 1
der = dθ eθ + dϕ e ϕ
r r
Γ rθ dθ eθ + Γ rϕ dϕ e ϕ
θ ϕ
=

1 cos θ
deθ = dr eθ − r dθ er + dϕ e ϕ
r sin θ
Γθθr dr eθ + Γrθθ dθ er + Γ θ ϕ dϕ e ϕ
ϕ
=

1 cos θ
de ϕ = dr e ϕ + dθ e ϕ − r sin2 θ dϕ er
r sin θ
− sin θ cos θ dϕ eθ
r
Γ dre ϕ + Γ dθ e ϕ + Γ dϕ er + Γ
ϕ ϕ θ
= ϕr ϕθ φϕ ϕϕ dϕ eθ
(B.-18)

Estas expressões nos dão diretamente os símbolos de Christoffel para coorde-


nadas esféricas:
1 1 r
Γ Γ Γ
θ ϕ
rθ = , rϕ ,= rr =0
r r
r 1 cos θ
Γ Γ θθr = , Γ
ϕ
θθ = −r , =
r θϕ sin θ
1 cos θ r
Γ Γ ϕθ = Γ = −r sin2 θ ,
ϕ ϕ
ϕr = , , φϕ
r sin θ
Γ θ
ϕϕ = − sin θ cos θ . (B.-20)

B.0.2 Simetria dos símbolos de Christoffel


Como pudemos perceber, calcular os símbolos de Christoffel envolvem bastante
trabalho. Porém, os símbolos de Christoffel possuem simetrias que por vezes
nos servem de atalho. Quando partimos de uma base em onde m = ( x, y, z) por
exemplo, e queremos chegar numa base eµ , onde µ = (r, θ, ϕ) sabemos que a
relação entre os vetores de uma base e outra é dada pela expressão

∂x m
eµ = em (B.-20)
∂x µ

© s.r. dahmen 2022


76 uma introdução à teoria do espaço e do tempo

Esta foi a equação que usamos acima para expressar a base (er , eθ , e ϕ ) em
função da base (ex , ey , ez ). Por outro lado a derivada total de um campo vetorial
é semelhante em sua forma à derivada total de um campo escalar
∂eµ α
deµ = dx
∂x α  
∂  m
 ∂x em  dx α

= α µ
∂x  ∂x 
= eµ

∂2 x m
= dx α em (B.-21)
∂x α ∂x ν
Mas pela definição (B) dos símbolos de Christoffel temos
∂eµ
=Γ ν
µα eν (B.-21)
∂x α
Comparando as duas expressões temos
∂2 x m
eν Γ ν
µα = em (B.-21)
∂x α ∂x ν
Como ∂α ∂ν = ∂ν ∂α temos que

Γ ν
µα =Γ ν
αµ (B.-21)

isto é, os símbolos de Christoffel são simétricos por troca de índices.

Resumindo: embora os símbolos de Christoffel possam parecer algo extre-


mamente abstrato, eles nada mais são que a medida da variação dos vetores
de uma base quando nos movemos pelo espaço. No caso de coordenadas
cartesianas estes símbolos são iguais a zero, pois não só ex = ı̂ mas também
ey = ̂ e ez = k̂ não dependem da coordenada ( x, y, z). Eles apontam sempre
para a mesma direção do espaço e tem magnitude 1. Já para coordenadas
curvilíneas, mesmo sendo o espaço plano, os vetores da base dependem em
direção e magnitude da coordenada do ponto onde se encontram. O caso mais
simples é o de coordenadas polares (r, θ ) no R2 , pois embora er tenha sempre
a mesma magnitude 1 em qualquer ponto do espaço, sua direção muda com
o ângulo θ. Já o vetor eθ não apenas muda em magnitude (linearmente em r)
como muda também de direção quando nos movemos no espaço. Portanto,
quando dois vetores representando uma mesma grandeza física (a velocidade
por exemplo) é comparado em diferentes pontos do espaço, devemos levar
em consideração que estes vetores podem ser diferentes devido à variações
intrínsecas de magnitude e direção, mas também que mesmo que estas suas
propriedades não variem, os vetores da base eµ podem ter mudado. Neste caso
a representação do vetor muda.

Aplicação: a aceleração em coordenadas curvilíneas. De novo temos aqui um


plano descrito pelas coordenadas polares (r, θ ). Nestas variáveis, a velocidade
v de uma partícula pode ser escrita em termos de suas componentes na forma:
dr dθ
v= er + e (B.-21)
dt dt θ
Nosso objetivo é calcular a aceleração
dv
a= (B.-21)
dt

© s.r. dahmen 2022


os símbolos de christoffel e coordenadas curvilíneas 77

em coordenadas polares. Para isto vamos usar a expressão (4.30) trocando


índices gregos por latinos por uma questão de familiaridade

dA dAk k
= e +Γ A i u j ek (B.-21)
dλ dλ k ij

No nosso caso A = v e λ = t. Com esta substituição a expressão acima fica:

a = (v̇k + Γ k
ij v
i
v j ) ek (B.-21)

Em coordenadas plano-polares há apenas 3 símbolos de Christoffel diferentes


de zero: Γ rθθ e Γ θrθ = Γ θθr . Ficamos assim com a expressão
 
r
a = r̈ + Γ
 θ
θθ θ̇ θ̇ er + r θ̈ + 2Γ rθ θ̇ ṙ eθ . (B.-21)

Sendo Γ r
θθ = −r e Γ θ
rθ = 1/r a expressão acima se torna
 
2
a = (r̈ − r θ̇ 2 ) er + θ̈ + θ̇ ṙ eθ
r

= (r̈ − r θ̇ 2 ) er + (r θ̈ + 2 θ̇ ṙ )
r
= (r̈ − r θ̇ 2 ) r̂ + (r θ̈ + 2 θ̇ ṙ ) θ̂ (B.-23)

Este resultado, que nos livros de mecânica é deduzido de outra forma, mostra
como o formalismo covariante permite estudarmos a variação de qualquer
vetor quando os vetores da base também variam. Usamos também a notação
mais usual dos versores por uma questão de familiaridade.

© s.r. dahmen 2022


C
Dedução do caráter tensorial da derivada covariante

Neste apêndice é apresentada uma dedução matemática bastante elegante do caráter


tensorial da derivada covariante.

A prova que a derivada covariante é um tensor de ordem 2 aqui apresentada


é baseada no livro de Petrov 1 . Considere a representação covariante de um 1
A. S. Petrov, op. cit., p. 13.
tensor A arbitrário, para o qual vale

Aα0 = Λσα0 Aσ (C.0)

e consideremos sua derivada parcial

∂γ0 Aα0 = ∂γ0 (Λσα0 Aσ ) = ∂γ0 Λσα0 Aσ + Λσα0 ∂γ0 Aσ .


 
(C.0)

Uma vez que


∂ ∂τ ∂
= = Λτγ0 ∂τ (C.0)
∂ γ0 ∂γ0 ∂τ
podemos escrever a derivada parcial de Aα0 como

∂γ0 Aα0 = ∂γ0 Λσα0 Aσ + Λσα0 Λτγ0 (∂τ Aσ ) .



(C.0)

Tomemos agora a regra de transformação dos símbolos de Christoffel do 2º


tipo:  
0 0 0
Γ α β0 γ0 = Λαω Λτβ0 Λ γ0 Γ ωτρ + Λαω ∂ β0 Λωγ0 .
ρ
(C.0)

Multipliquemos agora esta expressão por Aσ0 = Λ σ0 Aρ de tal forma que


ρ

ficamos com a expressão


   
σ0 σ0 σ0 τ
Γ α0 γ0 Aσ0 = Λ τ ∂α0 Λ γ0 + Λ α0 Λ γ0 Λ τ Γ µν + Λ σ0 Aρ .
τ µ ν ρ
(C.0)

É muito importante notar que a escolha de índices é fundamental para que


os índices que não são somados em (C), γ0 e α0 , também sejam os índices que
’sobram’ em (C). Assim, ao tomarmos agora a diferença entre (C) e (C) termo a
termo ficamos com:
0
∂ γ0 A α0 − Γ σ α0 γ0 A σ0 ∂γ0 Λσα0 Aσ + Λσα0 Λτγ0 (∂τ Aσ )

=
0
 
−Λστ Λ Aρ ∂α0 Λτγ0
ρ
σ0
0
−Λ Λνγ0 Λστ Λ Γ τ µν Aρ .
µ ρ
α0 σ0 (C.-1)
80 uma introdução à teoria do espaço e do tempo

0
Esta expressão pode ser simplificada pois Λστ Λ
ρ ρ
σ0 = δτ e portanto ficamos
com

0
∂ γ0 A α0 − Γ σ α0 γ0 A σ0 ∂γ0 Λσα0 Aσ + Λσα0 Λτγ0 (∂τ Aσ )

=
   
−δτ Aρ ∂α0 Λτγ0 + Λ α0 Λνγ0 Γ τ µν Aρ
ρ µ

∂γ0 Λσα0 Aσ + Λσα0 Λτγ0 (∂τ Aσ )



=
 
− Aρ ∂α0 Λ γ0 − Λ α0 Λνγ0 Γ µν Aρ
ρ µ ρ
(C.-3)

Observando agora que no 4º termo da expressão acima os índices µ e ν são


mudos, podemos fazer a troca µ → σ e ν → τ, reescrevendo a expressão acima
como
0
∂ γ0 A α0 − Γ σ α0 γ0 A σ0 (∂γ0 Λσα0 ) Aσ − (∂α0 Λ γ0 ) Aρ
ρ
=
 
+Λσα0 Λτγ0 ∂τ Aσ − Γ στ Aρ .
ρ
(C.-3)

Escrevamos explicitamente os primeiros dois termos da expressão acima. Eles


são:
∂ ∂x σ ∂ ∂x ρ
(∂γ0 Λσα0 ) Aσ − (∂α0 Λ
ρ
γ0 ) Aρ = 0 0 A σ − 0 0 Aρ . (C.-3)
∂x γ ∂x α ∂x α ∂x γ
Uma vez que os índices σ e ρ são mudos, podemos fazer a troca ρ → σ e
ficamos com  2 σ
∂2 x σ

∂ x
0 0 − 0 0 Aσ = 0 (C.-3)
∂x γ ∂x α ∂x α ∂x γ
pois ∂2 /∂x α ∂x β = ∂2 /∂x β ∂x α . Portanto a expressão (C.-2) se torna finalmente
 
0
∂γ0 Aα0 − Γ σ α0 γ0 Aσ0 = Λσα0 Λτγ0 ∂τ Aσ − Γ στ Aρ
ρ
(C.-3)

Isto mostra que a derivada covariante Aσ||τ

Aσ||τ ≡ ∂τ Aσ − Γ
ρ
στ Aρ (C.-3)

se transforma realmente como um tensor covariante de ordem 2, pois segundo


(C):
Aα0 ||γ0 = Λσα0 Λτγ0 Aσ||τ (C.-3)

© s.r. dahmen 2022


D
Dedução da equação (3.34)

Neste apêndice é apresentada uma dedução matemática da relação entre os símbolos de


Christoffel e a métrica fundamental, equação (3.34).

Mostraremos aqui, entre outras coisas, como é possível obter os símbolos de


Christoffel diretamente da métrica gµν . Para tanto vamos tomar como ponto de
partida o fato que a derivada covariante do tensor métrico fundamental gµν é
nula, ou seja
gµν ;γ = 0 (D.0)
Para mostrar este resultado procedemos da seguinte forma: a variação da
componente contravariante Aν do vetor arbitrário A vale, pela definição
 
DAν = Aν ;α dx α = Aν,α + Γ νγα Aγ dx α . (D.0)

Sabemos também que, conhecendo DAν , é possível obter a variação da compo-


nente covariante DAµ simplesmente baixando o índice da primeira expressão:

DAµ = gµν DAν (D.0)

Por outro lado

DAµ = D ( gµν Aν )
= ( Dgµν ) Aν + gµν ( DAν )
(D.-1)

Como (D) e (D.1) devem ser iguais, temos

gµν DAν = ( Dgµν ) Aν + gµν ( DAν ). (D.-1)

Esta expressão só pode ser satisfeita para um A arbitrário se

( Dgµν ) Aν = 0 −→ Dgµν = gµν ;γ dx γ = 0. (D.-1)

Disto concluímos que


gµν ;γ = 0 (D.-1)
Podemos reescrever o resultado acima usando explicitamente a definição da
derivada covariante de um tensor covariante de ordem 2
∂Aµν
Aµν ;α = −Γ γ
µα Aγν − Γ
γ
να Aµγ (D.-1)
∂x α
82 uma introdução à teoria do espaço e do tempo

que, no caso de gµν dá

∂gµν
gµν ;α = −Γ γ
µα gγν − Γ
γ
να gµγ = 0. (D.-1)
∂x α
Lembrando que

Γ gγν = Γνµα ; Γ gµγ = Γµνα


γ γ
µα να (D.-1)

a expressão (D) pode ser escrita como

∂gµν
−Γ νµα −Γ µνα =0 (D.-1)
∂x α

Para expressar agora um Γ νγ como função da métrica gµν precisamos de


µ

alguma maneira isolar o símbolo de Christoffel de um lado da equação. A


estratégia adotada é a seguinte: com o resultado que acabamos de deduzir
∂g
podemos fazer uma permutação dos índices µ, ν, α nos termos dxµνα e obter
assim duas outras expressões análogas à (D). Estas expressões são

∂gµα
−Γ αµν −Γ µαν = 0
∂x ν
∂gνα
−Γ ανµ −Γ ναµ = 0. (D.-1)
∂x µ
Os símbolos de Christoffel são simétricos por troca dos dois últimos índices

Γ µνα =Γ µαν

Isto significa que podemos escrever as três expressões por nós obtidas como:

∂gµν
−Γ νµα −Γ µνα = 0
∂x α
∂gµα
−Γ αµν −Γ µνα = 0
∂x ν
∂gνα
−Γ αµν −Γ νµα = 0. (D.-3)
∂x µ
onde destacamos em vermelho alizarin os índices permutados. Somando as
duas primeiras equações e subtraindo a terceira chegamos finalmente à
 
1 ∂gµν ∂gµα ∂gνα
Γ µνα = + − . (D.-3)
2 ∂x α ∂x ν ∂x µ

Esta expressão nos permite calcular diretamente os símbolos de Christoffel do


1º tipo conhecida a métrica e suas derivadas. Para os símbolos de Christoffel do
2º tipo, os Γ να , podemos obter a expressão equivalente simplesmente subindo
µ

o índice:  
1 ∂gσν ∂gσα ∂gνα
Γ να = gµσ
µ
+ − . (D.-3)
2 ∂x α ∂x ν ∂x σ

A importância deste resultado não pode ser menosprezada: para um gµν que
seja solução das equações de Einstein, temos imediatamente os Γ να que entram
µ

na equação da geodésica. Com isto temos as equações de movimento de uma


partícula livre num espaço curvo e com isto a trajetória.

© s.r. dahmen 2022


dedução da equação (3.34) 83

Os símbolos de Christoffel Γ να e Γµνα recebem os nomes de símbolo de


µ

Christoffel do 2ª tipo e símbolo de Christoffel do 1ª tipo, respectivamente. Ainda


é possível encontrar autores que preferem uma notação um pouco diferente:
( ) ( )
µ να
Γ να ≡
µ
= = {να , µ}
να µ
" # " #
µ να
Γ µνα ≡ = = [να , µ]
να µ

Não existe nestes casos uma convenção sobre a ordem em que os índices são
escritos. Os livros da escola russa de Relatividade dão preferência para as
duas últimas formas. Esta notação tem se tornado no entanto cada vez menos
frequente.

© s.r. dahmen 2022


E
A base tangente e a base dual

Em espaços planos trabalhamos na maioria das vezes por uma questão de


comodidade com a base ortonormal de vetores ı̂, ̂ e k̂ associadas aos eixos
paralelo r sin θ
cartesianos x, y e z. Quando dizemos que estes versores são associados aos
eixos ou curvas coordenadas na verdade estamos dizendo que eles são tangentes θ
r
aos eixos, motivo pelo qual toda base definida desta forma é chamada de
φ
base tangente, natural ou direta. Consideremos agora a transformação das
coordenadas cartesianas ( x, y, z) para as coordenadas polares (r, θ, ϕ): meridiano

x = r sin θ cos ϕ, y = r sin θ sin ϕ, z = r cos θ. (E.0)

Podemos também definir uma base tangente nestas variáveis, ou seja uma na
Figura E.1: As bases tangentes em co-
qual os vetores da base são tangentes às direções r, θ e ϕ. A pergunta é: como
ordenadas cartesianas x ,y, z (em azul)
fazer isto? Existiria uma regra para, dado um conjunto de variáveis, achar a e em coordenadas esféricas r, θ, ϕ (em
base tangente a elas associada? vermelho). Notem que em ambos os ca-
sos os vetores da base são tangente às
A base tangente às curvas coordenadas é definida pela derivada do vetor curvas coordenadas. No caso de coor-
posição r em relação às variáveis que definem as coordenadas. denadas esféricas er aponta na direção
radial (para longe da origem), e ϕ é tan-
gente aos paralelos e aponta na direção
Em se tratando de coordenadas cartesianas ( x, y, z), o vetor posição r é expresso
de ϕ crescente (de oeste para leste) e eθ é
na forma tangente aos meridianos, apontando na
r = x ı̂ + y ̂ + z k̂, (E.0) direção de norte para sul.
de onde segue que

∂r ∂r ∂r
= êx = ı̂, = êy = ̂, = êz = k̂. (E.0)
∂x ∂y ∂z

Em termos de coordenadas esféricas o mesmo r pode ser escrito como

r = r sin θ cos ϕı̂ + r sin θ sin ϕ ̂ + r cos θ k̂ (E.0)

e, neste caso, seguindo a definição da base tangente, temos

∂r
er = = sin θ cos ϕ ı̂ + sin θ sin ϕ ̂ + cos θ k̂,
∂r
∂r
eθ = = r cos θ cos ϕı̂ + r cos θ sin ϕ ̂ − r sin θ k̂,
∂θ
∂r
eϕ = = −r sin θ sin ϕ ı̂ + r sin θ cos ϕ ̂. (E.-1)
∂ϕ

Notem que er é unitário, mas e e e ϕ tem módulo diferente de 1.


86 uma introdução à teoria do espaço e do tempo

Um ponto de extrema importância é nos lembrarmos que uma base tangente


não é necessariamente formada por vetores unitários. Somos instintivamente
levados a pensar em bases como sendo sempre formadas por versores, e o
caso acima é um exemplo de que isto não é verdade. Em Relatividade Geral
isto é muito importante pois como trabalhamos com espaços espaços curvas e
com sistemas de coordenadas arbitrários, o fato da base não ser unitária leva a
diferenças, por exemplo, no cálculo do gradiente, como mostrado ao final do
capítulo (4).
Obviamente sempre podemos normalizar os vetores e obter uma base unitária:

1 1
êr = er , êθ = e , ê ϕ = eϕ . (E.-1)
r θ r sin θ

Os vetores da base esférica apontam na direção de r para r + dr, de θ para


θ + dθ e de ϕ para ϕ + dϕ e portanto são tangentes às linhas radiais, às linhas
de θ (equivalmente aos meridianos no globo terreste) e ϕ (equivalente aos
paralelos na superfície do globo).

A base dual.

Existe a possibilidade de usarmos uma outra base, a chamada base dual. Esta
base é também chamada de base normal (normal no sentido de perpendicular)
pois ela é obtida por meio do gradiente das coordenadas. Temos assim 2 bases
possíveis:

→ base tangente obtida pela derivada do vetor posição r em relação às


coordenadas e

→ base normal (dual) obtida pelo gradiente das coordenas diretamente, e


não por meio de r

O nome normal vem do fato que o gradiente é sempre perpendicular às curvas


de nível das coordenadas (em 2-d falamos de curvas de nível; em 3-d tratamos
de superfícies de nível; para 4-d temos volumes de nível e assim por diante).
É fácil ver que em coordenadas cartesianas a base dual e a base tangente são
idênticas, pois pela definição do gradiente das coordenadas temos:
superficies de nivel
y

∂x ∂x ∂x
∇x = ı̂ + ̂ + k̂ = ı̂
∂x ∂y ∂z
∂y ∂y ∂y direcao do gradiente

∇y = ı̂ + ̂ + k̂ = ̂ e’ a mesma
do eixo x
∂x ∂y ∂z
gradiente
∂z ∂z ∂z
∇z = ı̂ + ̂ + k̂ = k̂ (E.-2) x
∂x ∂y ∂z

O fato das bases serem idênticas neste caso vem do fato da base original ser z
x=2 x=3
x=1

ortogonal: no caso tridimensional, as superfícies de nível da coordenada x


Figura E.2: Visualização em 3-d do fato
são planos y − z com x constante. Este planos são perpendiculares ao eixo x e
que em sistemas de coordenadas ortogo-
sendo o gradiente perpendicular aos planos, temos que o gradiente e o eixo nais, a base dual e tangente são iguais a
x apontam na mesma direção. O sistema de coordenadas esféricas é também menos de fatores de escala. Notem que as
ortogonal e portanto sua base dual deverá coincidir, a menos de fatores de superfícies de nível são perpendiculares à
escala, com a base tangente. Podemos verificar isto escrevendo as coordenadas direção do eixo x. Sendo o gradiente per-
pendicular às superfícies e na direção de
x positivo, os dois vetores são paralelos.
© s.r. dahmen 2022
a base tangente e a base dual 87

r, θ e ϕ como função de x, y e z
q
r = x 2 + y2 + z2
p !
x 2 + y2
θ = arctan
x
y
ϕ = arctan (E.-3)
x
e calcular o gradiente. Seguindo a notação usual, denotaremos vetores da base
dual com um superescrito ei para diferenciá-los dos vetores da base tangente,
representados por um subescrito ei . Temos assim, segundo a definição do
gradiente:

∂r ∂r ∂r r
er = ∇r = ı̂ + ̂ + k̂ = = er
∂x ∂y ∂y r
1  e
eθ = ∇θ = cos θ cos ϕ ı̂ + cos θ sin ϕ ̂ − sin θ k̂ = 2θ
r r
1 eϕ
eϕ = ∇ϕ= (− sin θ sin ϕ ı̂ + sin θ cos ϕ ̂) = 2 (E.-4)
r sin θ r sin θ
Este resultado nos mostra que a base de vetores dual e tangente coincidem, a
menos de fatores de escala. Com uma normalização elas se tornam idênticas:

êr = êr , êθ = êθ , ê ϕ = ê ϕ . (E.-4)

Nosso conclusão é que em sistemas de coordenadas ortogonais, as bases dual


e tangente, quando normalizadas, são idênticas. Se as bases então coincidem,
fica a pergunta: por qual motivo definimos então duas bases, uma baseada
na variação de r e e outra no gradiente das coordenadas? O exemplo 1.1.3 do
livro de Foster e Nightingale nos traz um exemplo de coordenadas hiperbólicas
no espaço Euclideano cujas curvas coordenadas não são ortogonais entre si
e portanto os vetores da base não são mutuamente perpendiculares. Como
consequência, as bases duas e tangente são diferentes. Podemos entender isso
também, de maneira mais clara, no exemplo do plano R2 no qual escolhemos
um sistema de coordenadas oblíquo ( x1 , x2 ). Isto está representado na figura
(E.3) logo abaixo. O que fica claro nesta figura é que sendo o gradiente
perpendicular as curvas de nível e sendo que estas não são perpendiculares
aos eixos ordenados, resulta que entre o gradiente e os eixos haverá um
ângulo diferente de π/2. Neste caso as duas bases não coincidem e podemos
representar um vetor qualquer em uma ou outra base. A projeção na base
tangente é chamada representação contravariante do vetor ao passo que a
projeção na base dual é a representação covariante. Em outras palavras:

= T 1 e1 + T 2 e2 representação na base contravariante


1 2
= T1 e + T2 e representação na base covariante (E.-4)

onde ( T 1 , T 2 ) e ( T1 , T2 ) são as componentes contravariantes e covariantes


do vetor , respectivamente. Notem as componentes contravariantes (base
tangente) são escritas com o índice em cima. Já as componentes covariantes
(base dual) com o índice embaixo. Esta é uma convenção adotada por todos
e é importante que a sigamos para evitar confusão posteriormente 1 . O vetor 1
A notação usada remonta aos “pais” do
obviamente é o mesmo, o que muda é a maneira como o escrevemos em termos cálculo tensorial: são eles o alemão Elwin
de componentes. Bruno Christoffel (1829–1900) e os italia-
nos Gregorio Ricci-Curbastro (1853–1925)
e Tullio Levi-Civitta (1873–1941).
© s.r. dahmen 2022
88 uma introdução à teoria do espaço e do tempo

Figura E.3: A razão geométrica pela qual,


num sistema de coordenadas não ortogo-
nais, a base tangente e dual são diferentes.
Notem que os gradientes (em vermelho)
são perpendiculares às curvas de nível e
2
x não coincidem com as direções dos eixos
x1 e x2 (azul). Estes gradientes definem
coordenada uma outra base, a base dual ou, como é
gradiente
mais comumente conhecida, base covari-
ante. A base de vetores na direção dos
gradiente coordenada eixos (em azul) é chamada de base contra-
T
2 cova variante. É importante também notar que
riante
quer usemos a base tangente, quer a base
2 T dual, a regra do paralelogramo vale para
T
contravariante as componentes de (os paralelogramos
estão desenhados em azul e vermelho,
covariante
te

respectivamente, na origem dos eixos de


n
aria

coordenadas.
trav

gradiente
con

1
x
1 T
gradiente T 1

É importante notar, no exemplo descrito por Foster e Nightingale (coordenadas


curvilíneas) ou no exemplo aqui discutido (coordenadas oblíquas), estamos
descrevendo um espaço plano que poderia muito bem ser descrito em termos
de coordenadas cartesianas. Em espaços planos a escolha de referencial é uma
questão de escolha: optamos por este ou aquele conjunto de coordenadas que
seja mais conveniente ao problema que estamos resolvendo.
Na Relatividade Geral, o uso destas bases não é mais uma questão de escolha
mas antes uma questão de necessidade: em espaços curvos é impossível achar
uma base de eixos ortogonais a não ser em regiões muito pequenas em torno
de um ponto onde a curvatura pode ser tomada como praticamente nula, isto
é, o espaço é localmente plano. Fazemos isto por exemplo quando colocamos
um eixo cartesiano no laboratório onde estamos conduzindo um experimento.
Localmente podemos desprezar a curvatura da superfície terrestre. O fato da
superfície de uma esfera ser (obviamente) curva se reflete no fato que não con-
seguimos mapear esta superfície num plano sem que a deformemos (isto pode
ser facilmente apreciado nas diferentes projeções planares dos mapas-mundi).
Em espaços curvos a base dual e tangente são necessariamente diferentes. O
porquê disto ocorrer fica claro nesta passagem do livro de Landau e Lifshitz:

No caso geral de campos gravitacionais que variam, a métrica do espaço não


apenas não é Euclideana como também varia no tempo. Isto significa que
relações entre diferentes distâncias geométricas mudam com o passar do tempo.
O resultado disto é que a posição relativa de “corpos-teste” introduzidos neste
campo não podem ser constantes qualquer que seja o sistema de coordenadas
escolhido [...] Devido à arbitrariedade na escolha do referencial, as leis
da natureza devem ser escritas, na relatividade geral, de uma forma que
seja apropriada em qualquer sistema quadridimensional de coordenadas (ou,

© s.r. dahmen 2022


a base tangente e a base dual 89

como se costuma dizer, em forma “covariante”). Isto, obviamente, não


implica na equivalência física entre todos estes referenciais (como no caso
da equivalência entre todos os referenciais inerciais na relatividade especial).
Muito pelo contrário, a aparência específica dos fenômenos físicos, incluindo
as propriedades dos movimentos dos corpos, se torna diferente em diferentes
referenciais. 2 2
L. D. Landau e E. M. Lifshitz, The Classi-
cal Theory of Fields, Elsevier, 2004, p. 246.
Ao longo do curso de Relatividade Geral teremos a oportunidade de discutir
isto detalhadamente.

© s.r. dahmen 2022


F
Dois exemplos de transporte paralelo

Discutiremos aqui dois exemplos de transporte paralelo: o primeiro sobre um


arco de círculo no plano e o segundo o deslocamento paralelo sobre a superfície
de uma esfera. O primeiro caso é meramente ilustrativo pois sendo a superfície
plana, poderíamos usar coordenadas cartesianas. A idéia porém neste caso é
entender como o formalismo realmente reproduz o esperado.
A equação para o deslocamento paralelo da componente contravariante de um
vetor A é
δAi = −Γi kp Ak dx p ; e x = − eφ
Q

Como exemplo utilizaremos o vetor A = ex , transportado do ponto P ao ponto


ρ
Q como na figura ao lado. Utilizaremos coordenadas polares:
φ

x1 = ρ, x2 = φ
P
(F.0) ex = e ρ

O elemendo de linha nestas variáveis vale

ds2 = gik dx1 dx k = dρ2 + ρ2 dφ2 (F.0)

de onde obtemos Figura F.1: Transporte paralelo do vetor


! ! ex do ponto P ao ponto Q ao longo de
1 0 1 0 um círculo.
( gik ) = , ( gik ) = . (F.0)
0 ρ2 0 1/ρ2

Precisamos achar os símbolos de Christoffel. Como eles são funções das


derivadas parciais da métrica como função das coordenadas, a única derivada
parcial diferente de zero dos gik é

∂g22 ∂g
= 22 = 2ρ (F.0)
∂x1 ∂ρ

Isto implica que há apenas 3 símbolos de Christoffel:

1 g11 ∂g22 2 2 g22 ∂g22 1


Γ 22 =− = −ρ Γ 21 =Γ 12 = = (F.0)
2 ∂x1 2 ∂x1 ρ

Como queremos transportar o vetor ex do ponto P ao Q utilizando coordenadas


polares, precisamos antes expressar o vetor em termos dos vetores de base eρ e
eφ . Isto nos dá
sin φ
A = ex = cos φ e1 − e2 = Ai ei (F.0)
ρ
92 uma introdução à teoria do espaço e do tempo

As componentes deste vetor são, claramente

sin φ sin( x2 )
A1 = cos φ = cos( x2 ), A2 = − =− (F.0)
ρ x1

O que podemos depreender imediatamente deste exemplo é que embora o


vetor A = ex seja constante e independente da posição onde se encontram,
suas componentes variam com as coordenadas (ρ, φ). Isto significa que dAi =
i dx p = ∂Ai /∂x p dx p não serve para medir a variação do vetor A do ponto x
A,p
até o ponto x + dx em coordenadas polares. Em particular, ao deslocarmo-nos
por
(dx1 , dx2 ) = (dρ, dφ) = (0, dφ) (F.0)
obtemos
!
∂Ai ∂A1 ∂A2
 
i cos φ
(dA ) = dx p = dφ + dφ = − sin φ − dφ (F.0)
∂x p ∂φ ∂φ ρ

ao passo que

(δAi ) = −Γ ikp Ak dx p = −Γ 122 A2 dφ − Γ 2


12 A
1

 
cos φ
= − sin φ − dφ, (F.0)
ρ

de onde concluímos que a derivada covariante é zero pois:

DAi = dAi − δAi = 0 (F.0)

Este resultado era esperado pois sabemos que o vetor ex é constante. POr
questão de simplicidade, uma vez que ρ é constante, tomemos ρ = 1. Se agora
fizermos todo o percurso, do ponto P ao ponto Q da figura, isto é

dρ=0
( xi ( P)) = (ρ, φ) = (1, 0) −−−→ ( xi ( Q)) = (ρ, φ) = (1, π/2) (F.0)

a mudança do vetor Ai ao longo deste caminho vale


Z Z π/2
(dAi ) = dφ (− sin φ, − cos φ) = (−1, −1) (F.0)
0

Este resultado significa que as componentes do vetor A = ex mudam ao longo


do caminho,

( A1 , A2 ) Q − ( A1 , A2 ) P = (−1, −1)
( A1 , A2 )Q − (1, 0) = (−1, −1)
( A1 , A2 ) Q = (0, −1) (F.-1)

Já a mudança devido ao deslocamento paralelo segue de


Z Z π/2
(δAi ) = dφ (− sin φ, − cos φ) = (−1, −1). (F.-1)
0

Portanto o vetor ex não muda se o movermos ao longo do quadrante de círculo


pois dAi − δAi = 0, ou seja, os dois termos se cancelam. Olhemos agora para o
caso do transporte paralelo de um vetor sobre a superfície de uma esfera, como
ilustra a próxima figura.

© s.r. dahmen 2022


dois exemplos de transporte paralelo 93

A esfera de raio a é parametrizada pelas variáveis usuais x1 = θ e x2 = φ, com


as convenções usuais de 0 ≤ θ ≤ π e 0 ≤ φ ≤ 2π. A métrica é
!
a2 0
gµν = (F.-1)
0 a2 sin2 θ

Os únicos símbolos de Christoffel diferentes de zero são:

Γrθθ = − sin θ cos θ Γθrθ = Γθθr = cot θ (F.-1)

Consideremos o transporte de um vetor v arbitrário ao longo de um paralelo Figura F.2: Um vetor é transportado pa-
de latitude θ = θo do ponto Po até a volta ao mesmo ponto, ou seja entre φ = 0 ralelamente sobre a superfície de uma
e φ = 2π. esfera. Fonte: Foster and Nightingale, op.
A equação paramétrica ui (t) do círculo é dada por cit., p. 66.

(
u1 ( t ) = θ o
uµ (t) =
u2 ( t ) = t 0 ≤ t ≤ 2π

o que implica que du1 /dt = 0 e du2 /dt = 1. Dados os valores para os símbolos
de Christoffel, a equação do transporte paralelo é

v̇µ + Γ ν2 vν = 0
µ
(F.-2)

que nada mais é que um conjunto de equações diferenciais ordinárias


(
v̇1 − sin θo cos θo v2 = 0 ( v1 = v θ )
(F.-2)
v̇2 + cot θo v1 = 0 ( v2 = v φ )

para as componentes v1 e v2 do vetor em questão. Para resolver este sistema


de equações diferenciais precisamos de condições inciais. Suponhamos que v
seja um vetor unitário e portanto

gµν vµ (0) vν (0) = 1 (F.-2)

e que ele faça um ângulo inicial α em relação ao meridiano N–S que passa pelo
ponto Po , ou seja, sua componente projetada sobre o vetor unitário êθ = 1a eθ Consulte o Apêndice C acerca da nor-
1

malização dos vetores eµ .


que aponta na direção Sul em Po valha 1 :

gµν vµ (0) eν = cos α. (F.-2)

Estas duas equações nos dizem que as componentes de v em Po são, respectiva-


mente
1
v1 (0) = cos α
a
1
v2 (0) = sin α. (F.-2)
a sin θo
A solução de (F) com as condições iniciais acima vale
(
v1 (t) = vθ (t) = 1a cos(α − cos θo t)
1
(F.-2)
v2 ( t ) = v φ ( t ) = a sin θo sin(α − cos θo t).

Estas soluções nos dão o valor das componentes do vetor v que é transportado
paralelamente a si mesmo sobre qualquer ponto do círculo θo . O resultado

© s.r. dahmen 2022


94 uma introdução à teoria do espaço e do tempo

mais interessante é o valor que este vetor assume ao retornar ao ponto inicial
Po , ou seja, quando t = 2π. Neste caso o resultado acima se reduz à
(
v1 (2π ) = vθ (2π ) = 1a cos(α − 2π cos θo )
1
(F.-2)
v2 (2π ) = vφ (2φ) = a sin θo sin( α − 2π cos θo ).

Isto significa que ao completar o circuito o vetor continua sendo unitário, como
pode ser facilmentente comprovado calculando o produto escalar de v(2π )
consigo mesmo
gµν vµ (2π ) vν (2π ) = 1. (F.-2)
No entanto, o produto escalar de v(0) com v(2π ) dá:

gµν vµ (0) vν (2π ) = cos α cos(α − 2π cos θo ) + sin α sin(α − 2π cos θo )


= cos[α − (α − 2π cos θo ]
= cos(2π cos θo ), (F.-3)

ou seja, o vetor v depois de transladado ao longo do círculo θ = θo faz um


ângulo 2π cos θo em relação à sua direção original. Por exemplo, para θ0 = 85°o
giro do vetor é de 31.4°, ao passo que próximo ao polo norte, para θ0 = 5°, o
giro é de 1.4°.
Este último resultado ilustra um ponto bastante importante acerca do transporte
paralelo: se θo = π/2, se a trajetória é ao longo do Equador, o vetor mantém
sua orientação durante o translado. O Equador é, entre todos paralelos, o único
grande círculo, isto é uma geodésica. Portanto, se um vetor é transportado
ao longo de uma geodésica, o ângulo entre o vetor e a tangente à geodésica é
constante. Se pudéssemos cortar uma tira muito fina ao longo da geodésica e
estendê-la sobre uma superfície plana, esta tira seria uma reta. O mesmo não
ocorre para outros círculos sobre a superfície da esfera que não sejam grandes
círculos. Um outro ponto importante deste resultado é para o caso quando
percorremos uma curva fechada de dimensões relativamente pequenas, como
no caso de θ0 = 5°. Quanto menor a curva fechada, mais o giro do vetor se
aproxima de 2π e portanto o desvio da direção original é quase imperceptível.
Isto significa, fisicamente falando, que se nos restringirmos a uma área pequena
da superfície, esta área parecerá quase plana e não conseguiremos detectar
o fato que ela é na realidade curva. Portanto, experimentos para detectar a
curvatura de superfícies só são possíveis considerando-se regiões grandes da
superfície total.

© s.r. dahmen 2022

Você também pode gostar