FirstCourseGR Pages 1 200

Machine Translated by Google
Esta página foi intencionalmente deixada em branco

Um Primeiro Curso de Relatividade Geral

Segunda edição
Clareza, legibilidade e rigor combinam-se na segunda edição deste livro amplamente utilizado
para fornecer o primeiro passo para a relatividade geral para estudantes de graduação com uma
formação mínima em matemática.
Tópicos dentro da relatividade que fascinam pesquisadores e estudantes astrofísicos são
abordados com a facilidade e autoridade características de Schutz – de buracos negros a lentes
gravitacionais, de pulsares ao estudo do Universo como um todo. Esta edição agora contém
descobertas recentes de astrônomos que requerem a relatividade geral para sua explicação; um
capítulo revisado sobre estrelas relativísticas, incluindo novas informações sobre pulsares; um
capítulo inteiramente reescrito sobre cosmologia; e um tratamento extenso e abrangente de
detectores de ondas gravitacionais modernos e fontes esperadas.
Mais de 300 exercícios, muitos novos para esta edição, dão aos alunos a confiança para
trabalhar com a relatividade geral e a matemática necessária, enquanto o estilo de escrita informal
torna o assunto facilmente acessível. Soluções protegidas por senha para instrutores estão
disponíveis em www.cambridge.org/Schutz.
Bernard Schutz é Diretor do Instituto Max Planck de Física Gravitacional, Professor da

Universidade de Cardiff, Reino Unido, e Professor Honorário da Universidade de Potsdam e da
Universidade de Hannover, Alemanha. Ele também é Investigador Principal do projeto do detector
GEO600 e membro do Comitê Executivo da Colaboração Científica LIGO. O professor Schutz
recebeu a Medalha de Ouro Amaldi da Sociedade Italiana de Gravitação.
Um Primeiro Curso de
Relatividade geral
Segunda edição
Bernard F. Schutz
Instituto Max Planck de Física Gravitacional (Instituto Albert Einstein) e
Universidade de Cardiff
CAMBRIDGE UNIVERSITY PRESS

Cambridge, Nova York, Melbourne, Madri, Cidade do Cabo, Cingapura, São Paulo
Cambridge University Press

Edifício de Edimburgo, Cambridge CB2 8RU, Reino Unido
Publicado nos Estados Unidos da América pela Cambridge University Press, Nova York
www.cambridge.org
Informações sobre este título: www.cambridge.org/9780521887052
© B. Schutz 2009
Esta publicação está protegida por direitos autorais. Sujeito a exceção legal e ao
fornecimento de acordos de licenciamento coletivo relevantes, nenhuma reprodução de qualquer
parte pode ocorrer sem a permissão por escrito da Cambridge University Press.
Publicado pela primeira vez em formato impresso 2009
ISBN-13 978-0-511-53995-4 e-book (EBL)
ISBN-13 978-0-521-88705-2 capa dura
A Cambridge University Press não se responsabiliza pela persistência ou precisão de urls para
sites externos ou de terceiros mencionados nesta publicação e não garante que qualquer
conteúdo em tais sites seja, ou permanecerá, preciso ou apropriado.
Conteúdo
Prefácio da segunda edição página xi

Prefácio da primeira edição xiii
1 Relatividade especial 1
1.1 Princípios fundamentais da teoria da relatividade especial (SR) 1.2 1

Definição de um observador inercial em SR 3
1.3 Novas unidades 4
1.4 Diagramas espaço- 5
temporais 1.5 Construção das coordenadas usadas por outro observador 6

1.6 Invariância do intervalo 9
1,7 Hipérbole invariável 14
1,8 Resultados particularmente importantes 17
1.9 A transformação de Lorentz 21
1.10 A lei da composição da velocidade 22
1.11 Paradoxos e intuição física 1.12 Leitura 23
complementar 1.13 Apêndice: O 'paradoxo' 24
gêmeo dissecado 1.14 Exercícios 25

28
2 Análise vetorial na relatividade especial 33

2.1 Definição de um vetor 33
2.2 Álgebra vetorial 2.3 36
A quatro velocidades 2.4 A 41

quatro momentos 42
2,5 Aplicações de 44
2.6 produtos 46
escalares 2.7 Fótons 49
2,8 Leitura adicional 50
2.9 Exercícios 50
3 Análise tensorial na relatividade especial 56

3.1 O tensor métrico 56
3.2 Definição de tensores 56
3.3 O 0 tensores: uma forma 58
1
3.4 O 0 tensores 66
2
viii Conteúdo
3.5 Métrica como um mapeamento de vetores em uma forma 3.6 68

M
Finalmente: 3.7 Índice tensores 72
N 'aumentando' e 'diminuindo' 3.8
Diferenciação de tensores 74
76
3.9 Leitura adicional 77

3.10 Exercícios 77
4 fluidos perfeitos na relatividade especial 84

4.1 Fluidos 84
4.2 Poeira: o vetor número-fluxo N 85
4.3 Formas e superfícies 88
4.4 Poeira novamente: o tensor tensão-energia 4.5 91

Fluidos gerais 93
4.6 Fluidos perfeitos 100
4.7 Importância para a relatividade geral 4.8 Lei 104

de Gauss 105
4.9 Leitura complementar 106

4.10 Exercícios 107
5 Prefácio à curvatura 111
5.1 Sobre a relação da gravitação com a curvatura 5.2 111
Álgebra tensorial em coordenadas polares 5.3 Cálculo 118
tensorial em coordenadas polares 5.4 Símbolos de 125
Christoffel e a métrica 5.5 Bases não coordenadas 131

135
5.6 Olhando para o futuro 138
5.7 Leitura adicional 5.8 139

Exercícios 139
6 coletores curvos 142

6.1 Variedades e tensores diferenciáveis 142
6.2 Variedades Riemannianas 144
6.3 Diferenciação de covariantes 150
6.4 Transporte paralelo, geodésica e curvatura 6.5 O tensor 153

de curvatura 157
6.6 Identidades de Bianchi: tensores de Ricci e Einstein 163
6.7 Curvatura em perspectiva 6.8 165
Leitura complementar 6.9 Exercícios 166

166
7 Física em um espaço-tempo curvo 7.1 A 171
transição da geometria diferencial para a gravidade 7.2 Física em um 171
espaço-tempo levemente curvo 7.3 Intuição curva 175

177
ix Conteúdo
7.4 Quantidades conservadas 7.5 178

Exercícios de leitura complementar 181
7.6 181
8 As equações de campo de Einstein 8.1 184
Finalidade e justificação das equações de campo 8.2 Equações 184
de Einstein 8.3 Equações de Einstein para campos gravitacionais 187

fracos 8.4 Campos gravitacionais
complementar Exercíciosnewtonianos 8.5 Leitura 189
194
197
8.6 198
9 Radiação gravitacional 203
9.1 A propagação de ondas gravitacionais 9.2 A detecção 203
de ondas gravitacionais 9.3 A geração de ondas 213
gravitacionais 9.4 A energia transportada por ondas 227
gravitacionais 9.5 Fontes astrofísicas de ondas gravitacionais Leitura 234

complementar Exercícios 242
9.6 247
9.7 248
10 soluções esféricas para estrelas 256
10.1 Coordenadas para espaços-tempos esfericamente simétricos 10.2 256
Espaço-tempos esfericamente simétricos estáticos 10.3 Fluido perfeito 258
estático Equações de Einstein 10.4 A geometria exterior 10.5 A 260
estrutura interior da estrela 262

263
10.6 Soluções interiores exatas 266
10.7 Estrelas realistas e colapso gravitacional 10.8 Leitura 269
complementar 10.9 Exercícios 276

277
11 Geometria de Schwarzschild e buracos negros 281
11.1 Trajetórias no espaço-tempo de Schwarzschild 11.2 281

Natureza da superfície r = 2M 298
11.3 Buracos negros gerais 304
11.4 Buracos negros reais em astronomia 318
11.5 Emissão mecânica quântica de radiação por buracos negros:

o processo Hawking 11.6 323
Leitura adicional 11.7 Exercícios 327

328
12 Cosmologia 12.1 335
O que é cosmologia? 335
12.2 Cinemática cosmológica: observando o universo em expansão 337

x Conteúdo
12.3 Dinâmica cosmológica: entendendo o universo em expansão 12.4 353

Cosmologia física: a evolução do universo que observamos 12.5 Leitura 361
complementar 12.6 Exercícios 369
370
Apêndice A Resumo de álgebra linear 374

Referências 378
Índice 386
Prefácio da segunda edição
Nos 23 anos entre a primeira edição deste livro e a presente revisão, o campo da relatividade geral
floresceu e amadureceu. Sobre seus sólidos fundamentos matemáticos cresceram inúmeras
aplicações, algumas das quais nem sequer eram imaginadas em 1985, quando surgiu a primeira
edição. O estudo da relatividade geral, portanto, mudou da periferia para o centro da educação de
um físico teórico profissional, e cada vez mais alunos de graduação esperam aprender pelo menos o
básico da relatividade geral antes de se formarem.
Meus leitores têm sido pacientes. Os alunos continuaram a usar a primeira edição deste livro para
aprender sobre os fundamentos matemáticos da relatividade geral, embora tenha se tornado
seriamente desatualizado em aplicações como a astrofísica de buracos negros, a detecção de ondas
gravitacionais e a exploração de o universo. Esta segunda edição extensivamente revisada, espero,
finalmente trará o livro de volta ao equilíbrio e dará aos leitores uma introdução consistente e
unificada à pesquisa moderna em gravitação clássica.
Os primeiros oito capítulos sofreram poucas mudanças. Referências recentes para leitura adicional
foram incluídas e algumas seções foram expandidas, mas, em geral, a abordagem geométrica dos
fundamentos matemáticos da teoria parece ter resistido ao teste do tempo.
Em contraste, os quatro capítulos finais, que tratam da relatividade geral na arena astrofísica, foram
atualizados, expandidos e, em alguns casos, completamente reescritos.
Polegada. 9, sobre radiação gravitacional, há agora uma extensa discussão sobre detecção com
interferômetros como o LIGO e o detector espacial planejado LISA. Também incluí uma discussão
sobre prováveis fontes de ondas gravitacionais e o que podemos esperar aprender com as detecções.
Este é um campo que está mudando rapidamente, e a primeira detecção direta pode ocorrer a
qualquer momento. O Capítulo 9 destina-se a fornecer uma estrutura durável para a compreensão
das implicações dessas detecções.
Polegada. 10, a discussão sobre a estrutura de estrelas esféricas permanece robusta, mas inseri
material sobre estrelas de nêutrons reais, que vemos como pulsares e que são fontes potenciais de
ondas gravitacionais detectáveis.
O Capítulo 11, sobre buracos negros, também ganhou um extenso material sobre as evidências
astrofísicas de buracos negros, tanto para buracos negros de massa estelar quanto para buracos
negros supermassivos que os astrônomos surpreendentemente descobriram nos centros da maioria
das galáxias. A discussão da radiação Hawking também foi ligeiramente alterada.
Por fim, Cap. 12 sobre cosmologia é completamente reescrito. Na primeira edição eu
essencialmente ignorei a constante cosmológica. Nisso segui o preconceito da época, que supunha
que a expansão do universo estava desacelerando, embora ainda não tivesse sido medida com
precisão suficiente. Acreditamos agora, a partir de uma variedade de observações mutuamente
consistentes, que a expansão está se acelerando. Este é provavelmente o maior desafio para
xii Prefácio da segunda edição
física teórica hoje, tendo um impacto tão grande nas teorias fundamentais da física de partículas
quanto nas questões cosmológicas. Eu organizei o Ch. 12 em torno dessa perspectiva, desenvolvendo
modelos matemáticos de um universo em expansão que incluem a constante cosmológica, depois
discutindo em detalhes como os astrônomos medem a cinemática do universo e, finalmente,
explorando a maneira como os constituintes físicos do universo evoluíram após o Big Bang. Os
papéis da inflação, da matéria escura e da energia escura afetam a estrutura do universo hoje e até
mesmo nossa própria existência. Neste capítulo, é possível apenas dar uma breve amostra do que
os astrônomos aprenderam sobre essas questões, mas espero que seja suficiente para encorajar os
leitores a aprender mais.
Incluí mais exercícios em vários capítulos, onde era apropriado, mas removi as soluções dos
exercícios do livro. Eles já estão disponíveis no site do livro.
O assunto deste livro continua sendo a relatividade geral clássica; além de uma breve discussão
sobre a radiação Hawking, não há referência aos efeitos de quantização. Embora a gravidade
quântica seja uma das áreas mais ativas de pesquisa em física teórica hoje, ainda não há uma
direção clara para apontar um aluno que queira aprender a quantizar a gravidade. Talvez na terceira
edição seja possível incluir um capítulo sobre como a gravidade é quantizada!
Quero agradecer a muitas pessoas que me ajudaram nesta segunda edição. Vários me forneceram
generosamente listas de erros de impressão e erros na primeira edição; Quero mencionar
especialmente Frode Appel, Robert D'Alessandro, JAD Ewart, Steve Fulling, Toshi Futamase, Ted
Jacobson, Gerald Quinlan e B. Sathyaprakash. Quaisquer erros remanescentes são, obviamente, de
minha inteira responsabilidade. Agradeço também aos meus editores da Cambridge University Press,
Rufus Neal, Simon Capelin e Lindsay Barnes, por sua paciência e incentivo.
E é claro que sou profundamente grato à minha esposa Sian por sua generosa paciência durante
todas as horas, dias e semanas que passei trabalhando nesta revisão.
Prefácio da primeira edição
Este livro evoluiu de notas de aula para um curso de graduação de um ano inteiro em relatividade geral que lecionei
de 1975 a 1980, uma experiência que me convenceu firmemente de que a relatividade geral não é significativamente
mais difícil para os alunos de graduação aprenderem do que os tratamentos padrão de nível de graduação.
eletromagnetismo e mecânica quântica.
A explosão do interesse de pesquisa em relatividade geral nos últimos 20 anos, em grande parte estimulada pela
astronomia, não apenas levou a uma compreensão mais profunda e completa da teoria, mas também nos ensinou
maneiras mais simples e físicas de entendê-la. A relatividade está agora na corrente principal da física e da
astronomia, de modo que nenhum físico teórico pode ser considerado amplamente educado sem algum treinamento
no assunto. A formidável relatividade da reputação adquirida em seus primeiros anos (Entrevistador: 'Professor
Eddington, é verdade que apenas três pessoas no mundo entendem a teoria de Einstein?' Eddington: 'Quem é o
terceiro?') sendo mais amplamente ensinado aos físicos teóricos. O objetivo deste livro é apresentar a relatividade
geral em um nível apropriado para alunos de graduação, de modo que o aluno compreenda os conceitos físicos
básicos e suas implicações experimentais, seja capaz de resolver problemas elementares e esteja bem preparado
para os conceitos mais avançados. textos sobre o assunto.
Na prossecução deste objectivo, tentei satisfazer dois critérios concorrentes: primeiro, assumir um mínimo de
pré-requisitos; e, segundo, evitar diluir o assunto. Ao contrário da maioria dos textos introdutórios, este não pressupõe
que o aluno já tenha estudado eletromagnetismo em sua formulação manifestamente relativista, a teoria das ondas
eletromagnéticas ou a dinâmica dos fluidos. A dinâmica de fluidos necessária é desenvolvida nos capítulos
relevantes. A principal consequência de não assumir uma familiaridade com as ondas eletromagnéticas é que as
ondas gravitacionais têm que ser introduzidas lentamente: a equação da onda é estudada do zero.
Uma lista completa de pré-requisitos aparece abaixo.

O segundo princípio orientador, o de não diluir o tratamento, é muito subjetivo e mais difícil de descrever. Tentei
introduzir a geometria diferencial completamente, não me contentando em confiar apenas em analogias com
superfícies curvas, mas deixei de fora assuntos que não são essenciais para a relatividade geral neste nível, como
teoria de variedades não métrica, derivadas de Lie e feixes de fibras. .1 Introduzi as equações de campo não
lineares completas, não apenas as da teoria linearizada, mas as resolvo apenas nos casos plano e esférico, citando
e examinando, além disso, a solução de Kerr. Eu estudo as ondas gravitacionais principalmente na aproximação
linear, mas vou um pouco além dela para derivar a energia nas ondas e os efeitos da reação no emissor da onda.
Eu tentei em cada tópico fornecer o suficiente
1 O tratamento aqui é, portanto, diferente em espírito daquele em meu livro Geometrical Methods of Mathematical
Physics (Cambridge University Press 1980b), que pode ser usado para complementar este.
xiv Prefácio da primeira edição
alicerce para que o aluno possa ir a tratamentos mais avançados sem ter que recomeçar do
início.
A primeira parte do livro, até o cap. 8, apresenta a teoria em uma sequência que é típica de
muitos tratamentos: uma revisão da relatividade especial, desenvolvimento da análise tensorial
e física do contínuo na relatividade especial, estudo do cálculo tensorial em coordenadas
curvilíneas em espaços euclidianos e de Minkowski, geometria de variedades curvas , física
em um espaço-tempo curvo e, finalmente, as equações de campo. Os quatro capítulos restantes
estudam alguns tópicos que escolhi por causa de sua importância na astrofísica moderna. O
capítulo sobre radiação gravitacional é mais detalhado do que o usual neste nível porque a
observação de ondas gravitacionais pode ser um dos desenvolvimentos mais significativos na
astronomia na próxima década. O capítulo sobre estrelas esféricas inclui, além do material
usual, uma família útil de soluções compressíveis exatas devido a Buchdahl. Um longo capítulo
sobre buracos negros estuda com algum detalhe a natureza física do horizonte, indo até as
coordenadas de Kruskal, depois explorando o buraco negro rotativo (Kerr) e concluindo com
uma discussão simples sobre o efeito Hawking, a emissão mecânica quântica de radiação por
buracos negros. O capítulo final sobre cosmologia deriva as métricas homogêneas e isotrópicas
e estuda brevemente a física da observação e evolução cosmológica. Há um apêndice
resumindo a álgebra linear necessária no texto e outro apêndice contendo dicas e soluções
para exercícios selecionados. Um assunto ao qual decidi não dar tanta importância, como
outros textos tradicionalmente, são os testes experimentais de relatividade geral e de teorias
alternativas da gravidade. Os pontos de contato com o experimento são tratados à medida que
surgem, mas discussões sistemáticas de testes agora exigem livros inteiros (Will 1981).2 Os
físicos hoje têm muito mais confiança na validade da relatividade geral do que tinham uma ou
duas décadas atrás, e acredito que uma extensa discussão de teorias alternativas é, portanto,
quase tão fora de lugar em um texto elementar moderno sobre gravidade quanto seria em um
sobre eletromagnetismo.
Supõe-se que o aluno já tenha estudado: relatividade especial, incluindo a transformação de
Lorentz e mecânica relativista; cálculo vetorial euclidiano; equações diferenciais parciais
ordinárias e simples; termodinâmica e hidrostática; gravidade newtoniana (a estrutura estelar
simples seria útil, mas não essencial); e mecânica quântica elementar suficiente para saber o
que é um fóton.
A notação e as convenções são essencialmente as mesmas de Misner et al., Gravitation
(WH Freeman 1973), que pode ser considerada como um possível texto de seguimento após este.
O ponto de vista físico e o desenvolvimento do assunto também são inevitavelmente
influenciados por esse livro, em parte porque Thorne foi meu professor e em parte porque
Gravitação se tornou um texto tão influente. Mas porque tentei tornar o assunto acessível a um
público muito mais amplo, o estilo e o método pedagógico do presente livro são muito diferentes.
Em relação ao uso do livro, ele foi projetado para ser estudado sequencialmente como um
todo, em um curso de um ano, mas pode ser encurtado para acomodar um curso de meio ano.
Cursos de meio ano provavelmente devem visar objetivos restritos. Por exemplo, seria razoável
tentar ensinar ondas gravitacionais e buracos negros em meio ano para alunos que já
2 A segunda edição revisada desta obra clássica é Will (1993).

xv Prefácio da primeira edição
estudou as ondas eletromagnéticas, pulando cuidadosamente alguns dos capítulos. 1–3 e a maioria
dos caps. 4, 7 e 10. Alunos com preparação em relatividade especial e dinâmica de fluidos poderiam
aprender estrutura estelar e cosmologia em meio ano, desde que pudessem passar rapidamente pelos
primeiros quatro capítulos e depois pular os capítulos. 9 e 11. Um curso de nível de pós-graduação
pode, é claro, ser muito mais rápido, e deve ser possível cobrir todo o texto em meio ano.
Cada capítulo é seguido por um conjunto de exercícios, que vão desde os triviais (preenchendo as
etapas que faltam no corpo do texto, manipulando a matemática recém-introduzida) até problemas
avançados que ampliam consideravelmente a discussão no texto. Alguns problemas requerem
calculadoras programáveis ou computadores. Não posso exagerar a importância de fazer uma seleção
de problemas. Os fáceis e médios nos capítulos iniciais fornecem prática essencial, sem a qual os
capítulos posteriores serão muito menos compreensíveis. Os problemas médio-difíceis e difíceis dos
capítulos posteriores são um teste de compreensão do aluno. É muito comum na relatividade os alunos
acharem a estrutura conceitual tão interessante que relegam a resolução de problemas a um segundo
plano. Tal separação é falsa e perigosa: um aluno que não consegue resolver problemas de dificuldade
razoável também não entende realmente os conceitos da teoria. Geralmente, há mais problemas do
que se esperaria que um aluno resolvesse; vários capítulos têm mais de 30. O professor deverá
selecioná-los criteriosamente. Outra rica fonte de problemas é o Livro de Problemas em Relatividade e
Gravitação, Lightman et al. (Princeton University Press 1975).
Sou grato a muitas pessoas por sua ajuda, direta e indireta, com este livro. Gostaria de agradecer
especialmente aos meus alunos de graduação da University College, Cardiff, cujo entusiasmo pelo
assunto e cuja paciência com as inadequações das primeiras notas de aula me incentivaram a
transformá-las em livro. E sou certamente grato a Suzanne Ball, Jane Owen, Margaret Vallender,
Pranoat Priesmeyer e Shirley Kemp por sua paciente digitação e redigitação dos sucessivos rascunhos.
1 Relatividade especial
1.1 Princípios Fundamentais da teoria da relatividade

especial ( SR )
A maneira pela qual a relatividade especial é ensinada em um nível de graduação elementar – o nível
em que o leitor é considerado competente – geralmente se aproxima em espírito da maneira como foi
inicialmente entendida pelos físicos. Esta é uma abordagem algébrica, baseada na transformação de
Lorentz (§ 1.7 abaixo). Neste nível básico, aprendemos como usar a transformação de Lorentz para
converter entre as medidas de um observador e de outro, para verificar e compreender fenômenos
notáveis como dilatação do tempo e contração de Lorentz, e fazer cálculos elementares da conversão de
massa em energia.
Esse ponto de vista puramente algébrico começou a mudar, a se ampliar , menos de quatro anos
depois que Einstein propôs a teoria . espaço tridimensional que agora chamamos de espaço-tempo. Este
foi o início do ponto de vista geométrico, que levou diretamente à relatividade geral em 1914-16. É este
ponto de vista geométrico sobre a relatividade especial que devemos estudar antes de tudo.
Como veremos, a relatividade especial pode ser deduzida de dois postulados fundamentais:
(1) Princípio da relatividade (Galileu): Nenhum experimento pode medir a velocidade absoluta de um
observador; os resultados de qualquer experimento realizado por um observador não dependem de
sua velocidade em relação a outros observadores que não estão envolvidos no experimento.
(2) Universalidade da velocidade da luz (Einstein): A velocidade da luz em relação a qualquer observador
não acelerado é c = 3 × 108 m sÿ1, independentemente do movimento da fonte da luz em relação
ao observador. Sejamos bem claros sobre o significado deste postulado: dois observadores não
acelerados diferentes medindo a velocidade do mesmo fóton descobrirão que ele está se movendo
a 3 × 108 m sÿ1 em relação a si mesmos, independentemente de seu estado de movimento
em relação um ao outro.
Como observado acima, o princípio da relatividade não é um conceito moderno; ela remonta à hipótese
de Galileu de que um corpo em um estado de movimento uniforme permanece nesse estado a menos
que seja atuado por algum agente externo. Ela está totalmente incorporada na segunda
1 O artigo original de Einstein foi publicado em 1905, enquanto a discussão de Minkowski sobre a geometria do
espaço-tempo foi dada em 1908. Os artigos de Einstein e Minkowski são reimpressos (em tradução inglesa) em
The Principle of Relativity por A. Einstein, HA Lorentz, H. Minkowski e H. Weyl (Dover).
lei, que contém apenas acelerações, não velocidades em si. As leis de Newton são, de fato, todas
invariantes sob a substituição
v(t) ÿ v (t) = v(t) ÿ V,
onde V é qualquer velocidade constante . Esta equação diz que uma velocidade v(t) relativa a um
observador torna-se v (t) quando medida por um segundo observador cuja velocidade relativa ao primeiro
é V. Isso é chamado de lei galileana da adição de velocidades.
Ao dizer que as leis de Newton são invariantes sob a lei galileana da adição de velocidades, estamos
fazendo uma afirmação do tipo que muitas vezes faremos em nosso estudo da relatividade, então é bom
começar tornando-a muito precisa. A primeira lei de Newton, de que um corpo se move com velocidade
constante na ausência de forças externas, não é afetada pela substituição acima, pois se v(t) é realmente
uma constante, digamos v0, então a nova velocidade v0 ÿ V também é uma constante.
segunda lei de newton
F = ma = m dv/ dt,
também não é afetado, pois
a ÿ dv /d t = d(v ÿ V)/d t = dv/d t = a.
Portanto, a segunda lei será válida de acordo com as medidas de ambos os observadores, desde que
adicionemos à lei de transformação de Galileu a afirmação de que F e m são eles mesmos invariantes,
ou seja, os mesmos independentemente de qual dos dois observadores os mede.
A terceira lei de Newton, de que a força exercida por um corpo sobre outro é igual e oposta àquela
exercida pelo segundo sobre o primeiro, claramente não é afetada pela mudança de observadores,
novamente porque assumimos que as forças são invariantes.
Portanto, não há velocidade absoluta. Existe uma aceleração absoluta? Newton argumentou que
havia. Suponha, por exemplo, que eu esteja em um trem em um trilho perfeitamente liso,2 tomando uma
tigela de sopa no vagão-restaurante. Então, se o trem se move com velocidade constante, a sopa
permanece nivelada, não me oferecendo nenhuma informação sobre qual é a minha velocidade. Mas, se
o trem muda sua velocidade, então a sopa sobe por um lado da tigela, e posso dizer, olhando para ela,
quão grande e em que direção é a aceleração.3 Portanto, é razoável e útil destacar um classe de
observadores preferidos: aqueles que não são acelerados. Eles são chamados de observadores
inerciais, e cada um tem uma velocidade constante em relação a qualquer outro. Esses observadores
inerciais são fundamentais na relatividade especial, e quando usarmos o termo 'observador' de agora em
diante nos referiremos a um observador inercial.
O postulado da universalidade da velocidade da luz foi a grande e radical contribuição de Einstein para
a relatividade. Ele quebra a lei galileana da adição de velocidades porque diz que se v tem magnitude c,
então v também tem , independentemente de V. A primeira
experimento
evidência
de Michelson-Morely,
direta para este postulado
embora não
foi o
esteja claro se o próprio Einstein foi influenciado por ela. Todas as previsões contra-intuitivas da
relatividade especial fluem desse postulado e são amplamente confirmadas por experimentos. Na
verdade, é provavelmente justo dizer que a relatividade especial tem uma base experimental mais firme
do que qualquer outra
2
Os físicos freqüentemente têm que fazer tais idealizações, que muitas vezes estão muito distantes da experiência comum!
3
Para a discussão de Newton sobre esse ponto, veja o trecho de seu Principia em Williams (1968).
3 1.2 Definição de uma observação inercial em SR
nossas leis da física, uma vez que é testada todos os dias em todos os aceleradores de partículas gigantes,
que enviam partículas quase à velocidade da luz.
Embora o conceito de relatividade seja antigo, é costume referir-se à teoria de Einstein simplesmente como
“relatividade”. O adjetivo 'especial' é aplicado para distingui-la da teoria da gravitação de Einstein, que recebeu
o nome de 'relatividade geral' porque nos permite descrever a física do ponto de vista de observadores
acelerados e inerciais e é, nesse sentido, um forma mais geral de relatividade. Mas a verdadeira distinção física
entre essas duas teorias é que a relatividade especial (SR) é capaz de descrever a física apenas na ausência
de campos gravitacionais, enquanto a relatividade geral (GR) estende a SR para descrever a própria gravitação.
geração de físicos havia escolhido nomes mais apropriados para essas teorias!
1.2 D e fi ni ti onofaniner t al observador in SR
É importante perceber que um 'observador' é de fato um enorme sistema de coleta de informações, não apenas
um homem com binóculos. De fato, removeremos inteiramente o elemento humano de nossa definição e
diremos que um observador inercial é simplesmente um sistema de coordenadas para o espaço-tempo, que faz
uma observação simplesmente registrando a localização (x, y, z) e o tempo (t) de Qualquer evento. Este sistema
de coordenadas deve satisfazer as três propriedades a seguir para ser chamado de inercial:
(1) A distância entre o ponto P1 (coordenadas x1, y1, z1) e o ponto P2 (coordenadas
x2, y2, z2) é independente do tempo.
(2) Os relógios que ficam em cada ponto marcando a coordenada de tempo t são sincronizados e
todos correm na mesma velocidade.
(3) A geometria do espaço em qualquer tempo constante t é euclidiana.
Observe que esta definição não menciona se o observador acelera ou não.
Isso virá mais tarde. Acontece que apenas um observador não acelerado pode manter seus relógios
sincronizados. Mas preferimos começar com esta definição geométrica de um observador inercial. É uma
questão de experiência decidir se tal observador pode existir: não é auto-evidente que qualquer uma dessas
propriedades deva ser realizável, embora provavelmente esperaríamos que um universo 'bom' as permitisse!
No entanto, veremos mais adiante no curso que um campo gravitacional geralmente torna impossível construir
tal sistema de coordenadas, e é por isso que GR é necessário. Mas não vamos adiantar a história. No momento,
estamos assumindo que podemos construir tal sistema de coordenadas (que, se você quiser, os campos
gravitacionais ao nosso redor são tão fracos que realmente não importam). Podemos imaginar esse sistema de
coordenadas, de maneira bastante fantasiosa, como uma treliça de hastes rígidas preenchendo o espaço, com
um relógio em cada interseção das hastes. Algum sistema conveniente, como uma coleção de GPS
4
É fácil ver que os campos gravitacionais causam problemas para SR. Se um astronauta em órbita ao redor da Terra segura
uma tigela de sopa, a sopa sobe pela lateral da tigela em resposta à “força” gravitacional que mantém a espaçonave em
órbita? Dois astronautas em órbitas diferentes aceleram um em relação ao outro, mas nenhum deles sente uma aceleração.
Problemas como esse tornam a gravidade especial, e teremos que esperar até o Ch. 5 para resolvê-los.
Até então, a palavra 'força' se referirá a uma força não gravitacional.
satélites e receptores, é usado para garantir que todos os relógios estejam sincronizados. Os relógios
devem ser espaçados muito densamente, de modo que haja um relógio próximo a cada evento de
interesse, pronto para registrar sua hora de ocorrência sem qualquer atraso. Vamos agora definir como
usamos este sistema de coordenadas para fazer observações.
Uma observação feita pelo observador inercial é o ato de atribuir a qualquer evento as coordenadas x,
y, z do local de sua ocorrência e a hora lida pelo relógio em (x, y, z) quando o evento ocorreu. Não é a
hora t no relógio de pulso usado por um cientista localizado em (0, 0, 0) quando ele toma conhecimento do
evento. Uma observação visual é deste segundo tipo: o olho considera simultâneos todos os eventos que
vê ao mesmo tempo; um observador inercial considera simultâneos todos os eventos que ocorrem ao
mesmo tempo registrados pelo relógio mais próximo dele quando os eventos ocorreram. Essa distinção é
importante e deve ser lembrada. Às vezes, diremos 'um observador vê...', mas isso será apenas uma
abreviação de 'medidas'. Nunca nos referiremos a uma observação visual , a menos que o digamos
explicitamente.
Um observador inercial também é chamado de referencial inercial, que muitas vezes abreviamos para
'reference frame' ou simplesmente 'frame'.
1.3 Novas unidades
Como a velocidade da luz c é tão fundamental, adotaremos de agora em diante um novo sistema de
unidades de medida em que c tem simplesmente o valor 1! Não há problema em criaturas de movimento
lento, como engenheiros, se contentarem com as unidades do SI: m, s, kg. Mas parece bobagem em SR
usar unidades nas quais a constante fundamental c tem o valor ridículo de 3 × 108.
As unidades do SI evoluíram historicamente. Metros e segundos não são fundamentais; eles são
simplesmente convenientes para uso humano. O que faremos agora é adotar uma nova unidade de tempo, o metro.
Um metro de tempo é o tempo que a luz leva para percorrer um metro. (Você provavelmente está mais
familiarizado com uma abordagem alternativa: um ano de distância – chamado de 'ano-luz' – é a distância
que a luz percorre em um ano.) A velocidade da luz nessas unidades é:
distância que a luz viaja em qualquer intervalo de tempo

c=
dado o intervalo de tempo dado
1m
=
o tempo que a luz leva para percorrer um metro
1 m = 1,1 m
=
Então, se medirmos consistentemente o tempo em metros, então c não é apenas 1, é também uma dimensão
menor! Ao converter de unidades do SI para essas unidades 'naturais', podemos usar qualquer uma das
seguintes relações:
3 × 108 m sÿ1 = 1, 1 s
= 3 × 108 m,
1
1m= s.
3 × 108
5 1.4 Diagramas de espaço-tempo
As unidades do SI contêm muitas unidades 'derivadas', como joules e newtons, que são definidas em
termos das três unidades básicas: m, s, kg. Ao converter de s para m, essas unidades simplificam-se
consideravelmente: energia e momento são medidos em kg, aceleração em mÿ1, força em kg mÿ1,
etc. Faça os exercícios sobre isso. Com a prática, essas unidades parecerão tão naturais para você
quanto para a maioria dos físicos teóricos modernos.
1.4 Diagramas de espaço e tempo
Uma parte muito importante de aprender a abordagem geométrica do SR é dominar o diagrama de

espaço-tempo. No restante deste capítulo, derivaremos SR de seus postulados usando diagramas de
espaço-tempo, porque eles fornecem um guia muito poderoso para abrir caminho entre as muitas
armadilhas que SR apresenta ao iniciante. A Fig. 1.1 abaixo mostra uma fatia bidimensional do espaço-
tempo, o plano t ÿ x , no qual estão ilustrados os conceitos básicos.
Um único ponto neste espaço5 é um ponto de x fixo e t fixo , e é chamado de evento. Uma linha no
espaço dá uma relação x = x(t), e assim pode representar a posição de uma partícula em tempos
diferentes. Isso é chamado de linha do mundo da partícula . Sua inclinação está relacionada à sua
velocidade,
inclinação = dt/dx = 1/v.
Observe que um raio de luz (fóton) sempre viaja em uma linha de 45ÿ neste diagrama.
t
(m)
Linha do mundo de luz, v = 1
Linha mundial
acelerada Linha mundial de partículas movendo-se em
velocidade |v| < 1
Um evento
Linha mundial com velocidade v > 1
x (m)
Figura 1.1 Um diagrama de espaço-tempo em unidades naturais.
5
Usamos a palavra 'espaço' de uma forma mais geral do que você pode estar acostumado. Não nos referimos a um espaço
euclidiano no qual as distâncias euclidianas são necessariamente fisicamente significativas. Em vez disso, queremos dizer apenas
que é um conjunto de pontos que é contínuo (em vez de discreto, como uma rede). Este é o primeiro exemplo do que definiremos
no cap. 5 para ser um 'manifold'.
Adotaremos as seguintes convenções de notação:
(1) Os eventos serão indicados por letras maiúsculas cursivas, por exemplo, A, B,P. No entanto, a letra O é
reservado para denotar observadores.
(2) As coordenadas serão chamadas (t, x, y, z). Qualquer quádruplo de números como (5, ÿ3, 2, 1016) denota
um evento cujas coordenadas são t = 5, x = ÿ3, y = 2, z = 1016. Assim, sempre colocamos t primeiro.
Todas as coordenadas são medidas em metros.
(3) Muitas vezes é conveniente referir-se às coordenadas (t, x, y, z) como um todo, ou a cada uma
indiferentemente. É por isso que damos a eles os nomes alternativos (x0, x1, x2, x3). Esses sobrescritos
denota o 3
não são expoentes, mas apenas rótulos, chamados índices. Assim (x3) 2 quadrado da coordenada
(que é z), não o quadrado do cubo de x. Genericamente, as coordenadas x0, x1, x2 e x3 são chamadas
de xÿ. Um índice grego (por exemplo, ÿ, ÿ,ÿ, ÿ) será assumido para tomar um valor do conjunto (0, 1, 2,
3). Se ÿ não receber um valor, então xÿ é qualquer uma das quatro coordenadas.
(4) Há ocasiões em que queremos distinguir entre t por um lado e (x, y, z) por outro. Usamos índices latinos
para nos referirmos apenas às coordenadas espaciais.
Assim, um índice latino (por exemplo , a, b, i, j, k, l) assumirá um valor do conjunto (1, 2, 3). Se i não
recebe um valor, então xi é qualquer uma das três coordenadas espaciais. Nossas convenções sobre o
uso de índices gregos e latinos não são de forma alguma universalmente usadas pelos físicos. Alguns
livros os invertem, usando latim para {0, 1, 2, 3} e grego para {1, 2, 3}; outros usam a, b, c, ... para um
conjunto e i, j, k para o outro.
que Os alunos
estão devem sempre verificar as convenções utilizadas no trabalho
lendo.
1.5 Construção das coordenadas usadas por

outro observador
Como qualquer observador é simplesmente um sistema de coordenadas para o espaço-tempo, e como todos
os observadores observam os mesmos eventos (o mesmo espaço-tempo), deve ser possível desenhar as
linhas de coordenadas de um observador no diagrama de espaço-tempo desenhado por outro observador.
Para isso, temos que fazer uso dos postulados da RS.
Suponha que um observador O use as coordenadas t, x como acima, e que outro observador O¯, com
coordenadas ¯t , x¯, esteja se movendo com velocidade v na direção x em relação a O. Onde estão os eixos
de coordenadas para ¯t e x¯ ir no diagrama de espaço-tempo de O?
Eixo ¯t: Este é o lugar geométrico dos eventos na constante x¯ = 0 (e y¯ = ¯z = 0 também, mas vamos
ignorá-los aqui), que é o lugar geométrico da origem das coordenadas espaciais de O¯ . Esta é a linha do
mundo de O, e se parece com a mostrada na Fig. 1.2.
¯
eixo x : Para localizar isso, fazemos uma construção projetada para determinar o local dos eventos
em ¯t = 0, ou seja, aqueles que O¯ mede como simultâneos com o evento ¯t = ¯x = 0.
Considere a figura no diagrama de espaço-tempo de O, mostrado na Fig. 1.3. Todos os eventos no eixo
x¯ têm a seguinte propriedade: Um raio de luz emitido no evento E de x¯ = 0 em, digamos, tempo ¯t = ÿa
atingirá o eixo x¯ em x¯ = a (chamamos isso de evento P); se refletido, retornará ao ponto x¯ = 0 em ¯t = +a,
chamado evento R. O eixo x¯ pode ser definido, portanto, como o lugar geométrico de
7 1.5 Cons trução das coordenadas utilizadas por outro r obse rver
A tangente deste
ângulo é ÿ
Figura 1.2 O eixo do tempo de um referencial cuja velocidade é v.
t
uma
uma
x
-uma
Figura 1.3 Luz refletida em a, medida por O¯ .
eventos que refletem raios de luz de tal maneira que retornam ao eixo ¯t em +a se o deixaram em
-a, para qualquer a. Agora observe isso no diagrama de espaço-tempo de O, Fig. 1.4.
Sabemos onde está o eixo ¯t , pois o construímos na Fig. 1.2. Os eventos de emissão e
recepção, ¯t = ÿa e ¯t = +a, são mostrados na Fig. 1.4. Como a é arbitrário, não importa onde ao
longo do eixo ¯t negativo colocamos o evento E, então nenhuma suposição precisa ser feita sobre
a calibração do eixo ¯t em relação ao eixo t . Tudo o que importa para o
momento é que o evento R no eixo ¯t deve estar tão distante da origem quanto o evento E. Depois
de desenhá-los na Fig. 1.4, desenhamos em seguida o mesmo feixe de luz de antes, emitido de E,
e viajando em um 45 ÿ linha neste diagrama. O feixe de luz refletido deve chegar a R, então é a
linha de 45ÿ com inclinação negativa através de R. A interseção desses dois feixes de luz deve ser
o evento de reflexão P. Isso estabelece a localização de P em nosso dia
grama. A linha que a une com a origem – a linha tracejada – deve ser o eixo x:
t
t
uma
-uma
Figura 1.4 A reflexão na Fig. 1.3, medida O.
t t
t t
ÿ ÿ
x
ÿ
x x
ÿ
(uma) (b)
Figura 1.5 Diagramas de espaço-tempo de O (esquerda) e O¯ (direita).
não coincide com o eixo x . Se você comparar este diagrama com o anterior, verá porque:
em ambos os diagramas a luz se move em uma linha de 45ÿ , enquanto os eixos te ¯t mudam
a inclinação de um diagrama para o outro. Esta é a concretização do segundo postulado
fundamental de SR: que o feixe de luz em questão tem velocidade c = 1 (e, portanto,
inclinação = 1) em relação a cada observador. Quando aplicamos isso a essas construções
geométricas, descobrimos imediatamente que os eventos simultâneos a O¯ (a linha ¯t = 0,
seu eixo x ) não são simultâneos a O (não são paralelos à linha t = 0, o eixo x ). Essa falha
de simultaneidade é inevitável.
Os diagramas a seguir (Fig. 1.5) representam a mesma situação física. O da esquerda é o
diagrama de espaço-tempo O, no qual O' se move para a direita. O da direita é desenhado
do ponto de vista de O¯, no qual O se move para a esquerda. Os quatro ângulos são todos
iguais ao arco tan |v|, onde |v| é a velocidade relativa de O e O¯.
9 1.6 Invariância do intervalo
1.6 I nva r ança do interv al
É claro que ainda não terminamos a construção das coordenadas de O¯. Nós temos o
posição de seus eixos, mas não a escala de comprimento ao longo deles. Encontraremos essa escala provando
o que é provavelmente o teorema mais importante de SR, a invariância do intervalo.
Considere dois eventos na linha do mundo do mesmo feixe de luz, como E e P
na Fig. 1.4. As diferenças ( t, x, y, z) entre as coordenadas de E e P em
2 2 2 2
algum quadro O satisfaz a relação ( x) + ( s) + ( z) ÿ ( t) = 0, pois a velocidade
da luz é 1. Mas pela universalidade da velocidade da luz, as diferenças de coordenadas
entre os mesmos dois eventos nas coordenadas de O¯( ¯t , x¯, z¯) também satisfazem
y¯,
2 2 2 2
( x¯) + ( y¯) + ( = 0.z¯)Vamos
ÿ ( definir
¯t) o intervalo entre quaisquer dois eventos
(não necessariamente na mesma linha de mundo do feixe de luz) que são separados por coordenadas
incrementos ( t, x, y, z) para be6
2
2 2 2
segundos
= ÿ( t) + ( x) + ( s) + ( z) 2. (1.1)
Segue que se s2 = 0 para dois eventos usando suas coordenadas em O, então s¯ 2 = 0 para
os mesmos dois eventos usando suas coordenadas em O¯. O que isso implica sobre a relação
entre as coordenadas dos dois quadros? Para responder a esta pergunta, vamos supor que
a relação entre as coordenadas de O e O¯ é linear e que escolhemos suas origens
para coincidir (ou seja, que os eventos ¯t = ¯x = ¯y = ¯z = 0 e t = x = y = z = 0 são os mesmos).
Então, na expressão para s¯ 2,
2
2 2 2
segundos
= ÿ( ¯t) + ( x¯) + ( y¯) + ( z¯) 2,
os números ( ¯t, 2 o x¯, y¯, z¯) são combinações lineares de suas contrapartes não barradas,
significa que s¯ que
é uma função quadrática dos incrementos de coordenadas não barradas. Nós
pode, portanto, escrever
3 3
2
segundos
= (1.2)
Mÿÿ( xÿ)( xÿ)
ÿ=0 ÿ=0
para alguns números {Mÿÿ; ÿ, ÿ = 0, ... , 3}, que podem ser funções de v, a relativa
velocidade dos dois quadros. Observe que podemos supor que Mÿÿ = Mÿÿ para todos os ÿ e ÿ,
uma vez que apenas a soma Mÿÿ + Mÿÿ aparece na Eq. (1.2) quando ÿ = ÿ. Agora nós novamente
suponha que s2 = 0, de modo que da Eq. (1.1) temos
2 2
t = r, r = [( x) + ( s) + ( z) 2] 1/2.
6 O aluno para quem isso é novo provavelmente deve considerar a notação s2 como um símbolo único, não como o quadrado
de uma quantidade s. Como s2 pode ser positivo ou negativo, não é conveniente extrair sua raiz quadrada. Algum
os autores, entretanto, chamam s2 de 'intervalo quadrado', reservando o nome 'intervalo' para s = ÿ( s2). Observe também
que a notação s2 nunca significa (s2).
(Supomos t > 0 por conveniência.) Colocando isso na Eq. (1.2) dá

3
2 2 s¯
= M00( r) + 2 M0i xi r
i=1
3 3
+ Mij xi xj . (1.3)
i=1 j=1
2 deve desaparecer se s2 o fizer, e isso deve ser verdade para

Mas já observamos que s¯ arbitrário { xi
, i = 1, 2, 3}. É fácil mostrar (ver Exer. 8, § 1.14) que isso implica
M0i = 0i = 1, 2, 3 (1.4a)
Mij = ÿ(M00)ÿij (i, j = 1, 2, 3), (1.4b)
onde ÿij é o delta de Kronecker, definido por
1 se i = j,
ÿij = (1.4c)
0 se i = j.
A partir disso e da Eq. (1.2) concluímos que

2
2 2 2
segundos
= M00[( t) ÿ ( x) ÿ ( y) ÿ ( z) 2].
Se definirmos uma função
ÿ(v) = ÿM00,
então provamos o seguinte teorema: A universalidade da velocidade da luz implica que os intervalos
s2 e s¯2 satisfazem a relação entre quaisquer dois eventos calculados por diferentes observadores
segundos
2. = ÿ(v) s (1,5)
Vamos agora mostrar que, de fato, ÿ(v) = 1, que é a afirmação de que o intervalo é independente
do observador. A prova disso tem duas partes. A primeira parte mostra que ÿ(v) depende apenas de |
v|. Considere uma haste que está orientada perpendicularmente à velocidade v de O em relação a O.
Suponha que a haste esteja em repouso em O, sobre o eixo y . No diagrama de espaço-tempo de O
(Fig. 1.6), as linhas do mundo de suas extremidades são desenhadas e a região entre eles sombreada.
É fácil ver que o quadrado de seu comprimento é apenas o intervalo entre os dois eventos A e B que
são simultâneos em O (em t = 0) e ocorrem nas extremidades da haste. Isso porque, para esses
eventos, ( x)AB = ( z)AB = ( t)AB = 0. Agora vem o ponto chave da primeira parte da prova: os eventos
A e B são simultâneos medidos por O¯ também. A razão é mais facilmente vista pela construção
mostrada na Fig. 1.7, que é o mesmo diagrama de espaço-tempo da Fig. 1.6, mas no qual a linha do
mundo de um relógio em O é desenhada. Essa linha é perpendicular ao eixo y e paralela ao plano t ÿ
x , ou seja, paralela ao eixo ¯t mostrado na Fig. 1.5(a).
Suponha que este relógio emita raios de luz no evento P que atinge os eventos A e B. (Nem todo
relógio pode fazer isso, então escolhemos um relógio em O que passa pelo eixo y
Linhas mundiais das extremidades da haste t
Figura 1.6 Uma barra em repouso em O, sobre o eixo y.
Marcar ponto
Figura 1.7 Um relógio do quadro de O ', movendo -se na direção x no quadro de O.
em t = 0 e pode enviar tais raios de luz.) Os raios de luz refletem de A e B, e podemos ver
pela geometria (se você permitir a perspectiva no diagrama) que eles chegam de volta a
O¯'s relógio no mesmo evento L. Portanto, do ponto de vista de O, os dois eventos ocorrem
ao mesmo tempo. (Esta é a mesma construção que usamos para determinar o eixo x.) Mas
se A e B são simultâneos em O¯, então o intervalo entre eles em O¯ também é o quadrado
de seu comprimento em O¯. O resultado é:
2
(comprimento da haste em O¯) = ÿ(v)(comprimento da haste em O) 2.
Por outro lado, o comprimento da haste não pode depender da direção da velocidade,
porque a haste é perpendicular a ela e não há direções de movimento preferidas (o princípio
da relatividade). Portanto, a primeira parte da prova conclui que
ÿ(v) = ÿ(|v|). (1.6)

O segundo passo da prova é mais fácil. Ele usa o princípio da relatividade para mostrar que
ÿ(|v|) = 1. Considere três quadros, O, O¯, e O. O quadro O¯ move-se com velocidade v em, digamos, o
direção x em relação a O. O quadro O se move com velocidade v na direção x negativa em relação
também. É claro que O é de fato idêntico a O, mas por uma questão de clareza vamos manter
notação separada para o momento. Temos, a partir das Eqs. (1.5) e (1.6),
2
2
s2
= ÿ(v) s¯
s¯
2ÿs = [ÿ(v)]2 s 2.
= ÿ(v) s2
2
Mas como O e O são idênticos, s e s2 são iguais. Segue que
ÿ(v) = ±1.
Devemos escolher o sinal de mais, pois na primeira parte desta prova o quadrado do comprimento
de uma haste deve ser positivo. Provamos, portanto, o teorema fundamental de que o
intervalo entre quaisquer dois eventos é o mesmo quando calculado por qualquer observador inercial:
=s 2.
2
segundos
(1.7)
Observe que da primeira parte desta prova também podemos concluir agora que o comprimento de um
haste orientada perpendicularmente à velocidade relativa de dois pórticos é a mesma quando medida
por qualquer quadro. Também vale a pena reiterar que a construção na Fig. 1.7 provou uma relação
resultado, que dois eventos que são simultâneos em um quadro são simultâneos em qualquer quadro
movendo-se em uma direção perpendicular à sua separação em relação ao primeiro quadro.
Como s2 é uma propriedade apenas dos dois eventos e não do observador, pode ser usado
classificar a relação entre os eventos. Se s2 for positivo (de modo que os incrementos espaciais
dominam t), os eventos são ditos como separados no espaço. Se s2 for negativo, os eventos
são ditas como separadas no tempo. Se s2 é zero (portanto, os eventos estão no mesmo caminho da luz),
os eventos são ditos como lightlike ou null separados.
Figura 1.8 O cone de luz de um evento. A dimensão z é suprimida.

Os eventos que são semelhantes à luz separados de qualquer evento particular A, encontram-se em um cone cuja
vértice é A. Este cone é ilustrado na Fig. 1.8. Isso é chamado de cone de luz de A. Todos os eventos
dentro do cone de luz estão separados de A; todos os eventos fora dele são semelhantes ao espaço
separados. Portanto, todos os eventos dentro do cone podem ser alcançados de A em uma linha de mundo
que em todos os lugares se move em uma direção temporal. Como veremos mais tarde que nada
pode se mover mais rápido que a luz, todas as linhas do mundo de objetos físicos se movem em uma direção
temporal. Portanto, eventos dentro do cone de luz são alcançáveis de A por um objeto físico,
enquanto os de fora não são. Por esta razão, os eventos dentro do 'futuro' ou 'adiante'
cone de luz às vezes é chamado de futuro absoluto do ápice; aqueles dentro do 'passado' ou
cones de luz 'atrasados' são chamados de passado absoluto; e os de fora são chamados de absolutos em outros
lugares. Os eventos no cone são, portanto, a fronteira do passado absoluto
Galileu: t
Futuro do evento
'Para agora
evento
Passado do evento
Futuro
Einstein:
t
do
'Em outro lugar'
'Em outro lugar'
do
do
'Agora' é apenas
em si Passado de
Comum
Dois eventos: t futuro
Futuro
do
Futuro
do
Passado de
x
Passado de
Passado comum
Figura 1.9 Velhos e novos conceitos de espaço-tempo

e futuro. Assim, embora 'tempo' e 'espaço' possam, em certo sentido, ser transformados um no outro
na RS, é importante perceber que ainda podemos falar de 'futuro' e 'passado' de maneira invariável.
Para Galileu e Newton, o passado era tudo "antes" do que agora; todo o espaço-tempo era a união do
passado e do futuro, cuja fronteira era o "agora". Em SR, o passado é apenas tudo dentro do cone de
luz passado, e o espaço-tempo tem três divisões invariantes: SR acrescenta a noção de 'outro lugar'.
Além disso, embora todos os observadores concordem sobre o que constitui o passado, o futuro e
outros lugares de um determinado evento (porque o intervalo é invariante), cada evento diferente tem
um passado e um futuro diferentes; dois eventos não têm passados e futuros idênticos, mesmo que
possam se sobrepor. Essas idéias são ilustradas na Fig. 1.9.
1.7 I nva ri anthyperb ol ae
Podemos agora calibrar os eixos das coordenadas de O¯ no diagrama de espaço-tempo de O, Fig. 1.5.
Restringimo-nos ao plano t ÿ x . Considere uma curva com a equação
2 -t + x2 = a2,
onde a é uma constante real. Esta é uma hipérbole no diagrama de espaço-tempo de O, e passa por
todos os eventos cujo intervalo desde a origem é a2. Pela invariância do intervalo, esses mesmos
eventos têm intervalo a2 a partir da origem em O¯, então eles também estão na curva ÿ¯t 2 + ¯x2 = a2.
Esta é uma hipérbole espacial separada da origem. De forma similar,
os eventos na curva
2 -t + x2 = ÿb2
todos têm intervalo de tempo ÿb2 a partir da origem, e também estão na curva ÿ¯t 2 + ¯x2 = ÿb2.
Essas hipérboles são desenhadas na Fig. 1.10. Eles são todos assintóticos às linhas com inclinação
±1, que são, obviamente, os caminhos da luz através da origem. Em um diagrama tridimensional (no
qual adicionamos o eixo y , como na Fig. 1.8), as hipérboles de revolução seriam assintóticas ao cone
de luz.
Podemos agora calibrar os eixos de O¯. Na Fig. 1.11 , os eixos de O e O¯ são desenhados,
juntamente com uma hipérbole invariante de intervalo temporal ÿ1 a partir da origem. O evento A está
no eixo t , então x = 0. Como a hipérbole tem a equação
2 -t + x2 = ÿ1,
segue-se que o evento A tem t = 1. Da mesma forma, o evento B está no eixo ¯t , então tem x¯ = 0.
Como a hipérbole também tem a equação
2 ÿ¯t + ¯x2 = ÿ1,
segue-se que o evento B tem ¯t = 1. Usamos, portanto, a hipérbole para calibrar o eixo ¯t . Da mesma
forma, a hipérbole invariante
2 -t + x2 = 4
15 1.7 Inva rian t hype rbolae
-uma uma x
–b
Figura 1.10 Hipérbole invariável, para a > b.
x
1
2 x
¯
Figura 1.11 Usando as hipérboles através dos eventos A e E para calibrar os eixos x¯ e t .
mostra que o evento E tem coordenadas t = 0, x = 2 e que o evento F tem coordenadas ¯t = 0, x¯ =

2. Este tipo de hipérbole calibra os eixos espaciais de O¯.
Observe que o evento B parece estar 'mais distante' da origem do que A. Isso novamente mostra
a inadequação de usar a intuição geométrica baseada na geometria euclidiana. Aqui + ( x) 2, não a
a quantidade física importante é o intervalo ÿ( t) 2 distância euclidiana + ( x) 2. O estudante
( t) 2 da relatividade tem que aprender a usar s2 como a medida física de
'distância' no espaço-tempo, e ele tem que adaptar sua intuição de acordo. Isso não está, é claro,
em conflito com a experiência cotidiana. A experiência cotidiana afirma que o 'espaço' (por exemplo, o
seção do espaço-tempo com t = 0) é euclidiana. Para eventos que têm t = 0 (simultâneo ao

observador O), o intervalo é
2
2 2
segundos
= ( x) + ( s) + ( z) 2.
Esta é apenas a sua distância euclidiana. A nova característica do SR é que o tempo pode (e
deve) ser trazido para o cálculo da distância. Não é possível definir 'espaço' de forma única,
pois diferentes observadores identificam diferentes conjuntos de eventos como simultâneos
(Fig. 1.5). Mas ainda há uma distinção entre espaço e tempo, pois os incrementos temporais
entram em s2 com o sinal oposto dos espaciais.
(uma)
t
t
(b)
Figura 1.12 (a) Uma linha de simultaneidade em O é tangente à hipérbole em P. (b) A mesma tangência vista
por O' .
17 1.8 Resultados particularmente importantes
A fim de usar a hipérbole para derivar os efeitos da dilatação do tempo e da contração de Lorentz, como
faremos na próxima seção, devemos apontar uma propriedade simples, mas importante da
tangente à hipérbole.
Na Fig. 1.12(a) desenhamos uma hipérbole e sua tangente em x = 0, que é obviamente
uma linha de simultaneidade t = const. Na Fig. 1.12(b) desenhamos as mesmas curvas do
ponto de vista do observador O que se move para a esquerda em relação a O. O evento P foi
deslocado para a direita: pode ser deslocado para qualquer lugar na hipérbole, escolhendo o Lorentz
transformação corretamente. A lição da Fig. 1.12(b) é que a tangente a uma hipérbole em qualquer
o evento P é uma linha de simultaneidade do quadro de Lorentz cujo eixo do tempo une P à origem.
Se este referencial tem velocidade v, a tangente tem inclinação v.
1.8 P r tí c ul a r l y importantes
Dilatação do tempo
Da Fig. 1.11 e do cálculo que a segue, deduzimos que quando um relógio se move no
¯t eixo atinge B tem uma leitura de ¯t = 1, mas esse evento B tem coordenada t = 1/ ÿ(1 ÿ v2)
em O. Então, para O, parece correr lentamente:
( ¯t ) medido em O¯
( t) medido em O = . (1,8)
ÿ(1 ÿ v2)
Observe que ¯t é o tempo realmente medido por um único relógio, que se move em um mundo
linha da origem até B, enquanto t é a diferença nas leituras de dois relógios em repouso
eu não; um em uma linha de mundo através da origem e um em uma linha de mundo através de B.
voltar a esta observação mais tarde. Por enquanto, definimos o tempo adequado entre os eventos B e
a origem para ser o tempo marcado por um relógio que realmente passa por ambos os eventos. Isto
é uma quantidade diretamente mensurável e está intimamente relacionada ao intervalo. Deixe o relógio ser
em repouso no referencial O¯, de modo que o tempo próprio ÿ é o mesmo que o tempo coordenado ¯t. Então,
como o relógio está em repouso em O¯, temos x¯ = y¯ = z¯ = 0, então
2 2 = ÿ ¯t
s = ÿ ÿ 2. (1.9)
O tempo adequado é apenas a raiz quadrada do negativo do intervalo. Ao expressar a

intervalo em termos de coordenadas de O temos
2 2 2
ÿ = [( t) ÿ ( x) ÿ ( y) ÿ ( z) 2] 1/2
= t ÿ(1 ÿ v2). (1.10)
Esta é a dilatação do tempo novamente.

t
t
Figura 1.13 O comprimento adequado de AC é o comprimento da haste em sua estrutura de repouso, enquanto o de AB é seu comprimento
em O.
Contração de Lorentz
Na Fig. 1.13 mostramos a trajetória mundial de uma barra em repouso em O¯. Seu comprimento em O é a raiz
quadrada de s2 AC,enquanto seu comprimento em O é a raiz quadrada de s2 Se o evento C tem coordenadas
AB.
¯t = 0, x¯ = l, então pelo cálculo idêntico de antes de ter a coordenada x em O
xC = l/ ÿ(1 ÿ v2),
e como o eixo x é a linha t = vx, temos
tC = vl/ ÿ(1 ÿ v2).
A linha BC tem inclinação (em relação ao eixo t)
x/ t = v,
e assim temos
xC ÿ xB
= v,
tC - tB
e queremos saber xB quando tB = 0. Assim,
xB = xC ÿ vtC
eu v2l
= ÿ
= l ÿ(1 ÿ v2). ÿ(1 ÿ v2) (1.11)

ÿ(1 ÿ v2)
Esta é a contração de Lorentz.
Convenções
O intervalo s2 é um dos conceitos matemáticos mais importantes de SR, mas não há um acordo
2 2
universal sobre sua definição: muitos autores definem s2 = ( t) ÿ ( x)
ÿ
19 1.8 Resultados particularmente importantes
2
( y) aosÿquais
( z) 2.nos
Esse
referimos
sinal geral
anteriormente),
é uma questão
poisdea convenção
invariância (como
de s2 implica
o uso dos
a invariância
índices latino
de ÿes2.
grego
O
resultado físico de importância é justamente essa invariância, que surge da diferença em + ( z) 2]
partes. Assim como em outras convenções,
sinal entre o ( t) os alunos2 e [( x) 2 + ( s) 2
devem garantir que sabem qual sinal está sendo usado: afeta todos os tipos de fórmulas, por
exemplo, a Eq. (1.9).
Falha da relatividade?
Os recém-chegados à RS, e outros que não a entendem bem o suficiente, muitas vezes se
preocupam neste ponto com a inconsistência da teoria. Começamos assumindo o princípio da
relatividade, que afirma que todos os observadores são equivalentes. Agora mostramos que se O¯
se move em relação a O, os relógios de O¯ serão medidos por O como sendo mais lentos do que os
de O. Então, não é o caso de O¯ medir os relógios de O como sendo correndo mais rápido que o
seu? Se for assim, isso viola o princípio da relatividade, já que poderíamos facilmente começar com
O e deduzir que os relógios de O andam mais devagar que os de O.
Isso é o que se chama de 'paradoxo', mas como todos os 'paradoxos' em SR, isso vem de não
ter raciocinado corretamente. Vamos agora demonstrar, usando diagramas de espaço-tempo, que
O¯ mede os relógios de O para estarem mais lentos. Claramente, poderíamos simplesmente
desenhar o diagrama de espaço-tempo do ponto de vista de O, e o resultado seguiria. Mas é mais
instrutivo permanecer no diagrama de espaço-tempo de O.
Diferentes observadores concordarão com o resultado de certos tipos de experimentos. Por
exemplo, se A jogar uma moeda, todos os observadores concordarão com o resultado. Da mesma
forma, se dois relógios estiverem próximos um do outro, todos os observadores concordarão em
qual está lendo um horário mais cedo do que o outro. Mas a questão da velocidade com que os
relógios funcionam só pode ser resolvida comparando os mesmos dois relógios em duas ocasiões
diferentes, e se os relógios estão se movendo um em relação ao outro, então eles podem estar
próximos um do outro em apenas uma dessas ocasiões. . Em outra ocasião, eles devem ser
comparados a alguma distância, e diferentes observadores podem tirar conclusões diferentes. A
razão para isso é que eles realmente realizam experimentos diferentes e inequivalentes. Na análise
a seguir, veremos que cada observador utiliza dois relógios próprios e um relógio do outro. Essa
assimetria no 'design' do experimento dá o resultado assimétrico.
Vamos analisar primeiro a medida de O, na Fig. 1.14. Isso consiste em comparar a leitura de um
único relógio de O¯ (que viaja de A a B) com dois relógios próprios: o primeiro é o relógio na origem,
que lê o relógio de O¯ no evento A; e o segundo é o relógio que está em F em t = 0 e coincide com
o relógio de O em B. Este segundo relógio de O move-se paralelamente ao primeiro, na linha
tracejada vertical. O que O diz é que ambos os relógios em A lêem t = 0, enquanto em B o relógio
de O¯ lê ¯t = 1, enquanto o de O lê um tempo posterior, t = (1 ÿ v2) ÿ1/2. Claramente, O' concorda
com isso, pois ele é tão capaz de olhar para os mostradores do relógio quanto O é. Mas para O
afirmar que o relógio de O está andando devagar, ele deve ter certeza de que seus dois relógios
estão sincronizados, caso contrário não há nenhum significado particular em observar que em B o
relógio de O está atrasado em relação ao de O. Agora, do ponto de vista de O, sua
t
t
Figura 1.14 O comprimento adequado de AB é o tempo que um relógio em , enquanto o de AC é o tempo em que
repouso em O leva para fazê-lo, medido por O.
os relógios são sincronizados, e a medição e sua conclusão são válidas. Na verdade, são as únicas
conclusões que ele pode tirar corretamente.
Mas O' não precisa aceitá-los, porque para ele os relógios de O não estão sincronizados. A linha
pontilhada que passa por B é o locus dos eventos que O¯ considera simultâneos a B. O evento E
está nesta linha e é o tique-taque do primeiro relógio de O, que O¯ mede como simultâneo ao evento B.
Um cálculo simples mostra que isso é em t = (1 ÿ v2) 1/2, antes do outro relógio de O em B, que está
lendo (1 ÿ v2) ÿ1/2. Portanto, O¯ pode rejeitar a medição de O, pois os relógios envolvidos não estão
sincronizados. Além disso, se O¯ estuda o primeiro relógio de O, ele conclui que ele passa de t = 0 a
t = (1 ÿ v2) 1/2 (ou seja, de A a B) no tempo que seu próprio relógio leva para tiquetaquear de ¯t = 0
a ¯t = 1 (ou seja, de A a B). Assim, ele considera os relógios de O mais lentos do que os seus.
Segue-se que o princípio da relatividade não é contrariado: cada observador mede o relógio do
outro como lento. A razão pela qual eles parecem discordar é que eles medem coisas diferentes. O
observador O compara o intervalo de A a B com o de A a C. O outro observador compara o de A a B
com o de A a E. Todos os observadores concordam com os valores dos intervalos envolvidos. O que
eles discordam é qual par usar para decidir sobre a taxa na qual um relógio está funcionando. Esse
desacordo surge diretamente do fato de os observadores não concordarem sobre quais eventos são
simultâneos. E, para reiterar um ponto que precisa ser entendido, a simultaneidade (sincronização
do relógio) está no centro das comparações de relógio: O usa dois de seus relógios para 'tempo' a
taxa de um relógio de O, enquanto O¯ usa dois de seus próprios relógios para cronometrar um relógio
de O.
Essa divergência é preocupante? Não deveria ser, mas deveria deixar o aluno muito cauteloso. O
fato de diferentes observadores discordarem sobre as taxas de clock ou simultaneidade significa
apenas que tais conceitos não são invariantes: eles são dependentes de coordenadas. Isso não
impede que um determinado observador use tais conceitos de forma consistente. Por exemplo, O
pode dizer que A e F são simultâneos, e ele está correto no sentido de que eles têm o mesmo valor
da coordenada t. Para ele, isso é uma coisa útil de se saber, pois ajuda a localizar os eventos no espaço-tempo.
21 1.9 A tran stação de Lo ren tz
Qualquer observador isolado pode fazer observações consistentes usando conceitos que são válidos
para ele, mas que podem não ser transferidos para outros observadores. Todos os chamados paradoxos
da relatividade envolvem, não a inconsistência das deduções de um único observador, mas a
inconsistência de supor que certos conceitos são independentes do observador quando na verdade são
muito dependentes do observador.
Mais dois pontos devem ser feitos antes de nos voltarmos para o cálculo da transformação de
Lorentz. A primeira é que não tivemos que definir um 'relógio', então nossas afirmações se aplicam a
qualquer bom relógio: relógios atômicos, relógios de pulso, ritmo circadiano ou a meia-vida do decaimento
de uma partícula elementar. Verdadeiramente, todo o tempo é 'retardado' por esses efeitos. Dito de
forma mais adequada, como a dilatação do tempo é uma consequência da falha da simultaneidade, ela
não tem nada a ver com a construção física do relógio e certamente não é perceptível a um observador
que olha apenas para seus próprios relógios. O observador O vê todos os seus relógios funcionando no
mesmo ritmo uns dos outros e como sua consciência psicológica do tempo, então todos esses processos
são mais lentos medidos por O. Isso leva ao "paradoxo" gêmeo, que discutiremos mais adiante.
O segundo ponto é que esses efeitos não são ilusões de ótica, pois nossos observadores exercem
o máximo de cuidado possível na realização de seus experimentos. Os alunos iniciantes geralmente se
convencem de que o problema surge na velocidade finita de transmissão dos sinais, mas isso é incorreto.
Os observadores definem 'agora' como descrito em § 1.5 para o observador O¯, e esta é a maneira mais
razoável de fazê-lo. O problema é que dois observadores diferentes definem 'agora' da maneira mais
razoável, mas não concordam. Esta é uma consequência inevitável da universalidade da velocidade da
luz.
1.9 A transformação de L orentz
Vamos agora tornar nosso raciocínio menos dependente da lógica geométrica estudando a álgebra de
SR: a transformação de Lorentz, que expressa as coordenadas de O em termos das de O. Sem perder
a generalidade, orientamos nossos eixos de modo que O¯ se mova com velocidade v no eixo x positivo
em relação a O. Sabemos que os comprimentos perpendiculares ao eixo x são os mesmos quando
medidos por O ou O¯. A transformação linear mais geral que precisamos considerar, então, é
¯t = ÿt + ÿx y¯ = y,
x¯ = ÿ t + ÿx z¯ = z,
onde ÿ, ÿ, ÿ e ÿ dependem apenas de v.

De nossa construção em § 1.5 (Fig. 1.4) fica claro que os eixos ¯t e x¯ têm as equações:
Eixo ¯t (x¯ = 0): vt ÿ x = 0, eixo
x¯ (¯t = 0): vx ÿ t = 0.
As equações dos eixos implicam, respectivamente:
ÿ /ÿ = ÿv, ÿ/ÿ = ÿv,

que dá a transformação
¯t = ÿ(t ÿ vx),
x¯ = ÿ(x ÿ vt).
A Fig. 1.4 nos dá outra informação: os eventos (¯t = 0, x¯ = a) e ( ¯t = a, x¯ = 0) são conectados por
um raio de luz. Isso pode ser facilmente mostrado para implicar que ÿ = ÿ. Portanto, temos,
apenas da geometria:
¯t = ÿ(t ÿ vx), x¯
= ÿ(x ÿ vt).
Agora usamos a invariância do intervalo:
2 2 2
ÿ( ¯t) + ( x¯) = ÿ( t) + ( x) 2.
Isso dá, depois de alguma álgebra direta,
ÿ = ±1/ ÿ(1 ÿ v2).
Devemos selecionar o sinal + para que quando v = 0 obtenhamos uma identidade em vez de uma
inversão das coordenadas. A transformação completa de Lorentz é, portanto,
t vx
¯t = ÿ
,
ÿ(1 ÿ v2) ÿ(1 ÿ v2)
ÿvt x
x¯ = + ,
ÿ(1 ÿ v2) ÿ(1 ÿ v2) (1.12)
y¯ = y,
z¯ = z.
Isso é chamado de aumento da velocidade v na direção x .

Isso fornece a forma mais simples da relação entre as coordenadas de O¯ e O. Para que esta
forma seja aplicada, as coordenadas espaciais devem ser orientadas de uma maneira particular: O¯
deve se mover com velocidade v na direção x positiva como visto por O , e os eixos de O¯ devem
ser paralelos aos correspondentes em O. Rotações espaciais dos eixos em relação um ao outro
produzem conjuntos de equações mais complicados do que a Eq. (1.12), mas seremos capazes de
fugir com a Eq. (1.12).
1.10 T hev el o ty - lei de composição
A transformação de Lorentz contém todas as informações que precisamos para derivar o padrão
fórmulas, como as de dilatação do tempo e contração de Lorentz. Como exemplo de seu uso,
generalizaremos a lei galileana da adição de velocidades (§ 1.1).
23 1.11 Para radoxos e intuição física
Suponha que uma partícula tenha velocidade W na direção x¯ de O¯, ou seja, x¯/ ¯t = W. Em
outro referencial O, sua velocidade será W = x/ t, e podemos deduzir x e t da transformação de
Lorentz . Se O se move com velocidade v em relação a O, então a Eq. (1.12) implica
x = ( x¯ + v ¯t )/(1 ÿ v2) 1/2
t = ( ¯t + v x¯)/(1 ÿ v2) 1/2.
Então nós temos
x
W= = ( x¯ + v ¯t )/(1 ÿ v2) 1/2 ( ¯t
t + v x¯)/(1 ÿ v2)1/2 x¯/ ¯t + v
W+v
= = . (1.13)
1 + v x¯/ ¯t 1 + Wv
Esta é a lei de Einstein da composição de velocidades. O ponto importante é que |W | nunca

excede 1 se |W| e |v| ambos são menores que um. Para ver isso, defina W = 1. Então a Eq.
(1.13) implica
(1 ÿ v)(1 ÿ W) = 0,
ou seja, v ou W também devem ser iguais a 1. Portanto, duas velocidades 'subluminais' produzem
outra subluminal. Além disso, se W = 1, então W = 1 independentemente de v: esta é a
universalidade da velocidade da luz. Além disso, se |W| 1 e |v| 1, então, de primeira
(1.13) dáordem, a Eq.
W = W + v.
Esta é a lei galileana da adição de velocidade, que sabemos ser válida para pequenas velocidades.
Isso era verdade para nossas fórmulas anteriores no § 1.8: as 'correções' relativísticas para as expressões
galileanas são de ordem v2 e, portanto, são desprezíveis para v pequeno.
1.11 Int ui ç ã o fi sí ca p rado xe
As introduções elementares à RS muitas vezes tentam ilustrar as diferenças físicas entre a

relatividade galileana e a RS apresentando certos problemas chamados 'paradoxos'. Os mais
comuns incluem o 'paradoxo dos gêmeos', o 'paradoxo da vara no celeiro' e o 'paradoxo da
guerra espacial'. A ideia é colocar esses problemas em uma linguagem que faz com que as
previsões da RS pareçam inconsistentes ou paradoxais, e então resolvê-los mostrando que uma
aplicação cuidadosa dos princípios fundamentais da RS não leva a nenhuma inconsistência: os
paradoxos são aparentes, não reais , e resultam invariavelmente da mistura de conceitos galileus com os m
Infelizmente, o aluno descuidado (ou o aluno atento de um professor descuidado) muitas vezes
sai com a ideia de que SR de fato leva a paradoxos. Isso é pura bobagem.
Os alunos devem perceber que todos os 'paradoxos' são realmente problemas matematicamente mal
colocados, que SR é uma imagem perfeitamente consistente do espaço-tempo, que foi verificada
experimentalmente inúmeras vezes em situações em que os efeitos gravitacionais podem ser negligenciados, e que SR
'Sua velocidade máxima é 186 mph – que é 1/3 600 000 da velocidade da luz.'
Figura 1.15 A velocidade da luz está bem longe de nossa experiência usual! (Com a gentil permissão de S. Harris.)
forma a estrutura na qual todo físico moderno deve construir suas teorias. (Para o estudante que
realmente quer estudar um paradoxo em profundidade, veja 'O paradoxo' dissecado' neste
capítulo.)
Psicologicamente, a razão pela qual os recém-chegados à RS têm problemas e talvez dêem
aos 'paradoxos' mais peso do que merecem é que temos tão pouca experiência direta com
velocidades comparáveis à da luz (ver Fig. 1.15). O único remédio é resolver problemas em SR
e estudar cuidadosamente suas previsões 'contra-intuitivas'. Um dos melhores métodos para
desenvolver uma intuição moderna é estar completamente familiarizado com a imagem
geométrica do SR: o espaço de Minkowski, o efeito das transformações de Lorentz nos eixos e
as "imagens" de coisas como dilatação do tempo e contração de Lorentz. Esta imagem
geométrica deve estar no fundo de sua mente à medida que passamos a estudar cálculo vetorial
e tensorial; vamos trazê-lo para a frente novamente quando estudarmos GR.
1.12 P ra l a d o
Há muitas boas introduções à RS, mas uma muito legível que orientou nosso próprio tratamento
e é muito mais detalhada é Taylor e Wheeler (1966). Outro tratamento elementar amplamente
admirado é Mermin (1989). Outro clássico é o francês (1968). Para tratamentos que analisam
mais cuidadosamente os fundamentos da teoria, consulte Arzeliès (1966), Bohm (2008), Dixon
(1978) ou Geroch (1978). Paradoxos são discutidos
25 1.13 Apêndice: O 'para radox' gêmeo dissecado
em alguns detalhes por Arzeliès (1966), Marder (1971) e Terletskii (1968). Para uma biografia científica de Einstein,
ver Pais (1982).
Nosso interesse em SR neste texto é principalmente porque é um caso especial simples de GR no qual é
possível desenvolver a matemática que precisaremos mais tarde. Mas a RS é em si a base de todas as outras
teorias fundamentais da física, como o eletromagnetismo e a teoria quântica, e como tal recompensa muito mais
estudo do que lhe daremos.
Veja as discussões clássicas em Synge (1965), Schrödinger (1950) e Møller (1972), e tratamentos mais modernos
em Rindler (1991), Schwarz e Schwarz (2004) e Woodhouse (2003).
Os artigos originais sobre RS podem ser encontrados em Kilmister (1970).
' '
1.13 Anexo: O gêmeo paradoxo dissecado
O problema
Diana deixa sua gêmea Artemis para trás na Terra e viaja em seu foguete por 2,2 × 108 s (ÿ 7 anos) de seu tempo
a 24/25 = 0,96 da velocidade da luz. Ela então instantaneamente inverte sua direção (desafiando sem medo
aqueles gs) e retorna à Terra da mesma maneira. Quem é mais velho no reencontro dos gêmeos? Um diagrama
de espaço-tempo pode ser muito útil.
Breve solução
Consulte a Fig. 1.16 na próxima página. Diana viaja pela linha PB. Em seu quadro, o evento A de Artemis é
simultâneo ao evento B, então Artemis está realmente envelhecendo lentamente. Mas, assim que Diana se vira,
ela muda os referenciais inerciais: agora ela considera B simultâneo ao evento C de Artemis! Efetivamente, Diana
vê Artemis envelhecer incrivelmente rápido por um momento. Este jorro mais do que compensa a lentidão que
Diana observou o tempo todo.
Numericamente, Artemis envelhece 50 anos para os 14 de Diana.
Discussão mais completa
Para os leitores que estão insatisfeitos com a afirmação 'Diana vê Artemis envelhecer incrivelmente rápido por um
momento', ou que se perguntam que física está por trás de tal afirmação, discutiremos isso com mais detalhes,
tendo em mente que a afirmação 'Diana vê' realmente significa 'Diana observa', usando as hastes, relógios e banco
de dados que todo bom observador relativista possui.
Diana pode fazer suas medições da seguinte maneira. Decolando da Terra, ela salta para um referencial inercial
chamado O ¯ se afastando da Terra em v = 0,96. Assim que ela se acomoda nesse novo quadro, ela ordena que
todos os relógios sejam sincronizados com o dela, que lê ¯t = 0 ao deixar a Terra. Ela ainda coloca um estudante
de pós-graduação em cada um de seus
Reunião
50 anos
A segunda linha de simultaneidade de Diana
O segundo eixo do tempo de Diana
tempo
Eixo
do
25 anos Reversão (Diana altera os quadros de referência)
A primeira linha de simultaneidade de Diana

Artemis'
O primeiro eixo do tempo de Diana
Partida Linha de simultaneidade de Artemis
Figura 1.16 O 'paradoxo' idealizado do gêmeo no diagrama do espaço-tempo do gêmeo que fica em casa.
relógios e ordena a cada um deles que monta um relógio que passa pela Terra para anotar a hora no
relógio da Terra no caso de passagem. Depois de viajar sete anos com seu próprio relógio, ela salta
do referencial inercial O e agarra outro O que está voando em direção à Terra em v = 0,96 (medido no
referencial da Terra, é claro). Quando ela se acomoda nesse quadro, ela novamente distribui seus
alunos de pós-graduação nos relógios e ordena que todos os relógios sejam sincronizados com o dela,
que indica t = 7 anos na troca. (Todos os relógios já estavam sincronizados entre si – ela apenas ajusta
apenas o zero de tempo deles.) Ela ainda ordena que todo estudante de pós-graduação que passar
pela Terra de t = 7 anos até chegar lá registre o tempo de passagem e a leitura de Os relógios da Terra
naquele evento.
Diana finalmente chega em casa depois de envelhecer 14 anos. Sabendo um pouco sobre dilatação
do tempo, ela espera que Artemis tenha envelhecido muito menos, mas, para sua surpresa, Artemis é
uma avó de cabelos brancos, 50 anos mais velha! Diana guarda sua surpresa para si mesma e corre
para a sala de informática para verificar os dados. Ela lê os despachos dos alunos de pós-graduação
que montam os relógios do quadro de saída. Com certeza, Artemis parece ter envelhecido muito
lentamente por seus relatórios. Na época de Diana ¯t = 7 anos, o estudante de pós-graduação que
passava pela Terra registrou que os relógios da Terra marcavam apenas um pouco menos de dois
anos de tempo decorrido. Mas então Diana verifica as informações de seus alunos de pós-graduação
montando os relógios do quadro de entrada. Ela descobre que em seu tempo t = 7 anos, o estudante
de pós-graduação relatou uma leitura dos relógios da Terra em mais de 48 anos de tempo decorrido!
Como um aluno pode ver a Terra em t = 2 anos e outro aluno, ao mesmo tempo, vê-la em t = 48 anos?
Diana sai da sala de informática resmungando sobre os padrões em declínio do ensino de graduação de hoje.
No entanto, sabemos o erro que Diana cometeu. Seus dois mensageiros não passaram pela Terra
ao mesmo tempo. Seus relógios marcaram a mesma quantidade, mas eles encontraram a Terra nos
eventos A e C muito diferentes. Diana deveria ter pedido aos alunos do primeiro quadro para continuar
registrando as informações até que vissem o aluno t = 7 anos do segundo quadro passar pela Terra. o que
27 1.13 Apêndice: O 'para radox' gêmeo dissecado
y
Diana atribui t = 7 anos
a ambas as linhas tracejadas!
D
y
C
x
B
ÿ
x
UMA
(uma) (b)
Figura 1.17 A mudança de quadro de Diana é análoga a uma rotação de coordenadas na geometria euclidiana.
importa, afinal, que eles teriam enviado seus despachos datados de ¯t = 171 anos? O tempo é apenas uma
coordenada. Devemos ter certeza de pegar todos os eventos.
O que Diana realmente fez foi usar um sistema de coordenadas ruim. Exigindo informações apenas
antes de ¯t = 7 anos no quadro de saída e somente após t = 7 anos no quadro de entrada, ela deixou todo
o interior do triângulo ABC fora de seus trechos de coordenadas (Fig. 1.17(a)).
Não é de admirar que muita coisa aconteceu que ela não descobriu! Se ela tivesse permitido que os alunos
do primeiro quadro coletassem dados até ¯t = 171 anos, ela poderia ter coberto o interior daquele triângulo.
Podemos inventar uma analogia com as rotações no plano (Fig. 1.17(b)). Considere tentar medir o
comprimento da curva ABCD, mas ser forçado a girar as coordenadas no meio da medição, digamos,
depois de ter medido de A a B no sistema x ÿ y .
Se você girar para x¯ ÿ ¯y, você deve retomar a medição em B novamente, que pode estar na coordenada
y¯ = ÿ5, enquanto originalmente B tinha a coordenada y = 2. Se você medir o comprimento da curva
começando em qualquer ponto que tivesse y¯ = 2 (mesmo y¯ que o valor de y em que você terminou no
outro quadro), você começaria em C e obteria um comprimento muito curto para a curva.
Agora, ninguém cometeria esse erro nas medições em um avião. Mas muitas pessoas o fariam se
fossem confrontadas pelo paradoxo dos gêmeos. Isso vem de nossa recusa em ver o tempo simplesmente
como uma coordenada. Estamos acostumados a pensar em um tempo universal, o mesmo em todos os
lugares para todos, independentemente de seu movimento. Mas não é o mesmo para todos, e devemos
tratá-lo como uma coordenada e garantir que nossas coordenadas cubram todo o espaço-tempo.
Coordenadas que não cobrem todo o espaço-tempo causaram muitos problemas em GR.
Quando estudarmos o colapso gravitacional e os buracos negros veremos que as coordenadas usuais
para o espaço-tempo fora do buraco negro não chegam ao interior do buraco negro. Por esta razão, uma
partícula caindo em um buraco negro leva um tempo de coordenadas infinitas para percorrer uma distância
finita. Isso é puramente culpa das coordenadas: a partícula cai em um tempo próprio finito, em uma região
não coberta pelas coordenadas 'externas'. Um sistema de coordenadas que cobre tanto o interior como o
exterior satisfatoriamente não foi descoberto até meados da década de 1950.
1.14 Exercícios
1 Converta o seguinte em unidades em que c = 1, expressando tudo em termos de m

e kg: (a)
Exemplo trabalhado: 10 J. Em unidades do SI, 10 J = 10 kg m2 sÿ2. Como c = 1, temos 1 s = 3 × 108 m, e assim
1 sÿ2 = (9 × 1016) ÿ1 mÿ2. Portanto, obtemos 10 J = 10 kg m2(9 × 1016) ÿ1 mÿ2 = 1,1 × 10ÿ16 kg.
Alternativamente, trate c como uma conversão
fator de sion:
1 = 3 × 108 m sÿ1,
1 = (3 × 108) ÿ1 mÿ1 s,
-2 -2
10 J = 10 kg m2 = s = 10kgm2 s × (1)2
-2
10 kg m2 = 1,1 s × (3 × 108) ÿ2 s2 m-2
× 10ÿ16 kg.
Você pode multiplicar ou dividir por tantos fatores de c quantos forem necessários para cancelar os
segundos.
(b) A potência de saída de 100 W. (c)

Constante reduzida de Planck, = 1,05 × 10ÿ34 J s. (Observe a definição de em termos da constante de Planck
h: = h/2ÿ.)
(d) Velocidade de um carro, v = 30 m sÿ1. (e)
Momento de um carro, 3 × 104 kg m sÿ1. (f) Pressão
de uma atmosfera = 105 N mÿ2. (g) Densidade da água,
103 kg mÿ3. (h) Fluxo de luminosidade 106 J sÿ1 cmÿ2.
2 Converta o seguinte de unidades naturais (c = 1) para unidades do SI: (a) Uma

velocidade v = 10ÿ2. (b) Pressão 1019 kg mÿ3. (c) Tempo t = 1018 m. (d)
Densidade de energia u = 1 kg mÿ3. (e) Aceleração 10 mÿ1.
3 Desenhe os eixos t e x das coordenadas do espaço-tempo de um observador O e depois desenhe:

(a) A linha mundial do relógio de O em x = 1 m. (b) A
linha de mundo de uma partícula se movendo com velocidade dx/dt = 0,1, e que está em x = 0,5 m quando t = 0.
(c) Os eixos ¯t e x¯ de um observador O¯ que se move com velocidade v = 0,5 na direção x positiva em relação
a O e cuja origem (x¯ = ¯t = 0) coincide com a de O.
(d) O lugar geométrico dos eventos cujo intervalo s2 da origem é ÿ1 m2. (e) O lugar
geométrico dos eventos cujo intervalo s2 da origem é +1 m2. (f) A calibração marca
intervalos de um metro ao longo dos eixos x¯ e ¯t . (g) O lugar geométrico dos eventos cujo
intervalo s2 da origem é 0. (h) O lugar geométrico dos eventos, todos os quais ocorrem no
instante t = 2 m (simultâneos como visto
por O).
29 1.14 Exercícios
(i) O local dos eventos, todos os quais ocorrem no tempo ¯t = 2 m (simultâneos como visto
por O¯).
(j) O evento que ocorre em ¯t = 0 e x¯ = 0,5 m. (k) O lugar
geométrico dos eventos x¯ = 1 m. (l) A linha de mundo de
um fóton que é emitido a partir do evento t = ÿ1 m, x = 0, viaja na direção negativa de x , é
refletida quando encontra um espelho localizado em x¯ = ÿ1 m, e é absorvido quando encontra
um detector localizado em x = 0,75 m.
4 Escreva todos os termos das seguintes somas, substituindo os nomes das coordenadas (t, x, y, z)
por (x0, x1, x2, x3): (a)
3ÿ=0 Vÿ xÿ, onde {Vÿ, ÿ = 0, ... , 3} é uma coleção de quatro números arbitrários.
3
(b) i=1( xi ) 2.
5 (a) Use o diagrama de espaço-tempo de um observador O para descrever o seguinte experimento
realizado por O. Duas rajadas de partículas de velocidade v = 0,5 são emitidas de x = 0 em t
= ÿ2 m, uma viajando na direção x positiva e o outro no sentido negativo de x . Esses
detectores de encontro localizados em x = ±2 m. Após um atraso de 0,5 m de tempo, os
detectores enviam sinais de volta para x = 0 na velocidade v = 0,75. (b) Os sinais chegam de
volta em x = 0 no mesmo evento. (Certifique-se de que seu diagrama de espaço-tempo mostre
isso!) A partir disso, o pesquisador conclui que os detectores de partículas de fato enviaram
seus sinais simultaneamente, pois ele sabe que estão a distâncias iguais de x = 0. Explique
por que essa conclusão é válida. (c) Um segundo observador O¯ move-se com velocidade v =
0,75 na direção x negativa em relação a O. Desenhe o diagrama espaço-tempo de O¯ e nele
represente o experimento realizado por O. O¯ conclui que os detectores de partículas enviaram
seus sinais simultaneamente? Se não, qual sinal foi enviado primeiro? (d) Calcule o intervalo
s2 entre os eventos nos quais os detectores emitiram seus
sinais, usando as coordenadas de O e as de O¯.

6 Mostre que a Eq. (1.2) contém apenas Mÿÿ + Mÿÿ quando ÿ = ÿ, não Mÿÿ e Mÿÿ independentemente.
Argumente que isso nos permite definir Mÿÿ = Mÿÿ sem perda de generalidade.
7 Na discussão que levou à Eq. (1.2), suponha que as coordenadas de O¯ são dadas como
as seguintes combinações lineares das de O:
¯t = ÿt + ÿx,
x¯ = ÿt + vx ,
y¯ = ay,
z¯ = bz,
onde ÿ, ÿ,ÿ, ÿ, a e b podem ser funções da velocidade v de O¯ em relação a O, mas não dependem
das coordenadas. Encontre os números {Mÿÿ, ÿ, b = 0, ... , 3} da Eq. (1.2) em termos de ÿ, ÿ,ÿ, ÿ,
a e b.
8 (a) Deduza a Eq. (1.3) da Eq. (1.2), para geral {Mÿÿ, ÿ, ÿ = 0, ... , 3}.
(b) Como s¯2 = 0 na Eq. (1.3) para qualquer { xi }, substitua xi por ÿ xi na Eq. (1.3) e subtraia a
equação resultante da Eq. (1.3) para estabelecer que M0i = 0 para i = 1, 2, 3.
2
(c) Use a Eq. (1.3) com s¯ = 0 para estabelecer a Eq. (1.4b). (Dica: x, y e z são
arbitrário.)
9 Explique por que a linha PQ na Fig. 1.7 é desenhada da maneira descrita no texto.
10 Para os pares de eventos cujas coordenadas (t, x, y,z) em algum quadro são dadas abaixo,
classifique suas separações como temporal, espacial ou nula. (a) (0, 0, 0, 0) e (ÿ1,1, 0, 0), (b) (1,
1, ÿ1, 0) e (ÿ1, 1, 0, 2), ( c) (6, 0, 1, 0) e (5, 0, 1, 0), (d) (ÿ1, 1, ÿ1, 1) e (4, 1, ÿ1, 6). + x2 = a2 e ÿt
linhas t = ±x, independentemente de aeb . 12 (a) Use o fato de que a tangente à hipérbole DB na
Fig. 1.14 é a linha de simultaneidade para O¯ para mostrar que o intervalo de tempo AE é menor
que o tempo registrado no relógio de O¯ quando ele se move de A a B. (b) Calcule que
2 2
11 Mostre que a hipérbole ÿt + x2 = ÿb2 são assintóticos ao
( s 2)AC = (1 ÿ v2)( s 2)AB.
(c) Use (b) para mostrar que O¯ considera que os relógios de O estão funcionando lentamente, exatamente na 'direita'
avaliar.
13 A meia-vida da partícula elementar chamada méson pi (ou píon) é de 2,5 × 10ÿ8 s quando o píon
está em repouso em relação ao observador medindo seu tempo de decaimento. Mostre, pelo
princípio da relatividade, que os píons que se movem com velocidade v = 0,999 devem ter uma
meia-vida de 5,6 × 10ÿ7 s, medida por um observador em repouso.
14 Suponha que a velocidade v de O¯ relativa a O seja pequena, |v| 1. Mostre que o tempo
dilatação, contração de Lorentz e fórmulas de adição de velocidade podem ser aproximadas por,
respectivamente: (a) t ÿ (1 +
1 v2) ¯t,
(b) x ÿ (1 ÿ (c) w 212 v2) x¯,

ÿ w + v ÿ wv(w + v) (com |w| Quais são os 1 também).
erros relativos nessas aproximações quando |v| = w = 0,1?
15 Suponha que a velocidade v de O¯ relativa a O seja quase a da luz, |v| = 1 ÿ ÿ,
0<ÿ 1. Mostre que as mesmas fórmulas de Exer. 14 tornam-se
(b) x ÿ x¯/
t ÿ ¯t/
ÿ(2ÿ),
ÿ(2ÿ),
(c)(a)
wÿ
1 ÿ ÿ(1 ÿ w)/(1 + w).
Quais são os erros relativos nessas aproximações quando ÿ = 0,1 ew = 0,9?

16 Use a transformação de Lorentz, Eq. (1.12), para derivar (a) a dilatação do tempo e (b) as fórmulas
de contração de Lorentz. Faça isso identificando os pares de eventos onde as separações (no
tempo ou no espaço) devem ser comparadas e, em seguida, use a transformação de Lorentz para
realizar a álgebra para a qual a hipérbole invariante foi usada no texto.
17 Um poste leve de 20 m de comprimento está no chão ao lado de um celeiro de 15 m de comprimento.

Um atleta olímpico pega a vara, a leva para longe e corre com ela até o final do celeiro
31 1.14 Exercícios
a uma velocidade de 0,8 c. Seu amigo permanece em repouso, de pé junto à porta do celeiro. Tente
todas as partes desta pergunta, mesmo que você não consiga responder algumas. (a) Qual é o
comprimento que o amigo mede a estaca quando ela se aproxima do celeiro? (b) A porta do celeiro
está inicialmente aberta e, imediatamente após o corredor e a vara estarem inteiramente dentro do
celeiro, o amigo fecha a porta. Quanto tempo depois que a porta é fechada a frente do poste
atinge a outra extremidade do celeiro, medido pelo amigo?
Calcule o intervalo entre os eventos de fechar a porta e bater na parede.
É semelhante ao espaço, ao tempo
ou nulo? (c) No referencial do corredor, qual é o comprimento do celeiro e da vara? (d) O
corredor acredita que a vara está totalmente dentro do celeiro quando sua frente atinge
o fim do celeiro? Você pode explicar por quê?
(e) Após a colisão, o poste e o corredor param em relação ao celeiro. Do ponto de vista do amigo,
o poste de 20 m está agora dentro de um celeiro de 15 m, pois a porta do celeiro foi fechada
antes do poste parar. Como isso é possível? Alternativamente, do ponto de vista do corredor,
a colisão deveria ter parado o poste antes que a porta se fechasse, de modo que a porta não
pudesse ser fechada. A porta estava ou não fechada com o poste dentro?
(f) Desenhe um diagrama de espaço-tempo do ponto de vista do amigo e use-o para ilustrar
e justifique todas as suas conclusões.
18 (a) A lei de adição de velocidade de Einstein, Eq. (1.13), tem uma forma mais simples se
introduzirmos o conceito do parâmetro de velocidade u, definido pela equação
v = tanh u.
Observe que para ÿÿ< u <ÿ, a velocidade está confinada aos limites aceitáveis ÿ1 <v< 1.
Mostre que se
v = tanh u
w = tanh U,
então Eq. (1.13) implica
w = tanh(u + U).
Isso significa que os parâmetros de velocidade são adicionados linearmente.
(b) Use isso para resolver o seguinte problema. Uma estrela mede que uma segunda estrela está
se afastando com velocidade v = 0,9 c. A segunda estrela mede um terço para estar
recuando na mesma direção em 0,9 c. Da mesma forma, o terceiro mede um quarto, e assim
por diante, até um grande número N de estrelas. Qual é a velocidade da enésima estrela em
relação à primeira? Dê uma resposta exata e uma aproximação útil para N grande.
19 (a) Usando o parâmetro de velocidade introduzido no Exer. 18, mostram que as equações de
transformação de Lorentz, Eq. (1.12), pode ser colocado na forma
¯t = t cosh u ÿ x sinh u, y¯ = y,
x¯ = ÿt sinh u + x cosh u, z¯ = z.
(b) Use o intervalo identidade cosh2 u ÿ sinh2 u = 1 para demonstrar a invariância do

dessas equações.
(c) Desenhe o máximo de paralelos que puder entre a geometria do espaço-tempo e a geometria
euclidiana bidimensional comum, onde a transformação de coordenadas
análoga à transformação de Lorentz é
x¯ = x cos ÿ + y sen ÿ,
y¯ = ÿx sen ÿ + y cos ÿ.
Qual é o análogo do intervalo? Das hipérboles invariantes?

20 Escreva as equações de transformação de Lorentz na forma matricial.
21 (a) Mostre que, se dois eventos são separados no tempo, existe um referencial de Lorentz no qual
eles ocorrem no mesmo ponto, ou seja, nos mesmos valores de coordenadas espaciais.
(b) Da mesma forma, mostre que se dois eventos são separados no espaço, existe um referencial de Lorentz
em que são simultâneas.
2 Análise vetorial na relatividade especial
2.1 D e fi ni ti onofavetor
No momento, usaremos a noção de vetor que carregamos da geometria euclidiana, que um

vetor é algo cujos componentes se transformam como as coordenadas sob uma transformação
de coordenadas. Mais tarde, definiremos vetores de uma forma mais satisfatória.
maneiras.
O vetor típico é o vetor deslocamento, que aponta de um evento para outro

e tem componentes iguais às diferenças de coordenadas:
(2.1)
x ÿO ( t, x, y, z).
Nesta linha, introduzimos várias novas notações: uma seta sobre um símbolo denota um vetor
(de modo que x é um vetor que não tem nada a ver com a coordenada x), a seta após x significa
'tem componentes' e o O abaixo significa 'no quadro O'; os componentes estarão sempre na
ordem t, x, y, z (equivalentemente, índices na ordem 0, 1, 2, 3). A notação ÿO é usada para
enfatizar a distinção entre o vetor e seus componentes. O vetor x é uma seta entre dois eventos,
enquanto a coleção de componentes é um conjunto de quatro números dependentes de
coordenadas. Devemos sempre enfatizar a noção de vetor (e, posteriormente, qualquer tensor)
como um objeto geométrico: algo que pode ser definido e (às vezes) visualizado sem se referir
a um sistema de coordenadas específico.
Outra notação importante é
(2.2)
x ÿO { xÿ},
onde por { xÿ} queremos dizer todos os x0, x1, x2, x3. Se pedirmos as componentes deste vetor em outro sistema de coordenadas, digamos
o referencial O¯, escrevemos
xÿ { xÿ¯ }.
O¯
Ou seja, colocamos uma barra sobre o índice para denotar as novas coordenadas. O vetor x é
o mesmo, e nenhuma nova notação é necessária para ele quando o quadro é alterado. Apenas o
seus componentes mudam.1 Quais são os novos componentes xÿ¯ ? Nós os recebemos do
Transformação de Lorentz:
x0 vx1 _
x0¯ = ÿ
, etc.
ÿ(1 ÿ v2) ÿ(1 ÿ v2)
Como se trata de uma transformação linear, pode-se escrever

3
0¯
x0¯ = ÿ xÿ,
ÿ=0
0¯
Onde { ÿ} são quatro números, um para cada valor de ÿ. Nesse caso
0¯ 0¯
0 = 1/ ÿ(1 ÿ v2), 1 = ÿv/ÿ(1 ÿ v2),
0¯ 0¯
2= 3 = 0.
Uma equação semelhante vale para x1¯ , e assim, em geral, escrevemos

3
ÿ¯
xÿ¯ = ÿ xÿ, para ÿ¯ arbitrário. (2.3)
ÿ=0
ÿ¯
Agora { ÿ} é uma coleção de 16 números, que constitui a transformação de Lorentz
matriz. A razão pela qual escrevemos um índice para cima e o outro para baixo ficará claro
quando estudamos geometria diferencial. Por agora, permite-nos apresentar a última parte da
notação, a convenção de soma de Einstein: sempre que uma expressão contém um índice
como um sobrescrito e o mesmo índice como um subscrito, uma soma está implícita em todos os valores
esse índice pode levar. Aquilo é,
AÿBÿ e Tÿ Eÿÿ
são abreviaturas para as somas

3 3
AÿBÿ e Tÿ Eÿÿ ,
ÿ=0 ÿ=0
enquanto
AÿBÿ, Tÿ Eÿÿ e AÿAÿ
não representam somas em nenhum índice. A transformação de Lorentz, Eq. (2.3), agora pode ser
abreviado para
ÿ¯
xÿ¯ = ÿ xÿ, (2.4)
salvando alguma escrita bagunçada.
1
Isso é o que alguns livros de álgebra linear chamam de transformação 'passiva': as coordenadas mudam, mas o vetor
não.
35 2.1 Definição de um vec para r
Observe que a Eq. (2.4) é identicamente igual a

ÿ¯
xÿ¯ = ÿ
xÿ .
Uma vez que o índice repetido (ÿ em um caso, ÿ no outro) denota apenas uma soma de
0 a 3, não importa qual letra é usada. Esse índice somado é chamado de índice fictício,
e renomear um índice fictício (como fizemos, substituindo ÿ por ÿ ) geralmente é uma ferramenta útil
em álgebra tensorial. Há apenas uma coisa que não devemos substituir o índice fictício ÿ por:
um índice latino. A razão é que os índices latinos podem (por nossa convenção) apenas tomar os valores
1, 2, 3, enquanto ÿ deve ser igual a zero também. Assim, as expressões
ÿ¯ ÿ¯
ÿ xÿ e eu
XI
não são os mesmos; na verdade temos
ÿ¯ ÿ¯ ÿ¯
ÿ xÿ = 0 x0 + eu
xi . (2.5)
Eq. (2.4) são realmente quatro equações diferentes, uma para cada valor que ÿ¯ pode assumir. Um
índice como ÿ¯, no qual nenhuma soma é realizada, é chamado de índice livre. Sempre que uma equação
é escrito com um ou mais índices livres, é válido se e somente se for verdadeiro para todos
valores possíveis que os índices livres podem assumir. Tal como acontece com um índice fictício, o nome dado a um
índice livre é amplamente arbitrário. Assim, a Eq. (2.4) pode ser reescrito como
ÿ¯
xÿ¯ = ÿ xÿ.
Isso é equivalente à Eq. (2.4) porque ÿ¯ pode assumir os mesmos quatro valores que ÿ¯ poderia
presumir. Se um índice livre for renomeado, ele deverá ser renomeado em todos os lugares. Por exemplo, o
após a modificação da Eq. (2.4),
ÿ¯
xÿ¯ = ÿ xÿ,
não faz sentido e nunca deve ser escrito. A diferença entre essas duas últimas expressões é que a primeira
garante que, qualquer que seja o valor que ÿ¯ assuma, tanto xÿ¯ à esquerda quanto
ÿ¯
ÿ à direita terá o mesmo índice livre. A segunda expressão não liga o
índices desta forma, então não é equivalente à Eq. (2.4).
2
O quadro vetorial geral , é definido por uma coleção de números (seus componentes em alguns
digamos O)
UMA
(2.6)
ÿO (A0, A1, A2, A3) = {Aÿ},
e pela regra de que seus componentes em um quadro O¯ são

ÿ¯
Aÿ¯ = Aÿ. (2.7)
ÿ
2
Tal vetor, com quatro componentes, às vezes é chamado de quatro vetores para distingui-lo dos três vetores componentes com
os quais estamos acostumados na física elementar, que chamaremos de três vetores. A menos que digamos
,
caso contrário, um 'vetor' é sempre um vetor de quatro. Denotamos quatro vetores por setas, por exemplo, A e três vetores por
negrito, por exemplo, A.
Ou seja, seus componentes se transformam da mesma forma que as coordenadas. Lembre-se que um vetor
pode ser definido fornecendo quatro números (por exemplo, (108, ÿ10ÿ16, 5,8368, ÿ)) em algum quadro; então
seus componentes em todos os outros quadros são determinados exclusivamente. Os vetores no espaço-tempo obedecem a
regras usuais: se A e B são vetores e ÿ é um número, então A + B e ÿA também são vetores,
com componentes
A+B ÿ
ÿO (A0 + B0, A1 + B1, A2 + B2, A3 + B3),
(2.8)
ÿ
ÿA ÿO (ÿA0,ÿA1,ÿA2,ÿA3). ÿ
Assim, os vetores se somam pela regra usual do paralelogramo. Observe que podemos fornecer quatro
números quaisquer para formar um vetor, exceto que, se os números não forem adimensionais, todos devem ter
as mesmas dimensões, pois sob uma transformação elas serão somadas.
2.2 Gebra vetorial
Vetores de base
Em qualquer referencial O existem quatro vetores especiais, definidos por seus componentes:
ÿ
e0 ÿO (1, 0, 0, 0),
e1 ÿO (0, 1, 0, 0),
(2.9)
ÿÿÿÿÿÿ
e2 ÿO (0, 0, 1, 0),
e3 ÿO (0, 0, 0, 1). ÿÿÿÿÿÿ
Essas definições definem os vetores de base do referencial O. Da mesma forma, O¯ tem vetores de base
e0¯ ÿ (1, 0, 0, 0), etc.

O¯
Geralmente, e0¯ = e0, pois são definidos em quadros diferentes. O leitor deve verificar que
a definição dos vetores de base é equivalente a
ÿ ( eÿ) = ÿÿÿ . (2.10)
Ou seja, o componente ÿ de eÿ é o delta de Kronocker: 1 se ÿ = ÿ e 0 se ÿ = ÿ.

Qualquer vetor pode ser expresso em termos dos vetores de base. Se
UMA
ÿO (A0, A1, A2, A3),

então
A = A0 e0 + A1 e1 + A2 e2 + A3
e3,
A = Aÿ eÿ. (2.11)
37 2.2 Vec para álgebra
Na última linha, usamos a convenção de soma (lembre-se sempre de escrever o índice em e como um
subscrito para empregar a convenção dessa maneira). O significado da Eq. (2.11) é que A é a soma linear
de quatro vetores A0 e0, A1 e1, etc.
Transformação de vetores de base
A discussão que leva à Eq. (2.11) poderia ter sido aplicado a qualquer frame, então é igualmente verdadeiro
em O¯:
A = Aÿ¯ eÿ¯ .
Isso diz que A também é a soma dos quatro vetores A0¯ A1¯ e1¯, etc. Estes não são os mesmos quatro
e0¯,
vetores da Eq. (2.11), uma vez que são paralelos aos vetores base de O¯ e não de O, mas somam o
. meramente
mesmo vetor A É importante entender que as expressões Aÿpela
eÿ ereclassificação
Aÿ¯ eÿ¯ não sãodeobtidas
índicesuma
fictícios.
da outra
Índices barrados e não barrados não podem ser trocados, pois possuem significados diferentes.
Assim, {Aÿ¯} é um conjunto diferente de números de {Aÿ}, assim como o conjunto de vetores { eÿ¯} é
diferente de { eÿ}. Mas, por definição, as duas somas são as mesmas:
Aÿ eÿ = Aÿ¯ eÿ¯ , (2.12)
e isso tem uma consequência importante: dela deduzimos a lei de transformação para os vetores de base,
,
ou seja, a relação entre { eÿ} e { eÿ¯}. Usando a Eq. (2.7) para Aÿ¯ escrevemos a Eq. (2.12) como
ÿ¯ ÿAÿ eÿ¯ = Aÿ eÿ.
À esquerda temos duas somas. Como são somas finitas, sua ordem não importa. Já que os números
ÿ¯
ÿ e Aÿ são apenas números, sua ordem não importa, e podemos escrever
Aÿ ÿ¯ ÿ eÿ¯ = Aÿ eÿ.
Agora usamos o fato de que ÿ e ÿ¯ são índices fictícios: mudamos ÿ para ÿ e ÿ¯ para ÿ¯,
Aÿ ÿ¯ ÿ
eÿ¯ = Aÿ eÿ.
Esta equação deve ser verdadeira para todos os conjuntos {Aÿ}, pois A é um vetor arbitrário. Escrevendo-o como
Aÿ( ÿ¯ ÿ eÿ¯ ÿ eÿ) = 0
nós deduzimos
ÿ¯ ÿ eÿ¯ ÿ eÿ = 0 para cada valor de ÿ,
ou
eÿ = ÿ¯ ÿ eÿ¯. (2.13)
Isso fornece a lei pela qual os vetores de base mudam. Não é uma transformação de componentes: ela
fornece a base { eÿ} de O como uma soma linear sobre a base { eÿ¯} de O¯. Comparando isso com a lei
para componentes, a Eq. (2.7),
Aÿ¯ = ÿ¯ÿAÿ ,
vemos que é realmente diferente.
A discussão acima introduziu muitas técnicas novas, então estude-a cuidadosamente. Observe que
a omissão dos sinais de soma mantém as coisas organizadas. Observe também que um passo de
importância fundamental foi reetiquetar os índices fictícios: isso nos permitiu isolar o Aÿ arbitrário do
resto das coisas na equação.
Um exemplo
Deixe O¯ mover-se com velocidade v na direção x em relação a O. Então a matriz [ ÿ¯ ÿ] é
ÿ ÿvÿ 0 0 ÿvÿ ÿ 0 0 0
ÿ ÿ
10
( ÿ¯ÿ ) =
ÿ ÿ
,
ÿ
0 ÿ
ÿ 0 0 01 ÿ
onde usamos a notação padrão
ÿ := 1/ ÿ(1 ÿ v2).
Então, se A
ÿO (5, 0, 0, 2), encontramos seus componentes em O¯ por
0¯ 0¯
A0¯ = 0A0 + 1A1 +···
= ÿ · 5 + (ÿvÿ ) · 0 + 0 · 0 + 0 · 2 = 5ÿ .
De forma similar,
A1¯ = ÿ5vÿ,
A2¯ = 0, A3¯ =
2.
Portanto, A ÿ (5ÿ , ÿ5vÿ , 0, 2).

O¯
Os vetores de base são expressos como
eÿ = ÿ¯ ÿ eÿ¯
ou
e0 = 0¯ 0 e0¯ + 1¯ 0 e1¯ +···
= ÿ e0¯ ÿ vÿ e1¯.
39 2.2 Vec para álgebra
De forma similar,
e1 = ÿvÿ e0¯ + ÿ e1¯,

e2 = e2¯,
e3 = e3¯.
Isso dá a base de O em termos de O¯'s, então vamos desenhar a figura (Fig. 2.1) no quadro de O¯: Este
é claro que a transformação é exatamente o que é necessário para manter os vetores de base apontando ao longo
os eixos de seus respectivos quadros. Compare isso com a Fig. 1.5(b).
Transformações inversas
A única coisa que a transformação de Lorentz ÿ¯ ÿ depende de é a velocidade relativa do

dois quadros. Vamos, no momento, mostrar isso explicitamente escrevendo
ÿ¯
ÿ
= ÿ¯
ÿ(v).
Então
ÿ¯
eÿ = ÿ(v) eÿ¯. (2.14)
Se a base de O é obtida da de O pela transformação com velocidade v, então a

reverso deve ser verdadeiro se usarmos ÿv. Assim devemos ter
ÿ
eÿ¯ = ÿ¯ (ÿv) eÿ . (2.15)
Nesta equação eu usei ÿ¯ e ÿ como índices para evitar confusão com o anterior
ÿ
Fórmula. As barras ainda se referem, é claro, ao quadro O¯. A matriz [ ÿ¯ ] é exatamente a
matriz [ os ÿ¯ ÿ] exceto com v alterado para ÿv. As barras nos índices servem apenas para indicar
nomes dos observadores envolvidos: eles afetam as entradas na matriz [ ] apenas naquela
a matriz é sempre construída usando a velocidade do quadro de índice superior em relação ao
t t
Figura 2.1 Vetores base de O e O¯ como desenhados por O¯ .

quadro de índice inferior. Isso fica explícito nas Eqs. (2.14) e (2.15). Como v é a velocidade de O¯ (o
quadro de índice superior na Eq. (2.14)) em relação a O, então ÿv é a velocidade de O (o quadro de índice
superior na Eq. (2.15)) em relação a O¯ . Exer. 11, § 2.9, irá ajudá-lo a compreender este ponto.
Podemos reescrever a última expressão como

ÿ
eÿ¯ = ÿ¯(ÿv) eÿ .
Aqui acabamos de mudar ÿ¯ para ÿ¯. Isso não muda nada: ainda são as mesmas quatro equações, uma
para cada valor de ÿ¯. Nesta forma podemos colocá-lo na expressão para eÿ, Eq. (2.14):
ÿ
eÿ = ÿ¯ ÿ(v) eÿ¯ = ÿ¯ÿ (v) ÿ¯(ÿv) eÿ . (2.16)
Nesta equação apenas a base de O aparece. Deve, portanto, ser uma identidade para todo v. À direita há
duas somas, uma em ÿ¯ e outra em ÿ. Se imaginarmos realizar a soma ÿ¯ primeiro, então a direita é uma
soma sobre a base { eÿ } na qual cada vetor de base eÿ tem coeficiente
ÿ
ÿ¯ÿ (v) ÿ¯(ÿv). (2.17)
ÿ¯
Imagine avaliar a Eq. (2.16) para algum valor fixo do índice ÿ. Se o lado direito da Eq. (2.16) é igual à
esquerda, o coeficiente de eÿ à direita deve ser 1 e todos os outros coeficientes devem ser anulados. A
maneira matemática de dizer isso é
ÿ
ÿ¯ÿ (v) ÿ¯(ÿv) = ÿÿ ÿ,
onde ÿÿ ÿ é o delta de Kronecker novamente. Isso implicaria
eÿ = ÿÿ ÿ eÿ ,
que é uma identidade.

Vamos mudar a ordem de multiplicação acima e escrever a fórmula chave
ÿ¯(ÿv) ÿ¯ÿ (v) = ÿÿ ÿ. (2.18)
ÿ
expressa o fato de que a matriz [ ÿ¯(ÿv)] é a inversarealizamos
de [ soma quando exatamente aÿ¯duas
em ÿ¯ é multiplicamos ÿ(v)],matrizes.
operaçãopoisque
o Isto
A
matriz (ÿÿ ÿ) é, obviamente, a matriz identidade.
A expressão para a mudança dos componentes de um vetor, ÿ¯
Aÿ¯ = ÿ(v)Aÿ, ÿ¯(ÿv) e

ÿ
também tem seu inverso. Vamos multiplicar ambos os lados por soma em ÿ¯. Obtemos ÿ¯ÿ (v)Aÿ
ÿ
ÿ ÿ¯(ÿv)Aÿ¯ = ÿ¯(ÿv) = ÿÿ
ÿAÿ
= Aÿ .
41 2.3 A quarta velocidade
Isso diz que as componentes de A em O são obtidas daquelas em O¯ pela transformação com ÿv, que é,
obviamente, correta.
As operações que realizamos devem ser familiares para você no conceito de álgebra vetorial no
espaço euclidiano. O novo elemento que introduzimos aqui é a notação de índice, que será uma
ferramenta permanente e poderosa no restante do livro. Certifique-se de que compreende o significado
geométrico de todos os nossos resultados, bem como a sua justificação algébrica.
2.3 T hequatro - v el o cidade
Um vetor particularmente importante é a quatro velocidades de uma linha mundial. Na geometria

tridimensional de Galileu, a velocidade era um vetor tangente ao caminho de uma partícula. Em nossa
geometria quádrupla, definimos o U de quatro velocidades como um vetor tangente à linha de mundo da
partícula e de tal comprimento que se estende uma unidade de tempo no referencial dessa partícula. Para
uma partícula em movimento uniforme, vejamos essa definição no referencial inercial em que ela está em
repouso. Então as quatro velocidades apontam paralelas ao eixo do tempo e têm uma unidade de tempo.
Ou seja, é idêntico ao e0 desse quadro. Assim, poderíamos também usar como nossa definição da quatro
velocidades de uma partícula em movimento uniforme que é o vetor e0 em seu referencial de repouso
inercial. A palavra 'velocidade' é justificada pelo fato de que os componentes espaciais de U estão
intimamente relacionados com a velocidade ordinária v da partícula , que é chamada de três velocidades.
Isso será demonstrado no exemplo abaixo, a Eq. (2.21).
Uma partícula acelerada não possui um referencial inercial no qual esteja sempre em repouso. No
entanto, existe um referencial inercial que momentaneamente tem a mesma velocidade que a partícula,
mas que um momento depois não está mais se movendo com ela. Este referencial é o referencial
momentaneamente móvel (MCRF), e é um conceito importante. (Na verdade, há uma infinidade de
MCRFs para uma determinada partícula acelerada em um determinado evento; todos eles têm a mesma
velocidade, mas seus eixos espaciais são obtidos um do outro por rotações. Essa ambiguidade
t e0 = U
Figura 2.2 Os vetores de base de quatro velocidades e MCRF da linha mundial em A

geralmente não será importante.) A quatro velocidades de uma partícula acelerada é definida como a
e0 vetor base de seu MCRF naquele evento. Este vetor é tangente à linha do mundo (curva)
da partícula. Na Fig. 2.2 a partícula no evento A tem MCRF O¯, cujos vetores básicos são
são mostrados. O vetor e0¯ é idêntico a U lá.
2.4 Os quatro momentos
O quatro momento p é definido como
p = mU , (2.19)
onde m é a massa de repouso da partícula, que é sua massa medida em seu referencial de repouso. Dentro
algum quadro O tem componentes convencionalmente denotados por
(2.20)
p ÿO (E, p1, p2, p3).
Chamamos p0 a energia E da partícula no referencial O. Os outros componentes são seu espaço

momento pi .
Um exemplo
Uma partícula de massa de repouso m move-se com velocidade v na direção x do referencial O.
as componentes de quatro velocidades e quatro momentos? Seu quadro de repouso O¯ tem base de tempo
vetor e0¯, então, por definição de p e U , temos
U = e0¯, p = mU ,
ÿ ÿ ÿ
Uÿ = = 0¯, pÿ = m 0¯. (2.21)
ÿ¯ ÿ¯( e0¯)
Portanto temos
U0 = (1 ÿ v2) ÿ1/2, p0 = m(1 ÿ v2) ÿ1/2,

U1 = v(1 ÿ v2) ÿ1/2, p1 = mv(1 ÿ v2) ÿ1/2,
U2 = 0, p2 = 0,
U3 = 0, p3 = 0.
Para v pequeno, as componentes espaciais de U são (v, 0, 0), o que justifica chamá-la de quatro
velocidades, enquanto as componentes espaciais de p são (mv, 0, 0), justificando seu nome. Para v pequeno,
a energia é
E := p0 = m(1 ÿ v2) ÿ1/2 m + 1 2mv2.
Esta é a energia de massa de repouso mais a energia cinética de Galileu.

43 2.4 A virada dos quatro momentos
Conservação de quatro momentos
As interações de partículas na física galileana são governadas pelas leis de conservação de energia e
de momento. Uma vez que os componentes de p reduzem no limite não relativístico à energia e momento
galileanos familiares, é natural postular que a lei relativística correta é que o quatro vetor p é conservado.
Ou seja, se várias partículas interagem, então
p := p (i), (2.22)
todas as
partículas (i)
onde p (i) é o momento da iésima partícula, é o mesmo antes e depois de cada interação.
Esta lei tem o status de postulado extra, pois é apenas um dos muitos onde o limite não relativista
está correto. No entanto, como os dois postulados fundamentais da RS, este é amplamente verificado
pela experiência. Não menos importante de suas novas previsões é que a lei de conservação de energia
deve incluir a massa de repouso: a massa de repouso pode ser diminuída e a diferença
transformada em energia cinética e, portanto, em calor. Isso acontece todos os dias em usinas nucleares.
Há um ponto importante encoberto na declaração acima sobre a conservação de quatro momentos.

O que significa 'antes' e 'depois' de uma colisão? Suponha que haja duas colisões, envolvendo partículas
diferentes, que ocorrem em eventos separados semelhantes ao espaço, como abaixo. Ao somar o total
de quatro momentos, devemos tomá-los como estão na linha de tempo constante t ou na linha de
constante ¯t? Conforme medido por O, o evento A na Fig. 2.3 ocorre antes de t = 0 e B depois, então o
momento total em t = 0 é a soma dos momentos após A e antes de B. Por outro lado, para O¯ ambos
ocorrem antes de ¯t = 0 e, portanto, o momento total em ¯t = 0 é a soma dos momentos após A e depois
de B. Existe ainda um
t
t
Figura 2.3 Quando várias colisões estão envolvidas, os vetores individuais de quatro momentos que contribuem para a
o total de quatro momentos em qualquer momento particular pode depender do quadro, mas o
total de quatro momentos é o mesmo quatro vetores em todos os quadros; seus componentes se
transformam de quadro em quadro pela transformação de Lorentz.
quadro em que B é anterior a A e a soma pode ser o inverso de O's. Há

realmente não há problema aqui, no entanto. Como cada colisão conserva quantidade de movimento, a soma dos
momento antes de A é o mesmo que depois de A, e da mesma forma para B. Assim, todo observador inercial
obterá o mesmo vetor total de quatro momentos p . (Seus componentes ainda serão diferentes em
quadros diferentes, mas será o mesmo vetor.) Este é um ponto importante: qualquer observador
pode definir sua linha de tempo constante (este é na verdade um espaço de três de tempo constante, que é
chamada de hipersuperfície de tempo constante no espaço-tempo quadridimensional), nesse momento adicione
todos os momentos e obter o mesmo vetor que qualquer outro observador. É importante
entenda isso, porque tais leis de conservação aparecerão novamente.
Quadro do centro de momento (CM)
O centro do referencial do momento é o referencial inercial onde o momento total se anula:
(2.23)
p (i) ÿÿCM (ETOTAL, 0, 0, 0).
eu
Assim como nos MCRFs, qualquer outro quadro em repouso em relação a um quadro CM também é um quadro CM.
2.5 S e al arp ro duto
Magnitude de um vetor
Por analogia com o intervalo, definimos
2
UMA
= ÿ(A0) 2 + (A1) 2 + (A2) 2 + (A3) 2 (2,24)
para ser a magnitude do vetor A uma . Porque definimos os componentes para transformar sob
transformação de Lorentz da mesma maneira que ( t, x, y, z), garantimos que
2 2 2
ÿ (A0) 2 + (A1) 2 + (A2) 2 + (A3) 2 = ÿ(A0¯ ) + (A1¯ ) + (A2¯ ) + (A3¯ ) 2. (2,25)
A magnitude assim definida é um número independente do quadro, ou seja, um escalar sob Lorentz
transformações.
Essa magnitude não precisa ser positiva, é claro. Assim como nos intervalos, adotamos o
2
seguintes nomes: se A é positivo, A é um vetor espacial ; se zero, um vetor nulo ; e se
negativo, um vetor timelike . Assim, vetores que apontam espacialmente têm magnitude positiva, como é
usual no espaço euclidiano. É particularmente importante entender que um vetor nulo não é um
2
vetor zero. Ou seja, um vetor nulo tem A = 0, mas nem todos os Aÿ desaparecem; um vetor zero é definido
2
como um, onde todos os componentes desaparecem. Somente em um espaço onde A 2 é positivo-definido
faz A
= 0 requerem Aÿ = 0 para todos os ÿ.
45 2.5 Scala rp roduto
Produto escalar de dois vetores
Definimos o produto escalar de A e B como
A · B = ÿA0B0 + A1B1 + A2B2 + A3B3 (2,26)
em algum referencial O. Agora provamos que este é o mesmo número em todos os outros referenciais. Nós notamos
primeiro que A · A é apenas A 2, que sabemos ser invariante. Portanto (A + B ) · (A + B ), que
é a magnitude de A + B , também é invariável. Mas a partir das Eqs. (2.24) e (2.26) segue que
22
(A + B ) · (A + B ) = A +B + 2A · B .
Como o lado esquerdo é o mesmo em todos os quadros, assim como os dois primeiros termos à direita, então
o último termo à direita também deve ser. Isso prova a invariância do quadro do escalar
produtos.
Dois vetores A e B são ditos ortogonais se A · B = 0. O sinal de menos na definição do produto escalar
significa que dois vetores ortogonais um ao outro não são
necessariamente em ângulos retos no diagrama de espaço-tempo (veja exemplos abaixo). Um extremo
exemplo é o vetor nulo, que é ortogonal a si mesmo! Tal fenômeno não é
encontrado em espaços onde o produto escalar é positivo-definido.
Exemplo
Os vetores base de um referencial O satisfazem:
e0 · e0 = ÿ1,
e1 · e1 = e2 · e2 = e3 · e3 = +1,
eÿ · eÿ = 0 se ÿ = ÿ.
Eles formam, assim, uma tétrade de vetores mutuamente ortogonais: uma tétrade ortonormal ,
o que significa ortogonal e normalizado para a unidade de magnitude. (Um vetor timelike tem 'unidade
magnitude' se sua magnitude for -1.) As relações acima podem ser resumidas como
eÿ · eÿ = ÿÿÿ, (2,27)
onde ÿÿÿ é semelhante a um delta de Kronecker, pois é zero quando ÿ = ÿ, mas difere em
que ÿ00 = ÿ1, enquanto ÿ11 = ÿ22 = ÿ33 = +1. Veremos mais adiante que ÿÿÿ é de fato de
importância: é o tensor métrico. Mas, por enquanto, tratamos isso como um delta de Kronecker generalizado.
Exemplo
Os vetores base de O¯ também satisfazem
eÿ¯ · eÿ¯ = ÿÿ¯ÿ¯,

Figura 2.4 Os vetores base de O¯ não são 'perpendiculares' (no sentido euclidiano) quando desenhados
em O, mas são ortogonais em relação ao produto escalar do espaço-tempo de Minkowski.
de modo que, em particular, e0¯ · e1¯ = 0. Veja isso no diagrama de espaço-tempo de O, Fig. 2.4:
Os dois vetores certamente não são perpendiculares na figura. No entanto, seu produto escalar é
zero. A regra é que dois vetores são ortogonais se eles fazem ângulos iguais com a linha de 45ÿ que
representa o caminho de um raio de luz. Assim, um vetor tangente ao raio de luz é ortogonal a si
mesmo. Esta é apenas outra maneira pela qual a RS não pode ser 'visualizada' em termos de noções
que desenvolvemos no espaço euclidiano.
Exemplo
O U de quatro velocidades de uma partícula é apenas o vetor de base de tempo de seu MCRF,
então da Eq. (2.27) temos
U · U = ÿ1. (2,28)
2.6 A pli cações
Quatro velocidades e aceleração como derivadas
Suponha que uma partícula faça um deslocamento infinitesimal d x, cujos componentes em O são +
2 (dt, dx, dy, dz). A magnitude desse deslocamento é, pela Eq. (2.24), apenas ÿdt dy2 + dx2 +
dz2. Comparando isso com a Eq. (1.1), vemos que este é apenas o intervalo, ds2:
2 ds = dx · dx. (2,29)
Como a linha do mundo é temporal, isso é negativo. Isso nos levou (Eq. (1.9)) a definir o tempo
próprio dÿ por
(dÿ) 2 = ÿdx · dx . (2,30)

47 2.6 Aplicativos
Agora considere o vetor d x/dÿ , onde dÿ é a raiz quadrada da Eq. (2.30) (Fig. 2.5). este
vetor é tangente à linha do mundo, pois é um múltiplo de d x. Sua magnitude é
dx _ dx _ dx · dx _
· = = -1.
dÿ dÿ (dÿ )2
É, portanto, um vetor temporal de magnitude unitária tangente à linha do mundo. Em um MCRF,
(dt, 0, 0, 0).
d x ÿÿMCRF
dÿ = dt
de modo a
dx _
dÿ ÿÿMCRF (1, 0, 0, 0)
ou
dx _
= ( e0)MCRF.
dÿ
Esta foi a definição da quatro velocidades. Então temos a expressão útil
U = dx/dÿ. (2.31)
Além disso, examinemos

dU d2x _
= ,
dÿ dÿ 2
que é uma espécie de quatro-aceleração. Primeiro diferenciamos a Eq. (2.28) e use a Eq. (2.26):
d dU
(U · U ) = 2U · .
dÿ dÿ
Mas como U · U = ÿ1 é uma constante, temos
dU
U· = 0.
dÿ
ÿ
dx
Figura 2.5 O vetor de deslocamento infinitesimal dx tangente a uma linha mundial.

Como, no MCRF, U tem apenas um componente zero, essa ortogonalidade significa que
dU
dÿ ÿÿMCRF (0, a1, a2, a3).
Este vetor é definido como a aceleração de quatro vetores a :
dU
a= , U · a = 0. (2,32)
dÿ
Exer. 19, § 2.9, justifica o nome 'aceleração'.
Energia e impulso
Considere uma partícula cujo momento é p . Então
p · p = m2U · U = ÿm2. (2.33)
Mas
p · p = ÿE2 + (p1) 2 + (p2) 2 + (p3) 2.
Portanto,
3
E2 = m2 + (pi ) 2. (2,34)
i=1
Esta é a expressão familiar para a energia total de uma partícula.

Suponha que um observador O se mova com quatro velocidades U obs não necessariamente igual à
quatro velocidades da partícula. Então
p · U obs = p · e0¯,
onde e0¯ é o vetor base do referencial do observador. Nesse quadro, o quatro momentos tem
componentes
pÿ (E¯, p1¯ , p2¯ , p3¯ ).

O¯
Portanto, obtemos, da Eq. (2.26),
¯
ÿ p · U obs = E. (2,35)
Esta é uma equação importante. Ela diz que a energia da partícula em relação ao observador, E¯, pode
ser calculada por qualquer pessoa em qualquer referencial tomando o produto escalar p · U obs. Isso é
chamado de expressão 'invariante de quadro' para a energia relativa ao observador. É quase sempre
útil em cálculos usar tais expressões.
49 2,7 toneladas de fotos
2,7 Pótons
Sem quatro velocidades
Os fótons se movem em linhas nulas, então, para um caminho de fótons,
dx · dx = 0. (2,36)
Portanto dÿ é zero e a Eq. (2.31) mostra que a quatro velocidades não pode ser definida. Outra maneira
de dizer a mesma coisa é notar que não há nenhum quadro em que a luz esteja em repouso (o
segundo postulado de SR), então não há MCRF para um fóton. Assim, nenhum e0 em qualquer quadro
será tangente à linha do mundo de um fóton.
Observe com atenção que ainda é possível encontrar vetores tangentes ao caminho de um fóton
(que, sendo uma linha reta, tem a mesma tangente em todos os lugares): d x é um. O problema é
encontrar uma tangente de magnitude unitária, já que todas elas têm magnitude nula.
Quatro momentos
O quadrimomento de uma partícula não é um vetor unitário. Em vez disso, é um vetor em que os
componentes em algum quadro fornecem energia e momento da partícula em relação a esse quadro.
Se um fóton carrega energia E em algum quadro, então nesse quadro p0 = E. Se ele se move na
direção x , então py = pz = 0, e para que o quatro momento seja paralelo à sua linha de mundo
(portanto, ser nulo) devemos ter px = E. Isso garante que
p · p = ÿE2 + E2 = 0. (2,37)
Assim concluímos que os fótons têm momento espacial igual à sua energia.
Sabemos pela mecânica quântica que um fóton tem energia
E = hÿ, (2,38)
onde ÿ é sua frequência eh é a constante de Planck, h = 6,6256 × 10ÿ34 J s.

Essa relação e a transformação de Lorentz dos quatro momentos nos dão imediatamente a fórmula
de deslocamento Doppler para fótons. Suponha, por exemplo, que no referencial O um fóton tenha
frequência v e se mova na direção x . Então, em O¯, que tem velocidade v na direção x em relação a
O, a energia do fóton é
E¯ = E/ ÿ(1 ÿ v2) ÿ px v/ÿ(1 ÿ v2)
= hÿ/ÿ(1 ÿ v2) ÿ hÿv/ÿ(1 ÿ v2).
Definir isso igual a hÿ¯ dá ÿ¯, a frequência em O¯:
= (1 ÿ v)/ ÿ(1 ÿ v2) = ÿ[(1 ÿ v)/(1 + v)]. ÿ/ÿ ¯ (2,39)
Isso é generalizado em Exer. 25, § 2.9.

Partículas de massa de repouso zero
A massa de repouso de um fóton deve ser zero, pois
m2 = ÿ p · p = 0. (2,40)
Qualquer partícula cujo momento de quatro é nulo deve ter massa de repouso zero e vice-versa. A única
partícula de massa de repouso zero conhecida é o fóton. Os neutrinos são muito leves, mas não sem massa.
(Às vezes o 'gráviton' é adicionado a esta lista, já que as ondas gravitacionais também viajam na
velocidade da luz, como veremos mais adiante. Mas 'fóton' e 'gráviton' são conceitos que vêm da
mecânica quântica, e ainda há nenhuma teoria da gravidade quantizada satisfatória, de modo que
'gráviton' não é realmente uma noção bem definida ainda.) A ideia de que apenas partículas com massa
de repouso zero podem viajar na velocidade da luz é reforçada pelo fato de que nenhuma partícula de
repouso finito a massa pode ser acelerada até a velocidade da luz, pois então sua energia seria infinita.
Dito de outra forma, uma partícula viajando à velocidade da luz (na, digamos, direção x ) tem p1/p0 = 1,
enquanto uma partícula de massa de repouso m movendo-se na direção x tem, da equação p · p = ÿ m2, p1/
p0 = [1 ÿ m2/(p0) 2] 1/2, que é sempre menor que um, não importa quanta energia seja dada à partícula.
Embora pareça se aproximar da velocidade da luz, há uma distinção importante: a partícula com m = 0
sempre tem um MCRF, um referencial de Lorentz no qual está em repouso, cuja velocidade v é p1/p0 relativa
ao quadro antigo. Um fóton não tem quadro de repouso.
2.8 P ara
Nós apenas arranhamos a superfície da cinemática relativística e da dinâmica de partículas. Estes são
particularmente importantes na física de partículas, que por sua vez fornece os testes mais rigorosos de SR.
Ver Hagedorn (1963) ou Wiedemann (2007).
2.9 Exercícios
1 Dados os números {A0 = 5, A1 = 0, A2 = ÿ1, A3 = ÿ6},{B0 = 0, B1 = ÿ2, B2 = 4,

B3 = 0},{C00 = 1,C01 = 0,C02 = 2,C03 = 3,C30 = ÿ1,C10 = 5,C11 = ÿ2, C12 =
ÿ2,C13 = 0,C21 = 5,C22 = 2,C23 = ÿ2,C20 = 4,C31 = ÿ1, C32 = ÿ3, C33 = 0}, encontre:
(a) AÿBÿ; (b) AÿCÿÿ para todos os ÿ; (c) Aÿ Cÿ ÿ para todo ÿ; (d) AÿCÿÿ para todos os ÿ; (e) AÿBÿ para
todos os ÿ, ÿ; (f) Ai Bi; (g) Aj Bk para todo j, k.
2 Identifique os índices livres e fictícios nas equações a seguir e transforme-os em expressões equivalentes
com índices diferentes. Quantas equações diferentes cada expressão representa? (a) AÿBÿ = 5; (b) Aÿ¯
= 3 Prove a Eq. (2.5).
ÿ¯ ÿAÿ ; (c ) TÿÿÿAÿCÿÿ = Dÿÿ ; (d) Rÿÿ ÿ 12gÿÿR = Gÿÿ .
4 Dados os vetores A ÿO (5, ÿ1, 0, 1) e B ÿO (ÿ2, 1, 1, ÿ6), encontre os componentes

em O de (a) ÿ6A ; (b) 3A + B ; (c) ÿ6A + 3B .
51 2.9 Exercícios
5 Uma coleção de vetores { a, b , c, d } é dita linearmente independente se não

combinação deles é zero, exceto o trivial, 0a + 0b + 0 c + 0d = 0. (a) Mostre que os
vetores de base na Eq. (2.9) são linearmente independentes. (b) O conjunto a seguir
é linearmente independente? { a, b , c, 5a + 3b ÿ 2 c}.
6 No diagrama de espaço-tempo t ÿ x de O, desenhe os vetores de base e0 e e1. Desenhe os
vetores de base correspondentes do referencial O¯ que se move com velocidade 0,6 na direção x
positiva em relação a O. Desenhe os vetores de base correspondentes de O um referencial que
se move com velocidade 0,6 na direção x positiva em relação a O¯.
7 (a) Verifique a Eq. (2.10) para todos os ÿ, ÿ.
(b) Prove a Eq. (2.11) da Eq. (2.9).
8 (a) Prove que o vetor zero (0, 0, 0, 0) tem esses mesmos componentes em todas as referências
quadros.
(b) Use (a) para provar que se dois vetores têm componentes iguais em um referencial, eles têm
componentes iguais em todos os quadros.
9 Prove, escrevendo todos os termos, que
3 3 3 3
ÿ ÿ =
ÿ¯ ÿAÿ eÿ¯ ÿ ÿ¯ ÿAÿ eÿ¯ .
ÿ¯=0 ÿ¯=0
ÿ ÿ=0 ÿ=0
Como a ordem da soma não importa, temos justificativa para usar a convenção de soma de
o que não especifica a ordem da soma. Einstein ÿ¯ ÿAÿ eÿ¯ , para escrever simplesmente
10 Prove a Eq. (2.13) da equação Aÿ( ÿ¯ ÿ eÿ¯ ÿ eÿ) = 0 fazendo escolhas específicas para os
componentes do vetor arbitrário A 11 Seja .
ÿ¯
ÿ seja a matriz da transformação de Lorentz de O para O¯, dada na Eq. (1.12).
Seja A um vetor arbitrário com componentes (A0, A1, A2, A3) no referencial O. (a)
ÿ
Escreva a matriz de µ¯ (ÿv). (b) Encontre Aÿ¯ para
realizando todo ÿ¯.
a soma (c) Verifique
indicada a Eq.os
para todos (2.18)
valores de ÿ e ÿ. (d) Escreva a matriz de transformação de Lorentz de O¯ para O,
justificando cada entrada. (e) Use (d) para encontrar Aÿ a partir de Aÿ¯ . Como isso está
relacionado com a Eq. (2.18)? (f) Verificar, da mesma forma que (c), que
ÿ ÿ¯
ÿ (ÿv) = ÿÿ¯ ÿ¯.
ÿ¯(v)
(g) Estabelecer que

eÿ = ÿÿ ÿ eÿ
e
Aÿ¯ = ÿÿ¯ ÿ¯
Aÿ¯ .
12 Dado A ÿO (0, ÿ2, 3, 5), encontre:

(a) os componentes de A em O¯, que se move com velocidade 0,8 em relação a O no positivo
direção x ;
(b) os componentes de A em O, que se move com velocidade 0,6 em relação a O¯ no positivo
direção x ;
(c) a magnitude de A de seus componentes em O;
(d) a magnitude de A de seus componentes em O¯.

13 Deixe O se mover com velocidade v em relação a O, e deixe O se mover com velocidade v em relação a O¯.
(a) Mostre que a transformação de Lorentz de O para O é
ÿ
= ÿ ÿ¯
µ(v). (2.41)
ÿ ÿ¯ (v )
(b) Mostre que a Eq. (2.41) é apenas o produto matricial das matrizes do indivíduo
Transformações de Lorentz.
(c) Seja v = 0,6 ex, v = 0,8 ey¯. Encontre para

ÿÿ todos os ÿ e ÿ.
(d) Verifique se a transformação encontrada em (c) é de fato uma transformação de Lorentz por
2
mostrando explicitamente = s2 para qualquer ( t, x, y, z).
que s (e) Calcular
ÿ
ÿ¯ (v) ÿ¯ ÿ(v )
para v e v , como dado em (c), e mostre que o resultado não é igual ao de (c). Interpretar
isso fisicamente.
14 A matriz a seguir fornece uma transformação de Lorentz de O para O¯:
1,25 0 0 ,75
ÿ 0 10 0 ÿ
ÿ ÿ
.
ÿ
0 01 0 ÿ
ÿ 0,75 0 0 1,25 ÿ
(a) Qual é a velocidade (velocidade e direção) de O¯ em relação a O? (b)

Qual é a matriz inversa da dada? (c) Encontre os componentes em O de
um vetor A ÿ (1, 2, 0, 0).
O¯
15 (a) Calcule as componentes de quatro velocidades em O de uma partícula cuja velocidade em O
é v na direção x positiva , usando a transformação de Lorentz do referencial de repouso da
partícula.
(b) Generalize este resultado para encontrar as componentes de quatro velocidades quando a
partícula tem velocidade arbitrária v, com |v| < 1. (c) Use seu resultado em (b) para expressar v
em termos das componentes {Uÿ}. (d) Encontre a três velocidades v de uma partícula cujos
componentes de quatro velocidades são (2, 1,
1, 1).
16 Deduza a fórmula de adição de velocidade de Einstein realizando uma transformação de Lorentz
com velocidade v nas quatro velocidades de uma partícula cuja velocidade no referencial original
foi W.
17 (a) Prove que qualquer vetor temporal U para o qual U0 > 0 e U · U = ÿ1 é o
quatro velocidades de alguma linha do
mundo. (b) Use isso para provar que para qualquer vetor temporal V existe um referencial de Lorentz no qual
V tem zero componentes espaciais. 18
(a) Mostre que a soma de quaisquer dois vetores ortogonais semelhantes ao espaço é semelhante
ao espaço. (b) Mostre que um vetor tipo tempo e um vetor nulo não podem ser ortogonais.
19 Diz-se que um corpo é uniformemente acelerado se sua aceleração de quatro vetores a tem
direção espacial e magnitude, digamos a · a = ÿ2 0.
53 2.9 Exercícios
(a) Mostre que isso implica que a sempre tem os mesmos componentes no MCRF do corpo e que
esses componentes são o que se chamaria de 'aceleração' em termos galileanos.
(Esta seria a situação física de um foguete cujo motor sempre dava a mesma aceleração.)
(b) Suponha que um corpo seja uniformemente acelerado com ÿ = 10 m sÿ2 (cerca da aceleração da
gravidade na Terra). Se o corpo parte do repouso, encontre sua velocidade após o tempo t.
(Certifique-se de usar as unidades corretas.) Qual a distância percorrida neste tempo? Quanto
tempo leva para atingir v = 0,999?
(c) Encontre o tempo próprio decorrido para o corpo em (b), em função de t. (Integre dÿ ao longo de
sua linha de mundo.) Quanto tempo próprio se passou até sua velocidade ser v = 0,999? Quanto
uma pessoa aceleraria como em (b) idade em uma viagem da Terra ao centro de nossa Galáxia,
uma distância de cerca de 2 × 1020 m?
20 A linha de mundo de uma partícula é descrita pelas equações
x(t) = em + b sen ÿt, |bÿ| y(t) = b cos ÿt,
z(t) = 0, < 1,
em algum referencial inercial. Descreva o movimento e calcule os componentes das quatro velocidades
e quatro acelerações da partícula.
21 A linha de mundo de uma partícula é descrita pelas equações paramétricas em alguns Lorentz
quadro
ÿ ÿ
t(ÿ) = um senh , x(ÿ) = um custo ,
uma uma
onde ÿ é o parâmetro e a é uma constante. Descreva o movimento e calcule os componentes de quatro

velocidades e aceleração da partícula. Mostre que ÿ é o tempo próprio ao longo da linha do mundo e
que a aceleração é uniforme. Interpretar a.
22 (a) Encontre a energia, a massa de repouso e a velocidade de três velocidades v de uma partícula cujo momento de quatro
tem os componentes (4, 1, 1, 0) kg. (b) A

colisão de duas partículas de quatro momentos
p 1 ÿO (3, ÿ1, 0, 0) kg, p 2 ÿO (2, 1, 1, 0) kg
resulta na destruição das duas partículas e na produção de três novas, duas das quais têm quatro
momentos
2 , 0, 0) kg.
p 3 ÿO (1, 1, 0, 0) kg, p 4 ÿO (1, ÿ1
Encontre os quatro momentos, a energia, a massa de repouso e as três velocidades da terceira partícula
produzida. Encontre a três velocidades do quadro CM.
23 Uma partícula de massa em repouso m tem três velocidades v. Encontre sua energia correta para termos
de ordem |v| 4. A que velocidade |v| o valor absoluto de 0(|v| 4) termo é igual a 2m|v| 2? termo decinética
energia
12
1
24 Prove que a conservação de quatro momentos proíbe uma reação na qual um elétron e
pósitron aniquilam e produzem um único fóton (raio ÿ). Prove que a produção de dois fótons não é
proibida.
25 (a) Deixe o referencial O se mover com velocidade v na direção x em relação a O. Deixe um fóton ter
frequência ÿ em O e se movem em um ângulo ÿ em relação ao eixo x de O. Mostre que seu
frequência em O¯ é
= (1 ÿ v cos ÿ)/ ÿ(1 ÿ v2). ÿ/ÿ ¯ (2,42)
(b) Mesmo quando o movimento do fóton é perpendicular ao eixo x (ÿ = ÿ/2) há

é uma mudança de frequência. Isso é chamado de deslocamento Doppler transversal e surge porque
da dilatação do tempo. Em que ângulo ÿ o fóton deve se mover para que haja
nenhum deslocamento Doppler entre O e O¯?
(c) Use as Eqs. (2.35) e (2.38) para calcular a Eq. (2.42).
26 Calcule a energia necessária para acelerar uma partícula de massa em repouso m = 0 de
velocidade v para velocidade v + ÿv (ÿv v), para primeira ordem em ÿv. Mostre que seria necessário um
quantidade infinita de energia para acelerar a partícula à velocidade da luz.
27 Dois corpos idênticos de massa 10 kg estão em repouso à mesma temperatura. Um deles
é aquecido pela adição de 100 J de calor. Ambos são então submetidos à mesma força.
Qual acelera mais rápido e em quanto?
28 Seja A ÿO (5, 1, ÿ1, 0), B ÿO (ÿ2, 3, 1, 6),C ÿO (2, ÿ2, 0, 0). Seja O¯ um quadro
movendo-se com velocidade v = 0,6 na direção x positiva em relação a O, com seus eixos espaciais
orientado paralelamente a O's.
(a) Encontre os componentes de , B , e C em O¯.
A (b) Forme os produtos escalares A , B · C , A · C , e C · C usando os componentes em O¯.
· B Verifique a independência do quadro desses números.
(c) Classifique , B , e C como temporal, espacial ou nulo.
A 29 Prove, usando as expressões componentes, Eqs. (2.24) e (2.26), que
d dU
(U · U ) = 2U · .
dÿ dÿ
30 A quatro velocidades de um foguete é U ÿ O (2, 1, 1, 1). Ele encontra uma alta velocidade
raio cósmico cujo momento é P ÿO (300, 299, 0, 0) × 10ÿ27 kg. Calcular o
energia do raio cósmico medida pelos passageiros do foguete, usando cada um dos
os dois métodos a seguir.
(a) Encontre as transformações de Lorentz de O para o MCRF do foguete e use
para transformar as componentes de P .
(b) Use a Eq. (2,35).
(c) Qual método é mais rápido? Por quê?
31 Um fóton de frequência ÿ é refletido sem mudança de frequência de um espelho, com
um ângulo de incidência ÿ. Calcule a quantidade de movimento transferida para o espelho. o que
momento seria transferido se o fóton fosse absorvido em vez de refletido?
32 Deixe uma partícula de carga e e massa em repouso m, inicialmente em repouso no laboratório, espalhar
um fóton de frequência inicial ÿi. Isso é chamado de espalhamento Compton. Suponha que o fóton
espalhado saia em um ângulo ÿ da direção do incidente. Use a conservação de
quatro momentos para deduzir que a frequência final do fóton ÿf é dada por
55 2.9 Exercícios
1 1 1 ÿ cos ÿ
= +h . (2,43)
ÿf ÿi m
33 O espaço é preenchido com raios cósmicos (prótons de alta energia) e a radiação cósmica de
fundo de micro-ondas. Estes podem Compton espalhar-se uns pelos outros. Suponha que um fóton de
energia hÿ = 2 × 10ÿ4 eV espalha um próton de energia 109mP = 1018 eV, energias
medido no quadro de repouso do Sol. Use a Eq. (2.43) no quadro de repouso inicial do próton para
calcule a energia final máxima que o fóton pode ter no quadro de repouso solar após
a dispersão. Que faixa de energia é essa (raio-X, visível, etc.)?
34 Mostre que, se A , B , e C são quaisquer vetores e ÿ e ÿ quaisquer números reais,
(ÿA ) · B = ÿ(A · B ),
A · (ÿB ) = ÿ(A · B ),
A · (B + C ) = A · B + A · C ,
(A + B ) · C = A · C + B · C .
35 Mostre que os vetores { eÿ¯} obtidos de { eÿ} pela Eq. (2.15) satisfaça eÿ¯ · eÿ¯ = ÿÿ¯ÿ¯ para
todos ÿ¯, ÿ¯.
3 Análise tensorial na relatividade especial
3.1 T heme rtensor
Considere a representação de dois vetores A e B na base { eÿ} de algum quadro O:
A = Aÿ eÿ, B = Bÿ eÿ.
Seu produto escalar é
A · B = (Aÿ eÿ) · (Bÿ eÿ).
(Observe a importância de usar diferentes índices ÿ e ÿ para distinguir a primeira soma da

segunda.) Seguindo Exer. 34, § 2.9, podemos reescrever isso como
A · B = AÿBÿ( eÿ · eÿ),
que, pela Eq. (2.27), é
A · B = AÿBÿÿÿÿ. (3.1)
Esta é uma maneira invariável de quadro de escrever
ÿA0B0 + A1B1 + A2B2 + A3B3.
Os números ÿÿÿ são chamados de 'componentes do tensor métrico'. Justificaremos esse

nome mais tarde. Neste momento, observamos que eles essencialmente fornecem uma
'regra' para associar a dois vetores A e B um único número, que chamamos de produto
escalar. A regra é que o número é a soma dupla AÿBÿÿÿÿ. Tal regra está no cerne do significado de 'ten
como agora discutimos.
3.2 D e fi ni ti onoftensores
Fazemos a seguinte definição de um tensor:

0 é uma função de N vetores nos números reais, que é linear em cada um de seus N
Um tensor de
N
argumentos de tipo.
57 3.2 Definição de tenso rs
0
Vejamos o que significa esta definição. Por enquanto, vamos apenas aceitar a notação que sua ;
N
justificativa virá mais adiante neste capítulo. A regra para o produto escalar, Eq. (3.1),
satisfaz nossa definição de tensor. É0uma regra que leva dois vetores, A e B , e
2
produz um único número real A · B . Dizer que é linear em seus argumentos significa o que é
provado em Exer. 34, § 2.9. Linearidade no primeiro argumento significa
(ÿA ) · B = ÿ(A · B ), ÿ
e (3.2)
ÿ
(A + B ) · C = A · C + B · C ,ÿ
enquanto a linearidade no segundo argumento significa
A · (ÿB ) = ÿ(A · B ),
A · (B + C ) = A · B + A · C .
Esta definição de linearidade é de importância central para a álgebra tensorial, e o estudante

deve estudá-lo com atenção.
Para dar concretude a essa noção do produto escalar ser um tensor, introduzimos um
nome e notação para ele. Deixamos g ser o tensor métrico e escrevemos, por definição,
g(A , B ):= A · B . (3.3)
Então consideramos g( , ) como uma função que pode receber dois argumentos e que é linear
naquilo
g(ÿA + ÿB , C ) = ÿg (A , C ) + ÿ g(B ,C ), (3.4)
e da mesma forma para o segundo argumento. O valor de g em dois argumentos, denotado por
g(A , B ), é seu produto escalar, um número real.
Observe que a definição de um tensor não menciona componentes dos vetores. UMA
tensor deve ser uma regra que dá o mesmo número real independentemente da referência
quadro no qual os componentes dos vetores são calculados. Mostramos no capítulo anterior
que a eq. (3.1) satisfaz este requisito. Isso nos permite considerar um tensor como uma função de
os próprios vetores em vez de seus componentes, e isso às vezes pode ser útil
conceitualmente.
Observe que uma função ordinária de posição, f(t, x, y,z), é uma função de valor real de não
vetores em tudo. Por isso, é classificado como 0 tensor.
0
Além do uso do termo 'função'
A noção mais familiar de uma função é expressa na equação
y = f(x),
onde y e x são números reais. Mas isso pode ser escrito mais precisamente como: f é uma 'regra'
(chamado mapeamento) que associa um número real (simbolicamente chamado y, acima) com
outro número real, que é o argumento de f (simbolicamente chamado x, acima). A função em si não
é f(x), pois f(x) é y, que é um número real chamado 'valor' do
função. A função em si é f , que podemos escrever como f( ) para mostrar que ela tem
um argumento. Em álgebra, isso parece muito complicado, já que inconscientemente pensamos em x
e y como duas coisas ao mesmo tempo: são, por um lado, números reais específicos e, por outro,
por outro lado, nomes para números reais gerais e arbitrários. No cálculo tensorial, faremos
esta distinção explícita: A e B são vetores específicos , A · B é um número real específico, e g
é o nome da função que associa A · B com A e B .
Componentes de um tensor
Assim como um vetor, um tensor tem componentes. Eles são definidos como:
0
Os componentes em um quadro O de um tensor do N são os valores da função quando seus argumentos
tipo são os vetores de base { eÿ} do quadro O.
Assim, temos a noção de componentes como números dependentes de quadro (frame-dependente

porque a base se refere a um quadro específico). Para o tensor métrico, isso dá a
componentes como
(3.5)
g( eÿ, eÿ) = eÿ · eÿ = ÿÿÿ.
Assim, a matriz ÿÿÿ que introduzimos antes deve ser pensada como uma matriz dos componentes de g com base.
Em outra base, os componentes podem ser diferentes. Nós teremos
muitos outros exemplos disso mais tarde. Primeiro estudamos uma classe particularmente importante de tensores.
0
3.3 O 1
tensores: uma forma
0 é chamado um covetor, um vetor covariante, ou uma forma. Muitas vezes esses

Um tensor dos nomes de
1
tipo é usado de forma intercambiável, mesmo em um único livro-texto ou referência.
Propriedades gerais
˜
Seja uma forma arbitrária chamada p˜. (Adotamos a notação de que uma forma acima de um símbolo denota
única, assim como acima um símbolo denota um vetor.) Então p˜, fornecido com um vetor
argumento, dá um número real: p˜(A ) é um número real. Suponha que q˜ seja outra forma. Então
podemos definir
s˜ = ˜p + ˜q,
(3.6a)
r˜ = ÿp˜,
0
59 3.3 O 1 tensores: uma forma
para ser as formas únicas que assumem os seguintes valores para um argumento A :
s˜(A ) = ˜p(A ) + q(A ),

(3.6b)
r˜(A˜) = ÿp (A ).
Com essas regras, o conjunto de todas as formas um satisfaz os axiomas para um espaço vetorial, que
contas para seus outros nomes. Este espaço é chamado de 'espaço vetorial dual' para distingui-lo
do espaço de todos os vetores como A .
Ao discutir vetores, confiamos muito nos componentes e suas transformações.

Vejamos os de p˜. Os componentes de p˜ são chamados de pÿ:
pÿ := ˜p( eÿ). (3.7)
Qualquer componente com um único índice inferior é, por convenção, o componente de uma forma única;
um índice superior denota o componente de um vetor. Em termos de componentes, p˜(A ) é
p˜(A ) = ˜p(Aÿ eÿ)
= Aÿp˜( eÿ),
p˜(A ) = Aÿpÿ. (3.8)
O segundo passo decorre da linearidade que é o cerne da definição que demos de um

tensor. Assim, o número real p˜(A ) é facilmente encontrado como sendo a soma A0p0 + A1p1 + A2p2 + A3p3.
Observe que todos os termos têm sinais de mais: esta operação é chamada de contração de A e p˜, e
é mais fundamental na análise tensorial do que o produto escalar porque pode ser realizado
entre qualquer forma e vetor sem referência a outros tensores. Nós vimos isso
dois vetores não podem fazer um escalar (seu produto escalar) sem a ajuda de um terceiro tensor, o
métrica.
As componentes de p˜ em uma base { eÿ¯} são
pÿ¯ := ˜p( eÿ¯) = ˜p( ÿ¯ eÿ)

ÿ ÿ
= (3.9)
ÿ¯p˜( eÿ) = ÿ¯pÿ.
Comparando isso com

ÿ
eÿ¯ = ÿ¯ eÿ,
vemos que os componentes de uma forma se transformam exatamente da mesma maneira que os vetores de base
e de maneira oposta às componentes de vetores. Por 'oposto', queremos dizer usar o
transformação inversa. Este uso do inverso garante que Aÿpÿ é independente do quadro
para qualquer vetor A e p˜ de uma forma. Esta é uma observação tão importante que provaremos
explicitamente:
Aÿ¯ pÿ¯ = ( ÿ¯ ÿAÿ)( ÿÿ¯ pÿ), ÿ¯ (3.10a)
ÿÿÿAÿpÿ, = Aÿpÿ.
ÿAÿpÿ, = ÿÿ¯ = (3.10b)
(3.10c)
(3.10d)
(Esta é a mesma maneira pela qual o vetor Aÿ eÿ é mantido independente do referencial.) Esta inversa
transformação dá origem à palavra 'dual' em 'espaço vetorial dual'. A propriedade de transformar com vetores de
base dá origem ao co em 'vetor covariante' e sua forma mais curta
'covector'. Como os componentes de vetores comuns se transformam de forma oposta aos vetores de base (em
para manter o quadro Aÿ eÿ independente), eles são freqüentemente chamados de vetores 'contravariantes'. A maioria
desses nomes são antiquados; 'vetores' e 'vetores duais' ou 'formas únicas' são os nomes modernos. A razão pela
qual 'co' e 'contra' foram abandonados é que eles se misturam
duas coisas muito diferentes: a transformação de uma base é a expressão de novos vetores em
termos dos antigos ; a transformação de componentes é a expressão do mesmo objeto em
termos da nova base. É importante que o aluno tenha certeza dessas distinções antes de
seguindo adiante.
Formas básicas
Como o conjunto de todas as formas um é um espaço vetorial, podemos usar qualquer conjunto de quatro formas
um linearmente independentes como base. (Como em qualquer espaço vetorial, diz-se que uma forma é linearmente
independente se nenhuma combinação linear não trivial for igual à forma zero. A forma zero um é aquela cujo valor
em qualquer vetor é zero.) No entanto, na seção anterior,
já usaram os vetores de base { eÿ} para definir os componentes de uma forma. Isso sugere que devemos ser
capazes de usar os vetores de base para definir uma base uniformal associada
{ ˜ÿÿ, ÿ = 0, ... , 3}, que chamaremos de base dual para { eÿ}, sobre a qual uma forma única tem
os componentes definidos acima. Ou seja, queremos um conjunto { ˜ÿÿ} tal que
p˜ = pÿÿ˜ ÿ. (3.11)
ÿ
(Observe que usando um índice elevado em ÿ˜ permite que a convenção de soma funcione.) O
{ ˜ÿÿ} são quatro formas distintas, assim como os { eÿ} são quatro vetores distintos. Esta equação
deve implicar a Eq. (3.8) para qualquer vetor A e p˜ de uma forma:
p˜(A ) = pÿAÿ.
Mas a partir da Eq. (3.11) obtemos
p˜(A ) = pÿÿ˜ ÿ(A )
= pÿÿ˜ ÿ(Aÿ eÿ)
= pÿAÿÿ˜ ÿ( eÿ).
(Observe o uso de ÿ como índice na segunda linha, para distinguir sua soma
de um em ÿ.) Agora, esta linha final só pode igualar pÿAÿ para todos Aÿ e pÿ se
ÿ˜ ÿ( eÿ) = ÿÿ ÿ. (3.12)
Comparando com a Eq. (3.7), vemos que esta equação dá a ÿª componente da

ÿth base de uma forma. Portanto, define a ÿth base de uma forma. Podemos escrever esses
componentes como
0
0
ÿ˜
ÿO (1, 0, 0, 0),
1 ÿ˜
ÿO (0, 1, 0, 0),
2 ÿ˜
ÿO (0, 0, 1, 0),
3 ÿ˜
ÿO (0, 0, 0, 1).
É importante entender dois pontos aqui. Uma é que a Eq. (3.12) define a base
{ ˜ÿÿ} em termos da base { eÿ}. A base vetorial induz uma base de forma única e conveniente. Esta não é
a única base única possível, mas é muito útil ter a
relacionamento, eq. (3.12), entre as bases que sempre iremos utilizar. O relacionamento,
0
Eq. (3.12), está entre as duas bases, não entre pares individuais, como ÿ˜ e e0.
Ou seja, se mudarmos e0, deixando e1, e2 e e3 inalterados, então, em geral, isso
0
mudanças não apenas na posição de ÿ˜mas também
é que, empossamos
embora ÿ˜ 1, ÿ˜ 2, descrever
e ÿ˜ 3. O segundo pontoquanto
tanto vetores a induzuma-
formas dando um conjunto de quatro
componentes, seu significado geométrico é muito diferente. O aluno não deve perder
vista do fato de que os componentes contam apenas parte da história. A base contém o
restante das informações. Ou seja, um conjunto de números (0, 2, ÿ1, 5) sozinho não define nada; para
transformá-lo em algo, devemos dizer se estes são componentes em um vetor
base ou uma base de uma forma e, de fato, qual do número infinito de bases possíveis é
sendo usado.
Resta determinar como { ˜ÿÿ} se transforma sob uma mudança de base. Ou seja, cada quadro
tem seu próprio conjunto único { ˜ÿÿ}; como os dois quadros estão relacionados? A derivação aqui é
análogo ao dos vetores de base. Isso leva à única equação com a qual podemos escrever
os índices em suas posições corretas:
= ÿ¯
(3.13)
ÿ¯ ÿ˜ ÿÿ˜ ÿ.
Isso é o mesmo que para componentes de um vetor, e oposto para componentes de um

uma forma.
Imagem de um formulário
Para vetores, geralmente imaginamos uma seta se precisarmos de uma imagem. É útil ter um
imagem de um formulário também. Em primeiro lugar, não é uma flecha. Sua imagem deve refletir a
fato de que ele mapeia vetores em números reais. Um vetor em si não mapeia automaticamente
outro vetor em um número real. Para fazer isso, ele precisa de um tensor métrico para definir o escalar
produtos. Com uma métrica diferente, os mesmos dois vetores produzirão um produto escalar diferente .
Então, dois vetores por si só não dão um número. Precisamos de uma imagem de um formulário
que não depende de nenhum outro tensor ter sido definido. O geralmente usado
por matemáticos é mostrado na Fig. 3.1. A forma única consiste em uma série de superfícies. o
'magnitude' dela é dada pelo espaçamento entre as superfícies: quanto maior o espaçamento,
menor a magnitude. Nesta imagem, o número produzido quando uma forma única atua em um
vetor é o número de superfícies que a seta do vetor perfura. Então, quanto mais perto deles
(uma) (b) (c)
Figura 3.1 (a) A imagem de uma forma complementar à de um vetor como uma seta. (b) O valor
de uma forma em um dado vetor é o número de superfícies que a seta perfura. (c) O valor
de uma forma menor no mesmo vetor é um número menor de superfícies. Quanto maior a
forma, mais 'intensa' é a divisão do espaço em sua imagem.
espaçamento, maior o número (compare (b) e (c) na Fig. 3.1). Em um espaço quadridimensional, as superfícies
são tridimensionais. A forma única não define uma direção única, pois não é um vetor. Em vez disso, define uma
maneira de 'fatiar' o espaço. Para justificar esta imagem, vamos olhar para uma forma particular, o gradiente.
O gradiente de uma função é uma forma
Considere um campo escalar ÿ( x) definido em cada evento x. A linha de mundo de alguma partícula (ou pessoa)
encontra um valor de ÿ em cada uma delas (veja a Fig. 3.2), e esse valor muda de evento para evento. Se
rotularmos (parametrizar) cada ponto na curva pelo valor do tempo próprio ÿ ao longo dele (ou seja, a leitura de
um relógio se movendo na linha), então podemos expressar as coordenadas dos eventos na curva como funções
de ÿ :
[t = t(ÿ ), x = x(ÿ ), y = y(ÿ ), z = z(ÿ )].
A quatro velocidades tem componentes
dt _ dx _
Uÿ , , ... .
dÿ dÿ
Como ÿ é uma função de t, x, y e z, é implicitamente uma função de ÿ na curva:
ÿ(ÿ ) = ÿ[t(ÿ ), x(ÿ ), y(ÿ ), z(ÿ )],
e sua taxa de variação na curva é

0
ÿ
ÿ=2 você
ÿ=1 ÿ(ÿ) = ÿ[t(ÿ), x(ÿ), y(ÿ), z(ÿ)]
ÿ=0
x
Figura 3.2 Uma linha mundial parametrizada pelo tempo próprio , e os valores ÿ(ÿ ) do campo escalar ÿ(t, x, y, z)
ÿ ao longo dela.
dÿ ÿÿ dt ÿÿ dx ÿÿ dy ÿÿ dz
= + + + ÿt
dÿ dÿ ÿx dÿ ÿy dÿ ÿz dÿ
ÿÿ ÿÿ ÿÿ ÿÿ
= Ut + Ux + Uy + Uz . ÿt (3.14)
ÿx ÿy ÿz
Fica claro disso que na última equação criamos um meio de produzir a partir de
o vetor U o número dÿ/dÿ que representa a taxa de variação de ÿ em uma curva na qual
U é a tangente. Este número dÿ/dÿ é claramente uma função linear de U a uma , então nós definimos
forma.
Por comparação com a Eq. (3.8), vemos que essa forma única tem componentes
(ÿÿ/ÿt, ÿÿ/ÿx, ÿÿ/ÿy, ÿÿ / ÿz ). Esta forma única é chamada de gradiente de ÿ, denotado por d˜ÿ:
ÿÿ ÿÿ ÿÿ ÿÿ
, , , . (3.15)
d˜ÿ ÿO ÿt ÿx ÿy ÿz
É claro que o gradiente se encaixa em nossa definição de uma forma. Veremos mais tarde como é
acontece que o gradiente é geralmente introduzido no cálculo vetorial tridimensional
como vetor.
O gradiente nos permite justificar nossa imagem de uma forma. Na Fig. 3.3 desenhamos
parte de um mapa topográfico, mostrando contornos de igual elevação. Se h é a elevação, então
o gradiente d˜h é claramente maior em uma área como A, onde as linhas estão mais próximas,
e menor perto de B, onde as linhas são espaçadas. Além disso, suponha que quiséssemos
para saber quanta elevação uma caminhada entre dois pontos envolveria. Nós nos deitaríamos
no mapa uma linha (vetor x) entre os pontos. Então o número de contornos da linha
1
cruzado daria a mudança de elevação. Por exemplo, a linha 1 cruza 1 contorno, enquanto
2
2 cruza dois contornos. A linha 3 começa perto da 2, mas segue em uma direção diferente, terminando
1
contorno mais alto. Mas esses números são apenas h, que é a contração de d˜h com
2 x : h(ÿh/ÿxi
apenas = ) xi ou o valor de d˜h em x (ver Eq. (3.8)).
eu
UMA
3
40 2
30
1
20
B
10
Figura 3.3 Um mapa topográfico ilustra o gradiente de uma forma (contornos locais de elevação constante). o
mudança de altura ao longo de qualquer viagem (seta) é o número de contornos cruzados pela seta.
ÿ
V
Figura 3.4 O valor ÿ˜(V ) é 2,5.
Portanto, uma forma única é representada por uma série de superfícies (Fig. 3.4), e sua contração com um
vetor V é o número de superfícies que V cruza. Quanto mais próximas as superfícies, maior ÿ˜. Corretamente,
assim como um vetor é reto, as superfícies de uma forma são retas e paralelas.
Isso ocorre porque lidamos com uma-formas em um ponto, não sobre uma região estendida: uma-formas
'tangentes', no mesmo sentido dos vetores tangentes.
Essas imagens mostram por que, em geral , não podemos chamar um gradiente de vetor. Gostaríamos de
identificar o vetor gradiente como aquele vetor apontando 'para cima' da inclinação, ou seja, de tal forma que
ele cruze o maior número de contornos por unidade de comprimento. A frase-chave é 'por unidade de comprimento'.
Se houver uma métrica, uma medida de distância no espaço, então um vetor pode ser associado a um gradiente.
Mas a métrica deve intervir aqui para produzir um vetor. Geometricamente, por si só, o gradiente é uma forma
única.
Tenhamos certeza de que a Eq. (3.15) é uma definição consistente. Como os componentes
transformar? Para uma forma única devemos ter
ÿ
(d˜ÿ)ÿ¯ = ÿ¯ (d˜ÿ)ÿ. (3.16)
Mas sabemos como transformar derivadas parciais:
ÿÿ ÿxÿ
ÿÿ ÿxÿ
= ,
ÿxÿ¯ ÿxÿ¯
0
que significa
ÿxÿ
(d˜ÿ)ÿ¯ = (d˜ÿ)ÿ. (3.17)
ÿxÿ¯
São as Eqs. (3.16) e (3.17) consistente? A resposta, claro, é sim. O motivo: desde
xÿ = ÿ xÿ¯ ,
ÿ¯
e como ÿÿ¯ são apenas constantes, então
ÿxÿ/ÿxÿ¯ = ÿ (3.18)
ÿ¯ .
Essa identidade é fundamental. Componentes do gradiente se transformam de acordo com o

inversa das componentes de vetores. Portanto, o gradiente é a forma 'arquetípica'.
Notação para derivativos
De agora em diante, empregaremos a notação subscrita usual para indicar derivadas:
ÿÿ
ÿx := ÿ,x
e, mais geralmente,
ÿÿ
:= ÿ,ÿ. (3.19)
ÿxÿ
Observe que o índice ÿ aparece como um sobrescrito no denominador do lado esquerdo de

Eq. (3.19) e como subscrito no lado direito. Como vimos, essa colocação de
índices é consistente com as propriedades de transformação da expressão.
Em particular, temos
xÿ , ÿÿ,ÿ ÿÿ
que podemos comparar com a Eq. (3.12) para concluir que
d˜xÿ := ˜ÿÿ. (3.20)
Este é um resultado útil, que a base de uma forma é apenas d˜xÿ. Podemos usá-lo para escrever, para qualquer
função f ,
ÿf
df = d˜xÿ.
ÿxÿ
Isso se parece muito com a maneira˜ de 'cálculo desleixado' do físico de escrever diferenciais ou
infinitesimais. A notação d foi escolhida em parte para sugerir essa comparação, mas essa escolha
torna duplamente importante para o aluno evitar confusão nesse ponto. o
objeto d˜f é um tensor, não um pequeno incremento em f ; pode ter um valor pequeno ('infinitesimal')
se for contraído com um vetor pequeno.
Formas únicas normais
Assim como o gradiente, o conceito de vetor normal – um vetor ortogonal a uma superfície – é
uma que é mais naturalmente substituída pela de uma forma normal. Para um vetor normal
ser definido precisamos ter um produto escalar: o vetor normal deve ser ortogonal a todos
vetores tangentes à superfície. Isso pode ser definido apenas usando o tensor métrico. Mas um
uma forma normal pode ser definida sem referência à métrica. Diz-se que uma forma única é
normal a uma superfície se seu valor for zero em cada vetor tangente à superfície. Se a superfície
é fechado e divide o espaço-tempo em um 'dentro' e 'fora', um normal é dito ser um
uma forma normal externa se for uma forma normal e seu valor em vetores que apontam
para fora da superfície é positivo. Em Exer. 13, § 3.10, provamos que d˜f é normal a
superfícies de constante f .
0
3.4 O 2 tensores
0
Os tensores do tipo têm
2
dois argumentos vetoriais. Encontramos o tensor métrico
já, mas o mais simples desse tipo é o produto de duas formas únicas, formadas de acordo com
0
à seguinte regra: se p˜ e q˜ são uma-formas, então p˜ ÿ ˜q é o tensor que, quando 2
fornecido com os vetores A e B como argumentos, produz o número p˜(A ) q˜(B ), ou seja, apenas o
0
produto dos números produzidos pelos tensores. O símbolo
1
ÿ é chamado de 'exterior
0 tensor é formado a partir de um
sinal do produto' e é uma notação formal para mostrar como as 2
formas. Observe que ÿ não é comutativo: p˜ ÿ ˜q e q˜ ÿ ˜p são tensores diferentes . O primeiro
dá o valor p˜(A ) q˜(B ), o segundo o valor q˜(A ) p˜(B ).
Componentes
0
O tensor mais geral não2 é um simples produto externo, mas sempre pode ser representado
como uma soma de tais tensores. Para ver isso, devemos primeiro considerar os componentes de um
0 tensor f:
2
fÿÿ := f( eÿ, eÿ). (3.21)
Como cada índice pode ter quatro valores, existem 16 componentes, e eles podem ser pensados
de como sendo dispostos em uma matriz. O valor de f em vetores arbitrários é
f(A , B ) = f(Aÿ eÿ, = Bÿ eÿ)
AÿBÿf( eÿ, e¯ÿ)
= AÿBÿfÿÿ. (3.22)
(Novamente, observe que dois índices fictícios diferentes são usados para manter os diferentes somatórios
0
distintos.) Podemos formar uma base para esses tensores? Ou seja, podemos definir um conjunto de 16
2
tensores ÿ˜ ÿÿ tal que, análogo à Eq. (3.11),
0
67 3.4 O 2
tensores
f = fÿÿÿ˜ ÿÿ? (3.23)
Para que isso acontecesse, teríamos que ter
fÿÿ = f( eÿ, eÿ ) = fÿÿÿ˜ ÿÿ( eÿ, eÿ )
e isso implicaria, como antes, que
ÿ˜ ÿÿ( eÿ, eÿ ) = ÿÿ ÿÿÿ ÿ . (3.24)
ÿ
Mas ÿÿÿ é (pela Eq. (3.12)) o valor de ÿ˜ é um em eÿ, e analogamente para ÿÿÿ . Portanto, ÿ˜ ÿÿ
tensor cujo valor é apenas o produto dos valores de duas formas de uma base,
e por isso concluímos
ÿ˜ ÿÿ = ˜ÿÿ ÿ ˜ÿÿ. (3,25)
Então os tensores ÿ˜ÿ ÿ ˜ÿÿ são uma base para todos 0 tensores, e podemos escrever
2
ÿ
f = fÿÿÿ˜ ÿ ˜ÿÿ. (3.26)
0
Esta é uma maneira pela qual um general 2 tensor é uma soma sobre tensores de produto externo simples.
Simetrias
0
UMA
2
tensor recebe dois argumentos, e sua ordem é importante, como vimos. O comportamento do valor
de um tensor sob um intercâmbio de seus argumentos é uma propriedade importante
disso. Um tensor f é chamado simétrico se
f(A , B ) = f(B , A ) ÿA ,B . (3,27)
Definindo A = eÿ e B = eÿ, isso implica de seus componentes que
fÿÿ = fÿÿ. (3,28)
Isso é o mesmo que a condição de que a matriz de matrizes dos elementos seja simétrica. Um
0
arbitrário 2 tensor h pode definir um novo h(s) simétrico pela regra
1 1
h(s)(A , B ) = 2h(A , B ) + 2h(B , A ). (3,29)
Certifique-se de entender que h(s) satisfaz a Eq. (3.27) acima. Para os componentes isso
implica
1
h(s)ÿÿ = (3.30)
2 (hÿÿ + hÿÿ).
Esta é uma propriedade matemática tão importante que uma notação especial é usada para ela:
1
h(ÿÿ) := (3.31)
2 (hÿÿ + hÿÿ).
Portanto, os números h(ÿÿ) são os componentes do tensor simétrico formado a partir de h.

Da mesma forma, um tensor f é chamado antisimétrico se
f(A , B ) = ÿf(B , A ), ÿA fÿÿ = , B , (3.32)
ÿfÿÿ. (3.33)
0
Um antisimétrico 2 tensor sempre pode ser formado como
1 1
h(A)(A , B ) = 2h(A , B ) ÿ 2h(B , A ),
1
h(A)ÿÿ = 2 (hÿÿ ÿ hÿÿ).
A notação aqui é usar colchetes nos índices:
1
h[ÿÿ] = 2 (hÿÿ ÿ hÿÿ). (3,34)
Notar que
1 1
hÿÿ = 2 (hÿÿ + hÿÿ) + 2 (hÿÿ - hÿÿ)
= h(ÿÿ) + h[ÿÿ]. (3,35)
0
Assim, 2 tensor pode ser dividido exclusivamente em suas partes simétricas e antisimétricas.
qualquer O tensor métrico g é simétrico, como pode ser deduzido da Eq. (2.26):
g(A , B ) = g(B , A ). (3,36)
3.5 M et ri casamap pingofvectors intoone - for rm s
Apresentamos agora o que veremos mais adiante é o papel fundamental da métrica em diferentes
geometria inicial, para atuar como um mapeamento entre vetores e formas únicas. Para ver como isso funciona,
considere g e um único vetor V . Como g requer dois argumentos vetoriais, a expressão
g(V , ) ainda falta um: quando outro é fornecido, torna-se um número. Portanto, g(V , )
considerado como uma função de vetores (que devem preencher o 'slot' vazio nele) é um
função de vetores que produzem números reais: uma forma. Chamamos de V˜ :
g(V , ):= V˜ ( ), (3,37)
onde espaços em branco entre parênteses são uma maneira de indicar que um argumento vetorial deve ser
fornecido. Então V˜ é a forma única que avalia em um vetor A a V · A :
V˜ (A ) := g(V , A ) = V · A . (3,38)
Observe que, como g é simétrica, também podemos escrever
( g( , V ) := V˜ ).
69 3.5 Métrica como um mapeamento de vec para rs em uma forma
Quais são as componentes de V˜ ? Eles são
Vÿ := V˜ ( eÿ) = V · eÿ = eÿ · V = eÿ
· (Vÿ eÿ)
= ( eÿ · eÿ)Vÿ
Vÿ = ÿÿÿVÿ. (3,39)
É importante ñotar aqui que distinguimos as componentes Vÿ de V das componentes Vÿ de V

apenas pela posição do índice: em um vetor é para cima; em uma forma, para baixo.
Então, da Eq. (3.39), temos como caso especial
V0 = Vÿÿÿ0 = V0ÿ00 + V1ÿ10 + ...
= V0(ÿ1) + 0 + 0 + 0
= ÿV0, (3,40)
V1 = Vÿÿÿ1 = V0ÿ01 + V1ÿ11 + ...

= +V1, (3.41)
etc. Isso pode ser resumido como:
se V ÿ (a, b, c, d),
então V˜ ÿ (ÿa, b, c, d). (3,42)
As componentes de V˜ são obtidas das de V alterando o sinal da componente de tempo. (Como isso
dependia dos componentes ÿÿÿ, em situações que encontramos mais tarde,
onde a métrica tem componentes mais complicados, esta regra de correspondência entre
V˜ e V também serão mais complicados.)
O inverso: indo de A˜ para A

A métrica também fornece uma maneira de encontrar um vetor A que está relacionado a uma dada forma única?
UMA ? A resposta é sim. Considere a Eq. (3.39). Ele diz que {Vÿ} é obtido pela multiplicação de {Vÿ}
por uma matriz (ÿÿÿ). Se esta matriz tem uma inversa, então podemos usá-la para obter {Vÿ} de
{Vÿ}. Este inverso existe se e somente se (ÿÿÿ) tem determinante não evanescente. Mas uma vez que (ÿÿÿ)
é uma matriz diagonal com entradas (ÿ1, 1, 1, 1), seu determinante é simplesmente ÿ1. Um inverso faz
existem, e chamamos seus componentes de ÿÿÿ. Então, dado {Aÿ} , podemos encontrar {Aÿ}:
Aÿ := ÿÿÿAÿ. (3,43)
O uso da inversa garante que os dois conjuntos de componentes satisfaçam a Eq. (3.39):
Aÿ = ÿÿÿAÿ.
Portanto, o mapeamento fornecido por g entre vetores e formas um é um para um e invertível.

Em particular, com d˜ÿ podemos associar um vetor dÿ, que é o usualmente associado ao
gradiente. Podemos ver que este vetor é ortogonal a superfícies de constante ÿ como segue: seu
produto interno com um vetor em uma superfície de constante ÿ é, por este mapeamento, idêntico
ao valor da forma única d˜ÿ naquele vetor. Este, por sua vez, deve ser zero, pois d˜ÿ(V ) é a taxa
, que neste
de variação de ÿ ao longo de V em uma superfície caso é zero, pois V é considerado
de ÿ constante.
É importante saber o que é {ÿÿÿ} . Você pode verificar facilmente que
ÿ00 = ÿ1, ÿ0i = 0, ÿij = ÿij, (3,44)
de modo que (ÿÿÿ) é idêntico a (ÿÿÿ). Assim, para passar de uma forma para um vetor, basta
alterar o sinal do componente de tempo.
Por que distinguir formas únicas de vetores?
No espaço euclidiano, em coordenadas cartesianas a métrica é apenas {ÿij}, então os componentes

de uma forma e vetores são os mesmos. Portanto, nenhuma distinção é feita em álgebra vetorial
elementar. Mas em SR os componentes diferem (por essa mudança de sinal). Portanto, enquanto
o gradiente tem componentes
ÿÿ ÿÿ
d˜ÿ ÿ , , ... ,
ÿt ÿx
o vetor associado normal às superfícies de constante ÿ tem componentes
ÿÿÿ ÿÿ
d˜ÿ ÿ , , ... . (3,45)
ÿt ÿx
Se tivéssemos simplesmente tentado definir o 'gradiente vetorial' de uma função como o vetor com
esses componentes, sem primeiro discutir formas únicas, o leitor estaria justificado em ser mais do
que um pouco cético. A métrica não-euclidiana de SR nos obriga a estar cientes da distinção básica
entre formas únicas e vetores: ela não pode ser varrida para debaixo do tapete.
Como observamos anteriormente, vetores e formas unitárias são duais entre si. Esses espaços
duais são importantes e são encontrados em outras partes da física matemática. O exemplo mais
simples é o espaço de vetores coluna na álgebra matricial
uma
ÿ b ÿ
..
ÿ . ÿ,
cujo espaço dual é o espaço dos vetores linha (ab ··· ). Observe que o produto
(ab ...) ÿ pq ÿ (3,46)

.. = ap + bq + ...
ÿ . ÿ
71 3.5 Métrica como um mapeamento de vec para rs em uma forma
é um número real, de modo que um vetor de linha pode ser considerado uma forma em vetores de coluna.
A operação de encontrar um elemento de um espaço a partir de um dos outros é chamada de
'adjunto' e é 1-1 e invertível. Um exemplo menos trivial surge na mecânica quântica.
Uma função de onda (amplitude de probabilidade que é uma solução para a equação de Schrödinger) é uma
campo escalar complexo ÿ( x), e é extraído do espaço de Hilbert de todas essas funções. este
O espaço de Hilbert é um espaço vetorial, pois seus elementos (funções) satisfazem os axiomas de um
espaço vetorial. Qual é o espaço dual de uma forma? A dica crucial é que o produto interno
de quaisquer duas funções ÿ( x) e ÿ( x) não é ÿ( x)ÿ( x) d3x, mas sim ÿÿ( x)ÿ( x) d3x,
o asterisco denotando conjugação complexa. A função ÿÿ( x) age como uma forma única cuja
valor em ÿ( x) é sua integral com ele (análoga à soma na Eq. (3.8)). A operação
de conjugação complexa age como nosso tensor métrico, transformando um vetor ÿ( x) (no
espaço de Hilbert) em uma forma ÿÿ( x). O fato de que ÿÿ( x) também é uma função no método de Hilbert
o espaço é, neste nível, uma distração. (É equivalente a dizer que os membros do conjunto
(1, ÿ1, 0, 0) podem ser componentes de um vetor ou de uma forma.) O ponto importante
é que na integral ÿÿ( x)ÿ( x) d3x, a função ÿÿ( x) está atuando como uma forma, produzindo um número
(complexo) a partir do vetor ÿ( x). Este dualismo é mais claramente trazido
na notação Dirac 'bra' e 'ket'. Os elementos do espaço de todos os estados do sistema são chamados |
(com etiquetas de identificação escritas no interior), enquanto os elementos da dupla
(adjunto com conjugado complexo) espaço são chamados |. Dois 'vetores' |1 e |2 não
formam um número, mas um vetor e um vetor dual |1 e 2| faça: 2|1 é o nome disso
número.
Dessa forma, o conceito de um espaço vetorial dual surge com muita frequência em
física matemática.
Magnitudes e produtos escalares de uma forma
Um p˜ de uma forma é definido para ter a mesma magnitude que seu vetor associado p . Desta forma
nós escrevemos
p˜2 = p2 = ÿÿÿpÿpÿ. (3,47)
Isso parece envolver encontrar {pÿ} de {pÿ} antes de usar a Eq. (3.47), mas podemos
facilmente contornar isso. Usamos a Eq. (3.43) para pÿ e pÿ na Eq. (3,47):
p˜2 = ÿÿÿ(ÿÿÿpÿ)(ÿÿÿpÿ ). (3,48)
(Observe que cada soma independente usa um índice fictício diferente.) Mas como ÿÿÿ
e ÿÿÿ são matrizes inversas entre si, a soma em ÿ colapsa:
ÿÿÿÿÿÿ = ÿÿ ÿ. (3,49)
Usando isso na Eq. (3,48) dá
p˜2 = ÿÿÿpÿpÿ. (3,50)

Assim, o tensor métrico inverso pode ser usado diretamente para encontrar a magnitude de p˜ de seu
componentes. Podemos usar a Eq. (3.44) para escrever isso explicitamente como
2
p˜2 = ÿ (p0) 2 + (p1) 2 + (p2) + (p3) 2. (3,51)
Esta é a mesma regra, de fato, como a Eq. (2.24) para vetores. Por sua definição, este é o quadro
invariante. As formas únicas são semelhantes ao tempo, ao espaço ou nulas, como são seus vetores associados.
Tal como acontece com os vetores, agora podemos definir um produto interno de uma forma. Isto é
1 2
p˜ · ˜q := (p˜ + ˜q) ÿ ˜p2 ÿ ˜q2 . (3,52)
2
Sua expressão em termos de componentes é, não surpreendentemente,
p˜ · ˜q = ÿp0q0 + p1q1 + p2q2 + p3q3. (3,53)
Vetores normais e formas unitárias normais
Diz-se que um vetor é normal a uma superfície se sua forma associada for normal
Formato. Eq. (3.38) mostra que esta definição é equivalente à usual de que o vetor seja
ortogonal a todos os vetores tangentes. Um vetor normal ou uma forma é dito ser uma unidade normal
se sua magnitude for ±1. (Não podemos exigir que seja +1, já que vetores tipo tempo terão
grandezas negativas. Tudo o que podemos fazer é multiplicar o vetor ou forma por um fator global
para dimensionar sua magnitude para ±1.) Observe que normais nulas não podem ser normais unitárias.
Diz-se que uma superfície tridimensional é temporal, espacial ou nula, de acordo com a qual
dessas classes sua normal se enquadra. (Exer. 12, § 3.10, prova que esta definição é auto consistente.) Em Exer.
21, § 3.10, exploramos as seguintes propriedades curiosas dos vetores normais
temos por conta da nossa métrica. Um vetor normal externo é o vetor associado a
uma forma normal externa, conforme definido anteriormente. Isso garante que seu produto escalar com
qualquer vetor que aponta para fora é positivo. Se a superfície é semelhante ao espaço, o vetor normal externo
aponta para fora. Se a superfície for semelhante ao tempo, no entanto, o vetor normal externo
aponta para dentro. E se a superfície for nula, o vetor externo é tangente à superfície!
Essas peculiaridades simplesmente reforçam a visão de que é mais natural considerar o normal como
um formulário único, em que a métrica não entra na definição.
M
3.6 Para finalizar: N tensores
Vetor em função de uma forma
O dualismo discutido acima é de fato completo. Embora tenhamos definido uma forma como funções de vetores,
agora podemos ver que os vetores podem perfeitamente ser considerados lineares.
,
funções que mapeiam uma forma em números reais. Dado um vetor V uma vez que fornecemos um
de uma forma, obtemos um número real:
M
73 3.6 Finalmente: N tensores
V (p˜) ÿ ˜p(V ) ÿ pÿVÿ ÿ ˜p, V . (3,54)
Desta forma, destronamos vetores de sua posição especial como coisas 'atuadas' por tensores,
e considerá-los como próprios tensores, especificamente como funções lineares de formas únicas
em números reais. A última notação da Eq. (3.54) é novo, e enfatiza o status igual
dos dois objetos.
M
0
tensores
Generalizando isso, definimos:

M
Um 0 tensor é uma função linear de M uma forma nos números reais.
0 2
Todas as nossas discussões anteriores sobre
N tensores se aplicam aqui. Um 0 tensor é V ÿ W ,
simples que, quando fornecido com dois argumentos p˜ e q˜, dá o número V (p˜)W (q˜) :=
2
p˜(V )q˜(W ) = VÿpÿWÿqÿ. Então V ÿ W tem componentes VÿWÿ. Uma base para tensores é 0
M ÿ
eÿ ÿ eÿ. Os componentes de an são seus tensor são seus valores quando a base de uma forma ÿ˜
0
M
argumentos. Observe que os sobrescritos. 0 tensores têm componentes cujos índices são todos
M
N
tensores
A generalização final é:
M
Um N tensor é uma função linear de M uma-formas e N vetores nos números reais.
1
Por exemplo, se R é um tensor,
1 então ele requer uma forma p˜ e um vetor A para dar um
número R(p˜; A ). Tem componentes R(ÿ˜ ÿ; eÿ) := Rÿ ÿ. Em geral, os componentes de um
M
N tensor terá índices M para cima e N para baixo. Em um novo quadro,
ÿ
Rÿ¯
ÿ¯ = R(ÿ˜ ; eÿ¯)
ÿ¯ ÿ
= R( ÿÿ˜ ÿ; ÿ¯ eÿ )
ÿ¯
= ÿ
(3,55)
ÿ ÿ¯Rÿÿ .
Portanto, a transformação dos componentes é simples: cada índice se transforma trazendo a cujos índices
são organizados da única maneira permitida pela convenção de soma. Algum
nomes antigos que ainda estão em uso são: os índices superiores são chamados de 'contravariantes' (porque
M
eles se transformam contrários aos vetores de base) e os inferiores 'covariantes'. Um tensor
N é dito
para ser 'M-vezes contravariante e N-vezes covariante'.
Raciocínio circular?
Neste ponto, o estudante pode se preocupar que toda a álgebra tensorial tenha se tornado circular: uma
forma foi definida em termos de vetores, mas agora definimos vetores em termos de
um-formas. Essa 'dualidade' está no cerne da teoria, mas não é circularidade. Isso significa
podemos fazer como os físicos fazem, que é identificar os vetores com deslocamentos x
M
e coisas semelhantes (como p e v) e, em seguida, gerar todos os tensores pelas regras de
N
álgebra tensorial; esses tensores herdam um significado físico do significado original que
deu vetores. Mas poderíamos igualmente ter associado as formas únicas a alguns objetos físicos (gradientes,
por exemplo) e recuperado toda a álgebra daquele ponto inicial.
ponto. O poder da matemática é que ela não precisa (ou quer) dizer o que o
vetores originais ou uma-formas são. Ele simplesmente fornece regras para manipulá-los. A associação de,
digamos, p com um vetor está na interface entre a física e a matemática: é
como fazemos um modelo matemático do mundo físico. Um geômetra faz o mesmo.
Ele acrescenta à noção desses espaços tensoriais abstratos a ideia do que é um vetor em um
espaço curvo é. A idéia de vetor do geômetra moderno é algo que aprenderemos
sobre quando chegamos a espaços curvos. Por enquanto vamos praticar com tensores
em situações físicas, onde mantemos nossa noção (reconhecidamente imprecisa) de vetores
'como' x.
3.7 Índice
' ' '
subindo e 'low e ring
Da mesma forma que a métrica mapeia um vetor V em um tensor V˜ de uma , ele mapeia um N tensor
M
em um N-1 N tensor em um N+1 tensor. Nem
forma. Da mesma forma, a inversa mapeia um M M-1
M+1
malmente, estes recebem o mesmo nome e se distinguem apenas pelas posições de seus
2 tensor. Então
índices. Suponha que Tÿÿ são os componentes de um
ÿ 1
Tÿ ÿÿ := ÿÿÿTÿÿ ÿ
(3,56)
1
são os componentes de um 2
tensor (obtido mapeando o segundo argumento de uma forma de
Tÿÿ ÿ
em um vetor), e
ÿ := ÿÿÿTÿÿ (3,57)
Tÿ ÿ ÿ
1
são os componentes de outro (inequivalente) 2
tensor (mapeamento no primeiro índice), enquanto
Tÿÿÿ := ÿÿ ÿTÿÿ ÿ
(3,58)
3
são os componentes de um tensor. Essas operações são, naturalmente, chamadas de índice
0
'elevar' e 'abaixar'. Sempre que falamos em aumentar ou diminuir um índice, queremos dizer
este mapa gerado pela métrica. A regra no SR é simples: ao subir ou descer um
índice '0', o sinal do componente muda; ao aumentar ou diminuir um '1' ou '2' ou '3'
index (em geral, um índice 'i' ) o componente permanece inalterado.
75 3.7 Índice 'aumentando' e 'anel baixo'
Componentes mistos de métrica
Os números {ÿÿÿ} são os componentes da métrica e {ÿÿÿ} os da sua inversa. Suponha que elevemos um
índice de ÿÿÿ usando o inverso. Então obtemos os componentes 'mistos' de
a métrica,
ÿÿ ÿ ÿÿÿÿÿÿ. ÿ (3,59)
Mas à direita temos apenas o produto matricial de duas matrizes que são o inverso de
uns aos outros (os leitores que não têm certeza disso devem verificar a seguinte equação por
cálculo), então é a matriz identidade unitária. Como um índice está para cima e outro para baixo, é o
delta de Kronecker, escrito como
ÿ ÿÿ ÿ. (3,60)
ÿÿ ÿ
Elevando o outro índice, obtemos apenas uma identidade, ÿÿÿ = ÿÿÿ. Então podemos considerar ÿÿÿ
2 0
como os componentes do tensor,0 que é mapeado a partir do g, seus 2 tensor g por gÿ1. Então, para
componentes 'contravariantes' são iguais aos elementos da matriz inversa da matriz de
seus componentes 'covariantes'. É o único tensor para o qual isso é verdade.
Álgebras vetoriais métricas e não métricas
É de algum interesse perguntar por que a métrica é a que gera a correspondência

0
entre formas e vetores. Por que não algum outro tensor que tenha um
2 inverso? Poço
explorar essa ideia em etapas.
Primeiro, por que uma correspondência? Suponha que tivéssemos uma álgebra vetorial 'não métrica',
M
completa com todos os espaços duais e tensores.
N Por que fazer uma correspondência entre
formas e vetores? A resposta é que às vezes fazemos e às vezes não.
Sem um, o produto interno de dois vetores é indefinido, pois os números são produzidos
somente quando as formas unitárias atuam sobre vetores e vice-versa. Em física, produtos escalares são
úteis, então precisamos de uma métrica. Mas existem alguns espaços vetoriais na física matemática onde
métricas não são importantes. Um exemplo é o espaço de fase da mecânica clássica e quântica.
Segundo, por que a métrica e não outro tensor? Se uma métrica não foi definida, mas outra
tensor simétrico fez o mapeamento, um matemático apenas chamaria o outro tensor de
métrica. Ou seja, ele o definiria como aquele que gera um mapeamento. Para um matemático,
a métrica é um pouco mais de estrutura na álgebra vetorial. Diferentes espaços na emática matemática podem
ter diferentes estruturas métricas. Um espaço Riemanniano é caracterizado por uma
métrica que fornece magnitudes positivas definidas de vetores. Um como o nosso, com tempo indefinido
sinal, é chamado pseudo-Riemanniano. Podemos até definir uma 'métrica' que é antisimétrica:
um espaço bidimensional chamado espaço espinor tem tal métrica, e acaba sendo de
importância fundamental na física. Mas sua estrutura está fora do escopo deste livro. o
ponto aqui é que não temos SR se apenas discutirmos vetores e tensores. Obtemos SR quando
dizemos que temos uma métrica com componentes ÿÿÿ. Se atribuirmos outros componentes,
pode obter outros espaços, em particular o espaço-tempo curvo de GR.
3.8 Diferentes tipos de frequência
0 0 tensor. Diferenciação de uma função

Uma função f é a 0
tensor, e seu gradiente d˜f é um 1
produz um tensor de um posto mais alto (covariante). Veremos agora que isso se aplica também
à diferenciação de tensores de qualquer posto.
Considere um 1
1 tensor T cujos componentes {Tÿÿ} são funções de posição. Podemos
escreva T como
T = Tÿÿÿ˜ _ ÿ ÿ eÿ. (3,61)
Suponha, como fizemos para funções, que nos movemos ao longo de uma linha de mundo com parâmetro ÿ , próprio
Tempo. A taxa de variação de T,
dT T(ÿ + ÿ ) ÿ T(ÿ )
= limite , (3,62)
dÿ ÿÿ0 ÿ
não é difícil de calcular. Como as formas e vetores da base são os mesmos em todos os lugares
(ie ÿ˜ ÿ(ÿ + ÿ ) = ˜ÿÿ(ÿ )), segue que
dT
= dTÿÿ ÿ˜ ÿ ÿ eÿ, (3,63)
dÿ dÿ
onde dTÿÿ/dÿ é a derivada ordinária da função Tÿÿ ao longo da linha do mundo:
dTÿÿ / dÿ = Tÿ ÿ, ÿ Uÿ . (3,64)
1
Agora, o objeto dT/dÿ é um tensor, pois
1 na Eq. (3.62) é definido como sendo apenas o
diferença entre dois desses tensores. Das Eqs. (3.63) e (3.64) temos, para qualquer
vetor U ,
dT/dÿ = (Tÿ ÿ,ÿ ÿ˜ ÿ ÿ eÿ) Uÿ , (3,65)
de onde podemos deduzir que
ÿT := (Tÿ ÿ,ÿ ÿ˜ ÿ ÿ ˜ÿÿ ÿ eÿ) (3,66)
é um 1
2 tensor. Este tensor é chamado de gradiente de T.
Usamos a notação ÿT em vez de d˜T porque a última notação é geralmente reservada por
matemáticos para outra coisa. Também temos uma notação conveniente para a Eq. (3,65):
dT/dÿ = ÿU T, ÿU (3,67)
T ÿ Tÿ ÿ Uÿ . ÿ, (3,68)
Esta derivação fez uso do fato de que os vetores de base (e, portanto, a base que se forma) eram
constantes em todos os lugares. Descobriremos que não podemos assumir isso na curva
espaço-tempo de GR, e levar isso em conta será nosso ponto de entrada na teoria!
77 3.10 Exercícios
3.9 P ulteriormente
Nossa abordagem para a análise tensorial enfatiza a natureza geométrica dos tensores em vez das
propriedades de transformação de seus componentes. Os alunos que desejarem a ampliação de alguns
dos pontos aqui apresentados podem consultar os primeiros capítulos de Misner et al. (1973) ou Schutz (1980b).
Ver também Bishop e Goldberg (1981).
A maioria das introduções a tensores para físicos fora da relatividade se limitam a tensores 'cartesianos',
ou seja, a componentes tensoriais em coordenadas cartesianas tridimensionais.
Ver, por exemplo, Bourne e Kendall (1991) ou o capítulo de Mathews e Walker (1965).
Uma referência muito completa para análise tensorial no estilo antigo baseado em transformações de
coordenadas é Schouten (1990). Ver também Yano (1955). Livros que desenvolvem esse ponto de vista
para tensores na relatividade incluem Adler et al. (1975), Landau e Lifshitz (1962) e Stephani (2004).
3.10 Exercícios
1 (a) Dado um conjunto arbitrário de números {Mÿÿ; a = 0, ..., 3; ÿ = 0, ... , 3} e dois conjuntos arbitrários
de componentes vetoriais {Aÿ,ÿ = 0, ... , 3} e {Bÿ , ÿ = 0, ... , 3}, mostram que os dois expressões
3 3
MÿÿAÿBÿ := MÿÿAÿBÿ
ÿ=0 ÿ=0
e
3
MÿÿAÿBÿ
ÿ=0
não são equivalentes.

(b) Mostre que
AÿBÿÿÿÿ = ÿA0B0 + A1B1 + A2B2 + A3B3.
2 Prove que o conjunto de todas as formas um é um espaço

vetorial. 3 (a) Comprovar, por escrito todos os termos, a validade das seguintes
p˜(Aÿ eÿ) = Aÿp˜( eÿ).
(b) Sejam as componentes de p˜ (ÿ1, 1, 2, 0), as de A sejam (2, 1, 0, ÿ1) e as de B sejam (0, 2, 0, 0).
Encontre (i) p˜(A ); (ii) p˜(B ); (iii) p˜(A ÿ 3B ); (iv) p˜(A ) ÿ 3p˜(B ).
4 Dados os seguintes vetores em O:
UMA
ÿO (2, 1, 1, 0), B ÿO (1, 2, 0, 0),C ÿO (0, 0, 1, 1), D ÿO (ÿ3, 2, 0, 0 ),
(a) mostre que são linearmente independentes; (b)

encontre as componentes de p˜ se
p˜(A ) = 1, p˜(B ) = ÿ1, p˜(C ) = ÿ1, p˜(D ) = 0;
(c) encontre o valor de p˜(E ) para
E
ÿO (1, 1, 0, 0);
(d) determinar se as formas-um p˜, q˜,r˜ e s˜ são linearmente independentes se q˜(A ) =

q˜(B ) = 0, q˜(C ) = 1, q˜(D ) = ÿ1, r˜(A ) = 2, r˜(B ) = ˜r(C ) = ˜r(D ) = 0, s˜(A ) =
ÿ1, s˜(B ) = ÿ1, s˜(C ) = ˜s(D ) = 0.
5 Justifique cada passo a partir das Eqs. (3.10a) a (3.10d).
6 Considere a base { eÿ} de um frame O e a base (ÿ˜ 0, ÿ˜ 1, ÿ˜ 2, ÿ˜ 3) para o espaço de
formas únicas, onde temos
ÿ˜ 0
ÿO (1, 1, 0, 0),
ÿ˜ 1
ÿO (1, ÿ1, 0, 0),
ÿ˜ 2
ÿO (0, 0, 1, ÿ1),
ÿ˜
3 ÿO (0, 0, 1, 1).
Note que {ÿ˜ ÿ} não é a base dual para { eÿ}.

(a) Mostre que p˜ = ˜p( eÿ)ÿ˜ ÿ para p˜ arbitrário .
(b) Seja p˜ ÿO (1, 1, 1, 1). Encontre os números lÿ tais que
p˜ = lÿÿ˜ ÿ.
Estes são os componentes de p˜ em {ÿ˜ ÿ}, o que quer dizer que eles são os valores de p˜ em
os elementos da base vetorial dual a {ÿ˜ ÿ}.
7 Prove a Eq. (3.13).
8 Desenhe as formas básicas d˜t e d˜x de um referencial O.
9 A Fig. 3.5 mostra curvas de igual temperatura T (isotermas) de uma placa de metal. Nos pontos
P e Q como mostrado, estime os componentes do gradiente d˜T. (Dica: os componentes
y
2
1
30
20
10 20
0
0
10
x
1 2 3 4
Figura 3.5 Isotermas de uma placa aquecida irregularmente.

79 3.10 Exercícios
são as contrações com os vetores de base, que podem ser estimados contando os
número de isotermas cruzadas pelos vetores.)
10 (a) Dado um referencial O cujas coordenadas são {xÿ}, mostre que
ÿxÿ/ÿxÿ = ÿÿ ÿ.
(b) Para quaisquer dois quadros, temos a Eq. (3.18):
ÿxÿ/ÿxÿ¯ = ÿ ÿ¯ .
Mostre que (a) e a regra da cadeia implicam
ÿ ÿ¯ = ÿÿ µ.
ÿ¯ ÿ
Esta é a propriedade inversa novamente.

11 Use a notação ÿÿ/ÿxÿ = ÿ,ÿ para reescrever as Eqs. (3.14), (3.15) e (3.18).
12 Seja S o plano bidimensional x = 0 no espaço euclidiano tridimensional. Deixar
n˜ = 0 seja uma forma normal de S.
(a) Mostre que se V é um vetor que não é tangente a S, então n˜(V ) = 0.
(b) Mostre que se n˜(V ) > 0, então n˜(W ) > 0 para qualquer W , que aponta para o mesmo
lado de S como V (ou seja, qualquer W cujos componentes x tenham o mesmo sinal de Vx).
(c) Mostre que qualquer normal a S é um múltiplo de n˜.
(d) Generalize essas afirmações para uma superfície tridimensional arbitrária em um espaço-tempo
quadridimensional.
13 Prove, por argumentos geométricos ou algébricos, que d˜f é normal a superfícies de constante f .
14 Sejam p˜ ÿO (1, 1, 0, 0) e q˜ ÿO (ÿ1, 0, 1, 0) duas formas. Prove, tentando duas
vetores A e B como argumentos, que p˜ ÿ ˜q = ˜q ÿ ˜p. Então encontre as componentes de p˜ ÿ ˜q.
15 Forneça o raciocínio que leva da Eq. (3.23) à Eq. (3.24).
16 (a) Prove que h(s) definido por
1 1
h(s)(A , B ) = 2h(A , B ) + 2h(B , A ) (3,69)
é um tensor simétrico.
(b) Prove que h(A) definido por
1 1
h(A)(A , B ) = 2h(A , B ) - 2h(B , A ) (3,70)
é um tensor antisimétrico.
(c) Encontre as componentes das partes simétricas e antissimétricas de p˜ ÿ ˜q definidas em
Exer. 14.
0
(d) Prove que se h é um antisimétrico tensor,
2
h(A , A ) = 0
para qualquer vetor .

A (e) Encontre o número de componentes independentes que h(s) eh (A) têm.
0
17 (a) Suponha que h seja a 2 tensor com a propriedade que, para quaisquer dois vetores A e B
(onde B = 0)
h(, A ) = ÿh( , B ),
onde ÿ é um número que pode depender de A e B . Mostre que existem formas p˜ e q˜

tais que
h = ˜p ÿ ˜q.
(b) Suponha que T é um

1 1 tensor, ÿ˜ uma forma única, vetor va, e T(ÿ˜; v) o valor de T em ÿ˜ e
v. Prove que T( ; v) é um vetor e T( ÿ˜; ) é uma forma única, ou seja, um tensor fornece 11
um mapa de vetores para vetores e formas únicas para formas únicas.

18 (a) Encontre as formas um mapeadas pelo tensor métrico dos vetores
A ÿO (1, 0, ÿ1, 0), B ÿO(0, 1, 1, 0), C ÿO(ÿ1, 0, ÿ1, 0),

D ÿO(0, 0, 1, 1).
(b) Encontre os vetores mapeados pelo inverso do tensor métrico da forma p˜ ÿO (3, 0, ÿ1,
ÿ1), q˜ ÿO (1, ÿ1, 1, 1), r˜ ÿO (0, ÿ5, ÿ1, 0), s˜ ÿO (ÿ2, 1, 0, 0). 19 (a) Prove que a matriz
{ÿÿÿ} é inversa a {ÿÿÿ} realizando a multiplicação da matriz
cátion.
(b) Deduza a Eq. (3,53).
20 Em três espaços euclidianos em coordenadas cartesianas, normalmente não distinguimos entre
vetores e formas-um, porque seus componentes se transformam de forma idêntica. Prove isso
em duas etapas. (a) Mostre que
Aÿ¯ = ÿ¯ ÿAÿ
e
ÿ
Pÿ¯ = ÿ¯Pÿ
ÿ¯
são a mesma transformação se a matriz { Tal ÿ} é igual à transposta de sua inversa.
matriz é dita ortogonal. (b) A métrica de tal
espaço tem componentes {ÿij, i, j = 1, ... , 3}. Prove que uma transformação de um sistema de
coordenadas cartesianas para outro deve obedecer
k¯i eu
ÿij = _ ¯j ÿkl
k
e que isso implica { em ¯i } é uma matriz ortogonal. Veja Ex. 32 para o análogo deste
SR.
21 (a) Seja uma região do plano t ÿ x limitada pelas linhas t = 0, t = 1, x = 0, x = 1.
Dentro do plano t ÿ x , encontre as formas unitárias normais para fora e seus vetores
associados para cada uma das linhas de fronteira. (b) Seja outra região limitada pelas
linhas retas que unem os eventos cujas coordenadas são (1, 0), (1, 1) e (2, 1). Encontre uma
normal externa para o limite nulo e encontre seu vetor associado.
22 Suponha que, em vez de definir vetores primeiro, tivéssemos começado definindo formas
únicas, auxiliadas por figuras como a Fig. 3.4. Então poderíamos ter introduzido vetores como
funções lineares de valor real de uma forma, e definido a álgebra vetorial pelos análogos das
Eqs. (3.6a) e (3.6b) (ou seja, trocando setas por tils). Prove que, assim definidos, os vetores
formam um espaço vetorial. Este é outro exemplo da dualidade entre vetores e formas únicas.
81 3.10 Exercícios
M
23 (a) Prove que o conjunto de todosNos tensores para M,N fixos forma um espaço vetorial. (Você
deve definir a adição de tais tensores e sua multiplicação por números.) (b) Prove que uma
base para este espaço é o conjunto
ÿ eÿ ÿ ··· ÿ eÿ }. ÿ ˜ÿÿ ÿ ˜ÿÿ ÿ ··· ÿ ˜ÿÿ { eÿ
M vetores N -formas
(Você terá que definir o produto externo de mais de duas formas.) tensor
2
24 (a) Dados os componentes de um 0
Mÿÿ como a matriz
01 00
ÿ 1 ÿ102 ÿ
ÿ ÿ
,
ÿ
20 01 ÿ
ÿ 1 0 ÿ2 0 ÿ
achar:
(i) os componentes do tensor simétrico M(ÿÿ) e o tensor antissimétrico

M[ÿÿ] ;
(ii) os componentes de Mÿÿ; (iii) os

componentes de Mÿÿ; (iv) os
componentes de Mÿÿ. (b) Para o

tensor cujas componentes são
1 1 sentido Mÿÿ,
falar faz
de sua
partes simétricas e antisimétricas? Se sim, defina-os. Se não, diga por quê.
(c) Eleve um índice do tensor métrico para provar
ÿÿ = ÿÿÿ . ÿ
2 0
25 Mostre que se A é um
0
tensor e B a 2 tensor, então
AÿÿBÿÿ
é invariante de quadro, ou seja, um escalar.

0 0
26 Suponha que A seja um tensor tensor, B a simétrico 2 tensor, C um arbitrário 2
2
antisimétrico e D um arbitrário 2 0 tensor. Provar:
0
(a) AÿÿBÿÿ = 0; (b) AÿÿCÿÿ =

AÿÿC[ÿÿ]; (c) BÿÿDÿÿ =
BÿÿD(ÿÿ) . 27 (a) Suponha que
2
A seja um antisimétrico 0 tensor. Mostre que {Aÿÿ}, obtidos abaixando índices usando
0
tensor.
o tensor métrico, são componentes de uma antisimétrica (b) Suponha Vÿ = Wÿ. Prove que Vÿ =2 Wÿ.
28 Deduza a Eq. (3.66) da Eq. (3,65).

29 Prove que a diferenciação tensorial obedece à regra de Leibniz (produto):
ÿ(A ÿ B) = (ÿA) ÿ B + A ÿ ÿB.
30 Em algum quadro O, os campos vetoriais U e D têm os componentes:
U ÿ (1 + t 2, t 2, ÿ2 t, 0),
D ÿ (x, 5 tx, ÿ2 t, 0),
e o escalar ÿ tem o valor

2
ÿ = x2 + t ÿ y2.
(a) Encontre U · , U · D , D · D . U é adequado como um campo de quatro velocidades? é D ?

U (b) Encontre a velocidade espacial ÿ de uma partícula cuja quatro velocidades , para t arbitrário .
é U O que acontece com ela nos limites t ÿ 0, t ÿ ÿ?
(c) Encontre Uÿ para todo ÿ.
(d) Encontre Uÿ,ÿ para todos os ÿ, ÿ.
(e) Mostre que UÿUÿ,ÿ = 0 para todo ÿ. Mostre que UÿUÿ,ÿ = 0 para todo ÿ.
(f) Encontre Dÿ,ÿ.
(g) Encontre (UÿDÿ),ÿ para todo ÿ.
(h) Encontre Uÿ(UÿDÿ),ÿ e compare com (f) acima. Por que as duas respostas são semelhantes?
(i) Encontre ÿ,ÿ para todo ÿ. Encontre ÿ,ÿ para todo ÿ. (Lembre-se que ÿ,ÿ := ÿÿÿÿ,ÿ.) Quais são as
números {ÿ,ÿ} os componentes de?
(j) Encontre ÿU ÿ, ÿU D , ÿD ÿ, ÿD U .
31 Considere uma unidade temporal U de quatro vetores, e o tensor P cujos componentes são
dado por
Pÿÿ = ÿÿÿ + UÿUÿ .
(a) Mostre que P é um operador de projeção que projeta um vetor arbitrário V em um

ortogonal a U. Isto é, mostre que o vetor V ÿ cujas componentes são
Vÿÿ = Pÿ ÿVÿ = (ÿÿ

ÿ + UÿUÿ)Vÿ
é
(i) ortogonal a U e ,
(ii) não afetado por P:

Vÿÿÿ : = PÿÿVÿ ÿ ÿ. = Vÿ
(b) Mostre que para um vetor não nulo arbitrário q , o tensor que projeta ortogonalmente
para ele tem componentes
ÿÿÿ ÿ qÿqÿ / (qÿqÿ).
Como isso falha para vetores nulos? Como isso se relaciona com a definição de P?
(c) Mostre que P definido acima é o tensor métrico para vetores perpendiculares a U :
P(V ÿ,W ÿ) = g(V ÿ,W ÿ)

= V ÿ · W ÿ.
0
32 (a) Da definição fÿÿ = f( eÿ, eÿ) para os componentes de um 2 tensor, prove que
a lei de transformação é
ÿ
f ÿ¯ÿ¯ = ÿÿ¯ ÿ¯ fÿÿ
e que a versão matricial disso é
T
(¯f) = ( ) (f)( ),
onde ( ) é a matriz com componentes ÿÿ¯ .

83 3.10 Exercícios
(b) Como nossa definição de um referencial de Lorentz nos levou a deduzir que o tensor métrico tem
componentes ÿÿÿ, isso deve ser verdade em todos os referenciais de Lorentz. Somos assim
levados a uma definição mais geral de uma transformação de Lorentz como aquela cuja matriz ÿÿ¯ satisfaz
ÿ
ÿ¯ÿÿÿ . (3,71)
ÿÿ¯ÿ¯ = ÿÿ¯
Prove que a matriz para um impulso de velocidade ÿ ex satisfaz isso, de modo que esta nova
definição inclui nossa mais antiga.
(c) Suponha ( ) e (L) são duas matrizes que satisfazem a Eq. (3.71), ou seja, (ÿ) = (ÿ)( ) e
() T similarmente para (L). Prove que ( )(L) também é a matriz de um Lorentz
transformação.
33 O resultado do Exer. 32c estabelece que as transformações de Lorentz formam um grupo, representado
pela multiplicação de suas matrizes. Isso é chamado de grupo de Lorentz, denotado por L(4) ou 0(1,3).
(a) Encontre as matrizes do elemento identidade do grupo de Lorentz e do elemento inverso àquele cuja
matriz está implícita na Eq. (1.12). (b) Prove que o determinante de qualquer matriz representando uma
transformação de Lorentz
é ±1.
(c) Prove que os elementos cujas matrizes têm determinante +1 formam um subgrupo,
enquanto aqueles com -1 não.
(d) O grupo ortogonal tridimensional O(3) é o grupo análogo para a métrica do espaço euclidiano
tridimensional. Em Exer. 20b, vimos que ela era representada pelas matrizes ortogonais. Mostre
que as matrizes ortogonais formam um grupo, e então mostre que 0(3) é (isomórfico a) um
subgrupo de L(4).
34 Considere as coordenadas u = t ÿ x, v = t + x no espaço de Minkowski.
(a) Defina eu como o vetor que conecta os eventos com coordenadas {u = 1, v = 0, y = 0,z = 0} e {u = 0,
v = 0, y = 0,z = 0}, e analogamente para eÿ .
Mostre que eu = ( et ÿ ex)/2, ev = ( et + ex)/2, e desenhe eu e ev em um diagrama de espaço-
tempo do plano t ÿ x . (b) Mostre que { eu, ev, ey, ez} são uma base para vetores no espaço de
Minkowski. (c) Encontre os componentes do tensor métrico nesta base. (d) Mostre que eu e ev são
nulos e não ortogonais. (Eles são chamados de base nula para
o plano t ÿ x .) (e)
Calcule as quatro formas um d˜u, d˜v, g( eu, ), g( ev, ) em termos de d˜t e d˜x.
4 Fluidos perfeitos na relatividade especial
4.1 Fluidos
Em muitas situações interessantes em GR astrofísica, a fonte do campo gravitacional pode ser

considerada um fluido perfeito como uma primeira aproximação. Em geral, um 'fluido' é um tipo
especial de continuum. Um continuum é uma coleção de partículas tão numerosas que a dinâmica
de partículas individuais não pode ser seguida, deixando apenas uma descrição da coleção em
termos de quantidades 'médias' ou 'em massa': número de partículas por unidade de volume,
densidade de energia, densidade de momento, pressão, temperatura, etc. O comportamento de um
lago de água e o campo gravitacional que ele gera não depende de onde qualquer molécula de água
em particular esteja: depende apenas das propriedades médias de enormes coleções de moléculas .
No entanto, essas propriedades podem variar de ponto a ponto no lago: a pressão é maior no
fundo do que no topo, e a temperatura também pode variar. A atmosfera, outro fluido, tem uma
densidade que varia com a posição. Isso levanta a questão de quão grande é a média de uma
coleção de partículas: ela deve ser claramente grande o suficiente para que as partículas individuais
não importem, mas deve ser pequena o suficiente para que seja relativamente homogênea: a
velocidade média, energia cinética , e o espaçamento entre partículas deve ser o mesmo em toda a
coleção. Tal coleção é chamada de 'elemento'. Este é um termo um tanto impreciso, mas útil para
uma grande coleção de partículas que podem ser consideradas como tendo um único valor para
quantidades como densidade, velocidade média e temperatura. Se tal coleção não existir (por
exemplo, um gás muito rarefeito), então a aproximação do continuum se desfaz.
A aproximação do contínuo atribui a cada elemento um valor de densidade, temperatura, etc.

Como os elementos são considerados 'pequenos', esta aproximação é expressa matematicamente
atribuindo a cada ponto um valor de densidade, temperatura, etc. definido por vários campos, tendo
valores em cada ponto e em cada tempo.
Até agora, essa noção de um continuum abrange tanto as rochas quanto os gases. Um fluido é
um continuum que 'flui': essa definição não é muito precisa e, portanto, a divisão entre sólidos e
fluidos não é muito bem definida. A maioria dos sólidos fluirá sob pressão suficientemente alta. O que
torna uma substância rígida? Depois de pensar um pouco, devemos ser capazes de ver que a rigidez
vem de forças paralelas à interface entre dois elementos. Dois elementos adjacentes podem empurrar
e puxar um ao outro, mas o continuum não será rígido a menos que eles também possam impedir
um ao outro de deslizar ao longo de seu limite comum. Um fluido é caracterizado pela fraqueza de
tais forças antiderrapantes em comparação com a força direta de empurrar-puxar, que é chamada de pressão.
85 4.2 Dus t: o número r– fluxo vec para r N
Um fluido perfeito é definido como aquele em que todas as forças antiderrapantes são zero, e a única força
entre elementos fluidos vizinhos é a pressão. Veremos em breve como tornar isso matematicamente preciso.
4.2 D ust : então um ber – fl uxvector N
Apresentaremos a descrição relativista de um fluido com a mais simples: 'poeira' é definida como uma
coleção de partículas, todas em repouso em algum referencial de Lorentz.
Não está muito claro como esse uso do termo 'poeira' evoluiu do outro significado como aquela substância
que está em repouso no peitoril da janela, mas tornou-se um uso padrão na relatividade.
A densidade numérica n
A pergunta mais simples que podemos fazer sobre essas partículas é: quantas existem por unidade de
volume? Em seu quadro de repouso, este é apenas um exercício de contar as partículas e dividir pelo
volume que elas ocupam. Ao fazer isso em muitas regiões pequenas, poderíamos obter números diferentes
em pontos diferentes, já que as partículas podem estar distribuídas mais densamente em uma área do que
em outra. Definimos essa densidade numérica como n:
n := densidade numérica no MCRF do elemento. (4.1)
Qual é a densidade numérica em um referencial O* no qual as partículas não estão em repouso? Todos
terão a mesma velocidade v em O¯. Se olharmos para as mesmas partículas que contamos no quadro de
repouso, então há claramente o mesmo número de partículas, mas elas não ocupam o mesmo volume.
Suponha que eles estivessem originalmente em um sólido retangular de dimensão xy z. A contração de
Lorentz reduzirá isso para xyz ÿ(1 ÿ v2), uma vez que comprimentos na direção do movimento se
contraem, mas comprimentos perpendiculares não (Fig. 4.1). Por causa disso, o número de partículas por
unidade de volume é [ÿ(1 ÿ v2)]ÿ1 vezes o que era no
quadro de descanso:
n densidade numérica no quadro

= . (4.2)
ÿ(1 ÿ v2) em que as partículas têm velocidade ÿ
O fluxo através de uma superfície
Quando as partículas se movem, outra questão de interesse é: 'quantas' delas estão se movendo em uma
determinada direção? Isso é feito com precisão pela definição de fluxo: o fluxo de partículas através de uma
superfície é o número que atravessa uma unidade de área dessa superfície em uma unidade de tempo. Isso
depende claramente do referencial inercial ('área' e 'tempo' são conceitos dependentes do referencial) e da
orientação da superfície (uma superfície paralela à velocidade das partículas
A caixa contém N partículas A caixa contém as mesmas partículas, mas

n = N/(ÿx ÿy ÿz ) agora n = N/(ÿx ÿy ÿz )
ÿz
z z ÿz
ÿx
ÿx
ÿy ÿy
y y
Em MCRF dentro
x x
Figura 4.1 A contração de Lorentz faz com que a densidade das partículas dependa do quadro em que está
medido.
ÿÿt
ÿA = ÿy ÿz
Figura 4.2 Ilustração simples da transformação

¯ do fluxo: se as partículas se movem apenas
¯ na direção x, então
todas aquelas dentro de uma distância v t da superfície S cruzarão S not tempo
não será atravessado por nenhum deles). No quadro de repouso da poeira o fluxo é zero, pois todas as partículas
estão em repouso. No referencial O, suponha que todas as partículas se movam com velocidade v na direção x, e
vamos, por simplicidade, considerar uma superfície S perpendicular a x (Fig. 4.2). O volume retangular delineado
por uma linha tracejada contém claramente todas e apenas aquelas partículas que cruzarão a área A de S no
tempo ¯t. Ele tem volume v ¯t A, e contém partículas [n/ ÿ(1 ÿ v2)]v ¯t A , pois neste quadro a densidade numérica é
n/ ÿ(1 ÿ v2).
O número que cruza por unidade de tempo e por unidade de área é o fluxo através das superfícies de constante x¯:
nv
(fluxo)x¯ = .
ÿ(1 ÿ v2)
Suponha, de forma mais geral, que as partículas também tenham uma componente y da velocidade em O.
Então a linha tracejada na Fig. 4.3 inclui todas e somente aquelas partículas que cruzam A em S em
87 4.2 Dus t: o número r– fluxo vec para r N
ÿA = ÿy ÿz
x
ÿx ÿt
Figura 4.3 A situação geral do fluxo: apenas a componente x da velocidade transporta partículas através de um
superfície de x constante .
o tempo ¯t. Este é um 'paralelepípedo', cujo volume é a área de sua base vezes sua altura.
Mas sua altura – sua extensão na direção x – é apenas vx¯ ¯t . Portanto obtemos
nvx¯
(fluxo)x¯ . (4.3)
= ÿ(1 ÿ v2)
O número-fluxo de quatro vetores N
Considere o vetor N definido por
N = nU , (4.4)
onde U é a quatro velocidades das partículas. Em um quadro O ¯ em que as partículas têm um

velocidade (vx, vy, vz ), temos
1 vx vy vz
Uÿ , , , .
O¯ ÿ(1 ÿ v2) ÿ(1 ÿ v2) ÿ(1 ÿ v2) ÿ(1 ÿ v2)
Segue que
n nvx nvy nvz

Nÿ , , , . (4.5)
O¯ ÿ(1 ÿ v2) ÿ(1 ÿ v2) ÿ(1 ÿ v2) ÿ(1 ÿ v2)
Assim, em qualquer quadro, o componente de tempo de N é a densidade numérica e os

componentes espaciais são os fluxos através das superfícies das várias coordenadas. Isso é muito importante
resultado conceitual. Na física galileana, a densidade numérica era um escalar, o mesmo em todos os quadros
(sem contração de Lorentz), enquanto o fluxo era outra coisa: um vetor de três que era
dependente, uma vez que as velocidades das partículas são uma noção dependente do quadro. Nosso relativista
A abordagem unificou essas duas noções em um único vetor de quatro vetores independente de quadro. este
é o progresso em nosso pensamento, do tipo mais fundamental: a união de noções aparentemente

díspares em uma única e coerente.
Vale a pena reenfatizar o sentido em que usamos a palavra 'independente de frame'.
O vetor N é um objeto geométrico cuja existência é independente de qualquer referencial; como um
tensor, sua ação em uma forma para dar um número é independente de qualquer quadro. É claro que
seus componentes dependem do quadro. Como os físicos da pré-relatividade consideravam o fluxo
como um vetor de três, eles tiveram que se contentar com um vetor dependente do quadro, no seguinte
sentido. Como três vetores era independente da orientação dos eixos espaciais no mesmo sentido que
quatro vetores são independentes de todos os quadros; mas o vetor fluxo três é diferente em referenciais
que se movem um em relação ao outro, pois a velocidade das partículas é diferente em referenciais
diferentes. Para os físicos antigos, um vetor de fluxo tinha que ser definido em relação a algum
referencial inercial. Para um relativista, há apenas um quatro vetores, e a dependência de moldura da
maneira mais antiga de ver as coisas veio da concentração apenas em um conjunto de três dos quatro
componentes de N. Esta unificação da
densidade de número independente de quadro galileano e fluxo dependente de quadro em um único
quadro independente de quatro vetores N é semelhante à unificação de 'energia' e 'momento' em quatro
momentos.
Uma nota final: é claro que
N · N = ÿn2, n = (ÿN · N ) 1/2. (4.6)
Assim, n é um escalar. Da mesma forma que 'massa de repouso' é um escalar, embora a energia e a
'massa inercial' sejam dependentes do referencial, aqui temos que n é um escalar, a 'densidade de
repouso', embora a densidade numérica seja dependente do referencial. Sempre definiremos n como
um número escalar igual à densidade numérica no MCRF. Faremos definições semelhantes para
pressão, temperatura e outras grandezas características do fluido. Estes serão discutidos mais tarde.
4.3 Uma superfície de areia de forma única
Densidade numérica como um fluxo temporal
Podemos completar a discussão acima sobre a unidade de densidade numérica e fluxo percebendo
que a densidade numérica pode ser considerada como um fluxo temporal. Para ver isso, vamos olhar
novamente para o fluxo através das superfícies x , desta vez em um diagrama de espaço -tempo, no
qual traçamos apenas ¯t e x¯ (Fig. 4.4). A superfície S perpendicular a x tem a linha do mundo mostrada.
A qualquer momento ¯t é apenas um ponto, pois estamos suprimindo tanto y¯ quanto z¯. As linhas de
mundo dessas partículas que passam por S no tempo ¯t também são mostradas. O fluxo é o número de
linhas do mundo que cruzam S no intervalo ¯t = 1. Realmente, como é uma superfície bidimensional,
seu 'caminho do mundo' é tridimensional, do qual desenhamos apenas uma seção. O fluxo é o número
de linhas do mundo que cruzam uma unidade de 'volume' desta três superfícies: por volume, é claro
89 4.3 Uniformes e superf cies
ÿt
Partículas x
Figura 4.4 Fig. 4.2 em um diagrama espaço-tempo, com a direção y suprimida.
Partículas
x
ÿx
¯
Figura 4.5 t=
Densidade numérica como um fluxo através de superfícies const.
significa um cubo de lado unitário , ¯t = 1 , y¯ = 1, z¯ = 1. Assim, podemos definir um fluxo como o número de
linhas mundiais que cruzam uma unidade de três volumes. Não há razão para não podermos agora definir
esses três volumes como um volume espacial ordinário x¯ = 1, y¯ = 1, z¯ = 1, tomado em algum tempo
particular ¯t. Isso é mostrado na Fig. 4.5. Agora o fluxo é o número que cruza no intervalo x¯ = 1 (já que y¯ e
z¯ são suprimidos). Mas este é apenas o número 'contido' na unidade de volume no momento: a densidade
do número. Assim, o fluxo 'timelike' é a densidade numérica.
Uma forma única define uma superfície
A maneira como descrevemos as superfícies acima foi um pouco desajeitada. Para empurrar ainda mais
nossa imagem invariável, precisamos de uma representação matemática um pouco mais satisfatória da superfície
que essas linhas do mundo estão se cruzando. Esta representação é dada por uma forma. Em geral, um
superfície é definida como a solução de alguma equação
ÿ(t, x, y,z) = const.
O gradiente da função ÿ, d˜ÿ, é uma forma normal. Em certo sentido, d˜ÿ define o
superfície ÿ = const., uma vez que determina exclusivamente as direções normais a essa superfície.
No entanto, qualquer múltiplo de d˜ÿ também define a mesma superfície, então é costume usar o
unidade-normal de uma forma quando a superfície não é nula:
n˜ := d˜ ÿ/|d˜ÿ|, (4.7)
Onde
|d˜ ÿ| é a magnitude de d˜ ÿ :
|d˜ ÿ|=| ÿÿÿ ÿ,ÿ ÿ,ÿ | 1/2. (4.8)
(Não confunda n˜ com n, a densidade numérica no MCRF: eles são completamente diferentes,
dado, por acidente histórico, a mesma carta.)
Como no cálculo vetorial tridimensional (por exemplo, lei de Gauss), definimos o 'elemento de superfície'
como a unidade normal vezes um elemento de área na superfície. Neste caso, um elemento de volume
em um espaço de três cujas coordenadas são xÿ, xÿ e xÿ (para alguns valores particulares de ÿ, ÿ,
e ÿ , todos distintos) podem ser representados por
n˜ dxÿ dxÿ dxÿ , (4.9)
e uma unidade de volume (dxÿ = dxÿ = dxÿ = 1) é apenas n˜. (Esses dxs são os infinitesimais que
integramos sobre, não os gradientes.)
O fluxo na superfície
Lembre-se da lei de Gauss em três dimensões que o fluxo através de uma superfície de, digamos, o
campo é apenas E · n, o produto escalar de E com a unidade normal. A situação aqui é exatamente
o mesmo: o fluxo (de partículas) através de uma superfície de constante ÿ é ñ, N . Para ver isso, seja ÿ
seja uma coordenada, digamos x¯. Então uma superfície de constante x¯ tem d˜x¯ normal, que é uma unidade normal
já desde d˜x¯ ÿO¯ (0, 1, 0, 0). Então d˜x¯, N = Nÿ(d˜x¯)ÿ = Nx¯ , que é o que temos
já visto é o fluxo através das superfícies x. Claramente, se tivéssemos escolhido ÿ = ¯t, então teríamos
acabou com N0¯ , a densidade numérica, ou fluxo através de uma superfície de constante ¯t.
Este é um dos primeiros exemplos físicos concretos de nossa definição de um vetor como um
função de uma forma em números reais. Dado o vetor N podemos calcular o fluxo
,
através de uma superfície, encontrando a forma unitária normal para essa superfície e contraindo-a
com N. _ Além disso, expressamos todo o quadro invariavelmente e de uma maneira que
separa a propriedade do sistema de partículas N da propriedade da superfície n˜. Tudo
disso terá muitos paralelos no § 4.4 abaixo.
91 4.4 Dus t novamente: o tensor tenso-energia tenso r
Representação de um quadro por uma forma única
Antes de discutir outras propriedades dos fluidos, devemos mencionar um fato útil. Um referencial inercial,
que até agora foi definido por sua quatro velocidades, pode ser definido também por uma forma, a saber,
aquela associada à sua quatro velocidades g(U , ). Este tem componentes
Uÿ = ÿÿÿ Uÿ
ou, neste quadro,
U0 = ÿ1, Ui = 0.
Isto é claramente também igual a ÿd˜¯t (já que seus componentes são iguais). Assim, poderíamos igualmente
definir um quadro dando d˜t. Isso tem uma boa imagem: d˜t deve ser representado como um conjunto de
superfícies de t constante, as superfícies de simultaneidade. Estes definem claramente o quadro, até rotações
espaciais, que geralmente ignoramos. De fato, em certo sentido, d˜t é uma maneira mais natural de definir o
quadro do que U . Por exemplo, a energia de uma partícula cujo momento de quatro
épé
E = d˜t, p = p0. (4.10)
Não há nenhum sinal de menos estranho que obtemos na Eq. (2,35)
E = ÿp · U .
4.4 D ustag ai n: thestress – ene rg ytensor
Até agora, discutimos apenas quantas partículas de poeira existem. Mas eles também têm energia e momento,
e sua energia e momento são a fonte do campo gravitacional em GR. Portanto, devemos agora perguntar
como representá-los de maneira invariante de quadro. Vamos supor por simplicidade que todas as partículas
de poeira têm a mesma massa de repouso m.
Densidade de energia
No MCRF, a energia de cada partícula é apenas m, e o número por unidade de volume é n.

Portanto, a energia por unidade de volume é mn. Denotamos isso em geral por ÿ:
ÿ := densidade de energia no MCRF. (4.11)
Assim, ÿ é um escalar assim como n é (e m é). No nosso caso de poeira,
ÿ = nm (poeira). (4.12)
Em fluidos mais gerais, onde há movimento aleatório de partículas e, portanto, energia cinética de movimento,
mesmo em um referencial de repouso médio, a Eq. (4.12) não será válido.
No referencial O¯ temos novamente que a densidade numérica é n/ ÿ(1 ÿ v2), mas agora a energia de cada
partícula é m/ ÿ(1 ÿ v2), pois ela está se movendo. Portanto, a densidade de energia é mn/ ÿ(1 ÿ v2):
ÿ densidade de energia em um quadro

= . (4.13)
1 ÿ v2 em que as partículas têm velocidade v
=
0¯ Esta transformação envolve dois fatores de (1 ÿ v2) ÿ1/2 0, porque tanto o volume quanto a energia se
transformam. É impossível, portanto, representar a densidade de energia como algum componente de um
2
vetor. É, de fato, um componente de um tensor. Isso é mais facilmente
0
visto
definição dedo pontoDefinir
tensor. de vista de nossa
energia requer
uma forma única, a fim de selecionar o componente zero do quatro vetores de energia e momento; definir uma
densidade também requer uma forma única, uma vez que a densidade é um fluxo através de uma superfície
de tempo constante.
Da mesma forma, um fluxo de energia também requer duas formas: uma para definir 'energia' e a outra para
definir a superfície. Também podemos falar de densidade de momento: novamente uma forma única define
qual componente do momento, e outra forma define a densidade. Por analogia, há também fluxo de momento:
a taxa na qual o momento atravessa alguma superfície. Todas essas coisas requerem duas formas únicas.
Portanto, existe um tensor T, chamado tensor de tensão-energia, que tem todos esses números como valores
quando fornecidos com as formas apropriadas como argumentos.
Tensor de tensão-energia
A definição mais conveniente do tensor tensão-energia é em termos de seus componentes em algum quadro
(arbitrário):
fluxo de momento ÿ através de

T(d˜xÿ, d˜xÿ) = Tÿÿ := . (4.14)
uma superfície de xÿ constante
(Por momento ÿ queremos dizer, é claro, o componente ÿ de quatro momentos: pÿ := d˜xÿ, p .) Que este é
realmente um tensor é provado em Exer. 5, § 4.10.
Vejamos como essa definição se encaixa com nossa discussão acima. Considere T00. Isto é definido como
o fluxo de momento zero (energia) através de uma superfície t = constante. Esta é apenas a densidade de
energia:
T00 = densidade de energia. (4.15)
Da mesma forma, T0i é o fluxo de energia através de uma superfície xi = const:
T0i = fluxo de energia através da superfície xi . (4.16)
Então Ti0 é o fluxo de i momento através de uma superfície t = const: a densidade de i momento, Ti0 = i
densidade de momento. (4.17)
Finalmente, Tij é o fluxo j do momento i :
Tij = fluxo de i momento através da superfície j . (4.18)

93 4.5 Fluidos gerais
Para qualquer sistema em particular, fornecer os componentes de T em algum quadro o define

completamente. Para poeira, os componentes de T no MCRF são particularmente fáceis. Não há
movimento das partículas, então todos os momentos i são zero e todos os fluxos espaciais são zero. Portanto
(T00)MCRF = ÿ = mn,
(T0i )MCRF = (Ti0)MCRF = (Tij)MCRF = 0.
É fácil ver que o tensor p ÿ N tem exatamente essas componentes no MCRF, onde p = mU é o
quadrimomento de uma partícula. Portanto temos
Poeira : T = p ÿ N = mn U ÿ U = ÿ U ÿ U . (4.19)
A partir disso podemos concluir
Tÿÿ = T(ÿ˜ ÿ, ÿ˜ ÿ) =
ÿU (ÿ˜ ÿ)U (ÿ˜ ÿ) =
ÿUÿUÿ. (4.20)
No quadro O¯, onde
1 vx
Uÿ , , ... ,
ÿ(1 ÿ v2) ÿ(1 ÿ v2)
temos portanto
T0¯0¯ = ÿU0¯ U0¯ = ÿ/(1 ÿ v2), ÿ
T0¯¯i = ÿU0¯ U¯i = ÿvi /(1 ÿ v2),

(4.21)
T¯i0¯ = ÿU¯i U0¯ = ÿvi ( 1 ÿ v2), T¯i¯j ÿÿÿÿ
= ÿU¯i U¯j = ÿvi vj / (1 ÿ v2). ÿÿÿÿ
Estes são exatamente o que calcularíamos, a partir dos primeiros princípios, para densidade de
energia, fluxo de energia, densidade de momento e fluxo de momento, respectivamente. (Fizemos o
cálculo para densidade de energia acima.) Observe um ponto importante: Tÿÿ = Tÿÿ; isto é, T é simétrica.
Isso será verdade em geral, não apenas para a poeira.
4.5 Fluidos gerais
Até agora, lidamos com a coleção de partículas mais simples possível. Para generalizar isso para
fluidos reais, temos que levar em conta os fatos de que (i) além dos movimentos de massa do fluido,
cada partícula tem alguma velocidade aleatória; e (ii) pode haver várias forças entre as partículas que
contribuem com energias potenciais para o total.
Tabela 4.1 Quantidades macroscópicas para fluidos de componente único
Nome do símbolo Definição
você
Quatro velocidades do fluido Quatro velocidades de MCRF
elemento
n Densidade numérica Número de partículas por unidade de volume em MCRF
N Vetor de fluxo N := nU
ÿ densidade de energia Densidade da energia de massa total (massa de repouso,

cinética, química, ...)
Energia interna por partícula := (ÿ/n) ÿ m ÿ ÿ = n(m + ) Assim é um
nome geral para todas as energias que não o resto
massa.
ÿ0 Densidade de massa de repouso ÿ0 := mn.

Como m é uma constante, esta é a 'energia'
associada apenas à massa de repouso. Desta forma,
ÿ = ÿ0 + n .
T Temperatura Definição termodinâmica usual em MCRF (ver
abaixo de).
p Pressão Noção fluidodinâmica usual em MCRF. Mais

sobre isso mais tarde.
S Entropia específica Entropia por partícula (veja abaixo).
Definição de grandezas macroscópicas
O conceito de elemento fluido foi discutido no § 4.1. Para cada elemento fluido, vamos para
o referencial em que está em repouso (seu momento espacial total é zero). Este é o seu MCRF. este
O quadro é verdadeiramente comovente momentaneamente : uma vez que os elementos fluidos podem ser acelerados, um momento
mais tarde um quadro inercial diferente será o MCRF. Além disso, dois elementos fluidos diferentes
podem estar se movendo um em relação ao outro, de modo que não tenham os mesmos MCRFs.
Assim, o MCRF é específico para um único elemento de fluido, e qual frame é o MCRF é
função da posição e do tempo. Todas as grandezas escalares associadas a um elemento de fluido em
relatividade (como densidade numérica, densidade de energia e temperatura) são definidas como
valores no MCRF. Assim fazemos as definições apresentadas na Tabela 4.1. Nós confinamos nossos
atenção aos fluidos que consistem em apenas um componente, um tipo de partícula, de modo que (por
exemplo) fluxos interpenetrantes não são possíveis.
Primeira lei da termodinâmica
Esta lei é simplesmente uma declaração de conservação de energia. No MCRF, imaginamos que
o elemento fluido é capaz de trocar energia com seu entorno de apenas duas maneiras:
condução de calor (absorção de uma quantidade de calor Q) e por trabalho (realização de uma quantidade de trabalho
p V, onde V é o três volumes do elemento). Se deixarmos E ser a energia total do
elemento, então como Q é a energia ganha e p V é a energia perdida, podemos escrever (assumindo
pequenas mudanças)
E = Q ÿ p V, ÿ
ou (4.22)
ÿ
Q = E + p V. ÿ
Agora, se o elemento contiver um total de N partículas, e se esse número não mudar (ou seja,
nenhuma criação ou destruição de partículas), podemos escrever
N N
V= , V=ÿ n. (4.23)
n n2
Além disso, também temos (da definição de ÿ)
E = ÿV = ÿN/n,
E = ÿ V + V ÿ.
Esses dois resultados implicam

N n
Q= ÿ ÿ N(ÿ + p) .
n n2
Se escrevermos q := Q/ N, que é o calor absorvido por partícula, obtemos
ÿ+p
nq = ÿ ÿ n. (4.24)
n
Agora suponha que as mudanças sejam 'infinitesimais'. Pode-se mostrar, em geral, que um fluido
o estado pode ser dado por dois parâmetros: por exemplo, ÿ e T ou ÿ e n. Todo o resto é
uma função de, digamos, ÿ e n. Isso significa que o lado direito da Eq. (4.24),
dÿ ÿ (ÿ + p)dn/ n,
depende apenas de ÿ e n. A teoria geral das equações diferenciais de primeira ordem mostra
que esta sempre possui um fator de integração: isto é, existem duas funções A e B,
funções apenas de ÿ e n, tais que
dÿ ÿ (ÿ + p)dn/ n ÿ A dB
é uma identidade para todos os ÿ e n. É costume em termodinâmica definir temperatura para

ser A/n e entropia específica ser B:
dÿ ÿ (ÿ + p) dn/n = nT dS, (4,25)
ou, em outras palavras,
q = T S. (4.26)
O calor absorvido por um elemento fluido é proporcional ao seu aumento na entropia.

Assim, introduzimos T e S como definições matemáticas convenientes. Um mimo completo
mento mostraria que T é a coisa normalmente significada por temperatura, e que S é a coisa
usado na segunda lei da termodinâmica, que diz que a entropia total em qualquer sistema deve
aumentar. Não teremos nada a dizer sobre a segunda lei. A entropia aparece aqui apenas porque é uma
integral da primeira lei, que é meramente conservação de energia. Em particular, usaremos ambas as
Eqs. (4.25) e (4.26) mais tarde.
O tensor tensão-energia geral
A definição de Tÿÿ na Eq. (4.14) é perfeitamente geral. Vamos olhar para isso em particular no MCRF,
onde não há fluxo de massa do elemento fluido e nenhum momento espacial nas partículas. Então no
MCRF temos:
(1) T00 = densidade de energia = ÿ.

(2) T0i = fluxo de energia. Embora não haja movimento no MCRF, a energia pode ser transmitida por
condução de calor. Então T0i é basicamente um termo de condução de calor no
MCRF.
(3) Ti0 = densidade de momento. Novamente, as próprias partículas não têm momento líquido no MCRF,
mas se o calor estiver sendo conduzido, a energia em movimento terá um momento associado.
Argumentaremos abaixo que Ti0 ÿ T0i (4) Tij = fluxo de momento. .Este é um termo interessante e
importante. A próxima seção dá
uma discussão aprofundada sobre isso. É o chamado estresse.
Os componentes espaciais de T, T ij
Por definição, Tij é o fluxo do momento i através da superfície j . Considere (Fig. 4.6) dois elementos
fluidos adjacentes, representados como cubos, tendo a interface comum S. Em geral, eles exercem
forças um sobre o outro. Mostrado no diagrama é a força F exercida por A em B (B naturalmente exerce
uma força igual e oposta em A). Como a força é igual à taxa de variação do momento (pela lei de Newton,
que é válida aqui, já que estamos no MCRF onde
UMA B
z F
Figura 4.6 A força F exercida pelo elemento A sobre seu vizinho B pode ser em qualquer direção
dependendo das propriedades do meio e de quaisquer forças externas.
velocidades são zero), A está despejando momento em B à taxa F por unidade de tempo. É claro que B
pode ou não adquirir uma nova velocidade como resultado desse novo momento que adquire; isso depende
de quanto momento é colocado em B por seus outros vizinhos. Obviamente , o movimento de B é a
resultante de todas as forças. No entanto, cada força adiciona momento a B.
Há, portanto, um fluxo de momento através de S de A para B à taxa F. Se S tem área A, então o fluxo de
, então
momento através de S é F/A. Se S é uma superfície de fluido xj constante , o elemento A é Fi / A. Tij para
Esta é uma breve ilustração do significado de Tij: representa forças entre elementos fluidos adjacentes.
Como mencionado anteriormente, essas forças não precisam ser perpendiculares às superfícies entre os
elementos (ou seja, viscosidade ou outros tipos de rigidez fornecem forças paralelas à interface). Mas se
as forças forem perpendiculares às interfaces, então Tij será zero a menos que i = j. (Pense nisso – vamos
usá-lo em breve.)
Simetria de Tÿÿ em MCRF
Agora provamos que T é um tensor simétrico. Precisamos apenas provar que seus componentes são
simétricos em um quadro; isso implica que para qualquer r˜, q˜, T(r˜, q˜) = T(q˜,r˜), o que implica a simetria
de seus componentes em qualquer outro referencial. O quadro mais fácil é o MCRF.
(a) Simetria de Tij. Considere a Fig. 4.7 , na qual desenhamos um elemento fluido como um cubo de lado
l. A força que exerce em um vizinho através da superfície (1) (uma superfície x = const.) é Fi = Tixl 2, onde
o fator l 2
1 dá a área do rosto. Aqui, i percorre 1, 2 e 3, pois F não é
necessariamente perpendicular à superfície. Da mesma forma, a força que ele exerce em um vizinho em
(2) é Fi = Tiyl 2. (Vamos
2 também
tomar
exerce
o limite
umal ÿforça
0, então
em seu
tenha
vizinho
em mente
em direção
que o aelemento
direção -x
é pequeno.)
, que chamamos
O elemento
de
Fi Da mesma forma, existe Fi
3. 4 na face olhando na direção negativa de y . As forças sobre ÿFi etc. O
o elemento fluido são, respectivamente, ÿFi 1, primeiro
2,
ponto é que Fi ÿ ÿFi em ordem
3 1
que a soma das forças sobre o elemento deve desaparecer quando l ÿ 0 (caso contrário, a pequena massa
obtida como l ÿ 0 teria uma aceleração infinita). O próximo ponto é calcular
eu
eu
eu
4
z
2
1
Figura 4.7 Um elemento fluido.

torques em torno do eixo z através do centro do elemento de fluido. (Como as forças na parte
superior e inferior do cubo não contribuem para isso, não as consideramos.) Para o cálculo do
torque, é conveniente colocar a origem das coordenadas no centro do cubo. O lTyxl 2, onde
z ÿ1
= 0,
= ÿxFy
F1) força atuando no centro da face, onde r ÿ (l/2, 1 0)aproximamos
(observe particularmente
2 o torque devido
que ay ÿF1
= 0 lé3Tyx.
ÿ(r ×
O torque devido a ÿF2 é ÿ(r × lá). O torque devido a ÿF3 é o mesmo, lTxyl 2. Da mesma forma, o
ÿ1
Portanto, F2) 2 torque devido a ÿF4 é o mesmo, l 3Txy.
z
= +yFx 2 = 12 12
o torque total é
ÿz = l 3(Txy ÿ Tyx). (4.27)
O momento de inércia do elemento em relação ao eixo z é proporcional à sua massa vezes l 2,

ou
I = ÿÿl 5,
onde ÿ é alguma constante numérica e ÿ é a densidade (se da energia total ou da massa de repouso
não importa neste argumento). Portanto, a aceleração angular é
ÿ Txy - Tyx
ÿ¨ = = . (4,28)
2
EU
ÿÿl
Como ÿ é um número e ÿ é independente do tamanho do elemento, assim como Txy e Tyx, isso irá
para infinito quando l ÿ 0 a menos que
Txy = Tyx.
Assim, como obviamente não é verdade que os elementos fluidos estão girando dentro de fluidos,
os menores girando cada vez mais rápido, temos que as tensões são sempre simétricas:
Tj = Tj. (4,29)
Como não usamos nenhuma propriedade da substância, isso vale tanto para os sólidos quanto
para os fluidos. É verdade tanto na teoria newtoniana quanto na relatividade; na teoria newtoniana
2
Tij são os componentes de um tensor tridimensional
0 qualquer
chamado
engenheiro
tensor de
de tensão.
materiais;
É familiar
e contribui
paracom
seu nome para sua generalização relativista T.
(b) Igualdade de densidade de momento e fluxo de energia. Isso é muito mais fácil de demonstrar.
O fluxo de energia é a densidade da energia vezes a velocidade com que ela flui. Mas como a energia e a
massa são a mesma coisa, essa é a densidade da massa vezes a velocidade com que ela está se movendo;
em outras palavras, a densidade do momento. Portanto T0i = Ti0.
Conservação da energia-momento
Como T representa o conteúdo de energia e momento do fluido, deve haver alguma maneira de
usá-lo para expressar a lei de conservação de energia e momento. Na verdade, é razoavelmente
fácil. Na Fig. 4.8 vemos um elemento de fluido cúbico, visto apenas em seção transversal (direção
z suprimida). A energia pode fluir por todos os lados. A taxa de fluxo através da face (4) é l 2T0x(x
= 0), e através de (2) é ÿl 2T0x(x = a); o segundo termo tem um sinal negativo, pois T0x representa
a energia fluindo na direção positiva x , que está fora do volume através
eu
4 2
eu
x
Figura 4.8 Uma seção z = const. de um elemento fluido cúbico.
rosto (2). Da mesma forma, a energia que flui na direção y é l 2T0y(y = 0) ÿ l 2T0y(y = l). A soma dessas
taxas deve ser a taxa de aumento da energia interna, ÿ(T00l 3)/ÿt (declaração de conservação de energia).
Portanto temos
ÿ l 3T00 = l 2 T0x (x = 0) ÿ T0x (x = l) + T0y (y = 0) ÿt
ÿToy(y = l) + T0z (z = 0) ÿ T0z (z = l) . (4.30)
3
Dividindo por l e tomando o limite l ÿ 0 dá
ÿ ÿ ÿ ÿ
T00 = ÿ T0x - T0y - T0z . (4.31)
ÿt ÿx ÿy ÿz
[Ao derivar isso, usamos a definição da derivada
T0x(x = 0) ÿ T0x(x = l) ÿ
lim ÿÿ T0x (4.32)
lÿ0 eu ÿx .!
Eq. (4.31) pode ser escrito como
T00 ,0 + T0x ,x + T0y ,y + T0z ,z = 0
ou
T0ÿ ,ÿ = 0. (4.33)
Esta é a afirmação da lei da conservação da energia.

Da mesma forma, a quantidade de movimento é conservada. A mesma matemática se aplica, com o
índice '0' alterado para qualquer índice espacial que corresponda ao componente do momento cuja
conservação está sendo considerada. A lei geral de conservação é, então,
Tÿÿ,ÿ = 0. (4,34)
Isso se aplica a qualquer material em SR. Observe que é apenas uma divergência de quatro dimensões.
Sua relação com o teorema de Gauss, que dá uma forma integral da lei de conservação, será discutida
mais adiante.
Conservação de partículas
Também pode acontecer que, durante qualquer fluxo do fluido, o número de partículas em um elemento fluido
mude, mas é claro que o número total de partículas no fluido não mudará.
Em particular, na Fig. 4.8 , a taxa de variação do número de partículas em um elemento fluido será devido
apenas à perda ou ganho através dos limites, ou seja, aos fluxos líquidos para fora ou para dentro. Esta lei de
conservação é derivável da mesma forma que Eq. (4,34) foi. Podemos então escrever que
ÿÿÿÿ
N0 = ÿ Nx - Nova - Nz
ÿt ÿx ÿy ÿz
ou
Nÿ,ÿ = (nUÿ),ÿ = 0. (4,35)
Vamos nos limitar a discutir apenas os fluidos que obedecem a essa lei de conservação. Isso dificilmente é
uma restrição, uma vez que n pode, se necessário, sempre ser considerado a densidade de bárions.
'Baryon', para aqueles que não estão familiarizados com a física de altas energias, é um nome geral aplicado
às partículas mais massivas da física. Os dois mais comuns são o nêutron e o próton.
Todos os outros são muito instáveis para serem importantes na física cotidiana – mas quando decaem formam
prótons e nêutrons, conservando assim o número total de bárions sem conservar a massa de repouso ou a
identidade das partículas. Embora a física teórica sugira que os bárions nem sempre podem ser conservados -
por exemplo, as chamadas 'grandes teorias unificadas' das interações fortes, fracas e eletromagnéticas podem
prever um tempo de vida finito para o próton e colapsar e subsequente evaporação de um preto buraco (veja
cap. 11) não conservará o número bariônico – nenhum fenômeno desse tipo foi ainda observado e, em qualquer
caso, é improvável que seja importante na maioria das situações.
4.6 Fluidos perfeitos
Finalmente, chegamos ao tipo de fluido que é nosso principal assunto de interesse. Um fluido perfeito na
relatividade é definido como um fluido que não tem viscosidade e não tem condução de calor no MCRF. É uma
generalização do 'gás ideal' da termodinâmica comum. É, ao lado da poeira, o tipo de fluido mais simples de se
lidar. As duas restrições em sua definição simplificam enormemente o tensor tensão-energia, como veremos
agora.
Sem condução de calor
Da definição de T, vemos que isso implica imediatamente que, no MCRF, T0i = Ti0 = 0. A energia só pode fluir
se as partículas fluírem. Lembre-se de que em nossa discussão da primeira lei da termodinâmica mostramos
que se o número de partículas fosse conservado, então
101 4.6 Fluidos perfeitos
a entropia específica foi relacionada ao fluxo de calor pela Eq. (4.26). Isso significa que em um fluido
perfeito, se a Eq. (4.35) para a conservação das partículas for obedecida, então devemos ter também que
S é uma constante no tempo durante o escoamento do fluido. Veremos como isso resulta das leis de
conservação em um momento.
Sem viscosidade
A viscosidade é uma força paralela à interface entre as partículas. Sua ausência significa que as forças
devem ser sempre perpendiculares à interface, ou seja, que Tij deve ser zero a menos que i = j. Isso
significa que Tij deve ser uma matriz diagonal. Além disso, deve ser diagonal em todos os quadros MCRF,
uma vez que 'sem viscosidade' é uma afirmação independente dos eixos espaciais. A única diagonal da
matriz em todos os quadros é um múltiplo da identidade: todos os seus termos diagonais são iguais.
Assim, uma superfície x terá através dela apenas uma força na direção x , e similarmente para y e z; essas
forças por unidade de área são todas iguais e são chamadas de pressão, p. Então temos Tij = pÿij. De seis
quantidades possíveis (o número de elementos independentes na matriz simétrica 3 × 3 Tij) , a suposição
de viscosidade zero reduziu o número de funções para uma, a pressão.
Forma de T
No MCRF, T tem os componentes que acabamos de deduzir:
ÿ 000 0 p 0 0 0
ÿ ÿ
0 p 0 000 p
(Tÿÿ) =
ÿ
ÿ
ÿ
ÿ
. (4,36)
ÿ ÿ
Não é difícil mostrar que no MCRF
Tÿÿ = (ÿ + p)UÿUÿ + pÿÿÿ. (4,37)
Por exemplo, se ÿ = ÿ = 0, então U0 = 1, ÿ00 = ÿ1 e Tÿÿ = (ÿ + p) ÿ p = ÿ, como na Eq. (4.36). Tentando

todos os ÿ e ÿ possíveis, você pode verificar que a Eq. (4.37) dá a Eq. (4.36).
Mas a eq. (4.37) é uma fórmula invariante de quadro no sentido de que implica exclusivamente
T = (ÿ + p)U ÿ U + pgÿ1. (4,38)
Este é o tensor tensão-energia de um fluido perfeito.
Além do significado de pressão
Uma comparação da Eq. (4.38) com a Eq. (4.19) mostra que 'poeira' é o caso especial de um fluido perfeito
sem pressão. Isso significa que um fluido perfeito pode estar livre de pressão somente se sua
partículas não têm nenhum movimento aleatório. A pressão surge nas velocidades aleatórias das
partículas. Mesmo um gás tão diluído a ponto de ser virtualmente sem colisões tem pressão. Isso
ocorre porque a pressão é o fluxo do momento; se isso vem de forças ou de partículas que cruzam
uma fronteira é irrelevante.
As leis de conservação
Eq. (4.34) nos dá
Tÿÿ,ÿ = " (ÿ + p)UÿUÿ + pÿÿÿ#

= (4,39)
0. ,ÿ
Isso nos dá nossa primeira prática real com cálculo tensorial. Existem quatro equações na Eq. (4.39),
um para cada ÿ. Primeiro, vamos supor também
(nUÿ),ÿ = 0 (4,40)
e escreva o primeiro termo da Eq. (4.39) como
" (ÿ + p)UÿUÿ# ,ÿ
= $ ÿ + np UÿnUÿ ! ,ÿ
ÿ+p
= nUÿ Uÿ . (4.41)
n
,ÿ
Além disso, ÿÿÿ é uma matriz constante, então ÿÿÿ,ÿ = 0. Isso também implica, a propósito, que
Uÿ ,ÿUÿ = 0. (4,42)
A prova da Eq. (4.42) é
UÿUÿ = ÿ1 ÿ (UÿUÿ),ÿ = 0 (4,43)
ou
(UÿUÿ ÿÿÿ ),ÿ = (UÿUÿ ),ÿÿÿÿ = 2Uÿ ,ÿUÿ ÿÿÿ . (4,44)
O último passo decorre da simetria de ÿÿÿ, o que significa que Uÿ,ÿUÿ ÿÿÿ = UÿUÿ ,ÿÿÿÿ . Por fim, a
última expressão da Eq. (4.44) converte para
2Uÿ ,ÿUÿ,
que é zero pela Eq. (4.43). Isso prova a Eq. (4.42). Podemos fazer uso da Eq. (4.42) da seguinte
maneira. A equação original agora lê, após o uso da Eq. (4.41),
ÿ+p
nUÿ Uÿ + p,ÿÿÿÿ = 0. (4,45)
n
,ÿ
Das quatro equações aqui, podemos obter uma particularmente útil. Multiplique por Uÿ e some em ÿ.
Isso fornece o componente de tempo da Eq. (4.45) no MCRF:
ÿ+p
nUÿUÿ Uÿ + p,ÿÿÿÿUÿ = 0. (4,46)
n
,ÿ
103 4.6 Fluidos perfeitos
O último termo é apenas
p,ÿUÿ,
que sabemos ser a derivada de p ao longo da linha de mundo do elemento fluido, dp/dÿ .
O primeiro termo dá zero quando a derivada ÿ opera em Uÿ (pela Eq. 4.42), então obtemos
(usando Uÿ Uÿ = ÿ1)
ÿ+p
(4,47)
n
Uÿ % -n ,ÿ + p,ÿ & = 0.
Um pouco de álgebra converte isso em
ÿ+p
(4,48)
ÿ Uÿ $ ÿ,ÿ ÿ n n,ÿ ! = 0.
Escrito de outra forma,

dÿ ÿ + p dn
ÿ
= 0. (4,49)
dÿ n dÿ
Isso deve ser comparado com a Eq. (4.25). Isso significa
dS
UÿS,ÿ = = 0. dÿ (4,50)
Assim, o escoamento de um fluido perfeito que conserva partículas conserva a entropia específica.
Isso é chamado de adiabático. Como a entropia é constante em um elemento fluido à medida que
escoa, normalmente não precisaremos considerá-la. No entanto, é importante lembrar que a lei
de conservação de energia em termodinâmica está incorporada no componente das equações de
conservação, Eq. (4.39), paralela a Uÿ.
Os três componentes restantes da Eq. (4.39) são deriváveis da seguinte maneira. Escrevemos,
novamente, a Eq. (4,45):
ÿ+p
nUÿ Uÿ + p,ÿÿÿÿ = 0
n
,ÿ
e vá para o MCRF, onde Ui = 0 mas Ui = 0. No

,ÿ MCRF, a componente zero dessa equação é a
mesma que sua contração com Uÿ, que acabamos de examinar. Então, precisamos apenas dos
componentes i :
ÿ+p
nUÿ Interface do usuário
+ p,ÿÿiÿ = 0. (4,51)
n
,ÿ
Como Ui = 0, a derivada ÿ de (ÿ + p)/n não contribui em nada, e obtemos
(ÿ + p)Ui ,ÿUÿ = p,ÿÿiÿ = 0. (4,52)
ÿ Diminuir o índice i torna isso mais fácil de ler (e não muda nada). Como ÿi obtemos = ÿiÿ _
(ÿ + p)Ui,ÿUÿ + p,i = 0. (4,53)

Finalmente, lembramos que Ui,ÿUÿ é a definição da ai de quatro acelerações :
(ÿ + p)ai + p,i = 0. (4,54)
Aqueles familiarizados com a dinâmica de fluidos não relativística reconhecerão isso como a
generalização de
ÿa + ÿp = 0, (4,55)
Onde
a = vÿ + (v · ÿ)v. (4,56)
A única diferença é o uso de (ÿ + p) em vez de ÿ. Na relatividade, (ÿ + p) desempenha o papel de

'densidade de massa inercial', em que, a partir da Eq. (4.54), quanto maior (ÿ + p), mais difícil é acelerar
o objeto. Eq. (4.54) é essencialmente F = ma, com ÿp,i sendo a força por unidade de volume sobre um
elemento fluido. Grosso modo, p é a força que um elemento fluido exerce sobre seu vizinho, então ÿp
é a força sobre o elemento. Mas o vizinho do lado oposto do elemento está empurrando para o outro
lado, então somente se houver uma mudança em p através do elemento fluido haverá uma força
resultante fazendo com que ele acelere. É por isso que ÿÿp dá a força.
4.7 Importância para a r el atividade geral
A relatividade geral é uma teoria relativista da gravidade. Não fomos capazes de mergulhar nele
imediatamente porque não tínhamos uma compreensão suficientemente boa de tensores, de fluidos
em SR e de espaços curvos. Ainda temos que estudar a curvatura (que vem a seguir), mas neste ponto
podemos olhar para frente e discernir os contornos vagos da teoria que estudaremos.
O primeiro comentário é sobre a suprema importância de T em GR. A teoria de Newton tem como
fonte do campo a densidade ÿ. Isso foi entendido como sendo a densidade de massa e, portanto, está
mais próximo do nosso ÿ0. Mas uma teoria que usa a massa de repouso apenas como sua fonte seria
peculiar do ponto de vista relativista, uma vez que a massa de repouso e a energia são interconversíveis.
De fato, podemos mostrar que tal teoria violaria alguns experimentos de altíssima precisão (a serem
discutidos posteriormente). Assim, a fonte do campo deve ser todas as energias, a densidade da
energia de massa total T00. Mas ter como fonte do campo apenas um componente de um tensor daria
uma teoria da gravidade não invariante: precisaríamos escolher um referencial preferido para calcular
T00. Portanto, Einstein supôs que a fonte do campo deveria ser T: todas as tensões, pressões e
momentos também deveriam atuar como fontes. Combinar isso com sua visão sobre espaços curvos o
levou a GR.
O segundo comentário é sobre a pressão, que desempenha um papel mais fundamental na GR do
que na teoria newtoniana: primeiro, porque é uma fonte do campo; e, segundo, por causa de sua
aparição no termo (ÿ + p) na Eq. (4,54). Considere uma estrela densa, cujo forte campo gravitacional
requer um grande gradiente de pressão. Quão grande é medido pela aceleração que o elemento fluido
teria, ai, na ausência de pressão. Dado o campo, e
105 4.8 Lei de Gauss
portanto, dado ai, o gradiente de pressão necessário é exatamente aquele que causaria a
aceleração oposta sem gravidade:
p,i
ÿai = ÿ + p .
Isto dá o gradiente de pressão p,i. Como (ÿ + p) é maior que ÿ, o gradiente deve ser maior na
relatividade do que na teoria newtoniana. Além disso, como todos os componentes de T são
fontes do campo gravitacional, essa pressão maior aumenta o campo gravitacional, fazendo com
que pressões ainda maiores (em comparação com as estrelas newtonianas) sejam necessárias
para manter a estrela em pé. Para estrelas onde p ÿ (veja abaixo), isso não faz muita diferença.
Mas quando p se torna comparável a ÿ, descobrimos que aumentar a pressão é autodestrutivo:
nenhum gradiente de pressão manterá a estrela em pé, e o colapso gravitacional deve ocorrer.
Essa descrição, é claro, encobre cálculos muito detalhados, mas mostra que mesmo estudando
fluidos em SR podemos começar a apreciar algumas das mudanças fundamentais que a GR traz
para a gravitação.
Vamos apenas nos lembrar dos tamanhos relativos de p e ÿ. Vimos em Exer. 1, § 1.14, que
p ÿ em situações ordinárias. Na verdade, só obtemos p ÿ ÿ para material muito denso (estrela
de nêutrons) ou material tão quente que as partículas se movem perto da velocidade da luz
(um gás 'relativístico').
4,8 G auss
' lei
Nosso tópico final sobre fluidos é a forma integral das leis de conservação, que são expressas na
forma diferencial nas Eqs. (4.34) e (4.35). Como no cálculo vetorial tridimensional, a conversão de
uma integral de volume de uma divergência em uma integral de superfície é chamada de lei de Gauss.
A prova do teorema é exatamente a mesma que em três dimensões, portanto não a derivaremos
em detalhes:
,ÿ (4,57)
' Vÿ d4x = ( Vÿnÿ d3S ,
onde n˜ é a forma unitária normal discutida em § 4.3, e d3 S denota o volume tridimensional

da hipersuperfície tridimensional que limita o volume quadridimensional de integração. O
sentido do normal é que ele está apontando para fora , é claro, assim como em três
dimensões. Na Fig. 4.9 um volume simples é desenhado para ilustrar o significado da Eq.
(4,57). O volume é limitado por quatro pares de hipersuperfícies, para constantes t, x, y e
z; apenas dois pares são mostrados, pois só podemos desenhar duas dimensões
facilmente. A normal na superfície t2 é d˜ t. A normal na superfície t1 é ÿd˜ t, já que 'para fora' é clara
3 superfícies t2
4 volumes
x1 t1x2 _
Figura 4.9 O limite de uma região do espaço-tempo.
'
para trás no tempo. A normal em x2 é d˜x, e em x1 é ÿd˜x. Portanto, a integral de superfície
na Eq. (4,57) é
(ÿV0) dx dy dz
t2 V0 dx dy dz t1
(ÿVx ) dt dy dz
+'+
x2 'Vx dt dy dz +x1
'
+ termos semelhantes para as outras superfícies na fronteira.
Podemos reescrever isso como
' V0(t2) ÿ V0(t1) dx dy dz

(4,58)
+ ' " Vx (x2) ÿ Vx (x1) # dt dy dz +··· .
Se deixarmos V ser N, então Nÿ,ÿ = 0 significa que a expressão acima se anula, o que tem a
interpretação de que a mudança no número de partículas nos três volumes (primeira integral) é
devido ao fluxo através de seus limites (segundo e termos subsequentes). Se estamos falando
de conservação de energia, substituímos Nÿ por T0ÿ e usamos T0ÿ,ÿ = 0. Então, obviamente,
uma interpretação semelhante da Eq. (4.58) se aplica. A lei de Gauss fornece uma versão integral
da conservação de energia.
4.9 P ara
A mecânica do contínuo e as leis de conservação são tratadas na maioria dos textos sobre
GR, como Mis ner et al. (1973). Os alunos cuja formação em termodinâmica ou mecânica dos
fluidos é fraca são referidos aos trabalhos clássicos de Fermi (1956) e Landau e Lifshitz (1959)
107 4.10 Exercícios
respectivamente. Além de Exer. 25, § 4.10 abaixo, não estudamos muito sobre eletromagnetismo, mas tem um
tensor tensão-energia e ilustra as leis de conservação particularmente
claramente. Ver Landau e Lifshitz (1962) ou Jackson (1975). Fluidos relativísticos com dissipação apresentam suas
próprias dificuldades, que recompensam o estudo atento. Ver Israel e Stewart (1980).
Outro modelo para sistemas contínuos é o gás sem colisões; ver Andréasson (2005) para
uma descrição de como tratar tais sistemas em GR.
4.10 Exercícios
1 Comente se a aproximação do continuum provavelmente se aplica aos seguintes

sistemas físicos: (a) movimentos planetários no sistema solar; (b) fluxo de lava de um vulcão; (c) tráfego em
uma estrada principal na hora do rush; (d) tráfego em um cruzamento controlado por
sinais de parada para cada estrada de entrada; (e) dinâmica do plasma.
2 O fluxo através de uma superfície de x constante é freqüentemente chamado de "fluxo na direção x ". Usar
sua compreensão de vetores e formas únicas para argumentar que essa é uma maneira inadequada
de se referir a um fluxo.
3 (a) Descreva como o conceito galileu de momento é dependente do referencial de uma maneira
em que o conceito relativista não é.
(b) Como isso é possível, já que a definição relativista é quase a mesma que a
Galileu para pequenas velocidades? (Defina um vetor galileano de quatro momentos.)
4 Mostre que a densidade numérica da poeira medida por um observador arbitrário cujos quatro
velocidade é U obs é ÿN · U obs.
5 Complete a prova de que a Eq. (4.14) define um tensor argumentando que ele deve ser linear em
ambos os seus argumentos.
6 Estabeleça a Eq. (4.19) das equações anteriores.

7 Deduza a Eq. (4.21).
8 (a) Argumente que as Eqs. (4.25) e (4.26) podem ser escritas como relações entre formas únicas, ou seja,
˜
d˜ÿ ÿ (ÿ + p)dñ/n = nT d˜S = n q.
˜
(b) Mostre que a forma única q não é um gradiente, ou seja, não é d˜q para nenhuma função q.
9 Mostre que a Eq. (4.34), quando ÿ é qualquer índice espacial, é apenas a segunda lei de Newton.
10 Tome o limite da Eq. (4,35) para |v| 1 para obter
ÿn/ÿt + ÿ(nvi )/ ÿxi = 0.
11 (a) Mostre que a matriz ÿij permanece inalterada quando transformada por uma rotação do
machados.
(b) Mostre que qualquer matriz que tenha esta propriedade é um múltiplo de ÿij.
12 Deduza a Eq. (4.37) da Eq. (4.36).
13 Forneça o raciocínio da Eq. (4.44).
14 Argumente que a Eq. (4.46) é o componente de tempo da Eq. (4.45) no MCRF.
15 Deduza a Eq. (4.48) da Eq. (4.47).
16 No MCRF, Ui = 0. Por que não podemos assumir Ui = 0?
,ÿ
17 Definimos aÿ = Uÿ,ÿUÿ. Vá para o limite não relativístico (pequena velocidade) e

mostre que
ai = ÿvi + (v · ÿ)vi = Dvi /Dt,
onde o operador D/Dt é a derivada de tempo 'total' ou 'advectiva' usual da dinâmica dos fluidos.
18 Aprimore a discussão no final do § 4.6 mostrando que ÿÿp é na verdade a força resultante
por unidade de volume no elemento fluido no MCRF.
19 Mostre que a Eq. (4.58) pode ser usado para provar a lei de Gauss, Eq. (4,57). 20
(a) Mostre que se as partículas não são conservadas, mas são geradas localmente a uma taxa ÿ partículas por
unidade de volume por unidade de tempo no MCRF, então a lei de conservação, Eq. (4.35), torna -se
Nÿ = e.
,ÿ
(b) Generalize (a) para mostrar que se a energia e o momento de um corpo não são conservados (por
exemplo, porque ele interage com outros sistemas), então existe uma força relativística diferente de
zero de quatro vetores Fÿ definida por
Tÿÿ,ÿ = Fÿ.
Interprete os componentes de Fÿ no MCRF.

21 Em um referencial inercial O calcule os componentes dos tensores tensão-energia dos seguintes sistemas:
(a) Um grupo de partículas movendo-se todas com a mesma velocidade v = ÿex, como visto em O.
Seja a densidade de massa de repouso dessas partículas ÿ0, medida em seu referencial comovente.
Assuma uma densidade de partículas suficientemente alta para permitir tratá-las como um continuum.
(b) Um anel de N partículas semelhantes de massa m girando no sentido anti-horário no plano x ÿ y em

torno da origem de O, em um raio a a partir deste ponto, com uma velocidade angular ÿ. O anel é um
toro de seção transversal circular de raio ÿa a, dentro do qual as partículas são uniformemente
distribuídas com uma densidade alta o suficiente para que a aproximação contínua seja aplicada. Não
inclua a tensão-energia de quaisquer forças que os mantenham em órbita. (Parte do cálculo relacionará
ÿ0 da parte (a) a N, a, ÿ e ÿa.)
(c) Dois desses anéis de partículas, um girando no sentido horário e o outro no sentido anti-horário, no
mesmo raio a. As partículas não colidem ou interagem de forma alguma.
22 Muitos sistemas físicos podem ser idealizados como coleções de partículas que não colidem (por exemplo,
radiação de corpo negro, plasmas rarefeitos, galáxias e aglomerados globulares). Assumindo que tal
sistema tem uma distribuição aleatória de velocidades em todos os pontos, sem viés em qualquer direção
no MCRF, prove que o tensor tensão-energia é o de um fluido perfeito. Se todas as partículas têm a mesma
velocidade ÿ e massa m, expresse p e ÿ como funções de m, ÿ e n. Mostre que um gás de fóton tem p =
1
23 Use o sistema identidade Tÿÿ para o qual Tÿÿ = 0 fora de uma região3ÿ.
limitada do espaço):
,ÿ = 0 para provar os seguintes resultados para um sistema limitado (ou seja, um

109 4.10 Exercícios
(uma)
ÿ T0ÿ d3x = 0 (conservação de energia e momento).
ÿt
(b) T00xi xj d3x = 2 Tij d3x (teorema tensor virial).
ÿ2
ÿt2
(c) T00(xi xi) 2 d3x = 4 Ti ixj xj d3x + 8 Tijxixj d3x.
ÿ2 ÿt2
24 As observações astronômicas do brilho dos objetos são medições do fluxo de radiação
T0i do objeto na Terra. Este problema calcula como esse fluxo depende da velocidade
relativa do objeto e da Terra. (a) Mostre que, no referencial de repouso O de uma estrela
de luminosidade constante L (energia total irradiada por segundo), o tensor tensão-energia
da radiação da estrela no evento (t, x, 0, 0) tem componentes T00 = T0x = Tx0 = Txx
= L/(4ÿx2). A estrela fica na origem.
(b) Seja X o vetor nulo que separa os eventos de emissão e recepção da radiação. Mostre
que X ÿO(x, x, 0, 0) para a radiação observada no evento (x, x, 0, 0).
Mostre que o tensor tensão-energia de (a) tem a forma invariante de referencial
eu X)X
T= ,
4ÿ · X )4
( EUA
onde vocês é a quatro velocidades da estrela, U s ÿO(1, 0,

0, 0). (c) Deixe que o observador O¯, que está na Terra, viajando com velocidade ÿ para longe
da estrela na direção x , meça a mesma radiação, novamente com a estrela no eixo x. Deixar
X ÿ (R, R, 0, 0) e encontre R como uma função de x. Expresse T0¯x¯ em termos de R.
Explique por que R e T0¯x¯ dependem tanto de ÿ.
25 Eletromagnetismo no RS. (Este exercício é adequado apenas para alunos que já
encontraram as equações de Maxwell de alguma forma.) As equações de Maxwell para
os campos elétrico e magnético no vácuo, E e B, em notação de três vetores são
ÿ
ÿ×Bÿ E = 4ÿJ,
ÿt ÿ ÿ × E +
B = 0, (4,59)
ÿt
ÿ · E = 4ÿÿ,
ÿ · B = 0,
em unidades onde ÿ0 = ÿ0 = c = 1. (Aqui ÿ é a densidade de carga elétrica e J a densidade

de corrente.) (a) Um antisimétrico F0i = Ei (i = 1, 2, 3), Fxy = Bz outros componentes Fÿÿ
2
neste quadro e anote-os em0
uma matriz.
tensor F pode(b)
serUma rotação
definido de um ângulopelas
no espaço-tempo ÿ emequações
torno do
eixo z é um tipo de transformação, Fyz
de=Lorentz,
Bx, Fzx = By. Encontre a partir desta definição todos
com a matriz
10 0 0
ÿ 0 cos ÿ ÿ sen ÿ 0 ÿ
ÿ = ÿ ÿ
.
ÿ ÿ
0 sen ÿ cos ÿ 0 ÿ
ÿ 00 0 1 ÿ
Mostre que as novas componentes de F,
Fÿÿ = ÿ
ÿ ÿFÿÿ ,
ÿ
defina novos componentes de três vetores elétricos e magnéticos (pela regra dada em (a))
que são exatamente os mesmos que os componentes dos antigos E e B no espaço de três
rotações. (Isso mostra que uma rotação espacial de F faz uma rotação espacial de E e B.) (c)
Defina o atual quatro vetores J por J0 = ÿ, Ji = (J )
, e mostre que dois
eu
As equações de Maxwell são apenas
Fÿÿ ,ÿ
= 4ÿJÿ. (4,60)
(d) Mostre que as outras duas equações de Maxwell são
Fÿÿ,ÿ + Fÿÿ,ÿ + Fÿÿ,ÿ = 0. (4,61)
Observe que existem apenas quatro equações independentes aqui. Ou seja, escolha um
valor de índice, digamos zero. Em seguida, os três outros valores (1, 2, 3) podem ser
atribuídos a ÿ, ÿ, ÿ em qualquer ordem, produzindo a mesma equação (até um sinal geral) a
cada vez. Experimente e veja: segue da antisimetria de Fÿÿ .
(e) Agora expressamos as equações de Maxwell na forma tensorial. Mostre que a conservação
da carga, Jÿ,ÿ = 0 (lembre-se da Eq. similar (4.35) para o vetor número-fluxo N ), está implícita
na Eq. (4.60) acima. (Dica: use antisimetria de Fÿÿ .) (f) A densidade de carga em qualquer
referencial é J0. Portanto, a carga total no espaço-tempo é Q = J0 dx dy dz, onde a integral se
estende por toda uma hipersuperfície t = const. Definindo d˜t = ñ , uma unidade normal para
esta hipersuperfície, mostre que
(4,62)
Q = ' Jÿnÿ dx dy dz.
(g) Use a lei de Gauss e a Eq. (4.60) para mostrar que a carga total contida dentro de qualquer
duas superfícies fechadas S na hipersuperfície t = const. pode ser determinado fazendo uma
integral sobre o próprio S:
F0i E · n dS,
Q=( S n dS = ( S
onde n é a unidade normal a S na hipersuperfície (não o mesmo que n˜ na parte (f) acima).
(h) Faça uma transformação de Lorentz em Fÿÿ para um referencial O¯ movendo-se com
velocidade ÿ na direção x em relação ao referencial usado em (a) acima. Neste quadro defina um
três vetores E¯ com componentes E¯i = F0¯¯i , e similarmente para B¯ em analogia com (a).
Dessa forma, descubra como E e B se comportam sob uma transformação de Lorentz: eles
se misturam! Assim, E e B em si não são invariantes de Lorentz, mas são apenas
componentes de F, chamados de tensor de Faraday, que é a descrição invariante de campos
eletromagnéticos na relatividade. Se você pensar com cuidado, verá que, em termos físicos,
eles não podem ser invariáveis. Em particular, o campo magnético é criado por cargas em
movimento; mas uma carga movendo-se em um referencial pode estar em repouso em outro,
então um campo magnético que existe em um referencial pode não existir em outro. O que é
igual em todos os quadros é o tensor de Faraday: apenas seus componentes são transformados.
5 Prefácio à curvatura
5.1 O nther el a ti onofgra vi ta ti oncurvature
Até agora discutimos apenas SR. Na RS, as forças têm desempenhado um papel secundário e nunca
introduzimos a gravitação explicitamente como uma força possível. Um ingrediente do SR é a existência de
referenciais inerciais que preenchem todo o espaço-tempo: todo o espaço-tempo pode ser descrito por um
único referencial, todos cujos pontos coordenados estão sempre em repouso em relação à origem, e todos
cujos relógios funcionam no mesmo instante. mesma taxa em relação ao relógio da origem. Dos postulados
fundamentais fomos levados à ideia do intervalo s2, que dá um significado geométrico invariante a certas
afirmações físicas. Por exemplo, um intervalo de tempo entre dois eventos é o tempo decorrido em um relógio
que passa pelos dois eventos; um intervalo semelhante ao espaço é o comprimento de uma haste que une
dois eventos em um quadro em que eles são simultâneos. A função matemática que calcula o intervalo é a
métrica, e assim a métrica de SR é definida fisicamente por comprimentos de hastes e leituras de relógios.
Este é o poder de SR e uma razão para a elegância e compacidade da notação tensorial nele (por exemplo, a
substituição de 'densidade numérica' e 'fluxo' por N ).
Em um pedaço de papel no qual foram plotados todos os eventos e linhas mundiais de interesse em algum
sistema de coordenadas, sempre seria possível definir qualquer métrica apenas dando seus componentes gÿÿ
como algum conjunto arbitrariamente escolhido de funções das coordenadas.
Mas essa métrica arbitrária seria inútil para fazer cálculos físicos. A utilidade de ÿÿÿ é sua estreita relação com
o experimento, e nossa derivação dele se baseou fortemente nos experimentos.
Essa proximidade com o experimento é, obviamente, um teste. Como ÿÿÿ faz certas previsões sobre hastes
e relógios, podemos pedir sua verificação. Em particular, é possível construir um quadro no qual todos os
relógios funcionem na mesma taxa? Esta é uma questão crucial, e mostraremos que em um campo
gravitacional não uniforme a resposta, experimentalmente, é não.
Nesse sentido, os campos gravitacionais são incompatíveis com a RS global : a capacidade de construir um
referencial inercial global. Veremos que em pequenas regiões do espaço-tempo – regiões suficientemente
pequenas para que as não uniformidades das forças gravitacionais sejam pequenas demais para serem
medidas – sempre podemos construir um referencial SR 'local'. Nesse sentido, teremos que construir RS local
em uma teoria mais geral. O primeiro passo é a prova de que os relógios não funcionam todos na mesma
velocidade em um campo gravitacional.
O experimento de redshift gravitacional
Vamos primeiro imaginar realizando um experimento idealizado, sugerido pela primeira vez por Einstein. (eu deixo
uma torre de altura h seja construída na superfície da Terra, como na Fig. 5.1. Comece com um
partícula de massa de repouso m no topo da torre. (ii) A partícula é largada e cai livremente
com aceleração g. Ele atinge o solo com velocidade v = (2gh) 1/2, então sua energia total E,
1
medida por um experimentador no solo, é m + (iii) O 2mv2 + 0(v4) = m + mgh + 0(v4).
experimentador no solo tem algum método mágico de mudar toda essa energia
em um único fóton da mesma energia, que ele direciona para cima. (Esse processo não
violam as leis de conservação, uma vez que a Terra absorve o momento do fóton, mas não sua energia,
assim como faz para uma bola de borracha quicando. O aluno cético em relação à 'mágica' deve mostrar
como o argumento procede se apenas uma fração ÿ da energia é convertida em um fóton.)
(iv) Ao chegar ao topo da torre com energia E , o fóton é novamente magicamente
.
transformado em uma partícula de massa de repouso m = E Deve ser que m = m; caso contrário, perpétuo
movimento poderia resultar do ganho de energia obtido pela operação de tal experimento. Então nós
são levados por nossa aversão à injustiça do movimento perpétuo para prever que E = m ou, por
o fóton,
E hÿ m
= = = 1 ÿ gh + 0(v4). m + (5.1)
E hÿ mgh + 0(v4)
Prevemos que um fóton subindo no campo gravitacional da Terra perderá energia (não
surpreendentemente) e, consequentemente, será desviado para o vermelho.
Embora nosso experimento mental seja idealizado demais para ser prático, é possível medir
o redshift previsto pela Eq. (5.1) diretamente. Isso foi feito pela primeira vez por Pound e Rebka (1960)
e melhorado por Pound e Snider (1965). O experimento usou o efeito Mössbauer para
m
ÿ
Figura 5.1 Uma massa m é lançada de uma torre de altura h. A massa total na parte inferior é convertida em
energia e voltou ao topo como um fóton. O movimento perpétuo será executado a menos que o
fóton perde tanta energia na escalada quanto a massa ganha na queda. A luz é, portanto,
redshift à medida que sobe em um campo gravitacional.
113 5.1 Sobre a relação da gravitação com a curva tura
obter grande precisão na medição da diferença ÿ ÿ ÿ produzida em um fóton subindo uma distância
h = 22,5 m. Eq. (5.1) foi verificado com precisão de aproximadamente 1%.
Com as melhorias na tecnologia entre 1960 e 1990, o redshift gravitacional passou de uma
pequena correção exótica para se tornar um efeito central para a sociedade: o sistema de
navegação GPS incorpora correções vitais para o redshift, sem as quais não permaneceria preciso
por mais de alguns minutos. O sistema usa uma rede de relógios atômicos de alta precisão em
satélites em órbita, e a navegação por um aparato na Terra é realizada pela leitura dos carimbos
de hora nos sinais recebidos de cinco ou mais satélites. Mas, como veremos abaixo, o desvio
gravitacional para o vermelho implica que o próprio tempo corre um pouco mais rápido na altitude
mais alta do que na Terra. Se isso não fosse compensado, o receptor terrestre logo receberia
carimbos de hora errados. A operação bem-sucedida do GPS pode ser considerada uma verificação
muito precisa do redshift. Veja Ashby (2003) para uma discussão completa sobre a relatividade e
o sistema GPS.
Esta verificação experimental do redshift é reconfortante do ponto de vista da conservação de
energia. Mas é o golpe mortal para nossas chances de encontrar uma teoria relativista simples e
especial da gravidade, como mostraremos agora.
Inexistência de um referencial de Lorentz em repouso na Terra
Se SR for válido em um campo gravitacional, é uma primeira suposição natural supor que o
referencial 'laboratorial' em repouso na Terra é um referencial de Lorentz. O argumento a seguir,
devido originalmente a Schild (1967), facilmente mostra que essa suposição é falsa. Na Fig. 5.2
desenhamos um diagrama de espaço-tempo neste quadro hipotético, no qual a dimensão espacial
plotada é a vertical. Considere a luz como uma onda e observe duas 'cristas' sucessivas da onda
enquanto elas se movem para cima no experimento Pound-Rebka-Snider. O topo e a base da torre
têm linhas verticais neste diagrama, pois estão em repouso. A luz é mostrada movendo-se em
uma linha ondulada, e é propositalmente desenhada curvada de alguma forma arbitrária. Isso é
para permitir a possibilidade de que a gravidade possa agir sobre a luz de uma maneira desconhecida, desvia
t
ÿtbot _
Segunda crista
Primeira crista
ÿtbot _
Fundo Topo
Figura 5.2 Em um campo gravitacional independente do tempo, duas “cristas” sucessivas de uma onda
eletromagnética devem percorrer caminhos idênticos. Por causa do redshift (Eq. (5.1)) o tempo
entre eles no topo é maior do que no fundo. Um observador no topo, portanto, 'vê' um relógio na
parte inferior funcionando lentamente.
a partir de um caminho nulo. Mas não importa o quanto a luz seja afetada pela gravidade, o efeito deve ser o mesmo
em ambas as cristas de onda, já que o campo gravitacional não muda de uma hora para outra. Portanto, as
trajetórias das duas cristas são congruentes, e concluímos da hipotética geometria de Minkowski que ttop = tbottom.
Por outro lado, o tempo entre duas cristas é simplesmente o recíproco da frequência medida t = 1/ÿ. Como o
experimento Pound–Rebka–Snider estabelece que ÿbottom > ÿtop, sabemos que ttop > tbottom.
A conclusão da geometria de Minkowski está errada, e o referencial em repouso na Terra não é um referencial de
Lorentz.
É este o fim, então, do SR? Não exatamente. Mostramos que o referencial de Lorentz em repouso na Terra não
é inercial. Não mostramos que não existem referenciais inerciais. Na verdade existem
certos referenciais que são inerciais em sentido restrito, e no próximo parágrafo usaremos outro argumento físico
para encontrá-los.
O princípio da equivalência
Uma propriedade importante de um referencial inercial é que uma partícula em repouso nele permanece em repouso
se nenhuma força atuar sobre ele. Para usar isso, devemos ter uma ideia do que é uma força. Normalmente, a
gravidade é considerada uma força. Mas, como Galileu demonstrou em seu famoso experimento na Torre Inclinada
de Pisa, a gravidade se distingue de todas as outras forças de maneira notável: todos os corpos que recebem a
mesma velocidade inicial seguem a mesma trajetória em um campo gravitacional, independentemente de sua
composição interna. Com todas as outras forças, alguns corpos são afetados e outros não: o eletromagnetismo
afeta as partículas carregadas, mas não as neutras, e a trajetória de uma partícula carregada depende da razão
entre sua carga e sua massa, que não é a mesma para todas as partículas. Da mesma forma, as outras duas forças
básicas da física – as chamadas interações “fortes” e “fracas” – afetam diferentes partículas de maneira diferente.
Com todas essas forças, sempre seria possível definir experimentalmente a trajetória de uma partícula não afetada
pela força, ou seja, uma partícula que permanecesse em repouso em um referencial inercial. Mas, com a gravidade,
isso não funciona. Tentar definir um referencial inercial em repouso na Terra, então, é vazio, uma vez que nenhuma
partícula livre (nem mesmo um fóton) poderia ser um 'marcador' físico para ele.
Mas existe um quadro no qual as partículas mantêm uma velocidade uniforme. Este é um quadro que cai
livremente no campo gravitacional. Como esse referencial acelera na mesma taxa que as partículas livres (pelo
menos as partículas de baixa velocidade às quais a física gravitacional newtoniana se aplica), segue-se que todas
essas partículas manterão uma velocidade uniforme em relação a esse referencial. Este quadro é pelo menos um
candidato a um quadro inercial. Na próxima seção iremos
mostram que os fótons não são desviados para o vermelho neste quadro, o que o torna um candidato ainda melhor.
Einstein construiu GR tomando a hipótese de que esses referenciais são inerciais.
O argumento que acabamos de apresentar, de que os referenciais em queda livre são inerciais, talvez seja mais
familiar ao estudante se for invertido. Considere, em um espaço vazio livre de gravidade, um foguete com aceleração
uniforme. Do ponto de vista de um observador no interior, parece que existe um campo gravitacional no foguete: os
objetos lançados aceleram em direção à traseira do navio, todos com a mesma aceleração, independente de sua
composição interna.1
1 Isso foi testado experimentalmente com precisão extremamente alta no chamado experimento de Eötvös. Ver Dicke
(1964).
Além disso, um objeto mantido parado em relação ao navio tem 'peso' igual à força necessária para
mantê-lo acelerando com o navio. Assim como na gravidade 'real', essa força é proporcional à massa
do objeto. Um verdadeiro referencial inercial é aquele que cai livremente em direção à parte traseira
do navio, com a mesma aceleração das partículas. A partir disso, pode-se ver que campos
gravitacionais uniformes são equivalentes a referenciais que aceleram uniformemente em relação a
referenciais inerciais. Este é o princípio da equivalência entre gravidade e aceleração, e é uma pedra
angular da teoria de Einstein. Embora Galileu e Newton tivessem usado palavras diferentes para
descrevê-lo, o princípio da equivalência é um dos fundamentos da gravidade newtoniana.
Na terminologia mais moderna, o que descrevemos é chamado de princípio de equivalência fraco,

'fraco' porque se refere ao modo como os corpos se comportam apenas quando influenciados pela
gravidade. Einstein percebeu que, para criar uma teoria da gravidade completa, ele precisava estender
isso para incluir as outras leis da física. O que agora chamamos de princípio de equivalência de
Einstein diz que podemos descobrir como todas as outras forças da natureza se comportam em um
campo gravitacional postulando que as equações diferenciais que descrevem as leis da física têm a
mesma forma local em um referencial inercial em queda livre como elas fazer em SR, ou seja, quando
não há campos gravitacionais. Usaremos esta forma mais forte do princípio de equivalência no Cap.
7.
Antes de voltarmos à prova de que referenciais em queda livre são inerciais, mesmo para fótons,
devemos fazer duas observações importantes. A primeira é que nossos argumentos são válidos
apenas localmente – uma vez que o campo gravitacional da Terra não é uniforme, as partículas a
alguma distância não permanecem com velocidade uniforme em um determinado referencial em
queda livre. Discutiremos isso com algum detalhe a seguir. O segundo ponto é que há, obviamente,
uma infinidade de quadros em queda livre em qualquer ponto. Eles diferem em suas velocidades e na
orientação de seus eixos espaciais, mas todos aceleram em relação à Terra na mesma taxa.
O experimento redshift novamente
Vamos agora ter um ponto de vista diferente sobre o experimento Pound-Rebka-Snider. Vamos vê-lo
em um referencial em queda livre, o qual vimos ter pelo menos algumas das características de um
referencial inercial. Tomemos o referencial particular que está em repouso quando o fóton inicia sua
jornada ascendente e cai livremente depois disso. Como o fóton percorre uma distância h, leva um
tempo t = h para chegar ao topo. Neste tempo, o pórtico adquiriu velocidade gh para baixo em relação
ao aparato experimental. Assim, a frequência do fóton em relação ao quadro em queda livre pode ser
obtida pela fórmula do redshift
ÿ(queda livre) ÿ = 1 + gh
= 1 + gh + 0(v4). ÿ(1 ÿ (5.2)
(aparelho no topo) g2h2)
Da Eq. (5.1) vemos que se negligenciarmos termos de ordem superior (como fizemos para derivar a
Eq. (5.1)), então obtemos ÿ(fóton emitido na parte inferior) = ÿ(no referencial em queda livre quando o
fóton chega ao topo) . Portanto, não há redshift em um quadro em queda livre. Isso nos dá uma base
sólida para postular que o referencial em queda livre é um referencial inercial.
Frames inerciais locais
A discussão acima sugere que o experimento de redshift gravitacional realmente não torna SR e
gravidade incompatíveis. Talvez simplesmente tenhamos que perceber que o referencial em repouso na
Terra não é inercial e aquele em queda livre – no qual não há redshift e, portanto, a Fig. 5.2 não leva a
nenhuma contradição – é o verdadeiro referencial inercial. Infelizmente, isso não salva completamente
SR, pela simples razão de que os quadros em queda livre em diferentes lados da Terra caem em
direções diferentes: não há um único quadro global que esteja caindo livremente em todos os lugares no
campo gravitacional da Terra e que ainda seja rígido, em que as distâncias entre seus pontos
coordenados são constantes no tempo. Ainda é impossível construir um referencial inercial global e,
portanto, o máximo que podemos salvar é um referencial inercial local , que agora descrevemos.
Considere um referencial em queda livre no campo gravitacional da Terra. Um referencial inercial em

SR preenche todo o espaço-tempo, mas esse referencial em queda livre não seria inercial se fosse
estendido muito horizontalmente, porque então não estaria caindo verticalmente. Na Fig. 5.3 o pórtico
está caindo livremente em B, mas em A e C o movimento não é ao longo da trajetória de uma partícula de teste.
Além disso, como a aceleração da gravidade muda com a altura, o pórtico não pode permanecer inercial
se for estendido por uma distância vertical muito grande; se estivesse caindo com partículas em uma
altura, não estaria em outra. Finalmente, o quadro pode ter apenas uma extensão limitada no tempo,
uma vez que, à medida que cai, ambas as limitações acima se tornam mais severas devido à aproximação
do quadro da Terra. Todas essas limitações se devem a não uniformidades no campo gravitacional. Na
medida em que as não uniformidades podem ser desprezadas, o referencial em queda livre pode ser
considerado inercial. Qualquer campo gravitacional pode ser considerado uniforme sobre uma pequena
região de espaço e tempo, e assim podemos sempre estabelecer referenciais inerciais locais . Eles são
análogos aos MCRFs de fluidos: neste caso, o referencial é inercial em apenas uma pequena região por
um pequeno tempo. Quão pequeno depende (a) da força das não uniformidades do campo gravitacional
e (b) da sensibilidade de qualquer experimento que esteja sendo usado para detectar propriedades não
inerciais do referencial. Como qualquer não uniformidade é, em princípio, detectável, um quadro só pode
ser considerado matematicamente como inercial em uma região muito pequena. Mas para a tecnologia
atual, os quadros em queda livre perto da superfície da Terra podem ser considerados
UMA
B Terra
Figura 5.3 Uma estrutura rígida não pode cair livremente no campo da Terra e ainda permanecer rígida.
como inercial para uma alta precisão. Seremos mais quantitativos em um capítulo posterior. Por enquanto,
apenas enfatizamos a noção matemática de que qualquer teoria da gravidade deve admitir referenciais inerciais
locais: referenciais que, em um ponto, são referenciais inerciais de SR.
Forças de maré
As não uniformidades nos campos gravitacionais são chamadas de forças de maré, pois são elas que elevam
as marés. (Se a Terra estivesse em um campo gravitacional uniforme, cairia livremente e não teria marés. As
marés aumentam devido à diferença dos campos gravitacionais da Lua e do Sol ao longo do diâmetro da
Terra.) Vimos que essas forças de maré impedem a construção de referenciais inerciais globais. São, portanto,
essas forças que são consideradas a manifestação fundamental da gravidade em GR.
O papel da curvatura
As linhas do mundo de partículas livres têm sido nossa sonda da possibilidade de construir referenciais
inerciais. Em SR, duas dessas linhas de mundo que começam paralelas uma à outra permanecem paralelas,
não importa o quão longe elas sejam estendidas. Esta é exatamente a propriedade que as linhas retas têm na
geometria euclidiana. É natural, portanto, discutir a geometria do espaço-tempo como definida pelas linhas do
mundo de partículas livres. Nesses termos, o espaço de Minkowski é um espaço plano , pois obedece ao
axioma do paralelismo de Euclides. Não é um espaço euclidiano, no entanto, uma vez que sua métrica é
diferente: os fótons viajam em linhas retas do mundo de comprimento próprio zero. Então SR tem uma
geometria plana e não euclidiana.
Agora, em um campo gravitacional não uniforme, as linhas de mundo de duas partículas próximas que
começam paralelas geralmente não permanecem paralelas. O espaço-tempo gravitacional, portanto, não é plano.
Na geometria euclidiana, quando abandonamos o axioma do paralelismo, obtemos um espaço curvo. Por
exemplo, a superfície de uma esfera é curva. Linhas retas localmente em uma esfera se estendem a grandes
círculos, e dois grandes círculos sempre se cruzam. No entanto, suficientemente perto de qualquer ponto,
podemos fingir que a geometria é plana: o mapa de uma cidade pode ser representado em uma folha de papel
plana sem distorção significativa, enquanto uma tentativa semelhante para todo o globo falha completamente.
A esfera é, portanto, localmente plana. Isso é verdade para todos os chamados espaços Riemannianos2:
todos eles são localmente planos, mas as linhas localmente retas (chamadas geodésicas) geralmente não
permanecem paralelas.
O importante avanço de Einstein foi ver a semelhança entre os espaços riemannianos e a física
gravitacional. Ele identificou as trajetórias de partículas em queda livre com as geodésicas de uma geometria
curva: são localmente retas, pois o espaço-tempo admite referenciais inerciais locais em que essas trajetórias
são retas, mas globalmente não permanecem paralelas.
2 B. Riemann (1826-1866) foi o primeiro a publicar um estudo detalhado das consequências de abandonar o axioma do
paralelismo de Euclides.
Vamos seguir Einstein e procurar uma teoria da gravidade que use um espaço-tempo curvo
para representar os efeitos da gravidade nas trajetórias das partículas. Para isso, devemos claramente
tem que estudar a matemática da curvatura. A introdução mais simples é realmente estudar
sistemas de coordenadas curvilíneas em um espaço plano, onde nossa intuição é mais sólida. Nós devemos
ver que isso desenvolverá quase todos os conceitos matemáticos de que precisamos, e o passo para uma
espaço curvo será simples. Então, para o resto deste capítulo, estudaremos o euclidiano
plano: não mais SR (por enquanto!) e não mais produtos internos indefinidos. O que nós
estão atrás neste capítulo é paralelismo, não métricas. Essa abordagem tem o bônus adicional de
dando uma derivação mais sensata para tais fórmulas muitas vezes misteriosas como a expressão para
ÿ2 em coordenadas polares!
5.2 Tensor al gebrainp o r d o rdinates
Considere o plano euclidiano. As coordenadas usuais são x e y. Às vezes polar

as coordenadas {r, ÿ} são convenientes:
r = (x2 + y2) 1/2, x = r cos ÿ,

(5.3)
ÿ = arctan(y/x), y = rsin ÿ.
Pequenos incrementos r e ÿ são produzidos por x e y de acordo com
x y
r= x+ y = cos ÿ x + sen ÿ y, ÿ
r r
(5.4)
x 1 ÿ
ÿ = ÿ r2 y ÿ1
x+ r2 y = r
sen ÿ x + r cos ÿ y, ÿ
que são válidos para primeira ordem.
Também é possível usar outros sistemas de coordenadas. Vamos denotar uma coordenada geral
sistema por ÿ e ÿ:
ÿÿ ÿÿ ÿ
ÿ = ÿ (x, y), ÿ = x+
ÿx ÿyy ,
(5.5)
ÿÿ
ÿÿ ÿÿ
ÿ = ÿ(x, y), ÿ= x+
ÿx ÿÿ ÿyy .
Para que (ÿ , ÿ) sejam boas coordenadas, é necessário que quaisquer dois pontos distintos
(x1, y1) e (x2, y2) recebem diferentes pares (ÿ1, ÿ1) e (ÿ2, ÿ2), pela Eq. (5.5). Por
Por exemplo, as definições ÿ = x, ÿ = 1 não dariam boas coordenadas, uma vez que as distintas
pontos (x = 1, y = 2) e (x = 1, y = 3) ambos têm (ÿ = 1, ÿ = 1). Matematicamente, isso
requer que se ÿ = ÿ = 0 na Eq. (5.5), então os pontos devem ser os mesmos, ou x =
y = 0. Isso será verdade se o determinante da Eq. (5.5) é diferente de zero,
ÿÿ/ÿx ÿÿ/ÿy
det = 0. (5.6)
ÿÿ/ÿx ÿÿ/ÿy
Este determinante é chamado de Jacobiano da transformação de coordenadas, Eq. (5.5). Se o

Jacobiano desaparece em um ponto, a transformação é dita singular ali.
119 5.2 Álgebra tensa em coordenadas polares
Vetores e formas únicas
A maneira antiga de definir um vetor é dizer que ele se transforma sob uma transformação
ÿ de
coordenadas arbitrária da mesma forma que o deslocamento se transforma. Ou seja, um vetor
poder ser
representado3 como um deslocamento ( x, y), ou em coordenadas polares ( r, ÿ), ou em geral ( ÿ ,
ÿ). Então fica claro que para pequenos ( x, y) temos (da Eq. (5.5))
ÿ ÿÿ/ÿx ÿÿ/ÿy x
ÿ ÿ = ÿ ÿÿÿ ÿ
(5.7)
ÿ ÿÿ ÿ ÿÿ/ÿx ÿÿ/ÿy ÿ yÿ .
Ao definir a matriz de transformação
ÿ ÿÿ/ ÿx ÿÿ/ÿy ÿÿ/

( ÿ) = , (5.8)
ÿx ÿÿ/ ÿy
podemos escrever a transformação para um V arbitrário da mesma maneira que em SR
Vÿ = ÿÿVÿ , (5.9)
onde os índices não primos referem-se a (x, y) e primos a (ÿ , ÿ), e onde os índices só podem
assumir os valores 1 e 2. Um vetor pode ser definido como algo cujas componentes se transformam
de acordo com a Eq. (5.9). Há uma maneira mais sofisticada e natural, no entanto. Esta é a maneira
moderna, que agora apresentamos.
Considere um campo escalar ÿ. Dadas as coordenadas (ÿ , ÿ) é sempre possível formar as
derivadas ÿÿ/ÿÿ e ÿÿ/ÿÿ. Definimos a forma d˜ÿ como o objeto geométrico cujos componentes são
d˜ÿ ÿ (ÿÿ/ÿÿ , ÿÿ/ÿÿ) (5.10)
no sistema de coordenadas (ÿ , ÿ). Esta é uma definição geral de uma infinidade de formas únicas, cada
uma formada a partir de um campo escalar diferente. A transformação de componentes é automática a
partir da regra da cadeia para derivadas parciais:
ÿÿ = ÿx ÿÿ ÿy ÿÿ + ÿÿ
ÿy , (5.11)
ÿÿ ÿÿ ÿx
e similarmente para ÿÿ/ÿÿ. A maneira mais conveniente de escrever isso em notação matricial é como
uma transformação em vetores-linha,
( ÿÿ /ÿx ÿÿ/ÿy ) ÿx/ÿÿ ÿx/ÿÿ (ÿÿ/ÿÿ ÿÿ/

ÿÿ) = ÿy /ÿÿ ÿy/ÿÿ , (5.12)
porque então a matriz de transformação para uma forma é definida por analogia com a Eq. (5.8)
como um conjunto de derivadas das coordenadas (x, y) pelas coordenadas (ÿ , ÿ):
ÿ ÿx /ÿÿ ÿx/ÿÿ ÿy/

( ÿ) = . (5.13)
ÿÿ ÿy /ÿÿ
3
Vamos denotar vetores euclidianos por setas, e usaremos letras gregas para índices (numerados 1 e 2) para denotar o
fato de que a soma é sobre todos os valores possíveis (ou seja, ambos).
Usando esta matriz, a versão de soma de componentes da transformação na Eq. (5.12) é
(d˜ÿ)ÿ = ÿ ÿ(d˜ÿ)ÿ. (5.14)
Observe que a soma nesta equação está no primeiro índice da matriz de transformação,
como esperamos quando um vetor linha pré-multiplica uma matriz.
É interessante que em SR não tivemos que nos preocupar com vetores linha, porque o
matrizes de transformação de Lorentz simples que usamos eram simétricas. Mas se quisermos ir
além até mesmo das situações mais simples, precisamos ver que componentes de forma única são
elementos de vetores de linha. No entanto, a notação matricial torna-se complicada quando vamos além
tensores com dois índices. Em GR precisamos lidar com tensores com quatro índices, e algumas
vezes até cinco. Como resultado, normalmente expressaremos as equações de transformação em suas
forma algébrica, como na Eq. (5,14); os alunos não verão muita notação de matriz mais tarde neste
livro.
O que vimos nesta seção é que, na visão moderna, o fundamento do tensor
álgebra é a definição de uma forma. Isso é mais natural do que a maneira antiga, na qual
um único vetor ( x, y) foi definido e outros foram obtidos por analogia. Aqui um todo
classe de uma forma é definida em termos de derivadas, e as propriedades de transformação de
one-forms seguem automaticamente.
Agora um vetor é definido como uma função linear de uma forma em números reais. As implicações
disso serão exploradas no próximo parágrafo. Primeiro, apenas notamos que tudo isso é o
mesmo que tivemos em SR, de modo que os vetores de fato obedecem à lei de transformação, Eq. (5.9). Isso é
ÿ ÿ
de interesse ver explicitamente que ( ÿ) e ( ÿ) são inversas um do outro. O produto
das matrizes é
ÿÿ/ÿx ÿÿ/ÿy ÿx/ÿÿ ÿx/ÿÿ

ÿÿ/ÿx ÿÿ/ÿy ÿy /ÿÿ ÿy/ÿÿ
ÿÿ ÿx ÿÿ ÿy ÿÿ ÿx ÿÿ ÿy
= ÿx ÿÿ ÿy+ ÿÿ ÿx ÿÿ ÿy+ ÿÿ . (5.15)
ÿÿ ÿx ÿÿ ÿy ÿÿ ÿx ÿÿ ÿy
ÿx ÿÿ ÿy+ ÿÿ ÿx ÿÿ ÿy+ ÿÿ
Pela regra da cadeia esta matriz é
ÿÿ/ÿÿ ÿÿ/ÿÿ 10
= , (5.16)
ÿÿ/ÿÿ ÿÿ/ÿÿ 01
onde a igualdade segue da definição de uma derivada parcial.
Curvas e vetores
A noção usual de uma curva é de uma série conectada de pontos no plano. Isso nós vamos
chame um caminho e reserve a palavra curva para um caminho parametrizado. Ou seja, seguiremos
terminologia matemática moderna e define uma curva como um mapeamento de um intervalo do
linha real em um caminho no plano. O que isso significa é que uma curva é um caminho com um número real
associados a cada ponto do caminho. Esse número é chamado de parâmetro s. Cada ponto
tem coordenadas que podem então ser expressas como uma função de s:
Curva :{ÿ = f(s), ÿ = g(s), como b} (5.17)
define uma curva no plano. Se alterássemos o parâmetro (mas não os pontos) para s = s (s), que é
uma função do s antigo, teríamos
{ÿ = f (s ), ÿ = g (s ), como b }, (5.18)
onde f e g são novas funções, e onde a = s (a), b = s (b). Trata-se, matematicamente, de uma nova
curva, ainda que sua imagem (os pontos do plano por onde passa) seja a mesma. Portanto, há um
número infinito de curvas com o mesmo caminho.
A derivada de um campo escalar ÿ ao longo da curva é dÿ/ds. Isso depende de s, então por
alterando o parâmetro, alteramos a derivada. Podemos escrever isso como
dÿ/ds = d˜ÿ, V , (5.19)
onde V é o vetor cujas componentes são (dÿ/ds, dÿ/ds). Este vetor depende apenas da curva,
enquanto d˜ÿ depende apenas de ÿ. Portanto , V é um vetor característico da curva, chamado de
vetor tangente . (Ela é claramente tangente à curva: veja a Fig. 5.4.) Assim, um vetor pode ser
considerado como algo que produz dÿ/ds, dado ÿ. Isso leva à visão mais moderna, de que o vetor
tangente à curva deve ser chamado de d/ds. Alguns textos de relatividade ocasionalmente usam
essa notação. Para nossos propósitos, entretanto, vamos apenas deixar V ser o vetor tangente cujas
componentes são (dÿ/ds, dÿ/ds). Observe que um caminho no plano tem, em qualquer ponto, uma
infinidade de tangentes, todas paralelas, mas com comprimentos diferentes. Estes devem ser
considerados como vetores tangentes a diferentes curvas, curvas que possuem diferentes
parametrizações em uma vizinhança daquele ponto. Uma curva tem uma tangente única , pois o
caminho e o parâmetro são dados. Além disso, mesmo curvas que têm tangentes idênticas em um
ponto podem não ser idênticas em outro lugar. Da expansão de Taylor ÿ (s + 1) ÿ ÿ (s) + dÿ/ds,
vemos que V (s) se estende aproximadamente de s a s + 1 ao longo da curva.
Agora, é claro que sob uma transformação de coordenadas s não muda (sua definição não tinha
nada a ver com coordenadas), mas os componentes de V mudarão , pois pela regra da cadeia
dÿ/ds = ÿÿ/ ÿx ÿÿ/ÿy ÿÿ/ dx/ds

. (5.20)
dÿ/ds ÿx ÿÿ/ ÿy d /ds
Esta é a mesma lei de transformação que tínhamos para vetores anteriormente, Eq. (5.7).
ÿ
V
s=7
s=6
s=8
ÿ
V s=5
s=4 s=3 s=2
s=1
Figura 5.4 Uma curva, sua parametrização e seu vetor tangente.

Para resumir, a visão moderna é que um vetor é uma tangente a alguma curva, e é o
função que dá dÿ/ds quando recebe d˜ÿ como argumento. Dito isto, estamos agora
em posição de fazer coordenadas polares mais detalhadamente.
Formas e vetores de base de coordenadas polares
As bases das coordenadas são claramente
eÿ = ÿ
ÿ eÿ,
ou
x y
é= ex + _ rey _
(5.21)
ÿx ÿy
= ex +
ÿr ÿr ei
= cos ÿ ex + sen ÿ ey, (5.22)
e, da mesma forma,
ÿx ÿy
eÿ = ex + ei
ÿÿ ÿÿ
= ÿrsin ÿ ex + r cos ÿ ey. (5.23)
Observe que usamos, entre outros,

ÿx
x = .
r (5.24)
ÿr
Da mesma forma, para transformar de outra forma, precisaríamos

ÿr
r = .
x (5,25)
ÿx
As matrizes de transformação são extremamente simples: basta acompanhar qual índice é

para cima e qual é para baixo dá a derivada certa a ser usada.
As formas de base são, analogamente,
ÿÿ ÿÿ
d˜ÿ = d˜x + d'y,
ÿx ÿy
1
= ÿ1 sen ÿ d˜x + cos ÿ d˜y. (5.26)
r r
(Observe a semelhança com o cálculo ordinário, Eq. (5.4).) Da mesma forma, encontramos
d˜r = cos ÿ d˜x + sen ÿ d˜y. (5.27)
Podemos desenhar imagens das bases em vários pontos (Fig. 5.5). Desenhando os vetores de base
não é problema. Desenhar a base de uma forma é feito mais facilmente desenhando superfícies de
constanter e ÿ para d˜r e d˜ÿ. Essas superfícies têm orientações diferentes em lugares diferentes.
Há um ponto de grande importância a ser observado aqui: as bases mudam de ponto a ponto.
Para os vetores, os vetores de base em A na Fig. 5.5 não são paralelos àqueles em C. Isso é
porque eles apontam na direção da coordenada crescente, que muda de ponto a
dÿ
C
dr
B dÿ
UMA
Figura 5.5 Vectores de base e uma-formas para coordenadas polares.
ponto. Além disso, os comprimentos das bases não são constantes. Por exemplo, da Eq. (5.23) encontramos
| eÿ | 2 == eÿ · eÿ = r 2 sen2 ÿ + r 2 cos2 ÿ = r 2, (5.28a)
de modo que eÿ aumenta em magnitude à medida que nos afastamos da origem. A razão é que o vetor
base eÿ , tendo componentes (0,1) em relação a r e ÿ, tem essencialmente um deslocamento ÿ de uma
unidade, ou seja, um radiano. Deve ser mais longo para fazer isso em grandes raios do que em
pequenos. Portanto, não temos uma base unitária . É fácil verificar que
| er| = 1, |d˜r| = 1, |d˜ÿ| = r ÿ1. (5.28b)
Novamente, |d˜ÿ| fica maior (mais intenso) perto de r = 0 porque um determinado vetor pode abranger uma faixa
maior de ÿ perto da origem do que longe.
Tensor métrico
Os produtos escalares acima foram todos calculados conhecendo a métrica em coordenadas cartesianas x, y:
ex · ex = ei · ei = 1, ex · ei = 0;
ou, coloque em notação tensorial,
g( eÿ, eÿ) = ÿÿÿ em coordenadas cartesianas. (5.29)
Quais são as componentes de g em coordenadas polares? Simplesmente
= g( eÿ , eÿ) = eÿ · eÿ gÿ ÿ (5.30)
ou, pela Eq. (5.28),
grr = 1, gÿÿ = r 2, (5.31a)
e, a partir das Eqs. (5.22) e (5.23),
grÿ = 0. (5.31b)
Assim, podemos escrever as componentes de g como
100
(gÿÿ)polar = (5.32)
r2 ,
Uma maneira conveniente de exibir os componentes de g e, ao mesmo tempo, mostrar

as coordenadas é o elemento de linha, que é a magnitude de um 'infinitesimal' arbitrário
deslocamento dl :
2 dl · dl = ds _ = |dr er + dÿ eÿ | 2
2 = dr + r 2dÿ 2. (5.33)
Não confunda dr e dÿ aqui com as formas de base d˜r e d˜ÿ. As coisas neste
equação são componentes de d l em coordenadas polares, e 'd' significa simplesmente 'infinitesimal'.
Existe outra maneira de derivar a Eq. (5.33) que é instrutivo. Lembre-se da Eq. (3.26) em
0 tensor é escrito como uma soma sobre a base 0
qual é uma tensores d˜xÿ ÿ d˜xÿ. Para o
2 2
métrica geral
g = gÿÿ d˜xÿ ÿ d˜xÿ = d˜r ÿ d˜r + r 2d˜ÿ ÿ d˜ÿ.
Embora isso tenha uma semelhança superficial com a Eq. (5.33), é diferente: é um operador que,
quando fornecido com o vetor d l, cujos componentes são dr e dÿ,
dá a Eq. (5.33). Infelizmente, as duas expressões se assemelham muito de perto
devido à maneira confusa como a notação evoluiu neste assunto. A maioria dos textos e pesquisas
artigos ainda usam a forma 'antiquada' na Eq. (5.33) para exibir os componentes do
métrica, e seguimos a mesma prática.
A métrica tem um inverso:
ÿ1
10 10
= (5,34)
0 r2 0 rÿ2 .
Então temos grr = 1, grÿ = 0, gÿÿ = 1/ r2. Isso nos permite fazer o mapeamento entre
formas e vetores. Por exemplo, se ÿ é um campo escalar e d˜ÿ é seu gradiente, então o
vetor dÿ tem componentes
ÿ
(dÿ) = gÿÿÿ,ÿ, (5,35)
ou
r
(dÿ) = grÿÿ,ÿ = grrÿ,r + grÿÿ,ÿ
= ÿÿ/ÿr; (5.36a)
ÿ (dÿ) = gÿr ÿ,r + gÿÿÿ,ÿ

1 ÿÿ
= . (5.36b)
r2 ÿÿ
Assim, enquanto (ÿ,r, ÿ,ÿ ) são componentes de uma forma, o gradiente vetorial tem componentes
(ÿ,r, ÿ,ÿ /r2). Apesar de estarmos no espaço euclidiano, os vetores geralmente têm componentes diferentes de suas formas
associadas. As coordenadas cartesianas são as únicas coordenadas em

quais os componentes são os mesmos.
125 5.3 Cálculo tenso r em coordenadas polares
5.3 Co rdinadas de uso de cultura ten sorc
O fato de os vetores de base das coordenadas polares não serem constantes em todos os lugares, leva
alguns problemas quando tentamos diferenciar vetores. Por exemplo, considere o simples
vetor ex, que é um campo vetorial constante, o mesmo em qualquer ponto. Em coordenadas polares
r ÿ
tem componentes ex ÿ ( mesmo x, x) = (cos ÿ, ÿrÿ1 sen ÿ). Estes claramente não são constantes,
que ex seja. A razão é que eles são componentes em uma base não constante. Se
fôssemos diferenciá-los em relação a, digamos, ÿ, certamente não obteríamos
ÿ ex/ÿÿ, que deve ser identicamente zero. Assim, a partir deste exemplo, vemos que diferenciar os
componentes de um vetor não fornece necessariamente a derivada do vetor. Nós
também deve diferenciar os vetores de base não constantes. Esta é a chave para a compreensão das
coordenadas curvas e, de fato, dos espaços curvos. Vamos agora fazer essas idéias
sistemático.
Derivadas de vetores de base
Como ex e ey são campos vetoriais constantes, descobrimos facilmente que
ÿ ÿ
er = (cos ÿ ex + sen ÿ ey) = 0, ÿr (5.37a)
ÿr
ÿ ÿ
é= (cos ÿ ex + sen ÿ ey)
ÿÿ ÿÿ
1
= ÿ sen ÿ ex + cos ÿ ey = eÿ . (5.37b)
r
Estes têm uma figura geométrica simples, mostrada na Fig. 5.6. Em dois pontos próximos, A e
B, er deve apontar diretamente para longe da origem e, portanto, em direções ligeiramente diferentes. o
derivada de er em relação a ÿ é apenas a diferença entre er em A e B dividida por ÿ.
B
UMA
ÿÿ
Figura 5.6 Mudança em er, quando ÿ varia de ÿ.

A diferença neste caso é claramente um vetor paralelo a eÿ , o que torna a Eq. (5.37b)
razoável.
De forma similar,
ÿ ÿ
eÿ = (ÿrsin ÿ ex + r cos ÿ ey)
ÿr ÿr
1
= ÿ sen ÿ ex + cos ÿ ey = eÿ , (5.38a)
r
ÿ
eÿ = ÿr cos ÿ ex ÿ rsin ÿ ey = ÿr er. ÿÿ (5.38b)
O aluno é encorajado a fazer um desenho semelhante ao da Fig. 5.6 para explicar essas fórmulas.
Derivadas de vetores gerais
Voltemos à derivada de ex. Desde

1
ex = cos ÿ er ÿ sen ÿ eÿ , (5,39)
r
temos
ÿ ÿ ÿ
ex = (cos ÿ) er + cos ÿ ( é)
ÿÿ ÿÿ ÿÿ ÿ
1 1 ÿ
sen ÿ eÿ ÿ sen ÿ ( eÿ ) (5,40)
ÿ
ÿÿ r r ÿÿ
1
= ÿ sen ÿ er + cos ÿ eÿ
r
1 1
cos ÿ eÿ ÿ sen ÿ(ÿr er). (5.41)
ÿ
r r
Para obter isso, usamos as Eqs. (5.37) e (5.38). Simplificar dá

ÿ
ex = 0, (5,42)
ÿÿ
assim como deveríamos ter. Agora, na Eq. (5.40) o primeiro e o terceiro termos provêm da diferenciação das
componentes de ex na base das coordenadas polares; os outros dois termos são os
derivadas dos próprios vetores de base polar, e são necessários para cancelar o
derivados dos componentes.
Um vetor geral V tem componentes (Vr , com a Vÿ ) na base polar. Sua derivada, por analogia
Eq. (5.40), é
ÿV ÿ
= (Vr er + Vÿ eÿ )
ÿr ÿr
ÿVr ÿ er ÿVÿ
= er + Vr + eÿ + Vÿ ÿ eÿ ,
ÿr ÿr ÿr ÿr
e similarmente para ÿV /ÿÿ. Escrito em notação de índice, isso se torna
ÿV ÿ ÿVÿ ÿ eÿ
= (Vÿ eÿ) = eÿ + Vÿ .
ÿr ÿr ÿr ÿr
(Aqui ÿ percorre naturalmente r e ÿ.)

Isso mostra explicitamente que a derivada de V é mais do que apenas a derivada de

seus componentes Vÿ. Agora, como r é apenas uma coordenada, podemos generalizar o acima
equação para
ÿV ÿVÿ ÿ eÿ
= eÿ + Vÿ , (5,43)
ÿxÿ ÿxÿ ÿxÿ
onde, agora, xÿ pode ser r ou ÿ para ÿ = 1 ou 2.
Os símbolos de Christoffel
O termo final da Eq. (5.43) é obviamente de grande importância. Como ÿ eÿ/ÿxÿ é ele próprio um
vetor, pode ser escrito como uma combinação linear dos vetores de base; nós apresentamos o
símbolo ÿÿÿ para denotar os coeficientes nesta combinação:
ÿ eÿ
= ÿÿÿ eÿ. ÿxÿ (5,44)
A interpretação de ÿÿÿ é que é o ÿésimo componente de ÿ eÿ/ÿxÿ. Precisa de três

índices: um (ÿ) dá o vetor base a ser diferenciado; o segundo (ÿ) dá a
coordenar em relação ao qual está sendo diferenciado; e o terceiro (ÿ) denota o
componente do vetor derivado resultante. Essas coisas, ÿÿÿ, são tão úteis que
receberam um nome: os símbolos de Christoffel. A questão se são ou não
componentes de tensores que adiamos para muito mais tarde.
É claro que já os calculamos para coordenadas polares. Das Eqs. (5.37) e
(5.38) encontramos
(1) ÿ er/ÿr = 0 ÿ ÿrr = 0 para todos os ÿ, ÿ
(2) ÿ er/ÿÿ =
1
eÿ ÿ
r
rÿ = 0, ÿ
rÿ
= 1
,
r r
(5,45)
(3) ÿ eÿ /ÿr = (4)
1
eÿ ÿ
r
ÿr = 0, ÿ
ÿr
= 1
, ÿÿÿÿÿ
r r
r ÿ = 0.
ÿ eÿ /ÿÿ = ÿr er ÿ ÿÿ = -r, ÿÿ ÿÿÿÿÿ
Na definição, a Eq. (5.44), todos os índices devem referir-se ao mesmo sistema de coordenadas. Desta forma,
embora tenhamos calculado as derivadas de er e eÿ usando a constância de ex e ey,
as bases cartesianas, no final, não aparecem na Eq. (5,45). O Christoffel
importância dos símbolos é que eles nos permitem expressar essas derivadas sem usar qualquer
outras coordenadas que não as polares.
A derivada covariante
Usando a definição dos símbolos de Christoffel, a Eq. (5.44), a derivada na Eq. (5,43)
torna-se
ÿV ÿVÿ
= (5,46)
eÿ + Vÿ ÿÿÿ eÿ.
ÿxÿ ÿxÿ
No último termo existem duas somas, em ÿ e ÿ. Reetiquetar os índices fictícios ajudará

aqui: mudamos ÿ para ÿ e ÿ para ÿ e obtemos
ÿV ÿVÿ ÿ
= eÿ + Vÿ (5,47)
ÿÿ eÿ.
ÿxÿ ÿxÿ
A razão para a reclassificação foi que, agora, eÿ pode ser fatorado de ambos os termos:
ÿV ÿVÿ ÿ
= + Vÿ (5,48)
ÿÿ eÿ.
ÿxÿ ÿxÿ
Então o campo vetorial ÿV / ÿxÿ tem componentes
ÿ
ÿVÿ/ÿxÿ + Vÿ ÿÿ. (5,49)
Lembre-se de nossa notação original para a derivada parcial, ÿVÿ/ÿxÿ = Vÿ ,ÿ. Nós mantemos isso
notação e defina um novo símbolo:
ÿ
Vÿ ;ÿ := Vÿ ,ÿ + Vÿ ÿÿ. (5,50)
Então, com esta notação abreviada de ponto e vírgula, temos
ÿV /ÿxÿ = Vÿ ;ÿ eÿ, (5.51)
uma maneira muito compacta de escrever a Eq. (5,48).

Agora ÿV / ÿxÿ é um campo vetorial se considerarmos ÿ como um dado número fixo. Mas há dois
1
valores que ÿ pode ter, e assim também podemos considerar ÿV / ÿxÿ como sendo associado a um campo 1
tensorial que mapeia o vetor eÿ no vetor ÿV / ÿxÿ, como em Exer. 17, § 3.10. este
campo tensorial é chamado de derivada covariante de V , denotada, naturalmente, como ÿV . Então
seus componentes são

ÿ ÿ
(ÿV ) = Vÿ (5,52)
ÿ = (ÿÿV ) ;ÿ.
Em uma base cartesiana os componentes são apenas Vÿ,ÿ. Na base curvilínea, no entanto, o
derivadas dos vetores de base devem ser levadas em conta, e obtemos que Vÿ;ÿ são as
componentes de ÿV em qualquer sistema de coordenadas que os símbolos de Christoffel na Eq. (5,50)
referir-se. O significado desta declaração não deve ser subestimado, pois é a base
1
de todo o nosso trabalho posterior. Existe um único tensor chamado ÿV . Em coordenadas cartesianas sua
1
componentes são ÿVÿ/ÿxÿ. Em coordenadas gerais {xÿ } seus componentes são chamados de Vÿ ;ÿ
e pode ser obtido de duas maneiras equivalentes: (i) calcule-os diretamente em {xÿ }
ÿ
usando a Eq. (5.50) e um conhecimento de quais são os coeficientes ÿÿ nessas coordenadas;
ou (ii) obtê-los pelas leis usuais de transformação tensorial de Cartesiana para {xÿ }.
Qual é a derivada covariante de um escalar? A derivada covariante difere da
derivada parcial em relação às coordenadas apenas porque os vetores básicos mudam.

Mas um escalar não depende dos vetores de base, então sua derivada covariante é a mesma que
sua derivada parcial, que é seu gradiente:
ÿÿf = ÿf / ÿxÿ; ÿf = d˜f . (5,53)

Divergência e Laplaciano
Antes de fazer qualquer teoria, vamos relacionar isso com coisas que vimos antes. Dentro
Coordenadas cartesianas a divergência de um vetor Vÿ é Vÿ,ÿ. Este é o escalar obtido
contraindo Vÿ,ÿ em seus dois índices. Como a contração é uma operação invariante de quadro,
a divergência de V pode ser calculada em outras coordenadas {xÿ } também contraindo o
componentes de ÿV em seus dois índices. Isso resulta em um escalar com o valor Vÿ ;ÿ .
Isso é
importante perceber que este é o mesmo número que Vÿ,ÿ em coordenadas cartesianas:
Vÿ ,ÿ
ÿ Vÿ ;ÿ , (5,54)
onde os índices não primos referem-se às coordenadas cartesianas e os primos referem-se às coordenadas arbitrárias
sistema.
Para coordenadas polares (soltando primos por conveniência aqui)
ÿVÿ
Vÿ = +
ÿ
;ÿ ÿÿVÿ.
ÿxÿ
Agora, da Eq. (5.45) podemos calcular

r ÿ
ÿrÿ = rr + rÿ = 1/ r,
r ÿ
(5,55)
ÿÿÿ = ÿr + ÿÿ = 0.
Portanto temos
ÿVr ÿVÿ 1
Vÿ = + + VR ,
;ÿ
ÿr ÿÿ r
1 ÿ ÿ
= (rVr ) + Vÿ . (5,56)
r ÿr ÿÿ
Esta pode ser uma fórmula familiar para o aluno. O que provavelmente é mais familiar é o Lapla cian,
que é a divergência do gradiente. Mas temos apenas a divergência de vetores,
e o gradiente é uma forma única. Portanto, devemos primeiro converter a forma única em um vetor.
Assim, dado um ÿ escalar, temos o gradiente vetorial (veja a Eq. (5.53) e a última parte do § 5.2
acima) com componentes (ÿ,r, ÿ,ÿ /r2). Usando estes como os componentes do vetor no
fórmula de divergência, Eq. (5,56) dá
1 ÿ ÿÿ 1 ÿ2ÿ
ÿ·ÿÿ := ÿ2ÿ = r + . (5,57)
r ÿr ÿr r2 ÿÿ 2
Este é o Laplaciano em coordenadas polares planas. É, obviamente, identicamente igual a
ÿ2ÿ ÿ2ÿ
ÿ2ÿ = + . (5,58)
ÿx2 ÿy2
Derivadas de uma-formas e tensores de tipos superiores
Como um escalar ÿ não depende de vetores de base, sua derivada d˜ÿ é a mesma que sua covariante
derivada ÿÿ. Quase sempre usaremos o símbolo ÿÿ. Para calcular a derivada de
uma forma (que para um vetor não será simplesmente as derivadas de seus componentes), usamos
a propriedade de que uma forma única e um vetor dão um escalar. Assim, se p˜ é uma forma única e V é uma
vetor arbitrário, então para ÿ fixo, ÿÿp˜ também é uma forma, ÿÿV é um vetor, e ˜p, V ÿ ÿ
é um escalar. Em qualquer sistema de coordenadas (arbitrário) este escalar é apenas
ÿ = pÿVÿ. (5,59)
Portanto ÿÿÿ é, pela regra do produto para derivadas,
ÿpÿ ÿVÿ
ÿÿÿ = ÿ,ÿ = ÿxÿ Vÿ + pÿ . (5,60)
ÿxÿ
Mas podemos usar a Eq. (5.50) para substituir ÿVÿ/ÿxÿ em favor de Vÿ;ÿ, que são os componentes
de ÿÿV :
ÿpÿ ÿ
ÿÿÿ = ÿxÿ Vÿ + pÿ Vÿ ;ÿ ÿ pÿVÿ ÿÿ. (5,61)
Reorganizando termos e reclassificando índices fictícios no termo que contém o Christoffel

símbolo, dá
ÿpÿ
ÿÿÿ = ÿ pÿ ÿÿÿ Vÿ + pÿVÿ ;ÿ. ÿxÿ (5,62)
Agora, cada termo nesta equação, exceto o entre parênteses, é conhecido por ser o componente de um
tensor, para um campo vetorial arbitrário V . Portanto, como a multiplicação e a adição
de componentes sempre dá novos tensores, deve ser verdade que o termo entre parênteses também é
o componente de um tensor. Esta é, obviamente, a derivada covariante de p˜:
(ÿÿp˜)ÿ := (ÿ ˜p)ÿÿ := pÿ;ÿ = pÿ,ÿ ÿ pÿ ÿÿÿ. (5,63)
Então a Eq. (5.62) lê
ÿÿ(pÿVÿ) = pÿ;ÿVÿ + pÿVÿ ;ÿ. (5,64)
Assim, a diferenciação covariante obedece ao mesmo tipo de regra do produto que a Eq. (5,60). Deve _
faça isso, já que em coordenadas cartesianas ÿ é apenas uma diferenciação parcial de componentes, então
Eq. (5.64) reduz-se à Eq. (5,60).
Vamos comparar as duas fórmulas que temos, Eq. (5,50) e Eq. (5.63):
ÿ
Vÿ pÿ;ÿ= =Vÿ
pÿ,ÿ,ÿÿ+pÿVÿÿÿÿ.
;ÿ ÿÿ,
Há certas semelhanças e certas diferenças. Se lembrarmos que a derivada

, índices são os únicos que podem ser sem
índice ÿ é o último , então os outros
subindo e descendo com a métrica. A única coisa a observar é a diferença de sinal. Pode
ajuda a lembrar que ÿÿÿ estava relacionado a derivadas dos vetores de base, pois então é
razoável que ÿ ÿÿÿ esteja relacionado a derivadas das formas-um da base. A mudança de sinal
significa que as formas de base mudam 'opostamente' aos vetores de base, o que faz sentido
131 5.4 Símbolos de c ris to f fel e a métrica
quando lembramos que a contração ˜ÿÿ, eÿ = ÿÿÿ é uma constante, e sua derivada
deve ser nulo.
O mesmo procedimento que levou à Eq. (5.63) levaria ao seguinte:
ÿ ÿ
ÿÿTÿÿ = Tÿÿ,ÿ ÿ Tÿÿ ÿÿ ÿ Tÿÿ ÿÿAÿÿ = ÿÿ; (5,64)
ÿ
Aÿÿ ,ÿ + Aÿÿ ÿÿÿ + Aÿÿ ÿÿBÿÿ = Bÿÿ,ÿ + Bÿ ÿÿ; (5,65)
ÿ
ÿ ÿÿÿ ÿ Bÿÿ ÿÿ. (5,66)
Inspecione-os de perto: eles são muito sistemáticos. Simplesmente coloque um termo para cada índice;
um índice elevado é tratado como um vetor e um baixo como uma forma única. O geométrico
0 0
significado da Eq. (5.64) é que ÿÿTÿÿ é um componente do tensor ÿT, onde
3 T é um tensor. Da mesma 2
2 tensor e ÿA é um 2
forma, na Eq. (5.65), A é um ÿÿAÿÿ . 0 1 tensor com componentes
5.4 C r stoff s y m b ol sandtheme r ic
O formalismo desenvolvido acima não usou nenhuma propriedade do tensor métrico para derivar
derivadas covariantes. Mas a métrica deve estar envolvida de alguma forma, porque pode converter
um vetor em uma forma única e, portanto, deve ter algo a dizer sobre o relacionamento
entre seus derivados. Em particular, em coordenadas cartesianas os componentes do
uma forma e seu vetor relacionado são iguais, e como ÿ é apenas diferenciação de componentes,
os componentes das derivadas covariantes da forma única e do vetor devem ser iguais.
Isso significa que se V é um vetor arbitrário e V˜ = g(V , ) é sua forma relacionada, então em
Coordenadas cartesianas
ÿÿV˜ = g(ÿÿV , ). (5,67)
Mas a eq. (5.67) é uma equação tensorial, portanto deve ser válida em todas as coordenadas. Concluimos que
Vÿ;ÿ = gÿÿVÿ ;ÿ, (5,68)
que é a representação componente da Eq. (5,67).

Se o argumento acima em palavras não foi satisfatório, vamos analisá-lo novamente em equações. Sejam
índices não primos ÿ, ÿ, ÿ , ··· denotar coordenadas cartesianas e índices primos
ÿ ,ÿ,ÿ, ··· denotam coordenadas arbitrárias .
Começamos com a afirmação
Vÿ = gÿ ÿVÿ , (5,69)
válido em qualquer sistema de coordenadas. Mas em coordenadas cartesianas
gÿÿ = ÿÿÿ, Vÿ = Vÿ.

Agora, também em coordenadas cartesianas, os símbolos de Christoffel desaparecem, então
Vÿ;ÿ = Vÿ,ÿ e Vÿ Vÿ =;ÿ ,ÿ.
Por isso concluímos
Vÿ;ÿ = Vÿ ;ÿ
apenas em coordenadas cartesianas. Para converter isso em uma equação válida em todos os sistemas de
coordenadas, notamos que em coordenadas cartesianas
Vÿ;ÿ = gÿÿVÿ ;ÿ,
de modo que novamente em coordenadas cartesianas temos
Vÿ;ÿ = gÿÿVÿ ;ÿ.
Mas agora esta equação é uma equação tensorial, então sua validade em um sistema de coordenadas implica sua
validade em todos. Esta é apenas a Eq. (5.68) novamente:
Vÿ;ÿ = gÿ ÿVÿ ;ÿ (5,70)
Este resultado tem implicações de longo alcance. Se tomarmos a derivada covariante ÿ de

Eq. (5.69), encontramos
Vÿ ;ÿ = gÿ ÿ ;ÿ ;ÿ . Vÿ + gÿ ÿ Vÿ
A comparação disso com a Eq. (5.70) mostra (já que V é um vetor arbitrário) que devemos ter
gÿÿ;ÿ
ÿ0 (5,71)
em todos os sistemas de coordenadas. Isso é uma consequência da Eq. (5,67). Em coordenadas cartesianas
gÿÿ;ÿ ÿ gÿÿ,ÿ = ÿÿÿ,ÿ ÿ 0
é uma identidade trivial. No entanto, em outras coordenadas não é óbvio, então vamos trabalhá-lo como
uma verificação da consistência do nosso formalismo.
Usando a Eq. (5.64) dá (agora os índices não primos são gerais)
ÿ ÿ
gÿÿ;ÿ = gÿÿ,ÿ ÿ ÿÿgÿÿ ÿ ÿÿgÿÿ . (5,72)
Em coordenadas polares vamos trabalhar alguns exemplos. Seja ÿ = r, ÿ = r, ÿ = r:

ÿ ÿ
grr;r = grr,r ÿ rrgÿr ÿ rrgrÿ .
ÿ
Como grr,r = 0 e ÿ = ÿ,ÿ rr = 0 para todo ÿ, isso é trivialmente zero. Não tão trivial é ÿ = ÿ,
= r:
ÿ ÿ
gÿÿ;r = gÿÿ,r ÿ ÿrgÿÿ ÿ ÿrgÿÿ .
r
Com gÿÿ = r2, ÿ ÿr = 1/r e = 0, isso se torna ÿr
1 1
gÿÿ ;r = (r 2),r ÿ (r 2) - (r 2) = 0.
r r
133 5.4 Símbolos de c ris to f fel e a métrica
Então funciona, quase magicamente. Mas é importante perceber que não é mágica: segue diretamente dos
fatos que gÿÿ,ÿ = 0 em coordenadas cartesianas e que gÿÿ;ÿ são as
componentes do mesmo tensor ÿg em coordenadas arbitrárias.
Talvez seja útil fazer uma pausa aqui para ter alguma perspectiva sobre o que acabamos de fazer.
Introduzimos a diferenciação covariante em coordenadas arbitrárias usando nosso entendimento de paralelismo
no espaço euclidiano. Mostramos então que a métrica de Euclides
o espaço é covariantemente constante: Eq. (5.71). Quando passamos a curva (Riemanniana)
espaços teremos que discutir o paralelismo com muito mais cuidado, mas a Eq. (5.71) será
ainda é verdade e, portanto, todas as suas consequências, como as que agora passamos a
descrever.
Calculando os símbolos de Christoffel a partir da métrica
O desaparecimento da Eq. (5.72) leva a um resultado extremamente importante. Vemos que a Eq. (5,72)
pode ser usado para determinar gÿÿ,ÿ em termos de ÿÿÿ. Acontece que o inverso também é verdadeiro,
que ÿÿÿ pode ser expresso em termos de gÿÿ,ÿ. Isso fornece uma maneira fácil de derivar os símbolos de
Christof vil. Para mostrar isso, primeiro provamos um resultado de alguma importância em si mesmo: em
qualquer sistema de coordenadas ÿÿÿ ÿ ÿÿÿ. Para provar essa simetria, considere um escalar arbitrário
campo ÿ. Sua primeira derivada ÿÿ é uma forma com componentes ÿ,ÿ. Sua segunda covariante
0
derivada ÿÿÿ tem componentes ÿ,ÿ;ÿ e é um tensor. Em coordenadas
2 cartesianas esses
componentes são
ÿ ÿ
ÿ,ÿ,ÿ := ÿ
ÿxÿ ÿxÿ
e vemos que elas são simétricas em ÿ e ÿ, pois as derivadas parciais comutam. Mas se um
tensor é simétrico em uma base é simétrico em todas as bases. Portanto
ÿ,ÿ;ÿ = ÿ,ÿ;ÿ (5,73)
em qualquer base. Usando a definição, a Eq. (5,63) dá
ÿ,ÿ,ÿ ÿ ÿ,ÿ ÿÿÿ = ÿ,ÿ,ÿ ÿ ÿ,ÿ ÿÿÿ
em qualquer sistema de coordenadas. Mas novamente temos
ÿ,ÿ,ÿ = ÿ,ÿ,ÿ
em quaisquer coordenadas, o que deixa
ÿÿÿÿ,ÿ = ÿÿÿÿ,ÿ
para ÿ arbitrário. Isso prova a afirmação
ÿÿÿ = ÿÿÿ em qualquer sistema de coordenadas. (5,74)

Usamos isso para inverter a Eq. (5,72) por algumas ginásticas de índice avançado. Nós escrevemos três
versões da Eq. (5.72) com diferentes permutações de índices:
ÿ ÿ
gÿÿ,ÿ = ÿÿgÿÿ + ÿÿgÿÿ ,
ÿ ÿ
gÿÿ,ÿ = ÿÿgÿÿ + ÿÿgÿÿ ,
ÿ ÿ
ÿgÿÿ,ÿ = ÿ ÿÿgÿÿ ÿ ÿÿgÿÿ .
Somamos esses termos e agrupamos, usando a simetria de g, gÿÿ = gÿÿ:
gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ

ÿ ÿ ÿ ÿ ÿ ÿ
=( ÿÿ)gÿÿ + ( ÿÿ)gÿÿ + ( ÿÿ + ÿÿ)gÿÿ .
ÿ
ÿÿ ÿÿ -
Nesta equação, os dois primeiros termos à direita desaparecem pela simetria de e , Eq. (5,74),
obtemos
ÿ
gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ = 2gÿÿ ÿÿ.
Estamos quase lá. Dividindo por 2, multiplicando por gÿÿ (com soma implícita em ÿ)
e usando
gÿÿ gÿÿ ÿ ÿÿ ÿ
dá
1
ÿ
(5,75)
2 gÿÿ (gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ) = ÿÿ.
Esta é a expressão dos símbolos de Christoffel em termos das derivadas parciais do

componentes de g. Em coordenadas polares, por exemplo,
ÿ = 1
rÿ 2 gÿÿ (gÿr,ÿ + gÿÿ,r ÿ grÿ,ÿ).
Como grÿ = 0 e gÿÿ = rÿ2, temos
ÿ
1
rÿ
= (gÿr,ÿ + gÿÿ,r ÿ grÿ,ÿ )
2r2
1 1 1
= gÿÿ,r = (r 2), r = .
2r2 2r2 r
ÿ
Este é o mesmo valor para rÿ , como deduzimos anteriormente. Este método de calcular ÿÿÿ é
tão útil que vale a pena cometer a Eq. (5.75) para a memória. vai ser exatamente igual
em espaços curvos.
A natureza tensorial de ÿ ÿÿ
1
Como eÿ é um vetor, ÿ eÿ é um tensor
1 cujos componentes são ÿÿÿ. Aqui ÿ é fixo e
ÿ e ÿ são os índices de componentes: mudando ÿ muda o tensor ÿ eÿ, enquanto mudando
ÿ ou ÿ altera apenas o componente em discussão. Portanto, é possível considerar ÿ e
135 5.5 Bases não coordenadas
ÿ como índices de componentes e ÿ como um rótulo que fornece o tensor específico referido. Existe um tal tensor
para cada vetor de base eÿ. No entanto, isso não é muito útil, pois sob uma mudança de coordenadas a base
muda e as quantidades importantes no novo sistema são os novos tensores ÿ eÿ que são obtidos dos antigos ÿ
eÿ de uma maneira complicada: são tensores diferentes , não apenas componentes diferentes do mesmo tensor.
Assim, o conjunto ÿÿÿ em um quadro não é obtido por uma simples transformação tensorial do conjunto ÿÿ ÿ de
outro quadro. O exemplo mais fácil disso são as coordenadas cartesianas, onde ÿÿÿ ÿ 0, embora não sejamzero
em outros quadros. Assim, em muitos livros é dito que ÿÿÿ não são componentes de tensores. Como vimos, isso
não é estritamente verdadeiro: ÿÿÿ são os componentes (ÿ, ÿ) de um conjunto de tensores ÿ eÿ. Mas não existe
um tensor único cujos componentes sejam ÿÿÿ, então expressões como ÿÿÿVÿ também não são componentes de
um único tensor. o 11 12
combinação
Vÿ ,ÿ
+ Vÿÿ ÿÿ
é um componente de um único tensor ÿV .
5,5 N em bases coordenadas
Em toda essa discussão, geralmente assumimos que os vetores de base não cartesianos foram gerados por uma
transformação de coordenadas de (x, y) para algum (ÿ , ÿ). No entanto, como mostraremos a seguir, nem todo
corpo de vetores de base pode ser obtido dessa maneira, e teremos que examinar cuidadosamente nossos
resultados para ver quais precisam ser modificados (poucos realmente precisam).
Quase nunca usaremos bases não coordenadas em nosso trabalho neste curso, mas elas são freqüentemente
encontradas nas referências padrão em coordenadas curvas no espaço plano, então devemos fazer uma pausa
para dar uma breve olhada nelas agora.
Base de coordenadas polares
Os vetores base para o nosso sistema de coordenadas polares foram definidos por
eÿ = ÿÿ eÿ,
onde os índices primos referem-se às coordenadas polares e os não primos aos cartesianos. Além disso, tivemos
ÿ
ÿ = ÿxÿ/ÿxÿ ,
onde consideramos as coordenadas cartesianas {xÿ} como funções das coordenadas polares {xÿ }.
Nós achamos isso
· eÿ ÿ gÿ ÿ = ÿÿÿ , eÿ
ou seja, que esses vetores de base não são vetores unitários.

Base da unidade polar
Muitas vezes é conveniente trabalhar com vetores unitários . Um conjunto simples de vetores unitários derivados de
a base da coordenada polar é:
1
erˆ = er, eÿˆ = eÿ , (5,76)
r
com uma unidade de base uniforme correspondente
ÿ˜rˆ = d˜r, ÿ˜ ÿˆ = rd˜ÿ. (5,77)
O aluno deve verificar que
eÿˆ · eÿˆ ÿ gÿˆÿˆ = ÿÿˆÿˆ,

(5,78)
ÿˆÿ˜ _ · ˜ÿÿˆ ÿ gÿˆÿˆ = ÿÿˆÿˆ
então estes constituem bases ortonormais para os vetores e formas-um. Nossa notação, que
é bastante padrão, é usar um 'caret' ou 'hat', ˆ, acima de um índice para denotar um ortornormal
base. Agora, surge a questão, existem coordenadas (ÿ , ÿ) tais que
ÿx ÿy
erˆ = eÿ = ex + ey (5.79a)
ÿÿ ÿÿ
e
ÿx ÿy
eÿˆ = eÿ = ex + ei? (5.79b)
ÿÿ ÿÿ
Se sim, então { erˆ, eÿˆ} são a base para as coordenadas (ÿ , ÿ) e, portanto, podem ser chamadas de coordenadas
base; se tal (ÿ , ÿ) puder ser demonstrado que não existe, então esses vetores são uma base não coordenada.
A questão é, na verdade, mais facilmente respondida se olharmos para as formas únicas básicas. Assim, nós
procure (ÿ , ÿ) tal que
ÿ
ÿ˜rˆ = d˜ÿ = ÿÿ/ ÿx d˜x + ÿÿ/ ÿy d˜y,
(5,80)
ÿ
ÿˆÿ˜ _
= d˜ÿ = ÿÿ/ ÿx d˜x + ÿÿ/ ÿy d˜y. ÿ
ÿˆ
Como sabemos ÿ˜rˆ e ÿ˜ em termos de d˜r e d˜ÿ, temos, a partir das Eqs. (5.26) e (5.27),
ÿ˜rˆ = d˜r = cos ÿ d˜x + sin ÿd˜y,

(5,81)
ÿ˜ ÿˆ = r d˜ÿ = ÿ sen ÿ d˜x + cos ÿd˜y.
ÿˆ (A ortonormalidade de ÿ˜rˆ e ÿ˜ são óbvias aqui.) Assim, se (ÿ , ÿ) existir, temos
ÿÿ ÿÿ
= ÿ sen ÿ, = cosÿ. (5,82)
ÿx ÿy
Se isso fosse verdade, então as derivadas mistas seriam iguais:

ÿ ÿÿ ÿ ÿÿ
= . (5,83)
ÿy ÿx ÿx ÿy
Isso implicaria
ÿ ÿ
(ÿ sin ÿ) = (cos ÿ) ÿy (5,84)
ÿx
137 5.5 Bases não coordenadas
ou
ÿ y ÿ x
+ = 0.
ÿy ÿ(x2 + y2) ÿx ÿ(x2 + y2)
Isso certamente não é verdade. Portanto ÿ e ÿ não existem: temos uma base não coordenada.
(Se esse tipo de prova for surpreendente, tente nos próprios d˜r e d˜ÿ.)
Nos livros que tratam de cálculo vetorial em coordenadas curvilíneas, quase todos usam a base
ortonormal unitária em vez da base coordenada. Assim, para coordenadas polares, se um vetor tem
componentes na base de coordenadas PC,
V (5,85)
ÿÿPC (a, b) = {Vÿ },
então tem componentes na base ortonormal PO
V (5,86)
ÿÿPO (a,rb) = {Vÿˆ }.
Então, se, por exemplo, os livros calculam a divergência do vetor, eles obtêm, em vez de nossa Eq. (5,56),
1 ÿ 1 ÿ
ÿ·V= (r Vrˆ ) + Vÿˆ . (5,87)
r ÿr r ÿÿ
A diferença entre as Eqs. (5.56) e (5.87) é puramente uma questão de base para V .
Observações gerais sobre bases não coordenadas
As principais diferenças entre bases coordenadas e não coordenadas surgem do seguinte. Considere
um campo escalar arbitrário ÿ e o número d˜ÿ( eÿ), onde eÿ é um vetor base de alguma base arbitrária.
Usamos a notação
d˜ÿ( eÿ) = ÿ,ÿ. (5,88)
Agora, se eÿ é um membro de uma base coordenada, então d˜ÿ( eÿ) = ÿÿ/ÿxÿ e temos, como definido em
um capítulo anterior,
ÿÿ
ÿ,ÿ = ÿxÿ : base coordenada. (5,89)
Mas se não existem coordenadas para { eÿ}, então a Eq. (5.89) deve falhar. Por exemplo, se deixarmos a
Eq. (5.88) defina ÿ,ÿˆ , então temos
1 ÿÿ
. (5,90)
ÿ,ÿˆ = r ÿÿ
Em geral, obtemos
ÿ ÿÿ
ÿ ÿˆ ÿxÿ
ÿÿˆ ÿ ÿ ÿ,ÿˆ = ÿˆ ÿÿÿ = (5,91)
para qualquer sistema de coordenadas {xÿ} e base não coordenada { eÿˆ}. Portanto, é conveniente
continuar com a notação, Eq. (5.88), e fazer a regra de que ÿ,ÿ = ÿÿ/ÿxÿ apenas em uma base coordenada.
Os símbolos de Christoffel podem ser definidos como antes

ÿˆ
ÿÿˆ eÿˆ = ÿˆÿˆ eÿˆ ,
(5,92)
mas agora
ÿ
ÿ
ÿÿˆ = ÿˆ
, (5,93)
ÿxÿ
onde {xÿ} é qualquer sistema de coordenadas e { eÿˆ} qualquer base (coordenada ou não). Agora, porém,
não podemos provar que ÿˆ = ÿˆ o que era verdade
ÿˆÿˆ , uma vez que essa prova usou ÿ,ÿˆ,ÿˆ = ÿ,ÿˆ,ÿˆ ,
ÿˆÿˆ em uma base coordenada (derivadas parciais comutam), mas não é verdade de outra forma. Daí, também,
Eq. (5.75) para ÿÿÿ em termos de gÿÿ,ÿ aplica-se apenas em uma base coordenada. Mais general
expressões são trabalhadas em Exer. 20, § 5.8.
Qual é a razão geral para a inexistência de coordenadas para uma base? Se { ˜ÿÿ¯} é um
coordenar uma base de uma forma, então sua relação com outra {d˜xÿ} é
ÿxÿ¯
ÿ¯
ÿ¯ ÿ˜ = d˜xÿ = dxÿ. ÿ ÿxÿ (5,94)
ÿ¯
O ponto chave é que ÿ, que geralmente é uma função da posição, deve ser realmente o
derivada parcial ÿxÿ¯ /ÿxÿ em todos os lugares. Assim temos
ÿ ÿ¯
ÿ2xÿ¯ ÿ2xÿ¯ ÿ ÿ¯
= = = (5,95)
ÿ ÿ.
ÿxÿ ÿxÿ ÿxÿ ÿxÿÿxÿ ÿxÿ
ÿ¯ ÿ¯
'condições de integrabilidade' devem ser satisfeitas por todos os elementos para serem uma
ÿ para
base
que ÿ˜ Essas
coordenada. Claramente, podemos sempre escolher uma matriz de transformação para a qual
isso falha, gerando assim uma base não coordenada.
Bases não coordenadas neste livro
Não teremos ocasião de usar tais bases com muita frequência. Principalmente, é importante entender que
elas existem, que nem toda base é derivável de um sistema de coordenadas. A álgebra
de bases coordenadas é mais simples em quase todos os aspectos. Podemos perguntar por que os
tratamentos padrão de coordenadas curvilíneas no cálculo vetorial, então, se atêm às bases ortonormais. o
razão é que em tal base no espaço euclidiano, a métrica tem componentes ÿÿÿ, então a
forma do produto escalar e a igualdade de componentes vetoriais e de uma forma transitam
diretamente das coordenadas cartesianas (que têm a única base de coordenadas ortonormais!).
Para obter a simplicidade das bases de coordenadas para cálculo vetorial e tensorial, temos
para gastar tempo aprendendo a diferença entre vetores e formas únicas!
5.6 L oo ki ngahead
O trabalho que fizemos neste capítulo desenvolveu quase todas as notações e conceitos
precisaremos em nosso estudo de espaços curvos e espaços-tempos. É particularmente importante que
o aluno entende §§ 5.2–5.4 porque a matemática da curvatura será desenvolvida
139 5.8 Exercícios
por analogia com o desenvolvimento aqui. O que temos a acrescentar a tudo isso é uma discussão sobre
paralelismo, de como medir até que ponto o axioma do paralelismo euclidiano falha.
Esta medida é o famoso tensor de Riemann.
5.7 P a r a d e r
Os experimentos de Eötvös e Pound-Rebka-Snider, e outros fundamentos experimentais que sustentam a

GR, são discutidos por Dicke (1964), Misner et al. (1973), Shapiro (1980) e Will (1993, 2006). Veja Hoffmann
(1983) para uma discussão menos matemática da motivação para a introdução da curvatura. Para uma
revisão atualizada do uso da relatividade do sistema GPS, veja Ashby (2003).
A matemática das coordenadas curvilíneas é desenvolvida a partir de uma variedade de pontos de vista
em: Abraham e Marsden (1978), Lovelock e Rund (1990) e Schutz (1980b).
5.8 Exercícios
1 Repita o argumento que levou à Eq. (5.1) sob hipóteses mais realistas: suponha que uma fração ÿ da
energia cinética da massa na parte inferior possa ser convertida em um fóton e enviada de volta para
cima, permanecendo a energia restante no nível do solo de forma útil. Crie um motor de movimento
perpétuo se a Eq. (5.1) é violado.
2 Explique por que um campo gravitacional externo uniforme não geraria marés na Terra. 3 (a)
Mostre que a transformação de coordenadas (x, y) ÿ (ÿ , ÿ) com ÿ = x e ÿ = 1
viola a Eq. (5.6). (b)
As seguintes transformações de coordenadas são boas? Calcule o jacobiano e
liste quaisquer pontos em que as transformações falham.
(i) ÿ = (x2 + y2) 1/2, ÿ = arctan(y/x); (ii) ÿ = ln x, ÿ = y;
(iii) ÿ = arctan(y/x), ÿ = (x2 + y2) ÿ1/2.
4 Uma curva é definida por {x = f(ÿ), y = g(ÿ), 0 ÿ 1}. Mostre que o vetor tangente
(dx/dÿ, dy/dÿ) na verdade é tangente à curva.
5 Esboce as seguintes curvas. Quais têm os mesmos caminhos? Encontre também seus vetores tangentes
onde o parâmetro é igual a zero. (a) x
= sen ÿ, y = cos ÿ; (b) x = cos(2ÿt 2), y = sin(2ÿt (d) x = s2, y = ÿ(s ÿ 2 + ÿ); (c) x = s, y = s + 4;
2)(s + 2); (e) x = ÿ, y = 1.
6 Justifique as figuras da Fig. 5.5.
7 Calcule todos os elementos das matrizes de transformação ÿ
ÿ e ÿÿ para a transformação de
cartesiano (x, y) – os índices não prime – para polar (r, ÿ) – os índices prime.
8 (a) (Usa o resultado do Exer. 7.) Seja f = x2 + y2 + 2xy, e em coordenadas cartesianas

V ÿ (x2 + 3y, y2 + 3x), W ÿ (1, 1). Calcule f como uma função de r e ÿ, e encontre
os componentes de V e W na base polar, expressando-os como funções de r
e ÿ.
(b) Encontre as componentes de d˜f em coordenadas cartesianas e obtenha-as em polares
(i) por cálculo direto em polares, e (ii) pela transformação de componentes de
Cartesiano.
(c) (i) Use o tensor métrico em coordenadas polares para encontrar os componentes polares do
uma-formas V˜ e W˜ associadas a V e W . (ii) Obtenha os componentes polares de
V˜ e W˜ por transformação de seus componentes cartesianos.
9 Desenhe um diagrama semelhante ao da Fig. 5.6 para explicar a Eq. (5.38).
1
10 Prove que ÿV , definido na Eq. (5.52), é um tensor.
1
11 (Usa o resultado dos Exers. 7 e 8.) Para o campo vetorial V cujas componentes cartesianas são (x2 +
3y, y2 + 3x), calcule: (a) Vÿ,ÿ em cartesiano; (b) a transformação
ÿ ÿ
ÿ ÿVÿ,ÿ para polares; (c) os componentes Vÿ ;ÿ diretamente em polares usando o
Símbolos de Christoffel, Eq. (5.45), na Eq. (5,50); (d) a divergência Vÿ,ÿ usando seus resultados
em um); (e) a divergência Vÿ ;ÿ usando seus resultados em (b) ou (c); (f) a divergência
Vÿ
;ÿ usando a Eq. (5.56) diretamente.
12 Para o corpo de uma forma p˜ cujos componentes cartesianos são (x2 + 3y, y2 + 3x), com ÿ
ÿ
pute: (a) pÿ,ÿ em cartesiano; (b) a transformação ÿ pÿ,ÿ em polares;ÿ (c) o
componentes pÿ ;ÿ diretamente em polares usando os símbolos de Christoffel, Eq. (5.45), em
Eq. (5,63).
13 Para aqueles que fizeram os dois Exers. 11 e 12, mostram em polares que gÿ ÿVÿ ;ÿ = pÿ ;ÿ .
14 Para o tensor cujos componentes polares são (Arr = r2, Arÿ = rsin ÿ, Aÿr = r cos ÿ,
Aÿÿ = tan ÿ), calcule a Eq. (5.65) em polares para todos os índices possíveis.
15 Para o vetor cujos componentes polares são (Vr = 1, Vÿ = 0), calcule em polares
todos os componentes da segunda derivada covariante Vÿ;ÿ;ÿ . (Dica: para encontrar o segundo
1
derivada, trate a primeira derivada Vÿ;ÿ como qualquer tensor:
1 Eq. (5,66).)
16 Preencha todos os passos que faltam partindo da Eq. (5,74) para a Eq. (5,75).
17 Descubra como cada expressão Vÿ,ÿ e Vÿÿ ÿÿ se transforma separadamente sob uma mudança
de coordenadas (para ÿ ÿÿ, comece com a Eq. (5.44)). Mostre que nem é o tensor padrão
lei, mas que sua soma obedece à lei padrão.
18 Verifique a Eq. (5,78).
19 Verifique se o cálculo da Eq. (5,81) para a Eq. (5.84), quando repetido para d˜r e d˜ÿ,
mostra que eles são uma base coordenada.
20 Para uma base não coordenada { eÿ}, defina ÿ eÿeÿ

eÿeÿ
:= ÿcÿÿÿ
ÿ eÿ e use isso no lugar
da Eq. (5.74) para generalizar a Eq. (5,75).
21 Considere o plano x ÿ t de um observador inercial em SR. Uma certa aceleração uniforme
observador deseja estabelecer um sistema de coordenadas ortonormais. Por Exer. 21, § 2.9, seu
linha do mundo é
t(ÿ) = a sinh ÿ, x(ÿ) = a cosh ÿ, (5,96)
onde a é uma constante e aÿ é o seu tempo próprio (hora do relógio em seu relógio de pulso).
141 5.8 Exercícios
(a) Mostre que a reta tipo espaço descrita pela Eq. (5.96) com a como parâmetro variável e ÿ fixo é
ortogonal à sua linha de mundo onde eles se cruzam. Mudando ÿ na Eq. (5.96) gera então uma
família de tais linhas.
(b) Mostre que a Eq. (5.96) define uma transformação de coordenadas (t, x) para coordenadas (ÿ, a),
que formam um sistema de coordenadas ortogonal . Desenhe essas coordenadas e mostre que
elas cobrem apenas metade do plano t ÿ x original . Mostre que as coordenadas são ruins nas
linhas |x|=|t|, então elas realmente cobrem dois quadrantes disjuntos. (c) Encontre o tensor métrico
e todos os símbolos de Christoffel neste sistema de coordenadas.
Este observador fará um trabalho perfeitamente bom, contanto que ele sempre use os símbolos
de Christoffel apropriadamente e se atenha aos eventos em seu quadrante. Nesse sentido, a RS
admite observadores acelerados. O quadrante direito nessas coordenadas é algumas vezes
chamado de espaço de Rindler, e as linhas de fronteira x = ±t têm alguma semelhança com os
horizontes de buracos negros que estudaremos mais tarde.
22 Mostre que se UÿÿÿVÿ = Wÿ, então UÿÿÿVÿ = Wÿ.
6 Coletores curvos
6.1 Diferen te a bl ema ni f ol ds e tensores
O conceito matemático de um espaço curvo começa (mas não termina) com a ideia de uma variedade.
Uma variedade é essencialmente um espaço contínuo que se parece localmente com o espaço
euclidiano. Ao conceito de variedade é adicionada a ideia da própria curvatura. A introdução da
curvatura em uma variedade será o assunto das seções subsequentes. Primeiro estudamos a ideia de
uma variedade, que podemos considerar apenas uma palavra chique para 'espaço'.
Coletores
A superfície de uma esfera é uma variedade. Assim é qualquer 'hiperplano' m-dimensional em um

espaço euclidiano n dimensional (m n). Mais abstratamente, o conjunto de todas as rotações rígidas de
coordenadas cartesianas no espaço euclidiano tridimensional será mostrado abaixo como uma
variedade. Basicamente, uma variedade é qualquer conjunto que pode ser parametrizado continuamente.
O número de parâmetros independentes é a dimensão da variedade, e os próprios parâmetros são as
coordenadas da variedade. Considere os exemplos que acabamos de mencionar.
A superfície de uma esfera é 'parametrizada' por duas coordenadas ÿ e ÿ. O 'hiperplano' m-dimensional
tem m coordenadas cartesianas, e o conjunto de todas as rotações pode ser parametrizado pelos três
'ângulos de Euler', que na verdade dão a direção do eixo de rotação (dois parâmetros para isso) e a
quantidade de rotação (um parâmetro). Assim, o conjunto de rotações é uma variedade: cada ponto é
uma rotação particular, e as coordenadas são os três parâmetros. É uma variedade tridimensional.
Matematicamente, a associação de pontos com os valores de seus parâmetros pode ser pensada como
um mapeamento de pontos de uma variedade em pontos do espaço euclidiano de dimensão correta.
Este é o significado do fato de que uma variedade se parece localmente com o espaço euclidiano: é
'suave' e tem um certo número de dimensões.
Deve-se enfatizar que a topologia em grande escala de uma variedade pode ser muito diferente do
espaço euclidiano: a superfície de um toro não é euclidiana, mesmo topologicamente. Mas localmente
a correspondência é boa: um pequeno pedaço da superfície de um toro pode ser mapeado 1-1 no plano
tangente a ele. Esta é a maneira de pensar em uma variedade: é um espaço com coordenadas, que
localmente parece euclidiano, mas que globalmente pode deformar, dobrar e fazer quase tudo (desde
que permaneça contínuo).
143 6.1 Manifolds e tensores diferenciáveis
Estrutura diferencial
Na verdade, consideraremos apenas 'variedades diferenciáveis'. São espaços contínuos e diferenciáveis.

Grosso modo, isso significa que na vizinhança de cada ponto da variedade é possível definir uma
aplicação suave para o espaço euclidiano que preserva derivadas de funções escalares naquele ponto.
A superfície de uma esfera é diferenciável em qualquer lugar. A de um cone é diferenciável exceto em
seu ápice. Quase todas as variedades de uso em física são diferenciáveis em quase todos os lugares.
Os espaços-tempos curvos de GR certamente são.
A suposição de diferenciabilidade significa imediatamente que podemos definir formas e vetores. Ou

seja, em um determinado sistema de coordenadas na variedade, os membros do conjunto {ÿ,ÿ} são os
componentes da forma d˜ÿ; e qualquer conjunto da forma {aÿ,ÿ + bÿ ,ÿ}, onde aeb são funções, também
é um campo de uma forma. Da mesma forma, toda curva (com parâmetro, digamos, ÿ) tem um vetor
tangente V definido como a função linear que leva a forma d˜ÿ na derivada de ÿ ao longo da curva, dÿ/dÿ:
d˜ÿ, V = V (d˜ÿ) = ÿV ÿ = dÿ/dÿ. (6.1)
Qualquer combinação linear de vetores também é um vetor. Usando os vetores e as formas unitárias
M
assim definidas, podemos construir todo o conjunto de tensores do tipo
emNSR.
, exatamente
Como aindacomo
não fizemos
escolhemos
0
nenhum tensor para servir de métrica, ainda
2
resto,
não hánocorrespondência
entanto, é exatamente
entre formas
como etínhamos
vetores. em
Todo
SRo e
em coordenadas polares. Tudo isso vem apenas da diferenciabilidade, então o conjunto de todos os
tensores é considerado parte da 'estrutura diferencial' da variedade. Não teremos muita ocasião de usar
esse termo.
Análise
É útil aqui revisar os fundamentos da álgebra tensorial. Podemos resumir as seguintes regras.
(1) Um campo tensorial define um tensor em cada ponto.

(2) Vetores e uma-formas são operadores lineares entre si, produzindo números reais. o
linearidade significa:
˜p, aV + bW = a ˜p , V + b ˜p, Wa p˜ + ,
bq˜, V = a ˜p, V + b ˜q, V ,
onde a e b são quaisquer campos escalares.

(3) Os tensores são operadores lineares semelhantes em formas e vetores, produzindo
números.
(4) Se dois tensores do mesmo tipo têm componentes iguais em uma dada base, eles têm componentes
iguais em todas as bases e são ditos idênticos (ou iguais, ou iguais). Apenas tensores do mesmo
tipo podem ser iguais. Em particular, se os componentes de um tensor são todos zero em uma base,
eles são zero em todos, e diz-se que o tensor é zero.
144 Coletores curvos
(5) Uma série de manipulações de componentes de campos de tensores são chamadas de 'operações de
tensor permitidas' porque produzem componentes de novos tensores:
(i) A multiplicação por um campo escalar produz componentes de um novo tensor do
mesmo tipo.
(ii) A adição de componentes de dois tensores do mesmo tipo fornece componentes de um novo
tensor do mesmo tipo. (Em particular, apenas tensores do mesmo tipo podem ser adicionados.)
(iii) A multiplicação de componentes de dois tensores de tipo arbitrário fornece componentes de um

novo tensor da soma dos tipos, o produto externo dos dois tensores. (iv) Diferenciação
covariante (a ser discutida mais adiante) dos componentes de um tensor de
N
modelo
M fornece componentes de um tensor do tipo
NM +1 .
N
(v) Contração em um par de índices dos componentes de um tensor do tipo M pro
N-1
duz componentes de um tensor do tipo um Mÿ1 . (A contração só é definida entre
índice superior e inferior.)
(6) Se uma equação é formada usando componentes de tensores combinados apenas pelas operações
de tensor permitidas, e se a equação é verdadeira em uma base, então é verdadeira em qualquer outra.
Este é um resultado muito útil. Isso vem do fato de que a equação (de (5) acima) é simplesmente
uma igualdade entre componentes de dois tensores do mesmo tipo, que (de (4)) é então verdadeira
em qualquer sistema.
6.2 Ri em an ni anma ni f o ds
Até agora, não introduzimos uma métrica no coletor. De fato, em certos manifolds uma métrica seria
desnecessária ou inconveniente para qualquer problema que esteja sendo considerado.
Mas no nosso caso a métrica é absolutamente fundamental, já que ela vai carregar as informações sobre
as taxas em que os relógios rodam e as distâncias entre os pontos, assim como no SR. Uma variedade
0
diferenciável na qual um campo tensorial simétrico g foi escolhido 2para
ponto
atuaré como
chamada
a métrica
variedade
em cada
Riemanniana. (Estritamente falando, somente se a métrica for positiva-definida – isto é, g(V , V ) > 0 para
todo V = 0 – ela é chamada de Riemanniana; métricas indefinidas, comopseudo-Riemannianas.
SR e GR, são chamadas de
Esta é uma distinção que não nos incomodaremos em fazer.) É importante entender que ao escolher uma
métrica nós 'adicionamos' estrutura ao manifold; veremos que a métrica define completamente a curvatura
da variedade. Assim, escolhendo uma métrica g , a variedade obtém uma certa curvatura (talvez a de uma
esfera), enquanto um g diferente lhe daria uma curvatura diferente (talvez um elipsóide de revolução). A
própria variedade diferenciável é "primitiva": uma coleção amorfa de pontos, dispostos localmente como
os pontos do espaço euclidiano, mas sem nenhuma relação de distância ou forma especificada. Dar a
métrica g lhe dá uma forma específica, como veremos. A partir de agora estudaremos as variedades
Riemannianas, nas quais se supõe que uma métrica g esteja definida em cada ponto.
(Para completar, devemos observar que é de fato possível definir a noção de curvatura em uma
variedade sem introduzir uma métrica (as chamadas variedades 'afins').
145 6.2 dobras mani riemannianas
textos realmente abordam o assunto dessa maneira. Mas como a métrica é essencial em GR, vamos
simplesmente estudar aquelas variedades cuja curvatura é definida por uma métrica.)
A planicidade métrica e local
A métrica, é claro, fornece um mapeamento entre vetores e formas únicas em cada ponto.
Assim, dado um campo vetorial V (P) (cuja notação significa que V depende da posição
P, onde P é qualquer ponto), existe um único campo de forma V˜ (P) = g(V (P) ,).
O mapeamento deve ser invertível, de modo que associado a V˜ (P) haja um único V (P).
Os componentes de g são chamados gÿÿ; os componentes da matriz inversa são
chamados gÿÿ. A métrica permite aumentar e diminuir os índices da mesma forma que no SR,
que significa
Vÿ = gÿÿVÿ.
Em geral, {gÿÿ} serão funções complicadas de posição, então não será verdade que haveria
uma relação simples entre, digamos, V0 e V0 em um sistema de coordenadas arbitrário.
Como desejamos estudar variedades curvas gerais, temos que permitir qualquer sistema de
coordenadas. No SR estudamos apenas referenciais de Lorentz (inerciais) porque eles eram
simples. Mas como a gravidade impede que tais referenciais sejam globais, teremos que permitir
todas as coordenadas e, portanto, todas as transformações de coordenadas que não sejam
ÿ
singulares. (Não singular significa, como no § 5.2, que a matriz da transformação,
ÿ ÿxÿ / ÿxÿ, tem um
ÿ inversa.) Agora, a matriz (gÿÿ) é uma matriz simétrica por definição. É um teorema bem
conhecido da álgebra de matrizes (veja o Exer. 3, § 6.9) que sempre pode ser encontrada uma
matriz de transformação que transformará qualquer matriz simétrica em uma matriz diagonal
com cada entrada na diagonal principal +1, ÿ1 , ou zero. O número de entradas +1 é igual ao
número de autovalores positivos de (gÿÿ), enquanto o número de -1 entradas é o número de
autovalores negativos. Então, se escolhermos g originalmente para ter três autovalores positivos
ÿ
e um negativo, então sempre podemos encontrar um ÿ paramétricos
fazer com que os componentes
se tornem
ÿ1000
ÿ 0100 ÿ
(gÿÿ ) =
ÿ ÿ
ÿ (ÿÿÿ). (6.2)
ÿ
0010 ÿ
ÿ 0001 ÿ
De agora em diante usaremos ÿÿÿ para denotar apenas a matriz na Eq. (6.2), que é, obviamente, a
métrica de SR.
Há duas observações que devem ser feitas aqui. A primeira é que a Eq. (6.2) só é
possível se escolhermos (gÿÿ) dentre as matrizes que possuem três autovalores positivos e
um negativo. A soma dos elementos diagonais na Eq. (6.2) é chamado de assinatura da
métrica. Para SR e GR é +2. Assim, o fato de deduzirmos anteriormente a partir de
argumentos físicos que sempre podemos construir um referencial inercial local em qualquer
evento encontra sua representação matemática na Eq. (6.2), que a métrica pode ser transformada em
esse ponto. Isso, por sua vez, implica que a métrica deve ter assinatura +2 para descrever
um espaço-tempo com gravidade.
A segunda observação é que a matriz ÿ
ÿ que produz a Eq. (6.2) em cada ponto pode
ÿ
não ser uma transformação de coordenadas. Ou seja, o conjunto { ˜ÿÿ = base dinate.ÿ Pela
d˜xÿ}nossa
pode discussão
não ser uma
anterior
coor
de bases não coordenadas, seria uma coordenada
transformação somente se a Eq. (5,95) detém:
ÿ ÿ
ÿ ÿ
ÿ = ÿ
.
ÿxÿ ÿxÿ
Em um campo gravitacional geral isso será impossível, porque de outra forma implicaria
a existência de coordenadas para as quais a Eq. (6.2) é verdadeiro em todos os lugares: um quadro global de Lorentz.
No entanto, tendo encontrado uma base em um ponto particular P para o qual a Eq. (6.2) é verdadeira, é
possível encontrar coordenadas tais que, na vizinhança de P, a Eq. (6.2) é 'quase' verdadeira.
Isso está incorporado no seguinte teorema, cuja demonstração (bastante longa) está no final deste
seção. Escolha qualquer ponto P da variedade. Um sistema de coordenadas {xÿ} pode ser encontrado cuja
origem está em P e em que:
gÿÿ(xÿ) = ÿÿÿ + 0[(xÿ) 2]. (6.3)
Ou seja, a métrica próxima a P é aproximadamente a de SR, sendo as diferenças de segunda ordem em

as coordenadas. De agora em diante vamos nos referir a tais sistemas de coordenadas como 'Lorentz local
frames' ou 'frames inerciais locais'. Eq. (6.3) pode ser reformulado de uma forma um pouco mais precisa
maneira como:
gÿÿ(P) = ÿÿÿ para todos os ÿ, ÿ; (6.4)

ÿ
gÿÿ(P) = 0 para todos ÿ, ÿ, ÿ; ÿxÿ (6.5)
mas geralmente
ÿ2
gÿÿ(P) = 0
ÿxÿ ÿxÿ
para pelo menos alguns valores de ÿ, ÿ, ÿ e ÿ se a variedade não for exatamente plana.
A existência de quadros de Lorentz locais é meramente a afirmação de que qualquer espaço curvo tem
um espaço plano 'tangente' a ele em qualquer ponto. Lembre-se de que as linhas retas no espaço-tempo plano são as
linhas mundiais de partículas livres; a ausência de termos de primeira derivada (Eq. (6.5)) na métrica
de um espaço-tempo curvo significará que partículas livres estão se movendo em linhas que são localmente
reta neste sistema de coordenadas. Isso torna tais coordenadas muito úteis para nós, uma vez que o
equações da física serão quase tão simples nelas quanto no espaço-tempo plano, e se construídas
pelas regras do § 6.1 será válido em qualquer sistema de coordenadas. A prova deste teorema está em
no final desta seção, e vale a pena estudar.
Comprimentos e volumes
A métrica, é claro, dá uma maneira de definir comprimentos de curvas. Seja d x um pequeno deslocamento
vetorial em alguma curva. Então d x tem quadrado de comprimento ds2 = gÿÿ dxÿ dxÿ. (Lembre-se de que
chamamos isso de elemento de linha da métrica.) Se pegarmos o valor absoluto disso e pegarmos seu
raiz quadrada, obtemos uma medida de comprimento: dl ÿ |gÿÿ dxÿ dxÿ| 1/2. Então integrando dá
(6.6)
l = ' junto |gÿÿ dxÿ dxÿ| 1/2
curva
ÿ1 dxÿ * * dxÿ * * dÿ, gÿÿ * * dÿ1/2
**
(6.7)
=' dÿ
ÿ0
onde ÿ é o parâmetro da curva (cujos pontos finais são ÿ0 e ÿ1). Mas como o vetor tangente V
tem componentes Vÿ = dxÿ/dÿ, finalmente temos:
ÿ1
|V · V | 1/2 dÿ (6.8)
l=' ÿ0
como o comprimento da curva arbitrária.

O cálculo de volumes é muito importante para a integração no espaço-tempo. Aqui, queremos
dizer por 'volume' o elemento de volume quadridimensional que usamos para integrações na lei de
Gauss no § 4.4. Vamos para um referencial de Lorentz local, onde sabemos que uma pequena
região de quatro dimensões tem quatro volumes dx0 dx1 dx2 dx3 , onde {xÿ} são as coordenadas
que neste ponto dão a métrica quase de Lorentz, Eq. (6.3). Em qualquer outro sistema de
coordenadas {xÿ } é um resultado bem conhecido do cálculo de várias variáveis que:
ÿ(x0, x1, x2, x3)

dx0 dx1 dx2 dx3 = dx0 dx1 dx2 dx3 ÿ (x0 , x1 x3 ) , (6.9)
, x2 ,
onde o fator ÿ( )/ÿ( ) é o jacobiano da transformação de {xÿ } para {xÿ}, conforme

definido em § 5.2:
ÿx0/ÿx0 ÿx0/ÿx1 ··· ÿx1/ÿx0

ÿ(x0, x1, x2, x3) ÿ ÿ
= det ÿ ÿ
ÿ(x0 , x1 , x2 , x3 ) ..
ÿ . ÿ
ÿ
= det( ÿ). (6.10)
Essa seria uma maneira bastante tediosa de calcular o jacobiano, mas existe uma maneira mais
fácil de usar a métrica. Na terminologia matricial, a transformação dos componentes métricos é
T
(g) = ( )(ÿ)( ) , (6.11)
onde (g) é a matriz de gÿÿ, (ÿ) de ÿÿÿ, etc., e onde 'T' denota transposição. Segue que os
determinantes satisfazem
T
det (g) = det ( ) det (ÿ) det ( ). (6.12)
Mas para qualquer matriz

T
det ( ) = det ( ), (6.13)
e podemos ver facilmente pela Eq. (6.2) que
det (ÿ) = ÿ1. (6.14)
Portanto, obtemos
det (g) = ÿ[det ( )]2. (6.15)
Agora introduzimos a notação
g := det (gÿ ÿ), (6.16)
o que nos permite concluir da Eq. (6.15) que

ÿ
det ( ÿ) = (ÿg) 1/2. (6.17)
Assim, a partir da Eq. (6.9) obtemos
dx0 dx1 dx2 dx3 = [ÿdet ( gÿ ÿ)]1/2dx0 dx1 dx2 dx3 = ( ÿg)
1/2dx0 dx1 dx2 dx3 . (6.18)
Este é um resultado muito útil. Também é conceitualmente um resultado importante porque é o primeiro
exemplo de um tipo de argumento que empregaremos com frequência, um argumento que usa coordenadas
localmente planas para generalizar nossos conceitos de espaço plano para análogos em espaço curvo.
Neste caso começamos com dx0 dx1 dx2 dx3 = d4x em um sistema de coordenadas localmente plano.
Argumentamos que este elemento de volume em P deve ser o volume medido fisicamente por hastes e
relógios, uma vez que o espaço é o mesmo que o espaço de Minkowski nesta pequena região. Descobrimos
então que o valor dessa expressão em coordenadas arbitrárias {xÿ } é a Eq. (6.18), (ÿg) 1/2 d4x, que
portanto,
é,
a expressão para o volume verdadeiro em um espaço curvo em qualquer ponto de qualquer coordenada.
Chamamos isso de elemento de volume apropriado.
Não deveria ser surpreendente que a métrica entre nisso, é claro, já que a métrica mede comprimentos.
Nós só precisamos lembrar que em qualquer coordenada a raiz quadrada do negativo do determinante de
(gÿÿ) é a coisa a ser multiplicada por d4x para obter o verdadeiro, ou próprio,
elemento de volume.
Talvez seja útil citar um exemplo de três dimensões. Aqui o volume adequado é (g) 1/2, já que a métrica
é positiva-definida (a Eq. (6.14) teria um sinal +). Em + r2 sin2 ÿ dÿ2, então a métrica é = dr2 + r2dÿ 2
2
de linha é dl coordenadas esféricas o elemento
10 0 0 r2 0 0 0
ÿ r2 sin2 ÿ ÿ
(gij) = (6.19)
ÿ ÿ.
Seu determinante é r4 sen2 ÿ, então (g) 1/2 d3x é
2r _ sen ÿ dr dÿ dÿ, (6.20)
que sabemos ser o elemento de volume correto nessas coordenadas.

Prova do teorema da planicidade local
Seja {xÿ} um sistema de coordenadas dado arbitrário e {xÿ } aquele que é desejado: ele se reduz ao
sistema inercial em um certo ponto fixo P. (Um ponto nesta variedade quadridimensional é, obviamente,
um evento. ) Então há alguma relação
xÿ = xÿ(xÿ ), (6.21)
ÿÿ = ÿxÿ/ÿxÿ . (6.22)
ÿ
Expandindo em uma
ÿÿ série de Taylor em torno de P (cujas coordenadas são x 0 ) dá a
transformação em um ponto arbitrário x próximo a P:
ÿ
ÿ ÿ ÿ ÿ
µ( x) = ÿ(P) + (xÿ ÿ x 0
ÿ) (P)
ÿxÿ ÿ2 ÿ
1
ÿ ÿ
+ (xÿ ÿ x 0 )(xÿ ÿ xÿ 0 ÿxÿ ÿxÿ ÿ2xÿ(P) +··· ) ,
2
*
= ÿ ÿ *
ÿ|P + (xÿ ÿ x 0
) ÿxÿ ÿxÿ
*
*
P ÿ3xÿ
ÿ
2 1 (xÿ ÿ x + 0 )(xÿ ÿ xÿ ) 0 * * +···. * * P (6.23)
ÿxÿ ÿxÿ ÿxÿ
Expandir a métrica da mesma maneira fornece
ÿgÿÿ )
*
ÿ *
gÿÿ( x) = gÿÿ|P + (xÿ ÿ x 0

ÿxÿ * P
*
ÿ ÿ2gÿÿ ) *
0 2 1 (xÿ ÿ x + (xÿ ÿ xÿ ) ÿxÿ

0 ÿxÿ * +···. (6.24)
*
*P
Colocamos isso na transformação,
= ÿ
(6,25)
gu ÿ ÿÿ ÿgÿÿ,
obter
ÿ ÿ
gµ ÿ( x) = ÿ|P ÿ|Pgÿÿ|P
ÿ ÿ
+ (xÿ ÿ x 0
)[ ÿ ÿ|P ÿ|Pgÿÿ,ÿ |P ÿ ÿ|
+ Pgÿÿ|Pÿ2xÿ/ÿxÿ ÿxÿ |P ÿ ÿ|Pgÿÿ|Pÿ2xÿ/
+ ÿxÿ ÿxÿ |P]
ÿ
2 1 (xÿ ÿ x + 0 )(xÿ ÿ xÿ )[···].
0 (6.26)
Agora, não sabemos a transformação, Eq. (6.21), mas podemos defini-lo por sua expansão de Taylor.
Vamos contar o número de variáveis livres que temos para este propósito. A matriz ÿ|P tem 16 números,
ÿ
todos livremente especificáveis. A matriz {ÿ2xÿ/ÿxÿ ÿxÿ |P} tem 4 × 10 = 40 números livres (não 4 ×
4 × 4, pois é simétrica em ÿ e ÿ ).
A matriz {ÿ3xÿ/ÿxÿ ÿxÿ ÿxÿ |P} tem 4 × 20 = 80 variáveis livres, pois a simetria em todas
rearranjos de ÿ , ÿ e ÿ fornecem apenas 20 arranjos independentes (a expressão geral para três índices
é n(n + 1)(n + 2)/3!, onde n é o número de valores que cada índice pode assumir, quatro em nosso caso).
Por outro lado, gÿÿ|P, gÿÿ,ÿ |P e gÿÿ,ÿ ÿ|P são todos dados inicialmente. Eles têm, respectivamente, 10,
10 × 4 = 40 e 10 × 10 = 100 números independentes para uma métrica totalmente geral. A primeira
pergunta é, podemos satisfazer a Eq. (6.4),
gÿ ÿ|P = ÿÿ ÿ? (6.27)
Isso pode ser escrito como

ÿ ÿ
ÿÿ ÿ = ÿ|Pgÿÿ|P. (6,28)
ÿ|P
Por simetria, são dez equações, que para matrizes gerais são independentes. Para satisfazê-los temos
ÿ
16 valores livres em ÿ|P. As equações podem, denão

fato, ser satisfeitas,
especificados. deixando
Esses seis elementosaos
seis correspondem de seis
ÿ|P
ÿ
graus de liberdade nas transformações de Lorentz que preservam a forma da métrica ÿÿ ÿ .

Ou
seja, podemos impulsionar por uma velocidade v (três parâmetros livres) ou girar por um ângulo ÿ em
ÿ
torno de uma direção definida por dois outros ângulos. Estes somam seis graus de liberdade em ÿ|P que
deixam o referencial inercial local inercial.
A próxima questão é, podemos escolher os 40 números livres ÿ ÿ ÿ/ÿxÿ |P na Eq. (6.26) de forma a
satisfazer as 40 equações independentes, a Eq. (6.5),
gÿÿ ,ÿ|P = 0? (6,29)

ÿ
Como 40 é igual a 40, a resposta é sim, apenas um pouco. Dada a matriz ÿ|P, existe uma e apenas uma
maneira de organizar as coordenadas próximas a P tal que |P tenha os valores
ÿÿ,ÿ corretos para
ÿ ,ÿ|P = 0. fazer gÿ
Portanto, não
há liberdade extra além daquela com a qual para fazer transformações locais de Lorentz.
A pergunta final é: podemos fazer isso funcionar em ordem superior? Podemos encontrar 80 números
ÿÿ,ÿ ÿ|P que pode fazer os 100 números gÿ ÿ ,ÿ ÿ|P = 0? A resposta, já que 80 < 100, é não. Existem,
na métrica geral, 20 'graus de liberdade' entre as segundas derivadas gÿ ÿ ,ÿ ÿ|P. Como 100 ÿ 80 = 20,
haverá em geral 20 componentes que não podem ser anulados.
Portanto, vemos que uma métrica geral é caracterizada em qualquer ponto P não tanto por seu valor
em P (que sempre pode ser ÿÿÿ), nem por suas primeiras derivadas (que podem ser zeradas), mas pelos
20 derivadas segundas que, em geral, não podem ser anuladas. Esses 20 números serão vistos como
componentes independentes de um tensor que representa a curvatura; isso mostraremos mais adiante.
Em um espaço plano , é claro, todos os 20 desaparecem. Em um espaço geral eles não.
6.3 Diferença covariante
Vejamos agora o assunto da diferenciação. Por definição, a derivada de um campo vetorial envolve a
diferença entre vetores em dois pontos diferentes (no limite à medida que os pontos se juntam). Em um
espaço curvo a noção da diferença entre vetores em diferentes
151 6.3 Diferenciação de Covariância
os pontos devem ser tratados com cuidado, pois entre os pontos o espaço é curvo e a ideia de que os
vetores nos dois pontos podem apontar na 'mesma' direção é difusa. No entanto, a planicidade local da
variedade Riemanniana nos ajuda. Nós só precisamos comparar vetores no limite à medida que eles se
aproximam infinitesimalmente, e sabemos que podemos construir um sistema de coordenadas em qualquer
ponto que seja tão próximo de ser plano quanto gostaríamos nesse mesmo limite. Assim, em uma pequena
região a variedade parece plana, e então é natural dizer que a derivada de um vetor cujos componentes
são constantes neste sistema de coordenadas é zero naquele ponto. Em particular, dizemos que as
derivadas dos vetores base de um sistema de coordenadas localmente inercial são zero em P.
Vamos enfatizar que esta é uma definição da derivada covariante. Para nós, sua justificação está na
física: o referencial inercial local é um referencial em que tudo é localmente como SR, e em SR as derivadas
desses vetores de base são zero. Esta definição leva imediatamente ao fato de que nestas coordenadas
neste ponto, a derivada covariante de um vetor tem componentes dados pelas derivadas parciais dos
componentes (ou seja, os símbolos de Christoffel desaparecem):
Vÿ = Vÿ .ÿ atP
neste quadro. :ÿ (6.30)
Isso também é verdade para qualquer outro tensor, incluindo a métrica:
gÿÿ;ÿ = gÿÿ,ÿ = 0 atP.
(A segunda igualdade é apenas a Eq. (6.5).) Agora, a equação gÿÿ;ÿ = 0 é verdadeira em um quadro (o
localmente inercial) e é uma equação tensorial válida; portanto, é verdade em qualquer base:
gÿÿ:ÿ = 0 em qualquer base. (6.31)
Este é um resultado muito importante e vem diretamente de nossa definição de derivada covariante.
Lembrando § 5.4, vemos que se temos ÿÿÿ = ÿÿÿ, então a Eq. (6.31) leva à Eq. (5.75) para qualquer métrica:
1
ÿ = (6.32)
ÿÿ gÿÿ(gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ).
2
Resta a Exer. 5, § 6.9, para demonstrar, repetindo o argumento do espaço plano agora no referencial
localmente inercial, que ÿÿÿ é de fato simétrico em qualquer sistema de coordenadas, de modo que a Eq.
(6.32) está correto em quaisquer coordenadas. Assumimos no início que em P em um referencial localmente
inercial, ÿÿÿ = 0. Mas, mais importante, as derivadas de ÿÿÿ em P neste referencial não são todas nulas
geralmente, uma vez que envolvem gÿÿ,ÿ ÿ. Isso significa que, embora as coordenadas possam ser
encontradas em que ÿÿÿ = 0 em um ponto, esses símbolos geralmente não desaparecem em outros
lugares. Isso difere do espaço plano, onde existe um sistema de coordenadas em que ÿÿÿ = 0 em todos os lugares.
Assim, podemos ver que em qualquer ponto, a diferença entre uma variedade geral e uma plana se
manifesta nas derivadas dos símbolos de Christoffel.
Eq. (6.32) significa que, dado gÿÿ, podemos calcular ÿÿÿ em qualquer lugar. Podemos, portanto,
calcule todas as derivadas covariantes, dada g. Para revisar as fórmulas:
Vÿ = Vÿ ÿÿVÿ, ,ÿÿ + ;ÿ (6.33)
Pÿ;ÿ = Pÿ,ÿ ÿ ÿÿÿPÿ, (6,34)

Tÿÿ
ÿ
Tÿÿ + ÿ
;ÿ = Tÿÿ,ÿ + ÿÿ ÿÿ Tÿÿ. (6,35)
Fórmula de divergência
Muitas vezes lidamos com a divergência de vetores. Dado um campo vetorial arbitrário Vÿ, sua
divergência é definida pela Eq. (5.53),
ÿ
= Vÿ
Vÿ + ;ÿ,ÿ ÿÿVÿ. (6,36)
Esta fórmula envolve uma soma no símbolo de Christoffel, que, da Eq. (6.32), é
1
ÿ
=
ÿÿ
2 gÿÿ(gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ)
1 1
= gÿÿ(gÿÿ,ÿ ÿ gÿÿ,ÿ) + (6,37)
2 2 gÿÿgÿÿ,ÿ.
Isso teve seus termos reorganizados para simplificá-lo: observe que o termo entre parênteses é
antisimétrica em ÿ e ÿ, enquanto é contraída em ÿ e ÿ com gÿÿ, que é simétrica.
O primeiro termo, portanto, desaparece (veja Exer. 26(a), § 3.10) e encontramos
1
ÿ
= (6,38)
ÿÿ
2 gÿÿgÿÿ,ÿ.
Como (gÿÿ) é a matriz inversa de (gÿÿ), pode-se mostrar (ver Exer. 7, § 6.9) que a
derivada do determinante g da matriz (gÿÿ) é
g,ÿ = ggÿÿgÿÿ,ÿ. (6,39)
Usando isso na Eq. (6.38), encontramos
ÿ
ÿÿ = ( ÿ ÿ g),ÿ/ ÿ ÿ g. (6,40)
Então podemos escrever a divergência, Eq. (6.36), como
1
= Vÿ
Vÿ ;ÿ ,ÿ ÿÿg Vÿ( ÿ ÿ g),ÿ + (6.41)
153 6.4 Paralelo -transporte, geodésica e curvatura
ou
1
Vÿ;ÿ
= ( ÿ ÿ gVÿ),ÿ. ÿ (6,42)
ÿg
Esta é uma fórmula muito mais fácil de usar do que a Eq. (6.36). Também é importante para a lei
de Gauss, onde integramos a divergência sobre um volume (usando, é claro, o elemento de volume
adequado):
;ÿ ÿÿg (6,43)
' Vÿ d4x = ' ( ÿ ÿ gVÿ),ÿ d4x.
Como o termo final envolve derivadas parciais simples, a matemática da lei de Gauss se
aplica a ele, assim como em SR (§ 4.8):
d3S. (6,44)
' ( ÿ ÿ gVÿ),ÿ d4x = ( Vÿnÿ ÿ ÿ g
Isso significa
ÿÿg d3S. (6,45)

;ÿ
' Vÿ d4x = ( Vÿnÿ ÿ ÿ g
Portanto, a lei de Gauss se aplica a uma variedade curva, na forma dada pela Eq. (6,45).
Precisamos integrar a divergência sobre o volume próprio e usar o elemento de superfície
apropriado, nÿ ÿ ÿ g d3S, na integral de superfície.
6.4 Par todo el - transporte , geodésico,se curvas
Até agora, usamos o teorema da planicidade local para desenvolver o máximo possível de matemática
em variedades curvas sem considerar a curvatura explicitamente. De fato, ainda temos que dar uma
definição matemática precisa de curvatura. É importante distinguir dois tipos diferentes de curvatura:
intrínseca e extrínseca. Considere, por exemplo, um cilindro.
Como um cilindro é redondo em uma direção, pensamos nele como curvo. Esta é a sua
curvatura extrínseca : a curvatura que tem em relação ao espaço tridimensional plano do qual faz parte.
Por outro lado, um cilindro pode ser feito enrolando um pedaço de papel plano sem rasgá-lo
ou amassá-lo, de modo que a geometria intrínseca é a do papel original: é plano. Isso significa
que a distância na superfície do cilindro entre quaisquer dois pontos é a mesma do papel
original; linhas paralelas permanecem paralelas quando continuadas; na verdade, todos os
axiomas de Euclides valem para a superfície de um cilindro. Uma 'formiga' bidimensional
confinada a essa superfície decidiria que ela era plana; apenas sua topologia global é
engraçada, pois ir em uma certa direção em linha reta o traz de volta ao ponto de partida. A
geometria intrínseca de uma variedade n-dimensional considera apenas as relações entre seus pontos em
permanecem no coletor (para o cilindro, na superfície bidimensional). A curvatura extrínseca do cilindro

vem de considerá-lo como uma superfície em um espaço de maior dimensão, e perguntar sobre a
curvatura das linhas que ficam na superfície em comparação com as linhas 'retas' que saem dela.
Portanto, a curvatura extrínseca depende da noção de um espaço de dimensão superior. Neste livro,
quando falamos da curvatura do espaço-tempo, falamos da sua curvatura intrínseca , pois fica claro que
todas as linhas do mundo estão confinadas para permanecer no espaço-tempo. Se existe ou não um
espaço de dimensão superior em que nosso espaço de quatro dimensões é uma questão em aberto que
está se tornando cada vez mais um assunto de discussão no âmbito da teoria das cordas. A única coisa
de interesse em GR é a geometria intrínseca do espaço-tempo.
O cilindro, como acabamos de ver, é intrinsecamente plano; uma esfera, por outro lado, tem uma
superfície intrinsecamente curva. Para ver isso, considere a Fig. 6.1, na qual duas linhas vizinhas
começam em A e B perpendiculares ao equador e, portanto, são paralelas. Quando continuadas como
linhas localmente retas, elas seguem o arco de grandes círculos, e as duas linhas se encontram no pólo
P. As linhas paralelas, quando continuadas, não permanecem paralelas, portanto o espaço não é plano.
Há uma ilustração ainda mais impressionante da curvatura da esfera. Considere, primeiro, o espaço
plano. Na Fig. 6.2 é traçado um caminho fechado no espaço plano e, a partir de A, em cada ponto é
traçado um vetor paralelo ao do ponto anterior. Essa construção é realizada ao redor do laço de A a B a
C e de volta a A. O vetor finalmente desenhado em A é, obviamente, paralelo ao original. Uma coisa
completamente diferente acontece em uma esfera! Considere o caminho mostrado na Fig. 6.3. Lembre-
se, estamos desenhando o vetor como ele é visto por uma formiga bidimensional na esfera, então ele
deve sempre ser tangente à esfera. Além disso, cada vetor é desenhado o mais paralelo possível ao
anterior. Neste loop, A e C estão no equador separados por 90ÿ e B está no pólo. Cada arco é o arco de
um grande círculo e cada um tem 90ÿ de comprimento. Em A escolhemos o vetor paralelo ao equador.
À medida que avançamos em direção a B, cada novo vetor é traçado perpendicularmente ao arco AB.
Quando chegamos a B,
UMA B
Figura 6.1 Um triângulo esférico APB.
UMA
Figura 6.2 Um 'triângulo' feito de linhas curvas no espaço plano.

155 6.4 Paralelo -transporte, geodésica e curvatura
UMA
Figura 6.3 Transporte paralelo em torno de um triângulo esférico.
ÿ ÿ
você você
ÿ
V
ÿ
V
Figura 6.4 Transporte paralelo de V ao longo de U .
os vetores são tangentes a BC. Então, indo de B para C, continuamos desenhando tangentes a BC.
Estes são perpendiculares ao equador em C, e assim de C a A os novos vetores permanecem
perpendiculares ao equador. Assim, o campo vetorial girou 90ÿ nesta construção!
Apesar do fato de cada vetor ser desenhado paralelamente ao seu vizinho, o laço fechado causou uma
discrepância. Como isso não acontece no espaço plano, deve ser um efeito da esfera
curvatura.
Este resultado tem implicações radicais: em uma variedade curva simplesmente não é possível
definir campos vetoriais globalmente paralelos. Ainda podemos definir paralelismo local, por exemplo,
como mover um vetor de um ponto para outro, mantendo-o paralelo e com o mesmo comprimento. Mas
o resultado desse 'transporte paralelo' do ponto A ao ponto B depende do caminho percorrido.
Portanto, não podemos afirmar que um vetor em A é ou não paralelo a (ou o mesmo que) um certo
vetor em B.
Transporte paralelo
A construção que acabamos de fazer na esfera é chamada de transporte paralelo. Suponha que um
campo vetorial V seja definido na esfera, e examinamos como ele muda ao longo de uma curva, como
na Fig. 6.4. Se os vetores V em pontos infinitesimalmente próximos da curva são paralelos e de igual
comprimento, diz-se que V é transportado paralelamente ao longo da curva. É fácil escrever uma
equação para isso. Se U = d x/dÿ é a tangente à curva (ÿ sendo o parâmetro
ao longo dele; U não é necessariamente normalizado), então em um sistema de coordenadas localmente inercial em um
ponto P as componentes de V devem ser constantes ao longo da curva em P:
dVÿ
= 0 em P. (6,46)
dÿ
Isso pode ser escrito como:
dVÿ
= UÿVÿ = UÿVÿ = 0 em P. ,ÿ ;ÿ (6,47)
dÿ
A primeira igualdade é a definição da derivada de uma função (neste caso Vÿ) ao longo do
curva; a segunda igualdade vem do fato de que ÿÿÿ = 0 em P nessas coordenadas.
Mas a terceira igualdade é uma expressão invariante de quadro e vale em qualquer base, então pode ser
tomado como uma definição invariante de quadro do transporte paralelo de V ao longo de U :
d
UÿVÿ dÿ = 0 ÿ V = ÿU¯ V = 0. ;ÿ (6,48)
O último passo usa a notação para a derivada ao longo de U introduzida na Eq. (3,67).
Geodésica
As curvas mais importantes no espaço plano são as linhas retas. Um dos axiomas de Euclides é que
duas linhas retas inicialmente paralelas permanecem paralelas quando estendidas. O que ele faz
quer dizer com 'estendido'? Ele não quer dizer 'continuado de tal forma que a distância entre
permanece constante', porque mesmo assim ambos podem dobrar. O que ele quer dizer é que
cada linha continua indo na direção em que estava indo. Mais precisamente, a tangente a
a curva em um ponto é paralela à tangente no ponto anterior. Na verdade, uma linha reta
no espaço euclidiano é a única curva que transporta paralelamente seu próprio vetor tangente! Em um
espaço curvo, também podemos desenhar linhas que são 'tão quase retas quanto possível' exigindo
transporte paralelo do vetor tangente. São as chamadas geodésicas:
{U é tangente a uma geodésica}ÿÿU¯ U = 0. (6,49)
(Observe que em um sistema localmente inercial essas linhas são retas.) Em notação de componentes:
UÿUÿ ;ÿ = UÿUÿ ,ÿ + ÿÿÿUÿUÿ = 0. (6,50)
Agora, se ÿ for o parâmetro da curva, então Uÿ = dxÿ/dÿ e Uÿÿ/ÿxÿ = d/dÿ:
d dxÿ ÿ
dxÿ dxÿ
+ ÿÿ = 0. (6,51)
dÿ dÿ dÿ dÿ
157 6.5 O tensor de curvatura
Como os símbolos de Christoffel ÿÿÿ são funções conhecidas das coordenadas {xÿ}, isso é
uma equação diferencial não linear (quase-linear), de segunda ordem para xÿ(ÿ). Tem um único
solução quando as condições iniciais em ÿ = ÿ0 são dadas: xÿ 0 = xÿ (ÿ0) e Uÿ 0 = (dxÿ/dÿ)ÿ0 .
Então, dando uma posição inicial (xÿ 0 ) e uma direção inicial (Uÿ 0 ), obtemos um único
geodésico.
Lembre-se que se mudarmos de parâmetro, mudamos, matematicamente falando, a curva
(embora não os pontos por onde passa). Agora, se ÿ é um parâmetro de uma geodésica (de modo que
Eq. (6.51) for satisfeito), e se definirmos um novo parâmetro
ÿ = aÿ + b, (6,52)
onde a e b são constantes (não dependendo da posição na curva), então ÿ também é um

parâmetro em que a Eq. (6.51) é satisfeito:
d2xÿ dxÿ dxÿ

ÿ
+ = 0.
ÿÿ
dÿ2 dÿ dÿ
De um modo geral, apenas transformações lineares de ÿ como a Eq. (6.52) fornecerá novos parâmetros nos quais
a equação geodésica é satisfeita. Um parâmetro como ÿ e ÿ acima é chamado
um parâmetro afim . Uma curva com a mesma trajetória de uma geodésica, mas parametrizada por uma
parâmetro não afim é, estritamente falando, não uma curva geodésica.
Uma geodésica também é uma curva de comprimento extremo entre quaisquer dois pontos: seu comprimento é
inalterado para primeira ordem em pequenas mudanças na curva. O aluno é convidado a provar isso
usando a Eq. (6.7), encontrando as equações de Euler-Lagrange para que seja um extremo para fixo
ÿ0 e ÿ1, e mostrando que estes se reduzem à Eq. (6.51) quando a Eq. (6.32) é usado. Isto é um
exercício muito instrutivo. Também podemos mostrar que a distância adequada ao longo da geodésica é ela mesma
um parâmetro afim (ver Exers. 13–15, § 6.9).
6.5 Tensor de curvatura
Finalmente estamos em condições de dar uma descrição matemática da curvatura intrínseca

de um múltiplo. Voltamos ao curioso exemplo do transporte paralelo de um vetor
em torno de um circuito fechado, e tome-o como nossa definição de curvatura. Vamos imaginar em nosso
colete um loop fechado muito pequeno (Fig. 6.5) cujos quatro lados são as linhas de coordenadas
UMA C
D x1=a+ÿa
x2=b
x1=a
x2=b+ÿb
Figura 6.5 Pequena seção de uma grade de coordenadas.

x1 = a, x1 = a + ÿa, x2 = b e x2 = b + ÿb. Um vetor V definido em A é transportado em paralelo para B.

A lei do transporte paralelo ÿ e1V = 0 tem a forma de componente
ÿVÿ
ÿ
=ÿ
ÿ1Vÿ. (6,53)
ÿx1
Integrando isso de A a B dá
B ÿVÿ
dx1
Vÿ(B) = Vÿ(A) + ' ÿx1
UMA
(6,54)
ÿ ÿ1Vÿdx1,
= Vÿ(A) ÿ ' x2=b
onde a notação 'x2 = b' sob a integral denota o caminho AB. Transporte semelhante de B para C para D
dá
ÿ
ÿ2Vÿ dx2 , (6,55)
Vÿ(C) = Vÿ(B) ÿ ' x1=a+ÿa
ÿ
ÿ1Vÿ dx1. (6,56)
Vÿ(D) = Vÿ(C) + ' x2=b+ÿb
A integral na última equação tem um sinal diferente porque a direção do transporte

de C para D está na direção negativa x1 . Da mesma forma, a conclusão do loop dá
ÿ
ÿ2Vÿ dx2 . (6,57)
Vÿ(Afinal) = Vÿ(D) + ' x1=a
A variação líquida em Vÿ(A) é um vetor ÿVÿ, encontrado pela adição das Eqs. (6,54)-(6,57):
ÿVÿ = Vÿ(Afinal) ÿ Vÿ(Ainicial)
ÿ ÿ2Vÿdx2
= '+' x1=a ÿ ÿ2Vÿdx2 ÿ ' x1=a+ÿa
ÿ ÿ1Vÿdx1. (6,58)
x2=b+ÿb ÿ ÿ1Vÿdx1 ÿ ' x2=b
Observe que eles se cancelariam em pares se ÿÿÿ e Vÿ fossem constantes no loop, como seriam no
espaço plano. Mas no espaço curvo eles não são, então se combinarmos as integrais sobre variáveis
de integração semelhantes e trabalharmos na primeira ordem na separação nos caminhos, chegaremos
à ordem mais baixa,
b+ÿb ÿ
ÿ
ÿa ( ÿx1 ÿ2Vÿ) dx2
ÿVÿ ÿ ' b
a+ÿa ÿ
ÿ
ÿb ÿ1Vÿ) dx1 (6,59)
+'ÿ uma
( ÿx2
ÿ ÿ
ÿ ÿ
ÿ2Vÿ) + ( ÿx2 (6,60)
ÿa ÿb $ ÿ ( ÿx1 ÿ1Vÿ) ! .
Isso envolve derivados de símbolos de Christoffel e de Vÿ. As derivadas Vÿ podem ser

eliminadas usando a Eq. (6.53) e seu equivalente com 1 substituído por 2. Então a Eq.
(6.60) torna -se
ÿ ÿ ÿ ÿ ÿ
ÿVÿ = ÿa ÿb " ÿ ÿ1,2 ÿ µ2,1 + ÿ2 ÿ1 - ÿ1 ÿ2 # Vÿ. (6,61)
(Para obter isso, precisamos rotular índices fictícios nos termos quadráticos em s.) Observe
que isso acaba sendo apenas um número vezes Vÿ, somado em ÿ. Agora, os índices 1 e 2
aparecem porque o caminho foi escolhido para percorrer essas coordenadas. É antisimétrica em
1 e 2 porque a mudança ÿVÿ teria que ter o sinal oposto se dermos a volta
o loop na direção oposta (ou seja, trocando os papéis de 1 e 2). se nós usássemos
linhas de coordenadas gerais xÿ e xÿ, encontraríamos
ÿVÿ = mudança em Vÿ devido ao transporte, primeiro ÿa eÿ , depois ÿb eÿ,

então ÿÿa a ÿ, e finalmente ÿÿb eÿ
ÿ ÿ ÿ ÿ
(6,62)
ÿ
= ÿa ÿb " ÿ ÿÿ,ÿ ÿ ÿÿ,ÿ + ÿÿ ÿÿ ÿÿ

ÿ ÿÿ# Vÿ.
Agora, ÿVÿ depende de ÿa ÿb, a coordenada 'área' do laço. Então fica claro que se o
o comprimento do laço em uma direção é dobrado, ÿVÿ é dobrado. Isso significa que ÿVÿ depende
linearmente em ÿa eÿ e ÿb eÿ. Além disso, certamente também depende linearmente na Eq. (6.62) em
Vÿ em si e em ÿ˜ ÿ, que é a base de uma forma que dá ÿVÿ a partir do vetor ÿV . Por isso
temos o seguinte resultado: se definirmos
ÿ ÿ ÿ ÿ ÿ ÿ
Rÿ ÿÿÿ := ÿÿ,ÿ ÿ ÿÿ,ÿ + ÿÿ ÿÿ - ÿÿ ÿÿ,
(6,63)
1
então Rÿÿÿÿ deve ser componentes do ÿ˜ ÿ, V 3
tensor que, quando fornecido com argumentos
, ÿa eÿ, ÿb eÿ , dá ÿVÿ, o componente da mudança em V após transporte paralelo
em torno de um laço dado por ÿa eÿ e ÿb eÿ . Este tensor é chamado de curvatura de Riemann
tensor R. 1
É útil observar as componentes de R em um referencial localmente inercial em um ponto P.

tem ÿÿÿ = 0 em P, mas podemos encontrar sua derivada da Eq. (6.32):
ÿ = 1
(6,64)
ÿÿ,ÿ 2 gÿÿ gÿÿ,ÿÿ + gÿÿ,ÿÿ ÿ gÿÿ,ÿÿ .
Como as segundas derivadas de gÿÿ não desaparecem, chegamos a P
Rÿ
= 1
ÿÿÿ 2 gÿÿ (gÿÿ,ÿÿ + gÿ ÿ,ÿÿ ÿ gÿÿ,ÿÿ
ÿ gÿÿ,ÿÿ ÿ gÿÿ,ÿÿ + gÿÿ,ÿ ÿ ). (6,65)
Usando a simetria de gÿÿ e o fato de que
gÿÿ,ÿÿ = gÿÿ,ÿÿ,
(6,66)
porque as derivadas parciais sempre comutam, encontramos em P
Rÿ
= 1
(6,67)
ÿÿÿ 2 gÿ ÿ gÿ ÿ,ÿÿ ÿ gÿÿ,ÿÿ + gÿÿ,ÿ ÿ ÿ gÿÿ,ÿÿ .
Se baixarmos o índice ÿ, obtemos (no sistema de coordenadas localmente plano em sua origem P)
1
Tal como acontece com outras definições que introduzimos anteriormente, não há acordo universal sobre o sinal geral de
o tensor de Riemann, ou mesmo na colocação de seus índices. Sempre verifique as convenções de qualquer livro
você lê.
= 1 (6,68)
Rÿÿÿÿ := gÿÿRÿ ÿÿÿ 2 gÿÿ,ÿÿ ÿ gÿÿ,ÿÿ + gÿÿ,ÿÿ ÿ gÿÿ,ÿÿ .
Neste formulário é fácil verificar as seguintes identidades:
Rÿÿÿÿ = ÿRÿÿÿÿ = ÿRÿÿÿÿ = Rÿÿÿÿ, Rÿÿÿÿ + (6,69)
Rÿÿÿÿ + Rÿÿÿÿ = 0. (6,70)
Assim, Rÿÿÿÿ é antisimétrica no primeiro par e no segundo par de índices, e simétrica na troca dos dois
pares. Uma vez que as Eqs. (6.69) e (6.70) são equações tensoriais válidas verdadeiras em um sistema
de coordenadas, elas são verdadeiras em todas as bases. (Observe que uma equação como a Eq. (6.67)
não é uma equação tensorial válida, pois envolve derivadas parciais, não covariantes. Portanto, é
verdadeira apenas no sistema de coordenadas em que foi derivada.)
Pode-se mostrar (Exer. 18, § 6.9) que as várias identidades, Eqs. (6.69) e (6.70), reduzem o número
de componentes independentes de Rÿÿÿÿ (e, portanto, de Rÿÿÿÿ ) para 20, em quatro dimensões. Este é,
não por coincidência, o mesmo número de gÿÿ,ÿÿ independentes que encontramos no final do § 6.2 não
poderia ser anulado por uma transformação de coordenadas.
Assim Rÿÿÿÿ caracteriza a curvatura de forma tensorial.
Uma variedade plana é aquela que tem uma definição global de paralelismo: um vetor pode ser movido
paralelamente a si mesmo em uma curva arbitrária e retornará ao seu ponto de partida inalterado.
Isso significa claramente que
Rÿ = 0 ÿ coletor plano. ÿÿÿ (6,71)
(Tente mostrar que isso é verdade em coordenadas polares para o plano euclidiano.)
Um uso importante do tensor de curvatura vem quando examinamos as consequências de tomar duas
derivadas covariantes de um campo vetorial V . Descobrimos no § 6.3 que as primeiras derivadas eram
como as do espaço plano, pois poderíamos encontrar coordenadas nas quais a métrica era plana de
primeira ordem. Mas as segundas derivadas são uma história diferente:
ÿÿÿÿVÿ = ÿÿ(Vÿ ;ÿ)

ÿ
= (Vÿ ;ÿ),ÿ + ÿÿ ÿVÿ ;ÿ ÿ ÿÿVÿ ;ÿ . (6,72)
Em coordenadas localmente inerciais cuja origem está em P, todos os s são zero, mas suas derivadas
parciais não. Portanto, temos em P
ÿÿÿÿVÿ = Vÿ,ÿÿ + ÿÿÿ,ÿVÿ . (6,73)
Tenha em mente que esta expressão é válida apenas neste sistema de coordenadas especialmente
escolhido, e isso também é verdade para as Eqs. (6.74) a (6.76) abaixo. Essas coordenadas facilitam o
cálculo: considere agora a Eq. (6.73) com ÿ e ÿ trocados:
ÿÿÿÿVÿ = Vÿ,ÿÿ + ÿÿÿ,ÿVÿ . (6,74)

Se os subtrairmos, obtemos o comutador dos operadores de derivada covariantes ÿÿ e ÿÿ, escritos na

mesma notação que empregaríamos na mecânica quântica:
[ÿÿ, ÿÿ]Vÿ :=ÿÿÿÿVÿ ÿ ÿÿÿÿVÿ = ÿÿÿ,ÿ ÿ
ÿÿÿ,ÿ Vÿ . (6,75)
Os termos envolvendo as segundas derivadas de Vÿ desaparecem aqui, uma vez que
Vÿ,ÿÿ = Vÿ,ÿÿ. (6,76)
[Vamos fazer uma pausa para lembrar que Vÿ,ÿ é a derivada parcial da componente Vÿ, então pelas
leis da diferenciação parcial as derivadas parciais devem comutar. Por outro lado, ÿÿVÿ é um
componente do tensor ÿV , e ÿÿÿÿVÿ é um componente de ÿÿV : não há razão (do
cálculo diferencial) para que seja simétrica em ÿ e ÿ. Provamos, mostrando que a Eq. (6.75) é diferente
de zero, que a derivada covariante dupla geralmente não é simétrica.] Agora, neste quadro (onde ÿÿÿ
= 0 em P), podemos comparar a Eq. (6,75) com a Eq. (6.63) e veja que em P
[ÿÿ, ÿÿ]Vÿ = RÿÿÿÿVÿ . (6,77)
Agora, esta é uma equação tensorial válida, então é verdade em qualquer sistema de coordenadas: o
tensor de Riemann fornece o comutador de derivadas covariantes. Podemos descartar a restrição
para coordenadas localmente inerciais: elas eram simplesmente uma maneira conveniente de chegar
a uma expressão geral de tensor para o comutador. O que isso significa é que em espaços curvos,
devemos ter o cuidado de saber a ordem em que as derivadas covariantes são tomadas: elas não comutam.
Isso pode ser estendido para tensores de classificação mais alta. Por exemplo, um 1tensor
1
tem
ÿ
[ÿÿ, ÿÿ]Fÿÿ = Rÿÿ ÿÿFÿ ÿ + Rÿ ÿÿFÿÿ . (6,78)
Ou seja, cada índice recebe um tensor de Riemann nele, e cada um vem com um sinal +. (Todos eles
devem ter o mesmo sinal porque aumentar e diminuir índices com g não é afetado por ÿÿ, já que ÿg =
0.)
Eq. (6.77) está intimamente relacionado à nossa derivação original do tensor de Riemann a partir
do transporte paralelo em torno de laços, porque o problema do transporte paralelo pode ser pensado
como computação, primeiro a mudança de V em uma direção e depois em outra, seguida por
subtraindo as mudanças na ordem inversa: é isso que a comutação de derivadas covariantes também
faz.
Desvio geodésico
Muitas vezes mencionamos que em um espaço curvo, linhas paralelas quando estendidas não
permanecem paralelas. Isso agora pode ser formulado matematicamente em termos do tensor de
Riemann. Considere duas geodésicas (com tangentes V e V ) que começam paralelas e próximas
.
uma da outra, como na Fig. 6.6, nos pontos A e A. Seja o parâmetro afim nas geodésicas chamado ÿ.
ÿÿ B' ÿ
UMA'
V'
ÿ
ÿ ÿ(B)
ÿ(A) ÿ
V
ÿÿ B
UMA
Figura 6.6 Um vetor de conexão ÿ entre duas geodésicas conecta pontos de mesmo valor de parâmetro.
Definimos um 'vetor de conexão' ÿ que 'alcança' de uma geodésica a outra, conectando pontos em intervalos
, inercial
iguais em ÿ (ie A a AB a B , etc.). Para simplificar, vamos adotar um sistema
em
aponta
de
A, coordenadas
no ao
qual
longo
a coordenada
da
localmente
geodésica
x0 e
avança na mesma taxa que ÿ ali (isto é apenas um escalonamento da coordenada).
Então porque Vÿ = dxÿ/dÿ, temos em A Vÿ = ÿÿ 0 . A equação da geodésica em A é
d2xÿ *
* = 0, * dÿ2 (6,79)
*A
uma vez que todos os símbolos de Christoffel desaparecem em A. Os símbolos de Christoffel não , assim
desaparecem em A , a equação da geodésica V em A é
d2xÿ * * *
ÿ
+ 00(A ) = 0, (6,80)
dÿ2 *A
onde novamente em A arranjamos as coordenadas de modo que Vÿ = ÿÿ 0 . Mas, como A e A são separados
por ÿ , temos
ÿ ÿ
00(A ) ÿ= 00,ÿÿÿ , (6,81)
o lado direito sendo avaliado em A. Com a Eq. (6,80) isso dá
d2xÿ * * ÿ
=ÿ
00,ÿÿÿ . (6,82)
* dÿ2 *A
ÿ
Agora, a diferença xÿ(ÿ, geodésica V ) ÿ xÿ(ÿ, geodésica V ) é apenas a componente ÿ vetor ÿ . do
Portanto, em A, temos
d2ÿ ÿ dÿ2 d2xÿ * * * d2xÿ * * *

ÿ
= ÿ
=ÿ
(6,83)
00,ÿÿÿ .
dÿ2 *A
dÿ2 *A
Isso então dá como os componentes de ÿ mudam. Mas como as coordenadas são até certo ponto arbitrárias,
queremos ter não apenas a segunda derivada do componente ÿ ÿ, mas a segunda derivada covariante completa
ÿVÿVÿ . Podemos usar a Eq. (6.48) para obter
ÿ
ÿVÿVÿ = ÿV(ÿVÿ ÿ)
d ÿ
= (ÿVÿ ÿ) = dÿ (6,84)
ÿ0(ÿVÿÿ ).
163 6.6 Identidades Bianchi: Ricci e Eins tein tensors
Agora, usando ÿÿÿ = 0 em A, temos
d d
ÿ
= ÿ
+
ÿ ÿ +0
ÿVÿVÿ ÿ0ÿ
dÿ ÿ dÿ
d2
= ÿ
+
ÿ ÿ (6,85)
ÿ dÿ2 ÿ0,0ÿ
em A. (Também usamos ÿ ÿ ,0 = 0 em A, que é a condição para que as curvas comecem paralelas.)

Então nós obtemos
ÿ
= ÿ ÿ ÿ
ÿVÿVÿ ÿ0,0 ÿ 00, ÿÿ
ÿ (6,86)
= Rÿ 00ÿÿ = Rÿ ÿÿÿVÿVÿ ÿ ÿ,
onde a segunda igualdade segue da Eq. (6,63). A expressão final é invariante de quadro,
e A era um ponto arbitrário, então temos, em qualquer base,
ÿ
ÿVÿVÿ = Rÿ ÿÿÿVÿVÿ ÿ ÿ. (6,87)
As geodésicas em espaço plano mantêm sua separação; aqueles em espaços curvos não. Isto é
chamada de equação do desvio geodésico e mostra matematicamente que as forças de maré de
um campo gravitacional (que faz com que as trajetórias de partículas vizinhas divirjam) pode ser
representado pela curvatura de um espaço-tempo em que as partículas seguem geodésicas.
6.6 Bi an i n d idades: R c ci e Einst ei ntensores
Voltemos à Eq. (6.63) para os componentes do tensor de Riemann. se nós o diferenciássemos

em relação a xÿ (apenas a derivada parcial) e avalie o resultado em inércia local
coordenadas, encontramos
1
Rÿÿÿÿ,ÿ = gÿÿ,ÿÿÿ ÿ gÿÿ,ÿÿÿ + gÿÿ,ÿÿÿ ÿ gÿÿ,ÿÿÿ . (6,88)
2
A partir desta equação, a simetria gÿÿ = gÿÿ e o fato de que as derivadas parciais comutam,
podemos mostrar que
Rÿÿÿÿ,ÿ + Rÿÿÿÿ,ÿ + Rÿÿÿÿ,ÿ = 0. (6,89)
Como em nossas coordenadas ÿÿÿ = 0 neste ponto, esta equação é equivalente a
Rÿÿÿÿ;ÿ + Rÿÿÿÿ;ÿ + Rÿÿÿÿ;ÿ = 0. (6,90)
Mas esta é uma equação tensorial, válida em qualquer sistema. É chamado de identidades Bianchi, e
ser muito importante para o nosso trabalho.
O tensor de Ricci
Antes de perseguir as consequências das identidades Bianchi, precisamos definir as

Tensor de Ricci Rÿÿ:
Rÿÿ := Rÿÿÿÿ = Rÿÿ. (6,91)
É a contração de Rÿÿÿÿ no primeiro e terceiro índices. Em princípio, outras contrações também seriam
possíveis: na primeira e na segunda, na primeira e na quarta, etc. Mas como Rÿÿÿÿ é antisimétrica em ÿ e ÿ
e em ÿ e ÿ, todas essas contrações ou desaparecem identicamente ou se reduzem a ±Rÿÿ. Portanto, o tensor
de Ricci é essencialmente a única contração do tensor de Riemann. Observe que a Eq. (6.69) implica que é
um tensor simétrico (Exer. 25, § 6.9).
Da mesma forma, o escalar de Ricci é definido como
R := gÿÿRÿÿ = gÿÿgÿÿRÿÿÿÿ . (6,92)
O tensor de Einstein
Vamos aplicar a contração de Ricci às identidades de Bianchi, Eq. (6,90):
gÿÿ " Rÿÿÿÿ;ÿ + Rÿÿÿÿ;ÿ + Rÿÿÿÿ;ÿ # = 0
ou
Rÿÿ;ÿ + (ÿRÿÿ;ÿ ) + Rÿÿÿÿ;ÿ = 0. (6,93)
Para derivar este resultado, precisamos de dois fatos. Primeiro, pela Eq. (6.31) temos
gÿÿ;ÿ = 0.
Como gÿÿ é uma função apenas de gÿÿ , segue-se que
gÿÿ 0. ;ÿ= (6,94)
Portanto, gÿÿ e gÿÿ podem ser incluídos e retirados de derivadas covariantes à vontade: aumento e redução
de índice comuta com diferenciação covariante. O segundo fato é que
gÿÿRÿÿÿÿ;ÿ = ÿgÿÿRÿÿÿÿ;ÿ = ÿRÿÿ;ÿ , (6,95)
representando o segundo termo da Eq. (6,93). Eq. (6.93) é chamado de identidades Bianchi contratadas.
Uma equação mais útil é obtida contraindo novamente os índices ÿ e ÿ:
gÿÿ " Rÿÿ;ÿ ÿ Rÿÿ;ÿ + Rÿÿÿÿ;ÿ # = 0
ou
R;ÿ ÿ Rÿÿ;ÿ + (ÿRÿÿ;ÿ) = 0. (6,96)

165 6.7 Curvatura em perspectiva
Novamente a antisimetria de R foi usada para obter o sinal correto no último termo. Observação
que como R é um escalar, R;ÿ ÿ R,ÿ em todas as coordenadas. Agora, a eq. (6.96) pode ser escrito em
a forma
(2Rÿÿ ÿ ÿÿÿR);ÿ = 0. (6,97)
Estas são as identidades Bianchi contraídas duas vezes, muitas vezes simplesmente chamadas de Bianchi
identidades. Se definirmos o tensor simétrico
1
Gÿÿ ÿ Rÿÿ ÿ (6,98)
2 gÿÿR = Gÿÿ,
então vemos que a Eq. (6,97) é equivalente a
=
Gÿÿ 0. ;ÿ (6,99)
O tensor Gÿÿ é construído apenas a partir do tensor de Riemann e da métrica, e é automaticamente livre de
divergência como identidade. É chamado de tensor de Einstein, pois sua importância
para a gravidade foi entendido pela primeira vez por Einstein. [Na verdade, veremos que o campo de Einstein
equações para GR são
Gÿÿ = 8ÿTÿÿ
(onde Tÿÿ é o tensor de tensão-energia). As identidades Bianchi então implicam
Tÿÿ ;ÿ ÿ 0,
que é a equação da conservação local da energia e do momento. Mas isso está procurando
um pouco à frente.]
6.7 Curvatura inperspectiva
A maquinaria matemática para lidar com a curvatura é formidável. Existem muitos

equações importantes neste capítulo, mas poucas delas precisam ser memorizadas. É muito mais
importante compreender a sua derivação e particularmente a sua interpretação geométrica.
Essa interpretação é algo que construiremos nos próximos capítulos, mas o material já em mãos deve dar ao
aluno uma ideia do que a matemática significa. Deixar
nós revisamos as características importantes dos espaços curvos.
(1) Trabalhamos em variedades Riemannianas, que são espaços lisos com uma métrica definida
neles.
(2) A métrica tem assinatura +2, e sempre existe um sistema de coordenadas no qual, em
um único ponto, podemos ter
gÿÿ = ÿÿÿ,
ÿ
gÿÿ,ÿ = 0 ÿ = 0.
ÿÿ
(3) O elemento de volume adequado é

|g| 1/2d4x,
onde g é o determinante da matriz de componentes gÿÿ.

(4) A derivada covariante é simplesmente a derivada ordinária em coordenadas localmente
inerciais. Por causa da curvatura ( ÿÿÿ ,ÿ = 0) essas derivadas não comutam.
(5) A definição de transporte paralelo é que a derivada covariante ao longo da curva é zero. Uma
geodésica transporta paralelamente seu próprio vetor tangente. Seu parâmetro afim pode ser
considerado a própria distância apropriada.
(6) O tensor de Riemann é a caracterização da curvatura. Somente se ela desaparecer
identicamente é que a variedade é plana. Possui 20 componentes independentes (em quatro
dimensões), e satisfaz as identidades de Bianchi, que são equações diferenciais. O tensor de
Riemann em um sistema de coordenadas geral depende de gÿÿ e sua primeira e segunda derivadas parci
O tensor de Ricci, o escalar de Ricci e o tensor de Einstein são contrações do tensor de
Riemann. Em particular, o tensor de Einstein é simétrico e de segunda ordem, portanto possui
dez componentes independentes. Eles satisfazem as quatro identidades diferenciais, Eq. (6,99).
6.8 P ara
A teoria das variedades diferenciáveis é introduzida em um grande número de livros. Os seguintes

são adequados para explorar mais o assunto com vista às suas aplicações físicas, particularmente
fora da relatividade: Abraham e Marsden (1978), Bishop e Goldberg (1981), Hermann (1968), Isham
(1999), Lovelock e Rund ( 1990) e Schutz (1980b). Os trabalhos de referência matemática padrão
incluem Kobayashi e Nomizu (1963, 1969), Schouten (1990) e Spivak (1979).
6.9 Exercícios
1 Decida se os seguintes conjuntos são múltiplos e diga por quê. Se houver pontos excepcionais
em que os conjuntos não são múltiplos, dê-lhes:
(a) espaço de fase da mecânica hamiltoniana, o espaço das coordenadas canônicas e
momentos pi e qi ;
(b) o interior de um círculo de raio unitário no espaço euclidiano bidimensional; (c) o
conjunto de permutações de n objetos; (d) o subconjunto do espaço euclidiano de
duas dimensões (coordenadas x e y) que é uma solução para xy (x2 + y2 ÿ 1) = 0.
2 Das variedades em Exer. 1, em que é costume usar uma métrica, e o que é isso
métrica? Em que uma métrica normalmente não seria definida e por quê?
167 6.9 Exercícios
3 É bem conhecido que para qualquer matriz simétrica A (com entradas reais), existe uma matriz H para a
qual a matriz HTAH é uma matriz diagonal cujas entradas são os autovalores de A. (a) Mostre que existe
uma matriz R tal que RTHTAHR é a mesma matriz que HTAH , exceto com os autovalores rearranjados
em ordem crescente ao longo da diagonal principal de cima para baixo.
(b) Mostre que existe uma terceira matriz N tal que NTRHTAHRN é uma diagonal
matriz cujas entradas na diagonal são -1, 0 ou +1. (c) Mostre que
se A tem uma inversa, nenhum dos elementos diagonais em (b) é zero. (d) Mostre de (a)-(c)
que existe uma matriz de transformação que produz
Eq. (6.2).
4 Prove os seguintes resultados usados na prova do teorema da planicidade local em § 6.2:
(a) O número de valores independentes de ÿ2xÿ/ÿxÿ ÿxÿ |0 é 40. (b) O número
correspondente para ÿ3xÿ/ÿxÿ ÿxÿ ÿxÿ |0 é 80. (c) O número correspondente
para gÿÿ ,ÿ ÿ|0 é 100.
5 (a) Prove que ÿÿÿ = ÿÿÿ em qualquer sistema de coordenadas em um espaço Riemanniano curvo. (b) Use
isso para provar que a Eq. (6.32) pode ser derivada da mesma maneira que no espaço plano.
6 Prove que o primeiro termo da Eq. (6.37) desaparece. 7
(a) Dê a definição do determinante de uma matriz A em termos de cofatores de
elementos.
(b) Diferencie o determinante de uma matriz 2 × 2 arbitrária e mostre que ele satisfaz
Eq. (6.39).
(c) Generalize a Eq. (6.39) (por indução ou de outra forma) para matrizes n × n arbitrárias.
8 Preencha a álgebra que falta levando às Eqs. (6,40) e (6,42).
9 Mostre que a Eq. (6.42) leva à Eq. (5,56). Derive a fórmula de divergência para a métrica
na Eq. (6.19).
10 Uma 'linha reta' em uma esfera é um grande círculo, e é bem conhecido que a soma dos ângulos internos
de qualquer triângulo em uma esfera cujos lados são arcos de grandes círculos excede 180°. Mostre que
a quantidade pela qual um vetor é girado por transporte paralelo em torno de tal triângulo (como na Fig.
6.3) é igual ao excesso da soma dos ângulos sobre 180°.
11 Neste exercício vamos determinar a condição de que um campo vetorial V pode ser considerado
ser globalmente paralelo em uma variedade. Mais precisamente, o que garante que podemos encontrar
um campo vetorial V satisfazendo a equação
ÿ ÿ
(ÿV ) = Vÿ = Vÿ ,ÿ+ ;ÿ ÿÿVÿ = 0?
ÿ
(a) Uma condição necessária, chamada de condição de integrabilidade para esta equação, decorre da
comutação de derivadas parciais. Mostre que Vÿ,ÿÿ = Vÿ,ÿÿ implica
ÿ ÿ ÿ ÿ
ÿÿ,ÿ ÿ ÿÿ,ÿ
Vÿ = ÿÿ ÿÿ ÿ
ÿ
ÿÿ ÿÿÿ Vÿ .
(b) Ao rotular novamente os índices, trabalhe isso na forma

ÿ ÿ ÿ ÿ ÿ ÿ
ÿÿ,ÿ ÿ ÿÿ,ÿ + ÿÿ ÿÿ - ÿÿ ÿÿ
Vÿ = 0.
Isso acaba sendo suficiente, também.

12 Prove que a Eq. (6.52) define um novo parâmetro afim.
13 (a) Mostre que se A e B são transportados paralelamente ao longo de uma curva, então g(A , B ) = A ·
B é constante na curva.
(b) Conclua disso que se uma geodésica é espacial (ou temporal ou nula) em algum lugar,
é semelhante ao espaço (ou temporal ou nulo) em todos os lugares.
14 A distância adequada ao longo de uma curva cuja tangente é V é dada pela Eq. (6.8). Mostre que se a
curva é geodésica, então o comprimento adequado é um parâmetro afim. (Use o resultado do Exer.
13.)
15 Use Exers. 13 e 14 para provar que o comprimento adequado de uma geodésica entre dois pontos é
inalterado em primeira ordem por pequenas mudanças na curva que não alteram suas extremidades.
16 (a) Deduza as Eqs. (6,59) e (6,60) da Eq. (6,58). (b) Preencha
a álgebra necessária para justificar a Eq. (6.61).
17 (a) Prove que a Eq. (6.5) implica gÿÿ,ÿ(P) = 0. (b) Use
isso para estabelecer a Eq. (6,64). (c) Preencha os
passos necessários para estabelecer a Eq. (6,68). 18 (a)
Deduza as Eqs. (6,69) e (6,70) da Eq. (6,68).
(b) Mostre que a Eq. (6.69) reduz o número de componentes independentes de Rÿÿÿÿ de 4 × 4 × 4 ×
4 = 256 para 6 × 7/2 = 21. (Dica: trate pares de índices. Calcule quantas escolhas independentes
de pares existem para o primeiro e os segundos pares em Rÿÿÿÿ.)
(c) Mostre que a Eq. (6.70) impõe apenas mais uma relação independente da Eq. (6,69)
nos componentes, reduzindo o total de independentes para 20.
19 Prove que Rÿÿÿÿ = 0 para coordenadas polares no plano euclidiano. Use a Eq. (5.45) ou resultados
equivalentes.
20 Preencha a álgebra necessária para estabelecer a Eq. (6,73).
21 Considere as sentenças que seguem a Eq. (6,78). Por que o argumento entre parênteses não se aplica
aos sinais em
ÿ
Vÿ = Vÿ ,ÿ + ;ÿ ÿÿVÿ e Vÿ;ÿ = Vÿ,ÿ ÿ ÿÿÿVÿ?
22 Preencha a álgebra necessária para estabelecer as Eqs. (6,84), (6,85) e (6,86).

23 Prove a Eq. (6,88). (Cuidado: não se pode simplesmente derivar a Eq. (6.67) , pois ela é válida apenas
em P, não na vizinhança de P.)
24 Estabeleça a Eq. (6,89) da Eq. (6,88). 25 (a)
Prove que o tensor de Ricci é a única contração independente de Rÿÿÿÿ : todos os outros são múltiplos
dele. (b) Mostre que o tensor de Ricci é simétrico.
26 Use Exer. 17(a) para provar a Eq. (6,94).

27 Preencha a álgebra necessária para estabelecer as Eqs. (6,95), (6,97) e (6,99). 28
(a) Deduza a Eq. (6.19) usando a transformação de coordenadas usual de cartesiana para
polares esféricos.
(b) Deduza da Eq. (6.19) que a métrica da superfície de uma esfera de raio r tem componentes (gÿÿ =
r2, gÿÿ = r2 sin2 ÿ, gÿÿ = 0) na forma esférica usual
dinamita.
(c) Encontre os componentes gÿÿ para a esfera.
169 6.9 Exercícios
29 Em coordenadas polares, calcule o tensor de curvatura de Riemann da esfera de unidade

raio, cuja métrica é dada em Exer. 28. (Observe que em duas dimensões há apenas
um componente independente, pelos mesmos argumentos de Exer. 18(b). Então calcule
Rÿÿÿÿ e obtenha todos os outros componentes em função dele.)
30 Calcule o tensor de curvatura de Riemann do cilindro. (Como o cilindro é plano, este
deve desaparecer. Use as coordenadas que desejar e certifique-se de anotar as
métrica corretamente!)
31 Mostre que a diferenciação covariante obedece à regra do produto usual, por exemplo (VÿÿWÿÿ );ÿ =
Vÿÿ ;ÿ Wÿÿ + VÿÿWÿÿ ;ÿ. (Dica: use um referencial localmente inercial.)
32 Uma variedade quadridimensional tem coordenadas (u, v, w, p) nas quais a métrica tem componentes
guv = gww = gpp = 1, todos os outros componentes independentes
desaparecimento.
(a) Mostre que a variedade é plana e a assinatura é +2.

(b) O resultado em (a) implica que a variedade deve ser o espaço-tempo de Minkowski. Encontre uma
transformação de coordenadas para as coordenadas usuais (t, x, y, z). (Você pode achar útil
dica para calcular eÿ · eÿ e eu · eu.)
33 Uma 'tri-esfera' é a superfície tridimensional no espaço euclidiano quadridimensional
(coordenadas x, y, z, w), dado pela equação x2 + y2 + z2 + w2 = r2, onde r é o
raio da esfera.
(a) Defina novas coordenadas (r, ÿ, ÿ, ÿ) pelas equações w = r cos ÿ,z = rsin ÿ cos ÿ,
x = rsin ÿ sen ÿ cos ÿ, y = rsin ÿ sen ÿ sen ÿ. Mostre que (ÿ, ÿ, ÿ) são coordenadas
para a esfera. Estes generalizam as coordenadas polares familiares.
(b) Mostre que a métrica da três esfera de raio r tem componentes nestas coor sen2 ÿ, todas as outras
dá gÿÿ = r2 , gÿÿ = r2 sen2 ÿ, gÿÿ = r2 sen2 desaparecendo. ÿ componentes
(Use o mesmo método do Exer. 28.)
34 Estabeleça as seguintes identidades para um tensor métrico geral em uma coordenada geral
sistema. Você pode encontrar as Eqs. (6.39) e (6.40) úteis.
(a) µ = 1 (ln |g|),ÿ ;
ÿÿ 2
(b) gÿÿ ÿÿÿ = ÿ(gÿÿÿ ÿ g),ÿ/ ÿ ÿ g;
(c) para um tensor antisimétrico Fÿÿ , Fÿÿ ;ÿ = ( ÿ ÿ g Fÿÿ ),ÿ / ÿ ÿ g;
(d) gÿÿgÿÿ,ÿ = ÿgÿÿ,ÿgÿÿ (dica: o que é gÿÿgÿÿ?);
(e) gÿÿ ,ÿ = ÿ ÿÿÿgÿÿ ÿ ÿ ÿÿgÿÿ (dica: use a Eq. (6.31)).
35 Calcule 20 componentes independentes de Rÿÿÿÿ para um coletor com elemento de linha
ds2 = ÿe2 dt 2
r2(dÿ 2 ções apenas da +
coordenada
sin2 ÿ dÿ2),r .onde
(Primeiro,
e são identifique
funções arbitrárias
as coordenadas
+ e2 dr2e+os
componentes gÿÿ;
então calcule gÿÿ e os símbolos de Christoffel. Em seguida, decida sobre os índices dos 20
componentes de Rÿÿÿÿ que você deseja calcular e calcule-os. Lembre-se que você
pode deduzir os restantes 236 componentes desses 20.)
36 Uma variedade quadridimensional tem coordenadas (t, x, y, z) e elemento de linha
2 2
dias = ÿ(1 + 2ÿ) dt + (1 ÿ 2ÿ)( dx2 + dy2 + dz 2),
onde |ÿ(t, x, y, z)| 1 em todos os lugares. Em qualquer ponto P com coordenadas (t0, x0, y0, z0),
encontrar uma transformação de coordenadas para um sistema de coordenadas localmente inercial, para primeira ordem em
ÿ. A que taxa esse quadro acelera em relação às coordenadas originais,

novamente para primeira ordem em ÿ?
37 (a) O 'volume próprio' de uma variedade bidimensional é geralmente chamado de 'área própria'.
Usando a métrica em Exer. 28, integre a Eq. (6.18) para encontrar a área adequada de uma esfera
de raio r.
(b) Faça o cálculo análogo para a três esferas de Exer. 33.

38 Integrar a Eq. (6.8) para encontrar o comprimento de um círculo de coordenada constante ÿ em uma esfera de
raio r.
39 (a) Para quaisquer dois campos vetoriais U e V , seu colchete Lie é definido como o campo vetorial
[U , V ] com componentes
[U , V ] = UÿÿÿVÿ ÿ VÿÿÿUÿ. (6.100)
Mostrar isso
[U , V ] = ÿ[V , U ],
[U , V ] = Uÿ ÿ Vÿ/ÿxÿ ÿ Vÿ ÿUÿ/ÿxÿ.
Este é um campo tensorial no qual as derivadas parciais não precisam ser acompanhadas por
Símbolos de Christoffel!
(b) Mostre que [U , V ] é um operador derivativo em V ao longo de U escalar, ou seja, mostre que para qualquer
f,
[U , fV ] = f[U , V ] + V (U · ÿf). (6.101)
Isso às vezes é chamado de derivada de Lie em relação a U e é denotada por
[U , V ] := £ U V , U · ÿf := £U f . (6.102)
Então a Eq. (6.101) seria escrito na forma mais convencional do Leibnitz

regra para o operador derivativo £U :
£U (fV ) = f £ UV + V £ f. (6.103)
O resultado de (a) mostra que este operador derivativo pode ser definido sem uma conexão ou
métrica e, portanto, é muito fundamental. Veja Schutz (1980b) para uma
introdução.
(c) Calcule os componentes da derivada de Lie de um corpo de uma forma ÿ˜ do

conhecimento de que, para qualquer campo vetorial V , ÿ˜(V ) é um escalar como f acima, e do
definição de que £U ÿ˜ é um corpo de uma forma:
£U [ÿ˜(V )] = (£U ÿ˜)(V ) + ˜ÿ(£U V ).
Este é o análogo da Eq. (6.103).

7 Física em um espaço-tempo curvo
7.1 T hetrans s ão da diferença da geometria n ti al

para a gravidade
A essência de uma teoria física expressa em forma matemática é a identificação dos conceitos matemáticos
com certas quantidades fisicamente mensuráveis. Esta deve ser a nossa primeira preocupação quando
olhamos para a relação dos conceitos de geometria que desenvolvemos com os efeitos da gravidade no
mundo físico. Já discutimos isso até certo ponto. Em particular, assumimos que o espaço-tempo é uma
variedade diferenciável e mostramos que não existem referenciais inerciais globais na presença de campos
gravitacionais não uniformes. Por trás dessas declarações estão as duas identificações:
(I) O espaço-tempo (o conjunto de todos os eventos) é uma variedade quadridimensional com uma métrica.
(II) A métrica é mensurável por hastes e relógios. A distância ao longo de uma haste entre dois pontos
próximos é |d x · d x| 1/2 e o tempo medido por um relógio que experimenta dois eventos
intimamente separados no tempo é | ÿ dx · dx| 1/2.
Portanto, geralmente não existem coordenadas nas quais d x · d x = ÿ(dx0) 2 + (dx1) 2 ( dx2) 2 + (dx3 ) +
2 em todos
sugere
os lugares.
claramente
Poro uma
fazem outrovariedade
lado,
produto também
curvada,
escalar em argumentamos
na qual
um ponto podem
que tais
particular ser encontradas
frames
parecer comexistem
coordenadas
localmente.
o espaço-tempo que
de Isso
Minkowski.
Por isso, fazemos mais um requisito:
(III) A métrica do espaço-tempo pode ser colocada na forma de Lorentz ÿÿÿ em qualquer evento
particular por uma escolha apropriada de coordenadas.
Tendo escolhido esta forma de representar o espaço-tempo, devemos fazer mais duas coisas para obter
uma teoria completa. Primeiro, devemos especificar como os objetos físicos (partículas, campos elétricos,
fluidos) se comportam em um espaço-tempo curvo e, segundo, precisamos dizer como a curvatura é gerada
ou determinada pelos objetos no espaço-tempo.
Consideremos a gravidade newtoniana como um exemplo de teoria física. Para Newton, o espaço-tempo
consistia em espaço euclidiano tridimensional, repetido interminavelmente no tempo.
(Matematicamente, isso é chamado de R3 × R.) Não havia métrica no espaço-tempo como um todo
múltiplo, mas o espaço euclidiano tinha sua métrica usual e o tempo era medido por um relógio universal.
Observadores com velocidades diferentes eram todos igualmente válidos: essa forma de relatividade foi
incorporada à mecânica galileana. Portanto, não havia um padrão universal de descanso, e observadores
diferentes teriam definições diferentes sobre se dois eventos ocorrendo em momentos diferentes aconteceram no
mesmo local. Mas todos os observadores concordariam com a simultaneidade, se dois eventos aconteceram na
mesma fatia de tempo ou não. Assim, a "separação no tempo" entre dois eventos significava o tempo decorrido
entre as duas fatias euclidianas contendo os dois eventos. Isso era independente das localizações espaciais dos
eventos, então na gravidade newtoniana havia uma noção universal de tempo: todos os observadores,
independentemente da posição ou movimento, concordavam com o tempo decorrido entre dois eventos dados.
Da mesma forma, a 'separação no espaço' entre dois eventos significava a distância euclidiana entre eles. Se os
eventos fossem simultâneos, ocorrendo na mesma fatia de tempo euclidiana, então isso seria simples de calcular
usando a métrica dessa fatia, e todos os observadores concordariam com isso. Se os eventos ocorressem em
momentos diferentes, cada observador pegaria a localização dos eventos em suas respectivas fatias de espaço
e calcularia a distância euclidiana entre eles. As localizações seriam diferentes para diferentes observadores, mas
novamente a distância entre eles seria a mesma para todos os observadores.
No entanto, na teoria newtoniana não havia como combinar as medidas de tempo e distância: não havia
medida invariante do comprimento de uma curva geral que mudasse de posição e tempo à medida que avançava.
Sem uma forma invariável de converter tempos em distâncias, isso não era possível. O que Einstein trouxe para
a relatividade foi a invariância da velocidade da luz, que permite então uma unificação das medidas de tempo e
espaço. O espaço-tempo quadridimensional de Einstein tem uma estrutura muito mais simples que a de Newton!
Agora, dentro deste modelo de espaço-tempo, Newton deu uma lei para o comportamento de objetos que
experimentaram forças gravitacionais: F = ma, onde F = ÿmÿÿ para um dado campo gravitacional ÿ. E ele também
deu uma lei determinando como ÿ é gerado: ÿ2 = 4ÿGÿ. Essas duas leis são aquelas para as quais devemos
agora encontrar análogos em nosso ponto de vista relativista sobre o espaço-tempo. A segunda será tratada no
próximo capítulo. Neste capítulo, perguntamos apenas como uma determinada métrica afeta os corpos no espaço-
tempo.
Já discutimos isso para o caso simples do movimento de partículas. Como sabemos que a 'aceleração' de
uma partícula em um campo gravitacional é independente de sua massa, podemos ir para um referencial em
queda livre no qual as partículas próximas não têm aceleração. Isso é o que identificamos como um referencial
localmente inercial. Como as partículas em queda livre não têm aceleração nesse quadro, elas seguem linhas
retas, pelo menos localmente. Mas as linhas retas em um referencial inercial local são, é claro, a definição de
geodésicas na variedade curva completa.
Assim, temos nosso primeiro postulado sobre como as partículas são afetadas pela métrica:
(IV) Princípio de Equivalência Fraca: Partículas em queda livre se movem em geodésicas do espaço-tempo
semelhantes ao tempo.1
1 É mais comum definir o WEP sem referência a um espaço-tempo curvo, mas apenas dizer que todas as partículas caem com a
mesma velocidade em um campo gravitacional, independente de sua massa e composição. Mas o Princípio de Equivalência de
Einstein (Postulado IV ) é normalmente considerado como implicando que a gravidade pode ser representada pela curvatura do
espaço-tempo, então devemos simplesmente começar com a suposição de que temos um espaço-tempo curvo.
173 7.1 A transição da geometria diferencial para a gravidade
Por 'queda livre' queremos dizer partículas não afetadas por outras forças, como campos elétricos, etc. Todas as
outras forças conhecidas na física se distinguem da gravidade pelo fato de que existem partículas não afetadas
por elas. Assim, o Princípio de Equivalência Fraca (Postulado IV) é uma afirmação poderosa, passível de teste
experimental. E foi testado, e continua sendo testado, com alta precisão. Os experimentos normalmente comparam
a taxa de queda de objetos compostos de materiais diferentes; os limites experimentais atuais limitam as diferenças
fracionárias na aceleração a algumas partes em 1013 (Will 2006). O WEP é, portanto, uma das leis mais
precisamente testadas em toda a física. Existem até propostas para testá-lo até o nível de 10 a 18 usando
experimentos realizados por satélite.
Mas o WEP refere-se apenas a partículas. Como, digamos, os fluidos são afetados por uma métrica não plana?
Precisamos de uma generalização de (IV):
(IV ) Princípio de Equivalência de Einstein: Qualquer experimento físico local que não envolva gravidade terá o
mesmo resultado se realizado em um referencial inercial em queda livre como se fosse realizado no
espaço-tempo plano da relatividade especial.
Nesse caso, 'local' significa que o experimento não envolve campos, como campos elétricos, que podem se
estender por grandes regiões e, portanto, estender-se fora do domínio de validade do referencial inercial local.
Toda a física local é a mesma em um referencial inercial em queda livre como na relatividade especial. A gravidade
não introduz nada de novo localmente. Todos os efeitos da gravidade são sentidos em regiões extensas do espaço-
tempo. Isso também foi testado rigorosamente (Will 2006).
Isso pode parecer estranho para alguém acostumado a culpar a gravidade por dificultar subir escadas ou
montanhas, ou até mesmo sair da cama! Mas esses efeitos locais da gravidade são, do ponto de vista de Einstein,
realmente os efeitos de sermos empurrados pela Terra e pelos objetos nela. Nosso 'peso' é causado pela Terra
sólida exercendo forças sobre nós que nos impedem de cair livremente em uma geodésica (sem peso, através do
chão). Este é um ponto de vista muito razoável. Considere os astronautas orbitando a Terra. A uma altitude de
cerca de 300 km, eles dificilmente estão mais distantes do centro da Terra do que nós, de modo que a força da
força gravitacional newtoniana sobre eles é quase a mesma que sobre nós. Mas eles não têm peso, desde que
sua órbita os impeça de encontrar a Terra sólida. Uma vez que reconhecemos que o espaço-tempo tem curvas
naturais, as geodésicas, e que quando caímos sobre elas estamos em queda livre e não sentimos gravidade, então
podemos descartar completamente o conceito newtoniano de força gravitacional. Estamos apenas seguindo a
curva natural do espaço-tempo.
A verdadeira medida da gravidade na Terra são suas marés. Estes são efeitos não locais, porque surgem da
diferença da aceleração gravitacional newtoniana da Lua ao longo da Terra, ou seja, do desvio geodésico próximo
à Terra. Se a Terra estivesse permanentemente nublada, um terráqueo não saberia sobre a Lua por sua aceleração
gravitacional geral, já que a Terra cai livremente: não sentimos a Lua localmente. Mas os terráqueos podiam, em
princípio, descobrir a Lua mesmo sem vê-la, observando e compreendendo as marés. As forças de maré são o
único aspecto mensurável da gravidade.
Matematicamente, o que o Princípio de Equivalência de Einstein significa é, grosso modo, que se temos uma
lei local da física que é expressa em notação tensorial em SR, então sua forma matemática deve ser a mesma em
um referencial localmente inercial de um espaço-tempo curvo.
Esse princípio é freqüentemente chamado de 'regra da vírgula para o ponto e vírgula', porque se uma
lei contém derivadas em sua forma relativista especial ('vírgulas'), então ela tem essas mesmas derivadas
no referencial inercial local. Para converter a lei em uma expressão válida em qualquer referencial de
coordenadas, simplesmente tornamos as derivadas covariantes ('ponto e vírgula'). É uma maneira
extremamente simples de generalizar as leis físicas. Em particular, proíbe o 'acoplamento de curvatura':
é concebível que a forma correta de, digamos, termodinâmica em um espaço-tempo curvo envolva de
alguma forma o tensor de Riemann, que desapareceria em SR. O postulado (IV ) não permitiria nenhum
termo tensor de Riemann nas equações.
Como exemplo de como (IV ) se traduz em matemática, discutimos a dinâmica dos fluidos, que será
nosso principal interesse neste curso. A lei de conservação de partículas em SR é expressa como
(n Uÿ),ÿ = 0, (7.1)
onde n é a densidade de partículas no quadro de referência momentaneamente comovente (MCRF), e

onde Uÿ é a quatro velocidades de um elemento de fluido. Em um espaço-tempo curvo, em qualquer
evento, podemos encontrar um referencial localmente inercial comovendo momentaneamente com o
elemento fluido naquele evento e definir n exatamente da mesma maneira. Da mesma forma, podemos
definir U como o vetor de base de tempo desse quadro, assim como em SR. Então, de acordo com o
princípio de equivalência de Einstein (veja Cap. 5), a lei de conservação das partículas no referencial
localmente inercial é exatamente a Eq. (7.1). Mas porque os símbolos de Christoffel são zero no evento
dado porque é a origem do referencial localmente inercial, isso é equivalente a
(n Uÿ);ÿ = 0. (7.2)
Essa forma da lei é válida em todos os referenciais e, portanto, nos permite calcular a lei de conservação
em qualquer referencial e ter certeza de que é aquela implícita no princípio de equivalência de Einstein.
Portanto, generalizamos a lei de conservação de partículas para um espaço-tempo curvo. Seguiremos
este método para outras leis da física conforme precisarmos delas.
Este é apenas um jogo com tensores, ou há conteúdo físico no que fizemos? É possível que em um
espaço-tempo curvo a lei de conservação seja algo diferente da Eq. (7.2)? A resposta é sim: considere
postular a equação
(n Uÿ);ÿ = qR2, (7.3)
onde R é o escalar de Ricci, definido na Eq. (6.92) como o traço duplo da ten sor de Riemann, e onde q
é uma constante. Isso também reduziria para a Eq. (7.1) em SR, pois em um espaço-tempo plano o
tensor de Riemann se anula. Mas no espaço-tempo curvo, essa equação prevê algo muito diferente: a
curvatura criaria ou destruiria partículas, de acordo com o sinal da constante q. Assim, ambas as
equações anteriores são consistentes com as leis da física em SR. O princípio da equivalência de
Einstein afirma que devemos generalizar a Eq. (7.1) da maneira mais simples possível, ou seja, para a
Eq. (7.2). É claro que é uma questão de experiência, ou observação astronômica, para decidir se a Eq.
(7.2) ou Eq. (7.3) está correto. Neste livro, faremos simplesmente a suposição quase universal de que o
princípio da equivalência de Einstein está correto. Não há evidência observacional em contrário.
175 7.2 Física em tempos de espaço ligeiramente curvos
Da mesma forma, a lei de conservação da entropia em SR é
UÿS,ÿ = 0. (7.4)
Como não há símbolos de Christoffel na derivada covariante de um escalar como S, essa lei
é inalterada em um espaço-tempo curvo. Finalmente, a conservação de quatro momentos é
Tÿÿ ,ÿ
= 0. (7.5)
A generalização é
Tÿÿ ;ÿ = 0, (7.6)
com a definição
Tÿÿ = (ÿ + p)UÿUÿ + pgÿÿ , (7.7)
exatamente como antes. (Observe que gÿÿ é o tensor cujos componentes na inércia local
frame igual ao tensor métrico de espaço plano ÿÿÿ .)
7.2 Físico em tempos de espaço curvo
Para ver as implicações de (IV ) para o movimento de uma partícula ou fluido, devemos conhecer o
métrica no coletor. Como ainda não estudamos a forma como uma métrica é gerada, vamos
nesta fase tem que se contentar em assumir uma forma para a métrica que derivaremos
mais tarde. Veremos mais adiante que para campos gravitacionais fracos (onde, na linguagem newtoniana,
a energia potencial gravitacional de uma partícula é muito menor do que sua energia de massa de repouso) o
potencial newtoniano ordinário ÿ determina completamente a métrica, que tem a forma
2 2
dias = ÿ(1 + 2ÿ) dt + (1 ÿ 2ÿ) ( dx2 + dy2 + dz 2). (7.8)
(O sinal de ÿ é escolhido negativo, de modo que, longe de uma fonte de massa M, temos ÿ =
ÿGM/r.) Agora, a condição acima de que o campo seja fraco significa que |mÿ| m, de modo que
|ÿ| 1. A métrica, Eq. (7.8), é realmente correto apenas para primeira ordem em ÿ, então trabalharemos para
esta ordem a partir de agora.
Vamos calcular o movimento de uma partícula em queda livre. Denotamos seu momento de quatro
,
por p . Para todas as partículas, exceto sem massa, isso é mU onde U = d x/dÿ . Agora, por (IV), o
caminho da partícula é uma geodésica, e sabemos que o tempo próprio é um parâmetro afim em tal
um caminho. Portanto , U deve satisfazer a equação geodésica,
ÿU U = 0. (7.9)
Por conveniência mais tarde, no entanto, notamos que qualquer constante vezes o tempo próprio é um afim
parâmetro, em particular ÿ/ m. Então d x/d(ÿ/m) também é um vetor que satisfaz a equação geodésica. Este
vetor é apenas md x/dÿ = p. Assim, também podemos escrever a equação de movimento do
partícula como
ÿpp = 0 . (7.10)
Essa equação também pode ser usada para fótons, que têm um p bem definido, mas nenhum U , pois
m = 0.
Se a partícula tem uma velocidade não relativística nas coordenadas da Eq. (7.8), podemos encontrar um
forma aproximada para a Eq. (7.10). Primeiro vamos considerar o componente zero da equação,
observando que a derivada ordinária ao longo de p é m vezes a derivada ordinária ao longo de U , ou em
outras palavras m d/dÿ :
d 0
m p0 + ÿÿpÿpÿ = 0. (7.11)
dÿ
Como a partícula tem uma velocidade não relativística, temos p0 p1 , então a Eq. (7.11) é
aproximadamente
d
m p0 + 0 00(p0) 2 = 0. (7.12)
dÿ
0
Precisamos calcular 00:
0 1
00 = 2 g0ÿ(gÿ0,0 + gÿ0,0 ÿ g00,ÿ). (7.13)
Agora porque [gÿÿ] é diagonal, [gÿÿ] também é diagonal e seus elementos são os recíprocos
dos de [gÿÿ]. Portanto , g0ÿ é diferente de zero somente quando ÿ = 0, então a Eq. (7.13) torna -se
0 1 1 1
00 = 2 g00g00,0 = (ÿ2ÿ),0
2 ÿ(1 + 2ÿ)
= ÿ,0 + 0(ÿ2). (7.14)
Para ordem mais baixa na velocidade da partícula e em ÿ, podemos substituir (p0) 2 termo no segundo
da Eq. (7,12) por m2, obtendo
d
p0 = ÿmÿÿ . (7.15)
dÿ ÿÿ
Como p0 é a energia da partícula neste referencial, isso significa que a energia é conservada a menos que
o campo gravitacional depende do tempo. Este resultado é verdadeiro também na teoria newtoniana. Aqui,
entretanto, devemos notar que p0 é a energia da partícula somente em relação a este referencial.
Os componentes espaciais da equação geodésica dão a contrapartida da equação newtoniana.
F = m. Eles são
pÿpi + ,ÿ iÿÿpÿpÿ = 0 , (7.16)
ou, para a ordem mais baixa na velocidade,
mdpi + e 00(p0) 2 = 0. (7.17)

dÿ
Novamente negligenciamos pi comparado a p0 na soma. Coerente com isso nós

pode novamente colocar (p0) 2 = m2 para uma primeira aproximação e obter
dpi
= -m
eu
00. (7.18)
dÿ
Calculamos o símbolo de Christoffel:

eu 1
00 = 2 giÿ(gÿ0,0 + gÿ0,0 ÿ g00,ÿ). (7.19)
177 7.3 Intuição curvada
Agora, como [gÿÿ] é diagonal, podemos escrever
giÿ = (1 ÿ 2ÿ) ÿ1ÿiÿ (7.20)
e pegue
eu 00 = 12(1 ÿ 2ÿ) ÿ1ÿij(2gj0,0 ÿ g00j), (7.21)
onde mudamos ÿ para j porque ÿi0 é zero. Agora notamos que gj0 ÿ 0 e assim obtemos
i ÿ1 00 = 2
g00,jÿij + 0(ÿ2) (7.22)
= ÿ1 2 (7.23)
(ÿ2ÿ),jÿij.
Com isso, a equação de movimento, Eq. (7.17), torna -se
dpi / dÿ = ÿmÿ,jÿij. (7,24)
Esta é a equação usual na teoria newtoniana, já que a força de um campo gravitacional é ÿmÿÿ. Isso demonstra
que a relatividade geral prevê o movimento kepleriano dos planetas, pelo menos enquanto os efeitos de ordem
superior negligenciados aqui forem pequenos demais para serem medidos.
Veremos que isso é verdade para a maioria dos planetas, mas não para Mercúrio.
Tanto a equação de conservação de energia quanto a equação de movimento foram derivadas como
aproximações baseadas em duas coisas: a métrica era quase a métrica de Minkowski 1) e a velocidade da
gravidade newtoniana
partícula nãoé era
verificada,
relativística
por isso
(p0 é
pi reconfortante
). Esses dois –limites
de fato,
sãoessencial
(|ÿ| apenas
– que
as circunstâncias
recuperamos as emequações
que a
newtonianas. No entanto, não há mágica aqui. Quase teve que funcionar, dado que sabemos que as partículas
caem em linhas retas em quadros de queda livre.
Podemos fazer o mesmo tipo de cálculo para verificar se as equações newtonianas valem para outros
sistemas no limite apropriado. Por exemplo, o aluno tem a oportunidade de fazer isso para o fluido perfeito em
Exer. 5, § 7.6. Observe que a condição de que o fluido seja não relativístico significa não apenas que sua
velocidade é pequena, mas também que as velocidades aleatórias de suas partículas não são relativísticas, o
que significa p ÿ.
Essa correspondência de nosso ponto de vista relativista com a teoria newtoniana mais antiga no limite
apropriado é muito importante. Qualquer nova teoria deve fazer as mesmas previsões que a velha teoria no
regime em que se sabia que a velha teoria estava correta. O princípio da equivalência mais a forma da métrica,
Eq. (7.8), faz isso.
7.3 Uti lização de curvas
Embora no limite apropriado nossa imagem da gravidade no espaço-tempo curvo preveja as mesmas coisas
que a teoria newtoniana prevê, é muito diferente da teoria de Newton em conceito.
Devemos, portanto, trabalhar gradualmente para uma compreensão de seu novo ponto de vista.
A primeira diferença é a ausência de um quadro preferencial. Na física newtoniana e no SR, os

referenciais inerciais são os preferidos. Como a 'velocidade' não pode ser medida localmente, mas a
'aceleração' pode ser, ambas as teorias destacam classes especiais de sistemas de coordenadas para
o espaço-tempo em que as partículas que não têm aceleração física (ou seja, dU /dÿ = 0) também não
2 =/dt
têm aceleração coordenada ( d2xi 0).éEm
inercial
nossa emnova
todos os lugares,
imagem, ou sistema
não há seja, emde
que d2xi / dt Portanto,
coordenadas que =
2 igualdade.
temos que permitir todas as coordenadas em pé de 0 para cadaUsando
partícula
os para a qual
símbolos dedU /dÿ = 0.
Christoffel,
corrigimos quantidades dependentes de coordenadas como d2xi / dt para obter quantidades
2 fato
independentes de coordenadas como dU /dÿ . Portanto, não precisamos, e de desenvolver
não devemos,
formas de
pensar dependentes de coordenadas.
Uma segunda diferença diz respeito à energia e ao momento. Na física newtoniana, SR, e em nossa
teoria da gravidade geométrica, cada partícula tem uma energia e um momento definidos, cujos valores
dependem do referencial em que são avaliados. Nas duas últimas teorias, energia e momento são
componentes de um único vetor p de quatro vetores. . Em SR, o total de quatro momentos
de um sistema é a soma dos quatro momentos de todas as partículas, i p (i). Mas em um
curvo, nãoespaço-tempo
podemos
somar vetores definidos em pontos diferentes, porque não sabemos como: dois vetores só podem ser
ditos paralelos se forem comparados no mesmo ponto, e o valor de um vetor em um ponto para o qual
foi transportado paralelamente depende da curva ao longo da qual foi movido. Portanto, não há uma
maneira invariável de somar todos os p s, e se um sistema tem quatro momentos definíveis, não é
apenas a coisa simples que era em SR.
Acontece que para qualquer sistema cuja extensão espacial seja limitada (isto é, um sistema isolado),
uma energia e um momento totais podem ser definidos, de uma maneira que discutiremos mais adiante.
Uma maneira de ver que a energia de massa total de um sistema não deve ser a soma das energias
das partículas é que isso negligencia o que na linguagem newtoniana é chamado de sua auto-energia
gravitacional, uma quantidade negativa que é o trabalho que ganhamos montando o sistema de
partículas isoladas no infinito. Essa energia, se for incluída, não pode ser atribuída a nenhuma partícula
em particular, mas reside na própria geometria. A noção de energia potencial gravitacional, no entanto,
não está bem definida no novo quadro: ela deve, de alguma forma, representar a diferença entre a
soma das energias das partículas e a massa total do sistema, mas uma vez que a soma das energias
das partículas as energias das partículas não estão bem definidas, nem a energia potencial gravitacional.
Apenas a energia-momento total de um sistema é, em geral, definível, além dos quatro momentos de
partículas individuais.
7.4 Quantidades conservadas
A discussão anterior sobre energia pode nos fazer pensar no que podemos dizer sobre quantidades
conservadas associadas a uma partícula ou sistema. Para uma partícula, devemos perceber que a
gravidade, no antigo ponto de vista, é uma 'força', de modo que a energia cinética e o momento de uma
partícula não precisam ser conservados sob sua ação. Em nosso novo ponto de vista, então, não
podemos esperar encontrar um sistema de coordenadas no qual os componentes de p sejam constantes
ao longo da trajetória de uma partícula. Há uma exceção notável a isso, e é importante o suficiente para
olhar em detalhes.
179 7.4 Quantidades conser vadas
A equação geodésica pode ser escrita para os componentes 'rebaixados' de p como segue
pÿpÿ;ÿ = 0, (7,25)
ou
ÿ
pÿpÿ,ÿ ÿ ÿÿpÿpÿ = 0,
ou
mdpÿ = ÿ
(7.26)
ÿÿpÿpÿ .
dÿ
Agora, o lado direito acaba por ser simples

1
ÿ ÿ
ÿÿpÿpÿ = gÿ (gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ )pÿpÿ
2
1
=
(gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ )gÿ ÿpÿ pÿ
2
1
= (7,27)
(gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ )pÿpÿ.
2
O produto pÿpÿ é simétrico em ÿ e ÿ, enquanto o primeiro e terceiro termos entre parênteses são, juntos,
antissimétricos em ÿ e ÿ. Portanto, eles cancelam, deixando apenas o
meio termo
1
ÿ
ÿÿpÿpÿ = gÿÿ,ÿpÿpÿ. (7,28)
2
A equação geodésica pode assim, em completa generalidade, ser escrita
1
mdpÿ = (7,29)
gÿÿ,ÿpÿpÿ.
dÿ 2
Temos, portanto, o seguinte resultado importante: se todos os componentes gÿÿ são independentes
de xÿ para algum índice fixo ÿ, então pÿ é uma constante ao longo da trajetória de qualquer partícula.
Por exemplo, suponha que temos um campo gravitacional estacionário (isto é, independente do tempo).
Então, um sistema de coordenadas pode ser encontrado em que os componentes métricos são independentes
do tempo, e nesse sistema p0 é conservado. Portanto , p0 (ou, na verdade, ÿp0) é geralmente chamado de
'energia' da partícula, sem a qualificação 'neste quadro'. Observe que as coordenadas
também pode ser encontrado em que a mesma métrica tem componentes dependentes do tempo:
qualquer transformação de coordenadas dependente do tempo do sistema 'nice' fará isso. Na verdade, a maioria
sistemas inerciais locais em queda livre são assim, pois uma partícula em queda livre vê um campo
gravitacional que varia com sua posição e, portanto, com o tempo em seu sistema de coordenadas.
A estrutura em que os componentes métricos são estacionários é especial e é a 'estrutura oratória de
laboratório' usual na Terra. Portanto , p0 neste referencial está relacionado com a energia usual definida
no laboratório, e inclui a energia potencial gravitacional da partícula, como mostraremos agora.
Considere a equação
p · p = ÿm2 = gÿÿpÿpÿ
2 2
= ÿ(1 + 2ÿ)(p0) 2 + (1 ÿ 2ÿ)[(px ) + (pi ) + (pz ) 2], (7.30)
onde usamos a métrica, Eq. (7.8). Isso pode ser resolvido para dar
(p0) 2 = [m2 + (1 ÿ 2ÿ)(p2)](1 + 2ÿ) ÿ1, (7.31)
2
onde, por abreviação, denotamos por p2 a aproximação da + (py) 2 + (pz ) 2. Mantendo-se dentro do
soma (px) |ÿ| 1, |p| m, podemos simplificar isso para
(p0) 2 ÿ m2(1 ÿ 2ÿ + p2/ m2)
ou
p0 ÿ m(1 ÿ ÿ + p2/2m2). (7.32)
Agora abaixamos o índice e obtemos
p0 = g0ÿpÿ = g00p0 = ÿ(1 + 2ÿ)p0, (7,33)
ÿ p0 ÿ m(1 + ÿ + p2/2m2) = m + mÿ + p2/2m. (7,34)
O primeiro termo é a massa de repouso da partícula. A segunda e a terceira são as peças newtonianas
de sua energia: energia potencial gravitacional e energia cinética. Isso significa que a constância de p0
ao longo da trajetória de uma partícula generaliza o conceito newtoniano de energia conservada.
Observe que um campo gravitacional geral não será estacionário em nenhum referencial2, portanto,
nenhuma energia conservada pode ser definida.
De maneira semelhante, se uma métrica é axialmente simétrica, então podem ser encontradas
coordenadas nas quais gÿÿ é independente do ângulo ÿ em torno do eixo. Então pÿ será conservado.
Este é o momento angular da partícula. No limite não relativista temos
pÿ = gÿÿ pÿ ÿ gÿÿm dÿ/dt ÿ mgÿÿ , (7,35)
onde é a velocidade angular da partícula. Agora, para uma métrica quase plana, temos
2 gÿÿ = eÿ · eÿ ÿ r (7,36)
em coordenadas cilíndricas (r, ÿ,z) de modo que a quantidade conservada é
pÿ ÿ mr2 . (7,37)
Esta é a definição newtoniana usual de momento angular.

Tanto para as leis de conservação do movimento das partículas. Considerações semelhantes se
aplicam aos fluidos, uma vez que são apenas grandes coleções de partículas. Mas a situação em relação
à massa total e ao momento de um sistema autogravitante é mais complicada. Acontece que a massa e
o momento de um sistema isolado são conservados, mas devemos adiar qualquer discussão sobre isso
até vermos como eles são definidos.
2 É fácil ver que geralmente não existe um sistema de coordenadas que torne um determinado tempo métrico independente. A
métrica tem dez componentes independentes (o mesmo que uma matriz simétrica 4 × 4), enquanto uma mudança de
coordenadas nos permite introduzir apenas quatro graus de liberdade para mudar os componentes (estas são as quatro funções
xÿ¯ (xÿ)). De fato, é uma métrica especial se todos os dez componentes puderem ser independentes do tempo dessa maneira.
181 7.6 Exercícios
7.5 P ara
A questão de como a curvatura e a física se encaixam é discutida com mais detalhes por Geroch (1978).
As quantidades conservadas são discutidas em detalhes em qualquer um dos textos avançados.
O material deste capítulo é uma preparação para a teoria dos campos quânticos em um espaço-tempo
curvo fixo. Ver Birrell e Davies (1984) e Wald (1994). Isso, por sua vez, leva a uma das áreas mais ativas
da pesquisa gravitacional hoje, a quantização da relatividade geral. Embora não tratemos dessa área neste
livro, os leitores de trabalhos que abordam esse assunto do ponto de partida da relatividade geral clássica
(em contraste com a abordagem do ponto de partida da teoria das cordas) podem querer examinar Rovelli
(2004) Bojowald (2005) e Thiemann (2007).
7.6 Exercícios
1 Se a Eq. (7.3) foram a generalização correta da Eq. (7.1) para um espaço-tempo curvo, como você o
interpretaria? O que aconteceria com o número de partículas em um volume comovente do fluido, com
a evolução do tempo? Em princípio, podemos distinguir experimentalmente entre as Eqs. (7.2) e (7.3)?
2 Para primeira ordem em ÿ, calcule gÿÿ para a Eq. (7.8).

3 Calcule todos os símbolos de Christoffel para a métrica dada pela Eq. (7.8), de primeira ordem em
ÿ. Suponha que ÿ seja uma função geral de t, x, y e z.
4 Verifique se os resultados, Eqs. (7.15) e (7.24), dependiam apenas de g00: a forma de gxx
não os afeta, desde que seja 1 + 0(ÿ).
5 (a) Para um fluido perfeito, verifique se as componentes espaciais da Eq. (7.6) no limite newtoniano
reduz-se a
ÿ,t + (ÿ · ÿ)ÿ + ÿp/ÿ + ÿÿ = 0 (7,38)
para a métrica, Eq. (7.8). Isso é conhecido como equação de Euler para fluxo de fluido não
relativístico em um campo gravitacional. Você precisará usar a Eq. (7.2) para obter este resultado.
(b) Examine o componente de tempo da Eq. (7.6) sob as mesmas premissas, e
interpretar cada termo.
(c) Eq. (7.38) implica que um fluido estático (ÿ = 0) em um campo gravitacional newtoniano estático
obedece a equação de equilíbrio hidrostático
ÿp + ÿÿÿ = 0. (7,39)
Um tensor métrico é dito estático se existirem coordenadas nas quais e0 é semelhante ao tempo,
gi0 = 0 e gÿÿ,0 = 0. Deduza da Eq. (7.6) que um fluido estático (Ui = 0, p,0 = 0, etc.) obedece à
equação relativística de equilíbrio hidrostático
p,i + (ÿ + p) ln(ÿg00) = 0. ,i (7,40)

12
(d) Isso sugere que, pelo menos para situações estáticas, existe uma relação próxima entre g00 e ÿ
exp(2ÿ), onde ÿ é o potencial newtoniano para uma situação física semelhante.
Mostre que a Eq. (7.8) e Exer. 4 são consistentes com isso.
6 Deduza a Eq. (7.25) da Eq. (7.10).
7 Considere as quatro métricas diferentes a seguir, conforme fornecidas por seus elementos de linha:
2
(i) ds2 = ÿdt (ii) + dx2 + dy2 + dz2;
2
ds2 = ÿ(1 ÿ 2M/r) dt + (1 ÿ 2M/r) ÿ1 dr2 + r2(dÿ 2 + sin2 ÿ dÿ2), onde
M é uma constante;
(iii)
2
ÿ a2 sen2 ÿ dt ÿ 2a dt2Mrsin2
dÿ ÿ2 ÿ2ÿ 2
dias =ÿ (r2 +ÿ2
a2)sen2
2 ÿ a2
ÿ dÿ2
sen2
+ ÿ2
ÿ
+ 2 dr + ÿ2 dÿ 2,
onde M e a são constantes e introduzimos a notação abreviada
= r2 ÿ 2Mr + a2, ÿ2 = r2 + a2 cos2 ÿ; + sin2 ÿ

2 onde k é um
R2(t) " (1 ÿ kr2) ÿ1dr2sozinho.
+ r2(dÿ 2 constante e R(t) é umadÿ2)
função
# , arbitrária
(iv) ds2 = de
ÿdtt +
O primeiro já deve estar familiarizado. Encontraremos os outros três em capítulos posteriores.

Seus nomes são, respectivamente, as métricas de Schwarzschild, Kerr e Robertson-Walker.
(a) Para cada métrica, encontre tantos componentes conservados ÿÿ de uma partícula em queda livre
quatro impulsos possíveis.
(b) Use o resultado de Exer. 28, § 6.9 para colocar (i) na forma
2 2 2 = ÿdt + dr
(e) ds + r 2(dÿ 2 + sen2 ÿ dÿ2).
A partir disso, argumentam que (ii) e (iv) são esfericamente simétricas. Isso aumenta o número de
componentes conservados pÿ? (c) Pode-se mostrar que para (i) e (ii)–(iv), uma geodésica que
começa com ÿ = ÿ/2 e pÿ = 0 – ou seja, uma que começa tangente ao plano equatorial – sempre tem ÿ =
ÿ/2 e pÿ = 0. Para os casos (i ), (ii) e (iii), use a equação p · p = ÿm2 para resolver pr em termos de
m, outras quantidades conservadas e funções de posição conhecidas .
(d) Para (iv), a simetria esférica implica que se uma geodésica começa com pÿ = pÿ = 0, estes permanecem
zero. Use isso para mostrar a partir da Eq. (7.29) que quando k = 0, pr é uma quantidade conservada.
8 Suponha que em algum sistema de coordenadas os componentes da métrica gÿÿ sejam

independente de alguma coordenada xÿ.
(a) Mostre que a lei de conservação Tÿ ÿ;ÿ = 0 para qualquer tensor tensão-energia torna-se
1
( ÿ ÿ gTÿ ÿ),ÿ = 0. ÿ ÿ g (7.41)
(b) Suponha que nessas coordenadas Tÿÿ = 0 apenas em alguma região limitada de cada hipersuperfície
espacial x0 = const. Mostre que a Eq. (7.41) implica

FirstCourseGR Pages 1 200

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

FirstCourseGR Pages 1 200

Enviado por

Direitos autorais:

Formatos disponíveis

Machine Translated by Google

Machine Translated by Google

Esta página foi intencionalmente deixada em branco

Um Primeiro Curso de Relatividade Geral

Bernard Schutz é Diretor do Instituto Max Planck de Física Gravitacional, Professor da

CAMBRIDGE UNIVERSITY PRESS

Cambridge University Press

Publicado pela primeira vez em formato impresso 2009

ISBN-13 978-0-511-53995-4 e-book (EBL)

ISBN-13 978-0-521-88705-2 capa dura

Prefácio da segunda edição página xi

1.1 Princípios fundamentais da teoria da relatividade especial (SR) 1.2 1

1.4 Diagramas espaço- 5

temporais 1.5 Construção das coordenadas usadas por outro observador 6

1.10 A lei da composição da velocidade 22

1.11 Paradoxos e intuição física 1.12 Leitura 23

complementar 1.13 Apêndice: O 'paradoxo' 24

gêmeo dissecado 1.14 Exercícios 25

2 Análise vetorial na relatividade especial 33

2.2 Álgebra vetorial 2.3 36

A quatro velocidades 2.4 A 41

3 Análise tensorial na relatividade especial 56

3.5 Métrica como um mapeamento de vetores em uma forma 3.6 68

3.9 Leitura adicional 77

4 fluidos perfeitos na relatividade especial 84

4.4 Poeira novamente: o tensor tensão-energia 4.5 91

4.7 Importância para a relatividade geral 4.8 Lei 104

4.9 Leitura complementar 106

5 Prefácio à curvatura 111

5.1 Sobre a relação da gravitação com a curvatura 5.2 111

Álgebra tensorial em coordenadas polares 5.3 Cálculo 118

tensorial em coordenadas polares 5.4 Símbolos de 125

Christoffel e a métrica 5.5 Bases não coordenadas 131

5.6 Olhando para o futuro 138

5.7 Leitura adicional 5.8 139

6 coletores curvos 142

6.4 Transporte paralelo, geodésica e curvatura 6.5 O tensor 153

6.7 Curvatura em perspectiva 6.8 165

Leitura complementar 6.9 Exercícios 166

7 Física em um espaço-tempo curvo 7.1 A 171

transição da geometria diferencial para a gravidade 7.2 Física em um 171

espaço-tempo levemente curvo 7.3 Intuição curva 175

7.4 Quantidades conservadas 7.5 178

8 As equações de campo de Einstein 8.1 184

Finalidade e justificação das equações de campo 8.2 Equações 184

de Einstein 8.3 Equações de Einstein para campos gravitacionais 187

9 Radiação gravitacional 203

9.1 A propagação de ondas gravitacionais 9.2 A detecção 203

de ondas gravitacionais 9.3 A geração de ondas 213

gravitacionais 9.4 A energia transportada por ondas 227

gravitacionais 9.5 Fontes astrofísicas de ondas gravitacionais Leitura 234

10 soluções esféricas para estrelas 256

10.1 Coordenadas para espaços-tempos esfericamente simétricos 10.2 256

Espaço-tempos esfericamente simétricos estáticos 10.3 Fluido perfeito 258

estático Equações de Einstein 10.4 A geometria exterior 10.5 A 260

estrutura interior da estrela 262

10.7 Estrelas realistas e colapso gravitacional 10.8 Leitura 269

complementar 10.9 Exercícios 276

11 Geometria de Schwarzschild e buracos negros 281

11.1 Trajetórias no espaço-tempo de Schwarzschild 11.2 281

11.4 Buracos negros reais em astronomia 318

11.5 Emissão mecânica quântica de radiação por buracos negros:

Leitura adicional 11.7 Exercícios 327