Você está na página 1de 315

S Í LV I O R .

D A H M E N

F U N D A M E N T O S D A T E O R I A D A R E L AT I V I D A D E

U M A I N T R O D U Ç Ã O À T E O R I A D O E S PA Ç O E D O T E M P O
2

Hypothesen sind Netze, nur der wird fangen, der auswirft.


Hipóteses são redes: só pega algo aquele que as lança.
Novalis (Friedrich v. Hardenberg, 1772-1801)

Dancing with Gravity. © Laurent Taudin, com permissão do autor.


Copyright © 2022 por S.R. Dahmen

s.r. dahmen
instituto de física
ufrgs

Versão de Dezembro 2022


Acerca destas notas de aula

A Teoria da Relatividade sempre exerceu forte fascínio sobre os especialistas e um poder de sedução ainda
maior sobre leigos. A aura que a envolve, mormente a de ser uma teoria de dificílima compreensão e um
campo fértil para os paradoxos é reforçada por algumas estórias. Talvez a mais conhecida seja aquela a
respeito de uma resposta que o físico inglês A.S. Eddington (1882 – 1944), um dos pioneiros da área, teria dado
a um repórter quando perguntado se era verdade que havia apenas três pessoas no mundo que entendiam
a teoria de Einstein. Depois de pensar um pouco, Eddington teria respondido com ironia: “Estou tentando
imaginar quem seria a terceira pessoa ... ”.

Esta aura tem porém um lado reverso: muitas são as tentativas de “provar”, apesar de todo o suporte
experimental à teoria, que Einstein estava errado. Estas teorias são calcadas em grande parte no desconheci-
mento dos experimentos que a comprovam, dos fenômenos que ela descreve, de alguns princípios básicos da
Física e na vã tentativa de oferecer em troca uma teoria mais “intuitiva”, isto é, Newtoniana. Embora este seja
um fenômeno interessante, não é meu intuito aqui tentar entender as raízes psicológicas da não aceitação da
Teoria da Relatividade mas lembrar que estas tentativas não passam por um escrutínio mais rigoroso. Porém,
para que possamos fazer qualquer juízo de valor acerca de teorias alternativas, é necessário dominarmos a
teoria e compreendermos suas consequências e limitações.

O porquê deste livro.


Do ponto de vista prático, a pergunta que deveríamos fazer é o porquê de mais um texto de Relatividade
Especial, quando há tantos livros disponíveis de excelente qualidade. A quantidade de livros mais acessíveis
ou mais especializados é tão grande quão grande são o escopo, a profundidade e a maneira como o tema
é abordado. Aquele que se depara pela primeira vez com esta verdadeira panóplia pode se sentir como se
sentira Dante: “No meio do caminho de nossa vida, encontrei-me em uma selva escura, cuja via reta era para mim
perdida”. Meu objetivo ao preparar estas notas de aula foi o de apontar um caminho em meio a esta profusão
de livros.Estas notas são um apanhado daquilo que julguei ser o melhor das obras por mim consultadas.
Obviamente que a escolha dos temas e o modo como são apresentados refletem em grande medida a minha
visão sobre o assunto e não representam o único caminho, mas antes um dos caminhos possíveis.
Um segundo motivo é o fato que, com os fantásticos avanços da Astrofísica e da Cosmologia das últimas
décadas, a Teoria da Relatividade Geral tornar-se-á em breve – assim ao menos espero – curso obrigatório
dos currículos de Física. Porém é impossível entender a Relatividade Geral sem antes entender aquela
que a precedeu e lhe deu origem, a Relatividade Especial. Foi das considerações de Einstein a respeito da
generalização da sua Teoria Especial para referenciais não inerciais que ele chegou à Teoria Geral. Por isto,
para entender esta última, é imprescindível que entendamos a primeira.
Finalmente, há um motivo de ordem pessoal: eu acredito na importância de disponibilizar as notas de aula
6

na íntegra. Acredito que ao terem meus rascunhos com notas de rodapés, adendos, bibliografia e listas de “to
do’s”, as pessoas interessadas no assunto vejam como o processo de organização e apresentação das idéias é
parte fundamental para o entendimento. Com a pandemia e a mudança das aulas para o regime remoto, vi
uma oportunidade de dar a estas notas um formato mais condizente com as boas práticas letivas, e que de
sobra me permitisse melhorar o texto continuamente à medida que fossem surgindo dúvidas e sugestões.
Assim nasceram estas notas.

Quanto se fala da Teoria da Relatividade de Einstein, a primeira coisa que devemos ter em mente é se estamos
falando da Teoria da Relatividade Restrita ou Especial (TRR ou TRE) ou da Teoria da Relatividade Geral
(TRG). De um modo geral há quatro tipos de livros sobre Relatividade:
(i) livros de TRE mais dedicados à discussão da teoria em si e suas consequências. Normalmente estes livros
mantém a linguagem num nível mais acessível sem introduzir um aparato matemático que posteriormente
se mostra necessário na formulação da TRG (geometria diferencial). Nesta categoria estão os livros de
Christoudolides e Resnick (vide abaixo). Quando o objetivo é adquirir um conhecimento sólida da Teoria
Especial, livros desta linha são na minha opinião os mais indicados. Falta-lhes porém a conexão Instituto
de Física, Universidade Federal do Rio Grande do Sul
90540 – 090 Porto Alegre Brazil
silvio.dahmen@ufrgs.brcom a Teoria Geral e uma visão mais abrangente que permite ao leitor ver a TRG
como desenvolvimento natural da TRE.
(ii) Livros de TRE que lançam mão de um aparato e linguagem matemática que preparam o caminho para a
TRG. Exemplos são os livros de Ugarov e Tsamparlis. Julgo serem livros desta linha os mais apropriados
para um curso de graduação em Física e Astrofísica, mas a consulta aos livros do tipo (i) para complementar
algumas discussões é indispensável.
(iii) Os livros que têm a TRG como conteúdo principal. Em comum eles têm o fato que a TRE é discutida de
forma muito sucinta nos primeiros capítulos. O que os diferencia é basicamente a abordagem matemática
adotada: a apresentação da TRG na forma “index-free” ou a versão com índices. A versão livre de índices
é de grande elegância e se assemelha muito em espírito à introdução da notação de Dirac – os bras e os kets
– da Mecânica Quântica, embora nela falemos de formas multilineares, dualidade de Hodge e assim por diante.
Ela requer um conhecimento prévio de Matemática que acaba representando uma dificuldade a mais para
quem nunca estudou Relatividade Geral. A versão com índices é a do tradicional cálculo tensorial que,
num primeiro estudo, me parece bem mais intuitiva e de fácil compreensão (sem contar o fato que na
versão sem índices, quando temos que fazer alguns cálculos, temos que recorrer ao uso de índices, da
mesma maneira que na Mecânica Quântica, para problema específicos, temos que achar representações de
bras e os kets na forma de polinômios de Hermite no problema do oscilador quântico, apenas para citar um
exemplo).
(iv) Os livros que discutem a TRR e a TGR de maneira detalhada numa mesma obra. Em comum eles têm o
fato que foram os primeiros livros-texto escritos sobre o assunto e muitos de seus autores tiveram contato
direto com Einstein, como é o caso de Max von Laue, um relativista de primeira hora. Além de von
Laue podemos citar Vladimir Fock, Christian Møller, Arthur Eddington (que introduziu a Relatividade ao
mundo anglofônico), Richard C. Tolman e Max Born. A desvantagem destes livros – se é que podemos
assim falar – é uso de uma notação que à época não havia sido ainda convencionada, além da ausência de
alguns resultados novos, pois são livros escrito há mais de 60 anos. Porém, em termos de profundidade e
abrangência, são excelentes. Muitos dos autores são pioneiros e contribuíram de maneira significativa para
nossa compreensão da Relatividade.
7

A abordagem
É um fato que não estamos acostumados a pensar relativisticamente, e tanto a TRE quando a TRG vão
contra nosso senso comum. Deste modo tentei aplicar, didaticamente falando, as ideias que o filósofo e
educador alemão Karl Jaspers usou em sua obra Os grandes filósofos. Jaspers, um dos grandes filósofos do
último século, escreveu sua obra tendo em mente um público leigo mas interessado em entender o que
constitui a filosofia enquanto área do conhecimento, seus métodos e como ela foi sendo paulatinamente
definida e circunscrita no seu escopo. Para atingir seu objetivo Jaspers propugna um método que consiste em
cinco aspectos que o leitor deve ter em mente quando busca adentrar um assunto:

O primeiro é o aspecto histórico: seguindo as indicações cronológicas e geográ-


ficas tento imaginar as diferentes épocas da história. Elas se nos apresentam
com diferentes faces e mudanças insondáveis no modo de pensar. Compreende-
mos pouco suas origens bem como as sempre mutáveis condições da vida dos
pensadores, [condições estas] ditadas pelas circunstâncias naturais e pelo estado
de sua sociedade. As premissas e modos de pensar típicos de uma época se nos
mostram como vestimentas históricas de perguntas imorredouras. O segundo
aspecto é o fatual: volto-me às questões e aos sistemas de pensamento, ouço a
história, quais perguntas foram postas, quais respostas foram encontradas, sem
considerar seu ordenamento temporal. Desta maneira consigo sistematizar aquilo
que se tornou objeto do inquirir filosófico. Em terceiro lugar temos o aspecto
genético: é na mitologia, na religião, na literatura e na língua que encontro a
origem da filosofia, seja em seus primórdios ou em qualquer outra época. A fonte
basilar da filosofia está de certo modo em uma ou outra [destas áreas], da quais
às vezes se aproxima ou contra as quais muitas vezes se posiciona. O quarto
aspecto é o prático: eu consigo ver a materialização da filosofia na prática de
vida, quais consequências ela traz e como é por ela condicionada. Finalmente
temos o aspecto dinâmico: torno-me consciente do espaço de “forças”através das 1
Karl Jaspers, Die Grossen Philosophen, Bd.
quais, pelo ato filosófico, a guerra de ideias ocorre e não se esvai com o tempo. Os
1, R. Piper & Co. Verlag, Munique, 1991.
grandes sistemas unificadores da filosofia nos dão a aparência de uma conclusão, Existe uma tradução desta obra para o
mas a guerra novamente irrompe e se apresenta sob nova forma. Uma vez que eu inglês mas, ao contrário da edição alemã
não consigo chegar a um ponto de vista fora deste embate, vejo-me como parte completa de 968 páginas, a edição em
dele, baseado na maneira como interpreto estas forças e as polêmicas que elas língua inglesa foi dividida em vários vo-
lumes.
suscitam. 1

Guardadas as devidas peculiaridades de cada área do conhecimento, Jaspers propugna a abordagem dos
temas baseadas em cinco fundamentos: o fundamento histórico, ou seja a clara a noção que as questões que
tratamos advém de uma sequência de questionamentos que remontam a um passado longínquo, de visões de
mundo cujas origens estão em grande parte perdidas no passado (o fundamento genético) e que parecem não
ter relação com as questões a nós postas. Com isto surge o fundamento factual: perguntas concretas baseadas
em fatos observados que encontraram respostas dentro de um contexto ditado pelas circunstâncias e meios
disponíveis para os cientistas que com elas se ocuparam em diferentes eras. Isto gerou o desenvolvimento de
um aparato matemático, de um modo de questionamento – em suma, de um modus operandi – que constitui
o fundamento prático da ciência e traz em seu bojo a circunscrição do escopo e metodologia daquilo que
hoje definimos como sendo Física. Além disto, esta dissociação de temas se dá de forma dinâmica, ou
seja, quando imaginos que temos um grande sistema unificador como a Mecânica Clássica que tomamos
como base de toda a Física conhecida, surge uma teoria como a Eletrodinâmica Clássica que traz em seu
bojo resultados que notadamente contrariam fundamentos até então tidos como sólidos. O fundamento
8

dinâmico é essencial a toda ciência, pois ele permite a substituição total ou parcial de teorias pelos surgimento
de novos fatos experimentais. Este embate de forças que, em nosso caso nosso específico, foi a questão
da incompatibilidade das Equações de Maxwell com as transformações de Galileu, levam à ruptura das
amarras da visão newtoniana do espaço e do tempo, lançando as bases de uma nova física. Estes aspectos se
entrelaçam, se digladiam e se auxiliam mutuamente, sendo difícil muitas vezes pensar neles separadamente.
Busquei nestas notas mostrar a Relatividade como um processo de contínuo desenvolvimento dentro da
Física e a passagem entre as versões Especial e Geral como algo orgânico e não extemporâneo. Não devemos
nunca desprezar o desenvolvimento histórico pois, como diz Jaspers, muitas das questões que tentamos
responder dentro da TRE foram já formuladas em passado longínquo, mas vestidas em roupas que muitas
vezes se nos parecem desconhecidas.

Devo aqui expressar meu mais sincero agradecimento a meu amigo H. Hinrichsen que gentilmente me
disponibilizou algumas imagens e com quem pude discutir alguns dos tópicos aqui apresentados. Agradeço
também ao cartunista francês Laurent Taudin por permitir que eu usasse sua gravura no frontispício destas
notas de aula.

O grande orador romano Quintiliano, em sua obra didática De Institutio Oratoria afirmou no livro I, capítulo
V: “Estilo é a personificação de três excelências: correção, lucidez e elegância”, acrescentando, “pois muitos incluem a
importantíssima qualidade de pertinência sob a égide da elegância”. É obrigação de quem escreve um texto tentar
buscar estas quatro virtudes. Ao leitor porém cabe a palavra final se o autor foi bem sucedido na empreitada.

silvio.dahmen@ufrgs.br

Dezembro de 2022.
Literatura

RELATIVIDADE ESPECIAL

1. V. A. Ugarov: The special theory of relativity


Mir publishers, 1st. edition, Moscow, 1978.
Um dos melhores livros para quem está interessado em adquirir uma compreensão profunda e matematicamente
fundamentada da TRE: explicações lúcidas, exemplos claros e cobertura abrangente de mecânica, eletromagnetismo e
óptica. Em termos de estilo e discussão física, ele é semelhante ao livro de A. N. Matveev, outro ótimo exemplo da
escola russa de física. Este livro traz também um apêndice muito interessante escrito por V. L. Ginzburg (1916 - 2009,
prêmio Nobel de Física em 2003) sobre a controvérsia que não teria sido Einstein o “descobridor” da TER. Ugarov
usa dois conjuntos de variáveis espaço-temporais para o espaço de Minkowski – ( x0 = ct, x1 = x, x2 = y, x3 = z) e
( x1 = x, x2 = y, x3 = z, x4 = ict) – tomando o cuidado de apresentar as equações destes dois conjuntos lado a lado.
A edição em lingua francesa do livro, mais antiga, não é tão completa como a versão em inglês. Nível médio a avançado.

2. C. Christoudolides: The special theory of relativity: foundations, theory, Verification, Applications


Undergraduate Lecture Notes in Physics Series (Springer Verlag, Heidelberg, 2016).
Tradução do grego para o inglês das notas de aula do curso de Relatividade Restrita que Christoudolides lecionou
durante muitos anos na Universidade Técnica Nacional de Atenas, originalmente para estudantes de engenharia
e porteriormente para os de física. Um livro excelente que se destaca pela abrangência dos temas discutidos, dos
experimentos fundamentais e por aplicações mais modernas da Relatividade. Sem dúvida um dos melhores livros
sobre o assunto atualmente disponíveis e inspirado em grande medida na obra de Ugarov. Nivel médio a avançado.

3. M. Tsamparlis Special Relativity: an Introduction with 200 Problems and Solutions


Springer Verlag, 2010.
Um dos melhores livros disponíveis sobre o assunto, com forte inspiração nas duas obras acima. Com uma abordagem
matemática mais moderna, traz uma discussão aprofundada de conceitos e leis básicas da mecânica newtoniana, para
então discutir as modificações trazidas pela Relatividade de Einstein. O livro introduz inicialmente todo o aparato
matemático e deduz as transformações de Lorentz usando as propriedades de transformação de espaços lineares para
depois discutir, na segunda parte da obra, a física. Traz mais de 200 problemas propostos e suas soluções. Nível médio
a avançado.

4. Ya. P. Terletskii: Paradoxes in the theory or relativity


Plenum Press, New York, 1968.
Esta pequena jóia do físico russo Yakov Terletskii (1912 – 1993) explora com profundidade e clareza paradoxos da
Teoria da Relatividade, bem como introduz o assunto de maneira clara e concisa. A introdução das transformações de
Lorentz enquanto resultado das simetrias do espaço é primorosa. Infelizmente é um livro pouco conhecido. Nível
médio.
10

5. A. N. Matveev: Mechanics and Theory of Relativity


Mir publishers, 1st. edition, Moscow, 1989.
O físico russo A. N. Matveev (1922 - 1994) escreveu aqueles que, para mim, estão entre os melhores livros de física
básica já escritos. Este livro em particular faz parte de uma coleção de 4 obras, as outras sendo Electricity and Magnetism,
Optics e Molecular Physics. Um quinto volume sobre a Mecânica Quântica infelizmente não chegou a ser escrito devido
à morte do autor. Este livro traz muitos problemas e perguntas que vão ao ponto nevrálgico dos fundamentos. Trata-se,
como o título diz, de um livro de Mecânica, mas inclui a mecânica relativística de maneira orgânica e com excelentes
discussões. Nível médio.

RELATIVIDADE GERAL

6. L. Landau e E. Lifshitz, Field Theory (Teoria de Campos), vol. II


Pergamon Press, 1985.
Obra prima da série do Minimum Teoricum dos dois grandes físicos russos. Famoso pela clareza e economia de palavras,
os autores vão direto ao ponto sem muitos rodeios. Como reza a lenda, se formos sublinhar as partes importantes do
livro, é preciso sublinhar o texto todo. Nível avançado.

7. Ø. Grøn e A. Næss: Einstein’s Theory: A Rigorous Introduction for the Mathematically Untrained
Springer, New York, 2011.
Um dos livros mais admiráveis pela tentativa (bem sucedida!) de explicar Relatividade Geral para quem ainda não
sabe o que são vetores e derivadas. A abordagem se justifica pelo fato que Næss era filósofo e se propôs a aprender a
Teoria de Einstein a partir do zero com a ajuda de Grøn. Esta obra é resultado deste esforço. Nivel básico a médio,
com alguns tópicos em nível mais avançado.

8. Ø. Grøn e S. Hervik: Einstein’s General Theory of Relativity with Applications in Cosmology


Springer, New York, 2007.
Um dos melhores textos sobre Relatividade Geral disponível, com uma boa introdução à Teoria Especial. Muitas
das passaens matemáticas são melhor compreendidas se tivermos também o livro que Grøn e Næss para consulta.
Linguagem matemática moderna, nível avançado.

9. T. Fließbach: Allgemeine Relativitätstheorie


Spektrum Akademischer Verlag (Elsevier), München, 2006.
Este livro faz parte de uma série em física teórica escrita pelo físico alemão Thorsten Fließbach. Um excelente livro, com
resultados atualizados. Uma das características deste livro é de ser bastante sucinto e toda a matéria é apresentada de
modo compacto. Inspirado no livro de Weinberg, pode ser visto como um Weinberg “enxuto” mas bastante atualizado,
posto que o livro de Weinberg foi escrito há quase 50 anos. Nível avançado.

10. S. Weinberg, Gravitation and Cosmology


John Wiley & Sons, 1972.
Um clássico da Relatividade Geral difícil de ser superado. Weinberg tem sua maneira única de abordar o assunto
(aliás qualquer assunto). Uma obra excelente, onde a todo instante a teoria é comparada a resultados observacionais
conhecidos até a data em que a obra foi escrita. Weinberg não se intimida em apresentar os detalhes mais intricados
das deduções matemáticas, coisa que muitos livros do assunto não fazem. Nível avançado.
11

11. H. Stephani, General Relativity: An introduction to the theory of the gravitational field
Cambridge University Press, Cambridge, 1982.
Um clássico escrito por um dos líderes da famosa escola de relativistas da Universidade de Jena, na Alemanha.
Discussões claras e nota-se claramente a filosofia de deixar para o leitor muitas das deduções para que assim entenda
o que está fazendo. Pressupõe um bom conhecimento de física e matemática. Nível avançado.

12. E. Rebhahn, Theoretische Physik: Relativitätstheorie und Kosmologie


Springer Verlag, Berlin, 2012.
Eckhard Rebhahn lecionou Relatividade Geral durante muitos anos na Universidade de Düsseldorf e este livro é o
resultado destes anos dedicados ao ensino da teoria. Um excelente livro, muito completo, com resultados modernos,
deduções claras e ótimas discussões. É um dos poucos textos de Relatividade Geral mais modernos que dedica longos
capítulos à Teoria Especial, discutindo vários paradoxos. Infelizmente, como o livro de Fließbach, não existe tradução
deste livro para outros línguas, o que dificulta o acesso para aqueles que não lêem alemão. Nível avançado.

OUTRAS OBRAS

13. C. Møller: The Theory of Relativity


Oxford University Press, 1952.
Este livro é o resultado de mais de 20 anos lecionando Teoria da Relatividade na Københavns Universitet. A introdução
a respeito dos experimentos fundamentais da óptica e sua relação com a teoria de Einstein está entre as mais detalhadas
que pode ser encontrada em qualquer livro sobre o assunto. Escrito em uma época em que não havia ainda livros
apenas voltados para a Relatividade Geral, o livro trata a teoria com uma profundidade inaudita. Este pioneirismo
porém se reflete na notação um pouco ultrapassada quando comparada aos livros mais modernos e na falta de
ilustrações que facilitem a compreensão. É uma obra que requer um conhecimento sólido de física e matemática de
seus leitores, mas o esforço é compensado pela profundidade com que Møller discute certos tópicos. Um dos destaques
é uma discussão detalhada do paradoxo dos gêmeos na Relatividade Geral.

14. R. Resnick: Introduction to Special Relativity


John Wiley & Sons Inc, New Yokr, 1968.
O livro de Resnick mantém a discussão em um nível acessível, concentrando-se nas consequências da Teoria da
Relatividade e na reformulação de alguns conceitos fundamentais da mecânica. Um destaque são os exercícios
propostos, que vão diretamente ao cerne dos problemas. Um ótimo livro para iniciantes. Existe uma tradução para o
português de Shigeo Watanabe e publicada em 1971 pela EDUSP em parceria com a Editora Polígono. Nível básico.

15. M. Born: Die Relativitätstheorie Einsteins


Springer Verlag, 2006.
Max Born (1882 - 1970, prêmio Nobel de Física 1954) escreveu este excelente livro em 1920 tendo como público-alvo
pessoas com formação em ensino médio apenas. Há uma edição em inglês do livro, pela editora Dover, mas a edição
alemã moderna foi atualizada por dois pesquisadores atuantes na área com resultados mais recentes de cosmologia. O
interessante deste livro é ver como muitas explicações hoje encontradas em livros mais modernos sobre o assunto
foram inspiradas no pioneirismo de Born ao tentar escrever um texto acessível. Nível médio.

16. M. von Laue, Die Relativitätstheorie


Vieweg, 1953.
Max von Laue foi, discípulo Max Planck, escreveu o primeiro livro-texto de relatividade restrita, publicado em 1911.
O segundo volume, sobre relatividade geral, veio ao prelo em 1921. Nível avançado, notação muitas vezes difícil de
acompanhar mas pelo convívio do autor com Einstein, de quem era amigo, um texto que traz discussões profundas
12

que refletem a interação entre os dois. Nível avançado.

17. A. Einstein e outros: The Principle of Relativity


Dover Publications, 1952.
Trata-se de uma coletânea dos artigos originais de Einstein, Lorentz, Weyl e Minkowski sobre a Teoria Especial e Geral.
Há uma versão quase idêntica em Português, da editora Calouste Gubelkian (Portugal). Excelentes artigos mas que só
podem ser apreciados por aqueles que já dominam as duas teorias.

18. V. Petkov: Relativity and the Nature of Spacetime


Springer Verlag, 2005. The frontiers collection.
Vesselin Petkov tem formação em física e filosofia, e expõe nesta obra uma série de Gedankenexperimente com o objetivo
de esclarecer os fundamentos geometrodinâmicos da teoria da relatividade, sob um olhar filosófico, mas sem perder
de vista a matemática. Nele o autor defende seu ponto de vista sobre a teoria do block universe) e suas implicações. Um
livro para quem já tem um conhecimento de TER. Nível médio.

19. L. D. Landau e Yu. B. Rumer: O que é a teoria da Relatividade


Editora Mir, Moscou, 1980.
Este pequeno mas fascinante livro, uma verdadeira pérola, é o exemplo acabado daquilo que um livro para leigos
pode se tornar quando um físico da estatura de um Landau (1908 - 1968, prêmio Nobel de Física 1962) e Yuri B. Rumer
(1901 - 1985) se dedicam à tarefa de explicar física de maneira direta e simples. Nível básico.

20. H.-J. Treder: Relativität und Kosmos: Raum und Zeit Physik, Astronomie und Kosmologie
Akademie Verlag, Berlin, 1968.
Hans-Jürgen Treder (1928 - 2006) era considerado o maior físico teórico da antiga Alemanha Oriental. Sua área de
pesquisa era Relatividade e Cosmologia e, além de livros, monografias e artigos para especialistas, ele escreveu livros
sobre filosofia e história da ciência, com particular ênfase na sua área de atuação. Este livro, como diz o título, é acerca
dos conceitos de tempo e espaço deste Aristóteles até Einstein. Nível médio a avançado.

21. H.-J. Treder: Elementare Kosmologie


Akademie Verlag, Berlin, 1975.
Neste livro Treder aborda os modelos do Cosmos, começando pelos gregos, até os modelos que surgiram dos estudos
da Relatividade Geral. Nível médio a avançado.

Outros livros e artigos científicos consultados são citados ao longo do texto nos locais apropriados.
Sumário

1 Quem precisa de uma Teoria da Relatividade? 17


1.1 A estrutura do espaço-tempo em Aristóteles 20
1.2 A estrutura do espaço-tempo em Newton 23
1.3 A Relatividade do movimento na Mecânica de Newton 27

2 Referenciais e a Relatividade. 39
2.1 Referenciais inerciais 39
2.2 A Terra enquanto referencial inercial 40
2.3 A mecânica de Newton enquanto teoria relativística: transformações de Galileu 41
2.4 A eletrodinâmica de Maxwell enquanto teoria relativística: transformações de Lorentz 43
2.5 Dedução 1: transformações de Lorentz segundo Lorentz 48
2.6 Dedução 2: transformações de Lorentz enquanto simetria do espaço-tempo 51
2.7 Dedução 3: transformações de Lorentz e a constância da velocidade da luz 59
2.8 As transformações de Lorentz com velocidade árbitrária 60
2.9 As transformações de Lorentz com rotação 60
2.10 A velocidade e a aceleração relativísticas 64

3 Efeitos geométricos 69
3.1 A contração de Lorentz–FitzGerald e a dilatação do tempo 70
3.2 O problema da medida da barra 73
3.3 O tempo próprio 76
3.4 Os muons e a dilatação do tempo. 77
3.5 A classificação de intervalos espaço-temporais
e o princípio da causalidade 79
14

4 O efeito Doppler 85
4.1 O efeito Doppler relativístico 85
4.2 O efeito Doppler como consequência da invariância da fase de uma onda 91

5 Paradoxos 95
5.1 Realidade e Intuição Física 95
5.2 O paradoxo dos gêmeos ou dos relógios 95

6 A Mecânica Relativística I: massa e momentum 101


6.1 Ernst Mach e o conceito de massa 102
6.2 A massa na relatividade restrita 104
6.3 A colisão entre partículas idênticas A e B 104
6.4 O momentum relativístico 106
6.5 O que é massa? 107
6.6 A massa como medida de efeitos cinéticos 108
6.7 Massa e a energia 110
6.8 Seriam massa e energia equivalentes? 115
6.9 Energia a partir da massa 117

7 A Mecânica Relativística II: Exemplos 121


7.1 Movimento unidimensional sob F constante 121
7.2 Movimento de uma partícula carregada em um campo elétrico E uniforme: o caso bidimensi-
onal 123
7.3 Movimento de uma partícula carregada em um campo magnético B uniforme 125
7.4 O foguete relativístico 126

8 Tensores II: propriedades 135

9 Quadrivetores 139
9.1 A quadrivelocidade 141
15

10 A eletrodinâmica e a relatividade 145


10.1 A invariância da carga elétrica 146
10.2 O campo magnético enquanto efeito relativístico do campo elétrico e vice-versa 147
10.3 As equações de Maxwell, o quadripotencial e a quadricorrente 151
10.4 O tensor de campo eletromagnético 157
10.5 As equações de Maxwell em termos dos Fij 160
10.6 Um outro caminho possível 162

11 O tensor energia-momento e
o tensor das tensões de Maxwell 165
11.1 O vetor de Poynting e a conservação de energia 165
11.2 A conservação de momento para campos e partículas 167
11.3 A versão quadridimensional: o tensor energia-momento 173
11.4 O tensor das tensões na mecânica e sua interpretação física 177

12 Prolegômenos à Teoria da Gravitação:


sobre Einstein e Espaços Curvos 181
12.1 Os símbolos de Christoffel 183
12.2 Derivadas covariantes 192
12.3 Física em nova roupagem 196

13 Em busca de uma teoria relativística da gravidade 201


13.1 Revisitando espaços curvos 203
13.2 O espaço-tempo enquanto variedade 206
13.3 A curvatura 212
13.4 Equações de Campo de Einstein 218

14 Schwarzschild: nosso sistema solar 221


14.1 A métrica de Schwarzschild 221
16

15 O modelo-padrão do Universo: o universo de Friedmann, Lemaître, Robertson e


Walker 249
15.1 O modelo 251
15.2 Cosmologia: para onde vamos? Qual a estratégia? 258

A Experimentos fundamentais da história da Teoria da Relatividade Especial 269


A.1 Rømer e a velocidade da luz 270
A.2 O experimento de Michelson e Morley 273
A.3 O espalhamento de fótons 279
A.4 A reflexão da luz num espelho em movimento 282
A.5 A reflexão da luz pelo princípio de Huygens–Fresnel 284

B O tempo e espaço na Crítica da Razão Pura de Kant 289


B.1 A obra e seus objetivos 289
B.2 Breve histórico da obra. 290
B.3 Dos juízos. 292
B.4 A estética transcendental: o tempo e o espaço enquanto juízos sintéticos a priori 295

C Datas importantes 299

D O paradoxo dos gêmeos ou dos relógios


na Teoria da Relatividade Geral 305
D.1 Realidade e Intuição Física 305
D.2 O paradoxo dos gêmeos ou dos relógios na TRE 305
D.3 O paradoxo dos gêmeos na Relatividade Geral 310

Referências Bibliográficas 313


1
Quem precisa de uma Teoria da Relatividade?

There was a young lady named Bright


Whose speed was far faster than light
She started one day
In a relative way
And returned on the previous night.
(A.H. R. Buller, Punch, 19.12.1923)

Grande parte dos fenômenos estudados pela Física requerem um con-


junto de variáveis espaciais e temporais (coordenadas) para sua descrição.
Mesmo uma área da Física como a Termodinâmica, onde coordena-
das não fazem parte do conjunto de variáveis necessárias à descrição
dos fenômenos, os processos por ela estudados ocorrem ainda assim
em uma região espacialmente circunscrita e temporalmente limitada
(sistemas isolados). Não apenas isto: boa parte das leis da Física são
expressas em termos de equações diferenciais nas coordenadas. O
tempo e o espaço formam desta maneira o pano de fundo, a tecitura
sobre a qual todos fenômenos naturais acontecem. Eles têm existência
própria e não afetados pelos fenômenos que descrevem, algo diferente
da Relatividade Geral, onde o conteúdo de massa e energia de uma
região finita do espaço-tempo define a métrica localmente. Por isto, na
Teoria da Relatividade, referimo-nos constantemente a um evento, que
nada mais é que um conjunto de variáveis (t, x, y, z) = ( x0 , x1 , x2 , x3 )
que representam o intante de tempo t e ponto do espaço r onde um
processo físico que queremos descrever esteja acontecendo 1 . 1
Na realidade pontos no espaço e no
A escolha das coordenadas é normalmente ditada pelas condições do tempo são abstrações pois os fenômenos
ocorrem numa região finita do espaço e
problema que queremos estudar, por uma questão de conveniência. Elas num intervalo finito de tempo. Porém,
são meras representações, etiquetas que podem ser trocadas à vontade para efeitos de cálculo, estas abstrações
se mostram extremamente úteis.
na descrição do fenômeno, não mudando porém seu caráter,isto é o
conteúdo físico da teoria. No entanto, distâncias entre pontos no espaço
18 uma introdução à teoria do espaço e do tempo

e intervalos de tempo têm conteúdo físico, pois refletem diretamente as


propriedades métricas do espaço no qual são definidas. Neste sentido
podemos afirmar que

a Física é a ciência que se ocupa com a descrição de fenômenos natu-


rais, da sua dependência nas variáveis que os caracterizam – espaço-
temporais ou não – e nas relações funcionais entre estas 2 . 2
Etimologicamente a palavra física vem
do grego antigo ϕυσικη = physiké = co-
Porém, independente da representação que escolhamos, ela deve re- nhecimento da natureza (ϕυσις = physis
= natureza).
fletir um fato importante: as leis da Física não devem depender do
conjunto de coordenadas escolhidas, o que significa dizer que se nosso
laboratório se encontra no alto de uma montanha ou à beira-mar, ou
se realizamos um experimento hoje ou daqui a uma semana, é de se
esperar que os resultados de um experimento sejam os mesmos, desde
que as condições iniciais e de contorno sejam as mesmas. A experiência
também nos mostra que se nos encontrarmos dentro de um avião que
se move a velocidade constante não veremos uma física diferente daquela
que vemos quando parados. Isso significa que as propriedades de
invariância das leis da Física estão intrinsicamente relacionadas às pro-
priedades de simetria do espaço e do tempo, e as equações matemáticas
que as descrevem devem refletir esta invariância. Como diferentes refe-
renciais são representados por diferentes coordenadas, as propriedades
de transformação das coordenadas devem trazer em si as propriedades
de simetria do espaço-tempo subjacente 3 . Feitas estas observações 3
Embora a idéia de espaço-tempo como
podemos dizer que palco da física tenha sido introduzida por
Minkowski, ao invés de termos um es-
paço e um tempo separadamente como
a Teoria da Relatividade é a teoria que estabelece a relação entre inter- na física clássica, usaremos o termo in-
valos de espaço e de tempo medidos em diferentes referenciais inerciais e distintamente nestas notas de aula. A
diferença ficará clara pelo contexto.
suas consequências na Física.

A Teoria da Relatividade Galileu e a Teoria da Relatividade Especial


de Einstein têm portanto como objetivo principal definir as regras de
transformação entre intervalos medidos por diferentes observadores
inerciais, incorporando matematicamente estas propriedades nas leis
da Física de tal maneira que as mesmas sejam covariantes. O que
diferencia as duas, conceitualmente falando, é que a Relatividade de
Einstein traz um ingrediente físico a mais: a universalidade da veloci-
dade da luz c, cujo valor de 299 792 458 m/s é o mesmo para todos os
referenciais inerciais, e consequentemente independe da velocidade da
fonte que a produz. Há um outro ponto muitíssimo importante neste
novo ingrediente físico: ao introduzir a luz na teoria estamos imedi-
atamente trazendo para dentro da Relatividade a Eletrodinâmica de
Maxwell. Na realidade a Eletrodinâmica já nasceu relativística, uma vez
que é naturalmente invariante pelas Transformações da Relatividade
Einstein – as chamadas Transformações de Lorentz – e foi na verdade

© s.r. dahmen 2022


quem precisa de uma teoria da relatividade? 19

a Mecânica que teve que ser compatibilizada para se tornar também


relativisticamente invariante 4 . As consequências disto são profundas, 4
Historicamente foi a incompatibilidade
pois elas mudaram totalmente nossas concepções a respeito da relação da Relatividade de Galileu com a Eletro-
dinâmica de Maxwell com que colocou
entre distâncias e intervalos vistos por diferentes observadores inerci- os físicos no caminho da Relatividade de
ais, definindo portanto as simetrias subjacentes do espaço-tempo. Um Einstein. Isto explica o grande número
de experimentos ópticos que foram fun-
exemplo simples, apresentado abaixo, já nos dá uma idéia de como isto damentais no estabelecimento da Relati-
acontece. Observe que embora a idéia abaixo esteja correta, a maneira vidade.
como ela foi implementada está errada e portanto o cálculo abaixo é
apenas ilustrativo (antes de ler a explicação que vem logo a seguir, tente
imaginar onde este erro possa estar).

Imaginemos dois referenciais inerciais A e B, cujos eixos x coincidam, e que se


movem com velocidade relativa constante entre si de 100 000 km/s na direção
do eixo x positivo. Os eixos y e z destes referenciais apontam na mesma direção.
Vamos supor que o referencial A esteja “parado” enquanto o referencial B é
quem se move. No instante t = 0 suas origens coincidem e quando isto ocorre,
um pulso de luz é emitido na direção de um anteparo que se encontra em
x A = 300 000 km medido a partir da origem O A do eixo x. Passado 1 segundo,
um observador em O A verá a luz atingindo o anteparo. Disto ele conclui que a
velocidade da luz vale 5 5
Estamos arredondando a velocidade c
simplesmente para facilitar os cálculos.
∆ xA 300 000 km
cA = = . (1.1)
∆ tA 1s
Passado 1 segundo, segundo a mecânica Newtoniana, o observador em OB se
encontrará no marco x A = 100 000 km. Um cálculo simples nos diria que a luz,
no referencial B, teria atingido o marco x B = 200 000 km (para este observador
é como se ele estivesse parado e o anteparo se aproximasse da origem de seu
referencial inercial com uma velocidade −100 000 km/s). Se o observador B
aceita que a velocidade da luz seja uma constante universal, então ele será
obrigado a concluir que
∆ xB 200 000 km
c B = c A = 300 000 km/s = = −→ ∆ t B = 0.66 s. (1.2)
∆ tB ∆ tB
Portanto, sua conclusão seria que os intervalos temporais ∆ t A e ∆ t B para a
mesma sequência de eventos físicos – a emissão do feixe e sua chegada ao
anteparo – são diferentes e dependem do estado de movimento do observador!

Embora aceitemos que intervalo temporal tenha que mudar para “aco-
modar” os dois fatos – que as distâncias percorridas sejam diferentes
mas c continue igual nos dois referenciais – o cálculo acima está errado.
O erro está em termos usado a relatividade Newtoniana (Transformação
de Galileu) para tentar acomodar um fato experimental (universalidade
de c) dentro de uma estrutura de espaço e tempo que não o comporta.
Nossa dificuldade em conciliar estes fatos vem da ideia que fazemos da
estrutura espaço-temporal como algo dado e independente do estado de
movimento dos corpos - não é sem motivo que Kant chama os conceitos
de espaço e tempo da mecânica Newtoniana de juízos a priori e parte
deles para tentar fundamentar uma Filosofia (Crítica da Razão Pura)

© s.r. dahmen 2022


20 uma introdução à teoria do espaço e do tempo

nos moldes da Física e Matemática. Sem nos darmos conta, estamos


assumindo no cálculo acima a simultaneidade absoluta dos eventos,
ou seja, de um tempo absoluto externo aos fenômenos: neste caso a
chegada do sinal ao anteparo no mesmo instante de tempo t A = t B . Se-
gundo Newton isto se deve à existência de um relógio universal com o
qual todos os fenômenos podem ser registrados. Esta é uma das pedras
fundamentais da teoria Newtoniana e uma a qual estamos tão acostu-
mados que nem mesmo a questionamos. A Relatividade de Einstein
derrubou este ponto basilar da estrutura newtoniana. Uma maneira de
tentarmos compatibilizar a equivalência dos referenciais inerciais com
a constância da velocidade da luz é puramente matemática: definir as
transformações matemáticas mais gerais possíveis que mapeiam retas
em retas. Veremos no próximo capítulo como fazer isso. Embora esta
abordagem nos leve aos resultados corretos, desde que partamos das
premissas físicas corretas, elas muitas vezes obliteram nossa vista para o
verdadeiro sentido das teorias físicas e da sua construção. Neste caso,
se adotarmos um ponto de vista estritamente utilitarista, epitomizado
no famoso “shut up and calculate!” deixamos de entender que são as
leis fundamentais da dinâmica que determinam a estrutura do espaço
e do tempo e não o contrário. Mas para melhor entendermos isto
olhemos mais atentamente para a história das idéias sobre a estrutura
do espaço tempo que as leis do movimento determinam, começando
por Aristóteles e indo até Newton. Isto nos ajuda a entender melhor a
Relatividade de Einstein.

1.1 A estrutura do espaço-tempo em Aristóteles

Entre os muitos legados que recebemos dos gregos, e em particular de


Aristóteles, está uma primeira tentativa de uma ciência do movimento 6
A visão Aristoteliana e Platônica exer-
baseada em causas primeiras, isto é uma fundamentação do porquê o ceu enorme influência sobre a maneira
movimento ocorre 6 . Um dos entraves para que os gregos conseguissem de fazer ciência nas universidades do oci-
dente, definindo os currículos até mea-
desenvolver uma teoria que tivesse valor prático era a questão da dos do século XVI. O assim chamado Mé-
divisibilidade infinita do espaço e tempo, problema este epitomizado todo Escolástico, ou simplesmente Esco-
lástica, é na verdade uma série de regras
pelo famoso paradoxo de Zenão de Eléia (Zeno’s paradox). Isto por si
de como fazer ciência e filosofia do que
só seria assunto para um capítulo à parte, mas concentremo-nos aqui na basicamente uma teoria filosófica em si.
estrutura que a dinâmica aristoteliana impõe sobre o espaço e o tempo. Ela preconiza o ensino das 7 artes, divi-
didas num Trivium (Gramática, Retórica,
É importante notar que a discussão que segue é baseada na aplicação Lógica) e num Quadrivium (Aritmética,
de conceitos modernos às ideias de Aristóteles, pois Aristóteles não Geometria, Astronomia, Música). A Esco-
lástica tem um acento notadamente cris-
dispunha da Matemática adequada. A 1ª Lei formulada por Aristóteles
tão pois surgiu da necessidade de combi-
é aquela que determina a relação entre movimento e sua causa: nar o método da filosofia grega às exigên-
cias da fé dominante do mundo ociden-
Se um corpo se encontra em movimento, ele necessariamente está sendo tal e por isto seu nome está fortemente
associado a nomes de religiosos como To-
mantido em movimento por uma causa. más de Aquino (1225 - 1274) e William of
Ockham (1285 - 1347)– da famosa Nava-
Notemos que Aristóteles simplesmente diz que se há movimento, há lha de Ockham ou Occam – entre tantos
outros.
© s.r. dahmen 2022
quem precisa de uma teoria da relatividade? 21

algo que deve estar agindo para manter o movimento. Se nos ba-
seássemos em Aristóteles concluiríamos que mesmo a um movimento
retilíneo uniforme deve estar associada uma força. O mais importante
é que esta lei implica na existência de um repouso absoluto pois se não
há “causa”, não há movimento. Além disso Aristóteles diz 7 : 7
Aristotle, The Physics, Loeb Classical Li-
brary vol. I, W. Heinemann Ltd, London,
Seja A o agente causador do movimento, B o objeto que se move, C 1957, 249b - 250a.

a distância percorrida e D o tempo dispendido. Então A mover-se-á


1/2 B por uma distância 2C no tempo D, e A mover-se-á 1/2 B por uma
distância C no tempo 1/2 D, pois só assim a proporção será observada.

Podemos interpretar esta afirmação de Aristóteles 8 como dizendo que 8


D. J. Raine and M. Heller, The Science
a F = mv, ou seja, o equivalente Aristoteliano da 2ª Lei de Newton F = of Space-Time, Pachart Publishing House,
Tucson, 1981, p. 9.
ma. Notem que ela corrobora a 1ª Lei pois se v = 0, F = 0, em flagrante
constraste com Newton, para quem F = 0 não necessariamente implica
em v = 0. O que é importante notar é que a 2ª Lei de Aristóteles não
torna a 1ª redundante, pois a 1ª define uma estrutura de espaço-tempo
que dá sentido à 2ª. Vejamos o porquê.
Não basta a Aristóteles dizer que existe um estado de repouso ab-
soluto: é preciso também identificá-lo, caso constrário a teoria não 9
A idéia da Terra como o centro do Uni-
verso é na verdade um precursor do cha-
tem valor prático. Para Aristóteles todo o movimento deve ser enten-
mado “Princípio Cosmológico” que tem
dido como movimento em relação à Terra, que passa a ser o centro do um importante papel na Cosmologia mo-
Universo, imóvel. Repouso significa repouso em relação à Terra 9 . derna. O Princípio Cosmológico prega
que todas as posições e direções no Uni-
Comecemos então pela idéia de trajetória de uma partícula. Ela não verso são equivalentes, não havendo um
será aqui representada por curvas no R3 parametrizadas por um tempo ponto de observação privilegiado. Assim
estrutura do Universo que observarmos
t mas como trajetórias no R4 parametrizadas por λ. Estas trajetórias
é semelhante àquela observada de qual-
são chamadas em Relatividade de linhas de mundo (worldlines) da par- quer outro local do Universo.
tícula . Esta maneira de representar uma trajetória no espaço-tempo
é particularmente útil na Relatividade Geral, onde trabalhamos num
espaço quadridimensional curvo e a interpretação do real significado
físico do parâmetro t não é tão direta como na física clássica. No caso 10
Uma variedade n-dimensional M é um
espaço métrico no qual ∀ P ∈ M existe
da parametrização por uma variável λ, não precisamos atribuir um uma vizinhança U ⊂ M homeomórfica
sentido físico específico à variável, desde que ela descreve corretamente a um domínio V do espaço Euclideano
o movimento. Rn . Em outras palavras, uma variedade
M é um espaço no qual a vizinhança de
Olhemos agora o que podemos depreender a respeito da variedade qualquer ponto P pode ser aproximada
M = R4 a partir das Física Aristoteliana 10 . por um espaço Euclideano da mesma di-
mensão de M. Ou, se preferirmos, a va-
O fato de sabermos que o espaço-tempo Aristoteliano é o R4 obvia- riedade é um espaço topológico que é
mente não nos diz muito acerca da sua estrutura. Para determiná-la aproximadamente Euclideano nas imedi-
notemos em primeiro lugar que a 2ª Lei requer a existência de um ações de qualquer ponto. Este conceito
é de fundamental importância na Rela-
tempo absoluto, pois se escolhessemos um outro tempo τ = τ (t), tividade Geral na forma das variedades
teríamos11 Riemannianas, isto é espaços topológi-
cos que possuem uma métrica (produto
dx dx dτ dx interno) positiva definida. O termo foi
v= = 6= (1.3) introduzido por Riemann, que o chamou
dt dτ dt dτ
de Mannigfaltigkeit. O termo em inglês é
manifold.
e portanto dx/dt é diferente de dx/dτ a menos que dτ/dt = 1. Isso
11
Raine and Heller, op. cit. p. 12.
© s.r. dahmen 2022
22 uma introdução à teoria do espaço e do tempo

implica que a única transformação possível é da forma

τ = t + to (1.4)

que corresponde à liberdade de começarmos a medir o tempo a partir


de um evento arbitrário. Na verdade poderíamos também definir uma
mudança de unidade na forma

τ = kt (1.5)

desde que redefinamos a unidade de força. Isto seria equivalente à


definirmos a unidade de tempo diferente de segundos, por exemplo.
O que importa é que concluimos que as Leis fixam o tempo como
sendo único, afinal só uma mudança da origem da contagem de tempo
e de sua escala é compatível com elas. Portanto, a cada evento está
associado um tempo bem definido. Em linguagem matemática, isto
significa que há uma projeção Π T : M → T que leva todo ponto da
variedade M a um único ponto do eixo temporal T = R. Uma vez que
o eixo temporal é “selecionado”, as coordenadas espaciais em M não
estão no mesmo pé de igualdade que o tempo: as leis da dinâmica de
Aristóteles dão origem a uma decomposição do espaço-tempo na forma
de um produto de uma variedade unidimensional T e uma variedade
espacial Σ, isto é M = T × Σ. Isto signfica também que podemos falar
de uma simultaneidade absoluta, pois podemos dizer que dois eventos
ocorreram simultaneamente independente da distância que os separa.
Há um relógio universal que marca a passagem do tempo de modo
igual para todo o Universo. tempo t

Com relação ao espaço, mencionamos que a 1ª Lei implica na existên-


cia de um repouso absoluto, que Aristóteles identifica com a ausência
de movimento relativo à Terra. Consequemente há uma projeção única ΠT
Σ

de qualquer ponto da variedade M no subespaço tridimensional Σ,


homomórfico ao espaço R3 , ou seja, ΠΣ : M → R3 . Portanto na física
de Aristóteles faz sentido falar também de um espaço absoluto, cuja Π
Σ

origem é o centro de nosso planeta.


Precisamos agora acrescentar à variedade uma estrutura métrica
euclideana, que era a geometria conhecida dos gregos . A distância es-
pacial entre eventos (t1 , x1 ) e (t2 , x2 ) é dada pelo Teorema de Pitágoras:
espaco

n o1
2
| x1 − x2 | = ( x1 − x2 )2 + ( y1 − y2 )2 + ( z1 − z2 )2 (1.6) Figura 1.1: A decomposição aristoteliana
da variedade M = T × Σ, ou seja, em um
e o intervalo temporal vale espaço e um tempo absolutos.

| t1 − t2 | (1.7)

que nada mais é, na verdade, que um Teorema de Pitágoras em uma di-


mensão. A estrutura métrica do espaço-tempo é portanto a do produto
diretor de dois espaços euclideanos E1 × E3 .

© s.r. dahmen 2022


quem precisa de uma teoria da relatividade? 23

A dinâmica de Aristóteles é logicamente consistente, mas fisicamente


incorreta. Como veremos a seguir, a de Newton é logicamente inconsis-
tente mas fisicamente correta (ao menos para velocidades baixas quando
comparadas à velocidade da luz). Vamos nos ocupar agora da mecânica
Newtoniana e assim entender os pontos que ela deixa em aberto bem
como a estrutura do espaço-tempo que ela determina.

1.2 A estrutura do espaço-tempo em Newton

O Principia de Newton é tomado não apenas como o marco inaugural


da ciência moderna mas também da ciência cuja ênfase está mais no
“calcular” do que no “entender” 12 . Olhemos primeiro para a 1ª Lei 12
Nas palavras do matemático francês
de Newton, ou Lei da Inércia: René Thom, “... Os cartesianos explica-
ram tudo, mas não calcularam nada; New-
ton calculou tudo, mas não explicou nada”.
Se um corpo se encontra em movimento não uniforme, ele necessaria- R. Thom, Structural Stability and Morpho-
mente está sendo mantido neste tipo de movimento por uma força. genesis: An Outline of a General Theory of
Models, W. A. Benjamin Inc., New York,
Esta maneira de formular a 1ª Lei é a forma como os Aristotelianos 1975. Citado em D. J. Raine and M. Heller,
op. cit. p. 25.
a teriam formulado. Esta premissa fulcral da física Newtoniana nos
leva inequivocamente à conclusão da equivalência de movimentos
uniformes relativos entre si, ou seja da relatividade do movimento. Isto
porque são os movimentos não uniformes que são mantidos por uma
força. Isto leva à existência dos referenciais ditos inerciais, uma classe
de sistemas privilegiados que se movem em relação um ao outro e (caso
exista) a um referencial absoluto. O problema porém é que é impossível
determinar experimentalmente quem é este referencial absoluto, ou
sequer sua existência. Newton sabia disto pois no Principia, nas notas
introdutórias (Scholia, sing. Scholium) às definições ele diz:

Da mesma maneira que a ordem das partes do tempo é imutável, também o é a


ordem das partes do espaço [...] E assim, no lugar de posições e movimentos ab-
solutos, usamos [posições e movimentos] relativos, e sem qualquer inconveniente
para os assuntos do dia a dia; porém, em discussões filosóficas, temos que abstrair
de nossos sentidos e considerar as coisas por si próprias, de maneira distinta
daquilo que são apenas pelas medidas sensíveis das mesmas. Pois pode ser que
não haja um corpo realmente em repouso, em relação ao qual o movimento dos
outros corpos possa ser comparado.

Embora cinematicamente Newton saiba que é impossível determinar


o referencial absoluto, dinamicamente é possível fazê-lo (e ele existe)
como comprova o famoso experimento do balde que gira. A idéia, nas
palavras de Newton, é a seguinte:

Giremos um balde, suspenso por uma corda, um número suficiente de vezes


de maneira que a corda fique bastante torcida e depois coloquemos nele água,
mantendo-o em repouso junto com a água; em seguida, [ao soltamos o balde],
pela ação rápida de força da corda que se desenrola, ele gira no sentido contrário e,
enquanto a corda estiver se desenrolando, o recipiente continuará este movimento

© s.r. dahmen 2022


24 uma introdução à teoria do espaço e do tempo

por algum tempo, mas a superfície da água ficará parada, como estava antes do
recipiente se mover; mas o recipiente gradualmente comunicará seu movimento
à agua, fazendo-a girar perceptivelmente e retroceder pouco a pouco, subindo
pelos lados do recipiente de maneira a formar uma superfície côncava [...] Esta
subida da água mostra seu esforço em se afastar do eixo do movimento; e o
movimento circular absoluto, que aqui é diretamente contrário ao [movimento]
relativo, se revela, e pode ser medido através deste esforço [...] e portanto este
esforço não depende da translação da água em relação a corpos no ambiente,
nem o movimento circular verdadeiro pode ser determinado por tais translações
[...] mas movimento relativos [...] são destituídos de quaisquer efeitos reais
[...] descobrir e efetivamente distinguir o real movimento real de corpos dos
movimentos aparentes é na verdade uma tarefa de grande dificuldade; pois partes
deste espaço imóvel em relação aos quais estes movimentos ocorrem não podem
sob quaisquer circunstâncias serem observados por nossos sentidos [...] 13 . 13
Newton, op. cit., Scholium, livro 1.

O que Newton está basicamente afirmando é que inicialmente o balde


gira e nada acontece com a água, ou seja, o movimento relativo entre
os corpos não tem nenhum efeito físico detectável. Depois que a água
adquire o movimento de rotação do balde e portanto não mais se move
em relação ao balde, não existe mais um movimento relativo. No
entanto à superfície da água se torna côncava, demonstrando que ela
gira em relação a um referencial absoluto. A concavidade da água
portanto mostra que existe sim um movimento absoluto e que este é
determinado pela aceleração dos corpos, que são portanto absolutas 14 . 14
A Relatividade Geral de Einstein mos-
Isto explica a importância da 2ª Lei trou que nem mesmo as acelerações são
absolutas.

F = ma. (1.8)

que, em sua formulação matemática, não representa uma identidade no


sentido que ela define quaisquer um dos termos da igualdade. A massa
é uma propriedade do corpo e a aceleração depende do movimento.
Seu produto é identificado com uma força que a princípio depende de
uma constante de acoplamento de alguma interação fundamental e de
alguma propriedade da partícula (carga, por exemplo) não diretamente
relacionada à massa inercial. No entanto ela define uma estrutura de
espaço tempo que discutiremos a seguir.

1.2.1 Tempo absoluto


Se quisermos medir velocidades e acelerações precisamos medir inter-
valos de tempo. Netwon afirma no Principia:

O tempo matemático, verdadeiro, absoluto, por si e pela sua natureza, flui de


maneira igual, sem qualquer relação à algo externo e é chamado por outro nome
de “duração”; o tempo comum, aparente e relativo é alguma medida sensível e
externa (quer precisa ou desigual) da duração por meio de movimento, [tempo
este] que é normalmente usado – como uma hora, um dia, um mês, um ano – no
lugar do tempo verdadeiro.

© s.r. dahmen 2022


quem precisa de uma teoria da relatividade? 25

Disto depreendemos que o tempo absoluto de Newton é algo que


escapa aos nossos instrumentos de medida, por imprecisos, ou por
exemplo do período dos planetas, por irregulares. Newton continua:
Pode ser que não exista algo como um movimento preciso, através do qual o
tempo possa ser medido precisamente. Todos os movimentos podem ser acelerados
ou retardados, mas o fluxo do tempo não está sujeito à qualquer mudança. A
duração ou persistência da existência das coisas permanece a mesma, quer os
movimentos sejam rápidos ou lentos, ou não haja movimento algum; e portanto
devemos fazer a distinção entre esta duração e aquilo que as medidas sensíveis
dela feita e da qual a deduzimos.

Apesar das eventuais falhas conceituais, a teoria de Newton é indis-


cutivelmente bem sucedida: temos à nossa disposição equipamentos
precisos o suficiente para podermos, ao menos nas aplicações de inte-
resse, definirmos um tempo, seja através do uso de relógios siderais,
seja usando relógios atômicos. A compatibilidade destes relógios com
as leis de Newton é uma questão experimental. O conceito de um
tempo absoluto de Newton é puramente abstrato e não passível de
verificação experimental. No entanto, o que é mais relevante neste
conceito, comum à Teoria Aristoteliana, é a idéia de simultaneidade
absoluta: uma vez escolhida a maneira como determinamos o tempo
t, forçosamente todos os observadores inerciais devem usar o mesmo
parâmetro t nas equações de movimento. As únicas discrepâncias,
como já discutidas anteriormente, se referem à escolha da origem do
tempo inicial to e a escala escolhida. Isto fica claro se tomarmos a 2ª
Lei na forma:
d2 r
m 2 =F (1.9)
dt
e observarmos que pela transformação τ = at + b (a, b constantes)
somos levados à equação

d2 r
m = F0 (1.10)
dτ 2
onde F0 = F/a2 . Esta relação entre F0 e F/a2 significa, do ponto de
vista físico, que estamos adotando simplesmente uma nova unidade
para a força.

1.2.2 O espaço absoluto


A projeção Π T nos dá o que os matemáticos definem como um fibrado
do espaço-tempo. Em palavras simples, uma fibra é o domínio x cuja
imagem é y. No nosso caso particular, o subespaço R3 do espaço-tempo
e que entendemos comumente por espaço é um fibrado vetorial da va-
riedade T = R. A fibra é um espaço topológico (tem uma métrica)
associado a cada ponto de um espaço topologicamente mais simples. O
espaço mais simples (tempo) é chamado de base, e cada espaço vetorial

© s.r. dahmen 2022


26 uma introdução à teoria do espaço e do tempo

é uma fibra. O ponto agora é que cada partícula que se mova com velo-
cidade constante e não intercepte outra partícula define uma projeção
em T e não há motivo para considerar o espaço da partícula A privi-
legiado em relação à qualquer outra partícula B. Em outras palavras,
por exemplo, cada observador pode considerar a sua origem como
representando sempre o mesmo ponto do espaço independente de seu
estado de movimento. Outros observadores atribuiriam a sua origem
diferentes pontos de seus espaços. Em outras palavras, cada observador
pode definir uma projeção local que é totalmente equivalente e em
nada especial comparada à projeção de outro observador. Isto porém
não define uma estrutura do espaço-tempo pois em princípio temos
vários espaços simultâneos. Podemos argumentar que isto nada mais é
um jogo de palavras, pois nossa tendência é pensar da seguinte forma:
existe um espaço subjacente, imóvel, e se um observador se move, ele se
move dentro deste espaço ou em relação a este espaço. Mas a pergunta
é a seguinte: imagine um Universo onde haja apenas uma partícula
e queremos determinar se ela se move. Como fazer isso? Podemos
até imaginar que ela se mova em relação a um espaço no qual ela se
encontra inserida. Mas simplesmente não temos como determinar isto,
e portanto a idéia de movimento não faz sentido.
Este é basicamente o problema com o qual Newton se deparou.
Ele sabia que suas Leis não se aplicavam a todos os observadores,
pois havia uma classe especial deles (os inerciais), para os quais a
aceleração absoluta é zero. Podemos assim, ao menos em princípio,
distinguir entre movimento absoluto e repouso absoluto. Como existe
esta diferença, Newton conclui que existe um espaço absoluto:
Movimento absoluto é a translação de um corpo de um lugar absoluto a outro, e
movimento relativo a translação de um lugar relativo a outro.

Além disso ele afirma


O espaço absoluto, por sua própria natureza e independente de qualquer coisa
externa, permanece sempre igual e imóvel.

Deste modo Newton constrói um estrutura de espaço-tempo que é igual


à de Aristóteles, ou seja, o produto direto de dois espaços topológicos
Π × Σ pois existe um espaço privilegiado determinado pelos corpos
com aceleração nula. Aqui está porém a falha na lógica de Newton:
suas leis impõem a existência de uma aceleração absoluta, mas um
espaço absoluto implicaria na existência de velocidades absolutas tam-
bém. Porém, de acordom com as próprias Leis, é impossível detectar a
velocidade absoluta por meio de qualquer experimento, afinal observa-
dores inerciais podem ser diferenciados dos não inerciais pela ausência
de aceleração, mas eles podem ter qualquer velocidade e nenhum de-
les é mais privilegiado que outro. Portanto não existe uma projeção
privilegiada ΠΣ que defina um espaço absoluto, nenhuma definição

© s.r. dahmen 2022


quem precisa de uma teoria da relatividade? 27

global de um mesmo ponto do espaço em tempos diferentes e portanto


a teoria Newtoniana, em resumo, não admite a existência de um espaço
absoluto.

1.3 A Relatividade do movimento na Mecânica de Newton

A forma como medidas realizadas em diferentes referenciais inerciais


se relacionam foi formulada por Galileu em 1632 em sua obra Diágolo
acerca dos dois principais sistemas de mundo: o Ptolomaico e o Copernicano.
Galileu diz:

Tranque-se com um companheiro na cabine principal debaixo do deck de um


grande navio e com algumas moscas, borboletas e outros pequenos [seres] voado-
res. Tenha consigo também um grande aquário cheio de água e peixes. Pendure
uma garrafa que vai se esvaziando, gota a gota, num balde colocado embaixo.
Com o barco parado, observe como os pequenos insetos voam com a mesma
velocidade em qualquer direção, como os peixes nadam indiferentemente em todas
as direções e como as gotas caem no recipiente logo abaixo. E, ao jogar algo para
seu amigo, verá que não é preciso jogar [o objeto] com mais força nesta ou naquela
direção desde que a distância entre vocês seja a mesma. Pulando, você cairá à
mesma distância independente da direção do pulo. Quando tiver observado tudo
isto cuidadosamente (e não há dúvidas que quando o barco está parado tudo deve
ocorrer deste modo), ordene que o barco se mova com uma velocidade qualquer,
desde que o movimento seja uniforme e não sujeito à mudanças. Você não verá a
menor mudança em todos os efeitos descritos acima e nem poderá dizer, a partir
de qualquer um deles, se o barco está se movendo ou está parado.

Esta visão dominou a física durante séculos e ainda domina nossa


percepção diuturna de que espaço e tempo representam pré-condições
subjacentes a todos os fenômenos e não são por eles alterados. São
conceitos abstratos, sendo apenas os intervalos neles medidos sujeitos à
verificação experimental. É neste sentido que podemos entender a rele-
vância da obra de Immanuel Kant, a Crítica da Razão Pura15 , sobre todos
aqueles que se debruçaram sobre estas questões, Einstein inclusive. I. Kant, Crítica da Razão Pura, Fundação
15

Em sua parte inicial, a chamada Estética Transcendental, Kant discute Calouste Gulbenkian, Lisboa, 1989.

estes dois conceitos fulcrais da física de Newton. Seu objetivo não era
“entender” os conceitos de tempo e espaço mas explicar como nos é
possível ter esse entendimento. Em outras palavras, não responder à
pergunta “O que é?” (ontologia) mas “Como é possível que eu saiba o
que é?”(epistemologia). Para Kant espaço e tempo são juízos sintéticos
a priori, duas categorias aparentemente contraditórias (uma discussão
mais detalhada destes tópicos pode ser encontrada no apêndice B): em
poucas palavras, juízos a priori são aqueles que não são adquiridos
pela nossa experiência sensível mas estão de certo modo “impressos”
na nossa cognição. Porém são sintéticos, ou seja, não auto-explanatórios,
relacionados à nossa experiência com o mundo ao nosso redor. Como é
possível para a ciência – e por ciência Kant tinha a Física e a Matemática

© s.r. dahmen 2022


28 uma introdução à teoria do espaço e do tempo

em mente – ser “apriorística” mas ao mesmo tempo baseada na nossa


experiência sensível? A teoria do apriorismo de Kant dominou a discus-
são por gerações e exerceu particular influência sobre Rudolf Carnap e
Hans Reichenbach, dois dos mais importantes filósofos e físicos que se
debruçaram sobre o tema do espaço e do tempo.
O ponto de partida que levou ao questionamento das Transforma-
ções de Galileu e assim aos fundamentos da física Newtoniana foi o
surgimento da equação de onda para o campo eletromagnético a partir
das Equações de Maxwell. A equação de onda não era uma novidade
em si, posto que havia sido descoberta em 1746 pelo matemático fran-
cês Jean de La Ronde D’Alembert para o caso unidimensional de uma
corda vibrante 16 . A equação diferencial parcial de 2ª ordem deduzida 16
Esta equação pode ser deduzida
por D’Alembert para a amplitude Y ( x, t) da corda quando medida em aplicando-se a 2ª lei de Newton ao limite
contínuo de um sistema de massas aco-
relação à sua posição de equilíbrio tem a conhecida forma pladas por molas que obedeçam a lei de
Hooke. Para uma dedução, consulte por
1 ∂2 exemplo o excelente livro de A. L. Fetter e
Y ( x, t) − ∇2 Y ( x, t) = 0. (1.11) J. D. Walecka, Theoretical Mechanics of Par-
v2 ∂t2 ticles and Continua, International Series in
Pure and Applied Physics, McGraw-Hill,
É importante notar que esta equação traz em si uma escala, a veloci- New York, 1980, pags. 108 – 123.
dade v de propagação das ondas mecânicas por um meio material. Esta
velocidade é uma função das propriedades mecânicas do material pelo
qual as ondas se propagam e, no caso particular da corda vibrante de
p
D’Alembert, ela vale v = T/ρ onde T representa a tensão na corda e
ρ sua densidade linear de massa. Este resultado tem 2 consequências
importantes: é necessário um meio material para que uma onda se
propague e, caso este meio tenha movimento próprio com velocidade
vmeio medida num referencial inercial, ele carrega a onda consigo. Por-
tanto, segundo a Transformação de Galileu, observaremos uma onda
que se propaga com velocidade v ± vmeio dependendo da direção das
duas velocidades quando visto do referencial parado. Quando Maxwell
chegou à uma equação de onda para os campos elétrido e magnético
(v. abaixo), a lógica adotada foi a mesma, afinal estamos tratando da
mesma equação: os campos devem ser deformações de um meio lumi-
nífero (o Éter 17 ), da mesma maneira que ondas mecânicas o são. Para 17
Do latim aether via o grego αιθηρ, ar
Maxwell a existência do Éter era um fato, como podemes depreender puro. Era, segundo a mitologia grega, o
ar respirado pelos deuses.
do verbete Aether por ele escrito para a Encyclopedia Britannica:

There can be no doubt that the interplanetary and interstellar spaces are not
empty but occupied by a material substance or body, which is certainly the largest,
18
J. C. Maxwell, Encyclopedia Britannica,
9th edition, vol. 8, 1878.
and probably the most uniform, body of which we have any knowledge. 18

Portanto, se a luz se move em um meio e este meio se move em


relação ao laboratório, poderemos detectar diferenças na velocidade
da luz dependendo da direção de propagação do feixe em relação ao
“vento”do éter. Maxwell adiciona em seu verbete um comentário sobre
a possibilidade de medir o efeito do arrasto da luz pelo do Éter:

© s.r. dahmen 2022


quem precisa de uma teoria da relatividade? 29

... all methods ... by which it is practicable to determine the velocity of light from
terrestrial experiments depend on the measurement of the time required for the
double journey from one station to the other and back again 19 . 19
ibid.

A idéia por trás destes experimentos é detectar variações na velocidade


da luz feitas dentro de um mesmo laboratório em diferentes direções
do espaço e épocas do ano: sendo o Éter, como se acreditava, um
meio universalmente pervasivo, a mudança na direção da velocidade
da Terra ao longo de sua órbita deveria influenciar os resultados. Foi
justamente este o objetivo do famoso experimento de Michelson e
Morley, que no entanto não foi capaz de detectar qualquer mudança na
velocidade da luz 20 . Embora não tenha sido o único, o experimento 20
O problema é um pouco mais compli-
de Michelson e Morley é o mais famoso de todos (v. o Apêndice A cado. Sabia-se já desde os tempos dos
experimentos de Fizeau que qualquer me-
para uma discussão mais detalhada deste experimento). À medida dida do efeito da velocidade da Terra so-
que experimentos conduzidos por Boltzmann e Hertz comprovaram o bre as ondas eletromagnéticas surgiria
como uma correção de segunda ordem
sucesso da teoria de Maxwell e sua condição de teoria fundamental, ∼ (v/c)2 . Várias tentativas anteriores à
em pé de igualdade com a Mecânica, um problema se torna evidente. de Michelson e Morley não tinham preci-
Olhando para as equações de Maxwell no vácuo mais atentamente são suficiente para observar este efeito.

∂B
∇· E = 0 ∇×E = −
∂t
∂E
∇· B = 0 ∇ × B = e0 µ 0 , (1.12)
∂t
vemos que na última equação a velocidade c da luz no vácuo aparece
explicitamente, uma vez que e0 µ0 = 1/c2 21 . Portanto: 21
O uso da letra c tem origem no latim
celeritas. Esta notação era corrente em
se esperamos de uma teoria fundamental que ela dependa de constan- textos científicos mais antigos para repre-
sentar velocidades. Boltzmann a usa por
tes universais, ou seja descreva os mesmos fenômenos em diferentes exemplo na grande maioria de seus ar-
laboratórios, as constantes físicas que definem as escalas dos fenôme- tigos fundamentais da Mecânica Estatís-
tica. Einstein usa em seu famoso artigo a
nos por ela descritos devem ser universais e não podem depender do
maiúscula V para se referir à velocidade
referencial na qual são medidas. Velocidades claramente dependem do da luz.
referencial.

Convém aqui lembrar que as três leis de Newton não tem associadas
a si uma constante, ou seja, uma escala. Visto sob esta perspectiva, a
equação F = ma se aplica para um átomo mas também para um planeta.
Porém, as leis que definem as 4 forças fundamentais da Natureza têm
constantes universais que definem seu regime de aplicabilidade: no
caso da gravidade a constante de gravitação universal G = 6.6743 ×
def
10−11 m3 kg−1 s−2 e, no caso da interação Coulombiana ε 0 = 1
c20 µ0

8.854 187 8128(13) × 10−12 F/m .
Mas o que dizer de uma teoria que se pretende universal quando a
constante que a caracteriza é uma velocidade e portanto depende do
referencial? Se c reclama para si o status de uma constante universal,
pois surge naturalmente nas equações fundamentais da teoria, a con-

© s.r. dahmen 2022


30 uma introdução à teoria do espaço e do tempo

sequência lógica é este valor deve se referir a um referencial absoluto


diferente do referencial absoluto de Newton. Não é sem motivo que
Einstein, em seu famoso artigo de 1905, abre seu artigo discutindo esta
incompatibilidade:
É sabido que a eletrodinâmica de Maxwell – como a concebemos nos dias de hoje
– quando aplicada a corpos em movimento leva a assimetrias que não parecem
inerentes à teoria. Imaginemos por exemplo a interação eletrodinâmica entre um
imã e um condutor. O fenômeno observado depende tão somente do movimento
relativo entre o condutor e o imã, ao passo que segundo o entendimento usual
deve-se fazer uma rígida distinção entre os casos onde este ou aquele corpo se
move. Se o imã se move e o condutor permanece em repouso, surge no entorno
do imã um campo elétrico com certa valor de energia o qual, nos locais onde as
partículas do condutor se encontram, produz uma corrente. No entando, se o imã
permanecer parado e o condutor se mover, não surge nas proximadades do imã
um campo elétrico mas no condutor aparece uma força eletromotriz à qual não
está associada qualquer energia, mas que leva a uma corrente elétrica da mesma
intensidade e comportamento igual ao caso da força elétrica – pressupondo a
igualdade do movimento relativo nos dois casos aqui considerados.
Exemplos deste tipo, bem como as malsucedidas tentativas de se constatar o
movimento da Terra relativa a um “meio luminífero”, levam à suposição que para
quaisquer fenômenos propriedade alguma poder se coadunar com o conceito de
repouso absoluto, e isto não apenas na Mecânica como também na Eletrodinâmica.
Pelo contrário a todos os sistemas de coordenadas para os quais as mesmas leis
da Mecânica valem, devem valer também as mesmas leis da Eletrodinâmica
e da Óptica, como já confirmada até a primeira ordem de aproximação para
[certas] grandezas. Queremos assim elevar esta hipótese a um postulado (a
que chamaremos de “Princípio da Relatividade” em função de seu conteúdo),
introduzindo também o postulado – incompatível com o primeiro apenas na
aparência – de que a luz se move no vácuo com a velocidade V determinada
e independente do movimento do corpo emissor. Ambos os postulados bastam
para que cheguemos, baseados na Eletrodinâmica de Maxwell para corpos em
repouso, a uma Eletrodinâmica de corpos em movimento ao mesmo tempo simples
e livre de contradições. A introdução de um “éter luminífero” se mostrará por
consequência desnecessária, pois a ideia a ser aqui desenvolvida não introduz um
“espaço em repouso absoluto”com propriedades especiais nem associa a um ponto
do espaço, onde processos eletromagnéticos ocorrem, um vetor velocidade. 22 22
A. Einstein, Zur Elektrodynamik beweg-
ter Körper (Acerca da Eletrodinâmica de cor-
Esta incompatibilidade já era conhecida, motivo pelo qual vários físicos pos em movimento, Annalen der Physik 17
se debruçaram sobre esta questão. Num exercício puramente matemá- (1905), p. 891.

tico Lorentz descobriu as transformações que deixavam as Equações


de Maxwell invariantes, e que por este motivo levam hoje seu nome.
No caso simples de uma transformação entre referencias inerciais cujos
eixos x e x 0 coincidam, cujas origens conicidam em t = 0 e que tenham
um velocidade v entre si na direção do eixo x positivo, a chamada
transformação própria e Lorentz tem a forma:
x0 = γ( x − vt); y0 = y; z0 = z
 v 
t0 = γ t− 2x
c
(1.13)

© s.r. dahmen 2022


quem precisa de uma teoria da relatividade? 31

onde γ é o famoso fator de Lorentz:


1
γ= q . (1.14)
v2
1− c2

A Física estava assim, na virada do século XIX para o século XX, numa
encruzilhada entre duas teorias fundamentais mas incompatíveis entre
si. Havia três possíveis soluções para este dilema:

→ há dois tipos de transformação entre referenciais inerciais: um se


aplica à Mecânica, as conhecidas transformações de Galileu; outro
conjunto de transformações se aplica à Eletrodinâmica, as transfor-
mações de Lorentz. A Física seria, nesta visão, dicotômica na sua
essência. Mas além desta questão de cunho mais filosófico, haveria aí
um problema prático mais sério: imagine que queiramos descrever a
dinâmica de uma partícula carregada via

F = ma = qE + q v × B. (1.15)

Um lado da equação diz respeito à segunda lei de Newton, da


Mecânica, invariante por transformações de Galileu. O outro é uma
lei que diz respeito à Eletrodinâmica, invariante pelas transformações
de Lorentz. Como descrever as propriedades de transformação das
grandezas físicas desta equação? Além do mais, isto implica na
existência de um referencial absoluto para a luz (o Éter luminífero) e
portanto passível de detecção experimental.

→ a Teoria Eletrodinâmica de Maxwell é uma teoria incorreta e, des-


coberta a teoria correta, ela seria invariante pelas transformações
de Galileu. Esta explicação de certa forma coloca a Mecânica como
“mais fundamental” que a Eletrodinâmica. Porém, o sucesso da teo-
ria de Maxwell é um forte indício que este caminho não se justifica.

→ Há apenas uma transformação entre referenciais iniciais, válida para


toda a Física: as transformações de Lorentz. Um argumento a favor
desta hipótese está no fato também que as tranformações de Galileu
são um caso limite das transformações de Lorentz quando v/c  1.
Obviamente esta evidência matemática não pode ser tomada como
base de uma teoria física, e requer comprovação experimental. Po-
rém, se isto for verdade e tomarmos as transformações de Lorentz
como aplicáveis a toda a Física, somos levados ao inevitável: refor-
mular nossas idéias de espaço e de tempo, pois sua aferição passa a
depender do estado de movimento de quem a faz.

Como tentativas experimentais de confirmar a existência de um refe-


rencial privilegiado para a Eletrodinâmica falharam, restou a Einstein
tomar as transformações de Lorentz como sendo aquelas que correta-
mente descreve a relação entre as coordenadas espaciais e temporais

© s.r. dahmen 2022


32 uma introdução à teoria do espaço e do tempo

de diferentes referenciais inerciais e com isto reformular nossas ideias


acerca do espaço e do tempo. De forma sucinta:

A Teoria Especial (ou Restrita) da Relatividade é a teoria que esta-


belece a relação entre intervalos de espaço e de tempo medidos em
diferentes referenciais inerciais e suas consequências na Física 23 . As 23
A Teoria da Relatividade Geral é a te-
premissas básicas da Teoria Especial da Relatividade (TER) são duas: oria da gravitação enquanto efeito da
curvatura do espaço-tempo causado pela
presença de matéria e energia. Por isto
(a) as leis da Física são as mesmas em qualquer referencial inercial, ela é chamada de Teoria Geometrodinâmica
ou seja, são covariantes (invariantes na forma); da gravidade, particularmente pela es-
cola russa. Nela não existe uma força
gravitacional. Esta nada mais é que nossa
(b) a velocidade da luz no vácuo é a mesma para qualquer referen-
maneira de interpretarmos os efeitos ad-
cial inercial e representa a velocidade limite para a transmissão de vindos da curvatura do espaço
qualquer interação.

As consequências são muitas. A primeira premissa implica, por exem-


plo, que é impossível detectar o movimento absoluto de um referencial
e consequentemente não existe um tal referencial. A segunda premissa
implica que a velocidade da luz independe da fonte. Discutiremos este
tópico um pouco mais ao final deste capítulo. A consequência mais
profunda é que, em contraposição a Newton, na TER não se fala de um
espaço e de um tempo, mas de um espaço-tempo, uma amálgama destes
dois conceitos. Mais do que uma questão puramente semântica, esta
interrelação traz em seu bojo consequências nos processos de medida
quando comparados à fisica Newtoniana. Não obstante a mudança de
paradigma, seria um erro imaginarmos que uma vez suplantados pela
Relatividade de Einstein, os conceitos de espaço e tempo absoluto de
Newton sejam desprovidos de valor conceitual e histórico. O tempo
de Newton, em particular, foi fundamental para o estabelecimento da
Física enquanto teoria dos fenômenos naturais, além de dominar nosso
vida cotidiana. Nas palavras de P. Mittelstaedt 24 : 24
P. Mittelstaed, Der Zeitbegriff in der Phy-
sik, Bibliographisches Institut, 1980.
Todas as perguntas que surgiram e que de alguma maneira estavam relacionadas
ao tempo puderam ser respondidas de maneira satisfatória e unívoca pelo uso do
conceito de tempo absoluto. Isso se aplica inicialmente à direcionalidade e métrica
do tempo e à difícil questão, relacionada a estes conceitos, da unidade [de medida]
do tempo. Mas também questões mais detalhadas, como a da simultaneidade
em diferentes pontos do espaço ou a métrica temporal em sistemas inerciais em
movimento, puderam ser respondidas de maneira simples e convincente através
do uso deste conceito. O tempo absoluto possui assim – independentemente da
crítica à qual podemos submetê-lo – um grande valor teórico. Foi somente após
sua criação, relativamente simples e não problemática sob uma ponto de vista
mais moderno, que se tornou possível formular as teorias da física clássica.

O que a Relatividade trouxe em seu bojo foi algo de cunho fundamen-


tal: a idéia de que o espaço e o tempo não são dois espaços disjuntos
mas sim um só espaço-tempo quadridimensional com uma métrica
pseudo-euclideana. O que isto basicamente quer dizer é que medidas

© s.r. dahmen 2022


quem precisa de uma teoria da relatividade? 33

devem levar em conta o aspecto quadridimensional das grandezas


físicas. Na escala dos fenômenos do nosso cotidiano, onde lidamos
com velocidade bem menores que a velocidade da luz, esta disjunção
entre espaço e tempo é válida e facilita sobremaneira a compreensão
de certos fenômenos. Quando partimos para fenômenos que envolvem
velocidades muito altas, a mecânica de Newton falha completamente e
somos obrigados a usar o maquinário relativístico em toda sua extensão.
Nós devemos o conceito de espaço-tempo ao matemático alemão Her-
mann Minkowski (1864 - 1909) que apresentou seu resultado em uma
plenária do 80º Encontro de Cientistas Naturais e Médicos em Colônia,
Alemanha 25 no dia 21 de setembro de 1908. A teoria de Minkowski 25
A Versammlung Deutscher Ärtzte und Na-
também foi fundamental para que Einstein formulasse em 2016 a sua turforscher era a principal conferência ci-
entífica de sua época. A palestra de Min-
Teoria Geral da Relatividade. kowski intitulada Raum und Zeit (Espaço
e Tempo) pode ser encontrada em Textos
fundamentais da Física Moderna: O princí-
A teoria da relatividade e relativismo. A partir da revolução Newto- pio da relatividade, na tradução de Mário
niana, a visão mecanicista da Física foi sendo aos poucos estendida J. Saraiva, 4a. edição, Fundação Calouste
Gulbenkian, Lisboa, 1971.
para outras áreas da física, tendo também forte impacto sobre outras
áreas do conhecimento. Ela sofreu um grande impulso durante o
Iluminismo, impulso este que pode ser visto de maneira muito clara
na visão mecanicista do Universo em áreas como a Medicina, entre 26
Julien Offray de La Mettrie (1709 –
outras tantas. Uma das obras deste período que melhor exemplifica 1751), médico e filósofo francês, uma das
esta influência para além das fronteiras da Física é o tratado L’homme figuras-chave do Iluminismo. Hermann
Boerhaave (1668 – 1738) foi dos mais im-
Machine de Julien de La Mettrie. Essa visão reducionista pode ser
portantes médicos da história da medi-
epitomizada no famoso dístico de Boerhaave, de quem de La Mettrie foi cina moderna e exerceu enorme influên-
discípulo: simplex sigillum veri – a simplicidade é a marca da verdade 26 . cia sobre os médicos e filósofos associa-
dos à Encyclopédie de D’Alembert e Dide-
A possibilidade da livre escolha de um sistema inercial e a noção rot, muitos dos quais foram seus alunos
da relatividade da escolha das variáveis espaço-temporais que definem em Leiden.
uma teoria podem levar à ideia do relativismo do conteúdo das teorias
físicas: o conhecimento é relativo, i.e subjetivo. Nada poderia estar mais
errado, pois a teoria assevera exatamente o contrário: as leis da física
não são relativas, mas absolutas, no sentido que são covariantes – têm a
mesma forma – em qualquer referencial inercial. Não se deve confundir 27
Ya. P. Terletskii, Paradoxes in the the-
ory of relativity, Plenum Press, New York,
o conteúdo físico de uma teoria, baseada em fatos experimentalmente 1968, p. 3. O nome Relatividade, univer-
observados, à representação matemática e geométrica deste mesmo salmente adotado, tem origem histórica:
conteúdo. Para Terletskii, uma teoria só progride pelo estudo das ele foi usado por Einstein e Poincaré para
um postulado da teoria como um recurso
hipóteses relativas à substância do fenômeno per se e não à métodos semântico à idéia de um referêncial ab-
de medições 27 . É dentro deste espírito que trataremos da TER nos soluto (e portanto não relativo) represen-
tado pelo Éter de Maxwell.
próximos capítulos.

A velocidade da luz no vácuo como limite universal. Na Física em


geral mas mais particularmente na TER a velocidade da luz no vácuo
desempenha um papel central pois sabemos que nenhum sinal na
natureza se propaga com velocidade maior. Quanto dizemos “sinal”
estamos pensando numa interação entre corpos ou partículas, interação

© s.r. dahmen 2022


34 uma introdução à teoria do espaço e do tempo

esta que envolve a transferência de momentum e energia. Também,


por ser o parâmetro físico que estabelece a escala para que os efeitos
relativísticos sejam sentidos, o fator c e a luz são onipresentes ao longo
de toda a discussão da teoria.
A existência de uma velocidade limite na Física não é evidente e
muito menos logicamente necessária, i.e. não é consequência de nos-
sas teorias mais fundamentais. Trata-se de um fato experimental de
consequências profundas: se admitimos que exista uma velocidade
limite na natureza e que todos os referenciais inercias são equivalentes,
esta velocidade limite necessariamente tem que ser igual para todos os
referenciais. Se assim não fosse, seria possível detectar o movimento do
referencial medindo a mudança da velocidade da luz. Em outras pala-
vras, se pudéssemos através de um experimento detectar a velocidade
de um referencial inercial, em relação ao que esta velocidade se refere?
Isso nos levaria de novo à ideia da existência de um referencial absoluto.
Deste modo, se partirmos da validade universal da equivalência de todos
os referenciais inerciais, então a existência de uma velocidade limite, não
importa quanto ela seja, deve ser igual para todos os referenciais. Ou
seja, todas as velocidades relativas são diferentes em diferentes referen-
ciais inerciais, menos a velocidade c da luz no vácuo. Se não existe um
referencial privilegiado, existe uma velocidade privilegiada: c.
Mas onde está exatamente o problema, se é que há algum? Na
Mecânica Clássica não relativística temos as transformações de Galileu,
discutidas logo abaixo. Elas basicamente relacionam a velocida u0 de
um objeto, medida num referencial inercial I 0 , com a velocidade u deste
mesmo objeto, medida num referencial I, sendo que I 0 e I se movem
com velocidade relativa v entre si. Esta relação é por nós conhecida e
vale:
u0 = u + v. (1.16)

Esta adição de velocidades contradiz, claramente, a possibilidade de


existência de uma velocidade limite na natureza. Encontramo-nos assim
entre duas opções: ou esta transformação ou a Eletrodinâmica não está
correta, um verdadeiro dilema pois as duas das principais teorias físicas
no século XIX se mostravam incompatíveis.

Problemas: referenciais inerciais na mecânica clássica

1.1 Um barco navegando a montante (rio acima) passa por toras que se
movem a jusante (rio abaixo) levadas pela correnteza do rio. Passada uma hora,
o motor do barco para, sendo necessários 30 minutos para seu conserto. Durante
estes 30 minutos o barco é levado rio abaixo pela correnteza. Consertado
o motor, o barco desce o rio com uma velocidade relativa à corrente igual
àquela quando subia o rio. Ele ultrapassa as toras em um ponto à distância

© s.r. dahmen 2022


quem precisa de uma teoria da relatividade? 35

de s = 7.5 km do ponto onde se encontraram a primeira vez. Determine a


velocidade da corrente, partindo do pressuposto que ela seja constante.

1.2 Uma pessoa caminhando com uma velocidade v de módulo e direção


constante passa por um poste de iluminação pública cuja lâmpada se encontra
a uma altura H do solo. Determine a velocidade com que a sombra da cabeça
desta pessoa se move no chão, considerando que ela tenha uma altura h.

1.3 A distância entra o centro de uma cidade e a universidade é de d =


30.0 km. Uma pessoa saiu da universidade às 6:30 da manhã sendo que às
6:40 um ciclista tomou o caminho inverso, se movendo com uma velocidade
(suposta constante) de v = 18.0 km/h. A pessoa encontrou o ciclista após
ter caminhado s = 6.0 km. Determine a hora do encontro e a velocidade da
pessoa.

1.4 Dois trens sairam de Canoas com destino a Porto Alegre em um


intervalo de t = 10 min e com velocidades de v = 30.0 km/h. Qual a velocidade
do trem que fez o percurso inverso se ele cruzou com os 2 trens num intervalo
de τ = 4 min?

1.5 Duas plataformas de embarque, EP e EG , conectam as cidades Porto


Alegre e Guaíba. Os ferries viajam com a mesma velocidade relativa à água e
a distância entre as plataformas é de 20 km. O tempo de viagem de EP para
EG é de 1 hora e de EG para EP de 2 horas. O horário de partida dos barcos
das respectivas plataformas é o mesmo, e há um intervalo de 20 minutos entre
partidas. Cada barco, ao chegar, fica 20 minutos parado na plataforma antes de
partir novamente. Determine:
i. o número de barcos em serviço;
ii. o número de barcos que um barco viajando de EP e EG encontra no caminho;
iii. o número de barcos que um barco viajando de EG e EP encontra no
caminho.

1.6 Uma cientista trabalha num instituto fora da cidade. Um carro sai
da instituto para pegá-la todo dia e chega à parada de ônibus no mesmo
instante que ônibus que ela toma chega à parada. Certo dia, a cientista chegou
1 hora mais cedo ao ponto de ônibus e, decidida a não esperar pelo carro,
resolveu caminhar até o instituto. No caminho ela encontrou o carro e chegou
ao instituto 10 minutos antes de seu horário usual. Quanto tempo esta cientista
caminhou até encontrar o automóvel? Resolva este problema graficamente.

1.7 Dois turistas que se encontram a uma distância de 40.0 km de seu


hotel precisam chegar a ele no menor tempo possível. Eles possuem uma
bicicleta, que decidem usar alternadamente. Um deles começa a caminhar a
uma velocidade v1 = 5.0 km/h enquanto o outro saiu com a bicicleta a uma
velocidade v2 = 15.0 km/h. Os turistas decidiram deixar a bicicleta em pontos
intermediários, entre os quais um caminha e o outro anda de bicicleta. Qual
será a velocidade média dos turistas? Quanto tempo a bicicleta ficará parada?

© s.r. dahmen 2022


36 uma introdução à teoria do espaço e do tempo

1.8 Um ônibus viaja por uma estrada a uma velocidade de v = 16.0 m/s.
Um homem se encontra a 60.0 m da estrada e a 400.0 m do ônibus. Dado que
ele pode correr a uma velocidade máxima de 4.0 m/s, em que direção ele deve
correr para chegar num ponto qualquer da estrada no mesmo instante (ou
antes) do ônibus? Qual a velocidade mínima que ele deve ter para alcançar o
ônibus e em que direção deve correr?

1.9 Qual a velocidade mínima com a qual o homem do problema anterior


deve correr para ainda conseguir alcançar o ônibus e em que direção?

1.10 Um homem num ponto A às margens de um lago quer chegar a um


ponto B dentro do lago no menor tempo possível. A distância do ponto B à
margem BC = d e a distância do ponto onde se encontra o homem ao ponto C
vale AC = s. O homem consegue nadar com uma velocidade v1 e correr com
uma velocidade v2 v1 . O que ele deve fazer: nadar diretamente do ponto A ao
ponto B ou correr uma certa distância ao longo da margem e então nadar até o
ponto B?

Figura 1.2: Figura do Problema 1.10.

A s C

1.11 Um barco navegando rio acima cruza com uma jangada que desce o
rio com a correnteza. Passados 45 minutos (t1 ) o barco para numa plataforma
de embarque por t2 = 1 hora. Então, o barco desce o rio e ultrapassa a jangada
passado um tempo t3 = 1 hora. A velocidade do barco em relação à água
é constante e vale v1 = 10 km/h. Determine a velocidade v2 da correnteza.
Resolva o problema analitica e graficamente.

1.12 Para determinar a velocidade de um avião é necessário cronometrar


o tempo que ele leva para fazer um loop completo. Quanto tempo ele levará
para voar um circuito quadrado de lado a com um vento (em relação ao solo)
de velocidade u nos casos: a) a direção do vento é paralela a um dos lados do
quadrado e b) a velocidade do vento coincide com a diagona do quadrado? A
velocidade do avião (sem vento) em relação ao solo é igual a vu.

1.13 Um piloto deve voar no sentido leste de A para B e retornar de B


para A no sentido oeste. A velocidade do avião em relação ao ar é sempre dada

© s.r. dahmen 2022


quem precisa de uma teoria da relatividade? 37

por u0 e a velocidade do ar com relação ao solo vale v. A distância entre A e B


é l.
(i) Se não há vento (v = 0) mostre que o tempo de viagem de ida e volta é
t0 = 2l/u0 .
(ii) Suponha agora que o vento sopre em direção ao leste (ou oeste). Mostre
que neste caso o tempo de viagem é
t0
tL = (1.17)
1 − v2 / ( u 0 )2

(iii) Suponha agora que o vento sopre em direção norte. Mostre que neste caso
o tempo de viagem é
t0
tN = p (1.18)
1 − v2 / ( u 0 )2
(iv) Nos ítens (ii) e (iii) precisamos partir do pressuposto que v < u0 . Por quê?

1.14 Considere um sistema estelar binário onde uma estrela faz um mo-
vimento circular com velocidade v. Considere 2 posições, a denominada I,
quando a estrela se afasta da Terra, e a II, quando se aproxima (ver figura
abaixo). Considere o período de sua órbita como sendo T e a distância Terra –
estrela como sendo l. Suponhamos também que l é grande o suficiente para
que os pontos I e II possam ser considerados como estando separado por meia
órbita.

Figura 1.3: Figura do Problema 1.14.

I
l v

Terra l v
II

(i) Mostre que para um observador na Terra a estrela parece ir da posição I


para a II num tempo
T 2lv
− 2 , (1.19)
2 c − v2
(ii) e da posição II para a posição I num tempo
T 2lv
+ 2 ,
2 c − v2
(Para resolvermos este problema é necessário considerermos a famosa
“teoria da emissão” como sendo válida. Segundo esta teoria a velocidade da
luz vale c relativa à fonte que a produz e independe do estado de movimento
do meio pelo qual a luz se propaga).

1.15 Um projétil lançado por uma arma viaja a uma velocidade de 335/s.
Num dia sem vento, o projétil é disparado de um trem em direção a uma
pessoa que se encontra exatamente a 335 m da arma. Qual dos dois, o
projétil ou o som do disparo, atinge o homem primeiro se

© s.r. dahmen 2022


38 uma introdução à teoria do espaço e do tempo

(i) o trem está parado?


(ii) Se o trem se afasta do homem?
(iii) O trem se aproxima do homem?

Este problema é relevante para o entendimento das teorias de emissão.

Problemas 2: transformações entre referenciais, aspectos mate-


máticos
2.1 Considere a transformação linear entre dois referenciais inerciais de
coordenadas (l = ct, x, y, z) e (l 0 = ct0 , x 0 , y0 , z0 ) da forma:

x 0 = ax + bl ; l 0 = bx + al; y0 = y; z0 = z.

Mostre que o operador de D’Alembert

∂2
2 = ∇2 −
∂l 2
mantém sua forma (i.e. 20 = 2 ) se for satisfeita a condição

a2 − b2 = 1

2.2 Mostre que no caso da transformação de Lorentz


vx
x 0 = γ( x − vt); t0 = γ(t − ); y0 = y; z0 = z.
c2

onde γ = 1/ 1 − v2 /c2 , a condição a2 − b2 = 1 é satisfeita.

2.3 Por que a transformação

c+v n c+v n
   
0 0 vx
x = γ( x − vt) ; t = γ(t − 2 ) ; y0 = y; z0 = z; n ∈ N∗ .
c−v c c−v

não se presta enquanto transformação entre referenciais inerciais? (Note que


para n = 0 recuperamos a transformação de Lorentz.)

2.4 Tomando a equação de onda submetida a uma transformação de


Galileu (v. notas de aula)
2 1
20 = 2 − ∂t (v · ∇) − 2 ( v · ∇)2 ,
c2 c
mostre que esta equação, aplicada a uma onda plana da forma E(x, t) =
E0 eik·x−iωt , nos leva a uma relação de dispersão da forma

ω = kc ± kv. (1.21)

Qual o significado físico deste resultado?

© s.r. dahmen 2022


2
Referenciais e a Relatividade.

Absolute, true and mathematical time, of itself


and from its own nature, flows equably
without relation to anything external.

(Isaac Newton, Principia, 1687. Trad. Andrew Motte, 1729.)

Time is duration set out by measures.

(John Locke, An essay concerning human understanding, Book II, Chapter XIV,
1689.

Deduziremos neste capítulo a Transformação de Lorentz (TL) usando dife-


rentes abordagens. Estas transformações podem ser aplicadas a qualquer
grandeza definida na Física – seja ela um escalar, um vetor ou um tensor – e
nos mostram de que maneira elas mudam e quando mudam. Estas transfor-
mações também nos permitem reescrever equações em forma covariante, ou
seja de maneira a ter a mesma forma para qualquer escolha de RI. Porém,
mesmo antes de falarmos de TL ou sequer imaginarmos sua existência, é
possível deduzir alguns resultados surpreendentes com relação à medidas
de comprimento e de intervalos de tempo, resultados estes que surgem de
um postulado fundamental que diz que

a velocidade da luz no vácuo tem o mesmo valor para qualquer referencial


inercial.

É necessário no entanto ter uma noção precisa e clara do que o ato de


medir significa exatamente em Física e qual o procedimento a ser adotado.
Se não estabelecemos antes como medir algo, somos levados à resultados
contraditórios mesmo quando lidamos apenas com a mecânica clássica
não relativística. Discutiremos isto na seção ?? mais abaixo. Antes porém
devemos estabelecer o que se entende em Física por referenciais inerciais.

2.1 Referenciais inerciais


A 1ª lei de Newton, ou a Lei da Inércia, diz que todo corpo livre da ação
de forças externas mantém seu estado de movimento. Se parado, ele per-
40 uma introdução à teoria do espaço e do tempo

manece parado, e se em movimento, ele mantém uma trajetória retilínea


com velocidade constante. Uma vez que só faz sentido falar em movimento
quando este movimento se dá em relação a um sistema de referência, faz-se
mister definir qual o referencial que estamos usando. Isto necessariamente
leva à seguinte questão: imaginemos um corpo num espaço completamente
vazio. Seria possível detectar qualquer movimento? Faz sentido falar em
movimento em relação ao espaço vazio? Para Newton sim, faz sentido:
existe um espaço absoluto, relativo ao qual todo movimento pode (e deve) ser
comparado. Experimentalmente observou-se que as estrelas “fixas” podem
ser tomadas como estando em repouso em relação ao referencial absoluto
devido à sua distância até nós. Se a Lei da Inércia vale para o referencial
absoluto, ela vale também para qualquer referencial que se mova com velo-
cidade constante em relação ao referencial absoluto, uma vez que um corpo
que se move com velocidade constante em relação ao referencial absoluto
também se moverá com velocidade constante em relação a este outro refe-
rencial. Todo referencial para o qual a Lei da Inércia é válida é chamado
de referencial inercial (RI). Se tivermos um referencial que não é inercial,
como a Terra, a lei da inércia não mais se aplica em sentido estrito, pois
a aceleração deste referencial pode ser sentida na forma de forças fictícias.
Estas forças não tem origem física mas são introduzidas para que a Lei da
Inércia possa ser aplicada. Um exemplo é a força centrífuga e a força de
Coriolis. Tanto a mecânica newtoniana quanto a mecânica einsteiniana são
baseadas na existência destes referenciais.
Disto surge o princípio da relatividade em Mecânica: todos os RI devem
ser completamente equivalentes no que diz respeito às leis da mecânica.
Sendo assim, todos os fenômenos mecânicos ocorrem de maneira igual
em qualquer um deles: é impossível detectar qualquer movimento de um dado
referencial em relação ao espaço absoluto apenas pela observação de fenômenos
puramente mecânicos 1 . As transformações que ligam sistemas inerciais 1
C. Møller, The Theory of Relativity, Ox-
entre si são as conhecidas transformações de Galileu. Vamos explorar ford University Press, 1952, p. 2.
estas transformações em maiores detalhes abaixo, mas antes falemos um
pouco mais sobre RI’s e até que ponto podemos tomar a Terra como sendo
aproximadamente um referencial deste tipo.

2.2 A Terra enquanto referencial inercial

O fato de nossa planeta ter um movimento de rotação em torno de seu


próprio eixo e de translação ao redor do Sol faz com que ele não seja um RI.
Isso pode ser observado, por exemplo, no aparecimento das forças fictícias.
Porém, para todos os efeitos práticos, podemos considerá-lo como sendo
e, dependendo da situação, pode-se tomar o Sol, o centro de nossa galáxia
ou o centro do grupo local à qual nossa galáxia pertence. Em suma estrelas
muito distantes podem ser tomadas como referencial fixo: são as chamadas
estrelas fixas. Podemos estimar as acelerações a quais estamos submetidos e
ver assim quão precisa é nossa adoção deste ou daquele outro referencial.
Dependendo de nossa latitude, a força centrífuga fictícia varia de zero
nos polos até um valor máximo sobre o Equador. Para uma velocidade
angular de rotação de ω = 7.3 × 10−5 rad.s−1 e um raio no Equador igual
a 6.38 × 106 m, temos uma aceleração centrífuga de a = 0.034 m s−2 . Este
valor corresponde à 0.4% do valor médio de g sobre a superfície da Terra e

© s.r. dahmen 2022


referenciais e a relatividade. 41

Figura 2.1: As estrelas fixas enquanto re-


v ferenciais inerciais. A Terra executa um
G
movimento de rotação em torno do pró-
Centro de massa das prio eixo e portanto não é um RI. Porém,
Centro de massa da Via Lactea
Galaxias do Grupo Local a o efeito desta rotação é o de introduzir
G
forças fictícias cujos efeitos, embora men-
suráveis, podem ser desprezados no dia a
a v
S S dia. Já o movimento da Terra ao redor do
Sol contribui com um fator menor ainda.
Isto também se aplica ao movimento do
Sol em torno do centro de nossa galáxia
e desta em torno do centro de massa do
Terra Sol grupo local de galáxias ao qual a Via Lác-
a tea pertence. Para efeitos práticos pode-
T
mos então considerar as estrelas distantes
a como fixas.
R

v v
R T

pode, para todos os efeitos práticos, ser desprezado.


Já em seu movimento de translação em torno do Sol para uma distância
Terra–Sol de D = 1.50 × 1011[ m em média e uma velocidade angular de
ω = 2 × 10−7 rad.s−1 obtemos uma aceleração a T igual à 6.0 × 10−3 m s−2 ,
ou seja uma ordem de potência menor que a aceleração centrífuga devido
à rotação de nosso planeta. Considerando agora que o Sol executa uma
rotação em torno do centro de nossa galáxia, distante aproximadamente d =
2.7 × 1020 m deste, temos uma velocidade de translação de aproximadamente
220 km.s−1 , que corresponde à uma velocidade angular de aproximadamente
ω = 10−15 rad.s−1 e uma aceleração de aS = 1.8 × 10−10 m s−2 . Nossa
galáxia por sua vez revolve em torno do centro de massa do grupo local.
Embora não saibamos os valores, podemos estimar que a aceleração seja
ainda menor que a aceleração de nosso Sol em torno do centro de nossa
galáxia e portanto as estrelas distantes são, para todo efeito prático, um RI.

2.3 A mecânica de Newton enquanto teoria relativística: trans-


formações de Galileu
A relatividade de Galileu afirma que é impossível, através de quaisquer
experimentos da mecânica, detectar o movimento uniforme do referencial
inercial no qual nos encontramos. Isto equivale a dizer que fenômenos me-
cânicos devem ser descritos pelas mesmas leis físicas em diferentes sistemas
inerciais S e S0 . De uma maneira bastante geral, estas transformações podem
ser escritas como

x0 = Rx + vt + x0 com RR T = 1
0
t = t + t0 (2.1)

Estas transformações estão associadas à simetrias do espaço e tempo: a


isotropia e homogeneidade no caso do espaço, e a homogeneidade no caso

© s.r. dahmen 2022


42 uma introdução à teoria do espaço e do tempo

do tempo. O grupo de Galileu compraz:

i. translações espaciais x0 = x + x0 representam a homogeneidade do


espaço: os experimentos tem que reproduzir os mesmos resultados quer
eu os faça aqui ou num laboratório em outra cidade. Diferentes pontos
do espaço são equivalentes.
ii. Translações temporais t0 = t + t0 descrevem a homogeneidade do tempo.
O resultado de um experimento não pode depender de eu fazê-lo hoje
ou daqui a uma semana. Diferentes instantes de tempo são equivalentes.
i. rotações espaciais x0 = Rx representam a isotropia do espaço. O resul-
tado experimental não pode depender de eu ter meu aparato virado para
este ou aquele lado. Todas as direções do espaço são equivalentes.

Como caso particular temos as transformações de Galileu especiais propria-


mente ditas:

x0 = x + vt
0
t = t (2.2)

que usaremos com frequência nestas notas de aula. O grupo de Galileu tem
10 parâmetros livres: as 3 coordenadas em x0 , 3 componentes de velocidade
em v, uma coordenada temporal t0 e 3 ângulos de rotação em R.
As equações de movimento de Newton mantém sua forma por uma transfor-
mação pelo grupo de Galileu, ou seja, elas são covariantes. Para um sistema
de N massas interagentes as equações:

d2 x i
mi = Fi (|xi − x j |) (i 6= j = 1, 2, · · · N ) (2.3)
dt2
se transformam em

d2 xi0
mi0 = F0( |xi0 − x0j |) (i 6= j = 1, 2, · · · N ) (2.4)
dt2
onde Fi0 = RFi e mi0 = mi . A identidade das massas inercias é uma proposi-
ção ad hoc e reflete o fato que na teoria clássica de Newton, a massa inercial
se transforma como um escalar sob o grupo de Galileu:

f (xi0 ) = f (x) (2.5)

As forças, por óbvio, se transformam como vetores. Consideremos agora o


movimento de uma partícula que se desloca com um movimento arbitrário
em relação ao referencial inercial S de coordenadas (x, y, z, t) e vejamos o
que isto implica para o mesmo movimento no referencial S0 que se move
com velocidade constante v em relação a S. De acordo com o princípio da
relatividade de Galileu, a relação entre as coordenadas nos dois sistemas é
dada por x0 = x + vt. Diferenciando esta expressão obtemos

dx0 dx
= +v
dt dt
u0 = u+v (2.6)

É importante lembrarmo-nos que sempre que se estuda a Teoria da Relati-


vidade se reserva a notação v para a velocidade relativa entre referenciais

© s.r. dahmen 2022


referenciais e a relatividade. 43

inerciais, ao passo que velocidades de corpos materiais é sempre repre-


sentada pela letra u. Isto evita confusão na hora que estudamos como as
velocidades se transformam.
Vamos particularizar para um caso simples da transformação de Galileu
especial quando dois sistemas inerciais S e S0 têm um movimento relativo
entre si na direção do eixo x positivo, ou seja, as transformações dadas pela
eq. (2.2) se tornam
x 0 = x − vt; y0 = y; z0 = z
t0 = t. (2.7)
Neste caso, a transformação da velocidade u se torna
projectivetrans f ormationu0x = u x − v; u0y = uy ; u0z = uz (2.8)
No caso em que u não tenha componente paralela ao eixo z, podemos
simplificar estas equações ainda mais,
u0x = u0 cos θ 0 = u cos θ − v
u0y 0
= u sin θ 0
= u sin θ (2.9)
onde θ é ângulo que o vetor u faz com o eixo x (o mesmo se aplica à θ 0 , u0 e
o eixo x 0 do referencial S0 mutatis mutandis) 2 . Destas equações obtemos 2
Embora possa parecer surpreendende à
primeira vista, a diferença entre os ân-
sin θ gulos θ e θ 0 é um fato corriqueiro do
tan θ 0 =
cos θ − v/u nosso dia-a-dia, observado por exemplo
1 pela trajetória oblíqua das gotas de chuva
v2 2

v
u0 = u 1 − 2 cos θ − 2 (2.10) nos vidros laterais de um carro em movi-
u u mento.
Estas equações representam as relações entre as velocidades de um corpo
medidas em dois referenciais que se deslocam com velocidade relativa v
entre si.

2.4 A eletrodinâmica de Maxwell enquanto teoria relativís-


tica: transformações de Lorentz
A teoria proposta em 1865 por Maxwell muda sua forma quando submetida
a uma transformação de Galileu. Isto causa certo desconforto não pelo fato –
amplamente cohecido – que as equações de onda para E e B tem sua forma
alterada. Isto é um fato amplamento conhecido da mecânica Newtoniana. O
problema reside no fato que a teoria maxwelliana é considerada tão funda-
mental quanto a mecânica newtoniana e portanto as equações fundamentais
que a definem não dependam do referencial escolhido (da mesma maneira
que as leis de Newton não dependem). Este desconforto só aumentou nos
anos sucedouros: a comprovação experimental da teoria de Maxwell por
Boltzmann (1874) e Hertz (1888), bem como os avanços tecnológicos daí
decorrentes, tornaram cada vez mais forte a crença da comunidade científica
acerca da validade e exatidão das equações de Maxwell. A isto somou-se
a comprovação da constância da velocidade da luz para todo referencial
inercial. Havia assim uma discordância entre duas teorias extremamente
bem sucedidas: a mecânica de Newton, para quem a velocidade da onda da
velocidade da fonte, e a eletrodinâmica de Maxwell, onde isto não ocorre.
Algo semelhante ocorre hoje: a Teoria Quântica e a Relatividade Geral -
ambas extremamente bem sucedidas - não são compatíveis.

© s.r. dahmen 2022


44 uma introdução à teoria do espaço e do tempo

2.4.1 Eletrodinâmica no vácuo


Mostraremos a seguir que as equações de Maxwell não são compatíveis com
a invariância de Galileu. Por simplicidade, consideremos as equações no
vácuo. As equações de Maxwell (1865) por nós já conhecidas podem ser
escritas como

∇· E = 0
∂B
∇×E = −
∂t
∇· B = 0
∂E
∇×B = e0 µ 0 (2.11)
∂t
Tomando o rotacional da 2ª e 4ª equações obtemos
 
∂ ∂ ∂E
∇ × (∇ × E) = − ∇ × B = − e0 µ 0
∂t ∂t ∂t
 
∂ ∂ ∂B
∇ × (∇ × B) = e0 µ0 ∇ × E = e0 µ0 (2.12) Figura 2.2: James Clerk Maxwell (1831 –
∂t ∂t ∂t 1879).
Usando as identidades vetoriais

∇ × (∇ × E) = ∇(∇· E ) − ∇2 E
|{z}
=0
2
∇ × (∇ × B) = | {zB}) − ∇ B
∇(∇· (2.13)
=0

chegamos finalmente à equação de onda para E e B

∂2 E ∂2 B
e0 µ 0 = ∇2 E ; e0 µ 0 = ∇2 B, (2.14)
∂t2 ∂t2
com
1
c= √ = 2.99792458 × 108 m/s. (2.15)
e0 µ 0
A constante c é a velocidade da luz no vácuo, uma nova constante universal
que surge naturalmente na eletrodinâmica de Maxwell. Introduzindo o
operador quabla (ou operador D’Alembertiano) por meio de

1 2
2 := ∂ − ∇2 (2.16)
c2 t
as equações de onda acima podem ser escritas de forma mais sucinta como

2 E = 0; 2 B = 0. (2.17)

As soluções destas equações diferenciais parciais são as conhecidas ondas


eletromagnéticas. As soluções mais simples que temos são as chamadas
ondas planas, que são ondas cujas frentes (superfícies de mesma fase) são
planos perpendiculares à direção de propagação. Nesta caso podemos
descrevê-las simplesmente como

E(x, t) = E0 eik·x−iωt , B(x, t) = B0 eik·x−iωt . (2.18)

onde escolhemos a direção de propagação como sendo o do eixo x para 3


Sendo planas, as ondas não podem ter
simplificar a discussão 3 . Substituindo este resultado na equação de onda dependência em y ou z.

© s.r. dahmen 2022


referenciais e a relatividade. 45

obtém-se as relações de dispersão para ondas eletromagnéticas −ω 2 /c2 +


k2 = 0, ou sejaprojective transformation

ω = ±|k|c . (2.19)

No vácuo, a velocidade de grupo e velocidade de fase das ondas eletromag-


néticas são idênticas e iguais à c, como esperado. Mas o que acontece se
passarmos para um referencial inercial Ĩ que se move em relação ao referen-
cial I? Para isto basta acharmos as regras de transformação dos operadores
∂/∂t e ∂/∂x, um exercício algébrico. Porém, como usaremos frequentemente
estas transformações e preparar assim o terreno para as transformações de
Lorentz, vamos reescrever as transformaprojective transformationções de
Galileu em uma forma mais conveniente.

2.4.2 A transformação de Galileu em forma matricial


As transformações (2.2) podem ser escritas de forma mais conveniente por
meio da representação matricial. Por conveniência, vamos assumir que os
eixos do sistema Ĩ se movem na direção positiva dos eixos x, y e z. Neste
caso:
     
t̃ 1 0 0 0 t
 x̃  −v
 x 1 0 0  x 
  
  = trans f ormation    , (2.20)
 
 ỹ   − v y 0 1 0  y 
z̃ −vz 0 0 1 z

ou, de maneira mais resumida


! ! !
t̃ 1 0 t
= , (2.21)
x̃ −v 1 x

É importante enfatizarmos que:

→ as tranformações de Galileu são lineares;


→ a variável t não muda por mudança de referencial inercial, ou seja, na
mecânica newtoniana t não é uma coordenada, mas apenas um parâmetro,
igual para todo o universo.

De um modo geral, transformações lineares podem ser escritas como

∂ xei
xei = Λij x j + si onde Λij = (2.22)
∂x j

onde si representa uma translação simples 4 . Λij é uma matriz de transfor- 4


Usaremos a partir de agora a notação
mação cujo determinante é diferente de zero (ou seja, a transformação dever de Einstein para somas sobre índices:
ter inversa). Um problema com o qual nos deparamos agora é o seguinte: se sempre que um índice aparecer repetido
numa fórmula, isso significa que ele está
quisermos estudar a equação de onda em outro referencial, como é que as sendo somado, i.e. Λij x j = ∑ j Λij x j .
derivadas parciais se transformam? Isto é o que discutiremos em seguida.

A transformação de derivadas parciais


A transformação de uma derivada parcial pode ser entendida de maneira
relativamente simples. Lembremo-nos que as coordenadas de um espaço
métrico obedecem a uma simples álgebra 5 , a saber 5
H. Hinrichsen, Special Relativiy and Clas-
sical Field Theory, notas de aula, Würz-
burg 2019.
© s.r. dahmen 2022
46 uma introdução à teoria do espaço e do tempo

∂xi
= δij . (2.23)
∂x j

É de se esperar que no novo sistema de coordenadas, a mesma álgebra seja


obedecida
∂ xei
= δij . (2.24)
∂ xej
Vamos usar esta álgebra para encontrar a transformação esperada. Partimos
do pressuposto que derivadas parciais em Ĩ, ou seja, nas coordenadas
transformadas, possam ser expressas como uma combinação das derivadas
parciais em relação às coordenadas do referencial I:

∂ ∂ ∂
∂ xek
= ∑ ∂x Blk = B
∂xl lk
(2.25)
l l

onde Blk são os coeficientes de uma matriz transformação. Pela nossa


hipótese (2.24) temos

∂ xei ∂  
δij = = Blj Λij x j + si
∂ xej ∂xl | {z }
xei
∂x j
= Blj Λij = Λil Blj (2.26)
∂xl
|{z}
=δjl

Olhando mais atentamente para esta equação vemos que

δij = Λil Blj =⇒ 1 = ΛB (2.27)

onde 1 é a matriz identidade. Logo B é a inversa de Λ, ou seja


!
−1 1 0
B=Λ = (2.28)
v 1

Com isto fica agora fácil calcular como os operadores diferencias se trans-
formam na mecânica newtoniana ao passarmos de um referencial a outro:
!
˜ 1 0
(∂t ∇ ) = (∂t ∇ ) ·
e (2.29)
v 1
ou, de forma mais explícita:

∂˜ t = ∂t + v · ∇, ∇
e = ∇. (2.30)

Esta mudança nos operadores pode nos surpreender pois enquanto na


transformação de Galileu o tempo não muda mas as coordenadas espaciais
mudam, em se tratando das derivadas o contrário acontece: a derivada
temporal muda enquanto a derivada espacial permanece constante. É fácil
entendermos isto fisicamente: imagine-se sentado num veículo que se move.
Ao se aproximar de um morro, seu aclive permanecerá o mesmo, inde-
pendente do seu movimento. Já a altura da paisagem ao seu redor muda.
Em linguagem matemática, como teremos oportunidade de discutir mais 6
Esse mesmo resultado aparece na me-
adiante de forma detalhada, as propriedades de transformação pela matriz cânica de fluidos: se medimos o fluxo
direta Λ ou pela sua inversa Λ−1 é justamente a propriedade que diferencia de um fluido por um elemento de vo-
vetores contravariantes (vetores “comuns”tipo velocidade, momentum) de lume, devemos levar em conta que este
vetores covariantes (gradientes) 6 . elemento se move com o fluido e portanto
o fluxo será diferente quer o meçamos
num referencial ou no outro.
© s.r. dahmen 2022
referenciais e a relatividade. 47

Um pouco de manipulação algébrica leva facilmente à transformação do


operador 2
2 1
2e = 2 − 2 ∂t (v · ∇) + 2 ( v · ∇)2 (2.31)
c c
Ou seja, o operador muda de forma. Isto a princípio não representa um
problema: diferentemente da 2ª lei de Newton, que mantém sua forma por
uma transformação galileana, a mesma transformação muda a equação de
onda, um fato conhecido da mecânica: a mudança de referencial implica
numa medida de velocidade da onda que depende do estado de movimento
do observador ou do meio pelo qual a onda se propaga 7 . No caso das 7
A velocidade do som é um exemplo: o
ondas eletromagnéticas, pela transformação x → e
x = x − vt uma onda plana som é “arrastado” pelo meio sobre o qual
se propaga. À temperatura de 20 °Cno ar
E, por exemplo, se transforma em
seco o som se propaga a uma velocidade
de aproximadamente 243 m/s. Se houver
E(x, t) → Ẽ(x̃, t̃) = E0 eik·(ex+vt)−iωt . (2.32)
vento, uma pessoa parada em relação ao
solo medirá outra velocidade embora em
Substituindo isto na Eq. 2 E = 0 obtém-se
relação ao ar, o som mantenha sua veloci-
dade. Isto explica por exemplo o motivo
ω = ±|k|c + k · vFn, (2.33)
pelo qual no dia 10 de fevereiro de 2020
um Boeing 747 da companhia aérea in-
ou seja, a relação de dispersão para ondas eletromagnéticas muda: na me- glesa British Airways quebrou o recorde
cânica newtoniana a velocidade da luz depende do estado de movimento de velocidade subsônico num vôo entre
do observador. Surgem aqui dois problemas, um de ordem experimental, Nova Iorque e Londres, atingindo a velo-
outro de ordem conceitual. O problema experimental é que os valores de cidade de 1327 km/h em relação ao solo. A
c medidos eram, dentro da precisão obtida, sempre os mesmos. Dado o viagem durou 80 minutos a menos que
o tempo médio deste trecho. Sua veloci-
sucesso inegável da teoria eletromagnética enquanto teoria física, este re- dade em relação ao ar nunca passou de
sultado implica na incompatibilidade da eletrodinâmica de Maxwell e da 1248,km/h – Mach 1 – motivo pelo qual
mecânica de Newton. Esta última era o fundamento sobre o qual a física ele nunca rompeu a barreira do som. A
fora construída e na visão da época a eletrodinâmica poderia ser explicada velocidade em relação ao solo se deve a
(microscopicamente falando) em termos da propagação mecânica da luz em um vento de cauda que em momentos
da viagem atingiu aproximadamente 320
um meio físico. Como conciliar uma teoria que conceitualmente poderia ter km/h.
uma explicação mecânica mas que violava de maneira explícita a invariância
de Galileu? O que se aventava ao longo das últimas décadas do século XIX
é que talvez a equação de onda do eletromagnetismo fosse válida para um
referencial especial, o chamado Éter. Para testar esta hipótese basta medir
a velocidade da luz em laboratórios terrestres e comparar os valores de c
obtidos. Surge então um problema: considerando o valor de c que aparece
nas equações de Maxwell como sendo o valor correto no referencial do
Éter, a maneira mais fácil de detectar o movimento da Terra é através da
interferometria de feixes de luz que percorrem caminhos perpendiculares
(esta é a idéia por trás do experimento de Michelson e Morley). A interferên-
cia surge pela diferença de caminhos ópticos ou pela diferente velocidade
da luz nas direções perpendiculares (pois segundo Galileu a velocidade
da luz é afetada de maneira diferente pela adição da velocidade da Terra).
Assim, mesmo garantindo que os caminhos ópticos sejam iguais, o efeito da
velocidade se faria sentir. Para diferenciar entre um efeito e outro, bastaria
girar o aparato durante a realização do experimento: neste caso as franjas de
interferência se moveriam pois as velocidades relativas mudariam. Porém,
todas as experiências neste sentido falharam. Este insucesso porém não
pôde ser atribuído simplesmente à inexistência do Éter, mas ao fato que
se houvesse uma diferença observável, ela estava além da precisão experi-
mental dos aparelhos então disponíveis. Ou seja, o insucesso em detectar

© s.r. dahmen 2022


48 uma introdução à teoria do espaço e do tempo

diferentes valores de c talvez não fosse um comprovação da inexistência do


Éter mas sim resultado da falta de precisão experimental para detectar estas
diferenças 8 . 8
Uma discussão detalhada dos experi-
Quando se tornou claro que a velocidade da luz independia do estado do mentos envolvendo o efeito Doppler clás-
sico e o experimento de Michelson e Mor-
movimento do observador, surgiu uma crise: a mecânica de Newton era ley podem ser encontrados no capítulo 4
o fundamento sobre o qual a física fora construída. Porém, o sucesso da e apêndice ??.
teoria eletromagnética era inegável. As duas porém eram incompatíveis.
Lorentz colocou-se então diante da seguinte pergunta: quais transformações
deveríamos usar no lugar de Galileu para que as equações de Maxwell
continuem invariantes? Se houver uma transformação deste tipo, ela deve
depender continuamente de um parâmetro, a saber a velocidade v relativa
entre dois referenciais. Esta transformação é discutida abaixo.

2.5 Dedução 1: transformações de Lorentz segundo Lorentz


Qual a transformação de coordenadas que mantém a equação de onda
invariante? Esta tarefa coube a A. H. Lorentz, cuja resultado apresentaremos
agora. Para facilitar a discussão, vamos nos restringir ao caso unidimensional
das transformações de Galileu, a eq. (). A idéia de Lorentz foi substituir as
equações
! ! !
t̃ 1 0 t
= , (2.34)
x̃ −v 1 x
por uma transformação linear mais geral
! ! !
t0 A B t
= , (2.35)
x0 C D x Figura 2.3: Antoon Hendrik Lorentz
(1853 – 1928).
Vale a pena mais uma vez enfatizar que queremos transformações lineares
pois trajetórias retilíneas tem que ser mapeadas em trajetórias retilíneas 9 .
Vamos aplicar esta transformação aos operadores em (2.29) que, como
sabemos, é dada pela matriz inversa: 9
Notemos também que até o momento
! foi usada a notação x → x̃ quando esta-
0 0 1 D −B mos falando da transformação de Galileu.
(∂t ∇ ) = (∂t ∇ ) · (2.36)
AD − BC −C A Ao falarmos agora das transformações de
Lorentz, usaremos a notação x → x 0 .
ou, escrevendo os termos explicitamente
D∂t − C∂x A∂x − B∂t
∂0t = , ∂0x = (2.37)
AD − BC AD − BC
e, consequemente
     
C2 CD D2
1 2 A2 − c2
∂2x − 2 AB − c2
+ B2 − c2
∂2t
20 = ∂2x − ∂ = (2.38)
c2 t ( AD − BC )2
Se impusermos que 20 = 2, devemos ter
C2 D2
A2 − c2 CD B2 − c2 1
=1 AB − =0 =− (2.39)
( AD − BC )2 c2 ( AD − BC )2 c2
cuja solução é

A = D, C = Bc2 , AD − BC = 1 (2.40)

© s.r. dahmen 2022


referenciais e a relatividade. 49

Interpretação física. Temos na expressão acima 3 equações e 4 incógnitas,


razão pela qual precisamos de mais uma equação para que A, B, C e D
possam ser definidas univocamente. Esta quarta equação devemos buscar
na Física, afinal esperamos que transformações dependam da velocidade
relativa v entre os dois referenciais. Sendo assim, coloquemo-nos a pergunta:
como se move a origem x 0 do sistema I 0 quando visto do referencial I
original? Para responder esta pergunta basta tomar a transformação inversa
! ! !
t 1 D −B t0
= , (2.41)
x AD − BC −C A x0

colocando x 0 = 0 no lado direito da equação acima. Obtemos deste modo a


expressão
Dt0 −Ct0
t= , x= . (2.42)
AD − BC AD − BC
Como, do ponto de vista de I, a origem do sistema I 0 se move com velocidade
v, obtemos da equação acima que

x C
v= =− (2.43)
t D
Combinando este resultado com as três equações em (2.40) obtemos final-
mente
1 v
A = D= √ , B=− √ ,
1 − v2 /c2 c2 1 − v2 /c2
v
C = −√ . (2.44)
1 − v2 /c2
Nestas expressões encontramos pela primeira vez o famoso fator de Lorentz
p
γ = 1/ 1 − v2 /c2 (2.45)
em termos do qual podemos escrever as transformações de Lorentz em sua
forma usual
v
x 0 = γ( x − vt) , t0 = γ(t − x) . (2.46)
c2
A relação inversa é obtida pela inversão da velocidade relativa, ou seja
substituindo v por −v nas transformações:
v 0
x = γ( x 0 + vt0 ) , t = γ(t0 + x ). (2.47)
c2
Em notação vetorial temos
! ! !
ct0 γ − βγ ct v
= , β= (2.48)
x0 − βγ γ x c

e a inversa ! ! !
ct γ βγ ct0
= . (2.49)
x βγ γ x0

As transformações de Lorentz também são conhecidas como rotações hiper-


bólicas no plano (ct, x ). Isto pode ser visto de maneira clara se partirmos das

© s.r. dahmen 2022


50 uma introdução à teoria do espaço e do tempo

transformações de Lorentz infinitesimais, impondo novamente a linearidade


entre as coordenadas:
x = x 0 + ect0
e  1. (2.50)
ct = ct0 + ex 0
onde no limite e → 0 temos ec → v e recuperamos a transformação de
Galileu. Em forma vetorial podemos escrever esta equação como
! ! !
ct 1 e ct0
= . (2.51)
x e 1 x0

e as transformações infinitesimais inversas como


! ! !
ct0 1 −e ct
= . (2.52)
x0 −e 1 x

Para obtermos uma transformação finita, podemos realizar um número


grande de transformações infinitesimais sucessivas. Após n transformações
infinitesimais aproximamos todas como uma transformação finita por um
“ângulo” φ = en. No limite n → ∞, e → 0 com φ = const, esta aproximação
se torna exata. Por exemplo a expressão eφ = limn→∞ (1 + φ/n)n é o
resultado de sucessivas aplicações de rotações infinitesimais. Analogamente
para o caso das transformações de Lorentz finitas
! ! " !n # !
ct0 ct 1 φ/n ct0
Lφ = = lim
x0 x n→∞ φ/n 1 x0
n  !
ct0
 
φ
= lim 1 + A
n→∞ n x0
!
ct0
= exp(φA) (2.53)
x0
!
φ2 2 ct0
= (1 + φA + A + · · · )
2! x0
! !
cosh φ sinh φ ct0
=
sinh φ cosh φ x0

Nesta dedução usamos: !


0 1
A= , (2.54)
1 0
bem como as identidades

φ2 φ4 φ2n
cosh φ = 1+ + +··· = ∑
2! 4! n =0
(2n)!

φ3 φ5 φ2n+1
sinh φ = φ+ + +··· = ∑ . (2.55)
3! 5! n =0
(2n + 1)!

As transformações de Lorentz são rotações hiperbólicas no plano (ct, x ) por


um “ângulo” φ (cf. Fig. 2.4). O ângulo φ pode ser determinado da seguinte
forma. Tomemos um ponto que se move com velocidade constante. Do
ponto de vista do laboratório o ponto se move com velocidade v = x/t para
direita. As coordenadas x e t são assim dadas por

x = vt0 sinh φ ct = ct0 cosh φ , (2.56)

© s.r. dahmen 2022


referenciais e a relatividade. 51

de modo que o ângulo φ é dado por

tanh φ = v/c . (2.57)

Este ângulo recebe o nome de rapidez 10 e mede o ângulo entre os eixos das 10
Do inglês rapidity.
coordenadas dos dois referenciais inerciais que se movem com velocidade
relativa v.

Figura 2.4: Rotações no espaço euclidi-


ano e no espaço hiperbólico. Esquerda:
Rotação usual por um ângulo α no plano
( x1 , x2 ). Os círculos representam linhas
de mesma distância à origem, ou seja
x2 + y2 = x 02 + y02 . Direita: representa-
ção equivalente da “rotação” hiperbólica
por um ângulo α no plano ( x0 , x1 ). As
hipérboles representam linhas de mesma
distância em relação à origem, neste caso
(ct)2 − x2 = (ct0 )2 − x 02 .

A relação entre cosh φ e sinh φ e as velocidades c e v seguem de


s
tanh2 φ
r
v 1
sinh φ = 2
=
1 − tanh φ c 1 − v2 /c2
s r (2.58)
1 1
cosh φ = = .
1 − tanh2 φ 1 − v2 /c2

2.6 Dedução 2: transformações de Lorentz enquanto simetria


do espaço-tempo

Uma dedução bastante elegante das transformações de Lorentz é aquela que


faz uso das propriedades de homogeneidade e isotropia do espaço. Nesta
dedução não é necessário postular a constância da velocidade da luz, como Einstein
fez em seu trabalho original. Na base do argumento está o fato que, de acordo
com a teoria da relatividade, partículas livres descrevem trajetórias retilíneas
em referenciais inercias. Em outras palavras, retas devem ser mapeadas
em retas por uma mudança de eixo de coordenadas. Isso significa que a
trajetória de uma partícula descrita por uma equação de reta do tipo 11 11
H. Goenner, Einführung in die spezielle
und allegemeine Relativitätstheorie, Spek-
ax + bt + c = 0 (2.59) trum Akademischer Verlag, Heidelberg,
2006, p. 14.
num referencial I é descrita por uma equação de reta do tipo

Ax 0 + Bt0 + C = 0 (2.60)

num referencial I 0 . As transformações mais gerais que mapeiam retas em


retas são as chamadas transformações projetivas 12 : 12
Um exemplo simples de transformação
projetiva no plano são aquelas que usa-
mos quando queremos fazer um desenho
© s.r. dahmen 2022
em perspectiva.
52 uma introdução à teoria do espaço e do tempo

P(t, x )
t0 =
Q(t, x )
R(t, x )
x0 = (2.61)
Q(t, x )

onde P, R e Q são polinômios de grau um nas variáveis t e x:

P = At + Bx + C
R = Dt + Ex + F
Q = Gt + Hx + K. (2.62)

Se impusermos sobre estas equações a exigência que eventos numa re-


gião finita do espaço sejam mapeados em regiões finitas, então temos que
G = H = 0. Mas deixemos de lado um pouco a discussão matemática
e busquemos pensar um pouco mais em termos de física e o que estas
13
Y.P. Terletskii, Paradoxes in the Theory of
transformações implicam. Seguirei aqui de perto a dedução apresentada
Relativity; J.-M. Lévy-Leblond, One more
em Terletskii. Uma visão mais matemática pode ser encontrada em Lévy- derivation of the Lorentz transformation, Am.
Leblond e nas referências por ele apresentadas 13 . J. Physics 44/3 (1976): 271-277.
Comecemos pelo seguinte ponto: nossas transformações partirão de suposi-
ções que nos parecem “naturais” no que dizem respeito às propriedades do
espaço e do tempo. Além disso nossas suposições são baseadas na física new-
toniana, ou seja, não adotamos aqui qualquer condição sobre a velocidade
da luz como sendo algo especial. Nossas hipóteses são simplesmente:
i. o espaço e o tempo são homogêneos, ou seja, uniformes. Isto significa as
medidas espacias e temporais que fizermos independem do ponto onde
escolhemos as origens do nosso sistema de coordenadas ou ou instante
de tempo inicial;
ii. o espaço é isotrópico, ou seja, todas as direções são equivalentes. Basica-
mente isso significa que se olharmos para o espaço vazio, não veremos
qualquer diferença não importa a direção que olhemos);
iii. todos os referenciais inerciais são equivalentes.
Os diferentes sistemas de referência servem apenas como diferentes representações do
mesmo espaço e tempo com formas universais da existência da matéria. Cada uma
destas representações tem as mesmas propriedades. Consequentemente, não podemos
escolher as relações enntre as coordenadas e o tempo (x, y, z, t) num referencial
“estacionário” e as do referencial “em movimento” (x 0 , y0 , z0 , t0 ), ou seja as fórmulas
de transformação das coordenadas, de maneira arbitrária 14 . As equações que 14
Terletskii, op. cit. pág. 18.
relacionam as novas coordenadas às antigas são da forma

x0 = f 1 ( x, y, z, t)
y0 = f 2 ( x, y, z, t)
0
z = f 3 ( x, y, z, t)
0
t = f 4 ( x, y, z, t) (2.63)

Olhemos agora quais as restrições que as propriedades de simetria do espaço


e tempo impõem sobre estas equações (que no fundo se reduz à dizer que
as transformações devem ser projetivas).

i. A homogeneidade do tempo e espaço implica que as transformações


devem ser lineares.

© s.r. dahmen 2022


referenciais e a relatividade. 53

Se as derivadas das funções f i acima não fossem constantes mas depen-


dessem das variáveis (x, y, z, t), as diferenças (x10 − x20 ), (y10 − y20 ), (z10 − z20 )
e (t10 − t20 ) que são as projeções das distâncias espaciais e temporais entre
dois pontos P1 e P2 no referencial que se move, não mais dependeriam das
correspondestes projeções (x1 − x2 ) ... (t1 − t2 ) no referencial “parado” mas
das próprias coordenadas destes pontos.

Um exemplo simples ilustra isso. Tomando a variável x 0 apenas, imaginemos


que a transformação fosse do tipo:

x 0 = x2 . (2.64)

Considere os pontos de coordenadas x1 = 0, x2 = 1 e x3 = 2. Clara-


mente, no referencial I, x2 − x1 = x3 − x2 = 1. Por outro lado, segundo a
transformação acima, no referencial I 0 teríamos

x20 − x10 = 12 − 02 = 1
(2.65)
x30 − x20 = 32 − 22 = 5.

Basicamente uma transformação não linear implica que as propriedades


métricas do espaço dependeriam de nossa escolha da origem de coordenadas,
contradizendo nossas premissas.

Problema 2. Tente expressar matematicamente o fato que se as medidas não


podem depender da escolha da origem, então as transformações devem ser
lineares.

Solução: considere a coordenadas x2 = x1 + ξ onde x1 é nossa origem. A


transformação que procuramos é do tipo

x20 − x10 = ξ 0 = f 1 ( x2 , · · · ) − f 1 ( x1 , · · · ) = f 1 ( x1 + ξ, · · · ) − f 1 ( x1 , · · · ).
(2.66)
Mas, se ∂ξ 0 /∂x1 = 0 então

∂ f 1 ( x1 + ξ, · · · ) ∂ f (x , · · · )
− 1 1 =0 (2.67)
∂x1 ∂x1

ou seja
∂ f 1 ( x1 + ξ, · · · ) ∂ f (x , · · · ) ∂f
= 1 1 =⇒ 1 = const. (2.68)
∂x1 ∂x1 ∂x1
e logo f 1 tem que ser linear em x. Isso pode ser estendido a todas as outras
variáveis e funções f i , e portanto as transformações são lineares.

ii-a. A isotropia do espaço e a escolha dos eixos.

A isotropia do espaço nos permite escolher a direção do movimento relativo


de tal modo que os eixos x e x 0 coincidam. Combinado à independência da
escolha da origem, podemos fazê-lo de tal modo que em t = 0 os pontos
que representam a origem nos dois referencias I e I 0 coincidam, isto é
x 0 = y0 = z0 = 0 e x = y = z = 0 coincidem em t = t0 = 0. A isotropia do

© s.r. dahmen 2022


54 uma introdução à teoria do espaço e do tempo

espaço pode então ser expressa pelas transformações:

x0 = k(v)( x − vt)
0
y = λ(v)y
0
z = λ(v)z
t0 = µ(v)t + α(v) x (2.69)

Estas expressões requerem uma explicação. Primeiro, deve haver apenas


um parâmetro físico nas transformações: a velocidade relativa v entre os
referenciais 15 . Segundo, não pode haver nas expressões para y0 e z0 termos 15
Notem que não entramos ainda com a
em x ou t pois os eixo x 0 (que corresponde aos valores y0 = z0 = 0) sempre velocidade da luz, algo que será feito de-
coincide com o eixo x. Isto seria impossível se y0 e z0 dependessem de x pois. Enquanto estivermos falando ape-
nas de simetrias, c não desempenha pa-
ou t. Terceiro, devido à simetria do espaço não pode haver diferença entre pel algum.
eixos perpendiculares a x (x 0 ), logo os dois eixos devem se transformar da
mesma forma. Quarto: a última expressão requer uma explicação mais
cuidadosa. Por que a escrevemos daquela forma? Ao fazermos isso não
estaríamos levando em conta um certo conhecimento de causa, ou seja, que 16
Petitio principii é um termo da filoso-
não existe um espaço e um tempo a la Newton mas sim um espaço–tempo, fia para denotar uma argumentação fa-
uma variedade quadridimensional na qual as transformações projetivas laciosa que consiste em colocar nas pre-
missas aquilo que queremos provar nas
assumem esta forma particular? Para um físico pré–einsteiniano, imaginar
conclusões. Um exemplo simples: minha
uma variável t dependente da velocidade v era algo inconcebível pois isto ia opinião não está errada, portanto ela repre-
contra a idéia do tempo absoluto de Newton. Nossa argumentação parece senta a verdade. Na maioria das vezes
ser aquilo que em lógica chamamos de um petitio principii16 . falácias lógicas de petitio principii são bas-
tante difíceis de se detectar e não são tão
Na verdade é o nosso hábito de ver o tempo como algo independente de
evidentes como neste exemplo.
nosso estado de movimento que faz com que assumamos t0 = t e portanto
qualquer outra transformação desta variável nos pareça estranha. De um
modo geral o que estas transformações nos dizem é que em princípio é pos-
sível chegar perto das transformações de Lorentz – como veremos adianta
– considerando-se apenas propriedades de homogeneidade e isotropia do
espaço tempo. Isto é algo realmente profundo mas em algum momento
devemos nos lembrar que estamos lidando com física, com grandezas men-
suráveis, e aí veremos como a constância de c colocada por Einstein na base
de sua dedução faz toda a diferença.

ii-b. A isotropia do espaço e a reversão de v e x.

A isotropia do espaço e tempo implica também que se invertermos a veloci-


dade e ao mesmo tempo invertermos a direção positiva do eixo x a física
não muda e portanto as fórmulas não podem mudar, ou seja

−x0 = k(v)(− x + vt)


0
y = λ(−v)y
0
z = λ(−v)z
0
t = µ(−v)t − α(−v) x (2.70)

devem representar a mesma mudança de referencial. Comparando (2.69)


com (2.70) obtemos

k(−v) = k ( v ), α(−v) = −α(v)


µ(−v) = µ ( v ), λ(−v) = λ(v) (2.71)

© s.r. dahmen 2022


referenciais e a relatividade. 55

A função α(v) é a única função ímpar entre nossas funções. É possível assim
expressar as transformações usando apenas funções pares se introduzirmos
uma nova função η (v) de tal modo que podemos expressar a função α em
termos de nossa função µ e desta nova função na forma
v
α(v) = − µ(v) (2.72)
η (v)

Desta forma as equações (2.69) se tornam

x0 = k(v)( x − vt)
0
y = λ(v)y
0
z = λ(v)z
 
v
t0 = µ(v) t − x (2.73)
η (v)

iii-a. A equivalência de sistemas inerciais.

Da mesma maneira que temos uma transformação que serve para irmos de
I para I 0 , a mesma transformação de I 0 para I deve valer, notando apenas
que em relação ao referencial I 0 o referencial I se move com velocidade −v.
Logo, aplicando as transformações acima para a mudança inversa temos

x = k(−v)[ x 0 − (−v)t0 ] = k(v)( x 0 + vt0 )


y = λ(−v)y0 = λ(v)y0
z = λ(−v)z0 = λ(v)z0
−v 0
   
v 0
t = µ(−v) t0 − x = µ(v) t0 + x (2.74)
η (−v) η (v)

O primeiro resultado que tiramos destas equações é que y0 = λ(v)y e


y = λ(v)y0 . Isto implica em

λ2 (v) = 1 =⇒ λ(v) = ±1. (2.75)

Desta duas soluções apenas a solução λ = 1 faz sentido pois, caso contrário,
para v = 0 a solução λ = −1 nos daria um sistema com coordenadas y0 e z0
invertidas. Multiplicando agora a primeira e a última equação em (2.73) por
µ e kv, respectivamente, e somando as duas, obtemos

v2
 
µx 0 + kvt0 = µk 1 − x. (2.76)
η

Por uma questão de simplicidade deixamos de escrever explicitamente a


dependência em v das equações de transformação de coordenadas. Desta
expressão obtemos

x0 vt0
x= + (2.77)
k(1 − v2 /η ) µ(1 − v2 /η )

Se compararmos a expressão acima com a primeira equação de (2.69) vemos


que
1 1
k= 2
, k= (2.78)
k(1 − v /η ) µ(1 − v2 /η )

© s.r. dahmen 2022


56 uma introdução à teoria do espaço e do tempo

de onde concluímos que

1
µ(v) = k(v) = q 2
(2.79)
1 − ηv(v)

Nossas equações se transformam assim em

x − vt
x0 = q 2
1 − ηv(v)
y0 = y
z0 = z
t − vx/η
t0 = q 2
(2.80)
1 − ηv(v)

Falta agora determinar a função η (v). Uma coisa já podemos afirmar sobre
ela: sua dimensão é a de (velocidade)2 .

iii-b. As transformações formam um grupo.

Uma das importantes propriedades das transformações que discutimos até o


momento é que sendo referenciais inercias equivalentes, uma transformação
de um sistema de coordenadas I para um sistema I 0 e deste para um sistema
I 00 deve resultas na mesma física que uma transformação direta do sistema
“parado” I para o sistema I 00 . Vamos supor que a velocidade de I 0 medido
em relação a I seja v1 e a de I 00 medida em relação à I 0 seja v2 . Podemos
assim escrever

x0 = k(v1 )( x − v1 t); x 00 = k(v2 )( x 0 − v2 t0 )

v x0
   
v x
t 0
= k ( v1 ) t − 1 ; t = k ( v2 ) t − 2
00 0
(2.81)
η ( v1 ) η ( v2 )

onde reintroduzimos a notação k(v) para deixar as expressões mais claras.


Destas expressões é possível expressar as variáveis x 00 e t00 em função de x e
t:
  
v x
x 00 = k(v2 )k(v1 ) x − v1 t − v2 t − 1 ,
η ( v1 )
 
00 v1 x v2
t = k ( v2 ) k ( v1 ) t − − ( x − v1 t ) . (2.82)
η ( v1 ) η ( v2 )

Porém é possível escrever uma transformação direta de I para I 00 por uma


velocidade v3 pois as transformações formam um grupo:
 
v x
x 00 = k (v3 )( x − v3 t); t00 = k(v3 ) t − 3 . (2.83)
η ( v3 )

Os coeficientes que multiplicam t e x nas duas expressões para t00 e x 00


devem ser os mesmos, ou seja
   
v v v v
k ( v1 ) k ( v2 ) 1 + 1 2 = k ( v1 ) k ( v2 ) 1 + 2 1 (2.84)
η ( v1 ) η ( v2 )

© s.r. dahmen 2022


referenciais e a relatividade. 57

Esta igualdade só pode ser satisfeita se η (v1 ) = η (v2 ). Sendo v1 e v2 duas


velocidades arbitrárias, isto implica que η não pode depender de v. Logo
η = constante.

iv. A constante η, a causalidade e a topologia do tempo

Precisamos determinar agora o coeficiente η. Sendo a sua dimensão a de


(velocidade)2 , vamos denotá-lo por η = ±(v∞ )2 . Notemos primeiramente
que ela pode ser negativa ou positiva:

a) η = −(v∞ )2 < 0, em cujo caso a transformação se torna

x − vt t + vx/v2∞
x0 = q 2
t0 = q 2
(2.85)
1 + vv2 1 + vv2
∞ ∞

Sendo x 0 e t0 reais, os valores de v podem variar entre −∞ < v < ∞.


b) η = v2∞ > 0, quando então a transformação é dada por

x − vt t − vx/v2∞
x0 = q 2
t0 = q 2
, (2.86)
1 − vv2 1 − vv2
∞ ∞

Para que x0 e t0 sejam reais devemos impor −v∞ < v < v∞ .

Antes de discutirmos mais detalhadamente a escolha a ser feita para então


determinar o valor de v∞ , é importante distinguir o tempo topológico do tempo
métrico. Esta discussão tem consequências importantes para o desenvol-
vimento que faremos a seguir. Transcrevo abaixo o excelente texto de P.
Mittelstaedt acerca deste assunto 17 : 17
P. Mittelstaed, op. cit. pp. 18 - 21.

Toda e qualquer referência que façamos a respeito da evolução temporal –


empiricamente verificável – de um sistema físico se baseia no movimento [dos
ponteiros] de um relógio, i.e. num processo físico concreto. Este procedimento
é baseado por sua vez numa sequência de estados de um sistema físico e define,
assim, um ordenamento de estados no tempo e com isso uma direção temporal.
Uma escala temporal ϑ que represente esta direção no tempo é chamada de
tempo topológico. O tempo topológico é única e univocamente definido por
transformações contínuas, uma vez que todas as escalas temporais definidas
deste modo são topologicamente equivalentes . . . é importante notar aqui a
íntima relação entre ordem temporal e causalidade.
Para estabelecermos uma unidade (ou escala) de tempo, ou seja um tempo
métrico é conveniente que diferenciemos entre dois tipos de processos: os
periódicos e os monotônicos. Por periódicos entendemos um processo que
passa por uma sequência de estados repetidamente. O intervalo de tempo
necessário para passar por uma sequência completa é chamado de período τ.
O exemplo mais simples é o de um pêndulo . . . a definição da escala métrica
vem da constatação que o período τ é invariante e pode ser tomado como
unidade do tempo métrico. A vantagem desta metrificação primária baseada
em eventos periódicos está no fato que não é necessário recorrermos à métrica
de uma outra grandeza física. A desvantagem vem do fato que a subdivisão
do período em intervalos menores só pode ser obtida com o auxílio de outros
processos, cujos períodos estejam empiricamente relacionados entre si por
uma constante.

© s.r. dahmen 2022


58 uma introdução à teoria do espaço e do tempo

Mais comum, do ponto de vista físico, é o estabelecimento de uma escala de


tempo por meio de um processo monotônico, i.e. por uma sequência de estados
pelo qual o sistema passa uma única vez. O exemplo mais simples disto é do
movimento retilíneo uniforme de um corpo pelo espaço. Com o emprego de
um movimento desta natureza chega-se a um tempo métrico ao se estabelecer
que o movimento se dá de forma que espaços iguais são percorridos em tempos
iguais . . . a desvantagem é que a metrificação do tempo segundo este método
requer a pré-metrificação de outra grandeza física, neste caso o comprimento.
A vantagem desta metrificação secundária do tempo pelo movimento está no
fato que a princípio distâncias arbitrariamente pequenas podem ser definidas
e consequentemente intervalos temporais arbitrariamente pequenos.
O essencial nas palavras acima é a distinção clara entre um conceito e sua
medida: o tempo topológico está relacionado à propriedade fundamental da
causalidade na natureza, de um antes e um depois. Já no caso da auferição
do tempo, ou seja o tempo métrico, o que nos condiciona é simplesmente
nossa capacidade de determinar procedimentos e processos físicos que sejam
unívocos e reprodutíveis em qualquer laboratório.
Para resolver agora a questão do sinal da transformação, isto é escolher entre
a equação (2.85) e (2.86) imaginemos dois eventos, separados no espaço e no
tempo, e que designaremos por E1 ( x1 , t1 ) e E2 ( x2 , t2 ). Uma das imposições
que devemos fazer para que a transformação procurada seja compatível com
a física é que a causalide seja preservada pela topologia temporal, ou seja se
no referencial I existe uma relação de causa–efeito entre os eventos E1 ( x1 , t1 )
e E2 ( x2 , t2 ), esta relação deve ser preservada no referencial I 0 . Supondo
então que
∆x = x2 − x1 ; ∆t = t2 − t1 , (2.87)
pela transformação (2.85) obtemos

∆t + v∆x/v2∞
∆t0 = q 2
. (2.88)
1 + vv2

Sejam ∆x e ∆t conhecidos, com ∆t > 0. Olhando para o numerador desta


relação, basta notar que sendo −∞ < v < +∞ se escolhermos um v negativo
sujo módulo seja tal que
∆t
|v| > | | v2∞ . (2.89)
∆x
0
Isto nos leva a um ∆t < 0 o que significa que é sempre possível achar um
referencial inercial no qual a ordem dos eventos pode ser invertida. Se estes
eventos tiverem entre si uma relação de causa – efeito isto significa que a
causalidade pode ser violada, o que é fisicamente inaceitável. Portanto a
equação (2.85) não é fisicamente aceitável.
No caso da equação (2.86) obtemos

∆t − v∆x/v2∞
∆t0 = q 2
. (2.90)
1 − vv2

Para esta transformação existe uma classe de eventos Z( E1 , E2 ) para os quais


o sinal de ∆t é mantido por uma mudança de referencial
 
∆t ∆x v  ∆x
∆t0 = q 1 − >0 ⇐⇒ | | ≤ v∞ (2.91)

1− v2 ∆t v2∞ ∆t
v2∞ =v

© s.r. dahmen 2022


referenciais e a relatividade. 59

Para esta classe, caracterizada pela condição | ∆x


∆t | ≤ v∞ , uma inversão do
sinal de ∆t só seria possível se

∆t 2
|v| > | |v −→ |v| > v∞ . (2.92)
∆x ∞

Esta condição não pode ser satisfeita pois para que t seja real, a relação
−v∞ < v < v∞ , tem que ser obedecida. Existe portanto uma classe de
eventos Z( E1 , E2 ) para os quais é impossível achar uma transformação que
viole a causalidade e como consequência a única transformação admissível é
aquela representada pela equação (2.86). Existe porém, experimentalmente,
uma velocidade limite c para todos os entes físicos o que implica que v∞ = c.

2.7 Dedução 3: transformações de Lorentz e a constância da


velocidade da luz

Esta dedução, aqui apresentada de maneira um tanto simplificada, cor-


responde à dedução original de Einstein, tendo como ponto de partida a
propagação de um pulso luminoso de velocidade c a partir da origem de um
referencial inercial. Em seu trabalho original Einstein segue os passos mais
ou menos próximos aos que nos levaram ao conjunto de equações (2.80),
baseadas nas propriedades de simetria do espaço, para então introduzir o
postulado segundo o qual a velocidade da luz é a mesma para qualquer
referencial inercial e independe da velocidade da fonte.
Imaginemos que no instante t = 0 um sinal luminoso deixa a origem O de
um referencial, cuja origem coincide naquele instante com a origem O0 de
um outro referencial que se move com velocidade v em relação ao primeiro.
Passado um tempo t, esta frente de onda será dada pela equação de uma
esfera que, tanto em um referencial quanto em outro, pode ser escrita como

x 2 + y2 + z2 = c2 t2
x 02 + y 02 + z 02 = c2 t 02 (2.93)

Partindo da forma das transformações (2.73), que já levam em si as pro-


priedades de homogeneidade e isotropia do espaço, e substituindo-as na
2ªequação acima obtemos

 2
2 2 2 2 2 2 vx
( x − vt) k + y + z − c µ t− = 0. (2.94)
η

Para que esta expressão seja consistente com a primeira equação acima,
devemos impor que

µ2 c2 µ2 c2 v2
k2 − = 0; k2 − = 1; v2 k2 − µ2 c2 = −c2 . (2.95)
η η2

Como já vimos anteriormente que µ(v) = k(v), a última equação leva


diretamente à
1
k 2 = µ2 = 2 ; η = c2 , (2.96)
1 − vc2

© s.r. dahmen 2022


60 uma introdução à teoria do espaço e do tempo

e as transformações entre as coordenadas se reduzem à


x − vt
x0 = q
2
1 − vc2
y0 = y
0
z = z
0 t − vx/c2
t = q . (2.97)
2
1 − vc2

2.8 As transformações de Lorentz com velocidade árbitrária


As transformações de Lorentz até aqui apresentadas são comumente cha-
madas de Transformações de Lorentz Especiais, pela sua simplicidade e 18
O termo boost do inglês pode ser tradu-
portanto utilidade na ilustração das consequências da TER. É instrutivo zido para o português, em outros contex-
porém olharmos para a transformação mais geral possível, quando a veloci- tos, por impulso. Como em física usamos
dade relativa entre os dois referenciais não está na direção de um dos eixos o termo impulso para designar a gran-
R tf
ordenados. Uma transformação de Lorentz deste tipo, ou seja sem rotação deza ∆p = pf − pi = ti Fdt, usamos o
termo em inglês sem traduzí-lo.
relativa entre os eixos, é chamadas de boost 18 .
Para isto vamos escrever um vetor posição arbitrário r no referencial I em
duas componentes, sendo uma delas paralela à velocidade relativa v e outra
perpendicular, ou seja
r · v
r = r⊥ + rk , onde rk = v (2.98)
v2
Aplicando as transformações em rk temos para a componente r0k no referen-
cial I 0
1
r0k = γ(rk − vt); r0⊥ = r⊥ ; γ= q . (2.99)
v2
1− c2
Isso nos leva finalmente à
h r·v i  r · v
r0 = r + v (γ − 1) 2 − γt ; t0 = γ t − 2 (2.100)
v c
Observe que a transformação inversa tem exatamente a mesma forma,
bastando substituir as variáveis com apóstrofo pelas sem apóstrofo e vice-
versa (lembrando que v0 = −v. Em termos de componentes as equações
acima podem ser explicitamente escritas como abaixo:
v2 v x vy
 
v x vz
x0 = 1 + (γ − 1) 2x x + (γ − 1) 2 y + (γ − 1) 2 z − v x γt
v v v
2
" #
vy v x v y vy vz
y0 = (γ − 1) 2 x + 1 + (γ − 1) 2 y + (γ − 1) 2 z − vy γt
v v v
vz vy v2
 
vz v x
z0 = (γ − 1) 2 x + (γ − 1) 2 y + 1 + (γ − 1) 2z z − vz γt
v v v
v x + v y + v z
 
x y z
t0 = γ t − (2.101)
c2

2.9 As transformações de Lorentz com rotação


Podemos generalizar ainda mais a expressão acima considerando o caso
onde os eixos dos referencias apontam para diferentes direções do espaço, ou

© s.r. dahmen 2022


referenciais e a relatividade. 61

seja, há uma rotação de eixos. Em se tratando de Transformações de Lorentz


com rotação devemos proceder com um certo cuidado pois diferentemente
do caso de de um vetor que gira no espaço por um determinado ângulo,
nas transformações entre referenciais são os eixos que giram, e não os
objetos nele representados. Em outras palavras, quando tratamos da questão
de mudança de eixos de coordenadas para representar um evento físico
no tempo e no espaço, o que devemos ter claro é o fato que o evento
tem existência objetiva no espaço abstrato subjacente. A maneira como
os representamos é uma questão de escolha, que pode ser mais ou menos
adequada. Isto nos leva irremediavelmente a considerarmos a diferença entre
as transformações ditas passivas daquelas chamadas ativas e para melhor
entender a questão das transformações de Lorentz com rotação, devemos
primeiro entender esta diferença. Uma transformação passiva é aquela na
qual giramos o eixo de coordenadas, deixando os objetos físicos parados
em relação ao espaço físico abstrato. Uma transformação ativa é quando os
próprios objetos giram, mas os eixos de coordenadas que os representam
não mudam.
Vamos ver isto na forma de um exemplo em duas dimensões. Quando
giramos um vetor (uma grandeza física) por um ângulo θ, sabemos que
as novas coordenadas a0x , a0y podem ser escritas como função das antigas
coordenadas a x , ay via
! ! ! !
a0x cos θ − sin θ ax ax
= = R a , (2.102)
a0y sin θ cos θ ay ay

onde Ra é a matriz de rotação. Isto é um exemplo de uma transformação


ativa, isto é aquela onde o objeto físico é movido, gerando efeitos físicos
mensuráveis. Por exemplo, caso o vetor seja uma velocidade, isto levaria ao
surgimento de uma aceleração. O sistema de coordenadas não muda, o que
mudam são as projeções do objeto sobre os eixos. É importante lembrar que
estamos aqui falando de novas coordenadas de um vetor em relação a um mesmo
sistema de coordenadas. As variáveis a0x e a0y não se referem às coordenadas do vetor
por mudança de referencial. Porém, se mantivermos o vetor fixo e girarmos
os eixos ordenados por um ângulo −θ, temos uma transformação passiva.
Do ponto de vista do novo eixo, é como se o vetor tivesse girado por um
ângulo θ. As coordenadas mudam mas não pela mudança do vetor e sim
pela nova orientação dos eixos ordenados. Neste caso temos:

! ! !
a0x cos(−θ ) − sin(−θ ) ax
=
a0y sin(−θ ) cos(−θ ) ay
! !
cos θ sin θ ax
=
− sin θ cos θ ay
!
ax
= Rp . (2.103)
ay

Note que R p . Ra = 1 e portanto uma é a inversa da outra. A matriz R p é


chamada de matriz de rotação e representada simplesmente por R. Segue
assim que Ra = R−1 . Isto pode ser representado graficamente nas figuras
abaixo 19 . 19
A literatura especializada convenciona
Portanto, quando os eixos ortogonais de um sistema de sistema de coorde- que quando chamamos uma matriz R
de matriz de rotação, esta se refere sem-
nadas gira, rotação esta representada pela matriz R(α, β, γ) onde α, β e γ
pre à matriz de transformação dos eixos
ordenados, portanto da transformação
passiva. © s.r. dahmen 2022
62 uma introdução à teoria do espaço e do tempo

são os ângulos de Euler, do ponto de vista deste referencial é como se todos


os objetos por eles anteriormente representados girassem na direção inversa,
ou seja por uma rotação dada pela matriz R−1 (α, β, γ). O que é importante
frisarmos aqui que em se tratando de uma transformação de Lorentz ou
Galileu, o que estamos mudando é a representação do evento, não o evento
em si. Portanto as transformações são transformações do tipo passivas e isto
deve ser levado em conta ao consideramos as transformações de Lorentz ou
Galileu com rotação.

Figura 2.5: Figura superior: um eixo gira


O vetor a visto por I O vetor a visto por I’
em torno da origem por um ângulo θ.
y y’
Do ponto de vista do novo sistema de
a
coordenadas, é como se o vetor tivesse gi-
y’ x’ y
rado por um ângulo de −θ. Fisicamente
−θ
a o vetor não se moveu, mas sim os eixos
θ ordenados. Figura inferior: quando os
x x’
eixos giram, os pontos ( x, y) que repre-
sentam as coordenadas de um vetor são
levados à ( x 0 , y0 ) pela matriz de transfor-
mação passiva R. Quando o vetor gira
x por um ângulo α, a coordenadas ( x, y)
se transformam em ( x 0 , y0 ) segundo a
matriz inversa R−1 . Note que quando
[Mapeamento das coordenadas do vetor]
x’ = xcos θ + ysin θ
[Vetor gira por angulo α ] α = −θ, R−1 (−θ ) = R(θ ), as duas ope-
I I
I’ y’ = − xsin θ + ycos θ rações levam ao mesmo resultado final
y y
α
para ( x 0 , y0 ). Porém, é importante lem-
brar que ora usamos uma matriz, ora
y’ y’

x’ θ
outra.

x x x’

[Eixos giram por angulo θ ] [Mapeamento das coordenadas do vetor]


x’ = xcos α − ysin α

y’ = xsin α+ ycos α

Como caso ilustrativo combinemos agora uma transformação de Galileu com


rotação de eixos. Faremos esta transformação de duas formas diferentes: a
rotação seguida de um translado e depois um translado seguido de uma
rotação e mostraremos que as duas são equivalentes. Estas duas diferentes
formas de fazer a transformação estão ilustradas na figura abaixo.

Rotação e translação
Consideremos inicialmente uma rotação seguida de uma translação e olhe-
mos como ficam as coordenadas ( x, y) de um vetor posição r. Lembrando
que se para as transformações passivas as componentes do vetor se transfor-
mam pela aplicação de R−1 temos

x0 = x cos θ + y sin θ
0
y = − x sin θ + y cos θ (2.104)

Procedamos agora com a translação. Ao transladarmos as coordenadas


( x 0 , y0 ) estas vão para novas posições que não representam mais as com-
ponentes do novo vetor posição r00 conforme a figura acima mostra. Para

© s.r. dahmen 2022


referenciais e a relatividade. 63

Figura 2.6: Dois referenciais inerciais I


S gira para S’ que posteriormente translada para S’’
e I 00 que num dado instante t tem suas
S’
S
S’’ vt sin θ origens separadas por uma distancia vt
θ entre si bem como orientações diferentes
y
dadas por um ângulo θ. Na figura su-
y’’ x’
perior o referencial I sofre uma rotação
r vt
vt
y’
x’ por um ângulo θ no sentido antihorário,
y’
r’’ vt cos θ tornando-se I 0 , para depois ser transla-
x’’
O’
dado por uma distância vt até obtermos o
O O’’ x
referencial I 00 . Na figura inferior a ordem
das transformações é trocada. Primeiro
vt
S translada para S’ que posteriormente gira para S’’ I é transladado para I 0 que então sofre
S
S’’ S’ uma rotação, gerando I 00 .

y y’

y’’
r

r’’ θ
x’’

O O’ O’’ x’ x

obtermos as coordenadas ( x 00 , y00 ) corretas devemos subtrair de x 0 o termo


vt cos θ e adicionar a y0 o termo vt sin θ, isto é

x 00 = x 0 − vt cos θ
y00 = y0 + vt sin θ (2.105)

Combinando estas expressões chegamos finalmente ao resultado correto.

x 00 = ( x − vt) cos θ + y sin θ


00
y = −( x − vt) sin θ + y cos θ (2.106)

Translação e rotação
No caso de iniciarmos por uma translação temos, numa primeira etapa, as
transformações simples de Galileu

x 0 = x − vt ; y0 = y (2.107)

A isto aplicamos uma rotação obtemos

x 00 = x 0 cos θ + y0 sin θ
y00 = − x 0 sin θ + y0 cos θ (2.108)

Substituindo (2.107) em (2.108) obtemos novamente o conjunto de equações


(2.106).
As considerações acima nos permitem assim escrever as transformações
de Lorentz para eixos que apontam para direções distintas no espaço. A
transformação para o a variável t não muda. Porém, para o vetor r0 , deve-
mos primeiro considerarmos que a transformação de Lorentz sem rotação
produziria um vetor (visto por I 00 ) como sendo um vetor antes da rotação.
Como para I 00 o vetor rodado seria r00 = R−1 r0 , o vetor antes da rotação é o

© s.r. dahmen 2022


64 uma introdução à teoria do espaço e do tempo

vetor Rr00 = RR−1 r0 = r0 . Portanto a transformação de Lorentz sem rotação


é simplesmente
h r·v i
Rr00 = r0 = r + v (γ − 1) 2 − γt . (2.109)
v
e levando em conta a rotação
h r·v i
r00 = R−1 r0 = R−1 r + R−1 v (γ − 1) 2 − γt . (2.110)
v
Claramente podemos nesta expressão substituir os 00 por 0 e chamar o refe-
rencial I 00 das nossas considerações anteriores simplesmente de I 0 . Ficamos
assim com a transformação de Lorentz mais geral como sendo
h r·v i
r0 = R−1 r + R−1 v (γ − 1) 2 − γt . (2.111)
v
Podemos escrever esta transformação de outra forma se notarmos que

Rv0 = −v, (2.112)

ou seja, a velocidade relativa entre referenciais vista por I 0 (antes da rotação)


é igual à −v, como era de se esperar. Isto nos leva a concluir que a velocidade
depois da rotação vale
v0 = −R−1 v. (2.113)
Isto significa que as componentes (v0x , v0y , v0z ) não são iguais à (−v x , −vy , −vz )
como seria, obviamente, se os eixos fossem paralelos. Portanto as equações
de Lorentz com rotação podem ser escritas também como
h r·v i  r · v
r0 = R−1 r − v0 (γ − 1) 2 − γt , t0 = γ t − 2 (2.114)
v c
Para as equações inversas temos
r0 · v0 r0 · v0
   
0 0 0
r = Rr − v (γ − 1) 2 − γt , t=γ t − 2 (2.115)
v0 c
Lembremos que |v0 | = |v| = v. 20 20
Møller, op. cit., p. 43.

2.10 A velocidade e a aceleração relativísticas


Vamos agora deduzir as transformações para a velocidade e a aceleração
entre dois referenciais inerciais. Iniciemos pelas velocidades.
Imaginemos a situação física representada pela figura abaixo. Partimos da
situação física mais simples, onde os dois referenciais se movem com uma
velocidade relativa v na direção dos eixos x e x 0 colineares. Para evitar
confusão com a velocidade v entre referenciais, denotamos a velocidade de
uma partícula sempre pelas letras u e u0 . Os ângulos θ 0 e φ0 denotam os
ângulos que o vetor u0 faz com os eixos no referencial I 0 .
A dedução das transformações de Lorentz neste caso é relativamente simples.
Para isto, vamos partir das representações apropriadas para as transforma-
ções de Lorentz, a saber:

x 0 = γ( x − vt) −→ dx 0 = γ(dx − vdt)


 v   v 
t0 = γ t − 2 x −→ dt0 = γ dt − 2 dx
c c
y0 = y −→ dy0 = dy
0
z =z −→ dz = dz0 (2.116)

© s.r. dahmen 2022


referenciais e a relatividade. 65

x’1

x
1

u’

θ’

O’ x’
3

φ’ v

x3
O

x’
2

x
2

Definindo

dx 0
u0x = (2.117)
dt0

e substituindo as expressões para dx 0 e dt0 como função de dx e dt obtemos

γ(dx − vdt)
u0x =
γ[dt − (v/c2 )dx ]
γ dt [dx/dt − v]
=
γ dt [1 − (v/c2 )dx/dt]
ux − v
= (2.118)
1 − ucx2v

De maneira análoga chegamos facilmente às expressões correspondentes


para u0y e u0z , de modo a obtermos

ux − v uy
uz
u0x = u0y = . u0z =
1 − u x v/c2 γ(1 − u x v/c2 )
γ(1 − u x v/c2 )
(2.119)
Diferentemente das transformações para as coordenadas ( x, y, z), onde ape-
nas a coordenada na direção do movimento sofre uma modificação, para as
velocidades todas as três componentes mudam. Isto se deve claramente ao
fato que, embora dy0 = dy e dz0 = dz, dt0 6= dt. Um resultado interessante
desta transformação é quando a partícula se move com a velocidade da luz.
Neste caso, para efeitos de ilustração, tomando a direção da velocidade u

© s.r. dahmen 2022


66 uma introdução à teoria do espaço e do tempo

como sendo o eixo x temos

ux − v
u0x =
1 − u x v/c2
c−v
=
1 − cv/c2
c−v
=
1 − v/c
c−v
=
(1/c)(c − v)
→ u0x = c (2.120)

Não é difícil mostrar a expressão para velocidades v e u com direções


arbitrárias no espaço. Dado uma velocidade relativa v entre os referenciais
inerciais, a velocidade u sempre pode ser decomposta em uma componente
paralela uq e uma componente perpendicular u⊥ à u

u = uq êq + u⊥ ê⊥ (2.121)

onde
v = vêq , êq · ê⊥ = 0 êq · ê = ê⊥ · ê⊥ = 1 (2.122)

Nesta situação obtemos

uq − v
uq0 =
1 − vc·2u
u
u0⊥ =  ⊥  (2.123)
γ 1 − vc·2u

A dedução da aceleração segue de maneira análoga. Queremos entender


como a variação temporal de uma velocidade em um referencial se relaciona
com a variação da mesma velocidade vista por outro referencial. Partindo
da equação
u0x + v
ux = u0x v
, (2.124)
1+ c2

precisamos primeiro entender como u varia à medida que u0 varia, ou seja


quanto vale a expressão du/du0 . Fazendo as contas obtemos

 0 
du x d ux + v
=
du0x du0x 1+
u0x v
c2
v2
1− c2
=  2 . (2.125)
u0x v
1+ c2

Em outras palavras
v2
1− c2 0
du x =  2 du x (2.126)
u0x v
1+ c2

© s.r. dahmen 2022


referenciais e a relatividade. 67

Dividindo ambos os lados da equação por dt temos


v2
du x 1− c2 du0x
= 2 dt
dt 
u0 v
1+ x
c2

v2
1− c2 du0x dt0
=  2 dt0 dt (2.127)
u0x v
1+
|{z}
c2 a0x

Inserindo nesta equação a relação entre dt0 e dt, isto é


 v 
dt = γ dt0 + 2 dx 0 (2.128)
c
chegamos finalmente à à

2 3/2 2 3/2
   
1 − vc2 1 − vc2
a0x =  3 a x ou ax =  0
3 a x (2.129)
1 − ucx2v ux v
1 + c2

As equações para as acelerações nas direções y e z podem ser obtidas da


mesma maneira, embora a álgebra seja um pouco mais trabalhosa:
 2

1 − vc2  u{y,z} v/c2

a0{y,z} =  a
2 {y,z} +   a x (2.130)
1 − ux2v 1 − ucx2v
c

Vale notar que, diferentemente da mecânica newtoniana, onde a aceleração


é uma grandeza absoluta, isto é, independe do referencial, na mecânica
relativística as acelerações dependem. No limite newtoniano de baixas velo-
cidades, v/c  1, recuperamos das expressões acima o resultado esperado
a0 = a .

© s.r. dahmen 2022


3
Efeitos geométricos

Absolute, true and mathematical time, of itself


and from its own nature, flows equably
without relation to anything external.

(Isaac Newton, Principia, 1687. Trad. Andrew Motte, 1729.)

Time is duration set out by measures.

(John Locke, An essay concerning human understanding, Book II, Chapter XIV,
1689.)

Muitas vezes a dificuldade de entendermos certas consequências da TER


vem do fato que nunca paramos para pensar a respeito da maneira correta
de medirmos intervalos de tempo e distâncias no espaço. Normalmente
os procedimentos por nós usados nos parecem tão corretos – e dentro
de uma tolerância experimental eles realmente são – que mal pensamos
nas consequências do nosso próprio movimento caso tenhamos que nos
deslocar entre uma medida e outra. A TER nos força a repensar nossos
procedimentos.
O primeiro ponto a ser destacado é o fato que não faz sentido considerar
separadamente medidas de tempo e espaço, como se uma não interferisse
na outra. Quando compartimentalizamos o espaço 4-dimensional em 2
espaços disjuntos (espaço e tempo) estamos tomando um simulacro da
natureza que embora prático é, rigorosamente falando, incorreto. Não
podemos falar de um 3−espaço e um 1− espaço desacoplados, como na
mecânica de Newton, mas sim de um 4− espaço, que Minkowski chamou
de espaço-tempo 1 . Quaisquer medidas que façamos são sempre medidas 1
É bastante comum na literature especi-
num espaço quadridimensional e portanto distâncias são sempre dadas pela alizada representar o espaço-tempo 4-d
soma de 4 intervalos ∆xi2 . Discutiremos isto de maneira mais aprofundada por (3 + 1)-d para enfatizar a idéia que,
embora o espaço seja quadridimensional,
oportunamente. a métrica não é Euclideana.
O segundo ponto que merece destaque é que se estivermos observando um
evento num ponto A e outro no ponto B, separados no espaço e no tempo, na
medida em que nos deslocamos de A, com coordenadas ( x0A , x1A , x2A , x3A ) =
(t A , x A , y A , z A ), para B, com coordenadas ( x0B , x1B , x2B , x3B ) = (t B , x B , y B , z B ),
não podemos levar um relógio conosco. Isto porque – embora o efeito seja
70 uma introdução à teoria do espaço e do tempo

imperceptível – ao carregarmos conosco um relógio, ele será brevemente


acelerado quando saímos do ponto A onde nos encontrávamos, se deslocará
com velocidade aproximadamente constante até o ponto para onde nos
dirigimos e se desacelerá quando paramos em B. Durante toda esta viagem
o relógio sofrerá o efeito da dilatação temporal e ele não marcará mais o
tempo correto. Se tivéssemos um relógio parado em B e o comparássemos
com o relógio que carregamos, veríamos (desde que tivéssemos precisão
suficiente) uma diferença entre os dois relógios. É por este motivo que na
Teoria da Relatividade sempre se imagina que em todo ponto do espaço de
um dado referencial inercial se encontra um relógio, que marca a coordenada
t de quaisquer eventos que ali possam ocorrer. Isto significa que se um
objeto sai em t A de um ponto A e chega em t B no ponto B, os tempos t A e
t B são registrados por relógios diferentes mas sincronizados entre si. Em um
dado referencial inercial S, todos os relógios marcam o mesmo tempo. Neste
sentido, poderíamos dizer fazendo uso de uma certa liberdade linguística,
que o tempo em um RI é universal, pois é igual em qualquer ponto do
espaço, embora não absoluto, uma vez cada referencial inercial tem seu
próprio tempo “universal”. Só devemos ter cuidado com a acepção do termo
universal aqui usado.
No mundo relativístico, nunca usamos um único relógio, a não ser que
façamos a medida num mesmo ponto do espaço. De novo: na prática
não procedemos desta maneira pois os efeitos relativísticos para a imensa
maioria dos fenômenos cotidianos são desprezíveis, mas devemos sempre
ter em mente o fato que todo sistema inercial tem associado a cada ponto um
relógio e quando estamos comparando medidas temporais entre referenciais,
estamos comparando medidas feitas por um conjunto de relógios de um
referencial com o conjunto de relógios de outro referencial. Isto significa
que não devemos comparar diretamente relógios que se movem entre si
mas intervalos medidos por estes diferentes conjuntos de relógios. Se
tivermos isto claro em mente, teremos menos dificuldade de entender as
consequências daquilo que vamos discutir nas próximas páginas. Fosse a
velocidade da luz, digamos, da ordem da velocidade do som, teríamos que
levar a Relatvidade em conta, pois a razão v/c não seria mais desprezível.
Nossa idéia de medidas seria completamente diferente.
Vejamos agora estas mudanças trazidas pela Relatividade em detalhes.

3.1 A contração de Lorentz–FitzGerald e a dilatação do tempo


Entre as consequências mais fascinantes das transformações de Lorentz
temos a contração do espaço (contração de Lorentz-FitzGerald) e a dilatação
do tempo. Estas são também as propriedades que mais induzem as pessoas
a cometer erros quando comparando intervalos de tempos e distâncias
entre diferentes referenciais inerciais e estão na origem de alguns dos mais
conhecidos paradoxos. Vamos entender problema a questão da medição do
comprimento de um objeto.

3.1.1 Medindo comprimentos


Muitas vezes a dificuldade de entendermos certos aspectos da TER vem
do fato que nunca paramos para pensar a respeito da maneira correta de

© s.r. dahmen 2022


efeitos geométricos 71

v
medirmos intervalos de tempo e distâncias. Normalmente o processo que
utilizamos para medir um objeto parado (ou uma distância entre 2 pontos) é
primeiro cauda, depois cabeca

tão intuitivo que raramente nos perguntamos se ele é adequado: colocando


sucessivamente uma régua ao longo do corpo ou entre 2 pontos, régua esta L’

suposta perfeitamente rígida e de um comprimento padrão. O comprimento


ou a distância será obviamente um múltiplo deste padrão, observadas primeiro cabeca, depois cauda

as respectivas precisões experimentais. Não há nada de errado com este


L’’
procedimento. O problema surge quando tentamos medir o tamanho de um
objeto em movimento. Qual a maneira correta de fazê-lo? cauda e cabeca simultaneamente

Consideremos o exemplo de um peixe que passa nadando com velocidade


L
v por nós, parados na margem do rio. Como a figura ao lado ilustra, se
fizéssemos uma medida da cauda e da cabeça em tempos diferentes (no Figura 3.1: O procedimento de medida
nosso referencial parado) poderíamos obter um valor de comprimento maior do comprimento de um peixe de tama-
ou menor daquele que obteríamos caso o peixe estivesse em nossas mãos. nho L que se move em relação ao ob-
servador. O observador mede a posi-
Notemos que nem estamos aqui falando de Relatividade de Einstein, mas
ção da cauda em t1 e da cabeça em
sim da Relatividade de Galileu, pois se aplicarmos estas últimas transfor- t2 > t1 . Como o peixe se deslocou
mações entre as coordenadas ( x 0 , t0 = t) de nosso RI e as coordenadas ( x, t) por uma distância v(t2 − t1 ) o obser-
do RI do peixe, caso façamos as medidas em tempos t2 6= t1 obteremos um vador obterá um comprimento igual a
comprimento L0 da forma L0 = L + v(t2 − t1 ). Se medir primeiro
a cabeça e depois a cauda, o resultado
L 0 = L ± v ( t2 − t1 ) (3.1) será L00 = L − v(t2 − t1 ). Para obter o
comprimento correto as medidas devem
e portanto um valor diferente do comprimento do peixe. Portanto, para me- ser feitas simultaneamente.
dir corretamente o tamanho de um objeto que se move em relação ao nosso
referencial, devemos medir a posição dos seus extremos simultaneamente.
Poderíamos argumentar que se soubéssemos a velocidade do peixe, bastaria
cronometrar o tempo ∆t que o peixe leva para passar por nós e usarmos a
relação ∆x 0 = v∆t, identificando assim o ∆x 0 com o comprimento do peixe.
Porém, embora isto pareça razoável e usemos em certas situações, é preciso
antes saber a velocidade do objeto. No processo da medição simultânea das
extremidades, todas as medidas são feitas a partir de relógios e réguas no
nosso referencial, sem que dependamos de qualquer parâmetro da dinâmica
do objeto a ser medido.
Consideremos agora o caso relativístico e vejamos quais as consequências
da correta medida do comprimento de um objeto em movimento.
Imaginemos primeiramente uma barra que está em repouso em relação ao
referencial móvel S0 e cujas pontas tem as coordenadas x10 e x20 independentes
do tempo. Para medirmos um objeto em um referencial no qual ele se
encontra em repouso, adotamos um procedimento padrão: colocamos,
sucessivamente, réguas padrão ao longo do objeto e contamos o número
de réguas (e/ou frações desta) que perfazem seu comprimento. Para o
referencial S, a barra se move na direção do eixo x positivo com velocidade
v. A pergunta é: qual o comprimento da barra visto do referencial S, parado?
O comprimento da barra medido por alguém no referencial no qual ela se encontra
em repouso – neste caso o referencial S‘ – é dado por l00 = x20 − x10 e recebe o
nome de comprimento próprio. No laboratório S, por outro lado, a medida
simultânea em t = t1 = t2 das extremidades da barra nos dão o comprimento
l = x2 − x1 . Mas sendo, segundo as transformações de Lorentz

l00 = x20 − x10 = γ( x2 − vt2 ) − γ( x1 − vt1 )


= γ ( x2 − x1 ) − γ v ( t2 − t1 )
= γl, (3.2)

© s.r. dahmen 2022


72 uma introdução à teoria do espaço e do tempo

disto segue que


1 0
l= l (3.3)
γ 0
Como γ > 1, o comprimento l medido por S é menor que comprimento
próprio l00 do referencial S0 . Este fenômeno é conhecido como a contração de
Lorentz-FitzGerald.

Aqui surge uma confusão com relação à ideia da contração de Lorentz.


Façamo-nos a pegunta: se uma régua estiver parada não mais em relação à
S0 mas em relação à S, qual será seu comprimento visto do referencial S0 ?
Chamando de l0 o comprimento próprio da régua em S, somos tentados a
usar a equação deduzida acima e S escrever

1 0
l0 = l −→ l 0 = γ l0 (3.4)
γ

Como γ > 1, se o resultado acima estivesse correto S0 veria o objeto alon-


gado! Este resultado está errado, pois se uma régua tem, digamos, um
comprimento próprio de 1 metro num referencial, ela terá o mesmo com-
primento próprio de 1 metro em qualquer outro referencial inercial no qual
esteja parada. O resultado acima, se correto, violaria a completa equivalência
dos referenciais inerciais pois a contração deve valer para as duas situações,
que são completamente equivalentes. Onde está o erro de raciocínio? O erro
está na interpretação das transformações de Lorentz: embora referenciais
inerciais sejam equivalentes, quando aplicamos as fórmulas devemos sempre
distinguir quem se “move” de quem está “parado”. Se S está parado e S0 se
move usamos
x 0 = γ ( x − vt) (3.5)
de onde segue que quando medimos em S um objeto parado em S0 , tomando
t2 = t1 chegamos à

1
∆x 0 = γ ∆x → ∆x = ∆x 0 . (3.6)
γ

Quando pensamos em S0 parado e S se movendo (com velocidade −v)


escrevemos as transformações como

x = γ ( x 0 + vt0 ) (3.7)

de onde segue que quando medimos em S0 um objeto parado em S0 , to-


mando t20 = t10 chegamos à

1
∆x = γ ∆x 0 → ∆x 0 = ∆x. (3.8)
γ

Notemos que a transformação inversa de Lorentz não é obtida simplesmente


isolando x do lado direito da equação (3.5) e escrevendo

x0
x= + vt (3.9)
γ

pois nesta equação o t se refere ao tempo medido em S. A transformação


correta (3.7) tem que ter, do lado direito, as variáveis (t0 , x 0 ) referentes
ao referencial S0 . Portanto nosso erro estava em simplesmente usar uma
equação (3.4) que é condizente com (3.5) e não com (3.7), esta sim correta

© s.r. dahmen 2022


efeitos geométricos 73

para a transformação inversa. Isto deixa bastante claro o ponto em questão:


as medidas de comprimento feitas em um referencial devem ser simultâneas.
A equação (3.4) está errada pois envolve a simultaneidade em S (onde
relógios registram t) e não a simultaneidade em S0 (cujos relógios registram
t0 ). Basicamente esta dilatação observada nada mais é o mesmo fenômeno
observado quando medimos o peixe incorretamente. Este é o motivo também
pelo qual não faz sentido escrever l00 e l0 para o comprimento próprio de
um objeto pois este é, por definição, sempre igual nos referenciais onde o
objeto se encontra parado. Assim, de agora em diante, deixaremos de usar
um apóstrofo para indicar uma diferença que não existe.

3.1.2 Medindo intervalos de tempo


De modo análogo podemos estudar como os intervalos de tempo entre
eventos são registrados de maneira diferente por conjuntos de relógios de
diferentes referenciais inerciais. Um relógio que não sai do lugar em um
referencial mede o que chamamos de tempo-próprio, ou seja, ∆t = t2 − t1
onde x2 = x1 . Muitos autores usam a notação ∆τ para se referirem ao tempo
próprio. Embora esta notação não seja adotada por todos, ela nos ajuda
pois reservamos a notação ∆t apenas para tempos medido por relógios em
diferentes pontos do espaço, ou seja ∆t = t2 − t1 quando x2 6= x1 . Notem
que por exemplo que quando um trem sai de A e vai até B, o tempo de
viagem ∆t = t B − t A envolve sempre a medida feita por 2 relógios em
diferentes pontos do espaço para quem ficou na plataforma da estação. Já
um relógio que está fixo no trem e portanto não sai do lugar no RI do trem,
mede um tempo-próprio ∆τ que é diferente de ∆t, como veremos a seguir.
Imaginemos então a situação de um relógio num referencial S0 que se move
com velocidade v em relação ao referencial S. No referncial S parado, o
tempo transcorrido ∆t = t2 − t1 medido entre a passagem de um relógio
fixo em S0 pelos pontos x1 em t1 e x2 em t2 vale
v 0 v
∆t = t2 − t1 = γ(t20 + x ) − γ(t10 + 2 x10 ) = γ ∆t0 . (3.10)
c2 2 c
Obtemos assim a famosa equação para a dilatação do tempo
1
∆t = √ ∆t0 = γ ∆τ. (3.11)
1 − v2 /c2
O intervalo de tempo observado no referencial parado é sempre maior
(γ > 1) que o tempo-próprio medido por um observador em movimento.

3.2 O problema da medida da barra


Um dos problemas que nos ajuda a entender bem o conceito da dilatação
do tempo e ressaltar um tipo muito comum de confusão com relação ao
conceito de tempo próprio é dado pelo seguinte anunciado:

Uma barra que tem, em repouso, um comprimento l 0 passa por você com uma
velocidade v na direção de seu comprimento.
(a) Quanto tempo ela leva para passar por você, um observador no referencial S
“em repouso”?

© s.r. dahmen 2022


74 uma introdução à teoria do espaço e do tempo

(b) Quanto tempo leva esta passagem no referencial S0 da barra?


(c) Há uma contradição entre os resultados e a dilatação do tempo?
Vamos resolver inicialmente o problema dos diferentes intervalos de tempo
(quando medidos pelos diferentes referenciais) para depois então analisar
a questão da possível discrepância entre as medidas e a idéia de dilatação
temporal e tempo próprio (que, raramente, alguns autores chamam de tempo
intrínseco).

3.2.1 Resolução do problema


Vamos considerar a figura abaixo que representa o ponto de vista do refe-
rencial S, ou seja, aquele no qual se encontra um observador que vê a barra
passar. Para o observador parado, se ele medisse a barra, obteria um valor
(devido à contração de Lorentz) dado por

l0
l= (3.12)
γ
No referencial S, um objeto de tamanho l = l 0 /γ que tem uma velocidade v
leva um tempo (t2 − t1 ) para passar pelo observador, tempo este dado por

l l0
t2 − t1 = = . (3.13)
v vγ

Figura 3.2: A passagem da barra de com-


z’
primento l 0 /γ pelo observador parado
em S. Note que os tempos t1 e t2 medi-
z v dos pelo observador O correspondentes
t
2
à passagem do início e do final da barra
por ele, respectivamente, e são feitas na
v mesma coordenada x do observador.
l’ / γ

v
t
1
O’ x’

x
O

y’

y’

Vamos ver agora o que acontece do ponto de vista do referencial da barra.


Para ela, tudo se encontra parado e seu comprimento vale l 0 , como sabemos.
O que ela vê portanto é o observador vindo no sentido contrário com uma
velocidade −v. Ao chegar na frente da barra em t10 (segundo a barra) o
observador percorre a distância correspondente ao comprimento da barra até
chegar ao final dela em t20 . Novamente, o intervalo de tempo da passagem
do observador pela barra, do ponto de vista da barra, vale

l0
t20 − t10 = . (3.14)
v

© s.r. dahmen 2022


efeitos geométricos 75

Isto nos leva a concluir que

l0 l0
> −→ (t20 − t10 ) > (t2 − t1 ) (3.15)
v vγ

ou seja, o intervalo de tempo do ponto de vista da barra é maior que o


intervalo de tempo do ponto de vista do observador. Para fixar melhor as

Figura 3.3: A passagem do observador


z’
pelo comprimento l 0 da barra visto do re-
ferencial da barra. Note que as medidas
z temporais da passagem do observador O
pela barra são feitas em pontos diferentes
do espaço no referencial S0 .
t’ t’
2 1
−v l’

O’ x’

x
O

−v
y’

y’

idéias, imaginemos que a barra tenha em seu refencial o tamanho de 1 m


e se mova com uma velocidade v = 0.8c. Nesta caso 1/γ = 0.6. Para o
observador a barra terá 0.6 m e demorará um tempo

l l0 0.6 0.75
t2 − t1 = = = = . (3.16)
v vγ 0.8c c

Do ponto de vista da barra transcorrerá um tempo

l0 1.0 1.25
t20 − t10 = = = . (3.17)
v 0.8c c

Estes resultados significam que no referencial da barra passou mais tempo


que no referencial do observador.
A pergunta que fica agora é a seguinte: este resultado é compatível com a
dilatação do tempo? Afinal, nos parece que se há dilatação do tempo, ela
deve ser recíproca, ou seja, é possível obter o resultado “inverso” pois os
dois referenciais são equivalentes. Isto aparentemente contradiz o resultado
acima pois mostramos efetivamente que a barra observa uma passagem
de tempo maior no seu referencial do que o observador observa no seu
para os mesmos eventos físicos: a passagem das extremidades da barra
pelo observador (no caso da barra, a passagem do observador por suas
extremidades). Na verdade não há nada de errado em nossos cálculos e
nos resultados por nós obtidos. O problema é que sempre que falamos
de equivalência de referenciais, temos que especificar exatamente quais
medidas estão sendo feitas e comparadas entre si.

© s.r. dahmen 2022


76 uma introdução à teoria do espaço e do tempo

3.3 O tempo próprio


No exemplo acima, olhando do ponto de vista do observador O, a passagem
da frente e da traseira da barra ocorrem no mesmo ponto do espaço, pois
ele não sai do lugar. Assim o intervalo ∆t por ele medido é realmente um
tempo próprio e o resultado que obtivemos para ∆t0 medido no referencial
da barra é compatível com a dilatação do tempo: a barra vê o observador
“envelhecer” menos pois a barra está comparando o tempo próprio de outro
referencial com a passagem de tempo em seu referencial (na transformação
de Lorentz ∆x = 0).
O tempo que a barra mede para a passagem de O não é um tempo próprio
pois ela faz esta medida em pontos diferentes do espaço. Assim, não tem
como esperarmos a simetria na situação pois o tempo medido em S0 não é
um tempo próprio neste referencial. Portanto S não tem como achar um
∆t0 menor que seu ∆t. Resumindo: para que a dilatação valha nos dois
sentidos, temos que comparar um tempo próprio em S com o intervalo
medido em S0 e um tempo próprio em S0 como medido por S. No caso
acima a passagem do observador pela barra não é um tempo próprio no
referencial da barra. Se tivéssemos porém um outro intervalo de tempo em
S0 que fosse um tempo próprio, e que tivesse a mesma duração em segundos
que o intervalo próprio ∆t em S, aí sim os dois referenciais veriam o tempo
próprio do outro referencial dilatado.
Para mostrar como as medidas acima são perfeitamente compatíveis com as
transformações de Lorentz, coloquemos a pergunta de outro modo. Sabemos
que a barra mediu um tempo ∆t0 . A qual intervalo de tempo corresponde
esta medida no referencial S? As medidas obtidas acima são compatíveis?
Para respondermos esta pergunta basta aplicarmos as transformações de
maneira correta. Olhando para a transformação
β 0
∆t = γ(∆t0 + ∆x ) (3.18)
c
podemos, dado o ∆t0 e o ∆x 0 calcular o valor de ∆t. Sabemos que

l0
∆t0 = ; ∆x 0 = −l 0 (3.19)
v
onde o sinal negativo em l 0 se deve ao fato que para o problema em questão, a
barra é percorrida da extremidade de coordenada maior para a extremidade
de coordenada menor. Por isso a t20 > t10 corresponde x20 < x‘1 e o ∆x 0
portanto deve ser negativo2 . Partindo destes valores e substituindo-os na 2
Devemos sempre ter cuidado ao usar-
equação acima obtemos mos as transformações de Lorentz pois
devemos associar ao tempo ti a coorde-
l0 γ l0 v2 nada espacial xi correspondente.
 
v 0
∆t = γ( − 2 l ) = 1− 2 . (3.20)
v c v c
Lembrando que
v2 1
1− = 2 (3.21)
c2 γ
chegamos finalmente à

γ l0 1 l0
∆t = × 2 = , (3.22)
v γ γv
ou seja, recuperamos o resultado que obtivemos no início destas notas.

© s.r. dahmen 2022


efeitos geométricos 77

Talvez para esclarecer um pouco melhor esta questão olhemos pelo seguinte
ponto de vista. Consideremos a transformação

v v v
∆t0 = t20 − t10 = γ(t2 − 2 x2 ) − γ(t1 − 2 x1 ) = γ ∆t − γ 2 ∆x (3.23)
c c c
Todos os relógios em S, que marcam o tempo t, estão sincronizados. A
pergunta é: o que mostram os relógios em S0 num dado instante de tempo t
fixo? Se t é fixo, naquele instante todos os relógios em S marcam o mesmo
tempo e portanto ∆t = 0. Disto segue que
v
∆t0 = t20 − t10 = −γ 2 ∆x, (3.24)
c
ou seja, visto de S, todos os relógios em S0 estão dessincronizados e esta
dessincronização varia continuamente com a distância entre os relógios
medidas por S. Notem também que a dessincronização independe do tempo
t fixo que escolhemos. Para ilustramos isto, simplifiquemos um pouco a
discussão considerando que instante em que as origens coincidem, ajustemos
os relógios tal que t = 0 = t0 e x1 = 0. Chamando x2 = x temos
v
t0 ( x, t = 0) = −γ x. (3.25)
c2
Portanto, para S, todos os relógios de S0 à sua esquerda (eixo x negativo)
estão marcando um tempo maior que t = 0 e os relógios à sua direita (eixo
x positivo) estão marcando um tempo menor. Ou seja, os primeiros estão
adiantados em relação ao tempo marcado em S e os outros atrasados. A
figura ao lado ilustra isto.

Figura 3.4: Dois referenciais inerciais


tem, cada um, um conjunto de relógios
sincronizados entre si que. Dentro de
um RI todos marcam a mesma hora. Po-
rém, quando um referencial tenta aferir
os relógios de outro referencial inercial,
ele verá uma dessincronização destes últi-
mos, conforme ilustra a figura abaixo: os
relógios de S0 à esquerda da origem estão
adiantados, aqueles à direita atrasados.

t’(x,0)

adiantados

t=0

3.4 Os muons e a dilatação do tempo.


Embora o experimento que vamos agora descrever e que comprova o fenô- atrasados

meno da dilatação do tempo seja hoje verificado com grande precisão em

© s.r. dahmen 2022


78 uma introdução à teoria do espaço e do tempo

aceleradores de partículas, olhemos para a idéia dos experimentos originais


onde este fenômeno foi pela primeira vez comprovado. Estamos falando
aqui dos muons, partículas muito semelhantes aos elétrons (tem carga ele-
mentar −1 e spin 1/2) mas aproximadamente 200 vezes mais pesados que
estes. Os muons são um produto do decaimento dos mésons Π. Estes mé-
sons, em número de três (Π+ , Π− e Π0 ), são partículas subatômicas gerados
pelos prótons de alta energia que chegam com a radiação cósmica quando
estes interagem com as moléculas da alta atmosfera. Os mésons Π± e Π0 são
instáveis: os primeiros tem uma vida média de 26.033 ns ao passo que para
o último este valor é de 8.5 × 10−18 s (8.5 attosegundos). Os píons decaem
em múons e isto ocorre dentro de poucos metros atmosfera adentro. Estes
por sua vez tem uma meia-vida bem maior, da ordem de 2.197 µs. Mesmo
com a velocidade altíssima da ordem de v = 0.9997c, esta meia-vida não
é suficiente para que eles atinjam o solo. Não obstante, aproximadamente
10 000 deles atingem o solo por m2 a cada minuto e isto se deve ao efeito
relativístico da dilatação do tempo.
O experimento original foi baseado na seguinte ideia: dada a meia-vida
própria τo de um muon, o número de muons N (t) em um dado tempo t
vale
N (t) = N0 e−t/τo (3.26)
onde N0 é número de muons criados na alta atmosfera, que desconhecemos.
Porém, se medirmos o fluxo médio de muons a uma altitude h e seu fluxo
médio no solo (h = 0), temos que
∆Φo fluxo no solo
= = e−∆t/τo (3.27)
∆Φh fluxo a uma altura h
onde ∆t é o tempo necessário para o muons percorrerem a distância h. No
experimento original a diferença de altitude entre as medições era de 1907
metros 3 . Para facilitar as contas vamos tomar um h = 2000 metros. Neste 3
D. H. Frisch and J. H. Smith, Measu-
caso o ∆t que os mésons precisam para percorrer esta distância vale rement of the relativistic time dilation of µ
mesons, American Journal of Physics 31
2 × 103 m (5) (1963), 342 -355.
∆t = = 6.4 × 10−6 s. (3.28)
0.9997 × 3 . 108 m s−1
ou seja, um intervalo cerca de 3 vezes maior que sua vida média. Com este
valor obtemos de (3.29) que
∆Φo
= 0.054, (3.29)
∆Φh
ou seja, deveria haver uma queda de aproximadamente 95% no fluxo entre
h = 1907 m e h = 0 m. Porém, a razão observada foi de 0.73, ou seja uma
queda de apenas 17%. Isto significa que haviam mais muons atingindo o solo
e a única explicação é que estes estavam “vivendo”um tempo mais longo do
que o esperado. Para uma queda de fluxo de apenas 17% deveriamos ter
uma subpartícula de vida-média dada por

0.73 = e−∆t/τ = e−(6.6×10 s)/τ


−6
→ τ = 20.971µ s. (3.30)

Esta vida média é quase 10 vezes maior que a vida-média no referencial do


muon (medido no seu tempo próprio). Da dilatação do tempo sabemos que
o fator de Lorentz envolvido deve ser

τ = γ τo → 20.971 = γ (2.197) → γ = 9.55. (3.31)

© s.r. dahmen 2022


efeitos geométricos 79

e isto corresponde a uma velocidade v do muon, visto da Terra, de


−1/2
v2

γ= 1− → v = 0.9945c, (3.32)
c2

um resultado condizente com a previsão relativística da dilatação temporal.


Notem que este valor de v difere um pouco do valor usado mais acima
v = 0.9997c pois o valor 0.73 que utilizamos na parte final dos nossos
cálculos é o resultado experimental de um experimento que tinha um
∆h = 1907 m e que foi feito entre duas localidades separadas por centenas
de quilômetros uma da outra. Além do mais, é preciso considerar a perda
de muons devido à interação com a atmosfera entre os laboratórios. Esta
velocidade é condizente com os valores para v obtidas nos experimentos.
Do ponto de vista do muon, a explicação do fenômeno é a contração do
espaço. Para o muons, a distância l a ser percorrida é menor que a distância
própria lo = 2000 metros. Ela vale

1 2000 m
l= lo = = 209.42 m (3.33)
γ 9.55

Para o múon, num tempo de τo = 2.197 µs ele pode percorrer uma distância
de
∆h = 0.9945c × 2.197 × 10−6 s = 655 m (3.34)
e portanto ele chega ao solo.

3.5 A classificação de intervalos espaço-temporais


e o princípio da causalidade
As transformações de Lorentz

∆x 0 = γ (∆x − v∆t); ∆x = γ (∆x 0 + v∆t0 )


β β
∆t0 = γ (∆t − ∆x ); ∆t = γ (∆t0 + ∆x 0 ) (3.35)
c c
nos indicam claramente que os intervalos entre eventos físicos tem valores
relativos pois ∆x 0 T ∆x e também ∆t0 T ∆t. Nosso objetivo aqui é entender
sob quais condicões isto ocorre.
A diferença entre intervalos espaciais não nos causa muito espanto pois
estamos acostumados a ela no dia a dia: um observador pode dizer que
dois eventos ocorreram num mesmo local do espaço, se ele se encontra
por exemplo dentro de um veículo que se move, ao passo que para um
observador “parado” os mesmos eventos ocorrerão em diferentes pontos
do espaço. Nossa dificuldade maior está em entender que o intervalo
temporal entre dois eventos depende do referencial do observador, algo que
não percebemos em função do altíssimo valor da velocidade da luz. Para
facilitar um pouco a notação a ser usada daqui para a frente, vamos chamar
a distância entre dois eventos E1 (x1 , t1 ) e E2 (x2 , t2 ) de ∆x12 e o intervalo
temporal de ∆t12 , ou seja
2
∆x12 = ( x2 − x1 )2 + ( y2 − y1 )2 + ( z2 − z1 )2
= (∆x )2 + (∆y)2 + (∆z)2
∆t12 = t2 − t1 = ∆t (3.36)

© s.r. dahmen 2022


80 uma introdução à teoria do espaço e do tempo

Nós sabemos que o intervalo ∆s212 é um invariante por transformações de


Lorentz, ou seja
02 02
∆s212 = c2 ∆t212 − ∆x12
2
= c2 ∆t12 − ∆x12 (3.37)

Vamos supor que num dado referencial I os intervalos ∆x12 e ∆t12 são
diferentes de zero. Ou seja, para S, eles ocorrem em diferentes pontos do
espaço em diferentes tempos. Escolhamos agora um referencial S0 , também
inercial, e nos coloquemos as seguintes perguntas:

(1) é possível escolher um referencial S0 onde os eventos ocorrem no mesmo


ponto do espaço?
(2) Existe um referencial S0 onde os eventos ocorrem no mesmo instante de
tempo?
(3) Seria possível encontrar um referencial S0 onde os eventos ocorressem
no mesmo ponto do espaço e ao mesmo tempo?

Vamos tentar responder estas perguntas uma a uma.

3.5.1 (a) Eventos no mesmo ponto do espaço e os intervalos tipo-


tempo
Se queremos que dois eventos em diferentes pontos do espaço no referencial
S ocorram no mesmo ponto do espaço no referencial S0 , devemos impor que
0 = 0. Pela eq. (3.37) isto significa que
∆x12
02
∆s212 = c2 ∆t212 − ∆x12
2
= c2 ∆t12 ≥0 (3.38)

Isto significa que o intervalo ∆s12 deve ser real. Neste caso obtemos

0 1
∆t12 = ∆s (3.39)
c 12
Em outras palavras, existe um referencial S0 onde dois eventos não coin-
cidentes em S ocorrem no mesmo ponto do espaço em um intervalo de
tempo real (e que portanto existe!). Por este motivo, intervalos para os quais
∆s2 ≥ 0 (isto é, s é real) recebem o nome de intervalos tipo-tempo (time-like
intervals).
A condição física para que um intervalo seja do tipo-tempo é que ∆x12 < c ∆t12 . O
significado físico desta expressão é simples: a distância ∆x12 entre dois even-
tos é sempre menor que a distância que a luz percorre no mesmo intervalo de
tempo e portanto o evento E1 pode ser a causa do evento E2 pois dentro do
intervalo de tempo em questão um sinal que se propaga com a velocidade
da luz teria tempo de sair de x1 e chegar a x2 . Não necessariamente dois
eventos separados por um intervalo tipo-tempo guardam uma relação de
causa–efeito entre si, mas toda relação causa–efeito necessariamente é um
intervalo tipo-tempo. Vamos mostrar isto mais detalhadamente.
Considere uma partícula com massa de repouso diferente de zero (a grande
maioria das partículas com as quais lidamos na natureza). Vamos supor,
visando simplificar a discussão, que a partícula se mova na direção do eixo x
positivo e percorra uma distância ∆x em um intervalo de tempo ∆t quando
observada a partir do referencial S. No referencial S0 a mesma partícula
percorre uma distância ∆x 0 em um tempo ∆t0 . Obviamente a velocidade da

© s.r. dahmen 2022


efeitos geométricos 81

partícula é u = ∆x/∆t no referencial S. Levando em conta as transformações


de Lorentz acima temos
∆x
 
∆x 0 = γ (∆x − v∆t) = γ ∆t − v = γ ∆t (u − v)
∆t
v ∆x
 
v  uv 
∆t0 = γ (∆t − 2 ∆x ) = γ ∆t 1 − 2 = γ ∆t 1 − 2 (3.40)
c c ∆t c

Olhando para esta expressão é fácil ver agora qual a velocidade relativa
entre os referenciais para que nossa pergunta original, isto é, se é possível
ter um ∆x 0 = 0 seja satisfeita. Tomando ∆x 0 = 0 na primeira das equações
acima temos que necessariamente u = v, ou seja, no referencial que se move
com a partícula os eventos ocorrem no mesmo ponto do espaço, como era
esperado.
Um outro resultado importante diz respeito ao sinal de ∆t e o sinal de
∆t0 para eventos separados por intervalos tipo-tempo. Suponhamos que
∆t > 0, ou seja, o evento E2 ocorre depois do evento E1 no referencial S.
Para que ∆t0 > 0, olhando para a segunda das equações acima, temos que
obrigatoriamente  uv 
1− 2 > 0 (3.41)
c
Porém, esta condição é sempre satisfeita pois a velocidade de qualquer objeto
com massa de repouso diferente de zero é sempre menor que c. Mas isto
vale para quaisquer intervalos tipo-tempo, pois olhando mais atentamente
para a expressão acima podemos reescrevê-la como

v ∆x
 
1− (3.42)
c c ∆t

Mas pela definição de intervalos tipo-tempo, sempre vale ∆x < c∆t, ou


seja, a distância entre os eventos é sempre menor que a distância que a luz
percorre no mesmo intervalo de tempo. Em outras palavras, a condição
∆x < c∆t vale a fortiori e consequentemente u/c < 1 sempre e ∆t0 > 0.

Portanto, para intervalos tipo-tempo, os conceitos de “antes” e “depois” são absolu-


tos: dois eventos separados por um intervalo tipo-tempo sempre mantém a ordem
temporal dos eventos, independentemente do referencial inercial escolhido. A ordem
temporal dos eventos não pode ser mudada.

Repetindo, intervalos tipo-tempo entre 2 eventos podem guardar (mas


não necessariamente guardam) uma relação de causa–efeito entre si. Isto
porque se E1 ocorresse, uma interação que se propagasse com velocidade c
chegaria ao evento E2 antes que este ocorresse. Como nada se propaga com
velocidade maior que c, na hipótese de um “sinal” sair de E1 e chegar a E2 ‘,
o primeiro pode ser a causa do segundo.

3.5.2 (b) Eventos no mesmo instante de tempo e os intervalos tipo-


espaço

Vamos agora considerar intervalos para os quais ∆s212 < 0, ou seja ∆s12 é
imaginário. Nosso objetivo é achar um referencial S0 no quais dois eventos
não simultâneos em S sejam simultâneos em S0 , ou seja, ∆t12
0 = 0.

© s.r. dahmen 2022


82 uma introdução à teoria do espaço e do tempo

Aplicando o mesmo raciocínio aplicado anteriormente, temos que para um


intervalo ser do tipo-espaço, a condição a ser satisfeita é

∆x12 > c∆t12 (3.43)

Seria possível achar um referencial S0 para o qual ∆t0 = 0 mesmo quando


∆t 6= 0? Se ∆t0 = 0, então das transformações de Lorentz temos
c∆t
v=c (3.44)
∆x
o que implica que ∆x > c∆t pois só assim a velocidade relativa v entre dois
referenciais inerciais será menor que c. Mas isto também implica que, com
uma escolha apropriada de v, o fator

v ∆x
 
1− (3.45)
c c ∆t

pode ser negativo. Neste caso ∆t0 tem o sinal contrário ao de ∆t e a ordem
temporal de eventos pode ser invertida: o “antes” de um referencial passa a
ser o “depois” de outro referencial.

Portanto, para intervalos tipo-espaço, os conceitos de “antes” e “depois” são relativos:


dois eventos separados por um intervalo tipo-espaço podem ter a ordem temporal dos
eventos invertida, dependendo do referencial inercial escolhido. A ordem temporal
dos eventos pode ser mudada. Eventos causais não podem ser representados por
intervalos tipo-espaço.

3.5.3 (c) Eventos no mesmo instante de tempo e no mesmo ponto


do espaço: os intervalos tipo-luz
Se quisermos que um evento ocorra no mesmo ponto do tempo e do espaço,
0 = 0 e ∆x 0 = 0, as duas condições
ou seja, ∆t12 12
0
∆s12 ≥ 0 e ∆s12 ≤0 (3.46)

deveriam ser satisfeitas simultaneamente. Mas isto só é possível se ∆s12 =


0 = 0. Isto só é possível para corpos de massa de repouso diferentes de
∆s12
zero se os eventos coincidirem, ou seja, E1 e E2 forem o mesmo evento. Outro
tipo de evento para os quais ∆s12 = ∆s12 0 = 0 são aqueles da propagação da

luz, pois para a luz vale sempre

c2 ∆t2 = (∆x )2 + (∆y)2 + (∆z)2 (3.47)

Por isto estes eventos são conhecidos por eventos tipo-luz.

Resumindo, temos:
(a) Eventos tipo-tempo são aqueles separados por distâncias menores que
aquela percorrida pela luz no mesmo intervalo de tempo. A ordem tem-
poral é mantida para todo intervalo tipo-tempo. Eventos que guardam
uma relação de causa–efeito entre si necessariamente são tipo-tempo, mas
o inverso não é necessariamente verdadeiro. Pensemos num exemplo:
8.5 min após uma erupção solar um satélite apresenta uma falha em seu
circuito. Como a distância Sol–Terra é de 8.0 minutos-luz, passados 8.5

© s.r. dahmen 2022


efeitos geométricos 83

min qualquer sinal do Sol já teria passado pela Terra e portanto a falha do
satélite pode ser devido ao evento solar, mas não necessariamente. Este
evento corresponde a um intervalo tipo-tempo: não existe um referencial
inercial no qual a erupção solar é posterior à falha do satélite.
(b) Eventos tipo-espaço são aqueles separados por distâncias maiores que a
luz é capaz de percorrer no mesmo intervalo de tempo. A ordem temporal
não é necessariamente mantida. Os conceitos de “antes” e “depois” são
relativos. Eventos que guardam uma relação de causa–efeito entre si não
podem estar separados por um intervalo tipo-espaço. Exemplo: 4.0 min
após uma erupção solar um satélite apresenta problemas. Como não deu
tempo ainda de qualquer sinal do Sol chegar a Terra, a falha do satélite
não pode ser um efeito do evento solar. A ordem dos eventos portanto
não é fixa: é possível encontrar um referencial inercial no qual a falha do
satélite ocorre depois da erupção solar.

© s.r. dahmen 2022


4
O efeito Doppler

O efeito Doppler é de extrema importância prática. Ele é usado para detec-


tar a velocidade de objetos que se movem com altas velocidades ou, numa
situação mais corriqueira, detectar movimento de objetos que mudam cons-
tantemente de posição. Assim ele encontra muitas aplicações na Astronomia
ou na navegação de veículos autônomos. Devemos fazer aqui uma clara
distinção entre o efeito Doppler clássico e o efeito Doppler relativístico. O
primeiro diz respeito à mudança da frequência de um sinal em função da
velocidade da fonte: uma fonte que se movimenta e emite sinais com certa
frequência, terá se deslocado entre um pulso e outro. Para um observador
parado, as frentes de onda serão mais ou menos espaçadas, dependendo
do emissor estar se afastando ou se aproximando. Este efeito é puramente
geométrico. No efeito Doppler relativístico isto ainda ocorre mas há uma
contribuição extra devido à dilatação temporal de intervalos entre pulsos
quando observado de um observador parado.
É possível deduzir o efeito relativístico a partir do mesmo princípio usado
para a dedução do efeito clássico, isto é estudando a invariância da fase de
uma onda por mudança de referencial inercial. A partir disto aplicamos
as transformações apropriadas (Galileu ou Lorentz). Isto será feito ao final
deste capítulo em função da sua generalidade. Comecemos porém com uma
introdução mais simples para que assim consigamos perceber melhor as
Figura 4.1: Christian Andreas Doppler
diferenças entre um e outro caso.
(1803 – 1853). Físico e matemático aus-
Vale aqui frisar a importância histórica do efeito Doppler para a TER: ele foi tríaco.
um dos experimentos mais importantes para a aceitação da TER, por razões 1
J. Stark, Über die Lichtemission der Kanals-
que discutiremos mais adiante. Estes experimentos foram conduzidos por trahlen in Wasserstoff, Ann. d. Physik 21
Johannes Stark (1874–1957) e lhe renderam o Prêmio Nobel de 1919, embora (1906): 401-456; J. Stark, K. Siegel, Die Ka-
diga-se de passagem não tenham sido conclusivos. Foi apenas em 1938 com nalstrahlen in Kalium– und Natriumdampf,
Ann. d. Physik 21 (1906): 457-461 ; J.
o experimento de H.E. Yves e G. R. Stilwell que o efeito Doppler relativístico
Stark, W. Herrmann, S. Kinoshita, Der
pode ser confirmado de maneira inequívoca 1 . Doppler-effekt im Spectrum des Quecksilbers,
Ann. d. Physik 21 (1906): 462-469; H. E.
Yves and G. R. Stillwell, An experimental
4.1 O efeito Doppler relativístico study of the rate of a moving clock, J. Opt.
Soc. Amer. 28 (1938): 215-226.

Para início de conversa devemos diferenciar entre dois efeitos Doppler:


o longitudinal e o transversal. O longitudinal se dá quando a fonte e
observador se movem ao longo da linha que os une. Já o efeito radial ocorre
quando esse movimento tem uma componente perpendicular a esta direção.
86 uma introdução à teoria do espaço e do tempo

O efeito Doppler longitudinal. Uma fonte de luz emite um sinal de período


T0 em seu referencial próprio. Esta fonte se encontra, em seu referencial, na
origem x 0 = 0. Este referencial se move com velocidade v = vx̂ em relação
ao referencial I, na origem do qual se encontra nosso observador O em
repouso. No instante em que as origens dos eixos coincidem, a fonte emite
um pulso. Temos assim:

 No refencial I o primeiro pulso é emitido em t1 = 0, x1 = 0.


 No refencial I 0 o primeiro pulso é emitido em t10 = 0, x10 = 0
Passado um tempo T0 segundo o relógio de I 0 outro pulso é emitido pela
fonte, que neste instante se encontra a uma distância x2 do observador em I.
Neste caso temos

 No refencial I 0 o segundo pulso é emitido em t20 = T0 , x20 = 0.


 No refencial I o segundo pulso é emitido em t2 = γT0 e a fonte se
encontra a uma distância x2 = vt2 = vγT0 da origem.

Para atingir O, a luz precisa viajar por um tempo ∆t = x2 /c. Deste modo, o
tempo entre dois pulsos medido por O é dado por

x2 vγT0
T = t2 + ∆t = t2 + = γT0 +
c c
= γT0 (1 + β)
s
1+β
T = T0
1−β
r
c+v
T = T0 (4.1)
c−v

Quando a fonte se move para longe do observador, β > 0, caso contrário,


tomamos β < 0. No caso da frequência ν = 1/T temos
s r
1−β c−v
ν = ν0 = ν0 (4.2)
1+β c+v

Em resumo, para fontes que se afastam de nós (β positivo) a frequência do


sinal é menor e portanto o comprimento de onda é maior. Temos um desvio
para o vermelho, um red shift. Se a fonte se aproxima de nós (β negativo) há
um aumento da frequência e consequentemente observamos uma onda de
menor comprimento: temos um desvio para o azul, um blue shift. Isto pode
ser visto pela expressão análoga para os comprimentos de onda
s r
1+β c+v
λ = λ0 = λ0 (4.3)
1−β c−v

Embora iremos fazer a dedução mais abaixo para o caso clássico, vale neste
ponto comparar com a expressão acima com aquela obtida da mecânica
clássica. Temos, para o efeito Doppler clássico, as expressões

c − vF c − vO
{ T, λ} = { T0 , λ0 } , ν = ν0 (4.4)
c − vO c − vF
e
c − vF
ν = ν0 (4.5)
c − vO

© s.r. dahmen 2022


o efeito doppler 87

Notemos que nesta equação aparecem duas velocidades: a velocidade do


observador vO e a velocidade da fonte vS medidas em relação ao meio
(éter) no qual a luz se propaga, ao passo que na versão relativística apenas
a velocidade relativa entre os referenciais aparece. Uma discussão mais
detalhada sobre o surgimento destas duas velocidades é feita mais abaixo
onde deduzimos o efeito Doppler a partir da invariância da fase de uma
onda.

O estudante de Física. Vamos supor que você tenha sido pego por um
radar e é parado por um policial por ter ultrapassado o limite de velocidade
permitido, de 50 km/h. Ao ser questionado se você não tinha visto o
sinal vermelho no semáforo, você argumentou que estava andando a uma
velocidade cujo efeito Doppler teria feito o sinal vermelho parecer verde para
você. Para seu azar, o policial era apaixonado por física e contra-argumentou:
“Pelos meus cálculos, para que você tivesse observado um desvio para o azul
tão grande, sua velocidade deve ter sido bem maior que o limite permitido.
Vou te fazer uma proposta: lhe concedo uma hora para que você calcula a
velocidade necessária para que o efeito que você observou tenha ocorrido.
Passado este tempo, você tem duas opções: eu lhe aplico uma multa de R$
1.000 ou você paga uma multa no valor de 1 centavo para cada km que você
passou do limite permitido nesta rua”. O estudante, que tinha acabado de
concluir um curso de Teoria da Relatividade e lembrava da sua Óptica, sabia
que a luz verde tem um comprimento de onda entre 492 e 577 nm. Já a luz
vermelha, entre 622 e 780 nm. Tomando os valores médios λ̄verde = 535 nm
e λ̄vermelho = 700 nm, ele aplicou a fórmula de quem se aproxima da fonte
r
c−v
λ̄verde = λ̄vermelho (4.6)
c+v
Substituindo os valores acima ele chegou à conclusão que
v
β= = 0.2626 −→ v = 0.2626 c = 2.84 × 108 km/h (4.7)
c
o que implicaria numa multa de 2, 84 milhões de reais. Você obviamente
optaria pela multa de 1000 reais.

Questão 1. Uma nave espacial com duas fontes de luz.. Suponha que uma
espaçonave muito longa tenha em cada uma das extremidades fontes de luz de com-
primento λ popa = 700 nm e λ proa = 400 nm. A nave está praticamente alinhada
com você, tão próxima que você pode considerar que estão sobre a mesma linha.
Suponha que num dado instante você esteja mais ou menos entre os extremos da
nave, e vê a popa se aproximando enquanto a proa se afasta de você. Para qual
velocidade v0 da espaçonave as duas luzes parecerão, do seu referencial, como tendo
o mesmo comprimento de onda λ0 e qual o valor deste λ0 ?

Questão 2. A luz de uma nebulosa. Uma certa linha do espectro de uma


nebulosa tem um comprimento de onda medido de 656 nm quando o valor associado
à linha daquele elemento químico num laboratório seria de 434 nm. Com que
velocidade ela se afasta do nosso planeta?

Questão 3. Qual deve ser a velocidade de uma fonte que se afasta de nós para que
uma onda tenha o dobro do comprimento que tem no refencial da fonte? Expresse

© s.r. dahmen 2022


88 uma introdução à teoria do espaço e do tempo

sua resposta em unidades de c.

O efeito Doppler transversal. Vamos agora considerar o caso mais geral


onde a fonte ainda se descola com uma velocidade v = v x̂ em relação ao
observador mas a direção de sua posição instantânea faz um ângulo θ com
a origem do sistema de coordenadas I como mostra a figura abaixo. A
discussão anterior é um caso especial do resultado que apresentaremos
aqui. Do ponto de vista de O, no instante t1 a fonte emite um pulso na

Figura 4.2: Geometria para o efeito Dop-


pler geral onde, num dado instante t1 ,
y y’ y’
a fonte se encontra num ponto ( x, y) tal
que θ = arctan y/x. Para a fonte, no
referencial I 0 , sua posição permanece o
tempo todo como (y10 = y20 , x10 = x20 = 0).
v

r1
(x2 − x1 ) cos θ
r2

θ
x1 x2 x x’
Observador O

posição x1 . Como no caso anterior, passado um tempo t20 − t10 = T0 no


referencial da fonte, esta emite um segundo pulso que, segundo o relógio
de O, ocorre passado um intervalo t2 − t1 = γ(t20 − t10 ) = γT0 . Os diferentes
pulsos tiveram que percorrer caminhos de tamanhos r1 e r2 para chegar à O.
Portanto o tempo gasto do ponto de vista de O entre um pulso e outro é,
em analogia ao caso anterior
 r   r  r − r1
T = t2 + 2 − t1 + 1 = ( t2 − t1 ) + 2
c c c
r2 − r1
= γT0 + . (4.8)
c
Se a distância percorrida pela fonte entre os dois pulsos é pequena compa-
rada à distância entre observador e fonte, podemos aproximá-la por

r2 − r1 ≈ ( x2 − x1 ) cos θ = γvT0 cos θ (4.9)

que, substituida na equação anterior nos leva à:


cos θ
T = γT0 + γT0 v = γT0 (1 + β cos θ ), (4.10)
c
ou
1 + β cos θ 1 + v cos θ/c
T = T0 p = T0 √ . (4.11)
1 − β2 1 − v2 /c2
A mesma relação vale para o comprimento de onda λ e a relação inversa
para a frequência f . Observando que v cos θ é a velocidade radial com a
qual a fonte se afasta do observador, é comum na maioria dos textos definir
v cos θ
βr = (4.12)
c

© s.r. dahmen 2022


o efeito doppler 89

e escrever as equações para T, ν e λ na forma Observador (I) θ=0 Fonte (I’)

p Luz
1 + βr 1 − β2 1 + βr
T = T0 p , ν = ν0 , λ = λ0 p (4.13)
1−β 2 1 + βr 1 − β2
Observador (I) θ=π Fonte (I’)

Temos assim as seguintes situações: Luz

 θ = 0, cos θ = 1. Neste caso temos o efeito Doppler longitudinal puro com Fonte (I’)

a fonte se afastando do observador e


s
1−β Luz
ν = ν0 . (4.14) θ = π/2
1+β
Observador (I)
 θ = π/2, cos θ = 0. Neste caso temos
Figura 4.3: O efeito Doppler nas três situ-
q
ν = ν0 1 − β2 . (4.15) ações explicadas no texto.

Este é o efeito Doppler transversal puro. Finalmente temos o caso


 θ = π , cos θ = −1. Neste caso recuperamos o efeito Doppler longitudinal
puro mas com a fonte se aproximando do observador, em cujo caso temos
s
1+β
ν = ν0 . (4.16)
1−β

Vamos agora discutir brevemente o efeito Doppler em Astronomia. Devemos 2


E. Rebhahn, Theoretische Physik: Relati-
ter o cuidado, quando tratamos deste assunto, em diferenciar entre o efeito vitätstheorie und Kosmologie, Springer Ver-
lag, 2012, p. 445.
Doppler devido à velocidade relativa entre observador e objeto observado
e o chamado redshift cosmológico. Este desvio do espectro não é um efeito
Doppler verdadeiro e surge do fato que o comprimento de onda da luz que 3
R. Lambourne, The Doppler effect in As-
se propaga há milhões de anos aumentou, durante a expansão, junto com tronomy, Phys. Educ. 32 (1996), 34.
a métrica do espaço-tempo. Ele se adiciona ao efeito devido à velocidade
de recessão das galáxias e representa em torno de 1 % do efeito total 2 .
Um bom artigo em nível acessível que discute o uso do efeito Doppler na
Astrofísica pode ser encontrado na referência ao lado 3 .
Usemos agora efeito Doppler aplicado a um astro mais conhecido por nós, a
estrela α-Centauri que se encontra a 4.4 anos-luz do nosso sistema solar e
assim determinar sua velocidade em função do desvio de seu espectro.

O efeito Doppler e o movimento estelar. A estrela α-Cen que tem um movi-


mento próprio de (deslocamento angular na esfera celeste) de

ω = 2.6800 /ano = 5.65 × 10−13 rad/s. (4.17)

A linha espectral do Cálcio, que em um laboratório na Terra vale λ0 =


396.820 nm, apresenta no espectro de α-Cen um desvio de ∆λ = λ − λ0 =
−0.029 nm. Queremos determinar a velocidade (magnitude e direção) da
estrela em relação ao Sol. Figura 4.4: Espectro de um cluster
Uma vez que a distância à estrela é de de galáxias distantes (direita) compa-
rado ao espectro do Sol (esquerda),
D = 4.4 anos-luz = 4.16 × 1016 m (4.18) onde se vê claramente as linhas de ab-
sorção do espectro galáctico desloca-
sua velocidade tangencial vale das na direção do vermelho. (Fonte:
https://en.wikipedia.org/wiki/
Doppler_effect#Astronomy).
vθ = ω D = 5.65 × 10−13 rad/s × 4.16 × 1016 m = 23.5 km/s (4.19)

© s.r. dahmen 2022


90 uma introdução à teoria do espaço e do tempo

Disto concluímos que β θ = vθ /c = 7.83 × 10−5 . Na expressão (4.13) temos vr

1 + βr θ
λ = λ0 p (4.20) α − Centauri v
1 − β2

D
onde β r = vr /c, dada pela velocidade radial a estrela. A figura ao lado
esclarece melhor a geometria do problema.
Como θ
2
v = v2r + v2θ (4.21) Sol

temos que
Figura 4.5: A geometria do problema do
β2 = β2r + β2θ (4.22) efeito Doppler aplicado à α-Centauri.
e portanto a expressão para λ fica
1 + βr
λ = λ0 q (4.23)
1 − β2r − β2θ

Nosso objetivo é determinar β r pois uma vez determinado este valor pode-
mos determinar β e consequemente v. Sabemos porém que
λ0
= 1.000 073 (4.24)
λ
e, substituindo este valor na expressão acima, ficamos com uma equação de
segundo grau em β r , ou seja
  2     2
λ0 λ0 λ0
1+ β2r + 2 β r + β2θ − 1 + = 0. (4.25)
λ λ λ
Após substituirmos o valor de λ0 /λ = 1.000 073 nesta expressão ficamos
com
β2r + 1.000 073 β r + 0.000 073 = 0 (4.26)
cujas raízes são
(1) (2)
βr = −1 , βr = −7.3 × 10−5 (4.27)
(1)
A solução β r = −1 pode ser descartada fisicamente pois implica em
|vr | = c, ao passo que a segunda raiz nos dá

vr = −21.9 km/s (4.28)

Usando Pitágoras fica fácil mostrar que

v = 32.1 km/s (4.29)

O ângulo formado pela velocidade v da α-Cen com nosso Sol é dado por

±23.5
   

θ = arctan = arctan = arctan(±1.073) = ±133 ◦ (4.30)
vr −21.9
A velocidade radial negativa significa que α-Cen se aproxima de nosso
Sol,algo que já poderíamos ter deduzido pelo fato da variação do compri-
mento de onda ser negativa: a luz da estrela sofre um desvio para o azul e
portanto se aproxima de nós.

Questão 4. Uma fonte de luz se move em uma órbita circular com uma velocidade
de 0.5 c. Qual o desvio Doppler da linha amarela do Sódio quando observado do

© s.r. dahmen 2022


o efeito doppler 91

centro do círculo? O valor da linha no laboratório é de 589 nm.

Questão 5. Efeito Doppler do movimento de rotação do Sol. O Sol tem um


raio aproximado de 7.0 × 108 m e um período de rotação em torno de seu eixo de
24.7 dias. Qual o desvio Doppler de uma linha espectral que no laboratório tem 500
nm quando esta é emitida (a) do centro do Sol e (b) de um ponto na periferia do Sol
e em seu Equador?

4.2 O efeito Doppler como consequência da invariância da


fase de uma onda ~
y y

O efeito Doppler pode ser dedudizo a partir de um princípio mais fundamen-


tal, a saber a invariância da fase de uma onda por mudança de referencial
λ n
inercial. Este princípio independe do tipo de transformação que usamos. Só
quando substituímos as transformações de Galileu ou Lorentz que expressa y sin α
y P(x,y)
esta invariância que somos levados ao efeito clássico ou relativístico. x cos α α
α
Consideremos nosso sistema inercial S em repouso. α x
x ~
x
Em relação a este referencial, uma onda plana monocromática se propaga
com uma velocidade constante de c e suas propriedades físicas podem l = x cos α + y sin α
ser determinadas a partir de três grandezas: sua velocidade de fase, sua
frequência e a direção de propagação. Por uma questão de simplicidade,
suponhamos que a direção de propagação (a normal à frente de onda) se Figura 4.6: Frente de onda que contém o
encontre no plano (x, y) e faça um ângulo α com o eixo x. Uma onda deste ponto P a uma distância l da origem do
tipo é descrita por uma função de onda sistema de coordenadas.

f ( x, y, t) = A cos(2πF ) (4.31)

onde a fase F vale


 
x cos α + y sin α
F = ν t− . (4.32)
c

Nesta expressão ν é a frequência da onda e l = x cos α + y sin α é a distância


da origem O do sistema de coordenadas até o a frente de onda que contém
o ponto P de coordenadas (x, y).
O significado físico da fase F pode ser facilmente entendido da seguinte
maneira: imagine um observador parado no ponto P( x, y) que vê uma crista
de onda passar na origem em t = 0. Ele dá a esta crista uma etiqueta. Neste
instante ele aciona seu cronômetro e assim que esta crista etiquetada passa
por ele, ele inicia a contagem de cristas. Uma vez que um número ν de
cristas de onda chegam a ele por segundo, e a onda inicial demorou l/c
segundos demorou para alcançá-lo desde a origem, até o tempo t ele terá
contado  
l
ν t− , (4.33)
c
ou seja, a fase é exatamente igual ao número de ondas que o observador
conta no intervalo de tempo (t − l/c). Imagine agora um obervador em S0
que se encontra num ponto P̃( x̃, ỹ), que coincide com o ponto P em t̃ = t.
O número de ondas F que P̃ terá contado desde o momento que a onda

© s.r. dahmen 2022


92 uma introdução à teoria do espaço e do tempo

etiquetada passa por ele até o momento que ele chega no ponto P será
exatamente o mesmo contado por P 4 . Ou seja, 4
Por quê? Aparentemente este resultado
  parece contraditório, mas há uma ma-
x̃ cos α̃ + ỹ sin α̃ neira relativamente simples de visuali-
F = ν̃ t̃ − . (4.34)
c̃ zar isto: estando P̃ mais à esquerda de
P, a onda etiquetada passa primeiro por
ele. A partir deste momento ele começa
4.2.1 O efeito Doppler clássico a contar as ondas que o atingem. As on-
das que passarem por ele eventualmente
No caso clássico, como as variáveis (x, y, t) e (x̃, ỹ, t̃) estão relacionadas por atingirão P. Em outras palavras: até o
uma transformação de Galileu podemos escrever momento em que P̃ atingir P, todas as
ondas que estiverem entre os dois são

( x̃ + vt̃) cos α + ỹ sin α
 
x̃ cos α̃ + ỹ sin α̃
 ondas que já passaram pelo primeiro e
ν t̃ − = ν̃ t̃ − . (4.35) ainda passarão pelo segundo. Se eles
c c̃
contassem um número diferente de on-
das, significaria que houve o surgimento
Observando que os fatores que multiplicam as variáveis t̃ e x̃ devem ser as
de uma frente de onda do nada entre os
mesmas dos dois lados da igualdade, segue que dois.
 v 
ν̃ = ν 1 − cos α (Doppler clássico), (4.36)
c
bem como as relações
ν̃ cos α̃ ν cos α
= ,
c̃ c
ν̃ sin α̃ ν sin α
= . (4.37)
c̃ c
Destas equações obtemos

tan α̃ = tan α e portanto α̃ = α


ν̃2 ν2
= (4.38)
c̃2 c2
Combinando esta última expressão com a do efeito Doppler chegamos
finalmente à relação entre a velocidade da luz medida nos dois referenciais
iniciais
c̃ = c − v cos α. (4.39)
Se as velocidades fossem colineares teríamos c = c ± v dependendo do sinal
de v.

4.2.2 O caso relativístico


Consideremos o caso relativístico para compararmos a expressão obtida via
a relatividade de Einstein com aquela obtida via a relatividade de Galileu.
Para facilitar o cálculo, vamos considerar α = 0. A invariância do número
de fase continua válida na TER. No caso relativístico, a expressão (4.35) é
substituída por:
   
 t0 + v x 0 x 0 + vt0   1− v  x 0 
= ν0 q t0 −
2
ν q c − q c
(4.40)
 2
1 − vc2 c 1 − vc2
2   2
1 − vc2 c 

de onde concluímos, após um pouco de manipulação algébrica, que

v  12 r
1− c−v

0 c
ν =ν v =ν . (4.41)
1+ c c+v

© s.r. dahmen 2022


o efeito doppler 93

Este é o efeito Doppler relativístico por nós já deduzido. No limite em que


v  c podemos escrever

v
1−
 
ν0 ≈ ν 2c
v
1+ 2c
 v  v
≈ ν 1− 1−
2c 2c
 2
 v v
= ν 1− +O 2 , (4.42)
c c

ou seja, o efeito Doppler clássico coincide com o efeito Doppler relativístico


em primeiro ordem em v/c. Isso significa que apenas em medidas com
precisão suficiente é possível ver diferença entre os dois efeitos. Este é
o motivo pelo qual foi só em 1938 que se conseguiu comprovar o efeito
Doppler relativístico pela melhoria da precisão experimental.

Voltando à expressão (4.36) e observando que cos α = n · v, podemos escrevê-


la para qualquer velocidade relativa v e qualquer direção arbitrária n de
propagação na forma:
 n · v
ν0 = ν 1 − (Doppler clássico). (4.43)
c

Do ponto de vista experimental – dentro do contexto da física clássica – há


um detalhe importantíssimo no que se refere à aferição destas grandezas:
ela relaciona a frequência ν0 medida por um observador que se move em
relação a uma fonte de frequência νo fixa num laboratório. Porém, ambos se
movem em relação ao Éter. Por isto devemos proceder da seguinte forma:
imaginemos que νo seja a frequência da luz medida por um observador em
repouso no laboratório. Se vo é a velocidade do laboratório em relação ao
éter, a expressão (4.43) se aplica na forma:

n · vo
 
νo = νe 1 − , (4.44)
c

onde νe é a frequência que a luz teria em relação ao éter. Para um observador


que se move em relação ao éter com velocidade v a mesma expressão se
torna  n · v
ν0 = νe 1 − . (4.45)
c
Eliminando νe nestas expressões obtemos
!
0 o 1 − nc·v
ν =ν o . (4.46)
1 − n·cv

Se tomarmos a direção de v e vo como sendo a mesma da normal n, esta


expressão reproduz a equação clássica (4.4) discutida na seção anterior.
Olhando para estas expressões vemos que:

 podemos determinar ν0 , νo e n experimentalmente. Isso, com a expressão


acima, nos dá uma equação envolvendo v e vo ;
 podemos, além disso, medir a velocidade relativa vr do observador em
relação ao laboratório vr = v − vo .

© s.r. dahmen 2022


94 uma introdução à teoria do espaço e do tempo

Com isto podemos determinar as velocidades “absolutas” v e vo . Uma vez


que ambas as velocidades são pequenas comparadas à c podemos expandir
a equação (4.46) e chegarmos à

n · v n · vo
  
ν0 ≈ νo 1 − 1+
c c
· vo ) (n · v)
 
0 o n o ( n
ν = ν 1 − (v − v ) −
c c2

n ( n · v o ) (n · v) 
ν 0 = ν o 1 − ( vr ) + (4.47)
c c2

Desta expressão vê-se claramente que o efeito Doppler clássico depende


da velocidade relativa entre fonte e observador e as velocidades absolu-
tas entram apenas como termos de correção em 2ª ordem. Em princípio
o efeito Doppler poderia ser usado para comprovar a inadequação da
mecânica Newtoniana. Como a Terra se move em sua órbita com uma
velocidade de aproximadamente 3 × 106 cm/s, o termo v/c ≈ 10−4 e por-
tanto v2 /c2 ≈ 10−8 . Porém este valor estava muito além da precisão dos
instrumentos à época em que as primeiras medidas foram feitas. Assim,
embora o efeito Doppler pudesse ser usado como teste, foram necessários
décadas desde o experimento de Michelson e Morley para que o efeito
Doppler pudesse corroborar a Relatividade de Einstein. Em 1906 Johannes
Stark e colaboradores fizeram uma série de medidas do efeito Doppler na
luz emitida por H2 em tubos de raios catódicos. A ordem de grandeza
nestes experimentos era de v/c ≈ 1/300 e mesmo nestes não foi possível 5
J. Stark, op. cit.; J. Stark, K. Siegel, op.
determinar a velocidade absoluta. Em 1938 – 51 anos depois de Michelson cit.; J. Stark, W. Herrmann, S. Kinoshita,
e Morley – Yves e Stilwell realizaram experimentos que confirmaram a op. cit.; H. E. Yves and G. R. Stilwell, op.
validade do efeito Doppler relativístico 5 . Historicamente é por este motivo cit..
que se discute o experimento de Michelson e Morley e não o efeito Doppler,
embora este último pudesse comprovar a inadequação da transformação de
Galileu caso os experimentos fossem precisos o suficiente.

© s.r. dahmen 2022


5
Paradoxos

Do mesmo modo o tempo não existe por si;


tempus item per se non est, sed rebus ab ipsis é das coisas que surge o sentimento do que
consequitur sensus, transactum quid sit in aevo, foi, do que é, e do que há de vir; na realidade
tum quae res instet, quid porro deinde sequatur; ninguém sente em si próprio o tempo sepa-
rado do movimento das coisas e de seu sereno
nec per se quemquam tempus sentire fatendunst
repouso.
semotum ab rerum motu placidaque quiete.

(Lucretius, De Rerum Natura, Liber Primus 459 – 463, ca. 55 BCE)

5.1 Realidade e Intuição Física

Os fenômenos da contração do espaço e dilatação do tempo se nos apre-


sentam inicialmente como algo pouco intuitivo. É justamente desta falta de
intuição para a verdadeira natureza do espaço-tempo (um contínuo quadri-
dimensional) que surgem os chamados “paradoxos” – como por exemplo o
famoso paradoxo dos gêmeos, o mais conhecido da TER. Como o próprio
nome diz, paradoxos são resultados inesperados cuja contradição com a
realidade é apenas aparente1 . Eles são porém de tal modo formulados a nos 1
Paradoxo, ou antinomia, é uma afir-
dar a impressão que a teoria da relatividade é inconsistente. Na verdade mação lógica auto-contraditória ou uma
os paradoxos nada mais são do que aquilo que os matemáticos chamam cujo resultado vai contra nossa expecta-
tiva do mesmo. Um exemplo de para-
de ill-posed problems, ou seja, problema incorretamente colocados. No nosso doxo lógico é a afirmação “esta sentença
caso em particular, paradoxos surgem de nossa tentativa de aplicar conceitos é falsa”. A palavra vem do grego antigo
galileanos no lugar dos modernos conceitos de espaço-tempo da teoria da παραδoξoς que significa “estranho” ou
relatividade. “inesperado”.

5.2 O paradoxo dos gêmeos ou dos relógios

Façamos nesta seção uma análise detalhada do paradoxo. Uma astronauta,


Beatriz (B), embarca numa viagem interestelar até uma estrela U, deixando
sua irmã, a astrofísica Alice (A), na Terra. Consideramos que a Terra e
a estrela U estejam em repouso relativo. As condições da viagem são as
seguintes:

i) A viagem é simétrica: Beatriz viaja o mesmo tempo na ida e na volta,


se afastando de Alice com velocidade v e se aproximando dela com
velocidade −v.
96 uma introdução à teoria do espaço e do tempo

ii) O ponto de retorno, a estrela U, está em repouso relativo em relação à


Terra e portanto à Alice.
iii) Ambas carregam sinalizadores idênticos que enviam sinais de frequên-
cia ν0 .

Façamos agora a análise da viagem de Beatriz sob o ponto de vista dos dois
referenciais: primeiro do referencial de Alice, na Terra, (sistema S, tabela D.1)
e depois do referencial de Beatriz, a viajante (sistema S’, tabela D.2). Nossa
análise basear-se-á na contagem da troca de sinais entre as gêmeas e do
efeito Doppler relativístico.

a) Primeira parte da viagem de Beatriz Tabela 5.1: Viagem de Beatriz vista por
Alice.
a. Início t=0

b. Velocidade relativa de B v

c. Tempo de viagem total de B T

T
d. Distância AU entre A e B quando d= 2v
B chega ao ponto de retorno U
q
1−v/c
e. Frequência dos sinais emitidos por B νB ida = ν0 1+v/c
e captados por A

T d
f. Tempo t1 no qual A fica sabendo do t1 = 2 + c
retorno de B

g. Número de sinais de frequência νB ida νB ida · t1 =


N ida = √
d
emitidos por B e recebidos por A até t1 = ν0 v 1 − v2 /c2

b) Segunda parte da viagem de Beatriz

h. Velocidade relativa de B −v
q
1+v/c
i. Frequência dos sinais emitidos por B νB volta = ν0 1−v/c
e captados por A

j. Número de sinais de frequência νB volta N volta =√νB volta · ( T − t1 ) =


emitidos por B e recebidos por A até = ν0 vd 1 − v2 /c2
o retorno desta

k. Número total de sinais recebidos por A Ntotal =√N ida + N volta =


= ν0 T 1 − v2 /c2

l. Número total de sinais emitidos por A NA = ν0 T

© s.r. dahmen 2022


paradoxos 97

a) Primeira parte da viagem de Alice vista por Beatriz Tabela 5.2: Viagem da Alice vista de seu
referencial próprio.
a. Início t0 = 0

b. Velocidade relativa de A −v

c. Tempo de viagem total de A T 0 = T 0 /2 + T 0 /2

T0
d. Distância AU (contraído para B pois d0 = d
γ = 2 | − v|
para ela Alice e a estrela U estão em movimento)
q
1−v/c
e. Frequência dos sinais emitidos por A νA ida = ν0 1+v/c
e captados por B

f. Tempo no qual A inicia retorno t10 = T 0 /2

g. Número de sinais de frequência νAida NA ida = νA ida · t10 =


emitidos por A e recebidos por B até t10 = ν0 vd (1 − v/c)

b) Segunda parte da viagem de Alice vista por Beatriz

h. Início t00 = T 0 /2

i. Velocidade relativa de A v
q
1+v/c
j. Frequência dos sinais emitidos por A νA volta = ν0 1−v/c
e captados por B

k. Distância d00 = d
γ = d0

0 00
l. Número de sinais de frequência νA volta NA volta = νA volta T2 = νA volta T2
emitidos por A e recebidos por B = ν0 vd (1 + v/c)
até seu retorno

m. Número total de sinais recebidos por B Ntotal = NA ida + NA volta =


= ν0 2d
v

n. Número total de sinais emitidos por B NB = ν0 T 0 = ν0 vγ


2d

Analisando as duas tabelas podemos concluir o seguinte: para Alice, que


√ o fato de contar um NA > NB significa que um tempo menor
ficou na Terra,
= T 0 = T 1 − v2 /c2 < T decorreu para Beatriz, pois ela mandou um
menor número de sinais. Já para Beatriz, a astronauta, Alice emitiu mais
sinais, pois segundo ela NA > NB e portanto o tempo de Alice passou mais
rapidamente que o seu! Ou seja, as conclusões dos gêmeos são condizentes.
Ao voltar Beatriz terá envelhecido menos que Alice.
O ponto crucial na análise acima, do ponto de vista de Beatriz, é o ítem
(f). Este é o tempo usado para determinar o número de sinais recebidos no
ítem (g). A pergunta é: se sob a perspectiva de Alice usamos um tempo
t1 = T/2 + d/c para o cálculo do número de sinais recebidos, por qual
motivo Beatriz usa t10 = T 0 /2 e não t10 = T 0 /2 + d0 /c para calcular o número
de sinais recebidos de Alice? Para Alice faz sentido usar o tempo que
usamos pois ela permaneceu todo o tempo no mesmo referencial inercial.
Ela registra o último sinal que Beatriz enviou antes da sua viagem de retorno

© s.r. dahmen 2022


98 uma introdução à teoria do espaço e do tempo

como estando desviado para o vermelho. Alice receberá o primeiro sinal


desviado para o azul depois que o último sinal desviado pro vermelho
chegar. Já Beatriz, em t1 = T 0 /2 muda abruptamente de referencial e a
partir deste instante todos os sinais emitidos por ALice vão ser imeditamente
deslocados para o azul. Isto significa que o último sinal emitido por Alice
vai ser instantaneamente deslocado para o azul, assim como todos os sinais
subsequentes. É justamente neste ponto da discussão que entra a assimetria
dos referenciais. Beatriz troca de referencial abruptamente e com isto todos
os sinais que estão indo para ela vao sofrer um blue shift.
As explicações normalmente apresentadas nos livros-texto sobre as resolu-
ção deste paradoxo são basicamente de dois tipos de argumento: o primeiro
argumento diz respeito à assimetria do problema, afinal Alice está num
referencial inercial enquanto Beatriz não está pois, se retorna, em algum
momento de sua jornada estará submetida à acelerações. Consequentemente,
para calcular o diferença entre os tempos nos diferentes referenciais é ne-
cessário ir além da TER, generalizando a teoria, neste caso a Relatividade
Geral. Este foi o caminho seguido por Einstein, que apresentou a solução
do paradoxo após haver criado a generalização da Relatividade Restrita 2 2
Convém lembrar que a Relatividade Ge-
O segundo tipo de argumento, apresentado acima, busca evitar o problema ral foi motivada pela tentativa de Eins-
tein de generalizar a Relatividade Res-
do referencial acelerado e se baseia na troca de linha de simultaneidade
trita para referenciais não inerciais. Pos-
quando o Beatriz inicia o retorno. Isso equivale dizer que há 3 diferentes teriormente ela se tornou uma teoria da
relógios no sistema: o primeiro relógio é o de Alice. O segundo é o de gravitação, mas em seu cerne é uma teo-
Beatriz, na viagem de ida. Ao iniciar a viagem de volta Beatriz passa para ria para referenciais acelerados.
um terceiro referencial inercial ao qual está associado um terceiro relógio.
Vamos chamar estes relógios de A, B e C, respectivamente. Isto é discutido
em detalhes pelo físico indiano C. S. Unnikrishnan 3 , que afirma: 3
C.S. Unnikrishnan, On Einstein’s resolu-
tion of the twin clock paradox, Current Sci-
The second type of resolution invokes a change of line of simultaneity ence 89/12 (2005), pp. 2009 - 2015.
during the turn back of the twin B. This became necessary when
people posed the twin paradox such that there was no acceleration
experienced by the clocks, but merely involved change of inertial
frames, by including a third clock C. The twin (clock) B moves out
in inertial motion, and after some time transfers the reading of his
clock using a light signal to another clock C that is moving inertially
in the opposite direction towards A. So, A and C can compare their
reading as they pass each other without having to physically turn
around the path of one of the clocks. Since no acceleration is involved,
some other physical mechanism for the asymmetrical aging needs to
be invoked. The space-time diagram in Figure 2 explains the analysis.
The diagram is again preferentially drawn from the rest frame of A.
All the clocks, A, B and C are in inertial motion. I have indicated the
line of simultaneity of B and C as LS-B and LS-C. These represent a set
of inertially moving clocks that are synchronous with the proper time
of B and C respectively. The resolution points out that during the trans-
fer of clock information from the frame of B to the frame of C, the line
of simultaneity has changed, with a discrepancy and advance of time
at A of ∆t. Thus it is suggested that the excess physical time dilation of
the B–C system relative to A happens in the short duration of transfer
of information from one inertial frame to another. There is yet another
‘resolution’ that says that the ‘ticks of time’ as observed from the frame
of the moving twin by receiving light signals sent by the stationary
twin are Doppler-shifted differently during the outward and in- ward

© s.r. dahmen 2022


paradoxos 99

journey and there is a small residual second-order difference between


these remaining at the end of the jour- ney that correctly accounts
for the asymmetrical aging. Thus, in this resolution as well as in the
previous one, asymmetrical physical aging has nothing to do with
acceleration. We will need to come back to this analysis late.

A solução de Einstein se baseia no fato que a situação não é totalmente


simétrica, pois a irmã o que viaja não pode ser vista como um referencial
inercial durante a viagem: ela está submetido à acelerações durante o
processo, principalmente quando dá início à viagem de retorno. Um cálculo
aproximado se baseia no seguinte argumento. Imaginemos que a aceleração
se dá em pequenos passos, durante a qual a velocidade do foguete u é
praticamente constante durante um intervalo de tempo dt0 que, do ponto de
vista da irmã na Terra, vale (considerando que u < c)

dt0
dt = q (5.1)
u2
1− c2

Observe que do ponto de vista de Alice a aceleração ocorre em diferentes


pontos do espaço ao passo que para Beatriz ela ocorre no mesmo local. A
dilatação do tempo será dada assim por
Z t0 Z t0
2 dt0 2 dt0 ∆t0
∆t = q ≤ q = q . (5.2)
t10 u2 ( t 0 ) t10 v2 v2
1− c2
1− c2
1− c2

Ou seja, haverá uma dilatação menor que aquela que ocorreria se a viagem
fosse realizada a velocidade constante com inversão abrupta. Porém há uma
dilatação do tempo, uma conclusão inescapável da equação acima.
Qual o argumento que devemos adotar? O da troca simultânea ou o de
Einstein? Embora o da troca simultânea não recorra a argumentos fora da
Relatividade Especial e neste sentido apresenta uma solução que não foge
ao escopo da teoria, a troca instantânea de referencial não é algo fisicamente
realizável pois corresponderia a uma aceleração infinita, de v para −v em
∆t0 = 0. Neste sentido o argumento Einsteniano é mais realista.

© s.r. dahmen 2022


6
A Mecânica Relativística I: massa e momentum

A força inercial em um corpo qualquer é proporcional à 1


Vis inertiae cuiscunque corporis proportio-
quantidade de matéria que este corpo possui. 1 nalis est quantitati materiae, ex qua constat.
Mechanica sive motus scientiae analitece
(Leonhard Euler) exposita (Mecânica ou ciência do movi-
mento exposta analiticamente), Leonhard
Euler, São Petersburgo, 1736.

Teorema 1: é apenas através da quantidade de movimento para uma 2


Lehrsatz 1: Die Quäntität der Materie
dada velocidade que a quantidade de matéria pode ser estimada na kann in Vergleichung mit jeder anderen nur
comparação à outra qualquer. 2 durch die Quantität der Bewegung bei ge-
gebener Geschwindigkeit geschätzt werden.
(Immanuel Kant) Metaphysische Anfangsgründe der Na-
turwissenschaft (Fundamentos metafísi-
De todas as mudanças que a Teoria da Relatividade trouxe, talvez a mais cos das ciências naturais), I. Kant, Riga,
1786.
radical seja a do conceito de massa, sendo também aquela que nos causa
maior estranheza. Isso se deve em parte à nossa identificação da massa
de um corpo como sendo uma medida da sua quantidade de matéria,
identificação esta feita por Newton e sistematizada por Euler, como a frase
acima deixa claro. Para Newton, a massa era a portadora de uma força
inercial (vis inertiae) que por sua vez era proporcional à quantitas materiae.
É a esta força que Euler se refere em seu tratado Mecânica ou ciência do
movimento exposta analiticamente. Para ele, bem como para os físicos do
século XVII e XVIII, a existência de uma força inercial era tão concreta quanto
a de qualquer outra força: ela era a responsável pela resistência que um
corpo oferecia à mudança de seu estado de movimento. Kant, por outro
lado, argumentou que o conceito de uma força inerente à quantidade de
matéria de um corpo e responsável pela sua inércia era desprovido de
sentido: como poderia o equilíbrio da vis inertiae de um corpo em repouso,
ao ser perturbado pelo contato de um corpo em movimento, dar origem a
uma força contrária ao movimento do corpo que se aproxima? Para Kant,
uma força que por si só não é capaz de produzir qualquer movimento mas
apenas oferecer resistência ao movimento é um conceito desprovido de
sentido. O que no entanto devemos frisar é que tanto em Euler quanto em
Kant – independentemente da sua identificação de massa com a quantidade
de matéria – encontramos a ideia de que a massa só pode ser medida em
relação a outras massas pela comparação de seus diferentes momenta para
uma dada velocidade. Obviamente podemos ver também a massa como
a razão entre uma força e a aceleração por ela causada mas já no século
102 uma introdução à teoria do espaço e do tempo

XIX, com a busca por uma axiomatização da mecânica e influenciados


pelo positivismo filosófico, a própria idéia de força foi questionada 3 . Esta 3
Positivismo é um sistema filosófico se-
mudança de posição ocorreu também pelo aparecimento das geometrias gundo o qual o único conhecimento ver-
não Euclideanas e a crença que a Geometria, combinada ao conceito de dadeiro é aquele derivado das leis na-
turais, suas propriedades e relações. A
tempo, tinham prioridade sobre a dinâmica. Em outras palavras, um dos partir da experência sensível e usando
objetivos desta abordagem era construir uma mecãnica baseada em conceitos o raciocínio e a lógica é possível conhe-
puramente cinéticos. Neste sentido o trabalho de Mach e sua influência cer verdadeiramente algo. Neste sentido
sobre Einstein foram fundamentais. Vamos discutir um pouco as ideias de o positivismo rejeita a metafísica e para
Mach sobre o assunto. os físicos e matemáticos do século XIX
– como Saint-Venant, Hertz, Mach, Poin-
caré – a força era um conceito metafísico.

6.1 Ernst Mach e o conceito de massa


O programa de fundamentação de uma “ciência pura” para Mach tinha
por objetivo substituir qualquer interpretação metafísica dos conceitos por
relações funcionais entre grandezas obtidas através de experimentos. Neste
sentido o conceito de “massa” é importante e não precisa ser eliminados
das equações, mas ele só tem sentido enquanto conceito nas relações entre
grandezas cinéticas. Nas palavras de Mach 4 : 4
Ernst Mach, Die Prinzipien der Wärme-
lehre (Os princípios da Termodinâmica),
Quando busco eliminar todos os elementos metafísicos das repre- Leipzig, 1900, p. 363.
sentações das ciências naturais, não estou querendo dizer com isso
que quero também eliminar as representações mentais onde elas por
ventura possam ser úteis e muito menos as imagens que fazemos.
Também não devemos tomar a crítica à metafísica como uma crítica
voltada a todos os fundamentos até hoje utilizados. Por exemplo,
uma pessoa pode ter restrições sérias contra o conceito metafísico de
“matéria” e mesmo assim não precisar eliminar o valioso conceito de
“massa”. Muito pelo contrário, podemos mantê-lo como eu fiz no
Mecânica justamente porque constatamos que ela nada mais é que do
algo necessário para satisfazer uma importante equação.

A Mecânica à qual Mach se refere é seu famoso tratado Die Mechanik in ihrer
Entwicklung, historisch-kritisch dargestellt (A Mecânica em seu desenvolvimento,
apresentada de maneira crítica e histórica), obra esta que muito influenciou
Einstein e toda uma geração de físicos contemporâneos a ele. Mach define a
massa da seguinte maneira:
(a) Proposição experimental: sob certas condições, corpos que se encontram
próximos um do outro geram acelerações em sentidos contrários na
direção da linha que os une.
(b) A relação entra suas massas é a relação inversa entre suas acelerações
tomada com sinal negativo
Notem que Mach não fala de força (que ele define porsteriormente como
sendo o produto desta massa pela sua aceleração) e, para aquilo que aqui
nos interessa, as duas proposições são suficientes. Basicamente o que Mach
diz é o seguinte: seja a B| A a aceleração sofrida pela partícula A devido a
sua interação com B, e a A| B a aceleração que o B sofre devido à presença de
A. A experiência mostra que a razão das massas m A /m B é uma constante
positiva e igual ao negativo da razão inversa das respectivas acelerações:
mA a B| A
=− (6.1)
mB a A| B

© s.r. dahmen 2022


a mecânica relativística i: massa e momentum 103

Se levarmos a partícula B para longe e fizermos a interação entre A e uma


terceira partícula C temos

mA aC | A
=− , (6.2)
mC a A|C

o mesmo valendo para a interação entre B e C

mC a B|C
=− (6.3)
mB aC | B

Através desta definição temos também a transitividade:


! !
a B| A aC | A a B|C
− = − − (6.4)
a A| B a A|C aC | B

que significa simplesmente que se a massa de A é igual à de C e a massa de


B é igual à de C, então as massas de A e de C são iguais. Nesta definição
de massa podemos abrir mão do conceito de força: tomando um corpo
como padrão de massa e feitas em número suficiente de medidas, podemos
através das relações entre acelerações atribuir valores numéricos a todas as
outra massas.
Uma outra definição de massa que tem um papel importante na nossa
discussão mais à frente é aquele de Saint Venant 5 : 5
Adhémar Jean Claude Barré de Saint-
Venant (1797 – 1886). Físico, matemático
A massa de um corpo é a razão entre dois números que representam e engenheiro francês. Autor da obra Prin-
quantas vezes este corpo e um outro corpo, escolhido arbitrariamente, cipes de mécanique fondés sur la cinématique.
contém partes que, estando separadas e lançados um contra o outro
comunicam, pela colisão, velocidades iguais e contrárias.

Dois corpos que se aproximam um do outro com as mesmas velocidades


(em módulo) se afastam com as mesmas velocidades (em módulo) após
o choque, têm massas iguais. A definição de Saint-Venant é mais geral:
tomemos dois corpos de massas m1 e m2 , e sejam suas velocidades v1 e v2
antes da colisão e v1 + ∆v1 e v2 + ∆v2 suas respectivas velocidades após a
colisão. Pela lei de conservação do momentum vale

m1 v1 + m2 v2 = m1 (v1 + ∆v1 ) + m2 (v2 + ∆v2 ) (6.5)

ou seja,

m2 ∆v
m1 ∆v1 + m2 ∆v2 = 0 −→ =− 1 (6.6)
m1 ∆v2

Notemos que todas as definições de massa aqui apresentadas se baseiam em


conceitos puramente cinemáticos e, uma vez escolhida uma massa padrão,
as massas de outros corpos podem ser obtidos experimentalmente medindo-
se acelerações (Mach) ou colisões (Saint-Venant). Dada a importância das
colisões na definição de massa, vamos explorar mais detalhadamente a
colisão de duas partículas para ver como, em mecânica relativística, a
conservação do momentum impõe que a massa de um corpo deva ser
dependente de sua velocidade, onde por “massa” entendemos uma medida
da inércia e não da quantidade de matéria de um determinado corpo.

© s.r. dahmen 2022


104 uma introdução à teoria do espaço e do tempo

6.2 A massa na relatividade restrita

A mecânica newtoniana é invariante por transformações de Galileu e, conse-


quentemente, a forma de suas equações fundamentais não se mantém por
uma transformação de Lorentz. Além desta não-invariância da forma há
algumas inconsistências na teoria:

i. na mecânica newtoniana uma partícula pode ser acelerada indefinida-


mente por uma força, atingindo eventualmente uma velocidade v > c;
ii. ela permite a existência de forças instantâneas (action at a distance) ao
mesmo tempo que a terceira lei actio = reactio deve ser válida. Porém
a igualdade da ação e da reação não tem sentido na relatividade pois
esta implica na simultaneidade das forças e simultaneidade de dois
eventos separados é um conceito relativo 6 . Interações que podem ser 6
Por exemplo, costumamos estudar na
descritas por meio de um campo (como as forças eletromagnéticas) ou mecânica clássica o caso de 2 massas so-
forças de contato podem ser facilmente estudadas. No primeiro caso bre uma superfície sem atrito e ligadas
por uma mola, sujeitas à forças opostas
basta considerarmos a propagação finita da interação e como os campos de mesma intensidade no mesmo ins-
se modificam segundo uma transformação de Lorentz ao passo que as tante. Porém, o “mesmo instante” em
segundas podem ser vistas como ocorrendo no mesmo ponto do tempo e relatividade é diferente para diferentes
do espaço. observadores.
R. Resnick, Introduction to Special Relati-
Vamos adotar aqui o ponto de vista mais intuitivo, a saber aquele que vity, pp. 110-111.
envolve forças de contato na forma de colisões entre partículas. Partiremos
do pressuposto que o tempo de interação (durante o qual as partículas
estão aceleradas) é infinitamente pequeno e que as partículas tenham uma
separação - no momento da colisão - muito pequena quando comparadas às
suas dimensões. Se adotarmos este ponto de vista podemos tentar entender
a mecânica a partir das leis de conservação de momentum, uma vez que,
como a conservação de energia, queremos colocar esta lei como um princípio
geral da natureza que dever ser válido também na formulação relativística
da mecânica. Esperamos também que o resultado daí obtido nos dê, no
limite v/c → 0, o mesmo que obteríamos da mecânica newtoniana.

6.3 A colisão entre partículas idênticas A e B

Para analisar a maneira pelo qual o momentum é “generalizado” na mecâ-


nica relativística, analisemos como uma colisão elástica entre 2 partículas
idênticas é vista por dois diferentes observadores inerciais I e I 0 . Visando
simplificar a discussão, vamos imaginar uma colisão altamente simétrica do
ponto de vista do observador em I 0 : as partículas A e B tem velocidades
iguais em magnitude mas em sentidos opostos, de tal modo que o momento
total seja nulo. Em outras palavras, neste referencial o centro de massa
0 0 0 0
permanece parado, e uyA = −uyB e u xA = −u xB . Velocidades indicadas por
uma letra minúscula u se referem aos valores antes da colisão; uma letra
maiúscula U representará a velocidade após a colisão 7 . 7
R. Resnick, op. cit. p. 112. Uma dedu-
ção para velocidades com direções arbi-
Sendo a colisão elástica, as partículas tem velocidades finais de igual magni-
trárias no espaço pode ser encontrada em
tude e o momentum total após a colisão é também nulo. Uma vez que a força Møller, op. cit. pp. 67 – 69.
de contato é na direção y, as partículas revertem suas velocidades nesta dire-
ção, enquanto as velocidades na direção x permanecem inalteradas. Sendo
0 0 0 0 0 0 0 0
assim temos uyA = −UyA = UyB = −uyB e u xA = U xA = −U xB = −u xB .

© s.r. dahmen 2022


a mecânica relativística i: massa e momentum 105

Se escolhermos agora deliberadamente o referencial I 0 como tendo uma


velocidade v na direção do eixo x positivo tal que
0 0
v = u xB = −u xA (6.7) 8
Classicamente a partícula B, vista de I,
teria uma velocidade 2v para a direita,
veremos, do referencial I, uma partícula A com velocidade nula na direção mas sabemos que relativisticamente este
x mas que se move na direção y 8 . A figura abaixo ilustra melhor este fato. não é o caso.

y’
Figura 6.1: A colisão entre duas partí-
O’ culas A e B como vistas do referencial
Uy B’ I 0 (figura de cima) que se move com ve-
B locidade v na direção x em relação ao
ux B’ Ux B’
referencial I (figura de baixo). Notem
uy B’ que o observador em I 0 tem velocidade
O’ x’ nula. No referencial I ele tem uma velo-
uy A’
cidade v. Letras minúsculas representam
as velocidades antes da colisão; maiús-
Ux A’ ux A’ O’
A culas representam as velocidades após a
v
colisão.
y Uy A’

Uy B

B
ux B Ux B

uy B
O x
Uy A

uy A
A

Na mecânica newtoniana a componente y da velocidade não deve mudar por


uma transformação entre referenciais. Assim:
0 0
uyA = uyA uyB = uyB
0 0
UyA = UyA = −uyA UyB = UyB = −uyB . (6.8)

Como a variação de momentum do corpo A é igual à 2muyA , este deve ser o


momento que a partícula B adquire, logo

2muyA = 2muyB → uyA = uyB (6.9)

onde usamos o fato que as partículas tem a mesma massa m. Este é o


resultado é totalmente condizente com aquilo que sabemos (e esperamos!)
da mecânica de Newton. A pergunta agora é se estes resultados podem
ser igualmente obtidos da mecânica relativística. Se analisarmos mais
detalhadamente o cenário experimental, assumimos que, visto de I (parte
inferior da figura), as componentes y das velocidades das partículas são
iguais e pela colisão elas experimentam apenas uma inversão de sentido.
Porém, devido à transformação de Lorentz, ao passarmos para o referencial
I 0 estas componentes se transformam de maneira diferentes segundo

0 1 uyB q uyB
uyB = B = 1 − β 2
uB v
(6.10)
γ 1 − ux v 1 − cx2
c2

ao passo que para o corpo A cuja velocidade u xA = 0 a mesma transformação


de Lorentz leva à
1 A
q
0
uyA = uy = 1 − β2 uyA (6.11)
γ

© s.r. dahmen 2022


106 uma introdução à teoria do espaço e do tempo

Ou seja, como sabemos, as componentes y das respectivas velocidades


mudam de maneira diferente relativisticamente falando e, se forem iguais
em um referencial, não necessariamente são iguais em outro. Se agora
assumirmos segundo a mecânica newtoniana que deve haver apenas uma
inversão das componentes de y, deveríamos ter no referencial I 0 a relação
0 0
uyA = uyB . (6.12)

Se utilizarmos as transformações (corretas) de Lorentz, chegamos a um


resultado que contradiz aquilo que deduzimos da mecânica newtoniana.
Em outras palavras, se o momentum é conservado num referencial, ela não
necessariamente o é em outro referencial, o que representa um absurdo pois
as leis da física não podem depender do referencial inercial escolhido 9 . 9
Lembremos aqui que se o momentum
Mas onde está o problema com nossa dedução que, em mecânica clássica, é das partículas – ou se preferirmos, do
correta? A contradição surge do fato que, para chegarmos ao resultado que centro de massa do sistema – tem dife-
rentes valores dependendo do referencial
chegamos, usamos as expressões usuais p = mu e p0 = mu0 para o momenta adotado. Porém continua válida a con-
das partículas. A solução deste aparente paradoxo passa por redefinirmos servação do momentum por colisões, in-
aquilo que entendemos por momentum. dependentemente do valor que este mo-
mentum inicial possa ter.

6.4 O momentum relativístico


Por trás da ideia da variação da massa de um corpo com sua velocidade
podemos argumentar que grandezas físicas definidas em um referencial
inercial, devem manter sua forma funcional em outro referencial inercial,
mesmo que seus valores, quando medidos, variem. Mudam os valores,
não as definições. Assim, se quisermos definir o momentum como sendo
p = mu, acabamos caindo em uma contradição a menos que redefinamos
nesta expressão uma nova massa m que seja uma função da magnitude da
velocidade u do corpo, ou seja m = m(u). Vamos escrever assim

p = m(u)u (6.13)

E, no caso da conservação de momentum do problema acima proposta,


devemos substituir a equação (6.9) pela expressão

2m A uyA = 2m B uyB (6.14)

onde as massas agora são diferentes para cada corpo uma vez que esta
deve depender da sua velocidade. Partindo então da situação simétrica do
0 0
referencial I 0 , onde temos duas velocidades iniciais uyA = −uyB as equações
A B
(6.10) e (6.11) nos dão os valores de uy e uy diretamente

1
uyA = uyB u xB v
(6.15)
1− c2

Quando substituímos esta expressão na lei de conservação de momentum


(6.14) obtemos
uyA mA
mB = B ma = uB v
(6.16)
uy 1 − x2 c
Portanto, as massas relativísticas m A e m B devem necessariamente ser di-
ferentes se quisermos manter a forma newtoniana da versão relativística da
conservação de momentum. Olhando um pouco mais atentamente para esta

© s.r. dahmen 2022


a mecânica relativística i: massa e momentum 107

expressão, é possível simplificá-la pois na verdade existe uma relação entre


0
u xB e v uma vez que pela transformação de Lorentz u xB = v vale

0 u xB − v
u xB = v = u xB v
(6.17)
1− c2

Podemos resolver esta expressão em v, obtendo


 s 
 B 2
c2  ux
v = B 1− 1−  (6.18)
ux c

Substituindo esta expressão para v em (6.16) obtemos, finalmente


mA
mB = r  B 2 (6.19)
u
1 − cx

Esta é a maneira como a massa m B de um corpo em movimento se comporta


quando vista de um referencial I por uma massa m A em repouso. Estando o
corpo A em repouso, podemos chamar sua massa de massa de repouso (rest
mass) e denotá-la por m0 . Uma vez que partimos de duas massas exatamente
idênticas, esta seria a massa de B caso ele estivesse em repouso, isto é m0 .
Portanto, analisando a equação acima podemos dizer que ela representa
a massa de um corpo em movimento quando comparada à sua massa de
repouso. Para uma massa arbitrária m com velocidade u podemos escrever
então
m
m= q 0 (6.20)
2
1 − uc2
Podemos assim escrever a expressão correta para o momentum de uma
partícula com velocidade u como sendo
m0
p= q u = γm0 u (6.21)
u2
1− c2

6.5 O que é massa?


A pergunta que fica agora é: o que é exatamente massa? Como interpretar a
expressão (6.20) fisicamente?
O caminho por nós tomado para chegarmos a esta expressão foi basicamente
um: manter a definição de momentum como o produto de uma massa pela
velocidade – pois queremos manter a forma funcional das grandezas – e
garantir que o princípio da conservação de momentum seja válido para todo
referencial inercial. Olhando mais cuidadosamente para a expressão (6.22),
podemos escrevê-la na forma

dx dx dx
p = γm0 u = γm0 = m0 1 = m0 (6.22)
dt γ dt dτ

onde usamos a relação dt = γdτ na qual τ representa o tempo-próprio da


partícula. Olhando para a expressão nesta forma, podemos dizer que a
massa permanece inalterada e o momentum é expresso em termos de duas
propriedades invariantes: a massa m0 e o intervalo dτ. Esta maneira de
interpretar as definição de momentum está de acordo com a filosofia da

© s.r. dahmen 2022


108 uma introdução à teoria do espaço e do tempo

teoria da relatividade que preconiza que as propriedades relacionadas à


cinética (e portanto ao espaço-tempo) mudam de referencial para referencial,
ao passo que propriedades intrínsecas do corpo não diretamente relevantes
ao tempo e espaço – como carga e massa – permanecem inalteradas 10 . Vista 10
R. Resnick, op. cit., p. 119.
sob este aspecto, a mudança na forma do momentum pode ser interpretada
não como uma mudança devido à massa relativística mas devido à diferença
entre tempo próprio (τ) e tempo não próprio (t, medido por um observador
em um referencial no qual a massa m0 se move). Em outras palavras, a
origem das diferenças nos experimentos de colisão que observamos é devido
à relatividade das medidas temporais.
Há na definição de massa segundo a equação (6.20) uma vantagem “didática”
no sentido que todas as expressões da mecânica newtoniana que envolvam
m podem ser reescritas da mesma forma substituindo apenas a massa pela
versão relativística de m.
Adotaremos aqui a interpretação que a massa de um corpo muda com
sua velocidade desde que entendamos massa como uma grandeza física
não relacionada à quantidade de matéria mas sim uma medida de sua
inércia, cuja aferição deve ser feita por meio de experimentos envolvendo
cinética (colisões). O que na verdade está ocorrendo é que a expressão
p = γ mo v é a verdadeira medida do momento de um corpo de massa mo e
ao redefinirmos uma massa relativística como m = γ mo o fazemos apenas
para efeitos didáticos.

6.6 A massa como medida de efeitos cinéticos


Uma outra maneira de vermos como a massa realmente está relacionada às
propriedades cinéticas de um corpo, exploremos aqui a 2a. Lei de Newton
na sua forma relativística, a saber
 
dp d  m0
F= = q uŝ (6.23)
dt dt 1− u
2
c2

Por ŝ designamos o vetor unitário na direção da velocidade e portanto


tangential à curva que a massa descreve. No caso mais geral em que a
trajetória é curvilínea, ŝ varia sua direção com o tempo, mas obviamente
não sua intensidade por se tratar de um vetor unitário. Diferenciando a
expressão acima podemos escrever:
   
m u dŝ d m u
F = q 0  + q 0 u ŝ (6.24)
1− u
2 dt dt 1− u
2
c2 c2

Com um pouco de álgebra é fácil mostrar que


 
d  m0 u  m0 du
ŝ =  ŝ, (6.25)
2 3/2 dt
q
dt u2
1 − c2 u

1 − c2

onde du/dt s nada mais é que a aceleracão as na direção tangencial à traje-


tória. Portanto a expressão para a força se torna
m0 u dŝ m0
F=  1/2 dt +   as (6.26)
2 2 3/2
1 − uc2 1 − uc2

© s.r. dahmen 2022


a mecânica relativística i: massa e momentum 109

Vamos agora calcular o primeiro termo da expressão acima. Para isto


devemos entender quanto vale a derivada do versor ŝ. Para isto façamos uma v(t)

breve recapitulação da dinâmica de um corpo em movimento curvilíneo. A


∆r
aceleração de uma partícula numa trajetória sobre uma curva parametrizada
pela distância s entre dois pontos é dada por
r(t) v(t + ∆ t)
r(t + ∆ t)
dv d dv dŝ
a= = (vŝ) = ŝ + v (6.27)
dt dt dt dt
Lembremos que para dois pontos r(t) e r(t + dt) de uma trajetória, a distân-
cia ds é a distância entre dois pontos ao longo de uma trajetória ao passo
que dr é a distância entre os pontos em linha reta (v. figuras ao lado).
Primeiro, lembremos que dŝ/dt é perpendicular à ŝ. Isso pode ser facilmente
verificado pois sendo ŝ unitário temos
Figura 6.2: Dois pontos r(t) e r(t + dt)
dŝ2 dŝ de uma trajetória de uma partícula
ŝ2 = 1 =⇒ = 2ŝ · =0
dt dt que se desloca ao longo da curva
dŝ
=⇒ ŝ ⊥ (6.28) s(t). ds representa a distância entre
dt os dois pontos ao longo da trajetória,
Além do mais podemos parametrizar a trajetória pela posição s(t) que a ou seja do arco subentendido entre
massa tem no instante t. Assim podemos escrever os dois pontos ao passo que dr é a
distância linear entre eles. Abaixo as
dŝ dŝ ds dŝ acelerações.
= = v (6.29) a(t)
dt ds dt ds
Não é difícil verificar que por construção geométrica que no limite ∆t −→ 0
e ∆r −→ ∆s e por construção geométrica ∆v
a(t + ∆ t)
dŝ n̂
= (6.30) v(t)
v(t + ∆ t)
ds R
onde R é o raio de curvatura do ponto da trajetória onde a partícula se
encontra e n̂ a normal à trajetória. Substituindo (6.30) em (6.31) podemos
escrever
dŝ n̂
= v (6.31)
dt R
Substituindo este resultado em (6.32) obtemos finalmente s
a
s

dv dŝ v2
a= ŝ + v = as + n̂ (6.32) n
dt dt R
Ou seja, recuperamos o conhecido resultado que num movimento curvilíneo
temos uma aceleração centrípeta, responsável pela mudança da direção
da velocidade e uma aceleração tangencial, responsável pela mudança do a

módulo da velocidade. Isto implica também que, classicamente, a força está an

na direção da aceleração total, como ilustra a figura ao lado. F

O surpreendente é que no caso relativístico o resultado é diferente: substi-


tuindo o valor de dŝ/dt na equação (6.26) obtemos, para uma partícula de Figura 6.3: O resultado da mecânica
velocidade u, o seguinte resultado: newtoniana que num movimento
curvilíneo a aceleração tem duas
m0 u2 m0
F=  1/2 R n̂ +  3/2 as . (6.33) componentes: uma tangencial à tra-
u2 u2
1− c2
1− c2 jetória e uma aceleração centrípeta
na direção do centro de curvatura.
Em outras palavras, a massa inercial da partícula é diferente para as diferen- A força total aponta na direção da
tes acelerações. Um outro resultado interessante é que, no caso relativístico, aceleração a.

© s.r. dahmen 2022


110 uma introdução à teoria do espaço e do tempo

a direção da aceleração total e da força não mais coincidem pois os fato-


res que multiplicam as diferentes componentes de a são diferentes, como
ilustrado na figura ao lado.
Estes resultados reforçam nossa entendimento do conceito de massa como
sendo uma medida da inércia de um corpo e não de seu conteúdo de matéria
pois, caso assim o fosse, o corpo teria diferentes conteúdos de matéria em
diferentes direções, o que obviamente é um absurdo. s as
F
s

6.7 Massa e a energia n

A equação E = mc2 é talvez a mais famosa equação da física entre os não-


físicos. As suas consequências são profundas e pretendemos aqui mostrar
a
como chegar a ela e como utilizá-la. Nosso guia nestas deduções deve n
a
ser sempre a mecânica newtoniana. Ela e as leis fundamentais da física
(conservação de energia, momento) devem ser nosso ponto de partida. Fn F

Estudando os procedimentos que utilizamos para chegarmos aos resultados


clássicos conhecidos, repetimos os mesmos passos mas substituimos as Figura 6.4: Na mecânica de Einstein
grandezas fundamentais por suas expressões relativísticas, reinterpretando- ainda temos uma componente tan-
as quando necessário. Esta é a estratégia que adotaremos aqui. gencial e uma normal à curva sobre
Vimos na última seção com escrever a expressão geral para a força no caso a qual a partícula se desloca. Porém,
relativístico, ou seja, de que maneira a 2a. lei de Newton deve ser reescrita a força não é mais na direção da re-
para que continue válida na mecânica relativística. Quanto pensamos em sultante a.
energia na mecânica newtoniana, referimo-nos à energia cinética e à energia
potencial (caso o corpo em questão esteja sob a ação de forças conservativas).
Para o caso de uma partícula livre temos apenas a energia cinética.
O resultado fundamental da mecânica é que se um corpo está sob a ação de
uma força, o trabalho que ela realiza sobre ele ao longo de um deslocamento
dr é igual à variação de energia cinética K deste mesmo corpo
dK = F · dr (6.34)
Este resultado é bastante geral e se aplica sempre que não há forças dis-
sipativas atuando sobre o corpo. Além do mais, caso a força em questão
seja conservativa, sendo U a energia potencial do corpo, sabemos também
que dK = −dU, ou seja d(K + U ) = 0 −→ K + U = constante. Vamos partir
desta idéia, isto é do trabalho que uma força realiza sobre um corpo e tentar
entender o que acontece no caso relativístico. Como a expressão (6.23) é
uma função da velocidade u da partícula vamos adotar uma estratégia dife-
rente, a saber, ao invés de multiplicarmos a força por dr, multiplique-mo-la
escalarmente por u para vermos, na expressão acima, o que aparece do lado
esquerdo da equação. Tomemos assim
d
( γu m 0 u ) = F
dt
d
u · ( γu m 0 u ) = u · F (6.35)
dt
onde colocamos explicitamente um índice u na expressão usual do fator de
Lorentz γ = (1 − v2 /c2 )−1/2 para deixar explícito que γu = (1 − u2 /c2 )−1/2
se refere ao referencial que se move com a partícula. Como mostrado na
seção anterior esta derivada no tempo pode ser escrita na forma:
1 3 d u2
   
d
m0 u · γu u + γ u u = u·F (6.36)
2 dt c2 dt

© s.r. dahmen 2022


a mecânica relativística i: massa e momentum 111

ou seja,
u2
   
1 3 2d d
m0 γ u + γu u · u = u · F. (6.37)
2 u dt c2 dt }
| {z
1 du2
2 dt

Esta expressão pode ser escrita como

d u2 1 d u2 c2
    
1
m0 γu3 u2 + = u · F, (6.38)
2 dt c2 γu2 dt c2

ou, mais explicitamente


 2 
u2 2 d u2
   
1 m0 2 d u
u + 1 − c = u · F. (6.39)
2 (1 − u22 )3/2 dt c2 c2 dt c2
c

Isto se reduz à

u2
 
1 m0 d
( u2 + c2 − u2 ) = u·F (6.40)
2 (1 − u22 )3/2 dt c2
c

ou seja,
m0 c2 u2
 
1 d
= u·F (6.41)
2 (1 − u22 )3/2 dt c2
c
Notando que o termo do lado esquerdo desta equação corresponde à deri-
vada temporal de m0 γu c2 podemos escrever a expressão como

m0 c2
 
d
= u·F, (6.42)
dt (1 − u22 )1/2
c

que é equivalente à

m0 c2
 
d u2 1/2
= F · |{z}
u dt = F · dr . (6.43)
(1 − c2
) dr

Comparando agora este resultado com o resultado clássico onde


 
1
d m0 u2 = F · dr, (6.44)
2

vemos que, no caso relativístico, o que muda com a realização de trabalho


sobre a partícula é a grandeza

m c2
q 0 . (6.45)
2
1 − uc2

Esta grandeza, que não é a energia cinética do corpo (pois não é nula para
u = 0) é chamada de energia total E da partícula:
m0
E= q c2 = m(u)c2 = mc2 (6.46)
u2
1− c2

Esta é a famosa E = mc2 presente no imaginário popular ou estampada em


muitas camisetas. Não podemos nos esquecer porém que o m desta fórmula
é a massa relativística m(u) e não a massa de repouso m0 . O surpreendente
deste resultado, que não tem analogia na mecânica newtoniana é que mesmo

© s.r. dahmen 2022


112 uma introdução à teoria do espaço e do tempo

na situação em que a partícula está em repouso (u = 0), e portanto não


tenha energia cinética, ele ainda tem uma energia

E0 = m0 c2 . (6.47)

Esta energia, chamada de energia de repouso (rest energy) da partícula ou corpo


em questão, tem um valor absurdamente grande para corpos macroscópicos.
Como exemplo, um corpo de massa m0 = 1 g tem uma energia de repouso
de aproximadamente

E1g ≈ 10−3 kg × (3 × 108 m/s)2 = 9 × 1013 J (6.48)

Para termos uma noção da orgem de grandeza desta energia, para que esta
mesma massa tivesse uma energia cinética deste valor, segundo a mecânica
newtoniana ela teria que ter uma velocidade u dada pela expressão
s
1 2 2K
K = m0 u −→ u = (6.49)
2 m0

ou seja, uma velocidade de aproximadamente 4.2 × 108 m/s. É óbvio que


este cálculo está incorreto pois nenhum objeto pode ter uma velocidade
superluminal. Para calcularmos a correta velocidade que a partícula tem
que ter para que sua energia cinética seja igual à sua massa de repouso,
precisamos primeiro deduzir a expressão relativística para a energia cinética.
√ o seguinte: para baixas velocidades u  c, le-
Para tanto, basta notarmos
vando em conta que 1/ 1 − u2 /c2 ' 1 + 12 u2 /c2 , a expressão (6.46) assume
a forma
1
E = m0 c2 + m0 u2 + · · · (6.50)
2
ou seja, ao adquirir uma velocidade u, a partícula tem sua energia de repouso
acrescida pela energia cinética clássica. Portanto podemos definir a energia
cinética K de um corpo que se move com velocidade u pela equação
 
1
K = E − m0 c2 = m0 c2  q − 1  = m 0 c 2 ( γu − 1 ) . (6.51)
2
1 − uc2

que nos mostra que, se a velocidade do corpo é nula, então γu = 1 e portanto


K = 0. Voltando agora à questão sobre qual a velocidade que um corpo de
m0 = 1 g deve ter para que sua energia cinética seja igual à sua energia de
repouso, temos, segundo a equação acima
 
13 −3 2 q 1
9 × 10 J = (10 kg) × c − 1
2
1 − uc2
 
9 × 1016 1
= q − 1
c2 } 1− u
2
c2
| {z
=1
r
3
u = c ≈ 0.866c, (6.52)
4
que corresponde a uma velocidade u de aproximadamente 258900 km/s.
Este resultado independe da massa de respouso m0 pois se olharmos atenta-
mente para a equação (6.51) basta observarmos que a condição para que a

© s.r. dahmen 2022


a mecânica relativística i: massa e momentum 113

energia cinética seja n vezes maior que sua energia de repouso é dada pela
equação
  s
1 1
n= q  − 1 −→ u = c 1 −
 . (6.53)
1− u2 ( n + 1)2
c2

Este resultado nos mostra também a impossibilidade de uma partícula


de massa de repouso m0 6= 0 atingir a velocidade da luz, pois neste caso
teríamos que ter n → ∞, que implica numa energia infinita.
É a partir desta constatação da relatividade restrita – a existência de uma
eneria de repouso – que se costuma definir a massa de repouso de partí-
culas elementares em termos de unidades de energia, pois as duas estão
relacionadas por um fator constante de c2 . No caso do elétron, sua massa
de repouso vale 0.511 MeV, a do próton 938.272 MeV e 939.565 MeV para o
nêutron.
Se a partícula em questão estiver sob a ação de um potencial um potencial,
então a lei de conservação de energia mecânica no caso relativístico pode
ser expressa como

m c2
q 0 + U = K + U + m0 c2 = constante (6.54)
u2
1 − c2

Um ponto que merece nossa atenção é o cuidado que devemos ter ao


usarmos a expressão energia total de um corpo: no caso não relativístico
por energia total de um corpo subentende-se a soma das energias cinética
e potencial. No caso relativístico, a energia total pode ser usada para se
referir à equação (6.46), isto é a soma da energia cinética mais energia de
repouso (K + m0 c2 ) ou à soma destas duas energicas com a energia potencial
(K + U + m0 c2 ). Por isso é necessário deixar sempre claro a qual energia
estamos nos referindo para evitar confusão.
Um outro resultado importante do ponto de vista da mecânica é aquele
que associa a energia ao momentum da partícula. Sua importância se deve
ao fato de que, ao usarmos por exemplo a formulação Hamiltoniana da
mecânica clássica, partimos da definição do Hamiltoniano H( p, q) onde
( p, q) são as coordenadas canônicas do sistema:

p2
Hclássico = K + U = + U (q) (6.55)
2m
onde por clássico queremos dizer não relativístico. As equações do movimento
são obtidas via
∂H dp ∂H dq
=− ; = (6.56)
∂q dt ∂p dt
Se quisermos obter uma relação entre energia e momentum para poder
então escrever o Hamiltoniano de modo que seja relativisticamente correto,
podemos proceder da seguinte maneira: consideremos uma partícula de
velocidade u no referencial I mas que, para um referencial I 0 que se move
com velocidade v em relação à I, sua velocidade seja u0 . Como a massa de
repouso m0 é um invariante, podemos escrever a energia total da partícula
nos diferentes referenciais como

E = K + m0 c2 , E 0 = K 0 + m0 c2 , (6.57)

© s.r. dahmen 2022


114 uma introdução à teoria do espaço e do tempo

Vamos agora achar a relação entre os momenta da partícula nos 2 referenciais.


Pela equação (6.22) temos, para a componente x do momentum:
m0
px = q ux , (6.58)
u2
1− c2

sendo que a mesma expressão vale para as outras componentes do momen-


tum. Como nosso objetivo é fazer com que apareça p0x nesta expressão,
vamos utilizar a equação de transformação entre as velocidades u x e u0x nos
diferentes referenciais (v. equação 2.119), substituindo nela u x por u0x . Com
um pouco de álgebra é possível mostrar que

(1 + vu0x /c2 ) u0x + v


 
m0
px =
1 + vu0x /c2
q q
v2 02
1− c2
1 − uc2
 
m0 m0 v  q 1
= q u0x + q
u 02 u 02 v2
1− c2
1− c2
1− c2
p0x + vE0 /c2
= q . (6.59)
2
1 − vc2

Utilizamos na passagem da penúltima para a última equação a relação


E0 = mc2 . Se seguirmos o mesmo procedimento chegaremos finalmente à

E0 + vp0x
py = p0y ; pz = p0z ; E= q (6.60)
2
1 − vc2

Este resultado é bastante significativo pois se olharmos mais atentamente


para ele, veremos que as grandezas

E
p x , py , pz , (6.61)
c2
se transformam exatamente como as coordenadas x, y, z, t. Portanto, da
mesma maneira que o intervalo

c2 t2 − x 2 − y2 − z2 = c2 t 02 − x 02 − y 02 − z 02 (6.62)

é um invariante, a grandeza

E2 E 02
2
− p2 = 2 − p02 = m20 c2 (6.63)
c c

também é um invariante e tem o valor igual à m20 c2 . Para chegar à última


expressão usamos o fato que E2 = m2 c4 e p2 = γ2 m20 u2 . Com isto chegamos
à famosa relação relativística entre energia e momentum
q
E2 = ( pc)2 + (m0 c2 )2 −→ E = p2 c2 + m20 c2 (6.64)

A importância deste resultado está também no fato que ele nos permite
achar uma relação entre a energia e o momentum de partículas de massa de
repouso zero, como por exemplo o fóton. Para o caso do fóton em particular
temos

E = pc → hν = pc → p = = h̄ k (6.65)
c

© s.r. dahmen 2022


a mecânica relativística i: massa e momentum 115

Figura 6.5: Um triângulo retângulo


mnemônico que mostra a relação en-
tre a energia E, a energia de repouso
m0 c2 , o momentum p e a energia cinética
E = K + m0 c2 . Os ângulos√θ e φ são tais
que sin θ = v/c e sin φ = 1 − v2 /c2 .
K
2
mc φ
E=
2
c
m0
pc

m c2
0

Há uma maneira mnemônica de nos lembrarmos da relação (9.12) utilizando


para tanto um triângulo retângulo e o teorema de Pitágoras, como ilustra a
figura abaixo.
A expressão para E por nós deduzida nada mais é que o Hamiltoniano da
partícula. Caso ela esteja submetida a um potencial, a expressão Hclássico é
substituida por
q
H = p2 c2 + m20 c2 + U (6.66)

6.8 Seriam massa e energia equivalentes?

Antes de olharmos para algumas aplicações, devemos nos colocar a seguinte


pergunta: seria m0 c2 realmente uma energia ou apenas uma quantidade
com a dimensão de energia mas desprovida de conteúdo físico? Um Ge-
dankenexperiment simples ajuda-nos a entender o motivo pelo qual no nosso
dia-a-dia menosprezamos a energia de repouso e ficamos com a impressão
que ela não é “real”.
Um projétil de um fuzil tem uma velocidade de aproximadamente 1000 m/s.
Considerando a massa com sendo 10 g, sua energia cinética vale 5 × 103 J.
Comparando esta energia com sua energia de repouso, teremos

m0 c2 9 × 1014
= = 1.8 × 1011 (6.67)
K 5 × 103
ou seja, a energia de repouso é quase 200 bilhões de vezes maior que a
energia cinética do projétil. Isto significa, segundo a relatividade, que a
energia total do projétil em movimento ou em repouso é praticamente a
mesma, pois a energia cinética representa uma correção na energia total
na 11ªcasa decimal. Imaginemos agora a situação em que estamos num
avião que voe à 3600 km/h, ou seja, tenha a mesma velocidade do projétil
lançado do solo na mesma direção do nosso avião. Poderíamos pegar o

© s.r. dahmen 2022


116 uma introdução à teoria do espaço e do tempo

projétil com a mão sem nos ferirmos, algo que obviamente não faríamos
se estivéssemos parados em relação ao fuzil. Embora o projétil parado e
o projétil em movimento tenham energias cinéticas muito diferentes – e
está diferença é fundamental para os danos que ele posso nos causar – em
ambas as situações a energia de repouso está, digamos, escondida e por
este motivo não contribui para um eventual dano que o projétil possa nos
causar. A energia de repouso não se manifesta e simplesmente podemos
desprezá-la: todas as energias relevantes podem ser medidas tomando a
energia de repouso como nível “zero” de energia. Mas é justamente nesta
constatação que está a chave para verificarmos sua realidade: seu processo
de conversão. Afinal, uma das características da energia é a possibilidade
de sua conversão em outras formas de energia. Neste sentido, se houver
experimentos que mostrem a conversão de massa de repouso em outras
formas de energia, então mO c2 é efetivamente uma energia e não apenas
um denominador comum na dinâmica de um corpo que pode ser, digamos,
cancelado em ambos os lados da equação.
A conversão de energia de repouso em outras formas de energia é real e
ocorre em diferentes sistemas físicos, como discutiremos adiante. O caso
mais emblemático é o da chamada aniquilação de pares, ou seja, aquela entre
uma partícula e sua antipartícula. No caso da aniquilação elétron-pósitron
e− + e+ −→ γ, ambas as partículas deixam de existir e surge um fóton γ
cuja energia é a soma das energias cinéticas antes da colisão e de sua energias
de repouso. Nos processos de aniquilação de pares há uma conversão total
de massa de repouso em energia cinética, mas há processos outros onde
uma fração da massa de repouso é convertida. Segundo Matveev 11 : 11
A.N. Matveev, op.cit., p. 182–183.

Em todos os processos físicos, a energia desaparece em uma forma


e aparece em outra, de modo que seu valor permanece constante
durante este processo de conversão. Da mesma maneira, a forma de
existência da massa muda, mas seu valor é conservado. A equação
E = mc2 indica que independentemente da maneira como a massa
e energia se convertem em suas diferentes formas, a relação massa–
energia é sempre satisfeita.

Há uma certa confusão na literatura não especializada ao afirmar que é


possível converter “massa” em “energia”, pois normalmente se aceita a
equação E0 = m0 c2 por aquilo que ela aparenta ser e não por aquilo que ela
realmente é. Como a energia de repouso de corpos macroscópicos é absurda-
mente alta, infere-se que teríamos em poucos gramas de matéria uma fonte
praticamente inesgotável de energia e o desaparecimento da massa resultaria
no surgimento de uma energia que não existia antes. Em outras palavras,
se cogita no desaparecimento de um partícula ex nihilo e o surgimento de
uma energia como consequência. Tais processos nunca foram observados
na natureza. Teoricamente não estamos errados em pensar na conversão
total de uma massa em energia mas como este processo só é observado na
aniquilação de pares, seria necessário uma quantidade macroscópica de an-
timatéria para aniquilar a matéria correspondente. No entanto, as condições
experimentais para que se criem antipartículas exigem um dispêndio de
energia muito maior que a energia obtida pela conversão total das massas
envolvidas. Neste sentido a geração de energia pela aniquilação de pares
não tem valor prático. Mas outros processos há, como veremos adiante,
nos quais uma fração da massa de repouso é transformada em energia – as

© s.r. dahmen 2022


a mecânica relativística i: massa e momentum 117

reações nucleares. Estes são processos usados nas reatores nucleares para
geração de energia.

6.9 Energia a partir da massa

Pode nos parecer estranho mas todo dia presenciamos a transformação de


energia em massa – e não estamos aqui falando dos processos de fusão que
ocorrem no Sol – mas de processos mais corriqueiros. Para isto devemos ter
em conta que aquilo que denominamos energia interna de um corpo contribui
para sua massa. Deste modo, se tormarmos dois corpos idênticos, um resfri-
ado à ∼ 0 K e outro aquecido à 500 K e os colocarmos numa balança, esta
penderia para o lado do corpo mais quente. A comprovação experimental
deste fenômeno está no entanto além da nossa precisão experimental. Um
outro exemplo simples são as portas de elevadores com molas (ou portas
com molas, de um modo geral). Ao abrirmos uma porta realizamos um tra-
balho comprimento uma mola, aumentando assim sua energia potencial por
uma quantidade ∆E. Por exemplo, se fizermos uma força de 20 N atuando
por uma distância de 0.5 m, desprezando o atrito teremos aumentado a ener-
gia potencial por algo no entorno de 10 J. Supondo que a mola tenha uma
massa de 1.0 kg, sua energia de repouso vale E0 = 1.0 × 9 × 1016 ≈ 1017
J. Portanto, ao ser comprimida a massa de repouso da mola varia por
∆E/E0 ≈ 10−16 . Portanto, uma mola comprimida sofreria uma aceleração
menor que aquela que sofreria quando distendida se submetida nos dois
casos à mesma força. É evidente que estas variações da massa de repouso
são tão ínfimas que não temos como comprová-las experimentalmente. Isto
deve deixar mais ou menos claro para nós que se quisermos observar os
fenômenos de transformação de massa em energia (e vice-versa) devemos
olhar para os processos em escala atômica – reações químicas – ou processos
em escala subatômica – as relações nucleares.
As reações químicas como bem sabemos ocorrem devido ao rearranjo dos
orbitais eletrônicos. Em função da reestruturação dos orbitais, as energias
de interação entre átomos varia, variando assim sua massa. À diminuição
de massa estão associados processos exotérmicos ao passo que processos
endotérmicos estão associados à absorção de calor e consequente aumento
da massa dos compostos. Embora a variação da massa de repouso seja rela-
tivamente maior que no caso da mola discutido acima, ela representa uma
parte ínfima – da ordem de 0, 000001% = 10−8 da massa inicial e portanto
na química se condidera a massa de repouso como sendo invariante. Já nas
reações nucleares há variações de massa da ordem de 0.1 − 0.5%. Isto não
nos parece ser muito pois corresponde à um ∆E/E0 de aproximadamente
1/1000. Porém, em se tratando de núcleons, esta variação de massa pode
corresponder à uma energia cinética altíssima. No caso da bala de fuzil
que discutimos na seção anterior, uma variação deste porte corresponde
a um ∆E de 1012 J, uma energia que corresponde à 200 milhões de vezes
a energia cinética original do projétil 12 . Toda questão da energia gerada K. Mukhin, Física Nuclear Recreativa, Ed.
12

por processos nucleares obrigatoriamente passa pela discussão da energia de Mir, Moscou, 1987, pp. 133 – 135.
ligação entre os constituintes do átomo em questão.
À toda força atrativa está associada uma energia potencial negativa. Pensemos
no caso de um corpo sobre a superfície da Terra. À velocidade de escape do
corpo é aquela cuja energia cinética associada é suficiente para levar o corpo

© s.r. dahmen 2022


118 uma introdução à teoria do espaço e do tempo

a um ponto infinitamente distante, onde então sua energia total será zero.
Assim como K + U = 0, segue que U deve ser negativo no caso de potenciais
atrativos. Pensemos porém o caso da energia relativística. Tomemos um
satélite gravitando em torno da Terra. A soma da energia total e potencial
E + U do satélite em órbita deve ser menor que sua energia de repouso,
ou seja E + U < m0 c2 . Imaginemos que o contrário fosse verdadeiro, ou
seja, E + U > m0 c2 . Por conservação de energia seria possível então o
satélite ir para r → ∞, onde U = 0 e teríamos E > m0 c2 . Isto obviamente é
verdade pois a energia de uma partícula que não esteja sob ação do potencial
é sempre maior (no mínimo igual) à sua energia de repouso. Já quando
E + U < m0 c2 , o satélite e a Terra formam um estado ligado e não tem como
o satélite se desprender do campo gravitacional, pois para termos U = 0 e
a equação acima implicaria em E < m0 c2 . Como nenhum corpo pode ter
energia menor que sua energia de repouso, então a condição que tenhamos
um estado ligado (bound state) se resume à

E+U < m0 c2
( E − m 0 c 2 ) +U < 0
| {z }
=K
K+U < 0 (6.68)

Portanto, a condição para a formação de um estado ligado é que a soma


da energia potencial e energia cinética sejam negativas. Generalizando este
resultado para vários corpos interagentes, a condição para que estes corpos
existam num estado ligado é que a soma das energias cinéticas e potenciais de
todas as partículas envolvidas no estado ligado deve ser negativa. Esta energia é
chamada de energia de ligação (binding energy).

6.9.1 Energia de Ligação de Núcleons


Os núcleos atômicos são compostos por prótons e nêutrons. A energia total
de um núcleo atômico é igual à soma das energias de repouso dos núcleons
que o constituem, denominadas E0p e E0n mais a energia de ligação, aqui
denotada por −∆Enuc

Enuc = E0p + E0n − ∆Enuc (6.69)

Se a relação massa–energia se aplica também para a energia potencial de


interação – para a energia cinética e de repouso sabemos que ela se aplica –
a relação acima pode ser escrita como 13 : 13
Matveev, op. cit. p. 184.

Mnuc c2 = M0p c2 + M0n c2 − ∆Mnuc c2 (6.70)

ou seja,
Mnuc = M0p + M0n − ∆Mnuc (6.71)
A grandeza ∆Mnuc = ∆Enuc /c2
é chamada de defeito de massa (mass defect) do
núcleo. Para um núcleo pesado de número atômico Z e número de massa A
esta relação pode ser escrita como

Mnuc = Zm0p + ( A − Z )m0n − ∆Mnuc (6.72)

onde m0p e m0n são a massa de repouso do próton e do nêutron, respectiva-


mente.

© s.r. dahmen 2022


a mecânica relativística i: massa e momentum 119

Obviamente a energia de ligação (ou defeito de massa) é diferente para


diferentes núcleos e por isso, com o intuito de ter uma medida comparativa
da energia de ligação entre os elementos da tabela periódica, costuma-se
definir a energia e por núcleon

∆Enuc
e= (6.73)
A

Figura 6.6: Energia de ligação e por


núcleon dos isótopos mais comuns.
Fonte: wikipedia.

A energia de ligação para o núcleo mais simples (Hidrogênio) é zero, pois


seu núcleo é constituído de apenas 1 próton. Já seus isótopos, o Deutério
e o Trítio, e os átomos de Hélio e Oxigênio tem energias que ligação que
correspondem à 0.1%, 0.27%, 0.74% e 0.85% das suas energias de repouso
respectivamente 14 . Para núcleos atômicos constituídos por um número de 14
O Deutério é o isótopo do Hidrogênio
50 a 60 núcleons a energia de ligação chega a aprox. 0.92% da energia de formado por um núcleo constituído de 1
repouso, caindo depois para aproximadamente 0.78% para os núcleos mais próton e 1 nêutron. Já para o Trítio temos
1 próton e 2 nêutrons.
pesados. Isto significa que se um elemento do final da tabela periódica se
dividir em duas partes aproximadamente iguais, obteremos um elemento
próximo ao meio da tabela periódica, cujos núcleons estão mais fortemente
ligados que o elemento original que lhes deu origem. Portanto, a soma das
massas de repouso dos núcleos-filhotes será menor que a massa de repouso
do núcleo-mãe. A diferença de energia é liberada na forma de energia
cinética dos produtos da fissão e radiação emitida durante o processo. Este
é o processo físico por trás dos reatores nucleares e bombas atômicas.

© s.r. dahmen 2022


7
A Mecânica Relativística II: Exemplos

Nesta capítulo discutiremos como alguns problemas simples da mecânica de


uma partícula, como o problema do movimento unidimensional e bidimensi-
onal sob a ação de uma força constante diferem dos resultados da mecânica
newtoniana. Trataremos também do problema do foguete relativístico e suas
consequências.

7.1 Movimento unidimensional sob F constante

O problema mais simples que podemos tratar é o de uma partícula de


massa de repouso m sob a ação de uma força F constante 1 . Para facilitar 1
Nesta seção e nas próximas deixaremos
a comparação como caso newtoniano, representaremos as equações lado a de usar m0 para representar a massa de
lado: à esquerda apresentaremos o resultado não relativístico e à direita o repouso e usaremos simplesmente m.
relatívístico.
A equação de movimento nos dois casos é escrita como

d d
(mv) = F | (γmv) = F (7.1)
dt dt

Integrando as equações em t e supondo, como condição inicial, que v(t =


0) = 0 obtemos
mv
mv = Ft | q = Ft (7.2)
2
1 − vc2
Resolvendo algebricamente as duas equações para achar o valor de v obte-
mos

F Ft/m vcl
vcl = t = acl t. | vrel = r  2 = q . (7.3)
m vcl 2
1 + mcFt 1 + c

A expressão para vrel deduzida acima, embora correta, não deixa explícita
o fato que nenhum corpo com massa m pode ter uma velocidade igual ou
superior a da luz, pois classicamente a expressão para vcl não tem limite
superior. Porém, de acordo com a relatividade, à medida que aumenta a
velocidade há um aumento de massa inercial. Isto implica que sendo F uma
força constante, a aceleração não mais o será, diminuindo com o tempo.
Para ver isto basta reescrever a expressão acima em termos da aceleração do
122 uma introdução à teoria do espaço e do tempo

caso clássico acl , escrevendo a expressão acima como

acl t c
vrel = r  2 = r , (7.4)
c2
1 + aclc t 1+ a2cl t2

o que nos leva à


c t→∞
vrel = r −→ c. (7.5)
c2
1+ a2cl t2

Precisamos agora integrar as equações para vcl e vrel para obtermos a


posição x (t) da partícula. De novo, assumiremos como condição inicial que
x (t = 0) = 0. A integração da equação clássica é trivial. Já para a equação
relativística temos que resolver

Z t
acl t
x (t) = r  2 dt, (7.6)
0
1 + aclc t

cuja solução é
s 
c2  acl t 2
 
x (t) = 1+ − 1 . (7.7)
acl c

Portanto, juntando as duas fórmulas para comparação temos


s 
c2  acl t 2
 
1
x (t) = acl t2 | x (t) = 1+ − 1 . (7.8)
2 acl c

Para complementar, podemos agora deduzir a expressão para a aceleração


no caso relativístico simplesmente derivando a eq. (7.62) em relação ao
tempo. Um cálculo simples nos leva à

acl
a(t) = acl = constante | a(t) = r  2 . (7.9)
1 + aclc t

Examinemos agora com um pouco mais de detalhe as equações (7.62), (7.7),


e (7.9). No que diz respeito à equação que descreve a posição, vemos que
diferente do caso clássico onde a relação entre x e t é parabólica, no caso
relativístico a parábola é substituída por uma hipérbole. Por este motivo
costuma-se falar do “movimento hiperbólico de uma partícula relativística”.
É fácil também mostrar que esta equação, no limite de acl t = vcl  c,
reproduz a trajetória clássica x (t) = 21 acl t2 . Com relação à aceleração, fica
claro pela equação (7.9) que a aceleração diminui com o passar do tempo,
como era esperado.
Um outro resultado interessante que podemos tirar desta análise é aquele
que diz respeito ao tempo de coordenada t, ou seja, o tempo medido por
um referencial inercial em relação ao qual a partícula se movimenta, e o
tempo próprio τ que a partícula registra. Supondo que os tempos iniciais
coincidam, isto é t0 = τ0 = 0, a relação que existe entre estes dois é dada

© s.r. dahmen 2022


a mecânica relativística ii: exemplos 123

pela expressão:
v
a2cl t2
s u
v2
Z t Z tu
c2
= 1− dt = t1 − dt
u
τ
0 c2 0 a2 t2
1 + clc2
 
c acl t
= arcsinh
acl c
 s 
c a cl t a2cl t2
= ln  + 1+ 2 . (7.10)
acl c c

Para tempos muitos grandes a2cl t2 /c2  1 e portanto desprezando o fator 1


na raiz quadrada, a expressão acima se aproxima de
 
c 2acl t
τ≈ ln , (7.11)
acl c
ou seja, o tempo próprio transcorre mais lentamente que o tempo t medido
pelo observador inercial.

7.2 Movimento de uma partícula carregada em um campo +

elétrico E uniforme: o caso bidimensional v0 E


y

eE
Vamos olhar agora para o caso de uma partícula de carga e positiva com
velocidade inicial v0 = (v x , vy ) = (0, v0 ) que se mova entra as placas de um −
capacitor plano cuja dimensão é suficientemente grande para que o campo E
possa ser considerado constante. Este problema é equivalente ao lançamento
x

horizontal de uma massa em um campo gravitacional.


Como a forma da 2a. Lei de Newton é a mesma, seja no caso clássico, seja
no relativístico, podemos escrever as equações de movimento na forma
Figura 7.1: Movimento de uma partícula
dp x de carga e > 0 entre as placas de um
= eE, capacitor. As placas são consideradas
dt dp
=⇒ = eE, (7.12) grandes o suficiente para que o campo
dpy dt
=0 elétrico E no seu interior seja constante.
dt A partícula tem uma velocidade inicial
Tomando p0x = 0 e p0y = p0 como condições iniciais chegamos por integra- v0 na direção do eixo y positivo.
ção simples à solução na forma

px = p0x + eEt = eEt,


py = p0y = p0 ,
2
p = p2x + p2y = (eEt)2 + p20 . (7.13)

A diferença nas soluções surge quando buscamos determinar x(t) ou v(t)


nos diferentes casos, pois a relação entre p e v não é a mesma nas duas
situações. Para o caso clássico, quando v0  c, tomando a definição clássica
de momentum p = mv e as condições iniciais x0 = y0 = 0 e chegamos
facilmente à
1 eE 2 1 eE 2 eE
x = x0 + t = t ; vx = t
2 m 2 m m
y = y0 + v0 t = v0 t ; v y = v0
1 eE 2
x = y . (7.14)
2 mv20

© s.r. dahmen 2022


124 uma introdução à teoria do espaço e do tempo

O movimento bidimensional no caso relativístico, diferentemente do caso


clássico, é mais complicado: à medida que a velocidade da partícula au-
menta, aumenta sua massa. O aumento da massa levaria consequentemente
a um aumento de py , o que é fisicamente impossível pois não há forças
atuando nesta direção. Portanto, para que py se mantenha constante à
medida que a massa aumenta, é necessário que vy diminua com o passar do
tempo e como consequência teremos uma trajetória que não é mais descrita
por uma parábola mas deve reproduzir esta nos limites de v  c. Partamos
então da definição de momentum na relatividade, p = mγvrel e da relação
entre a energia e momentum, eq. (9.12) 2 : 2
Lembramos, mais uma vez, que nesta
q s seção m representa a massa de repouso.
ε = m2 c4 + p2 = m2 c4 + p20 +(ceEt)2
| {z }
ε0
q
= ε20 + (ceEt)2 (7.15)

onde fizemos também uso da última equação em (7.13). Lembrando porém,


da equação (6.46) segundo a qual ε = mγc2 e portanto mγ = ε/c2 podemos,
substituindo esta expressão em p = mγv escrever
c2
vrel = p (7.16)
ε
Desta equação segue que
dx p x c2 dy p c2
vrel
x = = ; vrel
y = = 0
dt ε dt ε
( Eet)c 2 p0 c2
= q ; = q
2
ε 0 + (ceEt)2 ε20 + (ceEt)2
vx
= q (7.17)
ε20 v2x
mc2
+ c2

Estes resultados confirmam nossa suspeita que vrel


y diminui com o passar
do tempo, eventualmente chegando a 0 quando t → ∞. Do mesmo modo é
fácil mostrar que

rel 2 t→∞
q
vrel = (vrel 2
x ) + ( vy ) −→ c. (7.18)

Finalmente, integrando as duas equações em t, sujeitas às condições iniciais,


chegamos finalmente à expressão
( Eet)c2
Z t
x = q dt
0 ε20 + (ceEt)2
1
q
ε0
= ε20 + (ceEt)2 − (7.19)
eE eE
para x (t). Para a variável y(t) temos:
p0 c2
Z t
y = q dt
0 ε20 + (ceEt)2
 
p0 c ceEt
= arcsinh
eE ε0
 s 
ceEt 2 
 
p0 c  ceEt
= ln + 1+ (7.20)
eE ε0 ε0

© s.r. dahmen 2022


a mecânica relativística ii: exemplos 125

Isolando t nas duas equações chegamos finalmente à equação da curva que


determina a trajetória da partícula
 
ε eEy
x= 0 cosh −1 (7.21)
eE p0 c

A equação portanto da trajetória é aquela de uma catenária. A diferença


entre uma catenária e um parábola é desprezível quando v/c  1. Quando
isto ocorre, temos
q
ε 0 = m2 c4 + p20 c2 ≈ mc2 ; p0 = mv0 ; γ≈1 (7.22)

Lembrando também que cosh x ≈ 1 + x2 /2 para x  1 temos finalmente


" #
1 eEy 2
 
ε0 eE 2
x= 1+ −1 = y (7.23)
eE 2 p0 c 2mv20

que é o resultado por nós obtido para o caso clássico, a última expressão da
eq. (7.14).

7.3 Movimento de uma partícula carregada em um campo


magnético B uniforme

Para uma partícula de carga e num campo magnético uniforme B podemos,


como nos casos anteriores, escrever diretamente a 2a. Lei de Newton como

dp
= ev×B (7.24)
dt
Diferente dos outros casos porém, no caso em questão as equações não
são apenas idênticas na forma, mas também no conteúdo. Isto ocorre
pois o campo magnético não realiza trabalho sobre a carga e portanto sua
energia permanece constante. Sabemos obviamente que as expressões para
os respectivos momenta são diferentes no caso clássico e no caso relativístico.
Usando então a relação (7.16), i.e. p = cE2 vrel podemos escrever a expressão
acima como
dvrel ec2
= v × B. (7.25)
dt E rel
Para efeito de comparação, a equação para o caso clássico quando p = mv é

dv e
= v × B. (7.26)
dt m
Portanto, as equações nos dois casos diferem apenas no fator que multiplica
o termo v × B. Vamos escolher o vetor B como tendo a direção do eixo z
positivo, i.e B = Bk̂. Temos assim, nos dois casos

dv eB dvrel ec2 B
= v × k̂ | = vrel × k̂ (7.27)
dt m dt E
Os dois termos que multiplicam o produto vetorial
s
eB ec2 B eB ω v2
ωcl = ωrel = = = cl = ωcl 1− (7.28)
m E mγ γ c2

© s.r. dahmen 2022


126 uma introdução à teoria do espaço e do tempo

ou seja, a frequência de cíclotron ωrel é menor que a frequência de cíclotron


clássica ωcl . Não obstante o raio da órbita da carga seja diferente nos dois
casos, as equações

dv x dvy dvz
= ω vy ; = −ω v x ; =0 (7.29)
dt dt dt
onde, dependendo do caso, usamos ωcl ou ωrel , têm uma solução que pode
ser obtida pelos métodos tradicionais na forma

vx = v0 cos(ωt + α)
vy = −v0 sin(ωt + α) (7.30)

onde α é uma constante de integração.

7.4 O foguete relativístico

O deslocamento de um veículo movido por um motor de reação, seja ele


uma turbina ou um foguete, se deve ao fato que num intervalo de tempo
dt o motor ejeta uma quantidade de gases aquecidos com uma velocidade
relativamente constante em relação ao veículo. Pela 3a. Lei de Newton, 3
V.I. Ugarov, The Special Theory of Relati-
ao ejetar estes gases o veículo sofre um empuxo na direção contrária à vity, Mir Publishers, Moscow, pp. 169 –
ejeção. Em ambos os casos, relativístico e não relativístico, é mais fácil 172.
resolver o problema do ponto de vista de um referencial que se move com
o objeto, pois motores a reação são projetados para expelir gases a uma 4
A. N. Matveev, op. cit. pp. 269 – 275.
velocidade constante em relação ao veículo em questão 3 . A equação que
rege o movimento de um motor de reação foi obtida pela primeira vez pelo
pioneiro russo da astronáutica Konstantin E. Tsiolkovsky.
Consideremos inicialmente as equações de movimento do foguete, que num
dado instante t, tem uma velocidade v e uma massa M (t) 4 . Durante um
curto intervalo de tempo dt, o foguete ejeta uma quantidade dM0 de massa
a uma velocidade u. Ambas as velocidades são medidas em relação a um
referencial inercial parado e não em relação ao referencial próprio do foguete.
Pela lei de conservação de massa, a quantidade de massa ejetada dM0 e a
variação da massa do foguete dM estão relacionadas via

dM + dM0 = 0 (7.31)

O fato de dM ser negativo na expressão acima se dá pelo simples fato da


massa do foguete diminuir com o tempo. Num dado instante t o momento Figura 7.2: Konstantin Eduardovich Tsi-
total do sistema é Mv ao passo que em t + dt, pela ejeção de massa, o olkovsky (1857 – 1935). Tsiolkovsky era
momentum total do sistema passa a ser ( M + dM) × (v + dv) + udM0 . professor de uma escola na cidade de Ka-
Considerando o sistema foguete + gases ejetados como um sistema isolado luga.
(não existe forças externas atuando) temos, pela lei de conservação de
momentum, que
u M v

( M + dM) × (v + dv) + udM0 = Mv (7.32)


dM’

Desprezando o termo de segunda ordem em dMdv podemos escrever a


equação acima como Figura 7.3: O foguete de Tsiolkovsky.

Mdv + vdM + udM0 = 0, (7.33)

© s.r. dahmen 2022


a mecânica relativística ii: exemplos 127

que, combinada com (7.31) pode finalmente ser escrita como

d dM
( Mv) = u . (7.34)
dt dt
Esta equação vale quer estejamos lidando com o caso clássico, quer com o
caso relativístico.

O foguete clássico. Na prática a velocidade u da massa ejetada, medida a


partir de um referencial inercial, diminui à medida que o foguete acelera.
É fácil entendermos isto pois os motores de foguetes são projetados de tal
modo que a queima de combustível e portanto a velocidade u0 – medida no
referencial do foguete – com que a a massa é expelida é conhecida ao longo
do processo de queima. Como na mecânica clássica a adição de velocidades
é simplesmente
u = u0 + v (7.35)
Se substituirmos esta expressão na equação acima ficamos com

dv dM dM
M = (u − v) = u0 (7.36)
dt dt dt

que tem a vantagem sobre a equação anterior por ser u0 conhecida ao longo
do processo. Este detalhe é crucial na solução do foguete clássico: embora o
foguete represente um referencial inercial diferente a cada instante de tempo,
na mecânica clássica todos as velocidade e seus respectivos incrementos
se adicionam linearmente. Portanto não importa se a equação por nós
obtida diz respeito a um único referencial inercial ou a vários. A velocidade
final pode ser obtida integrando esta equação diretamente. Chamamos
atenção para isto pois esta fato – a aditividade de velocidades a la Galileu – é
fundamental para que cheguemos à (7.36). Isso porém não se aplica ao caso
relativístico pois as velocidades (ou seus incrementos) não se adicionam
diretamente, como veremos posteriormente. Caso o foguete esteja sob a
ação de uma força externa F a equação acima se torna

dv dM
M = F + u0 (7.37)
dt dt
Esta equação descreve o movimento de foguetes não relativísticos sujeitos à
ação de uma força externa. Na astronáutica costuma se definir a grandeza µ
como sendo a taxa temporal de consumo de combustível via µ = −dM/dt >
0, de modo que a equação acima é normalmente escrita como

dv
M = F − µu0 (7.38)
dt

A força µu0 é chamada de força reativa do foguete. A equação acima nos diz
que se v e u tem mesma direção mas sentidos opostos, o foguete é acelerado.
Caso tenham o mesmo sentido, o foguete é desacelerado. Para quaisquer
outras direções destes dois vetores, não apenas a velocidade do foguete
muda em módulo como também direção.

A Equação de Tsiolkovsky. Consideremos agora o caso em que o foguete


se move em linha reta, que a velocidade u0 com que o gases ejetados seja

© s.r. dahmen 2022


128 uma introdução à teoria do espaço e do tempo

constante e não há forças externas atuando sobre o foguete. Neste caso (7.36)
se torna
dv dM
M = −u0 (7.39)
dt dt
Supondo que o foguete tenha uma velocidade inicial v0 e uma massa inicial
M0 , e escrevendo a equação acima como
dM dv
=− 0 (7.40)
M u
uma integração simples nos leva à
M 0
v − v0 = u0 ln 0 ⇔ M = M0 e−(v−v0 )/u . (7.41)
M
Esta é a famosa fórmula de Tsiolkovsky para um foguete clássico, deduzida
em 1903 por K. Tsiolkovsky 5 . Ela pode ser usada para se determinar qual 5
K. E. Tsiolkovsky, Selected works of Kons-
a mudança de velocidade do foguete dada uma mudança de sua massa (eq. tantin E. Tsiolkovsky, University Press of
à esquerda) ou qual sua nova massa conhecida sua mudança de velocidade the Pacific, Honolulu, 2004.
(eq. à direita). É possível ver por esta equação que a velocidade do foguete
será tanto maior quanto maior a razão M0 /M.

Se nosso objetivo for enviar uma nave ao espaço com o menor consumo
possível de combustível, ou seja para a menor diferença possível entre M0
e M, uma velocidade final suficientemente grande só pode ser atingida
aumentando-se a velocidade de escape dos gases. Porém, na vida real as
velocidades de ejeção de gases são da ordem de 4 ∼ 5 km/s. Portanto
se faz necessário usar uma outra idéia de Tsiolkovsky para imprimir a
espaçonaves velocidades grandes o suficiente: um foguete de vários estágios.
A vantagem dos estágios está não apenas na possibilidade de levar mais
combustível como também se livrar do peso dos tanques e motores pois
uma vez fora de uso eles representam uma massa que não faz parte da carga
útil (payload) que se deseja enviar. Por exemplo, se quisermos levar uma
espaçonave para além do campo gravitacional terrestre, é preciso imprimir
a ela uma velocidade de 11.5 km/s. Considerando que a velocidade inicial
de lançamento é v0 = 0 e a velocidade típica de ejeção u0 = 4 km/s, ao
substituirmos estes valores em obtemos
 
11.5 M
M = M0 exp − −→ M ≈ M0 e−3 ≈ 0 , (7.42)
4 20
ou seja, apenas 5% da massa total do foguete poderá ser levada para além da
atração gravitacional terrestre. Na realidade a situação é mais desfavorável
pois não estamos levando em conta na equação acima a resistência da
atmosfera sobre o foguete durante os primeiros 100 km da sua subida.
Como exemplo de aplicação, tomemos o foguete Saturn V, utilizado no
projeto Apollo para enviar o homem à lua. Coloquemos o problema da
seguinte maneira: a carga útil projetada para ser colocada em TLI 6 era de 6
TLI = trans-lunar insertion, a manobra
M = 48600 kg, que era a massa do módulo lunar mais módulo de comando. necessária para se colocar a espaçonave
A velocidade a ser atingida era de 7.8 km/s. Repetindo o cálculo acima, numa trajetória que a levará à Lua.
sendo 2.58 km/s a velocidade de ejeção dos gases, teríamos
 
7.8 M
M = M0 exp − −→ M ≈ M0 e−3 ≈ 0 , (7.43)
2.58 20

© s.r. dahmen 2022


a mecânica relativística ii: exemplos 129

Isso nos dá um M0 = 0.972 × 106 kg, ou seja, quase 1 milhão de kg. Na


realidade este cálculo está longe de ser correto, pois desprezamos o peso
do foguete e a resistência do ar. Na realidade o Saturno V era composto
por três estágios. O primeiro estágio levava o foguete a uma velocidade de
2.3 km/s num intervalo de tempo ∆t = 168 s a uma altitude de 67 km. A
massa total do primeiro estágio era de 2.29 × 106 kg, sendo que deste valor
2.16 × 106 kg era combustível (94% da massa total). O segundo estágio, como
uma massa total 496.2 × 103 kg (dos quais 456.1 × 103 kg era combustível,
representando 92% da massa total) ejetava os gases a uma velocidade de
4.13 km/s. Sua função era levar o terceiro estágio a uma órbita de 170 km
de altitude, a conhecida LEO 7 . O tempo de queima era de 360 s. O terceiro, 7
LEO = low Earth orbit, ou seja, uma
com um tempo de queima de 421 s era responsável por colocar o módulo órbita considerada baixa
de comando e módulo lunar na TLI, tinha 123 × 103 kg, 107.8 kg a massa
do combustível (aprox. 88% da massa total). A velocidade de ejeção dos
gases era de 4.13 km/s e a espaçonave era colocada a uma velocidade de 7.8
km/s.
Na realidade, para se colocar uma carga útil em órbita, procura-se acelerar
o foguete à maior velocidade no menor tempo possível, descartando a carga
inútil – os motores e tanques vazios – o quanto antes. Neste sentido os
valores reais de combustível necessário são muito mais altos que os valores
teóricos.

O foguete relativístico. Consideremos agora o caso relativístico. O que muda


é que, como sabemos, no caso relativístico a massa na equação (7.34) é
substituída pela massa relativística

M0
M= q (7.44)
v2
1− c2

onde M0 representa a massa do foguete medida em seu referencial e que


varia no tempo (pois ele ejeta parte dela). A massa do foguete vai diminuir
com o tempo pois embora haja um aumento da massa com a velocidade,
este aumento não compensa a perda da massa ejetada. A equação para o
movimento do foguete se torna então, no caso relativístico
   
d  M0 v  d  M0 
q =u q (7.45)
dt 1− v
2 dt 1− v
2
c2 c2

Podemos agora “abrir” a derivada do produto do lado esquerdo da equação


e passar o termo proporcional à derivada temporal da massa relativística
para o outro lado da equação, reescrevendo-a como
 
M0 dv d  M0 
q = (u − v) q (7.46)
1 − v dt dt
2 2
c2
1− v c2

Esta equação é idêntica à equação (7.36) onde substituimos a massa não


relativística pela massa relativística. Porém, e aqui devemos ter cuidado,
a diferença (u − v) não é a velocidade de ejeção dos gases relativa ao foguete,
isto é, u0 , como no caso clássico, pois as velocidades não se somam mais segundo

© s.r. dahmen 2022


130 uma introdução à teoria do espaço e do tempo

as transformações de Galileu mas segundo as transformações de Lorentz. Em


outras palavras, segundo a Relatividade de Einstein, não temos mais que
u0 6= u − v.
Vamos então, para facilitar nossos cálculos, considerar o caso do desloca-
mento linear na direção x. Neste caso a equação acima se torna
 
M0 dv d  M0 
q = (u x − v) q (7.47)
1 − v dt dt
2 2
c2
1− v c2

Derivando agora o termo da direita desta equação temos


 
d  M0  1 dM0
q = q
dt 1− v
2
1 − v dt
2
c2 c2
M0 v dv
+ (7.48)
c2 (1 − v2 /c2 ) 32 dt

Substituimos agora esta expressão em (7.47) e rearranjando os termos chega-


mos, após um pouco de álgebra, à

M0  vu x  dv dM0
2 2
1− 2 = (u x − v) (7.49)
1 − v /c c dt dt
De novo, é mais conveniente expressarmos a equação acima em termos da
velocidade de ejeção u0x dos gases medido no referencial do foguete. Pela
transformação de Lorentz sabemos que
ux − v
u0x = . (7.50)
1 − u x v/c2
Quando substituimos este valor na expressão que acabamos de deduzir,
chegamos a uma expressão de forma mais simples:

v2 dM0
 
dv
M0 = 1− u0x (7.51)
dt c2 dt

De novo, notamos que a velocidade de ejeção dos gases deve ser direcionada
no sentido contrário à v para que o foguete seja acelerado, ou seja, u0x = −u0
onde u0 é a magnitude da velocidade de ejeção. De maneira análoga ao caso
anterior podemos reescrever esta equação como

dM0 1 dv
=− 0 (7.52)
M0 u 1 − v2 /c2

Suponhamos agora que a massa inicial do foguete é M00 e sua velocidade


inicial v0 . Integrando entre estes limites e notando que

1 1 1 1 1
2 2
= + (7.53)
1 − v /c 2 1 − v/c 2 1 + v/c
a integral é trivial e nos leva finalmente à

M0
 
c 1 + v/c 1 + v0 /c
ln 0 = − 0 ln − ln
M0 2u 1 − v/c 1 − v0 /c
(1 + v/c)(1 − v0 /c)
 
c
= − 0 ln (7.54)
2u (1 − v/c)(1 + v0 /c)

© s.r. dahmen 2022


a mecânica relativística ii: exemplos 131

Disto obtemos, finalmente


 c
M0 (1 − v/c)(1 + v0 /c) 2u0

= (7.55)
M00 (1 + v/c)(1 − v0 /c)

ou, no caso onde a velocidade inicial do foguete é nula, esta expressão se


torna
 c
1 − v/c 2u0

M0 = M00 (7.56)
1 + v/c
Não é difícil mostrar que recuperamos o caso clássico quando v  c e
u0  c se lembrarmos que

c+v v
≈ 1+2 (7.57)
c−v c

e também  n
1
lim 1+ =e (7.58)
n→∞ n
Consideremos um exemplo no qual queremos acelerar um foguete à velo-
cidade de c/2 usando combustível químico, como de praxe, de tal modo
que u0 = 4 km/s. Quanto da massa inicial deverá ser ejetada neste caso?
Segundo a expressão acima temos

 3×105
M00 M00

0 1/2 2×4
M = M00 ≈ ≈ (7.59)
3/2 3 3/8×105 1020000

Ou seja, precisaríamos de uma massa de combustível da ordem de 1020000 o


valor da massa final do foguete. Em outras palavras, é impossível pensar
num foguete usando combustíveis sólidos que possam chegar à velocidades
próximas a da luz. A solução neste caso seria conseguir velocidades de
ejeção u0 maiores pois os foguetes movidos a combustíveis convencionais
não ultrapassam uma velocidade de ejeção de 5 km/s. Uma opção seria um
motor atômico, onde os produtos da fissão nuclear são ejetados com uma
velocidade da ordem de u0 ' 104 km/s. Repetindo as contas para este caso,
chegamos à
M0
M0 ≈ 06 . (7.60)
10
Ou seja, num foguete atômico apenas 1 milionésimo de sua massa inicial
atingiria a velocidade c/2. Uma opção mais realista são os foguetes fotônicos.
Neste caso a expressão (7.56) se torna
1
1 − v/c

2
M0 = M00 (7.61)
1 + v/c

Se dispuséssemos de um foguete assim, conseguiríamos que M0 = M00 / 3 ≈
0.58 M00 chegasse à velocidade c/2, ou seja pouco mais da metade da massa
inicial do foguete. Porém, como ficou claro na nossa discussão da conversão
total de massa em energia, este processo ocorre na forma da aniquilação de
uma partícula com sua antipartícula. Sendo assim, para conseguirmos um
foguete assim deveriámos levar um carga de combustível composta de uma
duas massas iguais, mas uma formada de partículas e outra das respectivas
antipartículas.

© s.r. dahmen 2022


132 uma introdução à teoria do espaço e do tempo

Uma viagem espacial relativística aos confins do Universo.

Neste Gedankenexperiment vamos imaginar que disponhamos de uma


nave espacial com motor fotônico e que portanto tenhamos um suprimento
de energia grande o suficiente para atingir velocidades tão altas quanto
queiramos. Nosso objetivo neste problema é mostrar que numa nave assim
seria possível viajar toda a extensão do Universo, de diâmetro de 28.5 Giga-
parsecs (≈ 9.3 × 1010 anos-luz ou 8.8 · 1026 metros) em um tempo de alguns
anos contados no relógio dos tripulantes de nossa nave (tempo próprio 8 . 8
O Universo observável tem aproximada-
Mas seria mesmo possível? mente 13.8 bilhões de anos-luz de raio.
Considerando-se uma taxa de expansão
Se dispuséssemos de uma nave espacial que viajasse à velocidade próxima aproximadamente constante, a estimativa
da da luz, e considerado a duração típica da vida de um ser humano como é que o raio esteja hoje 46.6 bilhões de
sendo 70 anos, poderíamos num cálculo simples imaginar que uma tripula- anos-luz ou 14.3 bilhões de parsecs.
ção percorreria neste tempo uma distância de aproximadamente 70 anos-luz.
Porém, pela teoria da relatividade sabemos que os tripulantes espaciais
veriam o espaço que ainda falta ser percorrido a sua frente contraído, o que
significa que poderiam percorrer uma distância tão grande quanto queiram
desde que a velocidade seja próxima de c. Um observador parado na Terra
veria, devido a dilatação do tempo, que o relógio do viajantes espaciais
andariam mais lentamente e ao se aproximar da velocidade c teriam tempo
suficiente para chegarem aos confins do Universo.
O problema porém reside no fato que é necessário acelerar a nave espacial
a uma velocidade próxima de c, o que poderia levar muito tempo. Vamos
supor então que a aceleração da nave seja igual a g, pois não gostaríamos
de submeter os tripulantes a uma aceleração maior que aquela que estão
acostumados na Terra. Além do mais, esta aceleração, para naves espaciais,
é relativamente pequena pois num lançamento usual os tripulantes são
submetidos a acelerações de até 3 g durante curtos intervalos de tempo.

Questão 1.1. Utilizando a fórmula clássica v = v0 + gt, estime o tempo que uma
espaçonave, partindo de uma velocidade inicial v0 = 0, demoraria para atingir uma
velocidade final c (classicamente a velocidade c não é um limite físico para corpos
com massa).

Embora factível em termos de duração este resulado é, como bem o sabemos,


incorreto pois devemos levar em conta a teoria da relatividade e a variação
da massa do corpo à medida que sua velocidade aumenta.
Consideremos então que nosso foguete seja relativístico. Neste caso, resol-
vemos em sala de aula o problema de um corpo relativístico acelerado e
conhecemos as equações para sua velocidade v, medida da Terra, bem como
sua posição como função do tempo (tanto o tempo medido por observado-
res na Terra, como o tempo próprio dos tripulantes, que discutiremos em
breve). 9 9
É importante frisar que no cálculo de
empuxo por uma força reativa – perda de
massa por ejeção de gases – típica de um
Questão 1.2. Deduzimos nas notas de aula que a velocidade vrel de tal foguete foguete, não devemos nos esquecer que
medido por um observador na Terra é embora o foguete perca massa, todas as
massas inerciais aumentam devido à re-
acl t latividade. Porém, o foguete mais perde
vrel = r  2 . (7.62)
massa por ejeção de comburentes do que
1 + aclc t ganha pelo efeito relativístico. O cálculo
por nós feito leva tudo isso em conta.
© s.r. dahmen 2022
a mecânica relativística ii: exemplos 133

Com esta equação e uma aceleração de g, estime qual será a velocidade da espaçonave
passado 1 ano do início da viagem (visto por um observador na Terra) e qual a
velocidade passados 2 anos.

Nós achamos também que a posição da espaçonave segundo os cálculos da


relatividade é dada pela expressão
s 
c2  acl t 2
 
x (t) = 1+ − 1 . (7.63)
acl c

Esta equação nos permite estimar, passado um certo tempo, a distância que
a espaçonave terá percorrido.

Questão 1.3. Estime a distância que a nave estará de nosso planeta passados 1 e 2
anos, respectivamente.

A expressão que acabamos de usar para x (t) nos permite calcular o tempo,
do nosso ponto de vista na Terra, que a nave levaria para percorrer uma
distância igual a toda a extensão do universo.

Questão 1.4. Estime o tempo em anos que a nave levaria para percorrer uma
distância de 28.5 Gigaparsecs.

Este tempo é absurdamente grande. Porém, nas notas de aula mostramos


também que o tempo medido pela tripulação da nave (tempo próprio) segue
de
s v
Z ∞ Z ∞u acl t2
v2 u c2
τ = 1 − 2 dt = t1 − dt
0 c 0 a2 t2
1 + clc2
 
c acl t
= arcsinh
acl c
 s 
c a cl t a2cl t2
= ln  + 1+ 2  (7.64)
acl c c

Lembrando da definição
p
arcsinh x = ln( x + 1 + x2 ) (7.65)

podemos escrever a expressão acima também como


c a τ
t= sinh cl (7.66)
acl c

Esta equação permite, dado um t da Terra, calcular o valor do tempo τ que


marca um relógio na espaçonave. Se preferirmos, contando que os dois
relógios marcavam o mesmo τ0 = t0 = 0 no momento do lançamento, esta
equação relaciona o intervalo ∆τ de tempo de espaçonave ao intervalo ∆t
transcorrido na Terra. Mas vamos fazer um cálculo um pouco diferente.
Como não temos como nos comunicar com a nave para perguntar a eles
quanto tempo se passou em seus relógios, seria interessante podermos

© s.r. dahmen 2022


134 uma introdução à teoria do espaço e do tempo

calcular quanto tempo τ se passou na espaçonave dado que sabemos que


ela percorreu, do nosso ponto de vista, uma distância x. Assim saberíamos,
por exemplo, quanto tempo se passou para esta nave chegar (segundo seu
relógio) à Proxima Centauri (α–Centauri C) por exemplo. Em outras palavras,
buscamos achar uma fórmula do tipo x (τ ) ou, o que é equivalmente, τ ( x ).
Faremos isto a seguir.

Questão 1.5. Usando as equações acima para x (t) e a relação t(τ ), mostre que a
fórmula que expressa x como função de τ, isto é, x = x (τ ) é dada por

c2
 a τ 
x= cosh cl −1 (7.67)
acl c

Podemos agora estimar com esta equação quanto tempo os tripulantes, do


seu ponto de vista, levam para atravessar a extensão do Universo de 28.5
Gigaparsecs. Faremos isto agora.

Questão 1.6. Estime o intervalo de tempo próprio (em anos) que os tripulantes de
nossa nave precisaram para chegar aos confins de nosso Universo.

Moral da estória: trata-se de uma viagem sem volta para os tripulantes e


sem que nós, que aqui ficamos, saibamos se eles foram bem sucedidos ou
não. Para eles, tudo que deixaram para trás ficou num passado longínquo, e
tudo o que eles puderem nos reportar estará no nosso futuro distante e não
estaremos mais ali para ouví-los.

© s.r. dahmen 2022


8
Tensores II: propriedades

Sempre que estivermos lidando com vetores, covetores, etc. é conveniente


“otimizarmos” a notação evitando escrever um vetor como
n
A= ∑ Ai ei (8.1)
i =1

pois sempre teremos que lidar com muitas somatórias e podemos nos perder
nas contas. Por isso usaremos a partir de agora a notação de Einstein, ou
seja, sempre que dois índices aparecem repetidos numa expressão, significa
que sobre eles é feita uma soma, isto é

de f . n
A = Ai ei ≡ ∑ Ai ei (8.2)
i =1

Um vetor arbitrário A pode ser expandido, como vimos anteriormente,


numa base de vetores não colineares eµ :

A = Aµ eµ (8.3)

As grandezas Aµ são as componentes do vetor A projetadas paralelamente


aos eixos (componentes contravariantes). Se fizermos o produto escalar
usual entre os vetores A e eµ obtemos a projeção perpendicular ao eixo que,
por definição, é a componente covariante do vetor

Aµ = A · eµ (8.4)

Se definirmos agora o produto escalar dos vetores da base, sendo eles


unitários, obtemos:

eµ · eν = keµ kkeν k cos(\


eµ , eν ) = gµν (8.5)

onde cos(\ eµ , eν ) é o cosseno do ângulo formado entre os versores eµ e eν .


Uma das propriedades do chamado tensor métrico gµν é ele ser simétrico nos
índices, isto é gµν = gνµ e no caso de um sistema de coordenadas de eixos
ortogonais gµν = constante. Isto no leva a um resultado interessante pois
podemos através de gµν relacionar diretamente as coordenadas covariantes
e as coordenadas contravariantes de um vetor arbitrário A:

Aν = A · eν = Aµ eµ · eν = gµν Aµ (8.6)
| {z }
gµν
136 uma introdução à teoria do espaço e do tempo

Esta expressão nos mostra como passar de coordenadas contravariantes para


coordenadas covariantes.

Este resultado tem consequências na Relatividade Restrita pois no caso do


espaço-tempo sabemos que o intervalo

ds2 = c2 dt2 − dx2 − dy2 − dz2 = gµν dx µ dx ν (8.7)

é um invariante, onde
 
1 0 0 0
0 −1 0 0 
gµν = (8.8)
 
0 0 −1 0 

0 0 0 −1

A métrica acima define um espaço dito pseudo-euclideano. Podemos definir


neste espaço um vetor quadridimensional – um quadrivetor – da seguinte
forma:

A = ( A0 , A1 , A2 , A3 ) ou A = ( A0 , A1 , A2 , A3 ). (8.9)

Pela equação (8.6) sabemos, em função da métrica gµν , que a relação entre
as componentes covariantes e contravariantes vale:

A0 = A0 ; A1 = − A1 ; A2 = − A2 ; A3 = − A3 (8.10)

e portanto

A2 = ( A0 )2 − ( A1 )2 − ( A2 )2 − ( A3 )2 (8.11)
2
A 6= ( A0 )2 + ( A1 )2 + ( A2 )2 + ( A3 )2

Na TER a norma de um quadrivetor é dada pela primeira das equações


acima e nunca pela segunda! Discutiremos no próximo capítulo a aborda-
gem de quadrivetores na TER.

Para fazer a transição de coordenadas covariantes para contravariantes,


definamos primeiro as quantidades através da condição
(
ρν 1, if ν = µ ,
gµρ g = δµν , δµν = (8.12)
0, if ν 6= µ .

e façamos o produto

gνρ Aρ = gνρ gρσ Aσ = δσν Aσ = Aµ (8.13)

Com isto ficamos então com as expressões que relacionam uma representa-
ção do vetor à outra representação:

Aµ = gµν Aν , Aµ = Aν (8.14)

Estas equações gerais nos mostram que num sistema de coordenadas or-
tonormais, eµ eν = δµν , gµν = δµν e portanto Aµ = Aµ : simplesmente a
diferença entre coordenadas covariantes e contravariantes desaparece.

© s.r. dahmen 2022


tensores ii: propriedades 137

O produto escalar de dois vetores A e B é, por definição

A · B = ( Aµ eµ ) · ( Bν eν ) = Aµ Bν (eµ · eν ) = gµν Aµ Bν = Aν Bν (8.15)


| {z }
gµν

Disto segue também que o norma de um vetor é dada por

A2 = A · A = gµν Aµ Aν = Aν Aν (8.16)

Chamamos anteriormente a grandeza gµν de tensor métrico. Isto se deve ao


fato que o quadrado de um deslocamento que conecta dos pontos infini-
tamente próximos no espaço, deslocamento este representado por dr cujas
componentes são os dx ν , vale

dr2 = ds2 = gµν dx µ dx ν (8.17)

Esta equação é das mais fundamentais da relatividade geral e nos permite


calcular qualquer distância dado a curvatura do espaço subjacente (as Equa-
ções de Einstein nada mais são que equações para se determinar gµν dada
uma distribuição de massa e energia) 1 . 1
Uma questão de convenção acerca da
notação para a métrica: os livros voltados
É importante não confundirmos o tensor métrico gµν com a matriz de para a TGR costumam fazer nos primei-
ros capítulos uma revisão rápida da TER
transformação Λ entre vetores de diferentes sistemas de coordenadas. Os
antes de entrarem na teoria geral. Como
elementos da primeira são dados pelas projeções dos vetores de uma na TGR os espaços são curvos, alguns
mesma base entre si e são importantes, entre outras coisas, na definição autores preferem usar gµν para denotar a
da métrica do espaço. No segundo caso, a projeção se dá entre vetores de métrica destes espaços, reservando para
bases diferentes, mas que representam um mesmo espaço subjacente. o espaço pseudo-euclideano da TER a
notação ηµν .

Vamos discutir agora como transformações entre diferentes bases se refletem


nos resultados discutidos até aqui. A transformação dos vetores de base e
para os vetores e0 é dada, como vimos anteriormente, por

e0µ = Λνµ eν (8.18)

onde os elementos da matriz, como pudemos ver em alguns casos aqui


discutidos, dependem do tipo de transformação entre os eixos. Disto segue
também que a transformação inversa pode ser escrita como

eν = Λν e0λ
λ
(8.19)
λ
Qual a relação entre Λνµ da transformação direta e Λµ da transformação
inversa? Podemos achar isto combinando (8.18) e (8.19) para escrever:

e0µ Λνµ eν = Λνµ Λν e0λ


λ
=
Λν e0λ = Λν Λλ eµ
λ λ µ
eν = (8.20)

Esta igualdade só pode ser satisfeita se


λ
Λνµ Λν = δµλ
λ
Λν Λλ
µ µ
= δν , (8.21)

que é na verdade um resultado já esperado: uma matriz é o inverso da


outra.

© s.r. dahmen 2022


138 uma introdução à teoria do espaço e do tempo

Vamos agora entender como um vetor posição r muda por uma transforma-
ção arbitrária como a que discutimos acima. Vamos projetá-lo em termos de
variáveis contravariantes, o seja, paralelas aos eixos ordenados. Podemos
escrever este vetor de duas formas:

x ν eν = x 0µ e0µ , (8.22)

pois o vetor é o mesmo, o que muda são suas projeções nos diferentes eixos.
De novo, das equações (8.18) e (8.19) podemos escrever

x ν Λν e0µ x 0µ e0µ
µ
=
x ν eν = x 0µ Λνµ eν (8.23)

Disto vemos claramente que as coordenadas do vetor r se transformam de


maneira inversa que os versores da base eµ

x 0µ = Λν x ν ; x ν = Λνµ x 0µ
µ
(8.24)

Disto se origina o nome contravariante: as componentes de um vetor A são


chamadas de contravariantes quando elas mudam segundo as equações
acima, ou seja, de maneira inversa (contrária) àquela pela qual os versores
mudam. Colocando as equações lado-a-lado podemos ver isto claramente:

e0µ A0µ = Λν Aν
µ
= Λνµ eν

Λν e0µ Aν = Λνµ A0µ


µ
eν =
(8.25)

Já para as componentes covariantes temos:

e0µ = Λνµ eν
A0µ = Λνµ Aµ
Λν e0µ Aν = Λν A0µ
µ µ
eν =
(8.26)

Isto foi ilustrado com alguns exemplos simples acima. Lembremos que
quando estamos lidando com referenciais ortonormais, a diferença entre
tensores covariantes e contravariantes não existe.

© s.r. dahmen 2022


9
Quadrivetores

Por força de hábito costumamos lidar com as transformações de Lorentz


usuais diretamente a partir das equações que as definem
 v 
ct0 = γ ct − x
c
0
 v 
x = γ x − (ct)
c
y0 = y
z0 = z, (9.1)

ou, seguindo nossas definições em termos das quatro variáveis (x0 , x1 , x2 , x3 )

x0 0 = γ( x0 − β x1 )
x0 1 = γ( x1 − β x0 )
x0 2 = x2
x0 3 = x3 . (9.2)

Podemos escrever esta equação numa forma mais conveniente, isto é

x0 0
     
γ −γβ 0 0 x0
 x0 1  −γβ γ 0 0  x 1 
 
 0 2 = 
   
x   0 0 1 0  x 2 
  
x0 3 0 0 0 1 x3

x0 µ
µ
= Lν x ν (9.3)

Esta notação tem em si uma vantagem pois, como sabemos, ela também se
aplica aos deslocaments infinitesimais no espaço-tempo da TER

dx 0 µ = Lν dx ν
µ
(9.4)

Na base da TER está a invariância do intervalo

ds2 = dx µ dx ν = dxν dx ν (9.5)

que pode ser facilmente obtida através das transformações

dxµ0 = Lνµ dxν dxν = Lν dxµ0


µ
→ (covariante)

Lνµ dx 0 µ
µ
dx = Lν dx ν → dx =ν
(contravariante), (9.6)
140 uma introdução à teoria do espaço e do tempo

temos
ds2 = dxν dx ν
(Lν dxµ0 ) (Lνσ dx 0σ )
µ
=
(Lν Lνσ ) dxµ0 dx 0 σ
µ
=
δσ dxµ0 dx 0 σ
µ
=
= dxµ0 dx 0 µ (9.7)
µ µ
Convém lembrar que a inversa Lν (v) = Lν (−v), ou seja é dada simples-
µ
mente com a troca de v por −v. Com isto é fácil demonstrar que Lν Lνσ = 1.
Mas talvez o mais interessante é notarmos que há outras grandezas que se
transformam de uma maneira semelhante. Quanto estudamos as relações
entre energia e momentum para chegarmos à famosa equação E = m(γ)c2
mostramos que para estas grandezas obtivemos as equações

 
p0x = γ p x − vE/c2
p0y = py
p0z = pz
E0 = γ ( E − vp x ) (9.8)
Este resultado é bastante significativo pois se olharmos mais atentamente
veremos que as grandezas
E
, p x , py , pz . (9.9)
c
se transformam exatamente como as coordenadas (ct, x, y, z). Portanto, da
mesma maneira que o intervalo
c2 t2 − x 2 − y2 − z2 = c2 t 02 − x 02 − y 02 − z 02 (9.10)
é um invariante, a grandeza
E2 E 02
2
− p2 = 2 − p02 = m20 c2 (9.11)
c c
também é um invariante e tem o valor igual à m20 c2 ( para chegar à última
expressão usamos o fato que E2 = m2 c4 e p2 = γ2 m20 u2 ). Com isto chegamos
à famosa relação relativística entre energia e momentum
q
E2 = ( pc)2 + (m0 c2 )2 −→ E = p2 c2 + m20 c2 (9.12)
O que estes resultados ressaltam é o fato que, sendo o espaço-tempo qua-
dridimensional, podemos definir vetores que “vivem” neste espaço e que
se transformam exatamente da mesma maneira que os intervalos, ou seja,
µ
pela mesma matriz Lν . Definimos assim os quadrivetores como o 4-tuplo
de números A = ( A , A1 , A2 , A3 ) que se transformam segundo:
0

A0 0 = γ ( A0 − β A1 )
A0 1 = γ ( A1 − β A0 )
A0 2 = A2
03
A = A3
A0µ Lν A0ν
µ
= (9.13)

© s.r. dahmen 2022


quadrivetores 141

com
A2 = Aµ Aν = Aν Aν = A0ν A0ν
ou

( A0 )2 − ( A1 )2 − ( A2 )2 − ( A3 )2 = ( A00 )2 − ( A01 )2 − ( A02 )2 − ( A03 )2 (9.14)

A filosofia por trás dos quadrivetores é que eles são os entes matemáti-
cos “naturais” no espaço pseudo-euclideano da relatividade restrita, trans-
formando-se de um referencial para outro de maneira “trivial”. Vamos
então tentar achar quem são estes quadrivetores pois uma vez familiari-
zados com estas novas grandezas, muitos dos resultados da TER podem ser
estendidos de maneira simples para áreas correlatas, como por exemplo a
eletrodinâmica e a óptica. Comecemos então pela quadrivelocidade.

9.1 A quadrivelocidade
Partindo da definição do quadrivetor posição R = (ct, r) = (ct, x, y, z) =
( x0 , x1 , x2 , x3 ) parece natural definir a quadrivelocidade V como
dR
V= (9.15)
dt
O problema com esta definição é o fato que dt não é um escalar invariante
por transformações de Lorentz. O intervalo temporal invariante é o tempo
próprio, ou seja, o tempo medido por um relógio que se move junto à
partícula de velocidade u, isto é o tempo medido no referencial no qual a
partícula está parada. Recordando brevemente p o conceito, lembremos que
se uma partícula tem um deslocamento dl = dx2 + dy2 + dz2 segundo um
referencial inercial, no referencial da partícula dl 0 = 0. Porém, devido à
invariância do intervalo ds2 temos que

c2 dt2 − dx2 − dy2 − dz2 = c2 dt0 2 = ds2 , (9.16)

de onde segue que


s
0 de f . dx2 + dy2 + dz2
dt ≡ dτ = 1− dt
c2 dt2
s
1 dl 2
 
= 1− 2 dt
c dt
s
u2
= 1 − 2 dt
c
dt
= (9.17)
γ
  1
2 −2
onde lembramos que γ = 1 − uc2 se refere explicitamente ao fator de
Lorentz devido ao referencial que se move com a partícula (comoving frame.
Daqui pra frente reservaremos a notação Γ = γv para o fator de Lorentz
associado à mudanças entre referenciais inerciais que se movem entre si
com velocidade relativa v). Deste modo, no lugar de (9.15) definimos o vetor
quadrivelocidade como
de f . dR
U ≡ (9.18)

© s.r. dahmen 2022


142 uma introdução à teoria do espaço e do tempo

ou, explicitamente

dx α dx α
Uα = =γ = γ uα ,
dτ dt
dx0
U0 = γ = γc,
dt
ou
U = (γc, γu x , γuy , γuz ) (9.19)

Notamos que no limite não relativístico γ → 1 temos U = (c, u x , uy , uz ) =


(c, u), a componente espacial recai na velocidade clássica . Qual o significa
físico da componente temporal U 0 = c ? Basicamente podemos entendê-la
como o fato que o tempo flui e não pode ser parado. É simples também
mostrarmos que U 2 = c2 . Agora, um dos pontos da vantagem de se
definir quadrivetores, como frisamos acima, é o fato que eles são os vetores
µ
“naturais” do espaço-tempo e se transformam naturalmente segundo Lν , ou
seja
µ
L
U = (γc, γu) −→
ν
U 0 = (γ0 c, γ0 u0 ), (9.20)

e esta definição deve levar, inexoravelmente, às transformações de velocidade


por nós já obtidas por outros métodos. Notem porém que devemos ter o
cuidado, ao escrever as equações acima, de definir um novo γ0 pois o fator
γ é definido em termos da velocidade u da partícula em relação a um
referencial inercial I. Ao passarmos para um referencial I 0 , a velocidade da
partícula passa a ser u0 e um comoving frame em I 0 tem um outro fator de
Lorentz definido por
− 12
u0 2

γ0 = 1 − 2 . (9.21)
c
Vamos mostrar como as transformações entre velocidades saem natural-
mente da transformação da quadrivelocidade. Para evitar confusão, vamos
definir o fator de Lorentz e a razão entre a velocidade v dos referenciais e c
através de
− 21
v2

v
Γ = 1− 2 ; B= (9.22)
c c

para não confundirmos com γ e β. Temos assim, segundo a definição


da transformação de quadrivetores de referencial inercial para referencial
inercial, as equações

γ0 u0 x = Γ[γu x − B(γc)]
γ0 u0 y = γuy
0 0z
γu = γuz
γ0 c = Γ[γc − B(γu x )] (9.23)

Da última equação obtemos

γ 1
=  (9.24)
γ0

vu x
Γ 1− c2

© s.r. dahmen 2022


quadrivetores 143

Disto segue que

γ ux − v
u0 x = 0 Γ (u x − v) = x
γ 1 − vu
c2
γ y uy
u0 y = 0 u =  x

γ Γ 1 − vu
c2
γ z uz
u0 z = 0 u =  x

γ Γ 1 − vu
c2
(9.25)

Recuperamos assim as transformações para a velocidade que havíamos


obtido anteriormente diretamente das equações de Lorentz.

9.1.1 Outros quadrivetores da mecânica


Podemos agora de maneira direta obter os quadrivetores aceleração A,
momentum P , e força F simplesmente partindo das definições acima. A
quadriaceleração é definida via

dU
 
d d
A = = ( γ c ), (γ u)
dτ dτ dτ
 
d d
= γ ( γ c ), γ ( γ u ) (9.26)
dt dt

É comum encontrar na literatura da TER esta expressão escrita de outra


forma. Sendo
1 E
γc = m0 γ c2 · = , (9.27)
m0 c m0 c
podemos reescrever A como
 
γ dE d
A= , γ (γ u) (9.28)
m0 c dt dt

O momentum é trivial, obtido pela multiplicação direta da quadrivelocidade


U pela massa de repouso, um invariante relativístico:

P = m0 U = (m0 γ c, m0 γ u) (9.29)

Disto segue que a quadriforça vale

dP
 
d d
F= = γ ( m0 γ c ), γ ( m0 γ u ) (9.30)
dτ dt dt

Destas expressões, com o devido cuidado ao definirmos Γ e B, chegamos às


transformações de Lorentz para a aceleração, força e momentum tridimensi-
onais. As grandezas acima, pela definição de quadrivetores, se transformam
de maneira trivial.
ηαβ

© s.r. dahmen 2022


10
A eletrodinâmica e a relatividade

Em última instância devemos a teoria da relatividade especial a Maxwell.


Se ele não tivesse formulado suas equações não teria havia a necessidade
de uma teoria da relatividade. Até então a teoria eletromagnética era
formulada em termos de duas grandezas vetoriais independentes, cujas
propriedades haviam sido descobertas por seus antecessores, como Volta,
Coulomb, entre tantos outros. Foi com a Lei da Indução de Faraday que
uma conexão entre os campos foi descoberta. Maxwell, lidando com estas
descobertas, chegou às suas equações descobriu-se um “defeito” muito sério
nas mesmas: elas não eram invariantes por uma transformação de Galileu.
A física é governada por princípios universais: suas leis devem permanecer
válidas por transformações de simetria do espaço, afinal que sentido faz
definir relações funcionais entre grandezas que mudam quando mudamos
para a sala de laborotório ao lado ou quando conduzimos o experimento
não hoje mas daqui a algumas semanas? No caso da eletrodinâmica as
grandezas fundamentais da teoria - os campos elétrico e magnético - não
eram newtonianos, no sentido que as equações às quais estavam submetidos
dependiam do referencial inercial no qual eram formuladas. Esta questão
fica muito claro quando lemos o trabalho original de Einstein, que colocou
este ponto de maneira muito sucinta e precisa no primeiro parágrafo de
seu mais famoso trabalho, um ponto ao qual raramente dispensamos maior
atenção. Imagine uma situação em que um imã se aproxima com velocidade
constante de uma bobina parada. Pela Lei de Faraday, sabemos que surgirá
na bobina um campo elétrico induzido Eind que exercerá uma força sobre os
elétrons, gerando uma corrente. Olhemos agora a mesma situação física do
ponto de vista do imã, ou seja, do referencial no qual ele se encontra parado.
Neste referencial vemos os elétrons se movimentando com a velocidade v da
bobina e portanto sujeitos à ação de uma força q v × B. O mesmo efeito físico
– o surgimento de uma força e consequemente de uma corrente – é explicado
de maneira diferente nos dois referenciais inerciais: ora devido a uma força
de origem puramente elétrica, ora de origem puramente magnética. Porém,
um dos fundamentos basilares da Física é o fato que as leis não podem
depender do referencial e portanto não podemos ter duas físicas diferentes
para explicar o mesmo fenômeno físico. Não é sem razão que o artigo
de Einstein de 1905 não se chama “A Teoria da Relatividade” mas Sobre a
Eletrodinâmica dos Corpos em Movimento 1 . Esta dicotomia entre duas teorias 1
A. Einstein, Zur Eletrodynamik beweg-
tão fundamentais e de tanto sucesso não era algo que os físicos pudessem ter Körper, Annalen der Physik 17,
aceitar. 891(1905).
146 uma introdução à teoria do espaço e do tempo

Para que possamos ver a Eletrodinâmica como uma teoria intrinsicamente


relativística é necessário reescrevê-la de forma que isto fique evidente. Antes
porém de fazermos isto, discutiremos um fato experimental sem o qual
tudo ficaria mais complicado: a carga elétrica não muda com a velocidade.
Vamos também dar um exemplo de como o problema discutido por Einstein
no início de seu famoso paper encontra uma solução satisfatória quando
aplicamos a transformação de Lorentz às forças envolvidas num problema
análogo. Feito isto discutiremos a formulação relativística da Eletrodinâmica.

10.1 A invariância da carga elétrica

A primeira pergunta que devemos nos fazer é com relação à cargas elétricas
que, como sabemos, são as fontes dos campos elétrico e magnético. Da
mesma maneira que a massa desempenha um papel fundamental nas leis da
mecânica, a carga tem um papel semelhante no eletromagnetismo. Porém,
como já pudemos ver, a massa inercial não é um invariante relativístico e
muda com a velocidade. A carga, porém, é invariante. Trata-se de um fato
experimental, comprovado de diferentes formas.
Se considerarmos por exemplo o fato que a velocidade do elétron no estado
fundamental do Hidrogênio é da ordem de ∼ c/137 ∼ 0.0073c, ao passo
que o próton do núcleo é praticamente estacionário, se a carga do elétrono
dependesse de sua velocidade o átomo de Hidrogênio se nos mostraria
como tendo uma carga. Vários experimentos nesta direção foram feitos
a partir dos anos 60 por J.G. King no MIT e extendidos para átomos e
moléculas mais complexas 2 . A idéia básica é a de encerrar um gás em um 2
J. G. King, Phys. Rev. Letters 5, 562
container metálico inicialmente neutro – no trabalho original de King foram (1960); V.W. Hughes, L.J. Fraser, E.R. Carl-
usados 17 g de H2 (aproximadamente 5 × 1024 moléculas). Para evitar que son, Zeit. Physik D - Atom. Mol. Clusters
10, 145 (1988).
eventuais íons, elétrons livres e partículas de poeira carregadas escapassem
do câmara metálica, havia na saída do gás um deionizador (capacitor) que
permitia que apenas moléculas com uma carga elétrica hipotética de 10−18 C
pudessem escapar. Como o conjunto container + gás eram inicialmente
neutros, se as moléculas que escapassem possuíssem uma carga diferente
de zero, surgiria no container metálico uma carga de valor absoluto igual à
carga que escapara. Na hipótese de uma diferença entre a carga do elétron e
do próton de 1 parte em 102 0, o container adquiriria uma carga de

Q = 2 × (5 × 1025 ) × 10−20 |e| = 105 |e| (10.1)

onde |e| é o valor absoluto da carga elementar do elétron. Nenhuma carga foi
observada no container. Outros experimentos importantes que comprovam
a invariância da carga com a velocidade são aqueles que estudam a ação de
forças sobre cargas em movimento que, segundo a TER obedecem à equação

 
d m0 u
√ = qE+qu×B (10.2)
dt 1 − u2 /c2
Experimentos com elétrons com energias cinéticas de 25 GeV (u = 0 999 999 999 8 c)
e prótons com 7 TeV (u = 0 999 999 991 3 c) comprovaram que esta equação
se aplica a estas altíssimas velocidades com os valores conhecidos para a
carga destas partículas elementares.

© s.r. dahmen 2022


a eletrodinâmica e a relatividade 147

10.2 O campo magnético enquanto efeito relativístico do campo


elétrico e vice-versa

Antes de olharmos para a formulação relativística da eletrodinâmica, é


possível já adquirir uma idéia do quão intimamente relacionadas estão as
duas teorias: usando apenas os resultados por nós já conhecidos da TER,
mostraremos a seguir como o campo magnético surge a partir do campo
elétrico quando fazemos uma mudança entre referenciais inerciais usando
as transformações de Lorentz.
Quando olhamos para a força que atua sobre uma carga q devido à presença
de um campo magnético B q, sabemos ser ela proporcional à velocidade v
da carga:
F = qv×B
Isto no entanto significa que se estivermos num referencial que se move
com uma velocidade v no mesmo sentido que a carga, esta contribuição
desapareceria. Como a física em diferentes referenciais inerciais deve ser a
mesma, isto é, os efeitos de uma força atuando sobre q deve ser observado
nos dois referenciais, surge a pergunta: qual força atua no referencial em
que v = 0 e qual sua origem? Como verificaremos a seguir, sendo a carga
um invariante relativístico, a única força que pode atuar na partícula é um
campo elétrico
F0 = qE0 , (10.3)
o que nos leva à conclusão inevitável de que a Lei de Coulomb associada
à Teoria da Relatividade deve ser capaz de responder pelos fenômenos
observados 3 . 3
E.M. Purcell, Electricity and Magnetism,
Berkeley Physics Course vol. 2, McGraw
Vamos considerar a seguinte situação física, visto do referencial do labora-
Hill, Boston, 1985.
tório: uma carga-teste q se desloca com velocidade v paralela a um fio que
transporta uma corrente I. No referencial do laboratório, os elétrons do fio
tem uma velocidade de deriva (drift velocity) dada por v0 e densidade linear
de carga −λ0 de mesmo módulo que a densidade densidadde λ0 de íons
positivos (átomos de Cobre, por exemplo). A figura abaixo ilustra a situação.

Figura 10.1: Uma carga-teste que se des-


y
cargas positivas loca com velocidade v paralela a um
cargas negativas
fio pelo qual passa uma corrente I0 =
−λ0 v0 . Baseado em Purcell, op. cit..
ions parados
densidade de carga λ 0
Neste referencial a carga-teste vê apenas
um campo magnético gerado pela cor-
rente I do fio.

densidade de carga − λ0
eletrons em movimento
v0
REFERENCIAL

LABORATORIO

E=0

q x
v
carga−teste em movimento

© s.r. dahmen 2022


148 uma introdução à teoria do espaço e do tempo

No referencial do laboratório, com coordenadas x, y, z há uma linha de


cargas positivas paradas e uma linha de cargas negativas (elétrons) que se
movem para a direita com velocidade v0 . Estamos considerando o caso
unidimensional por simplicidade. Como ambas as densidades lineares de
carga são iguais, qualquer volume do fio contém uma carga nula e portanto,
pela Lei de Gauss, não pode haver campos elétricos fora do fio. Deste modo,
a carga-teste q não sente a ação de nenhuma força Coulombiana.

Figura 10.2: A mesma situação física da


y figura acima quando vista do referencial
que se move com a carga-teste. Uma vez
que neste referencial sua velocidade é
v
ions em movimento nula, ela não pode sentir a atuação de
qualquer campo mangnético. Baseado
em Purcell, op. cit..

eletrons
em movimento
v’0
REFERENCIAL r
CARGA TESTE

q x

F’ = q E’

Olhemos agora de um referencial que se move com a carga, isto é, com a


velocidade v (fig. 10.2). Neste referencial a carga se encontra em repouso.
Surge porém no fio uma carga líquida diferente de zero, ou seja, é como se
o fio estivesse carregado. Como podemos ver na figura, as cargas positivas
parecerão estar mais próximas umas das outras e as cargas negativas mais
afastadas, quando comparadas à figura anterior. Isto se deve à contração
de Lorentz. Neste referencial, os íons se movem para a esquerda com
velocidade −v e portanto a distância entre √ os íons positivos sofre uma
contração de Lorentz por um fator γ = 1/ 1 − v2 /c2 . Consequentemente,
a densidade linear de cargas positivas passa a ser maior, e assume o valor
γλ0 . Mas o que ocorre com a densidade linear de elétrons no referencial
da carga-teste? Os elétrons sofrem também uma contração de Lorentz e
apresentam uma densidade maior que em relação a que tinham no fio
parado, da forma λ00 = γ00 λ0 onde γ00 é o fator de Lorentz de velocidade
v00 , ou seja, a velocidade de deriva dos elétrons visto do referencial da
carga-teste em repouso.
Aqui devemos ter um pouco de cuidado pois estamos lidando na verdade
com 3 diferentes refenciais inerciais: o referencial do laboratório (figura
10.1), o referencial da carga-teste (figura 10.2) e o referencial no qual os
elétrons estão parados. Assim, a densidade −λ0 dos elétrons observada no
laboratório é baseada numa distância maior dos elétrons quando comparada
à distância que estes elétrons tem em seu referencial, uma vez que para
o laboratóro há uma contração de Lorentz com fator γ0 (velocidade v0 )
dos elétrons de condução. Isto significa que no referencial dos elétrons, a

© s.r. dahmen 2022


a eletrodinâmica e a relatividade 149

densidade eletrônica λe é menor que λ0 e vale


s
λ v20
λ e = − 0 = − λ0 1− . (10.4)
γ0 c2

Para calcular assim a a densidade dos elétrons no referencial da carga-teste,


devemos adicionar relativisticamente as velocidades v0 e −v. Usando as
definições
v0 v v
β00 = 0 ; β0 = 0 β= (10.5)
c c c
a relação entre as velocidades v00 dos elétrons no referencial da carga-teste
com as velocidades v0 que eles tem no referencial do laboratório pode ser
escrita na forma
v0 − v β0 − β
v00 = =⇒ β00 = (10.6)
1 − v v0 /c2 1 − ββ 0

Assim, o fator de Lorentz γ00 que devemos usar para calcular como a den-
sidade linear de elétrons em seu referencial próprio (λe ) muda quando
passamos para o referencial da partícula teste é

2 1
γ00 = (1 − β00 )− 2 . (10.7)

Questão 2.1. Mostre, usando um pouco de álgebra, que a expressão acima pode ser
reescrita como:
γ00 = γγ0 (1 − ββ 0 ) (10.8)

O motivo destas transformações é que, experimentalmente, conhecemos as


densidades e velocidades medidas no laboratório e portanto é necessário
expressar nossas equações em função das grandezas ali medidas.
Sendo que as duas densidades (positiva e negativa) são alteradas por di-
ferentes fatores de Lorentz, surge no referencial da carga-teste surge uma
densidade de cargas diferente de zero que é dada pela diferença entre a
γ00
densidade de cargas positivas γλ0 e das cargas negativas γ0 λ0 :

γ00
λ0 = γλ0 − λ
γ0 0
λ
= γλ0 − 0 γγ0 (1 − ββ 0 )
γ0
= γββ 0 λ0 . (10.9)

Deste modo, cada pedaço do fio tem uma densidade líquida λ0 positiva e
que gera, a uma distância r do fio, um campo elétrico de magnitude

λ0
E0 = r̂ (10.10)
2πe0 r

Portanto a carga teste sente uma força na direção do eixo y negativo de


intensidade
qλ0
Fy0 = −qEy0 = − (10.11)
2πe0 r

© s.r. dahmen 2022


150 uma introdução à teoria do espaço e do tempo

Precisamos agora achar como a força se transforma de um referencial para


outro. Considere as definições

dpy dp0y
Fy = , Fy0 = = (10.12)
dt dt0
Porém, como mostramos em uma de nossas aulas, as componentes do
momentum se transformam exatamente da mesma maneira que as coor-
denadas x, y, z se transformam quando passamos de um referencial para
outro (equações 6.59 e 6.60 das notas de aula):

βγ E
p0x = γp x − ; p0y = py ; p0y = py . (10.13)
c

Questão 2.2. Usando o fato que ∆p0y = ∆py , segundo o resultado acima, e que
∆t0 = γ∆t, mostre que
Fy
Fy0 = (10.14)
γ

Se aplicarmos agora o resultado acima à expressão que obtivemos para Fy0


(eq. 10.11) chegamos à
Fy0
Fy = (10.15)
γ
(Note que a expressão ( 10.14) expressa a força no referencial que se “move”,
dada que sabemos a força no referencial “parado”. No caso acima temos
o inverso: conhecemos a força no referencial que se move e queremos
chegar na expressão para o referencial parado. Como todos os referenciais
inerciais são exatamente equivalentes, as regras de transformação devem ser
exatamente as mesmas). Obtemos então

1 qλ0
Fy = −
γ 2πe0 r
1 q (γββ 0 λ0 )
= −
γ 2πe0 r
qββ 0 λ0
= − . (10.16)
2πe0 r
Olhando para esta expressão e reconhecendo que −λ0 v0 é a corrente I que
passa pelo fio e β = v/c onde v é a velocidade da carga teste na direção do
eixo x positivo, a expressão acima se reduz à
− I/c
q z }| {
Fy = − β β 0 λ0 . (10.17)
2πe0 r |{z}
v/c

Chegamos assim à uma força de intensidade

q vI
Fy = . (10.18)
2πe0 r c2

Como c−2 = e0 µ0 ficamos finalmente com


 
µ0 I
Fy = q v = qvB (10.19)
2π r

© s.r. dahmen 2022


a eletrodinâmica e a relatividade 151

µ I
onde identificamos o termo 2π0 r como o campo magnético B gerado a uma
distância r de um fio pelo qual passa uma corrente I.
Este resultado mostra que dependendo do referencial inercial em que nos
encontramos, a força pode ser vista como resultado da atuação de um campo
elétrico ou de um campo magnético. Isto tem consequências bastante profun-
das na nossa discussão subsequente pois implica que não é possível achar
um quadrivetor que corresponda à E ou B separamente, uma vez que por
uma mudança de referencial estes vetores se misturam. Quadrivetores não
podem mudar sua natureza por mudanças de referencial. Precisamos assim
de um objeto mais geral, que contenha em si as componentes dos campos
E e B de tal modo que por transformações de Lorentz estas componentes
sejam transformadas umas nas outras. Este objeto é o tensor de campo
eletromagnético, um quadritensor.

10.3 As equações de Maxwell, o quadripotencial e a quadri-


corrente
As equações de Maxwell representam um sistema de equações para uma te-
oria macroscópica do campo eletromagnético. Segundo esta teoria, o campo
eletromagnético num meio arbitrário é descrito por quatro vetores: o campo
elétrico E, o campo magnético H, o campo indução elétrica (deslocamento)
D e o campo indução magnética B.
No caso de meios isotrópicos este número se reduz a dois campos pois os
vetores são proporcionais entre si:

D = eE, B = µH (10.20)

As constantes e, µ são a constante dielétrica e permeabilidade magnética


do meio 4 e estão relacionadas com a velocidade de propagação das ondas 4
Para meios anisotrópicos, os escalares e
eletromagnéticas via e µ são substituidos por tensores de 2a.
  ordem.
1 1
v2 = c2 = no vácuo (10.21)
eµ e0 µ 0
As equações de Maxwell são um conjunto de equações que relacionam estas
variáveis entre si:
∂D ∂E
∇×H = j+ ∇×H = j+e
∂t ∂t
∂B ∂H
∇×E = − ∇ × E = −µ (10.22)
∂t ∂t
onde, no caso de meios isotrópicos, aplicamos as equações do lado direito.
Estas equações são conhecidas do curso básico de Eletromagnetismo: a
primeira delas, no caso estático, é a Lei de Ampère ao passo que a segunda
é a conhecida Lei da Indução de Faraday. A estas equações acrescentamos a
chamada equação da continuidade, que representa a conservação de carga
∂ρ
+∇·j = 0 (10.23)
∂t
onde ρ é a densidade de carga e j = ρv é a densidade de corrente. Da
segunda equação em (10.22) segue também que

∇·B = 0 ∇ · H = 0, (10.24)

© s.r. dahmen 2022


152 uma introdução à teoria do espaço e do tempo

que interpretamos fisicamente como a inexistência de monopólos magnéticos.


Para sermos mais precisos, de (10.22) temos que ∇ · B = constante. A
inexistência de monopólos magnéticos é um fato experimental e por isso
esta equação é vista não como consequência da aplicação do operador ∇
à lei de Faraday na forma diferencial mas como uma lei independente. A
estas três equações de Maxwell adicionamos a quarta, a Lei de Gauss para o
campo E (D):
ρ
∇·D = ρ ∇·E = (10.25)
e
Para o caso de um sistema homogêneo mas não isotrópico temos uma
polarização e uma magnetização, de forma que

D = e0 E + P B = µ0 ( H + M ). (10.26)

No vácuo obviamente P = 0 e M = 0. Às equações de Maxwell, que


estabelecem as relações entre os campos e a equação da continuidade, que
representa a conservação de carga, resta acrescentarmos a lei que rege a
interação destes campos com densidades de cargas e ou correntes, a Lei de
Lorentz:

f = ρ (E + v × B) (10.27)
ou f é a densidade de força.
Visando facilitar a discussão, vamos aqui nos concentrar nas equações de
Maxwell no vácuo e na ausência de cargas e correntes. Temos neste caso:

∂E
∇×B = e0 µ 0 ∇·B = 0
∂t
∂B
∇×E = − ∇·E = 0 (10.28)
∂t
Queremos ressaltar neste capítulo, como já enfatizado anteriormente, que as
equações de Maxwell já vem relativisticamente “prontas”. Para mostrar va-
mos relembrar alguns fatos importantes do curso de teoria eletromagnética:
em se tratando de equações de Maxwell, é conveniente expressar muitas
vezes os campos E e B em termos do potencial escalar φ e do potencial vetor
A. Sendo ∇ · B = 0 é possível definir B em termos de um potencial vetor A
via
B = ∇ × A. (10.29)
A priori a introdução desta grandeza representa apenas uma transformação
matemática pois o divergente do rotacional de um vetor a qualquer é sempre
igual a zero: ∇ × (∇ · a) = 0. Se um campo vetorial tem circulação, ele não
pode ter fluxo. Se substituírmos esta expressão na equação acima para o
rotacional de E obtemos
 
∂ ∂A
∇×E = − ∇×A −→ ∇× E+ =0 (10.30)
∂t ∂t

Porém, a quantidade entre parênteses cujo rotacional é igual a zero pode


obviamente ser escrita como o gradiente de uma função escalar por um
motivo matematicamente análogo, ou seja, o rotacional do gradiente de uma
função f é sempre zero: ∇ × (∇ f ) = 0. Portanto podemos escrever

∂A ∂A
E+ = −∇φ −→ E = −∇φ − (10.31)
∂t ∂t

© s.r. dahmen 2022


a eletrodinâmica e a relatividade 153

Usamos nesta expressão o fato que os operadores ∇ e ∂/∂t comutam


∂ ∂
∇ = ∇ (10.32)
∂t ∂t
(isto vale apenas para ∂/∂t mas não para d/dt!). Substituindo estas novas
expressões para E e B nas equações ∇ · E = 0 e ∇ × B = e0 µ0 ∂E
∂t obtemos


∇2 φ + (∇ · A) = 0
∂t
1 ∂2 A
 
2 1 ∂φ
∇ A− 2 2 −∇ ∇·A+ 2 = 0 (10.33)
c ∂t c ∂t
Com isto conseguimos reduzir um conjunto de quatro equações para apenas
duas, mas ainda acopladas. É possível desacoplar estas equações usando
a arbitrariedade na definição de B em termos de A. O potencial vetor é
arbitrário pois sempre podemos adicionar a ele o gradiente de uma função
escalar Λ arbitrária, pois pela transformação

A → A0 = A + ∇ Λ (10.34)

B permanece inalterado. Para que isto porém não afete o campo elétrico,
somos obrigados a redefinir o potencial escalar segundo
∂Λ
φ → φ0 = φ − (10.35)
∂t
Esta liberdade nos permite escolher um conjunto de potenciais (A, φ) de
tal modo a tornar o termo entre parênteses na segunda equação em (10.33)
nulo:
1 ∂φ
∇·A+ 2 = 0. (10.36)
c ∂t
Esta escolha nos permite desacoplar as duas equações para Φ e A e escrever

1 ∂2 φ
∇2 φ − = 0 → 2φ = 0
c2 ∂t2
1 ∂2 A
∇2 A − 2 2 = 0 → 2A = 0 (10.37)
c ∂t
onde usamos o operador quabla por nós já encontrado anteriormente

1 ∂2
2 = ∇2 − = ∂µ ∂µ = gµν ∂µ ∂ν (10.38)
c2 ∂t2
Junto com (10.36) estas equações são completamente equivalentes às equa-
ções de Maxwell para E e B na ausência de cargas e correntes, as chamadas
equações de Maxwell homogêneas. No caso das presença de ρ e j, este
resultado pode ser facilmente generalizado. A condição representada pela
equação (10.36) é chamada de condição de Lorenz 5 . 5
Ludvig Valentin Lorenz (1829–1891), fí-
As transformações (10.34) e (10.35) são aquilo que chamamos de transforma- sico e matemático dinamarquês.
ções de calibre (gauge transformations). Uma outra transformação de calibre
muito usada é o chamado calibre de Coulomb (ou de radiação ou transversal).
Este é o calibre onde tomamos

∇ · A = 0, (10.39)

que leva em (10.33) à equação

∇2 φ = 0. (10.40)

© s.r. dahmen 2022


154 uma introdução à teoria do espaço e do tempo

No caso da presença de cargas ρ ficamos com a equação de Poisson


ρ
∇2 φ = − (10.41)
e0
cuja solução é
1 ρ(x0 , t) 0
Z
φ(x, t) = dx (10.42)
4πe0 |x − x0 |
que nada mais é que o potencial de Coulomb para um dado tempo t e uma
distribuição de carga ρ(x, t). Daí vem o nome do calibre.
Caso estejamos trabalhando num meio isotrópico de permissividade e e
permeabilidade µ, as equações para os potenciais se tornam

1 ∂2 φ ρ
∇2 φ − = −
v2 ∂t2 e
1 ∂2 A
∇2 A − 2 2 = −µj (10.43)
v ∂t

10.3.1 O quadripotencial e a quadricorrente


Seguindo nossa idéia de trabalhar com quadrivetores pois eles são os vetores
“naturais” do espaço-tempo da TER e portanto se transformam de maneira
“trivial”, vamos introduzir o quadripotencial e a quadricorrente. Temos:

Φk = (Φ0 , Φ1 , Φ2 , Φ3 ) = (φ/c, A)
Jk = (J 0 , J 1 , J 1 , J 3 ) = (cρ, j) (10.44)

Com esta notação as equações (10.37) podem ser unificadas em uma só


equação:
2 Φ k = − µ0 J k . (10.45)
Com estas definições é um simples exercício matemático mostrar que a
equação de continuidade (conservação de carga) e o calibre de Lorentz
podem ser escritos na forma

div J = 0; div Φ = 0 (10.46)

Por definição, a relação entre estas grandezas em diferentes referenciais


inerciais é dada

J 0 0 = γ(J 0 − βJ 1 ) Φ0 0 = γ(Φ0 − βΦ1 )


J 0 1 = γ(J 1 − βJ 0 ) Φ0 1 = γ(Φ1 − βΦ0 )
J 02 = J 2
Φ0 2 = Φ 2
J 03 = J 3
Φ0 3 = Φ 3
ou seja

Φ0 = Lν Φν
µ ν µ µ
J = Lν J (10.47)

Vamos agora olhar um pouco mais detalhadamente a transformação da


densidade de corrente, pois na parte inicial deste capítulo mostramos que
um fio neutro em um referencial inercial (ρ+ + ρ− = 0) tem uma densidade
de carga diferente de zero em outro (ρ0+ + ρ0− 6= 0) e isto leva ao surgimento
de interações magnéticas ou elétricas em função do referencial escolhido.
De certo modo é natural considerarmos a quadrivelocidade como sendo
uma combinação de um densidade de corrente e uma densidade de carga:

© s.r. dahmen 2022


a eletrodinâmica e a relatividade 155

quando lidamos com referenciais que se movem um em relação ao outro,


não podemos nos esquecer que uma carga pode parecer parada apenas em
seu relação a seu referencial próprio e que, em outro referencial, não apenas
uma carga mas também uma corrente são observadas. A transição de uma
carga para uma corrente nada mais é o efeito da mudança entre referenciais
inerciais. É interessante notarmos que quando nos deparamos pela primeira
vez com este fato na eletrodinâmica clássica e estudamos a força de Lorentz,
dificilmente paramos para pensar que temos uma força dependente da
velocidade relativa entre a carga teste e a fonte de B e portanto a física
pareceria “diferente” em outro referencial. É justamente para este fato que
Einstein chama nossa atenção no primeiro parágrafo do seu célebre artigo
de 1905 e a aparente assimetria entre as duas situações - não é por menos
que seu artigo é intitulado Sobre a Eletrodinâmica de Corpos em Movimento e
não algo tipo A Teoria da Relatividade.
Quando escrevemos a fórmula j = ρ u devemos ter claro que ela se aplica à
densidade de cargas que se movem à uma velocidade u. Estas cargas móveis
não são as únicas cargas no problema: os íons da rede cristalina também tem
carga. Porém os íons estão, para todos os efeitos, praticamente parados. Isto
significa que a expressão correta para j é j = ρ+ u+ + ρ− u− = ρ− u− . Porém,
a fim de evitar uma notação muito carregada, manteremos a expressão ρ u
lembrando porém que ela se refere sempre aos portadores móveis.
Das equações de transformação acima podemos obter imediatamente uma
corrente de convecção que surge da transformação do referencial próprio 6 . 6
Uma corrente é chamada de corrente de
convecção quando ela surge devido ao des-
I0
Consideremos o referencial no qual temos uma densidade de carga ρ0 e
locamento das cargas provocadas pelo
uma corrente nula j0 = 0, ou seja I 0 é o referencial próprio da carga. Neste deslocamento do meio onde elas se en-
referencial a quadricorrente vale: contram.

J 0 = (cρ0 , 0, 0, 0). (10.48)

Segundo as regras de transformação para quadrivetores, no referencial I do


laboratório temos

J0 = γ c ρ0
1
J = γ( β cρ0 ). (10.49)

[Lembramos que as grandezas γ e β são funções da velocidade relativa v


entre os referenciais.] Escrevendo a primeira expressão de forma explícita
temos:

J 0 = cρ = q 0 → ρ = γρ0 . (10.50)
2
1 − vc2
Esta é a expressão que relaciona a densidade de carga no referencial próprio
com a mesma densidade vista num referencial que se move com velocidade
v em relação a ela. Para a corrente obtemos
ρ0 v
Jx = q = ρv (10.51)
v2
1− c2

Esta expressão tem uma interpretação bastante simples: a velocidade de


uma carga em repouso no referencial I 0 é igual à v, a velocidade do meio
pelo qual é “arrastada”, quando vista de um referencial inercial que se move
em relação à I 0 . O motivo pelo qual a densidade de carga muda é devido à

© s.r. dahmen 2022


156 uma introdução à teoria do espaço e do tempo

mudança do volume devido à contração de Lorentz


s
v2
dV = 1 − 2 dV0 (10.52)
c

pois como a carga é conservada e é um invariante relativístico, ambos os vo-


lumes contém o mesmo número de portadores independente do referencial
escolhido. Não é muito difícil mostrar que

ρ20
J 2 = J 02 = − (10.53)
c2
pois J é um quadrivetor e portanto seu módulo é um invariante. O fato de
J 2 < 0 significa que ele é um vetor tipo-tempo pois os portadores nunca
podem ter uma velocidade maior que a da luz.
Vamos supor agora que no referencial I 0 há um condutor neutro (ρ0 = 0)
pelo qual flui uma corrente (j00 6= 0), ou seja

J 0 = (cρ0 = 0, J01 , J02 , J03 ). (10.54)

No referencial I, segundo as transformações de Lorentz, temos

J 0 = cρ = γβJ01 , J 1 = γJ01 , J 2 = γJ02 , J 3 = γJ03 ,


(10.55)
As 3 últimas fórmulas definem a magnitude da corrente no referencial I do
laboratório. A primeira expressão mostra (como já pudemos ver no início
deste capítulo) que neste referencial surge uma densidade de carga ρ não
nula
β
ρ = γ J01 (10.56)
c
um resultado que sai naturalmente das transformações de Lorentz quando
aplicadas a um quadrivetor. Este resultado pode ser interpretado geometri-
camente em um diagrama de Minkowski.
Imaginemos um referencial I onde temos um condutor parado e pelo qual
fluem elétrons com um velocidade v. No referencial I as linhas-de-mundo
dos íons positivos da rede (digamos átomos de Cu+ ) são linhas retas parale-
las ao eixo ct, ao passo que os elétrons têm linhas de mundo também retas
mas que fazem um ângulo θ = arctan(v/c) com o eixo ct. A figura abaixo
mostra como as linhas de mundo dos íons positivos (linhas pontilhadas) e
elétrons (linhas contínuas). Sendo o material neutro, cada segmento dos
eixos (ct, x ) devem dar origem a um mesmo número de linhas de mundo
de cargas positivas e negativas. A densidade de carga deve ser medida
simultaneamente em cada um dos referenciais I e I 0 . No primeiro, a den-
sidade de carga é determinada pelo número de linha-de-mundo de íons e
elétrons que cruzam uma unidade de comprimento neste referencial: por
exemplo, a densidade de carga é dada pelo número linhas-de-mundo de
íons (+) e elétrons (−) perpassando o segmento OA. Uma hipérbole de
escala corta os eixos x e x 0 , respectivamente, como podemos ver na figura.
A linha de simultaneidade no eixo x 0 são o próprio eixo e linhas paralelas
a ele. Mas como podemos ver, neste referencial, há mais linhas positivas
que negativas, portanto uma densidade maior de carga positiva quando
comparada à carga negativa. Para um observador em I 0 , o condutor parecerá
estar positivamente carregado.

© s.r. dahmen 2022


a eletrodinâmica e a relatividade 157

Figura 10.3: O diagrama de Minkowski


que mostra o surgimento de uma densi-
dade de carga diferente de zero no refe-
rencial I 0 a partir de uma densidade total
t t’ de carga nula e uma corrente diferente
de zero no referencial I como efeito das
+ + + + + +
+ − − − − − − transformações de Lorentz. A corrente no
referencial I é devido ao movimento de
arrasto dos elétrons, sendo que os íons es-
E2’
tão parados (um exemplo seria um átomo
de CU + que tem um elétron na banda de
condução). A linha-de-mundo dos íons
x’ são representadas por linhas pontilhadas,
a dos elétrons por linhas cheias. No refe-
A’ rencial I 0 surge uma densidade de carga
positiva pois, por no segmento represen-
tado por OA0 há mais íons que elétrons.
O mesmo segmento OA no referencial I
x tem um número igual de íons e elétrons.
O A

10.4 O tensor de campo eletromagnético

A partir das definições de quadricorrente e quadripotencial, vimos como


as transformações de Lorentz mostram o surgimento de uma densidade de
carga diferente de zero num dado referencial quando, em outro referencial,
o mesmo portador tem carga total neutra. Isso nos permite mostrar a
relação íntima entre fenômenos magnéticos e fenômenos elétricos como
consequência direta da relatividade restrita.
Nesta seção vamos um pouco mais além, mostrando como é possível, através
da definição do potencial escalar Φ e do potencial vetor A, reescrever as
equações de Maxwell de forma sucinta e introduzir um novo conceito – o
de tensor de campo – que depois desempenhará um papel importante na
relatividade geral. Vamos partir assim das definições dos campos a partir
dos potenciais

∂A
B = ∇ × A; E = −∇ φ − (10.57)
∂t

Vamos escrever as componentes destes vetores em termos das componentes


do quadripotencial Φ.

∂Az ∂Ay ∂Φ3 ∂Φ2


Bx = − = −
∂y ∂z ∂x2 ∂x3
 
∂φ ∂A x ∂Φ0 ∂Φ1
Ex = − − =c − (10.58)
∂x ∂t ∂x1 ∂x0

Com relação à aparente “troca de sinal” na última das equações acima, não
devemos nos esquecer que a métrica do espaço de Minkowski tem assinatura

(+, −, −, −) (10.59)

© s.r. dahmen 2022


158 uma introdução à teoria do espaço e do tempo

e portanto o operador diferencial ∂µ vale


 
∂ ∂
∂µ ≡ = ( ∂ x0 , ∂ x1 , ∂ x2 , ∂ x3 ) = ,∇ (10.60)
∂x µ ∂x0

Lembrando da relação ∂µ = gµν ∂ν podemos também escrever


 
∂ ∂
∂µ ≡ = , −∇ (10.61)
∂xµ ∂x0

de onde segue facilmente que o operador D’Alembertiano pode ser escrito


como
∂2
∂µ ∂µ = − ∇2 = 2 (10.62)
∂x0 2
A assinatura da métrica é o número de valores positivos e negativos da
métrica. Geralmente ela é representada pelo símbolo ( p, q) onde no nosso
caso temos (1, 3) mas é mais comum encontrarmos simplesmente a notação
(+, −, −, −).
As expressões para as outras componentes de E e B são análogas. Isso nos
leva a imaginar estas combinações como os elementos de um tensor de rank
2 antissimétrico:
!
ik ∂Φk ∂Φi
F ≡ − = ∂i Φ k − ∂ k Φi (10.63)
∂xi ∂xk
Vamos aqui introduzir uma outra notação muito usada na teoria da relativi-
dade:
∂f
≡ f,i (10.64)
∂xi
Esta notação foi criada em Teoria da Relatividade com o único objetivo de
tornar as equações mais sucintas: sempre que aparecer uma combinação de
uma vírgula seguida por um índice i, isto significa uma derivada parcial em
relação à variável xi . Assim podemos escrever

Fik ≡ (Φ k,i − Φ i,j ) (10.65)

Sendo um pouco mais explícitos temos então:

1
Ex = (Φ0,1 − Φ1,0 ) Bx = (Φ3,2 − Φ2,3 )
c
1
Ey = (Φ0,2 − Φ2,0 ) By = (Φ1,3 − Φ3,1 )
c
1
Ez = (Φ0,3 − Φ3,0 ) By = (Φ2,1 − Φ1,2 ) (10.66)
c
Escrevendo explicitamente a matriz temos
 
0 − Ex /c − Ey /c − Ez /c
ik
 E /c
 x 0 − Bz By 
F = (10.67)

 Ey /c Bz 0 − Bx 

Ez /c − By Bx 0

Se quisermos obter as componentes covariantes do tensor basta lembrarmos


que a passagem de índices contravariantes para covariantes se faz pelo uso

© s.r. dahmen 2022


a eletrodinâmica e a relatividade 159

da métrica µν

Fik = gim F mn gnk

 
0 Ex /c Ey /c Ez /c
− E /c 0 − Bz By 
 x
= (10.68)

 − Ey /c Bz 0 − Bx 
 
− Ez /c − By Bx 0

Mas qual o significado físico deste resultado? A teoria de Maxwell, como a


conhecemos, trabalha com campos vetoriais tridimensionais. Os campos E e
B são vetores e no que diz respeito à suas propriedades sob transformadas
de coordenadas – rotação, por exemplo – eles se comportam como vetores
usuais. Agora, no que tange aos outros vetores tridimensionais como vetor
posição, momentum, etc. conseguimos generalizá-los para o espaço-tempo
quadridimensional com um pouco de argumentação física: os quadrivetores
R, U , A e tantos outros têm, entre suas componentes, os vetores “usuais” R,
U, A da mecânica. Já os campos E e B não são generalizados para quadrive-
tores mas para algo que tem uma estrutura matemática mais complexa: o
tensor de campo eletromagnético.
A interpretação física é muito clara: o surgimento de um quadritensor
(4-tensor) ao invés de 2 vetores tridimensionais (ou 2 quadrivetores, se hou-
vessem!) significa que os campos E e B estão intrinsicamente relacionados e
de maneira tão inseparável que o “aparecimento” ou “desaparecimento” de
qualquer um deles depende do referencial inercial escolhido. Conhecemos
isto da eletrodinâmica clássica: um campo elétrico puro gerado por uma
carga só existe em um referencial onde esta carga está parada. Em qualquer
outro referencial inercial, esta mesma carga se move e portanto gera uma
corrente elétrica que por sua vez gera um campo magnético. Da mesma
maneira, como já pudemos discutir no início deste capítulo, um condutor
pelo qual passa uma corrente pode ser neutro em um referencial parado em
relação ao condutor, e portanto não gerar um campo E, mas ter uma carga
total não nula em um referencial que se move em relação ao fio, gerando
assim um campo elétrico diferente de zero neste referencial.
Portanto, basta termos um campo elétrico num referencial inercial I para
que surja um campo magnético em um referencial I 0 . Se tivermos em I um
campo magnético apenas, em I 0 teremos um campo magnético e um elétrico
– estamos aqui falando de referencias entre os quais há uma velocidade
relativa e portanto as transformações de Lorentz se aplicam. Como já
mencionado anteriormente, para rotações ou translações apenas, ambos os
vetores e comportam como vetores tridimensionais usuais. Se insistirmos
em tratar os vetores E e B como simples vetores, este resultado não poderia
ser expresso matematicamente. Não há como transformar estes vetores em
quadrivetores. Se fosse possível, cada quadrivetor teria componentes que
dependeriam das respectivas componentes no espaço tridimensional e as
transformações de Lorentz não misturariam os dois, como sabemos ocorrer
na realidade. Podemos pensar no campo eletromagnético (daí o nome) como
algo único, o que ele realmente é. Tanto que se em um referencial inercial
não houver nem campo elétrico nem campo magnético, é impossível fazer
surgir campos elétrico e magnético em outro referencial inercial.
Agora, como o tensor se transforma? Simples: como todo tensor de segunda

© s.r. dahmen 2022


160 uma introdução à teoria do espaço e do tempo

ordem sob uma transformação de Lorentz, ou seja

F 0 ik = Lim Lkl F ml . (10.69)


Lembremos que componentes contravariantes se transformam segundo as
tranformações das coordenadas. Tomemos um exemplo a transformação do
elemento Bz = F21 do tensor. Segundo a regra acima temos

F 021 = L2m L1l F ml


3
F 021 = ∑ L2m L1l F ml
m,l =0
3
F 021 = ∑ (L20 F 0l + L21 F 1l + L22 F 2l + L23 F 3l ) L1l (10.70)
l =0

A matriz de transformação do referencial I para I 0 no caso de uma velocidade


relativa v na direção x vale:
 
γ −γβ 0 0
−γβ γ 0 0
Lik =  . (10.71)
 
 0 0 1 0
0 0 0 1

Ao fazermos as contas teríamos em princípio que somar sobre 16 termos


em (10.70), mas o cálculo é mais simples pois apenas alguns elementos da
matriz L são diferentes de zero. A expressão acima se torna
3
F 0 21 = ∑ (|{z}
L20 F 0l + L21 F 1l + L22 F 2l + L23 F 3l ) L1l
l =0
|{z} |{z} |{z}
=0 =0 =1 =0
3
F 0 21 = ∑ L1l F 2l
l =0
F 0 21 = L10 F 20 + L11 F 21 + L12 F 22 + L13 F 23
F 0 21 = −γβ F 20
+ γ F 21 (10.72)

Como F20 = Ey /c e F21 = Bz chegamos que (??) vale

Bz − v2 Ey
F 0 21 = Bz0 = q c (10.73)
22
1 − vc

10.5 As equações de Maxwell em termos dos Fij

Uma vez que as componentes do tensor Fij são as componentes espaciais


dos campos E e B, fica a pergunta: seria possível escrever as equações de
Maxwell em termos destas componentes? A resposta √ é obviamente sim,
afinal isto seria o equivalente ao substituir 2 por 4 ou 5 por ln e5 . A
pergunta corretamente colocada na verdade é: seria possível escrever as
equações de Maxwell de uma forma mais elegante se as expressarmos em
termos dos Fij ? Para responder esta pergunta observemos a definição dos
Fij !
∂Φ j ∂Φi
Fij ≡ − = ∂i Φ j − ∂ j Φi (10.74)
∂xi ∂x j

© s.r. dahmen 2022


a eletrodinâmica e a relatividade 161

ou, se preferirmos
j
Fij ≡ (Φ ,i − Φ i,j ) (10.75)
Se tomarmos a derivada desta última expressão em relação ao índice k
teremos
ij j
∂k Fij = F ,k = Φ ,ik − Φ i,jk (10.76)
Por permutação cíclica de índices teremos:

ij j
F ,k = Φ ,ik − Φ i,jk
jk j
F ,i = Φ k,ji − Φ,ki

F ki
,j = i k
Φ ,kj − Φ ,ij (10.77)

Somando estas expressões e notando que ∂α ∂ β = ∂ β ∂α temos

ij jk
F ,k + F ,i + F ki k ij i jk j ki
,j = ∂ F + ∂ F + ∂ F = 0 (10.78)

Notem que nesta expressão os índices não estão somadas pois não apare-
cem repetidos! Não é difícil mostrar que se 2 índices forem repetidos na
expressão acima, a obtemos a identidade 0 = 0. Assim o número de equação
restantes é dado pela combinação de 3 índices de um conjunto de 4, isto é
C34 = 4!/3! = 4. Por exemplo, tomando os índices 0, 1, 2 temos, na equação
acima

∂2 F 01 + ∂0 F 12 + ∂1 F 20 = 0
1 ∂ 1 ∂ 1 ∂
− Ex + − Bz + Ey = 0
c ∂y c ∂t c ∂x
∂Ex ∂Ey ∂Bz
− = −
∂y ∂x ∂t
 
∂B
(∇ × E)z = − (10.79)
∂t z

Ou seja, esta é a componente z da Lei da Indução de Faraday:

∂B
∇×E = − . (10.80)
∂t
As 3 equações restantes de um total de 4 nos dão as componentes x e y da
equação acima e também a equação homogênea

∇ · B = 0, (10.81)

e podem ser obtidas das combinações de índices 1, 2, 3, 0, 1, 3 e 0, 2, 3. E


as outras equações de Maxwell, a Lei de Ampère e a Lei de Gauss para
o campo elétrico? Estas possuem, em casos mais gerais, a densidades de
corrente e de carga

ρ ∂E
∇·E = e ∇ × B = µ 0 j + e0 µ 0 (10.82)
e0 ∂t

Como temos correntes, temos neste caso que recorrer à quadricorrente


definida em (10.44). Neste caso não é difícil mostrar que estas equações se
resumem à
∂i F ij = µ0 J j (10.83)

© s.r. dahmen 2022


162 uma introdução à teoria do espaço e do tempo

Notem que nesta expressão há uma soma implícita nos índices segundo a
convenção de Einstein! Por exemplo, tomando o termo em j = 2 temos

∂i F i2 = µ0 J 2
∂0 F 02 + ∂1 F 12 + ∂2 F 22 + ∂3 F 32 + = µ0 Jy
1 ∂Ey ∂Bz ∂ ∂Bx
− − + 0+ = µ0 Jy
c2 ∂t ∂x ∂y ∂z
∂Bx ∂Bz 1 ∂Ey
− = µ0 Jy + 2
∂z ∂x
 c ∂t

1 ∂E
(∇ × B)y = µ0 j + 2 (10.84)
c ∂t y

que nada mais é que a componente y da Lei de Ampére.

10.6 Um outro caminho possível

Optamos por mostrar de duas maneiras diferentes como o Eletromagne-


tismo é afetado pelas transformações de Lorentz. Estas duas maneiras tem
objetivos diferentes.
No exemplo do fio com corrente e uma carga que se desloca em relação
a ele, um cálculo mais direto das forças envolvidas nos permite entender
de maneira clara como um campo magnético surge a partir de um campo
elétrico “puro” em um referencial no qual a partícula se move.
A segunda abordagem é mais abstrata, mas tem a vantagem de ser mais geral
e nos conduz de maneira natural ao conceito de tensor energia-momento,
que desempenha um papel fundamental na Teoria da Relatividade Geral.
Isto será por nós tratado mais adiante.
Uma terceira abordagem, mais próxima da idéia da primeira por nós apre-
sentada mas que leva aos resultados da segunda, será agora discutida.
Para tanto imaginemos um sistema de coordenadas S : (ct, x, y, z) no qual há
um campo elétrico e magnético E, B respectivamente. Imaginemos também
um sistema de coordenadas S0 : (ct0 , x 0 , y0 , y0 ) que se move como velocidade
vî em relação ao primeiro. Neste referencial designaremos os campos por E0
e B0 . Uma partícula com carga q se move com velocidade u em relação à S e
u0 em relação à S0 . A força de Lorentz à qual esta partícula está submetida
nos diferentes referenciais vale:

F = qE + q u × B
0
F = qE0 + q u0 × B0 (10.85)

Consideremos as componentes Fy e Fy0 da força de Lorentz nos dois referen-


ciais:

Fy = q Ey + uz Bx − u x Bz
 
Fy0 = q Ey0 + u0z Bx0 − u0x Bz0 (10.86)

A relação entre estas duas forças, segundo a TER, vale

Fy
Fy0 = (10.87)
γ(1 − v u x /c2 )

© s.r. dahmen 2022


a eletrodinâmica e a relatividade 163

ou  v ux  0
Fy = γ 1 − 2 Fy . (10.88)
c
Substituindo agora as expressões para as forças nestas equações temos
 v ux   0 
q Ey + u0z Bx0 − u0x Bz0

q Ey + uz Bx − u x Bz = γ 1 − 2 (10.89)
c
Pela transformações de Lorentz, no entanto, segue que as velocidades se
transformam segundo
ux − v uz
u0x = ; u0z = (10.90)
1 − vu x /c2 γ (1 − vu x /c2 )
Substituindo estes valores na expressão das forças logo acima ficamos com
 v ux  0
Ey + uz Bx − u x Bz = γ 1 − 2 Ey + uz Bx0 − γ (u x − v) Bz0 . (10.91)
c
Esta expressão pode ser reescrita como
h  i h  i
Ey − γ Ey0 + v Bz0 − Bz − γ Bz0 + v Ey0 /c2 u x + Bx − Bx0 uz = 0


(10.92)
Uma vez que esta expressão deve valer para quaisquer valores de velocidade
relativa v entre referenciais, ela só será satisfeita se os coeficientes forem
iguais a zero termo a termo:
   
Ey = γ Ey0 + v Bz0 , Bz = γ Bz0 + v Ey0 /c2 , Bx = Bx0 (10.93)

Seguindo os mesmos passos para a componente z da força de Lorentz


 v ux  0
Fz = γ 1 − 2 Fz (10.94)
c
chegaremos às expressões
   
Ez = γ Ez0 − v By0 , By = γ By0 − v Ez0 /c2 , Bx = Bx0 . (10.95)

Resta-nos finalmente a expressão

v u0y /c2 v u0y /c2


Fx = Fx0 + Fy0 + Fz0 (10.96)
1 + v u0x /c2 1 + v u0x /c2
que relaciona a componente x da força no referencial S às componentes Fx0 ,
Fy0 e Fz0 no referencial S0 . Isto nos leva então à
 
= q Ex0 + u0y Bz0 − u0z By0

q Ex + uy Bz − uz By
v u0y /c2 v u0y /c2
+ Fy0 + Fz0 .
1 + v u0x /c2 1 + v u0x /c2
(10.97)

Lembrando que
uy uy
u0y = e u0y = (10.98)
γ(1 − vu x /c2 ) γ(1 − vu x /c2 )
ficamos, na expressão da força, com uma expressão longa cujos únicos
termos independentes das componentes de v são qEx e qEx0 . Portanto eles
devem se cancelar mutuamente, levando-nos à

Ex = Ex0 . (10.99)

© s.r. dahmen 2022


164 uma introdução à teoria do espaço e do tempo

Com isto chegamos finalmente às transformações das componentes dos


campos sem a necessidade de falarmos de um tensor eletromagnético Fik .
Estas transformações são:

Ex0 = Ex Bx0 = Bx
Ey0 = γ( Ey − vBz ) By0 = γ( By + vEz /c2 )
Ez0 = γ( Ez + vBy ) Bz0 = γ( Bz − vEy /c2 ) (10.100)

© s.r. dahmen 2022


11
O tensor energia-momento e
o tensor das tensões de Maxwell

Um conceito de extrema importância que encontramos pela primeira vez


na TER é o chamado tensor energia-momento. Ele aparece no contexto de
campos eletromagnéticos, quando estudamos a conservação de energia e
momento de um sistema de partículas e campos interagentes. Sua importân-
cia se deve ao fato que, nas equações de campo de Einstein da Relatividade
Geral, o tensor energia-momento representa a fonte dos campos gravita-
cionais; dentro deste contexto, o modelo do fluido ideal relativístico tem
um papel importantíssimo pois ele é o modelo cosmológico mais simples
para tentar descrever a curvatura de um universo isotrópico e repleto de
matéria (poeira cósmica). No caso de campos eletromagnéticos, o tensor
energia-momento (quadridimensional) contém em si o famoso tensor das
tensões de Maxwell (tridimensional), um conceito bastante conhecido na
teoria do eletromangetismo clássico. Por este motivo descreveremos inici-
almente o tensor das tensões de Maxwell do Eletromagnetismo e como ele
surge quando estudamos a conservação de energia e momento.

11.1 O vetor de Poynting e a conservação de energia


Para facilitar, comecemos pela discussão da conservação de energia e mo-
mento para cargas e campos na sua forma tridimensional. Para isto vamos
partir das equações de Maxwell:
∂D
∇×H = j+ ∇·H = 0
∂t
∂B ρ
∇×E = − ∇·E = (11.1)
∂t e
onde, para meios isotrópicos de permissividade e e permeabilidade µ, temos

D = eE, B = µH. (11.2)


Caso estejamos no vácuo, substituimos e → eo e µ → µo . Daqui em diante
usaremos a representação f˙ para representar ∂ f /∂t.
Multiplicando escalarmente a lei de Ampère por H, a lei de Faraday por E e
subtraindo uma da outra obtemos
H · ∇ × E − E · ∇ × H = −Ḃ · H − Ḋ · E − j · E (11.3)
166 uma introdução à teoria do espaço e do tempo

Contudo, do cálculo vetorial conhecemos a identidade

H · ∇ × E − E · ∇ × H = ∇ · ( E × H ). (11.4)

Além disso temos que



(E · D + B · H) = Ė · D + E · Ḋ + Ḃ · H + B · Ḣ
∂t 
= 2 Ḋ · E + Ḃ · H (11.5)

Substituindo (11.4) e (11.5) em (11.3) obtemos

Ḋ · E + Ḃ · H = −j · E − ∇ · (E × H)
E·D+B·H
 

= −j · E − ∇ · (E × H)
∂t 2

u = −j · E − ∇ · (E × H) (11.6)
∂t
No termo da esquerda identificampos por u a densidade de energia dos
campos
E·D+B·H
u= (11.7)
2
que, no caso do vácuo, se reduz à conhecida expressão
1 1 1 1 2
u= eo E2 + µ o H2 = eo E2 + B . (11.8)
2 2 2 2µo
Integrando a equação (11.6) num volume V do espaço obtemos, lembrando
R
que U = V u dV

dU
Z Z
=− j · E dV − ∇ · (E × H) dV (11.9)
dt V V

Aplicando o teorema de Gauss-Ostragradsky na segunda integral do lado


direito da equação podemos finalmente escrever
dU
Z I
=− j · E dV − (E × H) · dA (11.10)
dt V A

onde a última integral é feita sobre a superfície A que delimita o volume


V. Interpretemos agora o significado desta equação. Considerando o caso
simples de cargas no vácuo, com j = ρv temos a expressão para a força de
Lorentz por unidade de volume na forma

f Lorentz = ρ (E + v × B) = ρE + j × B. (11.11)

Multiplicando escalarmente ambos os lados da equação por v temos

v · f Lorentz = ρ v · E = j · E (11.12)

Da equação acima depreendemos que o termo j · E representa portanto o


trabalho feito pelo campo elétrico sobre as cargas por unidade de tempo.
Por conservação de energia temos que
dK
Z Z
j · E dV = v · f Lorentz dV = (11.13)
V V dt
onde K é a energia cinética das cargas. Portanto a equação (11.9) pode ser
escrita como
d
I I
(U + K ) = − (E × H) · dA = − ·dA. (11.14)
dt A A

© s.r. dahmen 2022


o tensor energia-momento e o tensor das tensões de maxwell 167

Nesta expressão = E × H = E × B/µo é o conhecido vetor de Poyting que


representa o fluxo de energia por unidade de tempo (potência) por unidade
de área na direção do vetor . Sua unidade é W/m2 . A interpretação física
desta equação é que dentro de um volume a energia potencial e cinética
dos campos e pode aumentar ou diminuir caso acha um fluxo negativo ou
positivo de radiação eletromagnética.

11.2 A conservação de momento para campos e partículas


Para entendermos as leis de conservação de momento, partimos de dois
fatos bastante conhecidos: a relação entre densidade de força e momento
f = dp/dt e o fato que no caso eletromagnético a densidade de força sobre
partículas em um determinado volume é a força de Lorentz:

f Lorentz = ρ E + j × B.

A estratégia é partir das equações de Maxwell e tentar fazer aparecer ali


a força. Partimos assim da lei de Ampère e da lei de Faraday em sua
forma diferencial e as multiplicamos vetorialmente por B = µH e D = eE,
respectivamente

B × (∇ × H) = B × j + Ḋ
D × (∇ × E) = −D × Ḃ (11.15)

Adicionando as duas equações obtemos



eE × (∇ × E) + µH × (∇ × H) = −j × B + eµ H × Ė − E × Ḣ

ou, por uma simples troca de sinal



−eE × (∇ × E) − µH × (∇ × H) = j × B + eµ Ė × H + E × Ḣ (11.16)

Neste expressão podemos ver claramente do lado direito da equação o termo


da força magnética sobre uma corrente. Falta porém o termo correspondente
à força de Coulomb ρE para que a expressão fique completa. Esta por ser
obtida diretamente da lei de Gauss multiplicando-a por E:
ρ
∇·E = → eE (∇ · E) = ρ E.
e
Somando agora esta força de Coulomb à eq. (11.16) ficamos com
 
e E (∇ · E) − E × (∇ × E) − H × (∇ × H) = ρ E + j × B

+eµ Ė × H + E × Ḣ

Existe porém uma assimetria nesta equação pela falta de um termo propor-
cional à H∇ · H. Uma vez que pela lei de Gauss para campos magnéticos
este termo é zero, ou seja

∇·H = 0 → µH (∇ · H) = 0,

podemos adicioná-lo ao lado esquerdo da equação sem alterar seu valor.


Ficamos finalmente com:
   
e E (∇ · E) − E × (∇ × E) + µ H (∇ · H) − H × (∇ × H) =

ρ E + j × B + eµ Ė × H + E × Ḣ ,

© s.r. dahmen 2022


168 uma introdução à teoria do espaço e do tempo

ou seja
   
e E (∇ · E) − E × (∇ × E) + µ H (∇ · H) − H × (∇ × H) =

f Lorentz + eµ (E × H) . (11.17)
∂t
Olhando atentamente para a equação (11.17) vemos que o lado direito da
equação tem uma força de Lorentz, que corresponde à variação da densidade
de momento das cargas e um termo

eµ E × H = = g, (11.18)
c2
que corresponde à densidade de momento do campo magnético (comumente
os livros de Teoria Eletromagnética e Relatividade representam a densidade
de momento pela letra g). Antes de discutirmos melhor este ponto, vamos
reescrever o termo do lado esquerdo de (11.17) de maneira mais conveniente.

11.2.1 O tensor das tensões de Maxwell


Nosso objetivo aqui é reexpressar a eq. (11.17) de forma mais conveniente.
A expressão
a (∇ · a) − a × (∇ × a) (11.19)
para um vetor a arbitrário pode ser reescrita de outra forma. Para facilitar
a compreensão, abandonaremos por um momento a notação de Einstein.
Vamos também usar a forma explícita para a componente α do produto
vetorial a× expressa em termos do símbolo de Levi-Civita eαβγ :

(a×)i = ∑ ε ijk a j bk
j,k
 

(a×) = ∑ ∑ ε ijk a j bk  êi , (11.20)


i jk

onde

1

 se (i, j, k) for uma permutação cíclica.
ε ijk = −1 se (i, j, k) for uma permutação anticíclica.


0 se 2 ou mais índices forem repetidos.

Em outras palavras

ε 123 = ε 312 = ε 231 = 1


ε 132 = ε 213 = ε 321 = −1
ε iij = ε iji = ε jii = 0

Para os símbolos de Levi-Civita valem também as igualdades:

∑ ε ijk ε imn = δjm δkn − δjn δkm


i

∑ ε imn ε jmn = 2δij


mn

∑ ε ijk ε ijk = 6
ijk

© s.r. dahmen 2022


o tensor energia-momento e o tensor das tensões de maxwell 169

Nestas expressões δmn é o símbolo de Kronecker.

Tomemos o exemplo simples do produto vetorial entre a = ( a1 , a2 , a3 ) e


= (b1 , b2 , b3 ). Segunda a definição temos:

a× = ∑ ε ijk a j bk êi
i,j,k
 
= ∑ ε 1jk a j bk ê1 + ε 2jk a j bk ê2 + ε 3jk a j bk ê3
jk

Os únicos termos diferentes de zero são aqueles para os quais todos os


índices do símbolo de Levi-Civita são diferentes entre si:
   

a× = ε 123 a2 b3 + ε 132 a3 b2  ê1 + ε 231 a3 b1 + ε 213 a1 b3  ê2


=1 =−1 =1 =−1
 

+ ε 312 a1 b2 + ε 321 a2 b1  ê3


=1 =−1
= ( a2 b3 − a3 b2 ) ê1 + ( a3 b1 − a1 b3 ) ê2 + ( a1 b2 − a2 b1 ) ê3 .

Embora possa parecer uma complicação desnecessária, a formulação que


acabamos de discutir se mostra particularmente vantajosa quando queremos
demonstrar algumas identidades do cálculo vetorial, como por exemplo

∇ × (a×) = a ∇ · − ∇ · a + (·∇)a − (a · ∇) (11.21)

Para demonstrar a igualdade calculamos diretamente a componente i do


vetor na forma
 
∇ × (a×) i
= ε ijk ∇ j (a×)k
= ε ijk ∇ j (ε klm al bm )
= ε kij ε klm ∇ j ( al bm )
 
= δil δjm − δim δjl ∇ j ( al bm )
  
= δil δjm − δim δjl a l ∇ j bm + bm ∇ j a l
= δil δjm al ∇ j bm − δim δjl al ∇ j bm + δil δjm bm ∇ j al − δim δjl bm ∇ j al
= a i ∇ j b j − a j ∇ j bi + b j ∇ j a i − bi ∇ j a j
= ai (∇·) − (a · ∇) bi + (·∇) ai − bi (∇ · a)
= ai (∇·) − bi (∇ · a) + (·∇) ai − (a · ∇) bi (11.22)

Com isto vemos que o lado direito da igualdade é a componente i do vetor


à direita da equação (11.21).

Usando a notação de Levi-Civita podemos reescrever a eq. (11.19) como:


 ! 
a (∇ · a) − a × (∇ × a) = ∑ aj ∑ ∂i ai − ∑ ε jkm ak (∇ × a)m ê j
j i k,m
(11.23)
Os ê j representam os vetores unitários na direções dos eixos ordenados.
Vamos inicialmente nos concentrar no último termo do lado direito da

© s.r. dahmen 2022


170 uma introdução à teoria do espaço e do tempo

igualdade. Podemos escrever:


!
∑ ε jkm ak (∇ × a)m = ∑ ε jkm ak ∑ ε mrs ∂r as
k,m k,m r,s

= ∑ ε mjk ε mrs a k ∂r a s
k,m
r,s δjr δks −δjs δkr
 
= ∑ δjr δks − δjs δkr a k ∂r a s
k
r,s
 
= ∑ ak ∂ j ak − ak ∂k a j
k
 
1
= ∑ ∂ a2 − a k ∂ k a j
2 j k
(11.24)
k

Na passagem da 1ª linha para a 2ª rearranjamos ciclicamente a ordem


dos índices de ε jkm para ε mjk por uma questão de conveniência. Por serem
idênticos, o resultado permanece inalterado. Substituindo esta expressão na
equação (11.23) ficamos com
  
1
a (∇ · a) − a × (∇ × a) = ∑ ∑ a j ∂i ai − ∑ ∂ a2 − a k ∂ k a j
2 j k
ê j (11.25)
j i k

Sendo o índice k da última somatória um índice mudo, podemos fazer a


troca k → i sem alterar o resultado, escrevendo o termo entre chaves como:
    
1  1
∑ a j ∂i ai + ai ∂i a j − 2 ∂ j a2i = ∑ ∂i ai a j − 2 ∂ j a2i
i i
   1  
= ∑ ∂i ai a j − δij ∂i a2i
i
2
 
δij 2
= ∑ ∂i ai a j − ai (11.26)
i
2

Concluímos assim, finalmente, que a expressão (11.25) vale


  
δij
a (∇ · a) − a × (∇ × a) = ∑ ∑ ∂i ai a j −
2
a2i ê j (11.27)
j i

Usando a notação de Einstein, mais econômica, podemos escrever


 
δij
a (∇ · a) − a × (∇ × a) = ∂i ai a j − a2i ê j (11.28)
2

Aplicando agora este resultado à nossa equação original (11.17) temos

eE2 + µH2
 

∂i eEi Ej + µHi Hj − δij ê j = f Lorentz + eµ (E × H) . (11.29)
2 ∂t

Notemos aqui que o lado esquerdo desta expressão tem a forma de um


divergente. Esta observação é importante quando formos generalizar este
resultado para 4 dimensões. Reescrevendo esta igualdade de forma mais
sucinta temos:

∂i σij ê j = f Lorentz + eµ (E × H) , (11.30)
∂t

© s.r. dahmen 2022


o tensor energia-momento e o tensor das tensões de maxwell 171

onde σij é o célebre tensor das tensões de Maxwell:

eE2 + µH2
σij = eEi Ej + µHi Hj − δij = Ei D j + Hi Bj − δij u. (11.31)
2
(u é a densidade de energia do campo eletromagnético). No vácuo e em
meios isotrópicos este tensor é simétrico.
Como dito anteriormente, na Eletrodinâmica em 3 dimensões este tensor é
representado por uma matriz 3 × 3. Uma outra maneira de expressá-lo é em
termos do produto tensorial ⊗ (ou produto diádico) dos vetores E e H:


→ eE2 + µH2
σ = eE ⊗ E + µH ⊗ H − I (11.32)
2

O produto diádico entre os vetores

a = a1 i + a2 j + a3 k
= b1 i + b2 j + b3 k

é definido via:

a∧b = a1 b1 (i ∧ i) + a1 b2 (i ∧ j) + a1 b3 (i ∧ k)
+ a2 b1 (j ∧ i) + a2 b2 (j ∧ j) + a2 b3 (j ∧ k) (11.33)
+ a3 b1 (k ∧ i) + a3 b2 (k ∧ j) + a3 b3 (k ∧ k)

Podemos representá-los diretamente na forma de um produto externo de


matrizes:
   
a1 a1 b1 a1 b2 a1 b3
a ∧ b ≡ a ⊗ b ≡ abT =  a2  (b1 b2 b3 ) =  a2 b1 a2 b2 a2 b3 (11.34)
   
a3 a3 b1 a3 b2 a3 b3

Em termos da representação matricial, da mesma maneira que os vetores da


base i, j, k são representados por:
     
1 0 0
i = 0, j = 1, k = 0 (11.35)
     
0 0 1

os elementos de base diádicos são dados por:


     
1 0 0 0 1 0 0 0 1
i ∧ i = 0 0 0, i ∧ j = 0 0 0, i ∧ k = 0 0 0
     
0 0 0 0 0 0 0 0 0
     
0 0 0 0 0 0 0 0 0
j ∧ i = 1 0 0, j ∧ j = 0 1 0, j ∧ k = 0 0 1
     
0 0 0 0 0 0 0 0 0
     
0 0 0 0 0 0 0 0 0
k ∧ i = 0 0 0, k ∧ j = 0 0 0, k ∧ k = 0 0 0
     
1 0 0 0 1 0 0 0 1
(11.36)

© s.r. dahmen 2022


172 uma introdução à teoria do espaço e do tempo

Se integrarmos a equação (11.30) num volume arbitrário V no vácuo temos

∂σij E×H
Z Z Z

ê j dV = f Lorentz dV + dV. (11.37)
V ∂xi V ∂t V c2

De acordo com a 2ª Lei de Newton sabemos que

dP
Z
f Lorentz dV = (11.38)
V dt

onde P é o momento das cargas no volume V. O termo /c2 representa a


densidade de momento do campo eletromagnético de tal modo que temos:
Z
Pem = dV. (11.39)
V c2

Com isto a equação (11.37) pode ser escrita na forma

d ∂σij
Z
(P + Pem ) = ê j dV (11.40)
dt V ∂xi

O teorema de Gauss-Ostragradisky nos permite agora expressar a integral


do lado direito desta igualdade em uma integral sobre a superfície A que
delimita o volume V, ou seja
Z ∂σij I
ê j dV = σij ni ê j dA (11.41)
V ∂xi A

onde n̂ = (ni ) = (n1 , n2 , n3 ) representa o vetor normal ao elemento de área


dA. Os integrandos
σij ni ê j (11.42)
representam a componente j de uma força por unidade de área (pressão)
que atua na direção i sobre um elemento de superfície dA cuja normal é
n̂. Portanto a lei de conservação de momento do campo eletromagnético e
cargas no vácuo pode ser finalmente escrito como:

d
I
(P + Pem ) = σij ni ê j dA (11.43)
dt A

A interpretação física deste resultado é a seguinte: as equações de Maxwell


no vácuo nos levam a uma densidade de momento de campo eletromag-
nético identificada por /c2 . Portanto a equação (11.43) representa a 2ª Lei
de Newton para campos e cargas e diz que o aumento no momento total
num dado volume V pode ser expresso através de forças que atuam sobre a
superfície A que delimita o volume V.
Enfatizamos aqui que esta interpretação se aplica ao vácuo, pois nele pode-
mos fazer uma distinção clara entre o momento das cargas e o momento dos
campos, sem qualquer ambiguidade. Em meios dielétricos, há ainda hoje
uma controvérsia – a chamada controvérsia de Minkowki-Abraham de 1909
– sobre quais partes do momento devem ser associados ao campo e quais às
cargas. Do ponto de vista mais pragmático, pode-se adotar o ponto de vista 1
Por exemplo, um artigo recente de
de que o que realmente importa nas contas é o momento total, independente Agosto de 2021 é o de M. Partanen e J.
da maneira como este se distribui entre cargas e campos. Para se ter uma Tulkki, Covariant Theory of Light in a Dis-
idéia da atualidade destas discussões, no momento em que escrevo estas persive Medium, Phys. Rev. A 104, 023510
notas há artigos sendo publicados em periódicos de ponta sobre o assunto 1 . (2021).

© s.r. dahmen 2022


o tensor energia-momento e o tensor das tensões de maxwell 173

11.3 A versão quadridimensional: o tensor energia-momento


Há várias maneiras de estender o tensor das tensões de Maxwell para 4
dimensões. Grande parte da literatura parte de um princípio variacional,
a minimização da ação S para o campo eletromagnético, e obtém a par-
tir daí o tensor energia-momento. Para isto se faz necessário conhecer a
Lagrangeana do campo eletromagnético expresso em função do tensor de
campo eletrogmagnético F µν . Embora este método seja muito elegante, ele
parece um pouco obscuro quando nos deparamos pela primeira vez com
este conceito. Um método mais claro é através da tentativa de generalizar a
versão tridimensional (11.40) mostrando que a quadriforça pode ser escrita
como o divergente de um tensor quadritensor Tµν :

fµ =
Tµν . (11.44)
∂x ν
Este por exemplo é o método adotado por Ugarov. O que faremos aqui é
uma adaptação da discussão de Ugarov devido a A. Challinor e T. Watts 2 . 2
V. A. Ugarov, Special Theory of Rela-
Vamos antes revisar rapidamente algumas das equações que usaremos, tivity, Mir Publishers, Moscow, 1971,
escritas numa forma mais apropriada. pp. 226 – 233; A. Challinor, Electrody-
namics: Lecture Notes. Acessível em
www.damtp.cam.ac.uk/user/examples;
As equações de Maxwell. P. Watts, Advanced Electrogmagne-
∂µ F µν = µo J ν (11.45) tism: Lecture Notes. Acessível em
www.thphys.nuim.ie/Notes/MP465.
∂ρ F µν + ∂ν F ρµ + ∂µ F νρ = 0 (11.46)
Nestas equações ∂µ = ∂/∂x µ são as derivadas parciais nas variáveis x µ =
(ct, x, y, z) = ( x0 , x1 .x2 , x3 ).

O tensor eletromagnético de Maxwell.

Na expressão acima o tensor eletromagnético de Maxwell vale:


 
0 − Ex /c − Ey /c − Ez /c
 E /c 0 − Bz By 
F µν =  x (11.47)
 
 Ey /c Bz 0 − Bx 

Ez /c − By Bx 0
Se quisermos obter as componentes covariantes do tensor basta lembrarmos
que a passagem de índices contravariantes para covariantes se faz pelo uso
da métrica gµν
Fµν = gµα gνβ F αβ g βν

 
0 Ex /c Ey /c Ez /c
− E /c 0 − Bz By 
 x
= (11.48)

 − Ey /c Bz 0 − Bx 
 
− Ez /c − By Bx 0
O tensor misto vale:
µ
Fα = gαν F νµ

 
0 − Ex /c − Ey /c − Ez /c
− E /c 0 − Bz By 
 x
= (11.49)

 − Ey /c Bz 0 − Bx 
 
− Ez /c − By Bx 0

© s.r. dahmen 2022


174 uma introdução à teoria do espaço e do tempo

O tensor de campo de Maxwell também pode ser também escrito em termos


do quadripotencial formado do potencial escalar ϕ e potencial vetor A:

Aµ = ( ϕ/c, A) (11.50)

na forma
Fµν = ∂µ Aν − ∂ν Aµ (11.51)

A quadricorrente J µ .

A quadricorrente vale
J µ = (ρc, J) (11.52)
e satisfaz a equação de continuidade:

∂µ J µ = 0 (11.53)

A quadriforça F µ .

A definição de quadriforça
dpµ
Fµ = (11.54)

onde τ é o tempo-próprio e pµ = ( E/c, p) é o quadrimomento. Para uma
partícula de massa m temos a relação entre momento pµ e quadrivelocidade
uµ :

pµ = muµ (11.55)
dx µ d
uµ = = γ (ct, x) = (γ c, γv) (11.56)
dτ dt
3
Para que não haja confusão, índices la-
11.3.1 Dedução da expressão para T µν tinos i, j, k variam de 1 a 3; índices gre-
gos, por outro lado, vão de 0 à 4, por
O que queremos agora é construir um quadrivetor que contenha as energias e exemplo α = 0, 1, 2, 3. Assim fica claro
momenta do campo eletromagnético (e que tenha em si também os elementos que σij se refere ao tensor das tensões de
Maxwell, tridimensional, ao passo que
σij do tensor das tensões de Maxwell) 3 .
Tµν representa o tensor energia-momento
Vamos partir de uma situação física simples: o de um grupo de partículas de quadridimensional.
massa de repouso m, todas em repouso num referencial inercial próprio I 0 e
com densidade de partículas n0 (número de partículas por volume). Neste
referencial elas têm:

u 0 = n 0 m c2 = ρ 0 c2 , 0
= 0, σij = 0 (11.57)

onde a densidade de massa ρ0 = nm. Consideremos agora um referencial


I que vê as partículas se movendo com velocidade v = (−v, 0, 0), isto é,
em direção à origem x = 0. Neste referencial as partículas tem densidade
n = γ n0 devido à contração de Lorentz, e cada uma delas passa a ter energia
γ m c2 e momento −γ m v. Portanto em I temos

u = ( γ n 0 ) ( γ m c2 ) = γ2 n 0 m c2 = γ2 u 0 (11.58)

Para I há um fluxo de energia na direção do eixo x negativo

S x = − u v = − γ2 u 0 v (11.59)

© s.r. dahmen 2022


o tensor energia-momento e o tensor das tensões de maxwell 175

e uma densidade de momento (eq. 11.18)


γ2 u 0 v Sx
gx = (−γ m v)(γ n0 ) = −γ2 v (mn0 ) = − = 2. (11.60)
c2 c
u0 /c2
Há assim um fluxo da componente x do 3-momento na direção − x o
que significa que o tensor das tensões de Maxwell tem uma componente
σ11 = σxx
v2
σ11 = gx | v |= −γ2 u0 2 (11.61)
c
O que é importante notar nas relações acima é que u, Sx e σij se misturam
quando fazemos uma transformação de Lorentz de um referencial inercial
para outro. Por isso vamos fazer a hipótese que o tensor energia-momento
tem a forma !
µν u cg j
T = . (11.62)
Si /c −σ ij
O sinal negativo em σ vem da métrica de Minkowski com assinatura
(+, −, −, −). No caso do referencial I 0 no qual a partícula se encontra
parada, este tensor claramente tem a forma
u0 0 0 0
 
 0 0 0 0
T 0µν =  (11.63)
 
 0 0 0 0

0 0 0 0
Para que ele seja realmente um tensor, ele tem que se transformar segundo
as transformações de Lorentz aplicada a tensores de rank 2:
T µν = Λα Λνβ T 0αβ
µ

Devemos ter o cuidado nesta transformação: o referencial das partículas I 0


se move com velocidade −v em relação ao referencial I. A transformação
de Lorentz usual para obter um quadrivetor a0 dado que conhecemos o
quadrivetor a arbitrário em I neste caso vale:
a0µ Λα (−v) aα
µ
=
 
γ γβ 0 0
γ β γ 0 0
a0µ = (11.64)
 
 0 0 0 0
 
0 0 0 0
Como estamos partindo das grandezas em I 0 para chegar às grandezas de I
temos que usar em (11.64) é a matriz inversa, ou seja
 
γ −γ β 0 0
−γ β γ 0 0
Λα (v) = 
µ
(11.65)
 
 0 0 0 0

0 0 0 0
Calculando (11.64) explicitamente obtemos
Λα Λνβ T 0αβ
µ
T µν =
γ2 u 0 − γ2 β u 0
   
0 0 u cgx 0 0
 2 0
− γ β u γ2 β2 u 0 0 0 S /c
  x −σxx 0 0
= =
 
0 0 0 0  0 0 0 0
 

0 0 0 0 0 0 0 0
(11.66)

© s.r. dahmen 2022


176 uma introdução à teoria do espaço e do tempo

Com isto vemos que quando transformamos os valores por nós hipotetizados
em (11.62) para a forma do tensor T µν , obtemos os valores calculados
anteriormente usando argumentos físicos. Portanto nossa hipótese acerca de
T µν é correta e esta grandeza se transforma como um tensor. Usando agora
os vetores , g e o tensor das tensõ1es σij de Maxwell conhecidos, podemos
escrever diretamente
!
µν eo E2 /2 + B2 /µo (E × B) j /c
T = , (11.67)
(E × B)i /c −σ ij

onde σ ij é dado pela eq. (11.31):

1 eo E2 + B2 /µo
σij = eo Ei Ej + Bi Bj − δij (11.68)
µo 2

Em outras palavras:
 
eo E2 /2 + B2 /µo Sx /c Sy /c Sz /c
 Sx /c −σxx −σxy −σxz 
T µν =
 
Sy /c −σyx −σyy −σyz 


Sz /c −σzx −σzy −σzz
4
C. W. Misner, K. S. Thorne, J. A. Whe-
eler, Gravitation, W. H. Freeman & Com-
O termos do tensor T µν têm a seguinte interpretação física 4 : pany, San Francisco 1970, p. 138.

– T 00 : representa uma densidade de energia-massa.


– T i0 : representa a componente i da densidade de momento.
– T ii : representa uma pressão caso T ii > 0 ou uma tensão (stress) caso
Tii < 0.
– T ij : representa a componente i da força exercida por campos em x − dx
sobre a matéria em x + dx por unidade de área localizada em x e cuja
normal aponta na direção j. O termo técnico para esta força por unidade
de área é shear stress ou tensão de cisalhamento.

11.3.2 Formulação geral


Vamos agora tentar escrever estes resultados em termos dos tensor eletro-
magnético F µν . Para isto vamos escrever, termo a termo, os elementos de
T µν como função dos F µν . Temos primeiramente (v. 11.47):

1  
Sx = Ey Bz − Ez By
µo
1  
cF02 F2 1 − cF03 − F3 1

=
µo
c
F02 F2 1 + F03 F3 1
 
=
µo
c
F00 F0 1 + F01 F1 1 + F02 F2 1 + F03 F3 1
 
=
µo
c
= F0ρ Fρ 1
µo
= cT 01 (11.69)

Da terceira para a quarta linha acrescentamos os termos F00 e F11 pois eles
são nulos. Com isto podemos escrever Sx como uma soma no índice mudo

© s.r. dahmen 2022


o tensor energia-momento e o tensor das tensões de maxwell 177

ρ. Não é muito trabalhoso mostrar que


c 0ρ 2
Sy = F Fρ = cT 02 (11.70)
µo
c 0ρ 3
Sz = F Fρ = cT 03 (11.71)
µo

Com isto podemos escrever de forma geral:


 
1 1
T µν = F µα Fα ν + gµν F αβ Fαβ (11.72)
µo 4

Um cálculo mais explicito destas formas é apresentado na lista 4 de proble-


mas.

11.4 O tensor das tensões na mecânica e sua interpretação


física
A idéia do tensor das tensões vem da mecânica: ele é introduzido com
o intuito de descrever a força que atua num volume através das forças
que atuam na superfície que contém este volume. Embora o contexto
que tenhamos aqui usado seja o da Eletrodinâmica, vamos discutir aqui
brevemente o mesmo conceito na Mecânica, onde seu significa físico fica
mais evidente 5 . 5
V. A. Ugarov, op. cit., pp. 383 – 386.
Se um corpo elástico é deformado, surgem nele forças que tendem a fazê-lo
retornar à sua configuração original. Estas forças internas são chamadas
de tensões e sua origem física são as interações entre os átomos/moléculas
que o compõem. Curiosamente estas forças são de origem eletromagnética
mas esqueçamos aqui sua origem e nos concentremos na teoria puramente
mecânica. Uma das características mais fundamentais destas forças e que
as diferenciam de outras é seu curto alcance, ou seja, elas só atuam em
dimensões microscópicas. A consequência importante disto é que, quando
estudamos as forças dentro de um certo volume V, estas forças volumétricas
se reduzem àquelas atuando na superfície que delimita o volume.
Suponhamos assim que uma força F atua num volume unitário dentro de
um corpo. Consideremos também um volume V e as forças totais que nele
atuam. Se o volume dV é atuado por uma força F dV, a força total atuando
sobre o volume vale, como bem sabemos
Z
F dV. (11.73)

Na média, as forças de interação entre os pequenos elementos de volume


que constituem o volume V se cancelam e apenas as forças superficiais
sobram. Isto implica que a expressão acima deve se reduzir a uma integral
de superfície. Em particular, se considerarmos a componente k da força F, a
integral de volume Z
Fk dV (11.74)

deve se transformar em uma integral de superfície. No entanto, isto só é


possível, segundo o teorema de Gauss-Ostragradsky
I Z I Z
∂Ak
A· d = ∇ · A dV → Ak nk dS = dV (11.75)
S V S V ∂xk

© s.r. dahmen 2022


178 uma introdução à teoria do espaço e do tempo

se Fk puder ser representada da forma

∂Tik
Fk = . (11.76)
∂xi
No teorema de Gauss-Ostragradsky nk representa a k-ésima componente da
normal n̂ ao elemento de superfície dS. Assim sendo temos
Z Z I
∂Tik
Fk dV = dV = Tik ni dS (11.77)
V V ∂xi S

Considerando agora a soma sobre todas as componentes multiplicadas pelos


respectivos versores êk temos
Z Z Z I
∂Tik
F dV = Fk êk dV = ê dV = Tik ni êk dS (11.78)
V V V ∂xi k S

Portanto concluimos: se a força F que atua num volume unitário puder ser
representada na forma
∂Tik
F= ê (11.79)
∂xi k
sua atuação no volume V pode ser representada na forma de forças superficiais
atuando sobre a superfície S que delimita o volume em questão, de tal modo que o
elemento de superfície dS cuja normal é n̂ = ni êi tem atuando sobre ele uma força
por unidade de área igual à
Tik ni êk . (11.80)
Discutamos o significado físico das componentes do tensor das tensões Tik .
Imaginemos um volume V sujeito à forças de deformação. A força que atua
sobre um elemento dS da superfície S que delimita o volume depende do
valor e da direção deste elemento, ou seja da direção da normal n̂ de dS.
Esta força pn dS não necessariamente tem a direção da normal (note que n
não é um índice que indica a componente do vetor). A figura abaixo ajuda a
esclarecer melhor a geometria das forças envolvidas. Como fica claro pelas

Figura 11.1: Tensão exercida sobre uma


pn dS z
área dS da superfície de um volume V. A
n grandeza pn representa a força por área
que atua sobre dS, cuja normal é n̂. Ao
C
calcular (lado direito da figura) conven-
dS n cionamos as normais como sendo exteri-
ores ao volume. No caso das faces BOC,
AOC e AOB as normais são −i, −j e −k,
B respectivamente. As áreas das faces BOC,
O y
AOC e AOB são dS cos(n, ci), dS cos(n,
cj)
e dS cos(n,
d k) onde cos(ab,) representa o
A cosseno do ângulo entre os vetores a e .

expressões, pn tem unidade de força por área. Como já mencionado, ele


depende da orientação da normal à superfície onde atua e é chamado, em
Mecânica, de tensão (stress). Cada ponto da superfície tem uma tensão à ela
associada. Sendo a tensão um vetor, a pergunta que se faz é o motivo de
definirmos um tensor. O ponto todo está no fato que qualquer vetor pn pode

© s.r. dahmen 2022


o tensor energia-momento e o tensor das tensões de maxwell 179

ser escrito como uma combinação das três tensões p x , py e pz que atuam
nas direções dos eixos ordenados x, y, z, ou seja, atuam em superfícies cujas
normais coincidem com os vetores unitários i, j e k. Notem que p x , py e pz
não são vetores que apontam nas respectivas direções ( x, y, z) mas vetores,
cada qual com 3 componentes, que atuam nas superfícies de normais i, j e
k. Podemos escrever portanto
px = p xx i + p xy j + p xz k
py = pyx i + pyy j + pyz k
pz = pzx i + pzy j + pzz k (11.81)
ou seja
pm = pmn ên (11.82)
O que vamos mostrar é que a tensão um elemento de superfície dS com
uma normal n̂ arbitrária pode ser descrito em função das 9 componentes
da tríade de vetores p x , py e pz . Olhando para o tetraedro OABC da figura
acima, a face inclinada tem área dS. Vamos ainda supor que a normal n̂ faz
um ângulo agudo com os eixos, como ilustrado. A área das faces paralelas
aos planos yz, xz e xy são dadas por:
dSyz = dS cos(n,
ci); dSxz = dS cos(n,
cj); dSxy = dS cos(n,
d k ).

bAs normais a estas superfícies tem as direções −i, −j e −k e portanto


as forças que sobre elas atuam valem

−p x dS cos(n,
ci); py dS cos(n,
cj); pz dS cos(n,
d k ); (11.84)

Numa situação de equilíbrio, as forças atuantes sobre o tetraedro se


cancelam, isto é

dS pn − p x cos(n, i) − py cos(n, j) − pz cos(n, k) = 0 (11.85)

de onde tiramos que

pn = p x cos(n,
ci) + py cos(n,
cj) + pz cos(n,
d k) (11.86)

Lembrando porém que pela definição do vetor normal unitário


z

n1 = n̂ · i =| n̂ | | i | cos(n,
ci) = cos(n,
ci)
p
zz
n2 = n̂ · j =| n̂ | | j | cos(n,
cj) = cos(n,
cj)
p
zy
n3 = n̂ · k =| n̂ | | k | cos(n,
d k) = cos(n,
d k ), (11.87) p
zx p
yz
p
xz
ficamos com p
yy
p
p n = p1 n1 + p2 n2 + p3 n3 (11.88) e
z p
xx
p
xy
yx

e também e
y
y
e
pm = pmn ên . (11.89) x

x
Disto concluímos que
pn = pij eˆj ni (11.90)
Figura 11.2: As tensões que atuam sobre
Fisicamente pij representa a componente j da tensão na direção i da nor- as faces que delimitam um volume. Cos-
tumamos chamar as tensões normais à
mal da superfície dS sobre a qual ela atua. A figura ao lado representa superfície de pressão, aquelas paralelas de
estes elementos. tensão de cisalhamento ou shear stress.

© s.r. dahmen 2022


12
Prolegômenos à Teoria da Gravitação:
sobre Einstein e Espaços Curvos

Imagine que queiramos achar a menor distância entre duas cidades:


Frankfurt na Alemanha e Tóquio no Japão. Fosse nosso planeta plano
(como muitos hoje querem ou fingem acreditar) e alguém nos dissesse
que a menor distância entre dois pontos é uma reta, esta pessoa cer-
tamente ficaria surpresa ao olhar um mapa mundi e verificar que a
menor distância – aquela seguida por aviões comerciais – é dada pela
linha verde na figura ao lado e não pela linha vermelha, esta sim uma
reta no mapa.
Porém nosso planeta tem uma superfície esférica e sobre ela (ou
a alguns quilômetros acima dela, como no caso dos aviões), a menor
distância entre dois pontos é dada por um grande círculo. Grandes
Figura 12.1: Trajetória típica do vôo LH-
círculos são círculos sobre a superfície cujos centros coincidem com 716 da empresã aérea alemã Lufthansa,
o centro da esfera – os meridianos que definem as longitudes são que liga as cidades de Frankfurt e Tóquio-
Haneda.
um exemplo, mas não os paralelos, exceção feita à linha do Equador.
Quando a topologia do espaço no qual estamos confinados não é
plana, alguns de nossos conceitos como “caminho mais curto” têm
que ser revistos: a geometria euclideana e a trigonometria plana, tão
importantes na aferição de distâncias, falham 1 . Porém, o que acontece 1
Obviamente para distâncias curtas sem-
quando não apenas uma linha ou uma superfície são curvas mas todo pre podemos desprezar a curvatura da
superfície, aproximando-a de um plano,
o espaço-tempo ao nosso redor também? E, sendo curvo, por que ele o algo que fazemos constantemente.
seria? Temos como saber o espaço onde vivemos realmente é curvo?
Como veremos, a gravidade é a resposta!
A idéia do espaço-tempo com curvatura entrou na Física através
da Teoria da Relatividade Geral de Einstein (TGR). Segundo ela, a
gravidade nada mais é que o efeito por nós observado da curvatura do
espaço-tempo devido à presença de massa e ou energia. Na TGR não
existe o conceito de força gravitacional, mas sim de de um espaço curvo.
O que chamamos de força gravitacional nada mais é que a maneira
como sentimos esta curvatura.
Embora a ideia seja fascinante (e experimentalmente comprovada!),
182 uma introdução à teoria do espaço e do tempo

surge um problema sério: vetores e operações sobre vetores perdem


todo o sentido pois vetores curvos não existem! Como então fazer
“física” num espaço curvo? A idéia é simples: os espaço da TGR é um
espaço Riemanniano ou, na linguagem de Riemman, uma variedade
(manifold) M. Diferente de um espaço n-dimensional qualquer, uma va-
riedade é um espaço n-dimensional que, nas proximidades de qualquer
um de seus pontos p ∈ M, ele pode ser aproximado por um espaço
plano n-dimensional, i.e. sem curvatura. Este espaço multidimensional
nas imediações do ponto p da nossa variedade, admite que nele vetores
existam, uma vez que é plano. Imaginemos como exemplo a superfície
da Terra: embora ela seja curva, nas nossas imediações – descontada
obviamente a topografia do terreno – tratamos a superfície como sendo
plana. A superfície de uma esfera S2 imersa no espaço tridimensional
R3 é um espaço Riemanniano (figura ao lado). Se imaginarmos um
vetor, ele não vive exatamente na superfície mas num plano tangente a
ela. Na escala humana raio da Terra é tão grande (o que é o mesmo que
dizer que a curvatura da superfície é tão pequena) que desprezamos a
esfericidade do nosso planeta..
Independente da existência de espaços planos locais, fica ainda a
questão: a curvatura do espaço deve em princípio se refletir sobre
Figura 12.2: A superfície esférica S2
toda a Física. Porém, não queremos modelar os fenômenos físicos de imersa no espaço tridimensional R3 . Esta
forma que as equações sejam diferentes para cada geometria subja- variedade Riemanniana pode ser aproxi-
cente. Precisamos desenvolver uma linguagem que nos permita fazer mada em todo ponto por um plano tan-
gente ao ponto. No limite em que os
física independente das propriedades da topologia do espaço onde os paralelogramos representados nesta
os fenômenos ocorrem: precisamos escrever as equações da Física de figura têm sua área tendendo a zero, eles
se tornam planos. Autor: H. Hinrichsen.
forma covariante, isto é, uma única equação para um dado fenômeno
que possa ser aplicada sempre, independente do espaço subjacente.
Nestas equações a curvatura do espaço deve estar obviamente codifi-
cada, de modo a recuperarmos as equações por nós conhecidas nos
casos por nós já estudados. A tarefa é equivalente à construção de
um meio de transporte terrestre motorizado: ele precisa de rodas, um
meio de propulsão, um sistema de direção, aceleração e frenamento,
alguns ítens de segurança. Todo o resto é acessório: o design pode
nos proporcional uma bicicleta, moto, automóvel, um ônibus, um trem.
O acabamento interno depende do nível de exigência com relação ao
conforto que queiramos ter ou proporcionar, e assim por diante. As
equações covariantes da física são o meio de transporte: elas são a
forma mais pura das equações e neste sentido, pela sua generalidade,
as mais elegantes.
Nosso objetivo neste capítulo é introduzir esta nova linguagem, para
assim adquirirmos familiaridade e um vocabulário mais adequado.
Este programa não se resume à redefinir uma trigonometria ou uma
distância em geometrias mais gerais: as Física fala a língua das equações
diferenciais e portanto o objetivo ulterior é o estabelecimento de uma

© s.r. dahmen 2022


prolegômenos à teoria da gravitação: sobre einstein e espaços curvos 183

geometria diferencial. Foi a geometria diferencial, isto é a elaboração de


um cálculo diferencial e integral em espaços curvos que semeou o solo
sobre o qual a Teoria da Relatividade pode ser plantada.
Como veremos adiante, o vocabulário da geometria diferencial e
algumas das idéias talvez nos pareçam excessivamente abstratas, mas
na verdade são conceitos familiares já vistos ao longo do curso de física
travestidos numa linguagem diferente. Por isso, para efeitos didáticos,
vamos nos restringir aqui a espaços planos mas com coordenadas curvilí-
neas, como por exemplo as coordenadas esféricas (r, θ, ϕ) no R3 . Isto
nos permite introduzir esta nova linguagem preservando ainda uma
visão geométrica que nos é familiar da geometria plana. Esta assim
chamada proto-linguagem pode então ser aplicada a qualquer sistema
de coordenadas ou a espaços curvos.

12.1 Os símbolos de Christoffel

Os símbolos de Christoffel são fundamentais quando estamos tentando


entender a geometria de espaços curvos. Vamos por este motivo, antes
de definí-los de maneira formal, tentar entender o que significam
exatamente num contexto mais conhecido.
Comecemos por uma motivação física: imagine que queiramos ver
como um campo vetorial varia no espaço, no caso um campo vetorial A
que varia ao longo de uma curva, como ilustrado na figura abaixo. Este
campo pode por exemplo representar a velocidade do vento numa re-
gião montanhosa. Normalmente quando queremos descrever a variação

Figura 12.3: Figura superior: a variação


do vetor A ao longo de uma curva em
função dos vetores cartesianos e x e ey . O
vetor A pode representar por exemplo
um campo de velocidade do vento so-
bre uma determinada topografia. Fonte:
Grøn e Næss.

do vetor ao longo de uma curva S que contém os pontos P e Q acima,


é importante termos em mente que a curva é parametrizada em termos
de uma variável λ, isto é x α = x a (λ). No caso mais simples possível de
um sistema de coordenadas cartesianas, temos que a diferença entre os
vetores A P e AQ

A P = A P x e x + A P y ey ; A Q = A Q x e x + A Q y ey , (12.1)

ou seja
(∆A) PQ = A P − AQ (12.2)

© s.r. dahmen 2022


184 uma introdução à teoria do espaço e do tempo

se torna, no limite de uma variação infinitesimal


dA d( A x e x ) d( Ay ey )
= + (12.3)
dλ dλ dλ
No caso do sistema cartesiano este resultado é trivial, pois os vetores
da base são constantes no espaço:
dA dA x de x dAy dey
= ex + Ax + ey + Ay
dλ dλ dλ dλ dλ
=0 =0
dA x dAy
= ex + ey (12.4)
dλ dλ
Porém, se temos um sistema de coordenadas curvas, não cartesianas, a
derivada total dA/dλ de um campo vetorial tem duas contribuições:
dA dAµ eµ dAµ deµ
= = eµ + Aµ . (12.5)
dλ dλ dλ dλ
var. das componentes var. da base

Em outras palavras, a variação de um campo vetorial nada mais é que


a derivada usual de um campo vetorial pela variação das coordena-
das (parametrizadas por λ que define uma curva) mais um termo de
correção que diz como as coordenadas mudam. Como calcular esta
mudança dos vetores da base? É justamente este o ponto onde a figura
de Christoffel entra: ele determinou a variação total de um vetor numa
linguagem que nos permite calcular a derivada acima independente da
curvatura do espaço ou da base de vetores por nós usada.
Tomemos o plano euclideano em duas dimensões mas onde, no
lugar dos tradicionais vetores unitários da base cartesiana e x e ey
introduzimos o conhecido sistema de coordenadas polares (r, θ ) como
na figura abaixo. Nosso objetivo aqui é entender como os vetores da
base mudam com a mudança de posição no plano.
Desenhamos os vetores radiais er e os tangenciais eθ nos pontos P, Figura 12.4: Elwin Bruno Christoffel
Q, R e S. Vamos considerar primeiro a mudança do vetor eθ quando (1829 – 1900).

mudamos sua posição.


Antes lembremos que a mudança da base e x , ey para a base er e eθ
é dada por

er = cos θe x + sin θey


eθ = −r sin θe x + r cos θey (12.6)

O vetor de base er é unitário, independente da sua posição. Já a


magnitude de eθ varia de acordo com a distância deste vetor à origem:
para um mesmo deslocamento angular ∆θ, o arco descrito é maior
quanto maior a distância à origem do eixo de coordenadas.
p
| er | = cos2 θ + sin2 θ = 1
p
|eθ | = r2 sin2 θ + r2 cos2 θ = r. (12.7)

© s.r. dahmen 2022


prolegômenos à teoria da gravitação: sobre einstein e espaços curvos 185

Figura 12.5: Vetores da base de coordena-


das polares (r, θ ) no plano. Fonte: Grøn
e Næss.

O vetor ∆θ eθ é obtido pela diferença entre o vetor eθ (S) e o vetor eθ ( P) q


como ilustra a figura ao lado. O arco de círculo L, segundo a definição
de ângulo em radianos, vale:

L = |eθ | ∆θ (12.8)

e como |eθ | = r temos


L = r∆θ (12.9)
como era esperado. No limite em que ∆θ → 0 podemos escrever a
expressão no infinitesimal dθ

d
eθ = |dθ eθ | = rdθ (12.10)

e como o vetor dθ eθ aponta na direção contrária so vetor er podemos


escrever
dθ eθ = −rdθ er (12.11)
Este resultado nos mostra que o vetor eθ (S) está conectado ao vetor
eθ ( P) através de um “vetor diferença” ou “vetor de conexão”

dθ eθ = eθ (S) − eθ ( P) (12.12)

As componentes deste vetor por unidade de comprimento na respectiva


Figura 12.6: Figura superior: a variação
direção são chamados de coeficientes de conexão (connection coefficients)
do vetor eθ devido a um deslocamento
e são, neste caso, denotados por Γr θθ e Γθ θθ : angular ∆θ. Figura inferior: a diferença
 r  θ do vetor eθ em duas posições diferentes
deθ ∂eθ ∂eθ do espaço. A variação é dada pela dife-
= er + eθ rença de vetores eθ (S) − eθ ( P) q, onde o
dθ ∂θ ∂θ
último representa o vetor eθ ( P) transpor-
= Γ rθθ er + Γ θθθ eθ (12.13) tado paralelamente a si mesmo do ponto
P ao ponto S. Fonte: Grøn e Næss.

© s.r. dahmen 2022


186 uma introdução à teoria do espaço e do tempo

onde definimos
 r  θ
∂eθ ∂eθ
Γ rθθ = ; Γ θ
θθ = (12.14)
∂θ ∂θ

Um certo cuidado aqui se faz necessário: os sobrescritos r e θ não indi-


cam potência mas a componente contravariante do vetor. Γ rθθ e Γ θθθ são
mais comumente conhecidos na Teoria da Relatividade como símbolos
de Christoffel e foram aqui calculados de forma puramente geométrica
numa geometria por nós conhecida. Porém sua definição, como vere-
mos abaixo, é geral e se aplicam a espaços curvos multidimensionais
e portanto mais abstratos. Antes porém é importante enfatizarmos
exatamente o significado da notação para que não nos confundamos
quando seu uso se fizer necessário. Em palavras podemos escrever:

θθ → 1º subíndice: qual vetor da base varia (eθ )


r
Γ θθ = 2º subíndice: o quê varia (coordenada θ).


r→ a componente do vetor (radial neste caso).

Os índices inferiores indicam qual vetor da base está sendo variado pela
mudança infinitesimal de qual coordenada. O índice superior indica a
componente do vetor em questão. No caso específico que acabamos de
estudar temos
Γ rθθ = −r ; Γ θθθ = 0 (12.15)

Definição: o símbolo de Christoffel Γνµα é a ν-ésima componente do


vetor que mede a variação, por unidade de comprimento, do vetor
da base eµ causado pela variação infinitesimal da coordenada x α .

Para melhor fixar o conceito, vamos agora calcular geometricamente


os outros símbolos de Christoffel. Uma vez que o vetor eθ varia com a
distância à origem do sistema de coordenadas, vejamos como ele varia
por um deslocamento infinitesimal dr. Para isso recorremos à figura ao
lado:
O vetor ∆r eθ representa a variação do vetor eθ quando deslocado
do ponto P ao ponto Q por uma distância ∆r. Pela semelhança de
triângulos representados na figura podemos ver que

| ∆r e θ | |e |
= θ (12.16) Figura 12.7: a variação do vetor eθ devido
∆r r
a um deslocamento radial infinitesimal
e portanto ∆r. Fonte: Grøn e Næss.
∆r
| ∆r e θ | = | e θ | . (12.17)
r
No limite ∆r → 0 obtemos
dr
| dr e θ | = | e θ | (12.18)
r

© s.r. dahmen 2022


prolegômenos à teoria da gravitação: sobre einstein e espaços curvos 187

e sendo que o vetor dr eθ aponta na mesma direção e sentido de eθ


podemos escrever
1
dr eθ = dreθ . (12.19)
r
Com estas equações e a definição dos símbolos de Christoffel fica fácil
ver que:
 r
r ∂eθ
Γ θr = =0
∂r
 θ
∂eθ 1
Γ θ
θr = = (12.20)
∂r r

Vamos agora repetir os cálculos para a variação infinitesimal do


vetor de base er . Como o vetor é unitário e não depende da distância à
origem do sistema de coordenadas, temos imediatamente que

∆r er = 0 (12.21)
Figura 12.8: a variação do vetor er devido
o que já nos dá diretamente que Γ rrr = Γ θrr = 0 pois se o vetor ∆r er é a um deslocamento radial infinitesimal
zero, suas componentes tem que ser zero. Vamos calcular a variação de ∆θ. O vetor er( P) é deslocado paralela-
er em função do deslocamento infinitesimal ∆θ (figura abaixo). mente a si mesmo até o ponto S, onde
temos er ( P) k. A variação é dada pela
O círculo de arco L e raio |er | = 1 vale, neste caso diferença er (S) − er ( P) k. A figura infe-
rior mostra a variação em maior detalhe.
L = |er |∆θ = ∆θ (12.22) Fonte: Grøn e Næss.

cujo valor, no limite infinitesimal ∆θ → 0 se reduz à

|dθ er | = dθ (12.23)

Pela figura vemos que o vetor dr er tem a mesma direção e sentido do


vetor eθ e portanto pode ser escrito em termos do versor êθ = (1/r ) eθ
como
1
dθ er = dθ êθ = dθ eθ (12.24)
r
Disto concluímos diretamente que
 r
∂er
Γ rrθ = =0
∂θ
 θ
∂er 1
Γ θ
rθ = = (12.25)
∂θ r

É importante enfatizarmos que os símbolos de Christoffel estão rela-


cionados às regras de mudança da base de vetores por variações das
coordenadas e não descrevem o espaço em si pois, como já pudemos
discorrer ao longo deste curso, uma coisa é o espaço e outra é a maneira
que o representamos: coordenadas são etiquetas que podemos mudar
à vontade. No caso mais geral possível de um sistema de coordenadas

© s.r. dahmen 2022


188 uma introdução à teoria do espaço e do tempo

x1 e x2 onde as curvas de coordenadas são realmente curvas (em nosso


caso apenas uma delas era curva), temos 8 símbolos de Christoffel

Γ 111 , Γ 112 , Γ 121 , Γ 122 ,


Γ 211 , Γ 212 , Γ 221 , Γ 222 . (12.26)

No espaço n-dimensional o número de símbolos de Christoffel é n3


mas, devido a certas propriedades de simetria, o número de Γ να que
µ

devemos efetivamente calcular é menor. Resumindo temos:

deθ = Γ rθr dr er + Γ θθr dr eθ + Γ rθθ dθ er + Γ θθθ dθ eθ , ,


der = Γ rrr dr er + Γ θrr dr eθ + Γ rrθ dθ er + Γ θrθ dθ eθ , .(12.27)

Usando a convenção de Einstein podemos escrever as expressões acima


de forma mais elegante:

deµ = Γ ν
µα dx α eν (12.28)

O procedimento adotado para calcular os símbolos de Christoffel é o


seguinte:

(1) escreva os vetores da nova base eµ em termos dos vetores da base


original em . No nosso caso (eθ , e ϕ ) em termos de (e x , ey ).

(2) calcule as derivadas dos vetores eµ como função das suas variáveis
naturais, no caso acima as derivadas de (eθ , e ϕ ) como função de
(θ, ϕ).

(3) O resultado do item [2] ainda está expresso em termos da base


em . Reescreva o resultado em termos da base eµ . Os coeficientes
que multiplicam os vetores da base são os símbolos de Christoffel
procurados.

12.1.1 Coordenadas esféricas


Um outro exemplo importante que nos ajuda a fixar melhor a idéia dos
símbolos de Christoffel é quando temos o caso de coordenadas esféricas.
Olhando para a figura abaixo onde representamos os vetores er , eθ e
e ϕ sabemos que as relações entre estas coordenadas e as coordenadas
cartesianas ( x, y, z) são dadas por

x = r sin θ cos ϕ ; y = r sin θ sin ϕ ; z = r cos θ . (12.29)

Precisamos calcular as variações dos respectivos vetores er , eθ e e ϕ com 2


Note que vetores da base se transfor-
mam de maneira covariante, em acordo
a variação das coordenadas (r, θ, φ). Para isto recorremos à coordenadas
com o que já foi discutido anteriormente.
cartesianas escrevendo 2 :

© s.r. dahmen 2022


prolegômenos à teoria da gravitação: sobre einstein e espaços curvos 189

Figura 12.9: Sistema de coordenadas es-


féricas com seus respectivos vetores nas
direções (r, θ, φ). Fonte: Grøn e Næss.

∂x ∂y ∂z
er = e x + ey + ez
∂r ∂r ∂r
∂x ∂y ∂z
eθ = e x + ey + ez
∂θ ∂θ ∂θ
∂x ∂y ∂z
eϕ = ex + ey + ez (12.30)
∂ϕ ∂ϕ ∂ϕ

ou


∂x m xm ∈ { x, y, z}
eµ = em com (12.31)
∂x µ xµ ∈ {r, θ, φ}

Aplicando as definições temos

er = sin θ cos ϕ e x + sin θ sin ϕ ey + cos θ ez ,


eθ = r (cos θ cos ϕ e x + cos θ sin ϕ ey − sin θ ez ) ,
eϕ = r (− sin θ sin ϕ e x + sin θ cos ϕ ey ) . (12.32)

Queremos ver como estes vetores da base variam quando variamos r, θ


e φ . Por isso derivamos mais uma vez a expressão acima nas variáveis
(r, θ, φ) temos 3 3
A vantagem de usar a base cartesiana
aqui fica clara pois os versores e x , ey e ez
não mudam com a posição no espaço!
© s.r. dahmen 2022
190 uma introdução à teoria do espaço e do tempo

der = (cos θ cos ϕ e x + cos θ sin ϕ ey − sin θ ez ) dθ


+(− sin θ sin ϕ e x + sin θ cos ϕ ey ) dϕ

deθ = (cos θ cos ϕ e x + cos θ sin ϕ ey − sin θ ez ) dr


+(−r sin θ cos ϕ e x − r sin θ sin ϕ ey − r cos θ ey ) dθ
+(−r cos θ sin ϕ e x + r cos θ cos ϕ ey ) dϕ ,

de ϕ = (− sin θ sin ϕ e x + sin θ cos ϕ ey ) dr


+(−r cos θ sin ϕ e x + r cos θ cos ϕ ey ) dθ
−(r sin θ cos ϕ e x + r sin θ sin ϕ ey ) dϕ . (12.33)

Para calcular os símbolos de Christoffel precisamos expressar estas va-


riações em função dos vetores er , eθ e e ϕ , ou seja, precisamos expressar
(e x , ey , ez ) como função de (er , eθ , e ϕ ) invertendo a equação (12.30).
Com um pouco de manipulação algébrica é possível chegar à

1 1
der = dθ eθ + dϕ e ϕ
r r
Γ θrθ dθ eθ + Γ rϕ dϕ e ϕ
ϕ
=

1 cos θ
deθ = dr eθ − r dθ er + dϕ e ϕ
r sin θ
Γθθr dr eθ + Γrθθ dθ er + Γ θ ϕ dϕ e ϕ
ϕ
=

1 cos θ
de ϕ = dr e ϕ + dθ e ϕ − r sin2 θ dϕ er
r sin θ
− sin θ cos θ dϕ eθ
= Γ dre ϕ + Γ dθ e ϕ + Γ rφϕ dϕ er + Γ
ϕ ϕ θ
ϕr ϕθ ϕϕ dϕ eθ
(12.34)

Estas expressões nos dão diretamente os símbolos de Christoffel para


coordenadas esféricas:
1 1
Γ Γ Γ rrr = 0
θ ϕ
rθ = , rϕ , =
r r
1 cos θ
Γ rθθ Γ θθr = , Γ θϕ =
ϕ
= −r ,
r sin θ
1 cos θ r
Γ Γ ϕθ = Γ φϕ = −r sin2 θ ,
ϕ ϕ
ϕr = , ,
r sin θ
Γ θ
ϕϕ = − sin θ cos θ . (12.35)

12.1.2 Simetria dos símbolos de Christoffel


Como pudemos perceber, calcular os símbolos de Christoffel envolvem
bastante trabalho. Porém, os símbolos de Christoffel possuem simetrias

© s.r. dahmen 2022


prolegômenos à teoria da gravitação: sobre einstein e espaços curvos 191

que por vezes nos servem de atalho. Quando partimos de uma base
em onde m = ( x, y, z) por exemplo, e queremos chegar numa base eµ ,
onde µ = (r, θ, ϕ) sabemos que a relação entre os vetores de uma base
e outra é dada pela expressão

∂x m
eµ = em (12.36)
∂x µ
Esta foi a equação que usamos acima para expressar a base (er , eθ , e ϕ )
em função da base (e x , ey , ez ). Por outro lado a derivada total de um
campo vetorial é semelhante em sua forma à derivada total de um
campo escalar

∂eµ α
deµ = dx
∂x α  
∂  m
 ∂x em  dx α

= α µ
∂x  ∂x 
=eµ

∂2 x m
= dx α em (12.37)
∂x α ∂x ν
Mas pela definição (12.28) dos símbolos de Christoffel temos

∂eµ
=Γ ν
µα eν (12.38)
∂x α
Comparando as duas expressões temos

∂2 x m
eν Γ ν
µα = em (12.39)
∂x α ∂x ν
Como ∂α ∂ν = ∂ν ∂α temos que

Γ ν
µα = Γ ναµ (12.40)

isto é, os símbolos de Christoffel são simétricos por troca de índices.

Resumindo: embora os símbolos de Christoffel possam parecer algo


extremamente abstrato, eles nada mais são que a medida da variação
dos vetores de uma base quando nos movemos pelo espaço. No caso
de coordenadas cartesianas estes símbolos são iguais a zero, pois não
só e x = ı̂ mas também ey = ̂ e ez = k̂ não dependem da coordenada
( x, y, z). Eles apontam sempre para a mesma direção do espaço e
tem magnitude 1. Já para coordenadas curvilíneas, mesmo sendo o
espaço plano, os vetores da base dependem em direção e magnitude da
coordenada do ponto onde se encontram. O caso mais simples é o de
coordenadas polares (r, θ ) no R2 , pois embora er tenha sempre a mesma
magnitude 1 em qualquer ponto do espaço, sua direção muda com o
ângulo θ. Já o vetor eθ não apenas muda em magnitude (linearmente

© s.r. dahmen 2022


192 uma introdução à teoria do espaço e do tempo

em r) como muda também de direção quando nos movemos no espaço.


Portanto, quando dois vetores representando uma mesma grandeza
física (a velocidade por exemplo) é comparado em diferentes pontos
do espaço, devemos levar em consideração que estes vetores podem
ser diferentes devido à variações intrínsecas de magnitude e direção,
mas também que mesmo que estas suas propriedades não variem, os
vetores da base eµ podem ter mudado. Neste caso a representação do
vetor muda.

12.2 Derivadas covariantes

Muitas vezes nos perguntamos se é necessário toda esta matemática


para entendermos a Relatividade Geral: a resposta é sim, sem qualquer
sombra de dúvida. Não é muito difícil entender isto: pela Relatividade
Geral massa e energia curvam o espaço. Portanto, toda as leis da física
conhecidas por nós e desenvolvidas num espaço plano são aproxima-
ções, mas aproximações que funcionam muito bem. A curvatura do
espaço não se faz sentir numa escala do nosso dia-a-dia os campos
gravitacionais aos quais estamos sujeitos são comparativamente fracos.
Neste regime podemos aplicar a gravitação de Newton sem maiores
preocupações, desprezando os efeitos da curvatura do espaço. Toda a
Física por nós estudada até o momento – incluindo aí a Relatividade
Restrita – se passa num espaço plano, embora a métrica na TER não seja
euclideana mas pseudo-euclideana. Nos exemplos discutidos acima es-
tamos ainda lidando com espaços planos por uma questão de simplicidade
e para que melhor fixemos os conceitos com exemplos que nos são familiares.
Notem que nosso espaço não é curvo, apenas o sistema de coordenadas
por nós escolhido. Mas, do ponto de vista metodológico, as definições
aqui apresentadas são gerais e podem ser aplicadas a espaços curvos.
Há situações porém em que a curvatura se faz notar e neste caso
temos que formular as leis da física em uma roupagem um pouco
diferente, mais adequada aos nossos propósitos: numa linguagem de
cálculo diferencial e integral que se aplique a espaços curvos. A área
da matemática que se ocupa do cálculo em espaços curvos é conhecida
como geometria diferencial. A isto tudo soma-se uma dificuldade: a qua-
dridimensionalidade do espaço. Temos naturalmente uma dificuldade
grande, para não dizer impossível, de visualizar espaços multidimen-
sionais e aqui não estamos falando de multidimensionalidade, por
exemplo, de um espaço de fases da mecânica estatística, mas sim da
multidimensionalidade do espaço-tempo físico no qual vivemos. Se
este espaço é, além do mais, curvo, nossa intuição pouco nos ajuda.
Por isso na grande maioria da vezes os resultados e métodos emprega-
dos na Relatividade Geral se nos parecem abstratos. Porém, devemos
encará-los como generalizações de idéias por nós conhecidas, mas ape-

© s.r. dahmen 2022


prolegômenos à teoria da gravitação: sobre einstein e espaços curvos 193

nas reformuladas numa linguagem à qual não estamos acostumados.


Quando queremos ver como um campo vetorial varia no espaço temos
que levar em conta que não apenas o vetor pode variar como também
os vetores da base na qual ele é expresso. Retomemos então o caso do
vetor A discutido na seção 12.1. Chegamos na discussão à equação da
variação de A com duas contribuições:
dA dAµ eµ dAµ deµ
= = eµ + Aµ (12.41)
dλ dλ dλ dλ
var. das componentes var. da base

Isto define a derivada covariante direcional que, em outras palavras,


nada mais é que a derivada total de um campo vetorial pela variação
das coordenadas (parametrizadas por λ que define uma curva) mais
um termo de correção que diz como as coordenadas mudam. Como
mostramos na seção anterior, a derivada dos vetores da base pode ser
escrita como
deµ dx α
= Γ νµα eν (12.42)
dλ dλ
Podemos assim escrever a expressão acima como
dA dAµ ν dx
α
= eµ + Aµ Γ µα eν (12.43)
dλ dλ dλ
α
O que representa a grandeza dx dλ na expressão acima? Sabemos que
quando derivamos um escalar f ao longo da direção de um vetor
u = uν eν , ou seja calculamos a derivada direcional de f , podemos
escrever
df df
= uν ν (12.44)
dλ dx
que, em linguagem mais tradicional nada mais é que o produto escalar
do gradiente de f na direção do vetor u
df
=∇f·u (12.45)

α
Portanto o termo dx α
dλ = u define a componente α do vetor tangente à
curva. Usando este resultado em (12.43) podemos escrever
dA dAµ
= eµ + Aµ Γ ν
µα u
α
eν (12.46)
dλ dλ
Se já não bastasse esta expressão, os livros da área reescrevem-na de
modo um pouco diferente. Notando que
dAµ dAµ ∂x ν dAµ ν
= = u (12.47)
dλ ∂x ν dλ ∂x ν
escrevemos, finalmente
dA d Aµ ν
= u eµ + Aµ Γ νµα uα eν
dλ dx ν
A ,ν uν eµ + Aµ Γ νµα uα eν .
µ
= (12.48)

© s.r. dahmen 2022


194 uma introdução à teoria do espaço e do tempo

Nesta expressão estamos usando obviamente a notação de Einstein


onde índices repetidos são somados. Notamos porém que os vetores
da base aparecem nos dois termos do lado direito da equação. Uma
vez que os índices são mudos, podemos no 2º termo do lado direito
trocar ν → µ para que assim o vetor de base possa ser colocado em
evidência, e fazer simultaneamente a troca µ → α e α → ν. Isto nos
permite escrever a expressão acima de forma mais compacta:
dA  
= A ,ν + Aα Γ
µ µ
αν uν eµ (12.49)

Não bastasse isto, Einstein resolveu introduzir uma notação para o
termo entre parênteses

+ Aα Γ
µ µ µ
A ;ν =A ,ν αν (12.50)

e portanto
dA µ
= A ;ν uν eµ (12.51)

Ficamos assim com
dA
 dλ→ derivada direcional covariante do vetor A ao longo da curva
parametrizada por λ.
µ
 A ;ν → derivada covariante da componente Aµ do vetor A.
µ
 A ;ν uν → derivada covariante direcional da componente Aν do
vetor A na direção do vetor u = uν eν tangenta à curva λ

E durma-se com um barulho destes.

12.2.1 Qual o objetivo de tudo isto?


Vamos pensar em termos uma metáfora: imagine que você é chamado
para julgar um campeonato de patinação artística no gelo. Os atletas
ganham pontos por cada elemento obrigatório que completam, piruetas
e saltos específicos que são conhecidos por nomes como toe loop, Axel,
Salchow, Lutz, e assim por diante. Cada um deste movimentos tem re-
gras muito bem definidas sobre a maneira como são realizados. Porém,
ao chegar ao rink de patinação você descobre que não apenas as paredes
se movem mas também o gelo se deforma, afundando aqui e subindo
ali. Isto dificulta sobremaneira sua avaliação pois você conhece os saltos
num rink plano e estático, o que te permite visualizar claramente se
os saltos foram tecnicamente perfeitos. Os movimentos dos atletas
são os vetores A e você, como árbitro, observa as componentes destes
movimentos (para cima, para o lado) em relação a este rink móvel, que
corresponde assim à variabilidade dos vetores da base. O que você
aprende com Christoffel é descrever a “dança” de cada atleta indepen-
dente de como o rink se configura, isto é, ao trocar a “vírgula” (uma

© s.r. dahmen 2022


prolegômenos à teoria da gravitação: sobre einstein e espaços curvos 195

derivada simples) por “ponto-e-vírgula” (uma derivada covariante)


você obtém uma descrição covariante da dança: as componentes que
você descreve são independentes da geometria do seu rink 4 . 4
Se alguém tiver uma metáfora melhor
Do ponto de vista prático, a beleza deste formalismo está na maneira por favor compartilhe comigo que terei o
prazer em dar o crédito!
sintética através da qual as expressões podem ser escritas. Isto nos
permite manipular as fórmulas de maneira mais rápida quando se está
familiarizado com a ginástica de índices 5 . Isso não significa que seja 5
O termo index gymnastics foi introduzido
por Misner, Wheeler e Thorpe em seu
fácil “abrir” as contas na hora que precisamos delas. Mesmo no caso
livro clássico, o Gravitation.
bidimensional mais simples, a equação (12.48) contém 12 termos
dA ∂A1 dx1 dx1
= e1 + A1 Γ 111 e
dλ 1
∂x dλ dλ 1
dx1 ∂A1 dx2
+ A2 Γ 112 e1 + e1
dλ ∂x2 dλ
dx2 dx2
+ A1 Γ 112 e1 + A2 Γ 122 e
dλ dλ 1
∂A2 dx1 dx1
+ 1 e2 + A1 Γ 211 e2
∂x dλ dλ
dx1 ∂A2 dx2
+ A2 Γ 221 e2 + e2
dλ ∂x2 dλ
dx2 dx2
+ A1 Γ 212 e2 + A2 Γ 222 e2 (12.52)
dλ dλ
Em 3-d há 36 termos, em 4-d um total de 80. De um modo geral temos
para n dimensões n2 (n + 1) termos. A interpretação geométrica da
expressão A ;ν uν = ∑3ν=1 A ;ν uν é a seguinte: ele nos dá a compo-
µ µ

nente µ da variação do vetor A quando fazemos um deslocamento


infinitesimal na direção da curva. Como dissemos a vantagem deste
formalismo é quando estamos estudando derivadas de funções (velo-
cidades, acelerações) em espaços mais gerais. Porém este formalismo
contém em si resultados por nós conhecidos mas que evidentemente
estudamos usando uma roupagem diferente. Vamos ver um exemplo
onde este é o caso.

A aceleração em coordenadas curvilíneas. De novo temos aqui um plano


descrito pelas coordenadas polares (r, θ ). Nestas variáveis, a velocidade
v de uma partícula pode ser escrita em termos de suas componentes
na forma:
dr dθ
v= er + e (12.53)
dt dt θ
Nosso objetivo é calcular a aceleração
dv
a= (12.54)
dt
em coordenadas polares. Para isto vamos usar a expressão (12.48)
trocando índices gregos por latinos por uma questão de familiaridade
dA dAk k
= e +Γ Ai u j e k (12.55)
dλ dλ k ij

© s.r. dahmen 2022


196 uma introdução à teoria do espaço e do tempo

No nosso caso A = v e λ = t. Com esta substituição a expressão acima


fica:
a = (v̇k + Γ kij vi v j ) ek (12.56)

Em coordenadas plano-polares há apenas 3 símbolos de Christoffel


diferentes de zero: Γ rθθ e Γ θrθ = Γ θθr . Ficamos assim com a expressão
 
a = r̈ + Γ rθθ θ̇ θ̇ er + r θ̈ + 2Γ
 θ
rθ θ̇ ṙ eθ . (12.57)

Sendo Γ rθθ = −r e Γ θ
= 1/r a expressão acima se torna

 
2 2
a = (r̈ − r θ̇ ) er + θ̈ + θ̇ ṙ eθ
r


= (r̈ − r θ̇ 2 ) er + (r θ̈ + 2 θ̇ ṙ )
r
= (r̈ − r θ̇ 2 ) r̂ + (r θ̈ + 2 θ̇ ṙ ) θ̂ (12.58)

Este resultado, que nos livros de mecânica é deduzido de outra forma,


mostra como o formalismo covariante permite estudarmos a variação
de qualquer vetor quando os vetores da base também variam. Usa-
mos também a notação mais usual dos versores por uma questão de
familiaridade.

12.3 Física em nova roupagem

O que acabamos de ver foi como conceitos por nós conhecidos precisam
ser reformulados numa linguagem mais apropriada quando precisamos
aplicar estes conceitos em espaços mais gerais. Vamos agora tentar
nos ater um pouco a Física propriamente dita e ver como podemos
também expressar uma física por nós conhecida em termos desta nova
linguagem. Quando queremos descrever o movimento de um partícula
podemos escolher coordenadas cartesianas x, y e y com

ds2 = dx2 + dy2 + dz2 , (12.59)

coordendas cilíndricas ρ, ϕ e z com

ds2 = dρ2 + ρ2 dϕ2 + dz2 , (12.60)

ou coordenadas esféricas r, θ e ϕ para os quais a mesma distância vale

ds2 = dr2 + r2 dθ 2 + r2 sin2 θdϕ2 . (12.61)

De um modo geral, o deslocamento ds2 pode ser escrito sempre como


uma função quadrática das diferenciais das coordenadas

ds2 = gαβ ( x ν )dx α dx β ; α, β, ν = 1, 2, 3. (12.62)

© s.r. dahmen 2022


prolegômenos à teoria da gravitação: sobre einstein e espaços curvos 197

Esta é a chamada forma métrica fundamental. Nos casos mais gerais o


tensor métrico gαβ pode depender das coordenadas x ν . Nos exemplos
acima, não aparecem termos cruzados do tipo dθdϕ ou dzdρ. Neste
caso a matriz que representa gαβ é diagonal e a métrica é dita ortogonal
(os vetores da base são perpendiculares entre si). O que é importante
nesta forma é que o quadrado da velocidade vale
 2
2 ds dx α dx β
v = = gαβ (12.63)
dt dt dt
e portanto podemos usá-lo para construir o Lagrangiano de uma partí-
cula livre. Apenas como exemplo, tomemos a velocidade no caso de
coordenadas esféricas. Temos
 
1 0 0
gαβ = 0 r2 0  (12.64)
 
2 2
0 0 r sin θ
e portanto
dr dr dθ dθ dϕ dϕ
v2 = grr + gθθ + g ϕϕ
dt dt dt dt dt dt
= ṙ2 + r2 θ̇ 2 + r2 sin2 θ ϕ̇2 (12.65)

O Lagrangiano de uma partícula livre pode ser escrito nesta caso como
1 2 m
L= mv = gαβ ẋ α ẋ β (12.66)
2 2
As equações de Lagrange do segundo tipo são, como sabemos
d ∂L ∂L
− ν =0 (12.67)
dt ∂ ẋ ν ∂x
Fazendo as derivadas temos
∂L ∂L m
= m gαν ẋ α , = L ,ν = gαβ ,ν ẋ α ẋ β (12.68)
∂ ẋ ν ∂x ν 2
É importante ver como obtivemos o primeiro termo da equação acima
pois muitas vezes nos esquecemos da convenção de Einstein e deixa-
mos uma das derivadas de lado. Vamos assim escrever a somatória
explicitamente:
∂L ∂ m 
∂ ẋ ν
= ∑
∂ ẋ ν α,β 2
g αβ ẋ α β

 α β
m ∂ ẋ β α ∂ ẋ
2 ∑
= g αβ ẋ + ẋ
α,β
∂ ẋ ν d ẋ ν
 
m
2 ∑
α β β α
= g αβ ν δ ẋ + δ ν ẋ
α,β
m m
=
2 ∑ gνβ ẋ β + 2 ∑ gαν ẋα (12.69)
β α

© s.r. dahmen 2022


198 uma introdução à teoria do espaço e do tempo

Como os índices α e β das somatórias são mudos e gνβ = g βν podemos


simplesmente substituit na primeira somatória β → α e escrever
m m m m
2 ∑ gνβ ẋ β + 2 ∑ gαν ẋα =
2 ∑ gαν ẋα + 2 ∑ gαν ẋ α
β α α α
m
= 2
2 ∑ gαν ẋ α
α
= m gαν ẋ α (12.70)
 
d ∂L
Falta agora calcularmos a derivada temporal dt ∂ ẋ ν . Temos
 
d ∂L d
= m ( gαν ẋ α )
dt ∂ ẋ ν dt
dgαν α d ẋ α
= m ẋ + m gαν
dt dt
∂gαν dx α β
= m ẋ + m gαν ẍ α
∂x β dt
= m gαν ,β ẋ β ẋ α + m gαν ẍ α
(12.71)

Substituindo estes resultados na equação de Lagrange do segundo tipo


e dividindo tudo pela massa m temos

1
gαν ẍ α + gαν ,β ẋ α ẋ β − gαβ ,ν ẋ α ẋ β = 0 (12.72)
2
Podemos escrever o segundo termo do lado esquerdo da equação acima
de forma mais simétrica
1 
gαν ,β ẋ α ẋ β = g + gβν ,α ẋ α ẋ β (12.73)
2 αν ,β
que substituido em (12.74) nos dá

1 
gαν ẍ α + gαν ,β + g βν ,α − gαβ ,ν ẋ α ẋ β = 0 (12.74)
2
Finalmente um último passo: vamos multiplicar toda a expressão acima
por gµν e somar sobre a variável ν. Obtemos

1 µν 
gµν gαν ẍ α + g gαν ,β + g βν ,α − gαβ ,ν ẋ α ẋ β = 0
2
µ
δα 6
Embora não seja difícil provar este re-
1  sultado, ele é deveras trabalhoso. Uma
ẍ + gµν gαν ,β + g βν ,α − gαβ ,ν ẋ α ẋ β
µ
= 0 (12.75) dedução bastante acessível é aquela do
2
livro de Grøn e Næss, Eintein’s Theory: A
Porém, o termo do meio na verdade nada mais é do que o símbolo de Rigorous Introduction for the Mathematically
Untrained, Springer, New York, 2011, pp.
Christoffel escrito em termos da métrica do espaço 6 156 – 158..

1 µν
gαν ,β + g βν ,α − gαβ ,ν ≡ Γ
 µ
g (12.76)
2 αβ

© s.r. dahmen 2022


prolegômenos à teoria da gravitação: sobre einstein e espaços curvos 199

de modo que a expressão acima pode ser escrita como

ẍ µ + Γ
µ
αβ ẋ α ẋ β = 0 (12.77)

Esta é a equação de movimento de uma partícula livre escrita em


forma covariante. Ela se aplica em qualquer sistema de coordenadas
e em espaços de qualquer curvatura, pois a métrica fundamental gµν
está codificada na forma dos símbolos de Christoffel.

Podemos simplesmente obter as equações de movimento de uma partí-


cula livre colocando os símbolos de Christoffel na equação acima. Na
prática o que se faz na verdade é exatamente o contrário: na maior
parte das situações se escreve as equações de movimento partindo da
equação de Lagrange e dela lemos diretamente os símbolos de Chris-
toffel, pois este procedimento é mais simples. Por exemplo no caso de
uma partícula livre cuja velocidade é expressa em coordenadas esféricas
temos
m 2 
L= ṙ + r2 θ̇ 2 + r2 sin2 θ ϕ̇2 (12.78)
2
A partir desta Lagrangeana obtemos o seguinte conjunto de equações
de movimento:

r̈ − r θ̇ 2 − r sin2 θ ϕ̇2 = 0
2
θ̈ + ṙ θ̇ − sin θ cos θ ϕ̇2 = 0
r
2
ϕ̈ + ṙ ϕ̇ + 2 cot θ ϕ̇ θ̇ = 0 (12.79)
r
de onde, comparando com a equação (12.77) podemos obter direta-
mente os símbolos de Christoffel por nós calculados na equação (12.35).

© s.r. dahmen 2022


13
Em busca de uma teoria relativística da gravidade

Nosso objetivo neste capítulo é introduzir a Teoria Geral da Relatividade


(TGR) de Einstein que não é outra coisa senão a teoria da gravitação
que substitui a teoria da gravitação de Newton. Embora relativística,
ela é chamada entre os especialistas de teoria clássica da gravitação em
contraposição à teoria quântica da gravitação (quantum gravity).
A TGR surgiu da busca de Einstein em tentar generalizar sua TER 1
No original: “Ich saß auf meinem Ses-
sel im Berner Patentamt, als mir plötz-
para incluir o efeito de referenciais acelerados. Foi em relação a isto que
lich folgender Gedanke kam: Wenn sich
Einsten disse – numa fala bastante citada durante uma palestra em 1922 eine Person im freien Fall befindet, dann
na Universidade de Kyoto, no Japão – que buscando esta generalização spürt sie ihr eigenes Gewicht nicht. Ich
war verblüfft. Dieser einfache Gedanke
ele teve a ideia mais feliz de sua vida. Nas palavras de Einstein 1 machte auf mich einen tiefen Eindruck.
Er trieb mich in Richtung einer Theorie
Estava eu sentado na minha poltrona no Escritório de Patentes de Berna quando, der Gravitation ... daß alle natürlichen
repentinamente, me veio a seguinte ideia: quando uma pessoa está em queda Phänomene mit Ausnahme des Gravitati-
livre, ele não sente o próprio peso. Fiquei pasmo. Esta ideia simples me deixou onsgesetzes in den Begriffen der speziel-
profundamente impressionado e me colocou na direção correta de uma teoria len Relativitätstheorie dargestellt werden
konnten. Ich verspürte eine tiefe Sehnsu-
da gravitação ... que todo fenômeno natural, com exceção da Lei da Gravidade,
cht, den Grund dafür zu erkennen ... Für
poderia ser representado pelos conceitos da teoria da relatividade especial. Senti einen Beobachter, der sich im freien Fall
uma vontade profunda de entender o porquê. Para um observador que cai do vom Dach eines Hauses befindet, exis-
telhado de uma casa não existe – ao menos em suas imediações – um campo tiert — zumindest in seiner unmittelba-
gravitacional. Quando neste caso o observador deixa que outros objetos caiam ren Umgebung -– kein Gravitationsfeld.
Wenn nämlich der fallende Beobachter
com ele, então em relação a ele estes objetos se encontram em repouso ou num
einige andere Körper fallen läßt, dann
movimento uniforme. Deste modo, a comprovação experimental da independência befinden sie sich im Bezug auf ihn im
da aceleração da gravidade é um forte argumento para o fato que o postulado da Zustand der Ruhe oder gleichförmigen
Relatividade pode também ser estendido para sistemas de coordenadas que não se Bewegung. So ist die experimentell na-
movam uniformemente um em relação ao outro. chgewiesene Unabhängigkeit der Fallbes-
chleunigung ein starkes Argument für
A ideia central da TGR é que o espaço-tempo não necessariamente die Tatsache, daß das Relativitätspostu-
lat auch auf Koordinatensysteme ausge-
é plano como na TER mas pode ter uma curvatura, curvatura esta dehnt werden muß, die sich zueinander
que induziria os mesmos efeitos que corpos em movimento sentem na in nicht gleichförmiger Bewegung befin-
den.”
presença da gravitação de Newton no espaço plano. Esta idéia pode
ser visualizada na figura abaixo. O lado esquerdo da figura mostra
duas partículas em repouso, dada uma condição inicial representada
pela linha vermelha pontilhada. Como as duas partículas estão em
repouso, suas linhas-de-mundo são retas paralelas ao eixo x0 = ct, de
tal maneira que a distância entre elas permanece constante. Na figura
202 uma introdução à teoria do espaço e do tempo

Figura 13.1: A gravitação como con-


sequência da curvatura do espaço. Autor:
H. Hinrichsen.

da direita a superfície esférica bidimensional representa um espaço


curvo, onde a longitude ϕ representa a coordenada espacial e a latitude
θ a coordenada temporal 2 . Duas partículas em repouso numa posição 2
Esta imagem é apenas ilustrativa pois
inicial no equador da esfera manterão sua coordenada espacial, ou seja obviamente não sabemos de antemão a
curvatura do espaço-tempo.
sua longitude não mudará e portanto suas linhas de mundo convergem
para o norte da esfera. Portanto, a medida que o tempo passa elas se
aproximam uma da outra e colidem no pólo norte. Isto significa que a
distância entre elas diminui com o tempo. Isto significa também que a
curvatura do espaço gera uma atração aparente entre as duas.
Se aceitarmos assim que a curvatura do espaço pode ser interpretada
como uma força gravitacional, é preciso entender o que causa esta
curvatura. Da mesma maneira que no Eletromagnetismo as cargas
são as fontes do campo eletromagnético e interagem via campos, na
gravitação a massa e a energia das partículas são os entes responsáveis
pelos efeitos gravitacionais. Portanto a TGR é baseada em 2 hipóteses:

 O conceito Newtoniano de força é abandonado. Não existe força: as


partículas são livres e se movem em linha “reta” no espaço curvo.

 A curvatura do espaço é causada pelo massa e energia dos objetos


nele contidos.

Consequentemente a TGR é baseada em 2 equações que “traduzem”


estes dois pilares em uma linguagem matemática:

 A equação da geodésica nos diz o que são “retas” num espaço curvo,
ou seja, a menor distância entre dois pontos;

 As famosas equações de campo de Einstein (Einstein field equations) que


nos dizem como a massa e a energia geram a curvatura do espaço.

A complexidade das equações de campo de Einstein e da equação da


geodésica vem justamente do fato que elas são equações fortemente
acopladas pois o movimento da partícula muda a distribuição de massa
e energia e portanto afeta sua própria trajetória!

© s.r. dahmen 2022


em busca de uma teoria relativística da gravidade 203

E como fica a teoria de Newton se hoje entendemos que a força


gravitacional não existe, o que existe é a curvatura do espaço? Há uma
certa ironia na história pois Newton obviamente não tinha como saber
que o espaço-tempo era curvo e criou o conceito de força-a-distância
que simula o efeito da curvatura em ordens de expansão mais baixa
(dado um ponto sobre uma superfície curva, é possível aproximar a
superfície por um plano tangente ao ponto).

13.1 Revisitando espaços curvos

Na nossa discussão do capítulo anterior sobre espaços curvos evita-


mos falar de espaços verdadeiramente curvos e nos concentramos em
sistemas de coordenadas curvas em espaços planos. Fizemos isto por
uma questão didática para que os novos conceitos, como símbolos de
Christoffel, pudessem ser formulados na sua generalidade e numa
linguagem apropriada mas ainda sim exemplificados em situações por
nós conhecidas e para as quais nossa intuição geométrica nos ajuda.
Recapitulemos o que foi discutido. Para isto vamos tomar o espaço
plano R2 e dois pontos A e B cuja distância queremos calcular. Sendo o
espaço plano, é fácil aplicarmos o teorema de Pitágoras, que em nossa
nova linguagem pode ser escrita como

∆s2 = gij ∆xi ∆x j (13.1)


!
1 0
onde ∆xi = xiB − xiB e gij = = δij é a conhecida métrica
0 1
Euclideana.

Figura 13.2: O espaço Euclideano R2 re-


presentado em termos de coordenadas
cartesianas ( x, y) e coordenadas polares
(r, ϕ). Autor: H. Hinrichsen.

O cálculo da distância em coordenadas polares é um pouco mais


difícil que no caso de coordenadas cartesianas, mas algebricamente
ainda podemos calcular esta distância pois conhecemos as relações

x1 = r cos ϕ, x2 = r sin ϕ (13.2)

© s.r. dahmen 2022


204 uma introdução à teoria do espaço e do tempo

de tal modo que se aplicarmos substituirmos os valores das coordena-


das dos pontos A e B em termos das variáveis r A , r B , ϕ a , ϕ B temos

∆s2 = ( x B − x A )2 + (y B − y A )2 = r2A + r2B − 2r A r B cos( ϕ B − ϕ A )

na qual reconhecemos a lei dos cossenos aplicada ao triângulo cujos


lados são os segmentos OA = r A , OB = r B e AB. Mas seria possível
escrever esta distância em termos de r, ϕ usando a forma métrica
fundamental (13.1)? A resposta é não: a forma métrica fundamental
é uma forma bilinear, o que implica que a distância pode ser escrita
como uma equação quadrática nas diferenças entre coordenadas. A
expressão que acabamos de deduzir envolve uma função não linear da
diferença de coordenadas: cos( ϕ B − ϕ A ). De um modo geral isto ocorre
também em espaços curvos: na maioria das situações é impossível
expressar as distâncias em termos de funções bilineares da diferença
de coordenadas. Contudo, e este é o lado bom da história, para pontos
infinitesimalmente próximos ainda podemos usar a forma bilinear
(13.1). Tomando com exemplo os pontos

r A = r, r B = r + dr, ϕ A = ϕ, ϕ B = ϕ + dϕ (13.3)

e substituindo-os na expressão para ∆s2 , obtemos (desprezando termos


de ordem maior que 2 nos infinitesimais dr e dϕ

ds2 = dr2 + r2 dϕ2 . (13.4)

Este termo, conhecido como elemento de linha na TGR e na geometria


diferencial pode ser expresso em termos da forma métrica fundamental
como
ds2 = gij (x̃) d x̃i d x̃ j (13.5)
onde x̃1 = r e x̃2 = ϕ e
!
1 0
gij (x̃) = gij (r ) = (13.6)
0 r2

Notem que o tensor varia de acordo com o ponto do espaço onde nos
encontramos, mas isto não implica que o espaço seja curvo, afinal nosso
espaço subjacente é o mesmo R2 . Além do mais, o fato da matriz
ser diagonal significa que coordenadas polares são ortogonais. Vamos
tratar agora de um espaço realmente curvo.

Espaço curvo: a superfície da esfera S2

Todos conhecemos a figura de uma esfera. A esfera é uma variedade


totalmente simétrica de curvatura constante. Variedade ou manifold foi
um termo criado pelo famoso matemático Bernhard Riemann para
se referir aos espaços de n dimensões que localmente (a distâncias

© s.r. dahmen 2022


Figura 13.3: Georg Friedrich Bernhard
Riemman (1826 – 1866), matemático ale-
em busca de uma teoria mão, foi professor
relativística nas Universidades205
da gravidade de
Göttingen e Berlin. Fonte: wikipedia.

infinitesimais) se parecem com um espaço Euclideano plano Rn . Os


matemáticos também chamam tal espaço de n-variedade 3 . 3
O termo original alemão é Mannigfaltig-
Geralmente usamos a esfera bidimensional imersa (embedded) no keit. Riemann introduziu o termo em sua
famosa tese de doutorado – sob a orienta-
espaço Euclideano R3 como o exemplo mais simples de uma superfície ção de C. F. Gauss – cujo título é Ueber die
curva não apenas pela familiaridade com sua geometria mas também Hypothesen welche der Geometrie zu Grunde
liegen: Acerca das hipóteses sobre as quais a
pelo fato que podemos visualizá-la sem maiores dificuldades. Por isso Geometria está fundamentada.
nos serviremos desta esfera como nosso exemplo primordial de espaço
curvo. É importante lembrar que embora como seres tridimensionais é
fácil para nós visualizar esta esfera, devemos imaginar os homens que
sobre ela vivem são seres bidimensionais e que não possuem este nosso
ponto de vista privilegiado. A pergunta que Riemann e tantos outros se
fizeram era justamente esta: como é possível para seres que vivem sobre
a superfície da esfera descobrir que seu espaço é curvo se estão eles
restritos a viverem sobre a superfície? Ou seja, é possível determinar
a curvatura do espaço fazendo algum tipo de medida sem sair deste
espaço? Responderemos esta pergunta mais a frente. Esferas tem sua
superfície parametrizada por duas coordenadas: o ângulo azimutal
ϕ ∈ [0, 2π ], e um ângulo polar θ ∈ [0, π ], medido a partir do zênite ou
polo norte (obviamente a definição matemática difere um pouco das
coordenadas por nós usadas sobre a superfície da Terra pois tomados
a latitude dada por θ como tendo valores positivos medidos a partir
da linha do Equador e variando entre [0, ±π/2] e a longitude variando
entre [0, ±π ] baseados no meridiano de Greenwich). Em coordenadas
cartesianos temos

x = r sin θ cos ϕ
y = r sin θ sin ϕ
z = r cos θ (13.7)

Sendo r constante, tomemos r = 1. O elemento infinitesimal neste caso


se torna

ds2 = dx2 + dy2 + dz2 = dθ 2 + sin2 θ dϕ2


= gij (θ )d x̃i d x̃ j (13.8)
!
1 0
onde o tensor métrico vale gij (θ ) = .
0 sin2 θ

Nota: percebam que a métrica para coordenadas polares de R2 e a para


coordenadas esféricas de S2 são muito semelhantes em sua forma:
! !
1 0 1 0 Figura 13.4: A superfície esférica S2
polar: gij (r ) = , esférica: g ij ( θ ) = (13.9)
0 r2 0 sin2 θ imersa no espaço tridimensional R3 . Au-
tor: H. Hinrichsen.
A pergunta a ser fazer é basicamente esta: é possível olhando para a forma
métrica fundamental dizer que a primeira se refere a um espaço plano enquanto
a segunda e um espaço curvo? Veremos brevemente que sim.

© s.r. dahmen 2022


206 uma introdução à teoria do espaço e do tempo

13.2 O espaço-tempo enquanto variedade

Na TRG o espaço-tempo é modelado como uma variedade Riemanniana.


Uma variedade Riemanniana pode ser ilustrada como na figura ao lado
e suas propriedades básicas são:

 ele é localmente suave, ou seja se olharmos de um ponto bem


próximo, ele nos parece plano;

 quando estamos próximos e a variedade se mostra plana, podemos


definir um produto escalar usual que nos permite definir distâncias,
ângulos, etc..

Na TER o espaço-tempo é um espaço plano, pseudo-euclideano,


no qual pudemos definir quadrivetores. Na TGR estas idéias não são
mais válidas e precisamos de outras completamente diferentes. A Figura 13.5: Uma variedade bidimensio-
nal imersa no espaço tridimensional. Au-
dificuldade vem do fato que no exemplo de nossa esfera S2 , temos uma
tor: H. Hinrichsen.
superfície curva inserida num espaço 3-d, o R3 , que é plano e portanto
admite as regras por nós conhecidas. Já o espaço-tempo da TGR é
um espaço 4-d curvo que não está inserido num espaço plano de dimensão
maior que nos permitira parametrizá-lo em termos de componentes
vetorias que obedecessem certas condições. No caso da esfera S2 ,
como já falamos, podemos vê-la como uma superfície imersa no espaço
3-d parametrizado pelas coordenadas cartesianas ( x, y, z) sujeitos à
condição x2 + y2 + z2 = r2 . Na TGR não existe uma imersão óbvia.

Portanto, na Teoria da Relatividade Geral de Einstein temos que des-


crever nosso espaço-tempo sem a ajuda de um espaço plano de di-
mensão mais alta. Por isto, não podemos mais descrever a posição
como um vetor, pois não existem vetores curvos ou espaços vetoriais
curvos. Tudo o que podemos dizer é que o espaço-tempo consiste
em pontos p na variedade Riemanniana M.

Sistemas de coordenadas e mapas

Embora as posições ocupadas por corpos na variedade M não possam


mais serem descritos por vetores mas por pontos p ∈ M abstratos,
podemos ainda usar o conceito de coordenadas do mesmo modo que
usamos toda nossa vida. Um sistema de coordenadas, matematicamente
falando, é um conjunto de funções diferenciáveis que mapeiam um
subconjunto em U ⊂ M de maneira unívoca num conjunto de números
reais. Isto nós conhecemos do superfície da Terra com nossos graus
que definem uma latitude θ e uma longitude ϕ, exceção feita aos pólos,
onde a longitude não é definida. Isto é essencialmente o que fazemos
ao mapear estes dois números num plano, isto é ao projetarmos a
superfície terrestre em um mapa.
Notem que embora o mapa seja um espaço plano Rn , o mapa não

© s.r. dahmen 2022


em busca de uma teoria relativística da gravidade 207

reestabelece o conceito de espaço-tempo como um espaço-vetorial,


simplesmente porque os axiomas que regem um espaço vetorial não
se aplicam à variedade. Posições e também distâncias não podem
ser representadas por vetores e diferenças entre vetores. Porém, e aí
que está a importância da idéia de Riemann, cada ponto do espaço
de Riemman M pode ser localmente mapeado num espaço plano e
para coordenadas cuja diferença seja infinitesimal podemso definir um
elemento de linha

ds2 = gµν ( x ) dx µ dx ν (13.10)

que depende do ponto x ou de suas coordenadas. Assim, falamos em


TGR que o “campo tensorial gµν ” caracteriza de maneira completa as
propriedades geométricas da variedade M.

Geodésicas

Imagine-se dirigindo seu carro num espaço curvo. Deixe o volante


na posição neutra e siga em frente. Qual a trajetória que seu carro irá
descrever? Seu carro descreverá aquilo que na geometria diferencial é
chamado de geodésica. A posição neutra do volante significa em termos
físicos um corpo não sujeito a forças. Um corpo não sujeito a forças
descreve uma trajetória “reta”do espaço curvo. Como a curvatura
substitui a gravidade, isto significa que um corpo em queda livre Figura 13.6: Trajetória mais curta entre os
descreve uma geodésica. Em geometria diferencial a geodésica é a aeroportos de Frankfurt (FRA) e Tóquio-
Haneda (HND). Mapa gerado pelo site
menor distância entre os pontos A e B. Seguir uma geodésica significa
gcmap.com.
andar em linha “reta”.
Numa superfície esférica bidimensional as geodésicas são os grandes
círculos. O Equador é um grande círculo, da mesma maneira que você
se move sobre parte de um grande círculo se andar de sul para norte
mantendo sua longitude constante. É por isto que aviões seguem, na
medida do possível, trajetórias que são partes de grandes círculos. Por
exemplo, num vôo há muitos anos de Frankfurt para Tóquio voamos
primeiro em direção à Suécia que estava do lado esquerdo do avião e
continuamos nos movendo para o Norte, entrando depois na Rússia
e voando boa parte do tempo sobre a Sibéria. A figura ao lado ilustra
a trajetória seguida. Para acharmos agora a menor distância entre
dois pontos usaremos o formalismo Lagrangiano já usado por nós
no capítulo anterior. Esta abordagem se justifica pois as equações do
movimento no formalismo Lagrangeano vêm da minimização a ação
R
L(ẋ, x) dt. Substituindo o tempo t pela parametrização λ de uma
curva genérica chegaremos ao mesmo conjunto de equações.

A menor distância entre dois pontos

Queremos achar a menor distância entre os pontos A e B numa varie-

© s.r. dahmen 2022


208 uma introdução à teoria do espaço e do tempo

dade curva. O comprimento total da conexão entre os ponto é


Z
`= ds (13.11)
C

onde C é uma curva entre os pontos A e B e ds um elemento de


comprimento ao longo da curva. Dada uma métrica gµν ( x ) sabemos
que o intervalo é dado por

ds2 = gµν ( x ) dx µ dx ν (13.12)

Uma curva sobre a qual queremos fazer a integral precisa ser definida,
ou seja, parametrizada. Sendo uma curva e portanto unidimensional,
necessitamos em princípio de um parâmetro apenas. Vamos chamar
este parâmetro de λ. Podemos assim definir ds como
s
gµν dx dx dλ2
µ ν
ds = dλ dλ
q
= gµν ẋ µ ẋ ν dλ (13.13)

Isto nos permite escrever a distância entre os pontos A e B onde o


parâmetro assume os valores λ A e λ B na forma
Z λB q
`= gµν ẋ µ ẋ ν dλ (13.14)
λA

Esta parametrização pode nos parecer à primeira vista um pouco estranha


mas a utilizamos constantemente na mecânica. Vamos lembrar do exemplo do
lançamento oblíquo no campo gravitacional de uma massa m com velocidade
inicial v0 = (v0x , v0y ). Nós sabemos do curso de física básica que as posições
x (t) e y(t) são dadas por
1 2
x (t) = x0 + v0x t ; y(t) = y0 + v0y t − gt . (13.15)
2
Isto nada mais é do que a equação da trajetória – uma parábola – parametrizada
pela variável λ = t. A equação da parábola é obtida eliminando o t da primeira
equação e substituindo na segunda:
v0y 1 g
y ( x ) = y0 + ( x − x0 ) − ( x − x0 )2 (13.16)
v0x 2 v20x
Se quisermos calcular a distância percorrida ao longo da parábola, tomando
t0 = 0 e na equação (13.14) os termos
!
1 0
gµν = ; ẋ1 ẋ1 = v2x e ẋ2 ẋ2 = v2y . (13.17)
0 1

ficamos com
Z t q
` = v2x + v2y dt0
0
Z t q 2
= v20x + v0y + gt0 dt0
0
(13.18)

© s.r. dahmen 2022


em busca de uma teoria relativística da gravidade 209

cuja solução é

2 t
 
1
q
` = (v0y − gt0 ) v20x + v0y − gt0
2g 0
2 t
 2 
v0x
q
+ ln (v0y − gt0 ) + v20x + v0y − gt0
2 0
(13.19)

Substituindo os valores dos limites de integração obtemos finalmente

1
q 2
` = (v0y + gt) v20x + v0y − gt
2g
v20x
 q 
2
+ ln v0y + gt + v20x + v0y − gt
2
1 q v2  q 
− v0y v20x + v20y − 0x ln v0y + v20x + v20y (13.20)
2g 2

Caso deixemos a massa cair verticalmente a partir do repouso v0 = 0, obtemos


o resultado trivial ` = 1/2 gt2 que é a distância percorrida em linha reta pela
massa ao cair.

Do cálculo variacional sabemos que o menor caminho é aquele para o


qual a variação δ` = 0. Podemos assim usar o formalismo Lagrangiano
escrevendo a expressão acima na forma da integral de uma função de
Lagrange q
L( x, ẋ ) = gµν ẋ µ ẋ ν (13.21)
de tal modo que
Z λB q
δ` = δ gµν ẋ µ ẋ ν dλ = 0. (13.22)
λA

Esta variação nos dá nada mais nada menos que a equação de Lagrande
do segundo tipo da mecânica (onde substituímos λ por t):

d ∂L ∂L
− u =0 (13.23)
dλ ∂ ẋ u ∂x
Como a métrica do espaço Riemanniano codifica a curvatura da varie-
dade em cada ponto p e na Teoria da Gravidade de Einstein a métrica
gµν que muda de ponto a ponto codifica a gravidade, a equação acima
diz como é a geodésica de uma partícula num campo gravitacional.
Mostramos no capítulo anterior, depois de fazermos uma quantidade
razoável de conta, que a equação de Lagrange acima leva à equação

1 µν 
ẍ µ + g gαν ,β + g βν ,α − gαβ ,ν ẋ α ẋ β = 0 (13.24)
2
que, quando usamos a definição do símbolos de Christoffel como função
da métrica
1 µν
gαν ,β + g βν ,α − gαβ ,ν ≡ Γ αβ
 µ
g (13.25)
2

© s.r. dahmen 2022


210 uma introdução à teoria do espaço e do tempo

somos levados finalment à expressão

ẍ µ = −Γ
µ
αβ ẋ α ẋ β (13.26)
Esta equação foi por nós deduzida no capítulo anterior como sendo
a equação de movimento de uma partícula livre cuja Lagrangeana é
L = 12 mv2 . A beleza da teoria de Einstein é capturada por esta equação
simples, mas profunda: a mesma equação que descreve o movimento
de uma partícula livre descreve a menor distância entre dois pontos
num espaço cuja curvatura está codificada em sua métrica via os Γ αβ .
µ

Se massa e energia são então a causa da curvatura, a conclusão é que


uma partícula sob a ação da gravidade não está sujeita a uma força: ela
é na verdade uma partícula livre porém num espaço curvo e se move
ao longo de uma geodésica neste espaço. A gravidade não é portanto
uma “força”, mas o efeito pelo qual sentimos a curvatura do espaço.

Exemplo: retas no R2 em coordenadas polares.

Como vimos, o plano R2 pode ser descrito em termos das coordenadas


polares r, ϕ com a métrica
! !
1 0 µν 1 0
gµν (r ) = , g (r ) =
0 r2 0 r −2

(13.27)

Nos símbolos de Christoffel aparecem as derivadas da métrica na forma


gµν ,α . O único elemento de gµν que não é constante é o termo g22 que é
uma função da variável x1 = r e portanto a única derivada diferente de
zero é g22, 1 . Isto significa que temos apenas três símbolos de Christoffel
diferentes de zero:
1 11 1
Γ 122 = g ( g12 ,2 + g12 ,2 − g22,,1 ) = − g11 g22 ,1 = −r
2 2
1 22 1 1
Γ 112 = Γ 21 = g ( g21 ,2 + g22 ,1 − g12,,2 ) = g22 g22 ,1 = .
2
2 2 r
Neste caso as equações das geodésicas são:

ẍ1 + Γ 122 ẍ2 ẍ2 = r̈ − rϕ2 = 0


2
ẍ2 + Γ 222 ẍ1 ẍ2 = ϕ̈ + ṙ ϕ̇ = 0 (13.28)
r
Paradoxalmente, estas sejam talvez a pior maneira possível de se escre-
ver a equação de uma reta em R2 ! Se aplicarmos o formalismo acima
às coordenadas cartesianas x1 = x e x2 = y somos levados ao resultado
trivial ẍ = ÿ = 0.

© s.r. dahmen 2022


em busca de uma teoria relativística da gravidade 211

Exemplo: geodésicas na superfície da esfera.

Podemos utilizar o mesmo procedimento para determinar a geodésica


na superfície da esfera, ou seja, a equação de um grande círculo.
A superfície da esfera S2 ⊂ R3 pode ser parametrizada pelos ângulos
( x , x2 ) = (θ, ϕ). O tensor métrico vale (13.28)
1

! !
1 0 1 0
gµν (θ ) = , gµν (r ) =
0 sin2 θ 0 sin−2 θ

e a única deriva parcial diferente de zero é g22 ,1 . Os símbolos de


Christoffel são: Figura 13.7: UM grande círculo na esfera
1 11 1 e no mapa. Se você já acompanhou a
Γ 122 = g ( g12 ,2 + g12 ,2 − g22,,1 ) = − g11 g22 ,1 = − sin θ cos θ trajetória da ISS num mapa, esta figura
2 2 deve ser familiar.
1 1
Γ 112 = Γ 221 = g22 ( g21 ,2 + g22 ,1 − g12,,2 ) = g22 g22 ,1 = cot θ.
2 2
As geodésicas são dadas pelas equações

ẍ1 + Γ 122 ẍ2 ẍ2 = θ̈ − sin θ cos θ ϕ̇2 = 0


ẍ2 + Γ 222 ẍ1 ẍ2 = ϕ̈ + 2 cot θ θ̇ ϕ̇ = 0 (13.29)

Estas são as equações de um grande círculo na esfera. Como podemos


ver isto? Primeiro temos que observar que uma curva geodésica é
sempre a interseção de um plano e a superfície esférica pois é a curva
mais “reta” possível entre dois pontos. E, sendo a intersecção de um
plano com uma esfera, ela deve ser um círculo. Uma vez que a esfera
é a figura mais simétrica possível, não há uma direção preferencial e
todas as direções são equivalentes. Portanto podemos escolher uma
curva para quem θ tem um valor constante (latitude constante), isto é
paralela ao plano equatorial. Neste caso θ̈ = 0 e portanto o segundo
termo da equação (13.29) acima deve ser identicamente nulo:

sin θ cos θ ϕ̇2 = 0 (13.30)

Porém, ϕ̇ = dϕ/dλ 6= 0 pos a solução trivial ϕ̇ = 0 implicaria estarmos


presos a um ponto. Sendo assim concluímos que
π
sin θ cos θ = 0 → θ= (13.31)
2
é a única solução possível para θ ∈ [0, π/2]. Portanto a geodésica é um
grande círculo e coincide com a linha do Equador. Se θ = π/2 o 2º
termo da segunda equação (13.29) nos dá

ϕ̈ = 0 → ϕ̇ = K → ϕ = λK (13.32)

© s.r. dahmen 2022


212 uma introdução à teoria do espaço e do tempo

Se medirmos ϕ em radianos, K = 1/R e a solução nos dá longitude


medida ao longo da linha do Equador. Agora, sendo a orientação dos
eixos a partir dos quais definimos os ângulos θ e ϕ arbitrários, todos
as possíveis “linhas equatoriais” são soluções e portanto os grandes
círculos são todos os círculos desenhados sobre a superfície de uma
esfera cujos centros coincidem com o centro da esfera, como havíamos
afirmado anteriormente. Além do mais, é fácil ver também que para
quaisquer 2 cidades na superfície da Terra sempre existe um grande
círculo que passa pelas duas.

13.3 A curvatura

Se pudéssemos resumir a TGR em poucas palavras estas seriam: “massa


e energia curvam o espaço”. Já nos deparamos com os conceitos
de massa e energia em Física mas o que é exatamente um espaço
curvo? Vamos fazer aqui uma breve recapitulação de alguns conceitos
matemáticos sobre curvatura.
Seja o deslocamento ao longo da curva ds (v. figura ao lado). A
curvatura K é definida como a variação do ângulo de declividade por
Figura 13.8: Uma curva e sua derivada.
unidade de comprimento ao longo da curva A curvatura é definida como a variação
do ângulo φ ao longo do comprimento
dφ s da curva, ou seja dφ/ds. Fonte: Fonte:
K= . (13.33) Grøn e Næss.
ds

Podemos escrever ds2 = dx2 + dy2 e portanto


s
 2
dy
q
ds = 1+ dx = 1 + y02 dx (13.34)
dx

Pela definição de K temos assim

1 dφ 1
K= p = p φ0 (13.35)
1 + y 02 dx 1 + y 02

Queremos obviamente expressar a curvatura em termos de x e y. Como


temos a relação dy/dx = y0 = tan φ segue que

y00
y00 = (1 + tan2 φ)φ0 −→ φ0 = . (13.36)
1 + y 02

Disto temos
y00
K= (13.37)
(1 + y02 )3/2
Não devemos confundir y00 , as vezes chamada imprecisamente de curva-
tura, pois esta representa a mudança da tangente da curva por unidade
de comprimento medido na direção x. A curvatura é a mudança do
ângulo por unidade de comprimento ds ao longo da curva. Como

© s.r. dahmen 2022


em busca de uma teoria relativística da gravidade 213

exemplo simples, consideremos a curvatura da parábola y = x2 . Um


cálculo simples nos dá
2
K= (13.38)
(1 + 4x2 )3/2
que mostra que a curvatura da parábola tem seu valor máximo K = 2
em x = 0 e K = 0 para x → ∞, pois no limite de x muito grande os
braços da parábola aproximam-se de retas.
Com argumentos geométricos é possível calcular a curvatura de su-
perfícies imersas no R3 . Uma discussão detalhada deste procedimento
é feita no livro de Grøn e Næss 4 . Vamos aqui adotar uma abordagem 4
Øyvind Grøn e Arne Næss, Einstein’s
Theory: A Rigorous Introduction for the
geral e mais adequada a nossos objetivos.
Mathematically Untrained, Springer, New
Há na discussão precedente um detalhe muito importante. Vamos York, 2011, pp. 172–178.
pensar no exemplo acima e nos colocarmos na situação de seres uni-
dimensionais que vivessem sobre a curva: eles sabem que vivem num
espaço curvo? Se sabem, como descobriram? Para nós isto é evidente,
pois temos a vantagem de ver a curva de uma dimensão mais alta e
portanto vemos a mudança do ângulo φ com nossos próprios olhos:
conseguimos medir a mudança de direção do vetor tangente à curva.
Mas não nos esqueçamos que para os seres que vivem na curva um
vetor tangente à curva nunca muda de direção! Você poderia argumen-
tar que eles poderiam ver os efeitos da curvatura na gravidade. Mas
lembre-se que até a descoberta da TGR, nós explicávamos a gravidade
segundo a teoria da gravitação de Newton, no qual massas atraem-se
mutuamente na proporção direta do produto de suas massas e na pro-
porção inversa do quadrado da distância entre elas! O fato daquilo
que chamamos de gravidade seja o efeito físico da curvatura é um dos
mistérios mais fascinantes da Física. Porém a ideia de um espaço curvo
não tem qualquer relação lógica com o conceito de gravidade, sendo
um conceito puramente matemático. Consequentemente deve haver
um procedimento puramente matemático para determinar a curvatura,
e um que não implique em ter que sair da superfície. A chave está no
conceito de transporte paralelo.

13.3.1 O transporte paralelo de vetores

Vamos imaginar um plano no qual temos um vetor A ~ e uma curva na


forma de um triângulo. Nos é dada uma tarefa: transportar o vetor
ao longo da curva, saindo de qualquer ponto e retornando ao mesmo
ponto, mas mantendo o vetor sempre paralelo a si mesmo durante o transporte.
No retorno, o vetor coincidirá consigo mesmo. Isto parece óbvio.
Porém, em superfícies curvas isto não é mais tão óbvio assim. Para
melhor entendermos a situação quando nos movemos sobre uma su- Figura 13.9: O transporte paralelo de um
~ ao longo de uma curva no plano.
vetor A
perfície curva, imaginemos um barco que se move sobre geodésicas na Fonte: Fonte: Grøn e Næss.
superfície da Terra ao longo de um triângulo formado pela linha do

© s.r. dahmen 2022


214 uma introdução à teoria do espaço e do tempo

Equador e dois meridianos separados de 90 ° entre si (na verdade po-


demos escolher qualquer triângulo formado por geodésicas). A figura
ao lado ilustra a situação. Ao capitão é entregue um vetor e a condição
é que ele mantenha o vetor sempre paralelo a si mesmo. Ao fazer um
giro de 90 ° à esquerda no ponto mais à direita da figura, ele mantém
a direção, da mesma maneira que ao chegar ao pólo e novamente ao
Equador. Ao retornar à posição original, o vetor terá girado de 90 ° em
relação à sua direção original.
Este exemplo pode ser também ilustrado na figura abaixo: suponha
que o capitão mantenha o leme numa posição neutra e navegue sobre
um grande círculo. O vetor deve manter sua posição relativa ao barco
durante toda a viagem. Podemos ver como vemos o vetor representado
Figura 13.10: O transporte paralelo ao
sobre a superfície da esfera e como ela nos parece projetada em um
longo de um triângulo sobre uma esfera.
mapa. Fonte: H. Hinrichsen.

Figura 13.11: O transporte paralelo de


vetores é bem mais difícil do que o trans-
porte de uma grandeza escalar. Sendo a
superfície plana, o único espaço onde os
vetores podem viver é no espaço tangente.
Ao iniciar a viagem o capitão recebe um
vetor que existe no espaço tangente ilus-
trado no lado esquerdo da figura e que
faz um ângulo com a bombordo do navio.
Como esta direção muda ao longo da via-
A conclusão que chegamos é a seguinte: a curvatura do espaço se reflete
gem? A pergunta, embora pareça trivial,
no transporte paralelo de um vetor ao longo se uma curva fechada. não é pois os espaços tangentes mudam
Se o espaço for curvo, haverá uma diferença entre o vetor inicial e o continuamente. Fonte: H. Hinrichsen.

vetor final. Num espaço plano, a diferença entre os dois vetores é nula.
Mas como calcular isto explicitamente? Para isto temos a conhecida
definição da circulação C de um vetor B ao longo de uma curva T pelo
deslocamento infinitesimal dr = dx ν eν
I
C= B dr (13.39)

ou nosso conhecido, a circulação infinitesimal por unidade de área ∆S,


o rotacional
1
I
∇ × B = rot B = lim B dr (13.40)
∆S→0 ∆S

Nossa tarefa é generalizar este resultado para espaços de curvatura


arbitrária.

O tensor de curvatura de Riemann.


Nossa intuição nos mostrou no exemplo do barco e nas figuras anterio-
res que se certo modo a mudança da direção de um vetor quando este
é transportado paralelamente é a impressão digital da curvatura do
espaço. A mesma viagem num espaço plano não tem o mesmo efeito.
Agora chegou o momento de vermos como isso se traduz em termos

© s.r. dahmen 2022


em busca de uma teoria relativística da gravidade 215

de matemática. Gostaria antes de transcrever o texto de Grøn e Næss


sobre o que nos espera 5 : 5
Øyvind Grøn e Arne Næss, op. cit., p.
182.
In the following we shall search for a consistent geometrical interpretation of the
change of direction of a vector due to parallel transport around a closed curve.
This will turn out to be rather involved since we are seeking a mathematical
expression valid for curved surfaces generally, that is, for an overwhelmingly
rich variety of surfaces. You are invited to take part in what might be called
“index gymnastics”. The equations in this section are relatively short and simple,
but looking closely you will notice a bewildering change of indices. There is
reason to suspect that Einstein, who felt he was a pure physicist, and never a
mathematician, disliked this sort of gymnastics. But he saw no way to avoid it
in his search for a relativistic theory of gravitation. So he not only learned it and
mastered it. He also contributed to this part of the mathematics by inventing
useful notation —- as for example the Einstein summation convention.

Basicamente a idéia é usar o rotacional em espaços arbitrários e conectar


isto com a curvatura do espaço. Comecemos pela pequena área ∆S
sobre uma superfície plana, como na figura ao lado
De novo, visando facilitar a discussão, o que temos aqui são coordena-
das curvilíneas sobre um espaço plano mas os resultados que obteremos
serão gerais. O transporte paralelo sobre uma superfície plana não Figura 13.12: O transporte paralelo de
muda o vetor, ou seja ∆A = 0 e, no limite do deslocamento por uma um vetor no plano por um circuito fe-
chado que circunscreve uma área ∆S.
curva infinitesimal
Fonte Grøn e Næss.
dA = 0 (13.41)
O mais curioso deste resultado é que – e é importante frisar este ponto –
que ele vale também para espaços curvos! Isto parece uma contradição
pois estamos partindo do ponto que o transporte paralelo é uma assi-
natura da curvatura. Notemos porém que independente da curvatura
do espaço, se um vetor é transportado por uma distância infinitesimal,
o resultado acima afirma que em primeira ordem a variação é zero.
São os termos em segunda ordem que contribuirão para fazer o trans-
porte paralelo em espaços curvos algo diferente de zero. Em outras
palavras, o mudança de um campo vetorial por transporte paralelo não
é visível se estivermos olhando apenas para as primeiras derivadas -
a diferença surge no termo de segunda ordem (a curvatura de uma
curva y = y( x ) qualquer é, como mostramos há pouco, proporcional
à y00 (vide eq. 13.37). Vamos calcular dA = 0 para cada uma de suas
componentes, dAµ . Usando nossa definição de derivada covariante
temos, ao deslocarmos o vetor na direção dx ν

Aµ ;ν dx ν = 0 (13.42)

Substituindo nossa definição de derivada covariante (12.48) temos

Aµ ,ν dx ν = Aτ Γτ µν dx ν −→ Aµ ,ν = Aτ Γτ µν (13.43)

e
dAµ = Aτ Γτ µν dx ν = Bµν dx ν (13.44)

© s.r. dahmen 2022


216 uma introdução à teoria do espaço e do tempo

onde introduzimos a notação Bµν = Aτ Γτ µν visando tornar o resultado


mais claro. Calculemos agora a mudança total ∆Aµ do vetor ao longo
de uma curva fechada, isto é
I I
∆Aµ = dAµ = Bµν dx ν (13.45)

Isto pode ser escrito de maneira ainda mais familiar, se notarmos que
podemos escrever
Bµν dx ν = Bµ · dr (13.46)
onde Bµ são vetores. Isto leva finalmente à
I
∆Aµ = Bµ · dr (13.47)

que nada mais é que a expressão para a circulação de um vetor ao


longo de um caminho fechado.

Lembremos agora um resultado por nós conhecido do cálculo ve-


torial. Quanto calculamos a circulação de um vetor por uma curva
arbitrária em R3 temos
I
~B · d~r = (rot ~B)αβ ∆Sαβ (13.48)

ou, explicitamente
I
~B · d~r = (rot ~B) xy ∆S xy + (rot ~B)zy ∆Syz + (rot ~B)zx ∆Szx

= ( By,x − Bx,y ) ∆S xy + ( Bz,y − By,z ) ∆Syz + ( Bx,z − Bz,x ) ∆Syx


∂By ∂Bx
= ( − ) ∆S xy + · · · (13.49)
∂x ∂y

onde ∆Sij e a área que a curva projeta no plano ij 6 . Seguindo esta 6


Um livro de física básica onde este cál-
idéia podemos escrever diretamente culo é feita de maneira detalhada é o vo-
lume 3 da coleção Física Básica de Moy-
sés Nussenzveig.
(rot ~B)αβ = Bβ;α − Bα;β (13.50)

onde temos que generalizar a derivada parcial da nossa definição usual


para a derivada covariante. Substituindo explicitamente a expressão da
derivada covariante temos:

(rot ~B)αβ = Bβ,α − Bτ Γτ βα − ( Bα,β − Bτ Γτ αβ )


= Bβ,α − Bα,β − Bτ (Γτ βα − Γτ αβ )
| {z }
=0
= Bβ,α − Bα,β (13.51)

onde na passagem da penúltima para a última linha usamos o fato


que os símbolos de Christoffel são simétricos nos índices. Portanto a
expressão
(rot ~B)αβ = Bβ,α − Bα,β (13.52)

© s.r. dahmen 2022


em busca de uma teoria relativística da gravidade 217

vale em qualquer sistema de coordenadas.

Retornando agora à equação (13.47) podemos escrever

∆Aµ = (rot ~Bµ )αβ ∆Sαβ = ( Bµβ,α − Bµα,β )∆Sαβ (13.53)

Voltamos agora à notação original Bµν = Aτ Γτ µν ficamos nesta expres-


são com
∆Aµ = ( Aτ Γτ µβ ),α − ( Aτ Γτ µα ),β ∆Sαβ
 
(13.54)
Fazemos a derivada dos produtos Aτ Γτ µβ e Aτ Γτ µα e substituímos no
segundo e quarto termo da expressão resultante o índice mudo τ por ν.
Isso nos deixa com a seguinte expressão:
 
∆Aµ = Aτ,α Γτ µβ + Aν Γν µβ,α − Aτ,β Γτ µα − Aν Γν µα,β ∆Sαβ
(13.55)
Agora, nos sabemos da equação (13.43) que podemos escrever Aτ,α =
Aν Γν τα e Aτ,β = Aν Γν τβ . Substituindo estas expressões na equação
acima ficamos com

∆Aµ = Aν Γν τα Γτ µβ − Aν Γν τβ Γτ µα
+ Aν Γν µβ,α − Aν Γν µα,β ∆Sαβ

(13.56)

Colocando a componente Aν em evidência chegamos finalmente à

∆Aµ = Γν τα Γτ µβ − Γν τβ Γτ µα + Γν µβ,α − Γν µα,β Aν ∆Sαβ



(13.57)

O termo entre parênteses é o chamado tensor de curvatura de Riemann.


Ele é um tensor de 4ª ordem com componentes definidas via

Rνµαβ = Γν τα Γτ µβ − Γν τβ Γτ µα + Γν µβ,α − Γν µα,β (13.58)

Podemos escrever esta expressão como encontrada em outros livros na


forma

Rνµαβ = ∂α Γν µβ − ∂ β Γν µα + Γν τα Γτ µβ − Γν τβ Γτ µα . (13.59)

Portanto a variação da componente µ do vetor ao longo de uma curva


fechada vale
1
∆Aµ = Rνµαβ Aν ∆Sαβ (13.60)
2
ou, para o vetor como um todo
1 µν
∆A = ∆Aµ eµ = R Aν ∆Sαβ eµ (13.61)
2 αβ
onde elevamos os índices dos dois lados. O fator 12 vem pelo fato que
ao somarmos em α, β, contamos duas vezes a mesma superfície, por
exemplo surge um termo ∆S xy e ∆Syx que se referem, obviamente, à
mesma superfície. Em função desta dupla contagem somos forçados e

© s.r. dahmen 2022


218 uma introdução à teoria do espaço e do tempo

multiplicar o resultado pelo fator 12 . Nossa conclusão é que a mudança


de um vetor por transporte paralelo ao longo de uma curva fechada é
proporcional à curvatura do espaço multiplicada pela área circunscrita
pela curva.

Sejamos bastante claros em um ponto: este resultado é algo puramente


matemático e não tem qualquer relação com a física. Esperar que
apenas olhando para esta profusão de índices consigamos ver algo de
gravitação seria um exercício de imaginação sem qualquer justificativa
mais fundamentada: não há nada que conecte uma à outra. Foram
necessários 10 anos, de 1906 a 1916, para que Einstein conseguisse
associar uma à outra. O que devemos guardar deste resultado é que
um transporte paralelo de um vetor por uma curva fechada – em outras
palavras, a circulação do vetor – leva a uma mudança neste vetor caso o
espaço seja curvo. Tomando a circulação infinitesimal, que nada mais é
que o rotacional do vetor por unidade de área, chegamos a uma relação
dada pela equação (13.60) ou (13.61). Segundo Øyvind e Næss:

The result expressed in equation (9.3) [13.60] is purely mathematical. It concerns


the curvature of curved surfaces and curved spaces. The ’theorema egregium’
of Gauss is contained in Eq. (9.28) [13.57], since the values of the Christoffel
symbols and their derivatives are defined ’intrinsically’, i.e. without reference
to any higher-dimensional space which the one with curvature Rνµαβ could be
embedded in. Due to its mathematical character this theorem needs no empirical
support, it tells nothing about the physical world. The geometrical theory can
be developed abstractly as a non-geometrical, logical system. The terms ’vector’,
’point’, ’coordinate’, and ’path’ are then introduced without any reference to a
physical space that we might be said to live in. Drawings on a paper are of no
significance for the deductions. Drawings are only of heuristic value. However,
some equations of the abstract system can be made to correspond to certain
empirically studied physical relationships. If we construct a theory which, for
example, through certain equations, successfully predicts how light moves in flat
spacetime, and also in curved spacetime, we would talk of a physical spacetime,
whose geometrical properties we then can investigate empirically. The general
theory of relativity is just such a theory. This makes it meaningful to talk
about the geometry of physical spacetime. We shall further on be talking about
a four-dimensional model of the universe where we are born and presumably
are going to die. But the level of abstraction will be astonishing. Abhorrent
and frightening to some, awesome to others. The so-called Einstein equations,
superceeding Newton’s, require skyhigh levels of abstraction. The question is
unavoidable: will humanity never get back to a fairly easily understandable, but
grand theory of the universe of the Newtonian kind? For those who hope to see a
trend in that direction, the development of this century has been discouraging. 7 7
Øyvind Grøn e Arne Næss, op. cit., p.
186.

13.4 Equações de Campo de Einstein

O primeiro pilar da TGR de Einstein como pudemos dizer no início


deste capítulo é a equação da geodésica. O segundo pilar é formado

© s.r. dahmen 2022


em busca de uma teoria relativística da gravidade 219

pelas famoas Equações de Campo de Einstein que basicamente nos diz


que a curvatura é proporcional ao conteúdo de matéria e energia do
espaço. A energia e massa estão contidos no chamado tensor momento-
energia ou tensor stress momentum energia. Ele é um tensor que
basicamente descreve o fluxo de energia e momentum no espaço. Ele é
representado pelo símbolo T µν e tem a forma geral
 00
T 01 T 02 T 03

T
 T 10 T 11 T 12 T 13 
T µν =  20 (13.62)
 
T T 21 T 22 T 23 

T 30 T 31 T 32 T 33

Em gravitação o elemento T 00 = ρ onde ρ representa a densidade de


massa de um fluido uniforme. No eletromagnetismo
 
1 1 1 2
T 00 = 2 e0 E 2 + B (13.63)
c 2 2µ0
representa e energia do campo eletromagnético. Os outros termos
podem ser interpretados como o fluxo de massa ou momento nas
diferentes direções x, y, z. Este tensor porém tem apenas 2 índices e
como o tensor de curvature tem 4, é necessário reduzir o número de
índices. Einstein descobriu que a única contração de índices (soma
sobre índices) que fazia sentido fisicamente era o chamado tensor de
Ricci:
ρ
Rµν := Rµρν (13.64)
que pode ser contraído ainda mais uma vez para nos dar um escalar
µ
R := Rµ (13.65)

Einstein chegou depois de muitas tentativas à relação entre a curvatura


e a massa e energia na forma:
1 8π G
Rµν − R gµν + Λ gµν = 4 Tµν (13.66)
2 c
onde G é a constante gravitacional de Newton. Estas são as famosas
equações de Einstein. A constante Λ é a famosa constante cosmológica
que Einstein introduziu para estabilizar o universo pois devido à atra-
ção gravitacional as massas colapsariam. Esta idéia foi abandonada
quando se descobriu que um universo deste tipo não seria estável por
perturbações e que pelas observações que dispomos a hipótese de um
Big Bang (termo introduzido por J. A. Wheeler) era mais provável. Este
termo voltou a ter um significa físico devido à descoberta há 20 anos da
expansão acelerada do universo, numa espécie de efeito anti-gravidade:
a energia escura. Não devemos confundir energia escura – que nin-
guém sabe o que é – com matéria escura, que também não sabemos do
que se trata.

© s.r. dahmen 2022


14
Schwarzschild: nosso sistema solar

Nosso objetivo agora é estudar algumas das soluções mais importantes


das Equações de Campo de Einstein: a solução de Schwarzschild
(buracos negros), e a de Friedmann, Lêmaitre, Robertson e Walker
(universo em expansão). Iniciemos por Schwarzschild.

14.1 A métrica de Schwarzschild

Antes de falarmos da solução de Schwarzschild para as Equações de


Einstein (EE), é interessante falarmos um pouco de Karl Schwarzschild,
o astrônomo e físico alemão cuja solução das Equações de Einstein leva
hoje seu nome. Há um detalhe até certo ponto trágico acerca de sua
vida: com a eclosão da I Guerra Mundial, Schwarzschild apresentou-se
voluntariamente para lutar pelo seu país 1 . Ele foi enviado ao front Figura 14.1: Karl Schwarzschild (1873 –
1916).
russo e em 1915, entre uma batalha e outra, descobriu aquela que é 1
Schwarzschild, embora católico, era
a mais simples de todas as soluções e talvez a mais importante. No judeu-alemão. Ele não viveu para ver ci-
front ele desenvolveu uma doença auto-imune e foi enviado de volta à entistas como ele ter que fugir de seu país
quando o fascismo ascendeu ao poder em
Alemanha, onde e veio a falecer em 1916.
1933 (pelo voto popular!). Muitos destes
As EE admitem as mais variadas soluções e descrevem desde espaços alemães de ascendência judia eram heróis
planos de Minkowski, espaços curvos na presença de massa, o espaço condecorados da I Guerra Mundial. A es-
magadora maioria não teve tanta sorte.
no interior de estrelas e o Universo em expansão, entre outros. Mas o
que são exatamente, do ponto de vista matemático, as EE? As soluções
das EE são 10 funções que representam as componentes do tensor
métrico gµν . Estas funções dependem das coordenadas do tempo e do
espaço. No total 6 equações de segunda ordem a derivadas parciais,
o que significa que temos a liberdade de escolher o sistema de coor-
denadas mais apropriado pois o sistema de EDP’s é subdeterminado.
A solução das EE é geralmente um problema matemático de extrema
dificuldade e as soluções conhecidas são aquelas que impõem certas
condições de simetria no espaço. A solução de Schwarzschild é deste
tipo: ela se aplica ao espaço-tempo fora de uma distribuição de massa
esférica, uniforme e estática. Espera-se que o espaço-tempo gerado por
esta distribuição tenha a mesma simetria da distribuição de massa, ou
222 uma introdução à teoria do espaço e do tempo

seja, que possamos usar coordenadas esféricas e escrever o elemento de


linha como

ds2 = dr2 + r2 dθ 2 + r2 sin2 θ dϕ2 −c2 dt2 (14.1)


| {z }
d `2

A idéia de Schwarzschild é, mantendo a simetria esférica, permitir que


os termos da métrica não relacionados a θ e ϕ possam depender apenas
da distância r na forma

ds2 = eα(r) dr2 + r2 dθ 2 + r2 sin2 θ dϕ2 − e β(r) c2 dt2 (14.2)

onde eα(r) e e β(r) são funções a serem determinadas. As funções expo-


nenciais se mostraram mais adequadas na hora de fazer os cálculos.
Esta forma se mostrou equivalente à forma funcional da qual Schwarzs-
child partiu em seu trabalho original:

ds2 = Fdt2 − G (dx2 + dy2 + dz2 ) − H ( xdx + ydy + zdz)2


= Fdt2 − ( G + Hr2 ) dr2 − G r2 (dθ 2 + sin2 θ dϕ2 ), (14.3)

onde F, G e H funções de r. Os elementos de gµν são

grr = eα(r) , gθθ = r2 , gtt = −c2 e β(r)


g ϕϕ = r2 sin2 θ,
(14.4)
µµ µµ
Sabemos também que como g é diagonal temos g = 1/gµµ . Temos
agora que calcular o tensor de Ricci:

Rµν = Γ Γα βα − Γ Γα βν + Γα µν,α − Γα µα,ν


β β
µν µα (14.5)

onde os símbolos de Christoffel são definidos de acordo com (12.76)


1
Γ
µ 
≡ gµγ gνγ,λ + gλγ,ν − gνλ,γ (14.6)
νλ 2

Os símbolos de Christoffel para a métrica de Schwarzschild

Para fazer os cálculos vamos dividir os símbolos de Christoffel em três


grupos e ao invés de escrever eα(r) e e β(r) deixemos apenas α e β onde
fica subentendido que eles são funções da coordenada r.

(1) ν = µ. Neste caso temos


1
Γ ν
= (g + gνλ,ν − gνλ,ν ) (14.7)
νλ
2 gνν νν,λ
Os últimos 2 termos se cancelam e ficamos com
1
Γ ννλ = g . (14.8)
2 gνν νν,λ

Substituindo por exemplo em ν = µ = r temos


1
Γ rrr = grr,r . (14.9)
2 grr

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 223


Lembrando que grr,r = ∂r grr e grr = eα ficamos com

1 α 0 α0
Γ rrr = e α = . (14.10)
2 eα 2
Se fizermos as contas para os outros símbolos de Christoffel obtermos

t β0 1 1
Γ Γ Γ Γ
θ ϕ ϕ
tr = ; θr = ; ϕr = ; = cot θ. (14.11)
2 r r ϕθ

Lembrando que os símbolos de Christoffel são simétricos pela troca


dos índices inferiores, temos Γ t tr = Γ trt e assim por diante. Obtemos
assim um total de 8 símbolos de Christoffel.

(2) ν = λ 6= µ. Neste caso temos


1
Γ
µ 
νν = gµν,ν + gµν,ν − gνν,µ (14.12)
2 gνν
Uma vez que a métrica é diagonal, i.e. gµν = 0 para µ 6= ν, os dois
primeiros termos são 0 e ficamos com
1
Γ
µ
νν = − gνν,µ (14.13)
2 gνν
Com esta equação obtemos mais 4 símbolos de Christoffel:

Γ rθθ = −r e −α ; Γ r ϕϕ = −r e−α sin2 θ;


c2 β − α 0
Γ rtt = e β; Γ θ
ϕϕ = − sin θ cos θ. (14.14)
2

(3) ν 6= λ 6= µ. Neste caso temos Γ νλ = 0 pois todos os gµν = 0


µ

quando os índices são diferentes.


Substituindo por exemplo em ν = µ = r temos no primeiro conjunto
1
Γ rrr = grr,r . (14.15)
2 grr
Precisamos agora calcular o tensor de Ricci Rµν em (14.5). Depois de
alguma álgebra chegamos à
 
1 00 1 0 2 1 0 1 0 0 β−α
Rtt = β + (β ) + β − α β e
2 4 r 4
1 1 1 1
Rrr = − β00 − ( β0 )2 + α0 + α0 β0
2 4 r 4
 
1 0 1 0
Rθθ = 1 + − rα + rβ − 1 e− β
2 2
R ϕϕ = Rθθ sin2 θ (14.16)

Agora, para resolver as EE, observamos um resultado muito importante.


Partindo da forma
1 8π G
Rµν − R gµν + Λ gµν = 4 Tµν (14.17)
2 c

© s.r. dahmen 2022


224 uma introdução à teoria do espaço e do tempo

é possível multiplicar ambos os lados da equação por gµν :


1 8π G
gµν Rµν − R gµν gµν + Λ gµν gµν = 4 gµν Tµν . (14.18)
2 c
Agora
µ
gµν Rνµ = R µ = R
µ
gµν Tνµ = Tµ = T
µν µ
g gµν = δµ = 4. (14.19)
µ
R e T representam o traço dos respectivos tensores e δµ é o traço da
matriz identidade tr (1). Com isto a expressão acima se torna
8π G
− R + 4Λ = T (14.20)
c4
µ
onde T = T µ é o traço do tensor momentum energia. Desta equação
isolamos o R e o substituímos na EE original, ficando com
 
8π G 1
Rµν = Λ gµν + 4 Tµν − T gµν (14.21)
c 2
A equação acima é totalmente equivalente à EE original. A solução de
Schwarzschild é para um espaço-tempo fora da distribuição de massa
e portanto Tµν = 0 bem como não há expansão da métrica, logo a
constante cosmológica Λ = 0. Isto implica que Schwarzschild procurou
a solução da equação
Rµν = 0 (14.22)
ou seja, cada uma das 4 equações em (14.16) tem que ser nula. Cuidado
pois o fato de Rµν = 0 não implica que o espaço-tempo é plano! A
µ
curvatura do espaço é dada pelo tensor de Riemann Rνκι .
A tarefa que nos resta agora é resolver as 4 equações (14.16) igulando-
as a zero.

A solução de Schwarzschild
A solução de Schwarzschild segue da solução das equações combinadas
com argumentos físicos. Das primeiras duas equações concluímos que

α0 + β0 = 0 −→ α + β = const. (14.23)

A condição física é que a métrica de Schwarzschild descreve um objeto


massivo num espaço vazio e é de se esperar que, estando muito longe
da massa, o espaço tenha uma métrica de Minkowski, ou seja

lim α = lim β = 0 ⇒ α = −β ⇒ const = 0 (14.24)


r →∞ r →∞

De Rθθ = 0 temos a equação

1 − e− β + rβ0 = 0 (14.25)

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 225

cuja solução é
rS
e − β (r ) = 1 − (14.26)
r
onde rS é uma constante de integração. Com isto obtemos finalmente a
famosa métrica de Schwarzschild
 r   r  −1 2
ds2 = − 1 − S c2 dt2 + 1 − S dr + r2 dθ 2 + r2 sin2 θ dϕ2
r r
(14.27)
O raio de Schwarzschild rS desempenha um papel importantíssimo
na métrica de Schwarzschild e portanto esta “constante de integra-
ção” deve ser, em última instância, determinada por escalas típicas do
problema como massa e a constante gravitacional G. Isso vem de consi-
derações físicas pois há uma outra importante condição física que esta
métrica deve satisfazer: ela não apenas deve reduzir-se a uma métrica
de Minkowski no limite de r → ∞, como acabamos de ver, mas também
deve reproduzir a gravitação de Newton para campos gravitacionais
fracos. A questão então passa por mostrarmos inicialmente como obter
da teoria de Einstein o chamado limite Newtoniano ou, se preferirmos,
como descrever a gravitação Newtoniana na linguagem de TGR. Com
isto conseguimos determinar quem é rS comparando por um lado a
teoria Newtoniana em linguagem Einsteiniana e a métrica (14.27).

Newton e Einstein
Do ponto de vista físico, a TGR se fundamenta sobre 3 hipóteses:
i. a constância da velocidade da luz;

ii. a Teoria Especial da Relatividade e

iii. o princípio da equivalência fraco (sobre o qual falaremos mais


abaixo).
A primeira condição combinada com o fato que a Física é a mesma
em qualquer referencial inercial levou à TER. A TER traz em seu bojo
a ideia da covariância das leis da física: as leis da natureza devem ser
expressas por equações que sejam válidas em qualquer sistema de
coordenadas e em qualquer referencial inercial. Embora o princípio da
covariância não esteja diretamente relacionado às leis em si mas sim à
forma matemática através da qual as expressamos, a TER se ocupa em
última instância de fenômenos da natureza. O princípio da equivalência
tem um papel fundamental na TGR. Falemos primeiro do chamado
princípio da equivalência fraco: ele está relacionado ao fato que nas teoria
gravitacional de Newton a massa aparece em duas formas diferentes.
Temos por uma lado a massa inercial mi da 2ª de Newton e a massa
gravitacional m g da lei de gravitação universal. Quando combinamos
essas duas leis ficamos com
m g Mg
mi ~a = − G r̂, (14.28)
r2

© s.r. dahmen 2022


226 uma introdução à teoria do espaço e do tempo

onde Mg e m g são as massas gravitacionais dos corpos interagentes,


r é a distância entre eles e G = 6.67408 × 10−11 m3 kg−1 s−2 a cons-
tante gravitacional. A aceleração da partícula de massa inercial mi e
gravitacional m g vale
Mg m g
~a = − G 2 r̂ (14.29)
r mi
É um fato experimental que para todos os corpos mi e m g têm o
mesmo valor numérico. O princípio da equivalência fraco, princípio da
universalidade da queda livre ou princípio da equivalência de Galileu, como
também é conhecido, diz que a massa inercial e a massa gravitacional
tem o mesmo valor numérico e portanto todos os corpos num campo
gravitacional caem com a mesma aceleração. Este princípio também
pode ser expresso da seguinte forma: “Todas as partículas com as mesmas
coordenadas no espaço-tempo, na presença de um campo gravitacional, estão
sujeitas à mesma aceleração, independente de suas propriedades e de sua massa
de repouso 2 .” 2
Para ser mais preciso, alguns estudio-
sos diferenciam entre massa ativa e pas-
siva. A massa passiva é a massa do corpo
Há também o princípio da equivalência de Einstein. Em resumo ele diz: quando ele sofre a atração gravitacional.
“localmente um campo gravitacional e um referencial acelerado são totalmente Massa ativa é relativa à força que ele
exerce.
equivalentes. Para as mesmas condições iniciais, qualquer processo físico
ocorre nos dois da mesma maneira e não há como diferenciá-los através de
experimentos.” É importante o termo local na frase acima pois as linhas
de campo gravitacional gerados convergem para o centro de massa
do corpo que as gera. Assim, dois corpos que caem na presença de
um ~g aproximam-se um do outro, e isto em princípio é suficiente para
diferenciarmos um referencial acelerado de um campo gravitacional 3 . 3
L.D. Landau and E. L. Lifshitz, Teoria de
Voltemos um pouco ao texto original de Einstein, que transcrevo aqui 4 : Campos, Editorial Mir, Moscou, 1974, p.
XXXXX.
4
A. Einstein, Über den Einfluss der Schwer-
kraft aud die Ausbreitung des Lichtes
Em um campo gravitacional homogêneo (com aceleração da gravidade (Acerca da influência da força gravita-
γ) encontra-se um sistema de coordenadas K em repouso e de tal modo cional na propagação da luz), Annalen
orientado, que as linhas de campo do campo gravitacional apontam na der Physik 35 (1911), 898.
direção do eixo z negativo. Em uma região do espaço sem campos gravita-
cionais se encontra um segundo sistema de coordenadas K 0 , que se move
com aceleração constante γ na direção do eixo z positivo (aceleração γ).
Para não complicar desnecessariamente a discussão, desprezemos mo-
mentaneamente a teoria da relatividade e consideremos os dois sistemas
segundo a cinemática e mecânica usual [isto é, Newtoniana] ... desde
que nos restrinjamos a processos puramente mecânicos dentro do escopo
de validade da mecânica de Newton, temos certeza que os referenciais K
e K 0 são equivalentes ... nosso argumento [i.e que campos gravitacionais e
campos de aceleração são equivalente] só terá no entando um significado
mais profundo, quando os sistemas K e K 0 foram totalmente equivalentes
para todos os processos físicos, ou seja quando todas as leis da natureza
vistas por K e por K 0 forem totalmente iguais. Quando tomamos isto
como hipótese, obtemos um princípio que, caso verdadeiro, tem um
profundo significado heurístico.

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 227

Einstein mostra, neste e em um trabalho subsequente, o desvio da luz


num campo gravitacional e assim estende o princípio da equivalência
para a eletrodinâmica. O princípio da equivalência de Einstein pode
ser ilustrado na figura abaixo.

Figura 14.2: O princípio da equivalência


do campo gravitacional e de um campo
−a de aceleração a. O observador da es-
querda se encontra no espaço livre, sem
campo gravitacional, mas sujeito a uma
aceleração −a que é igual em módulo a
B’ B’ aceleração da gravidade que o observa-
dor da direita experimenta estando sobre
a superfície da Terra. O observador da
esquerda mede o desvio da luz que se
A propaga de A para A0 bem como a mu-
A
dança da frequência da luz emitida em B
A’ A’ e captada em B0 e a aceleração com que a
maçã “cai”J̇á o observador sobre a Terra
mede os mesmos desvios e variação da
frequência da luz bem como a aceleração
da maçã ao cair. De acordo com o princí-
pio da equivalência de Einstein nenhum
a a
dos observadores tem como determinar
se está num referencial acelerado ou na
presença de um campo gravitacional.
B B
TERRA

Para obter a teoria da gravitação de Newton como limite da teoria de


Einstein, vamos rever alguns fatos importantes. Da mesma maneira que
o campo elétrico E pode ser escrito a partir de um potencial, também
o campo gravitacional g também pode ser expresso em função do
potencial gravitacional
g = −∇ Φ (14.30)
e portanto temos uma lei de Gauss para a gravitação na forma

∇ · g = −4πGρ → = ∇2 Φ = 4πGρ (14.31)

onde ρ é uma densidade de massa.

O limite Newtoniano da Relatividade Geral


Vamos imaginar um campo gravitacional fraco, como o campo gravita-
cional do Sol no sistema solar. Precisamos primeiro entender o que é a
aceleração gravitacional na linguagem de Einstein. Para isto iniciemos
pela equação da geodésica

d2 x µ α
µ dx dx
β
2
+ Γ αβ =0 (14.32)
dτ dτ dτ
Consideremos uma partícula inicialmente em repouso. Se este for o
caso, todas as três componentes espaciais de sua quadrivelocidade

© s.r. dahmen 2022


228 uma introdução à teoria do espaço e do tempo

serão identicamente nulas u j = dx j /dτ = 0. A componente temporal


u j = dx0 /dτ = c dt/dτ não será nula e portanto, na somatória acima,
apenas os elementos com α = β = 0 são diferentes de zero. E expressão
acima se reduz à
d2 x j j dx0 dx0
= −Γ 00 dτ dτ
dτ 2
j d(ct) d(ct)
= −Γ 00
dτ dτ
 2
j dt
= c2 Γ 00 (14.33)
dt
Agora, como queremos medir a aceleração do ponto de vista de um
observador que está com seu relógio sincronizado no instante em que
a partícula está parada junto a ele, temos dt = dτ. Como a aceleração
da gravidade é definida com a aceleração de um partícula em queda
livre instantaneamente em repouso temos dt/dτ = 1 e portanto, da
expressão acima
d2 x j j
= a j = −c2 Γ 00 (14.34)
dt2
A métrica no espaço plano (sem gravidade) é conhecida, e tem os
valores ηµν (−1, 1, 1, 1). Estamos interessados no limite de campos
fracos (Newtonianos) e portanto assumimos que a métrica do espaço
µν se desvia pouco da métrica de Minkowski, isto é

gµν = ηµν + hµν . (14.35)

Em outras palavras, cada elemento da matriz hµν  1. Por outro lado


j
os símbolos de Christoffel Γ 00 são, por definição (vide eq 12.76):
 
j 1 jν ∂gµ0 ∂gµ0 ∂g00
Γ 00 = g + − (14.36)
2 ∂x0 ∂x0 ∂x ν
Estamos considerando um tensor métrico que não depende do tempo,
isto é uma métrica estática. Portanto os primeiros dois termos da
expressão acima são nulos e nos resta:

j 1 ∂g
Γ 00 = − g jν 00 (14.37)
2 ∂x µ
Uma vez que a métrica é diagonal, apenas os termos em g jν para os
quais j = ν são diferentes de zero, e portanto

j 1 ∂g
Γ 00 = − g jj 00j . (14.38)
2 ∂x
Como gµν = 1/gµν e na aproximação de campos gravitacionais fracos
µν = ηµν + hµν , a expressão acima se reduz à:

j 1 1 ∂(η00 + h00 ) 1 1 ∂h00


Γ 00 =− =− (14.39)
2 η jj + h jj ∂x j 2 η jj + h jj ∂x j

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 229

onde usamos o fato ao passar da penúltima para a última equação que


ηµν é a métrica de Minkowski e portanto constante. Na aproximação
hµν  1 podemos desprezar o termo no denominador e sendo η jj = 1
ficamos finalmente com
j 1 ∂h00
Γ 00 =− (14.40)
2 ∂x j
Comparando este resultado com (14.34) temos:

c2 ∂h00
aj = . (14.41)
2 ∂x j
Disto segue que o potencial gravitacional Newtoniana está relacionado
ao termo perturbativo da métrica via

Φ
h00 = −2 (14.42)
c2
Portanto, no limite perturbativo (campos gravitacionais fracos) o ele-
mento de linha do
 espaço onde atua a gravidade de Newton vale
ds2 = − 1 + 2 cΦ2 c2 dt2 + dx2 + dy2 + dz2

De volta a Schwarzschild

Em posse deste resultado podemos retornar à métrica de Schwarzs-


child e deteminar a constante de intergração, como prometido. O que
acabamos de ver é que no limite Newtoniano podemos escrever que a
componente tt da métrica g e a aceleração valem

c2 0
gt t = −c2 (1 − htt ), a= h . (14.43)
2 tt
Mas sabemos também que na gravitação de Newton a aceleração vale

GM
a=− (14.44)
r2
onde G é a constante de gravitação universal e M a massa do corpo
que gera o campo gravitacional. Isto significa que

2GM 1
h0tt = − (14.45)
c2 r 2
Integrando h0tt em r obtemos

2GM 1
htt = + const. (14.46)
c2 r
sob a condição que a métrica é plana para r → ∞ e portanto limr→∞ htt =
0, logo K = 0. Disto sobre
 
2 2GM
gtt = −c 1− 2 (14.47)
c r

© s.r. dahmen 2022


230 uma introdução à teoria do espaço e do tempo

Substituindo este valor na solução de Schwarzschild (14.27) chegamos


finalmente à famosa métrica de Schwarzschild:

2GM −1 2
   
2GM 2 2
ds2 = − 1 − 2 c dt + 1 − 2 dr + r2 dθ 2 + r2 sin2 θ dϕ2
c r c r
(14.48)
A grandeza
2GM
rS = (14.49)
c2
é o chamado raio de Schwarzschild. Para que tenhamos uma noção
da sua ordem de grandeza, reproduzimos abaixo alguns valores para
objetos físicos de diferentes dimensões.

Massa Raio de Schwarzschild Tabela 14.1: ` PÎ o famoso comprimento


de Planck = h̄ G/c3 . O comprimento
de Planck é a menor distância para a qual
elétron me = 9.1 × 10−31 kg 1.3 × 10−60 m os modelos da física atuais, cujas previ-
massa de Planck m P = 2 × 10−8 kg 1.6 × 10−35 m = ` P † sões são experimentalmente corrobora-
dos, ainda fazem sentido.
escala humana m = 1 kg 1.5 × 10−27 m ∗ Horizonte visível do Universo.

Terra m T = 5.9 × 1024 kg 7 mm


Sol mS = 2.0 × 1030 kg 3 km
Universo mU = 1.6 × 1055 kg ≈ 1028 m = RU C

Este resultado por exemplo mostra por qual motivo podemos usar
a gravitação de Newton para nosso sistema solar: se colocarmos a
distância da Terra ao Sol r ≈ 148.15 × 106 km ficamos com
rs 3
= × 10−6 ≈ 2 × 10−8 (14.50)
r 148.15
ou seja, a métrica é praticamente plana.

Buracos Negros

Quando tentamos visualizar um espaço com métrica de Schwarzschild


sempre esbarramos na nossa incapacidade de visualizar uma espaço
curvo de 3 + 1 dimensões. Uma maneira de fazermos isto é fixando
duas das coordenadas, por exemplo

• considerando uma fatia do espaço-tempo com t = constante;

• considerando um ângulo fixo, e.g. θ = π/2.

Se fizermos isto, ficamos com uma superfície bidimensional, pois a


métrica se reduz à
 r  −1 2
ds2 = 1 − S dr + r2 dϕ2 (14.51)
r
Para visualizar procedemos como de costume: imaginamos o espaço
R3 e a superfície acima nela imersa, adicionando uma terceira variável z

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 231

e representando a métrica acima como a de um espaço em coordenadas


cilíndricas
  2 
dz
ds2 = dz2 + dr2 + r2 dϕ2 = 1 + dr2 + r2 dϕ2
dr

Disto temos que


2 
r  −1
 
dz 
1+ = 1− S (14.52)
dr r

e portanto ficamos com uma equação diferencial em z

dz 1
= q (14.53)
dr r
r −1 S

cuja solução é

1
Z q
z= q dr = 2 (r − rS )rS + constante (14.54)
r
rS −1

Esta superfície é o famoso parabolóide de Flamm, ilustrado abaixo.

Figura 14.3: O parabolóide de Flamm. Na


figura, quando r = rS (plano z = 0) a mé-
trica exterior de Schwarzschild “termina”
no sentido que a derivada é infinita e
portanto o interior do buraco negro não
é acessível e está causalmente desconec-
tado da física para r > rS . Autoria: H.
Hinrichsen, com permissão.

Singularidade real ou matemática?

A comparação que fizemos entre a teoria Newtoniana como limite


da Teoria de Schwarzschild para campos fracos reforça o fato que a
métrica de Schwarzschild é a métrica do espaço exterior a uma massa M
com simetria esférica. Por isto ela é normalmente chamada de métrica

© s.r. dahmen 2022


232 uma introdução à teoria do espaço e do tempo

exterior de Schwarzschild. Olhando para os termos g00 e g11 da métrica,


nos vemos que ao passarmos de um r > rS para um r < rS há uma
troca de sinal na métrica, ou seja r e t invertem os papéis: r passa a ser
uma coordenada temporal e ct uma coordenada espacial. Para r < rS a
métrica passa a depender do tempo. Além disso, em r = 0 e r = rS a
métrica apresenta uma singularidade. No primeiro caso temos g00 →
−∞ e no segundo g1 1 → ±∞. A singularidade da métrica em r = rS
é uma consequência da não-linearidade das equações de Einstein, e
acreditou-se durante muito tempo que esta singularidade representaria
uma singularidade no espaço-tempo. Porém, há singularidades que
são devido à escolha de coordenadas: por exemplo, as coordenadas no
Polo Norte do nosso planeta apresentam uma singularidade, embora
não há nada de singular neste ponto, afinal todos os pontos de uma
esfera são equivalentes. É a nossa escolha de coordenadas – latitudes
e longitudes – que faz com que a longitude não seja definida no Polo
Norte. Este tipo de singularidade devido à escolha de coordenadas é
uma chamada singularidade removível e por mudança de coordenadas
ela desaparece.

Como exemplo, tomemos um elemento de linha da forma


dξ 2
ds2 = + 4ξ dϕ2 (14.55)
ξ
que tem uma singularidade em ξ = 0. Pela transformação ξ = r2 /4 o
elemento de linha se torna

ds2 = dr2 + r2 dϕ2 (14.56)

A singularidade de Schwarzschild em r = rS é uma singularidade de


coordenada apenas. Isto fica também claro pois todas as grandezas
invariantes que podemos calcular do tensor de curvatura, como det =
−r4 sin2 θ e o escalar de curvatura R = gµν Rνµ são finitas em r = rS .
Um observador, tido idealmente como um ponto, não observaria nada
estranho ao passar pelo raio de Schwarzschild.A singularidade de
Schwarzschild não é uma singularidade no espaço-tempo, o que não
significa que ela não seja interessante e não tenha consequências
físicas.
Na maioria das situações de interesse, como o tabela (15.1) indica, o raio
de Schwarzschild é muito pequeno e não tem efeito algum na física. Na
verdade, para astros como o Sol e a Terra o raio de Schwarzschild nem
existe, na realidade, pois ele foi por nós calculado para o espaço-tempo
exterior à massa e a uma distância de ∼ 3 km do centro do Sol ou 7
mm do centro da Terra, as equações por nós resolvida para o vácuo
não são válidas.

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 233

A trajetória de fótons na métrica de Schwarzschild

Esta seção poderia se chamar “Por que o buraco é negro” pois pretende-
mos mostrar aqui a trajetória de um fóton na métrica de Schwarzschild.
Como é o caso na maioria dos problemas em que lidamos com a mé-
trica de Schwarzschild, as equações de movimento de pontos materiais
formam um conjunto de equações acopladas nas variáveis r, θ e ϕ e por
isto, para melhor entendermos o fenômeno, algumas simplificações e
aproximações são necessárias.
Na TGR, toda partícula livre tem por trajetória uma geodésica.
Quando falamos “livre” devemos lembrar que na TGR não existe
força gravitacional, e sim uma curvatura do espaço. Portanto por “li-
vre” entendemos partículas que não estão sujeitas à ação de outras
forças físicas. Vamos considerar o movimento radial de fótons, ou
seja dθ = dϕ = 0 ao longo de suas linhas de mundo. Em se tratando
de fótons, suas linhas de mundo são geodésicas nulas, ds2 = 0, que
quando substituída na métrica de Schwarzschild )14.27) resulta em

dr2  rS  2 2
rS = 1 − c dt , (14.57)
1− r r

ou, tirando a raiz quadrada de ambos os lados

dr  r 
= ± 1− S (14.58)
dt r
onde o sinal + e − indicam um fóton que se move para longe ou
para perto da massa, respectivamente. Estas equações mostram que
ao aproximar-se de rS a velocidade do fóton → 0, mas este resultado
vem do fato da singularidade de coordenadas que discutimos acima e
não tem realidade física. É preciso estudar esta equação em coordena-
das apropriadas, as coordenadas de Eddington-Finkelstein 5 . Vamos 5
Arthur S. Eddington (1882 - 1944), céle-
estudar o caso de um fóton que se aproximada da massa (sinal − na bre astrônomo e físico inglês, escreveu os
primeiros artigos em inglês explicando
equação acima) e passa pelo raio de Schwarzschild. Reescrevamos a a TGR para o público de língua inglesa.
equação acima na forma Coordenou um dos famosos experimen-
tos de 1919 sobre a deflexão da luz pelo
r campo gravitacional do Sol. David R.
dr = −cdt (14.59) Finkelstein (1929–2016) foi um físico ame-
1 − rS
ricano, especializado em TGR.
e a integremos
r
Z Z
dr = − c dt −→ r + rS ln |r − rS | = −ct + K (14.60)
1 − rS
onde K é uma constante de integração. A idéia é escrever a equação na
forma
r = −ct̄ (14.61)
definindo uma nova coordenada temporal (coordenada de Eddington-
Finkelstein) de tal modo que no relógio que meça t̄ o fóton se mova na

© s.r. dahmen 2022


234 uma introdução à teoria do espaço e do tempo

direção radial com velocidade −c. Uma comparação desta forma com
a equação acima nos mostra que
rS
t̄ = t + , ln |r − rS | (14.62)
c
Como dito, este é o tempo medido por um relógio que é diferente do
tempo de coordenada t de Schwarzschild mas para o qual o fóton se
move com velocidade c constante. Com um pouco de álgebra podemos
reescrever a métrica de Schwarzschild em termos de dt̄ de tal modo
que (14.27) se torna
 r 
ds2 = 1 + S dr2 + r2 dθ 2 + r2 sin2 θ dϕ2
r
r  r 
+2 S c dt̄ dr + 1 − S c2 dt̄2 (14.63)
r r
[Este resultado nos mostra como muitas vezes, dependendo do pro-
blema, a escolha de coordenadas adequadas faz toda a diferença! Mas
obviamente não devemos acreditar que isto caiu do céu: há muito tra-
balho envolvido em achar as coordendas corretas.] Nestas coordenadas,
a equação da geodésica ds2 = 0 para o fóton se movendo radialmente
(dθ = dϕ = 0) vale então
 r  r  r 
1 + S dr2 + 2 S c dt̄ dr + 1 − S c2 dt̄2 = 0, (14.64)
r r r

que, dividida por c2 dt̄2 nos leva à:


 2  
 rS  dr rS dr  r 
1+ +2 + 1− S = 0 (14.65)
r cdt̄ r cdt̄ r

que nada mais é que uma equação de 2º grau para dr/cdt̄. Temos duas
raízes possíveis para esta equação, a saber:
 
dr
= −c
dt̄ in
r − rS
 
dr
= c (14.66)
dt̄ out r + rS

Notemos que quando rS = 0 temos (dr/dt̄)out = c pois obviamente


neste caso a métrica é plana e a velocidade do fóton deve valer c se-
gundo a TER. Vamos buscar uma interpretação física destes resultados.
Esta análise fica mais fácil de olharmos o comportamente do cone de
luz do emissor de fótons que passa pela “horizonte de Schwarzschild”
ou seja, a esfera de raio rS . A imagem reproduz as propriedades da
velocidade dos fótons dada pelas equações (14.66), representada pelas
laterais externas do cone-de-luz: a lateral esquerda representa um fóton
movendo-se em direção à rS ao passo que a lateral direita representa
um fóton se movendo para longe do horizonte.

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 235

Figura 14.4: O comportamento do cone


de luz de um emissor de fótos ao se apro-
ximar do raio rS ou horizonte de Schwarzs-
child. Fonte: Grøn e Næss.

Devemos primeiro notar que o corte esquerdo do cone de luz (ingoing


photon) sempre faz um ângulo de 45 ° com o eixo temporal pois segundo
a 1ª equação em (14.66), a velocidade do fóton é sempre igual à −c,
independende de sua posição r. Porém, a velocidade de um fóton que
se afasta (outgoing photon) depende de r, como mostra a 2ª equação
em (14.66) e portanto o corte do lado direito do cone faz um ângulo
que, para r → ∞ vale 45 ° mas que vai diminuindo à medida que nos
aproximados do horizonte. Exatamente na linha do horizonte r = rS
o numerador desta equação se torna 0, o que significa que o fóton
emitido para fora deste ponto, não conseguirá jamais sair para além de
rS . Nesta posição portanto, o corte direito do cone é paralelo ao eixo
temporal.
Quando o emissor estiver em r < rS , mesmo que emita um fóton
na direção para fora, a velocidade do fóton será negativa e ele se
moverá para dentro! Como todos os corpos materiais tem suas linhas
de mundo sempre dentro do cone-de-luz, qualquer nave espacial ou
partícula, uma vez passado o event horizon, não mais conseguirá escapar.
Como para quem o observa de fora não é possível ver qualquer fóton
saindo, o buraco se nos apresenta como um corpo perfeitamente negro.
Estes resultados nos permitem estudarmos dois fenômenos que foram
fundamentais para a confirmação da TGR de Einstein e são discutidas
em todos os bons livros sobre o assunto: a precessão do periélio do
planeta Mercúrio e o desvio da luz no campo gravitacional.

© s.r. dahmen 2022


236 uma introdução à teoria do espaço e do tempo

1. A precessão do periélio de Mercúrio.

A precessão do periélio do planeta Mercúrio é uma das mais fasci-


nantes comprovações da TRG de Einstein. O periélio, do grego antigo
πeρι (peri = próximo) e ηλιoς (helios = Sol) é o ponto da órbita mais
próximo ao Sol. No caso de uma estrela ou outro corpo celestre qual- 6
Um modelo simples que usa a teoria
da gravitação de Newton para calcular
quer, este ponto é chamado de periápside. No caso de Mercúrio, sendo este efeito foi apresentando no artigo de
a órbita uma elipse que não se fecha sobre si mesma, este ponto se M. P. Price e W. F. Rush, Non relativistic
move por um total de 575 00 por século, ou seja, 575 segundos de arco contribution to Mercury’s perihelion, Am.
J. Phys. 47(6) (1979), 531 - 534 . Nele os
por século. Destes, 532 00 podem ser achados usando a gravitação de autores consideram os planetas exteriores
Newton considerando-se a atração gravitacional dos outros planetas como um anel de densidade uniforme de
massa λi = Mi /2πRi onde Mi é a massa
sobre Mercúrio 6 . Porém, os 43 00 de arco restantes so puderam ser do i-ésimo planeta e Ri o raio de sua
explicados com a TGR. órbita.

Não devemos menosprezar a importância deste problema para a histó-


ria da astronomia. O astrônomo francês Urbain le Verrier (1811–1877),
que previu a existência de Netuno matematicamente observando a
anomalia da órbita de Urano, mediu a precessão do periélio de Mer-
cúrio em 1859 como sendo de 565 00 . Ele realizou então os cálculos
teóricos, segundo a gravitação de Newton, e chegou a um valor de
527 00 , faltando portanto 38 00 . Esta diferença foi mais tarde melhorado
pelas medidas do astrônomo canadense Simon Newcomb ()1835 – 1909)
para 43 00 , que somados aos 532 00 previstos pela teoria, completam o
Figura 14.5: A precessão do periélio, pois
valor de 575 00 experimentalmente observado. É interessante notar que a órbita não é fechada sobre si. Entre as
Einstein chegou ao resultado correto em 1914, portanto um antes do causas estão o achatamento do Sol nos
polos, a influência de outros planetas na
trabalho de Schwarzschild ser publicado!
órbita e a Relatividade Geral.

Vamos resolver o problema usando aquilo que sabemos do formalismo


Lagrangeano da Mecânica e o elemento de linha de Schwarzschild
 r   r  −1 2
ds2 = − 1 − S c2 dt2 + 1 − S dr + r2 dθ 2 + r2 sin2 θ dϕ2
r r
(14.67)
Segundo a teoria da relatividade geral, Mercúrio (ou qualquer outra
massa) se move ao longo de uma geodésica da métrica de Schwarzs-
child, ou seja, ele tem apenas energia cinética. Portando sua Lagrange-
ana no espaço-tempo vale
1 1 dx α dx β 1
L= mv2 = gαβ = gαβ ẋ α ẋ β (14.68)
2 2 dτ dτ 2
onde τ é o tempo próprio de Mercúrio. Agora, vamos substituir nesta
expressão a métrica de Schwarzschild. Isto nos leva à
  
m r  1
L= − 1 − S c2 ṫ2 + ṙ 2
+ r 2 2
θ̇ + r 2
sin2
θ ϕ̇ 2
. (14.69)
2 r 1 − rrS
Porém, devemos nos lembrar de um outro detalhe importante: um
quadrivetor (nossa velocidade) tem, segundo a relatividade restrita,

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 237

um módulo sempre igual em qualquer referencial inercial. No caso da


quadrivelocidade o módulo vale

v2 = gαβ ẋ α ẋ β = c2 (14.70)

Como a Lagrangeana é igual à (1/2)mv2 isto implica que a equação


acima também que
1 m m 2
L= mv2 = gαβ ẋ α ẋ β = c (14.71)
2 2 2
Igualando as duas expressões para L temos então
 r  1
− 1 − S c2 ṫ2 + ṙ2 + r2 θ̇ 2 + r2 sin2 θ ϕ̇2 = c2 (14.72)
r 1 − rrS

Temos agora as equações de Euler-Lagrange

∂L ∂L
 
d
− =0 (14.73)
∂x α dτ ∂ ẋ α
que nos dão as equações de movimento do planeta em questão. Sendo
x0 = ct, x1 = r, x2 = θ e x3 = ϕ, temos quando α = 0

∂L ∂L d ∂L
   
d
− = 0+
∂x0 dτ ∂ ẋ0 dτ ∂ṫ
 
d  rS 
= 1− ṫ
dτ r
= 0 (14.74)

Tomemos agora o caso x2 = θ. Aplicando a equação de Euler-Lagrange


para esta variável temos
d 2
(r θ̇ ) − r2 sin θ cos θ ϕ̇2 = 0 (14.75)

e para x3 = ϕ somos levados à
d 2
(r sin2 θ ϕ̇) = 0 (14.76)

Não precisamos fazer as mesmas contas para a variável x1 = r pois uma
vez que já temos as equações para θ, φ e t, basta substituirmos suas
soluções na expressão da Lagrangeana original e ficaremos com uma
equação diferencial para a variável r. Estas quatro equações bastam!
Além do que, embora saibamos fazer as derivadas em r, aplicar a
equação de Euler-Lagrange para esta variável se resume à álgebra
trabalhosa e desnecessária.

Como analisar as equações

Sempre que vamos analisar um problema em física usando uma nova


teoria – mas que deve conter em si a teoria antiga como caso limite –

© s.r. dahmen 2022


238 uma introdução à teoria do espaço e do tempo

devemos recorrer aos resultados conhecidos para ver quais são man-
tidos e quais mudam. Um detalhe muito importante das soluções de
Newton é que o movimento tem estabilidade planar, ou seja, o corpo
que orbita o Sol mantém o plano de sua órbita. O que define o plano da
órbita, em variáveis esféricas, é a coordenada θ. Por isso vamos olhar
para a equação (14.75) e considerar o movimento no plano equatorial,
ou seja θ = π/2, por uma questão de simplicidade. Vamos também
assumir que em τ = 0 temos θ̇ = 0. Neste caso a equação se reduz à

d 2
(r θ̇ ) = 0 → r2 θ̇ = constante (14.77)

Problema 1. Analise esta equação e explique com suas palavras o


porquê dela ser equivalente a dizer que o movimento é plano. Lem-
bre que ela é válida para todo τ.

Vamos analisar agora o movimento no plano xy (equatorial) da órbita.


Neste caso, da equação (14.76), para θ = π/2 teremos

d 2
(r ϕ̇) = 0 → r2 ϕ̇ = L (L = constante) (14.78)

A grandeza L é o momento angular do corpo por unidade de massa.
Vamos integrar agora a equação (14.74), o que nos dá
 r 
1 − S ṫ = K (K =constante) (14.79)
r
Substituindo estes nosso resultados em (14.72) com θ = π/2 ficamos
com
K2 ṙ2
− − r2 ϕ̇2 = c2 (14.80)
1 − rrS 1 − rrS
Esta não é uma equação trivial. A posição r de Mercúrio depende
do tempo e de ϕ. A experiência mostra que a maneira mais fácil de
resolver esta equação é através da substituição

1
r= (14.81)
y

Atenção: y é apenas uma variável e não deve ser confundida com a


coordenada cartesiana y. Para esta nova variável temos
 
dr d 1
ṙ = =
dτ dτ y
1 dy dϕ
= − 2
y dϕ dτ
1 dy
= − 2 ϕ̇
y dϕ
1 dy L
= − 2 (14.82)
y dϕ r2

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 239

onde usamos a equação (14.78), substituindo ϕ̇ por H/r2 . Como r2 =


1/y2 a expressão acima acaba ficando mais simples:
dy
ṙ = − L (14.83)

Substituindo esta resultado na equação diferencial (14.80) e multipli-
cando por (1 − y rS ) chega-se à
 2
K2 dy c2
2
− − y2 (1 − y r S ) = 2 (1 − y r S ) (14.84)
L dϕ L
que, rearranjando os termos, nos leva à
 2
dy r c2 K 2 − c2
+ y2 = r S y3 + S 2 y + . (14.85)
dϕ L L2
Derivando esta equação uma vez na variável ϕ obtemos finalmente

d2 y 3r r c2
2
+ y = S y2 + S 2 . (14.86)
dϕ 2 2L

Lembrando que o raio de Schwarzschild vale rS = 2GM/c2 obtemos,


ao substituí-lo na expressão acima, o resultado:

d2 y 3GM GM
+ y = 2 y2 + 2 . (14.87)
dϕ2 c L
No limite clássico rS = 0 (c → ∞) obtemos a equação para a órbita na
mecânica newtoniana (vide discussão a seguir, em particular a equação
(14.93)).

[LEITURA FACULTATIVA] Façamos aqui uma pausa para comparar


este resultado ao resultado clássico do movimento do planeta ao redor
do Sol segundo Newton. Consideremos a Langrangiana L de uma
massa m na presença de um potencial central V (r ) = − GMm/r escrita
em coordenadas esféricas:
1 1  mM
L = m v2 − V (r ) = m ṙ2 + r2 θ̇ 2 + r2 sin2 θ ϕ̇2 + G

(14.88)
2 2 r
As equações de Euler-Lagrange neste caso nos dão as equações de
movimento:
d GmM
(mṙ ) = mr θ̇ 2 + mr sin2 θ ϕ̇2 −
dt r2
d
(mr2 θ̇ ) = mr2 sin θ cos θ ϕ̈
dt
d
(mr2 sin2 θ ϕ̇) = 0 (14.89)
dt
Estas equações são invariantes pela troca θ → π − θ, pois nesta caso
sin θ → sin θ, cos θ → − cos θ e θ̇ → −θ̇. Isto significa que se tivermos

© s.r. dahmen 2022


240 uma introdução à teoria do espaço e do tempo

um problema de valor inicial (t = 0) com θ = π/2 e θ̇ = 0, ou seja,


um movimento que se dá inicialmente no plano equatorial, a uma
solução {r (t), θ (t), ϕ(t)} qualquer corresponde uma solução {r (t), π −
θ (t), ϕ(t)}. Isto contradiz a unicidade da solução para o valor inicial
adotado a menos que θ (t) = π/2. Portanto o corpo se mantém no
plano equatorial e como qualquer plano é equivente ao equatorial,
podemos assumir simplesmente que θ = π/2 e reduzir as equações de
movimento à:
GM
r̈ = r ϕ̇2 −
r2
d 2
(r ϕ̇) = 0 (14.90)
dt
A segunda equação, como sabemos, implica que o momento angular
mL = mr2 ϕ̇ é conservado. No caso L = 0 a primeira equação se torna
r̈ = − GM
r2
que corresponde ao caso de um corpo que cai radialmente
no potencial gravitacional. Como estamos interessados na precessão do
periélio, relacionado à variável ϕ, é conveniente expressar as relações
acima tomando ϕ como parâmetro. Isto significa escrever
∂ ∂ L ∂
= ϕ̇ = 2 (14.91)
∂t ∂ϕ r ∂ϕ
Isto nos leva à equação

L2
 
2 GM GM L ∂ L ∂r
r̈ = r ϕ̇ − 2 −→ 3
− 2 = 2 . (14.92)
r r r r ∂ϕ r2 ∂ϕ
Esta equação fica mais fácil de resolver com a substituição y = 1/r,
que, após um pouco de álgebra nos dá:

d2 y GM
+y = 2 . (14.93)
dϕ2 L
A solução desta equação é
1 GM
y( ϕ) = = A cos( ϕ − ϕ0 ) + 2 . (14.94)
r ( ϕ) L
Com uma translação apropriada de ϕ podemos escolher ϕ0 = 0 e A ≤ 0
de modo a ficarmos com uma solução da forma
1 GM   AL2
= 2 1 − e cos ϕ ; e=− . (14.95)
r L GM
Esta é a equação de uma elipse de excentricidade e.

O caso relativístico (14.87) se reduz a uma equação diferencial de 2ª


ordem em y( ϕ):
d2 y
+ y = a y2 + b (14.96)
dϕ2

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 241

com a = 3GM/c2 e b = GM/( L2 ). Nosso objetivo agora não é calcular


a solução exata da equação acima, mas usar argumentos físicos para
achar uma solução aproximada. A órbita de Mercúrio – apesar de ser
a de maior excentricidade e entre os planetas do sistema solar com
e = 0.206 – ainda sim se aproxima muito de um círculo. A equação do
círculo é dada igualando d2 y/dϕ2 = 0, ou seja,

d2 y
+ y = a y2 + b −→ y0 = a y20 + b, (14.97)
dϕ2

que é a equação de um círculo de raio 1/y0 . Vamos supor agora que


tenhamos um pequeno desvio da órbita circular, isto é, um desvio y1
tal que y1  y0 . Substituindo nossa solução y = y0 + y1 na equação
diferencial original obtemos:

d2 y1
+ y1 + y0 = a ( y0 + y1 )2 + b (14.98)
dϕ2

ou seja
d2 y1
+ y1 = 2ay0 y1 + ay21 . (14.99)
dϕ2
Sendo y1 muito pequeno podemos desprezar o termo quadrático em y1
e escrever finalmente

d2 y1
+ (1 − 2ay0 )y1 = 0. (14.100)
dϕ2

Esta equação diferencial harmônica tem como solução


p
y1 = e cos( 1 − 2ay0 ϕ) (14.101)

onde e é uma constante. A solução é portanto


 p 
y = y0 + y1 = y0 1 + e cos( 1 − 2ay0 ϕ) , (14.102)

ou, escrevendo em termos do raio r

1 1  p 
= 1 + e cos( 1 − 2ay0 ϕ) . (14.103)
r r0

Para a = 0 temos a solução clássica de Newton. Porém, se a 6= 0 o valor


de r mínimo (periélio) não mais ocorre a cada incremento de 2π na
p
variável ϕ mas passado um intervalo de 2π/ 1 − 2ay0 , ou seja, dado
um ponto onde ocorreu um mínimo para r, o próximo mínimo não
ocorrá no mesmo ângulo ϕ do último periélio mas em um um outro
ângulo cuja diferença ∆ϕ do ângulo anterior é
!
1
∆ϕ = 2π p −1 (14.104)
1 − 2ay0

© s.r. dahmen 2022


242 uma introdução à teoria do espaço e do tempo

Podemos se quisermos expandir o termo o primeiro termo da expressão


acima na forma
1
p ≈ 1 + ay0 , (14.105)
1 − 2ay0
que nos leva então à
∆ϕ = 2πay0 . (14.106)

Substituindo a por 3rS /2 chegamos finalmente à

rS
∆ϕ = 3π (14.107)
r0

Inserindo os valores para Mercúrio nesta expressão obtemos ∆ϕ =


5.03 × 10−7 rad. Isto é exatamente igual à 43 00 de arco, que era o fator
que faltava no cálculo newtoniano para chegar ao resultado observado
experimentalmente! A tabela abaixo apresenta as contribuições para
a precessão de Mercúrio devido a uma série de fatores: a atração
gravitacional dos outros planetas sobre Mercúrio, o fato do Sol não ser 7
O efeito relativístico descoberto em 1918
por Josef Lense (1890-1985) e Hans Thir-
uma esfera perfeita, o efeito relativistico de Lense-Thirring e resultado
ring (1888-1986) diz respeito à contribui-
previsto pela métrica de Schwarzschild que acabamos de deduzir 7 . ção devido à rotação da massa central, no
nosso caso o Sol.

Origem† Valor Tabela 14.2: † R. S. Park et al., Precession


of Mercury’s Perihelion from Ranging to the
Atração grav. de planetas 532.3035 00 MESSENGER Spacecraft, The Astronomi-
Oblaticidade do Sol 0.0286 00 cal Journal. 153 (3) (2017), 12.
* G. M. Clemence, The Relativity Effect
Relatividade Geral 42.9799 00 in Planetary Motions, Reviews of Modern
Precessão de Lense-Thirring 0.0020 00 Physics. 19 (4) (1947) 361–364.
Total previsto 575.31 00
Total observado* 574.10 ± 0.65 00

Um fato curioso: todo bom livro de mecânica clássica traz um capítulo


sobre o problema de 2 corpos interagindo via um potencial central e as
soluções em termos de órbitas fechadas (elipses). Entre os problemas
sugeridos ao final do capítulo se encontra muitas vezes um sobre a
possibilidade da órbita não se fechar, levando à precessão do periélio. 8
A. L. Fetter e J. D. Walecka, Theoretical
Mechanics of Particles and Continua, Inter-
Isto se dá pela introdução de um termo perturbativo no potencial, que
national Series in Pure and Applied Phy-
muitas vezes nos deixa em dúvida sobre o porquê exatamente o termo sics, McGraw-Hill, New York, 1980, pag.
perturbativo ter a forma que tem. Translitero aqui o problema 1.12 do 29.

excelente livro de Mecânica Clássica de Fetter e Walecka 8 :

1.12. The orbit of the planet mercury has an eccentricity 0.206 and a period 0.241
year; moreover, the perihelion advances slowly at a rate of 43 seconds of arc per
century. One possible explanation of this is that the potencial energy around the
sun has the form V = −(mMG/r )(1 + α GM/rc2 ) where α is a dimensionless
constant and MG/c2 ≈ 1.475 km characterizes the sun’s gravitational field.
Demonstrate that the resulting orbit indeed represents a precessing ellipse. Find
the magnitude and sign of α needed to fit the observed data.

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 243

Bem, se muitas vezes não entendemos o porquê de alguns livros tirarem


certos termos mágicos da cartola, um dia eventualmente acabaremos
descobrindo. Basta ter perseverança e nunca desistir!

Problema 2. O argumento usado para resolver a equação (14.87) por


meio de uma solução aproximada y = y0 + y1 com y1 /y0  1 foi
o fato da órbita de Mercúrio ser quase circular. Porém, podemos
analisar esta equação sob um outro ponto de vista: a diferença en-
tre a versão clássica (14.93) e a versão relativística (14.87) é o termo
quadrático em y. Desprezar este termo da equação significa dizer
que ele deve ser algumas ordens de grandeza menor que o termo
clássico. Usando os dados conhecidos do planeta Mercúrio, estime
a razão entre o termo relativístico e o termo clássico e mostre que
ele é da ordem de (v/c)2 , onde v é a velocidade orbital de Mercú- 9
Dica: para fazer a estimativa, lembre
que não basta calcular a constante que
rio. Com isto diga se nossa aproximação é justificada. Os dados de
multiplica y2 mas incluir a expressão in-
Mercúrio são: período da órbita = 87.96 dias; raio médio da órbita = teira, com uma estimativa do valor de y2
57.9 × 106 km; massa do Sol M = 1.98 × 1030 kg Lembre-se que L é o para este problema.

momento angular por unidade de massa 9 .

Todos os planetas do sistema solar apresentam uma precessão do perié-


lio, sendo o de Mercúrio o maior deles. O de Netuno, Urano e Plutão
não são conhecidos pois seus períodos orbitais ultrapassam o tempo
médio de uma vida humana e não há dados coletados. Um extenso e 10
G. C. Nyambuya, Azimuthally symmetric
theory of gravitation – I. On the perihelion
excelente artigo de revisão sobre o assunto é o de G.C. Nyambuya 10 .
precession of planetary orbits, Mont. Not. R.
Astr. Soc. 403 (2010), pp. 1381-1391.

valor calculado valor medido Tabela 14.3: Precessão do periélio da


Terra, de Vênus e de Mercúrio em
Terra 3.8 00 5.0 00 ± 1.2 00 segundos de grau por século. Em:
Vênus 8.6 00 8.4 00 ± 4.8 00 Eckhard Rebhan, Theoretische Physik: Rela-
tivitätstheorie und Kosmologie, Spektrum
Mercúrio 43.03 00 43.11 00 ± 0.45 00 Akademischer Verlag, Springer-Verlag,
Berlin u. Heidelberg, 2012, p. 307.

© s.r. dahmen 2022


244 uma introdução à teoria do espaço e do tempo

2. A deflexão da luz no campo gravitacional.

Para estudarmos o problema da deflexão da luz podemos usar a


equação da métrica (14.67) lembrando que, para a luz, sempre vale

ds2 = 0 (14.108)

Isto é o equivalente a tomar no lugar da equação (14.72) a equação


 r  1
− 1 − S c2 ṫ2 + ṙ2 + r2 θ̇ 2 + r2 sin2 θ ϕ̇2 = 0 (14.109)
r 1 − rrS
Se fizemos as mesmas aproximações (θ = pi/2) chegamos no equiva-
lente à equação (14.80)

K2 ṙ2
rS − − r2 ϕ̇2 = 0 (14.110)
1− r 1 − rrS
que nos leva a uma equação final muito parecida com a equação (14.87)
porém sem o termo clássico GM/L2 ! Isto era esperado pois na gra-
vitação newtoniana o fóton não sofre a ação do campo gravitacional!
Fazendo a mesma transformação de variáveis y = 1/r que fizemos no
problema anterior chegamos à:

d2 y 3GM
+ y = 2 y2 . (14.111)
dϕ2 c
Esta é a equação que vamos resolver.

Figura 14.6: A deflexão de um fóton pelo


Sol, com um ângulo de incidência baixo.
Fonte: Grøn e Næss.

Não estamos interessados numa solução geral mas apenas no caso


em que o fóton passa “raspando” pelo Sol (grazing photon). Nestas
situações a deflexão é bastante pequena, a trajetória é quase uma linha
reta. Neste caso, olhando para a figura acima e tomando o centro do
Sol como origem do sistema de coordenadas, temos a relação (vide
figura)
R
cos ϕ = (14.112)
r
onde r representa um ponto sobre a reta e R o raio do Sol. Vamos
chamar esta reta de y0 onde
1 cos ϕ
y0 = = (14.113)
r R

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 245

Sendo uma reta, ela obedece a equação

d2 y0
+ y0 = 0. (14.114)
dϕ2
Como no caso anterior, busquemos uma solução do tipo

y = y0 + y1 , y1  y0 . (14.115)

Substituindo esta solução na equação (14.111) onde, para simplificar,


voltamos a usar a no lugar de 3GM/c2 , ficamos com

d2 y1
+ y1 = a y20 (14.116)
dϕ2

onde desprezamos o termo de ordem y21 . Substituindo a expressão para


y0 acima ficamos finalmente com

d2 y1 a
+ y1 = 2 cos2 ϕ (14.117)
dϕ2 R
A solução deste tipo de equação diferencial tem a forma

y1 = A + B cos2 ϕ (14.118)

Problema 3. Mostre que para que esta função realmente seja solução
da equação diferencial acima, as constantes A e B devem satisfazer:
2a a
A= ; B=− . (14.119)
3R2 3R2
Ficamos assim finalmente com a expressão
1 cos ϕ a
y= = y0 + y1 = + 2 (2 − cos2 ϕ) (14.120)
r R 3R
Para r → ∞, ϕ → ϕ∞ e da expressão acima obtemos
cos ϕ∞ a
0= + 2 (2 − cos2 ϕ∞ ) (14.121)
R 3R
Para a hipótese da passagem do fóton de “raspão” , sabemos que
ϕ∞ ≈ π/2, desviando-se pouco deste valor. Por isso tomamos ϕ∞ =
π/2 + ∆ϕ. Para este valor temos

cos ϕ∞ = cos(π/2 + ∆ϕ) = − sin ∆ϕ ≈ −∆ϕ (14.122)

Substituindo este valor na expressão (14.121) ficamos com


∆ϕ a
0=− + 2 [2 − (∆ϕ)2 ] (14.123)
R 3R
De onde sai, desprezando o termo em ordem (∆ϕ)2
2a
∆ϕ = porm
3R

© s.r. dahmen 2022


246 uma introdução à teoria do espaço e do tempo

Pela figura vemos que o ângulo de deflexão é o dobro disso e


portanto
4a
∆ϕde f lect = (14.124)
3R
Substituindo o valor de a = (3/2)rS nesta expressão ficamos finamente
com o resultado
4a 2r
∆ϕde f lect = = S (14.124)
3R R
que corresponde, no caso do Sol, a um ângulo de 8.48 × 10−6 rads, ou
1.75 00 de arco.

3. Lentes Gravitacionais.

Uma das consequências da deflexão da luz por um campo gravi-


tacional de simetria esférica é que um feixe de raios paralelos pode
ser focado da mesma maneira que numa lente convexa. Olhando mais
atentamente para a figura abaixo vemos que surge não um foco mas
toda uma linha focal. Para um ponto P fora da linha focal mas dentro
da região de sobreposição de raios veríamos duas estrelas ao invés
de uma (supondo que o feixe de raios paralelos provenha da mesma
estrela). Caso estivéssemos exatamente sobre a linha focal, por questão
de simetria nossa primeira impressão é que veríamo uma imagem da
estrela na forma de um círculo (ou anel de luz). Porém nesta região
não se pode mais aplicar os resultados da óptica geométrica e cálculos
mais preciso que levam em conta o caráter ondular da luz mostra que
veríamos na realidade um ponto de luz de maior intensidade.

Figura 14.7: A lente gravitacional de um


corpo massivo de raio R0 . Num ponto so-
linha focal bre a linha focal veríamos a estrela como
um ponto de luz mas de maior intensi-
dade. Num ponto P ainda dentro da re-
gião de sobreposição de raios mas fora da
R0 linha focal veríamos 2 estrelas no lugar
∆ϕ de apenas uma.
D
P

O fenômeno da duplicidade de imagens para um observador que se


encontra na região de sobreposição de raios se chama lente gravitacional.
Olhando para a figura acima podemos ver que

R0
= tan ∆ϕ (14.124)
D

© s.r. dahmen 2022


schwarzschild: nosso sistema solar 247

onde R0 é o raio do corpo que gera a curvatura do espaço e D a distância


de seu centro até o ponto onde começa a região de sobreposição. Para
o caso de fótons por nós estudados na seção anterior temos ∆ϕ  1
e portanto podemos aproximar tan ∆ϕ ≈ ∆ϕ. Portanto a distância D
do astro à região de início do efeito de lente gravitacional é, nesta
aproximação
R0
D= (14.124)
∆ϕ

Problema 4. Estime a distância D da expressão acima para o nosso


Sol. Expresse sua resposta em termos de R (raio do sol) e anos-luz.
Estime também o valor de D para a estrela VY Canis Majoris, uma das
maiores estrelas conhecidas, com um raio de 2069 R e uma massa
da ordem de M = 17 ± 8 M . Para fazer sua estimativa tome o maior
valor de massa. Você pode tirar alguma conclusão destes resultados
em termos da observabilidade de lentes gravitacionais causadas por
estrelas?

O que é mais curioso é que este efeito foi previsto em 1912 por Einstein
antes que tivesse concluído a sua TGR, pois é possível calcular a traje-
tória da luz numa dada métrica gµν sem ter que resolver as equações
de Einstein. O efeito porém pareceu tão absurdo a Einstein que ele
não publicou seu resultado e só foi convencido de fazê-lo em 1936. A
descoberta experimental só foi feita 67 anos depois, em 1979.

© s.r. dahmen 2022


15
O modelo-padrão do Universo: o universo de Friedmann,
Lemaître, Robertson e Walker

Da mesma maneira que a Física de Altas Energias tem o seu modelo


padrão para as partículas elementares, a cosmologia relativística tem
o seu modelo padrão de universo: o modelo de Friedmann. Em 1922
o físico e matemático russo Alexander Friedmann apresentou uma
solução não estática das equações de Einstein que hoje leva seu nome.
O universo de Friedmann é o modelo de um universo em expansão.
Não obstante suas limitações e simplificações, ele é o fundamento de
toda a chamada cosmologia relativística e ponto de partida de todo
modelo cosmológico do universo em expansão. O mais interessante
é que Einstein inicialmente rejeitou o modelo, dizendo haver um erro
nas contas de Friedmann. O artigo de Friedmann foi publicado em
alemão na Zeitschrift für Physik, então o mais lido e apreciado de todos
os journals da década de 20.
No curto espaço de 11 meses, entre a submissão do artigo (29 de
Junho de 1929), o primeiro (18 de Setembro de 1922) e o segundo
comentários de Einstein (21 de Maio de 1923), o trabalho de Friedmann
passou da rejeição à aceitação pelo pai da TRG. No primeiro comentário,
publicado na Zeitschrift Einstein afirma:

Os resultados acerca de um universo não estacionário contidos no artigo [de Fri-


Figura 15.1: Alexander Alexandrovitch
edmann] me parecem suspeitos. Na realidade se verifica que a solução apresentada Friedmann (russo: Aleksandr Aleksan-
não satisfaz as equações de campo. drovitch Fridman, 1888 – 1925).

Basicamente o que Einstein afirma é que a solução de Friedmann para


as equações de campo estão erradas. A teoria literária diz que uma
tragédia, diferente da comédia, deve ser dividada em 5 atos : primeiro
a introdução, seguida de uma ascenção que leva ao clímax. Passado este
vem a queda que abre caminho para a tragédia final. Embora esta idéia
remonte ao poeta romano Horácio 1 e a história do artigo de Friedmann 1
Quintus Horatius Flaccus (65 - 8 AC)
não siga o esquema clássico de uma tragédia, se acrescentarmos a ela a foi um dos principais expoentes líricos
da língua latina durante o seu chamado
sua morte aos 35 anos de idade, após beber água contaminada e morrer Período de Ouro.
250 uma introdução à teoria do espaço e do tempo

de febre tifóide, temos todos os ingredientes de uma.


Em outubro de 1922, cópias da Zeitschrift já haviam chegado ao insti-
tuto em São Petersburgo onde Friedmann trabalhava, mas a resposta
de Einstein chegara à suas mãos antes, como uma carta de Friedmann
endereçada diretamente ao físico alemão e datada de 6 de Dezembro
atesta:

Caro Professor,
Através da carta de um amigo 2 que se encontra no momento no exterior, tive 2
Trata-se de Yuri Alexandrovitch Krut-
a honra de ser informado que o Sr. submeteu uma nota curta, a ser publicada kov (1890-1952), físico russo que partici-
no 11º volume da Zeitschrift für Physik, onde se afirma que, uma vez aceitas as pou do projeto de construção da bomba
atômica soviética. Krutkov percebeu o
hipóteses feitas em meu artigo “Acerca da Curvatura do Espaço”, seguiria das erro de Einstein com relação ao traba-
equações do universo deduzidas pelo Sr. que o raio de curvatura do universo é lho de Friedmann e teve vários encontros
uma grandeza independente do tempo. com o físico alemão a este respeito.

Friedmann mostra detalhadamente seus cálculos na carta enviada a


Einstein:

Considerando que a possibilidade da existência de um universo não estacionário


tenha algum interesse, permita-me apresentar aqui os cálculos que fiz ... para
sua verificação e julgamento crítico.

Apresentadas as contas Friedmann conclui:

Os resultados de meu cálculo mostraram que ... tanto um universo com curvatura
constante (e negativa) e um universo com uma curvatura que muda com o tempo
podem existir. A possibilidade de obter uma universo com curvatura constante e
negativa a partir de suas equações é de enorme interesse para mim e portanto lhe
peço para responder à minha carta, embora saiba bem o quão ocupado o Sr. deve
ser. Caso o Sr. confirme que os cálculos apresentados nesta carta são corretos,
peço a gentileza de informar aos editores da Zeitschrift für Physik sobre isto;
talvez, neste caso, o Sr. publique uma correção à sua afirmativa anterior ou
permita que parte desta carta seja publicada.

A resposta de Einstein veio rapidamente no mesmo journal

Em minha nota prévia critiquei o trabalho mencionado acima 3 . Contudo, minha 3


Einstein inclui o título do trabalho de
crítica foi baseada em um erro de cálculo da minha parte, como pude me convencer Friedmann no título de sua nota.
por uma carta de Friedmann a mim comunicada pelo Sr. Krutkov. Considero
os resultados do Sr. Friedmann corretos e lançam nova luz [sobre o tema].
Verifica-se que as equações de campo admitem não apenas soluções estáticas para
a estrutura do espaço com simetria central mas também dinâmicas (ou seja, que
variam no tempo).

Friedmann, em seu livro de divulgação científica O mundo enquanto


espaço e tempo afirmou:

A maneira mais correta e profunda para se estudar a geometria do universo com


ajuda da Teoria de Einstein é aplicando sua teoria a todo o universo e fazendo
uso da pesquisa em Astronomia.

Para concluir, fiquemos com outra passagem deste livro:

© s.r. dahmen 2022


o modelo-padrão do universo: o universo de friedmann, lemaître, robertson e walker 251

Pode-se chegar a basicamente dois tipos de universo: (1) do tipo estacionário, no


qual a curvatura do espaço não muda no tempo e (2) do tipo variável, no qual
a curvatura do espaço muda com o tempo. O primeiro tipo de universo pode
ser imaginado como uma esfera cujo raio não muda com o tempo; a superfície
bidimensional desta esfera e exatamente o espaço bidimensional de curvatura
constante. O segundo tipo, por sua vez, pode se visto com uma esfera que sempre
está mudando, ora aumentando seu raio, ora diminuindo como se estivesse se
comprimindo. O tipo estacionário envolve somente dois tipos de Universo, que
foram considerados por Einstein e de Sitter 4 . O tipo variável representa uma 4
O modelo de de Sitter, do físico e astrô-
grande variedade de casos. Pode haver aqueles casos em que o raio de curvatura nomo holandês Willem de Sitter (1872-
do universo está sempre aumentando no tempo e casos, também possíveis, onde 1934) é uma solução para as equações de
Einstein com métrica plana e sem maté-
o raio de curvatura muda periodicamente: o Universo se contrai num ponto ria, mas com uma expansão ditada pela
(no nada) e então aumenta seu raio novamente de um ponto até um certo raio, constante cosmológica.
voltando a se contrair a um ponto, etc.. Isto nos lembra o que a mitologia Hindú
diz a respeito dos ciclos de existência, e torna possível falarmos da “criação
do universo do nada” mas, até o momento, podemos considerar esta hipótese
apenas como um fato curioso que carece de um suporte confiável em função da
inadequação do material experimental disponível na Astronomia.

Hoje sabemos que Friedmann estava certo. A ele é creditado, com


justiça, a descoberta teórica da expansão do Universo. A expansão foi
confirmada experimentalmente pelo astrônomo americano Edwin Hub-
ble em 1929 mas, dois anos antes, em 1927, o cosmólogo belga Georges
Lemaître publicou um trabalho onde estudou aprofundadamente os
resultados de Friedmann. Lemaître concluiu que a presença de um
deslocamento para o vermelho na maioria dos dados observacionais
então conhecidos era devido à “velocidade de recessão das nebulosas
extra-galáticas [que] é um efeito cósmico da expansão do Universo”.

15.1 O modelo

A ideia-chave do modelo de Friedmann é que a qualquer instante de


tempo, a curvatura do Universo é constante em todo o espaço. Isto
Figura 15.2: Georges Henri Joseph Édou-
significa que o universo de Friedmann é isotrópico, homogêneo e não ard Lemaître (1894-1966), físico belga, foi
tem um centro (princípio cosmológico: todos os pontos do Universo o primeiro a levantar a hipótese da reces-
são das galáxias ser devido à expansão
são equivalentes entre si). Para entender isto iniciemos por uma idéia do Universo. Foi também o proponente
simples de curvatura no caso da superfície de uma esfera. O elemento da teoria do Big Bang. Lemaître era pa-
de linha nesta superfície é dado por dre católico.

ds2 = R2 dθ 2 + R2 sin2 θ dϕ2 (15.0)


Podemos reescrever este elemento em termos da varíavel r (vide figura
ao lado), notando que r = R sin θ e portanto
dr
= Rdθ. (15.0)
cos θ
Disto segue que
dr2 dr2 dr2
R2 dθ 2 = = = (15.0)
cos2 θ 1 − sin2 θ 2
1 − Rr 2

© s.r. dahmen 2022


252 uma introdução à teoria do espaço e do tempo

Com isto ds2 se torna

dr2
ds2 = + r2 dϕ2 (15.0)
r2
1− R2
z
A curvatura de uma superfície esférica de raio R vale k = 1/R2 e
θ
portanto podemos escrever a expressão acima como

dr2 r
ds2 = + r2 dϕ2 (15.0)
1 − k r2
R
y
Esta forma do elemento de linha é válida para o plano, no qual k = 0
e o elemento
ds2plano = dr2 + r2 dϕ2 (15.0)
x

nada mais é do que o elemento de linha escrito em termos de coordena- Figura 15.3: A relação entre r e R em
das polares r, ϕ. Este elemento na verdade vale para superfícies curvas coordenadas esféricas.
em geral, sejam as curvaturas positivas (k > 0) ou negativas (k < 0).
A generalização para o elemento de linha de um espaço de curvatura
constante em 3 − d vale

dr2
ds2 = + r2 dθ 2 + r2 dϕ2 (15.0)
1 − k r2

A ideia de Friedmann foi considerar um universo em expansão. As


galáxias não saem do lugar mas o universo se expande, ou seja, a
distância física dl entre 2 pontos é multiplicada por um fator de escala
a(t) que muda com o tempo, ou seja

dl = a(t)ds (15.0)

ou seja, o elemento de linha no universo de Friedmann vale

dr2
 
ds2 = a2 (t) + r2 dθ 2 + r2 dϕ2 − c2 dt2 (15.0)
1 − k r2

Este elemento de linha descreve um universo em expansão, isotrópico


e homogêneo, e é chamado de elemento de linha de Robertson-Walker.
As componentes do tensor métrico são

a2 ( t )
grr = ; gθθ = a2 (t)r2 ; g ϕϕ = a2 (t)r2 sin2 θ; gtt = −c2
1 − k r2
(15.0)
Para calcular agora os símbolos de Christoffel Γαβγ e os elementos do
tensor de Ricci Rij basta aplicarmos as definições por nós já apresenta-
das. Não há nada de diferente nos cálculos a não ser muita álgebra. Os
termos são (onde ȧ representa da/dt e lembrando que os símbolos de

© s.r. dahmen 2022


o modelo-padrão do universo: o universo de friedmann, lemaître, robertson e walker 253

Christoffel são simétricos pela troca dos índices inferiores):


1 1
Γθθr Γ
ϕ
= ϕr =
r r
Γ θϕ Γθϕϕ
ϕ
= cot θ = − sin θ cos θ
ȧ ȧ
Γθθt = Γrrt =
a a
ȧ kr
Γ Γrrr =
ϕ
=
ϕt a 1 − kr2
a ȧr2
Γtθθ =
c2
a ȧ a ȧr2
Γtrr = Γt ϕϕ = sin2 θ
c (1 − kr2 )
2 c2
Γrθθ = −r (1 − kr2 ) Γrϕϕ = r (1 − kr2 ) sin2 θ (15.-5)

Quanto aos elementos do tensor de Ricci precisamos apenas de dois


deles, em função da simetria do problema. Eles são:

Rtt = −3
a
r2
Rθθ = ( a ä + 2ȧ2 + 2kc2 ) (15.-5)
c2

15.1.1 Resolvendo as equações de Friedmann


O que devemos ter em mente no modelo de Friedmann é que ele
representa um universo de curvatura constante, não plana, é isotrópico
e homogêneo. O fato da curvatura ser constante significa que a massa
que gera o campo não pode, contrário ao que assumimos na mecânica
newtoniana ou no modelo de Schwarzschild, ser localizada numa
região finita do espaço, pois se assim o fosse a distâncias muito grandes
da massa teríamos um espaço plano, contradizendo nossa hipótese
de partida. Portanto, a massa no modelo de Friedmann deve estar
distribuida com densidade constante pelo espaço e o modelo mais
simples de uma distribuição de massa é a de um fluido ideal. Como
Friedmann tem que resolver as equações de Einstein

1 8π G
Rµν −R gµν + Λ gµν = 4 Tµν (15.-5)
2 c
sem a constante cosmológica Λ, o que precisamos é substituir no lugar
do tensor momentum-energia Tµν o tensor correspondente para um
fluido ideal de densidade de massa rho e energia cinética por unidade
de massa igual à:
1
E = ρ v2 (15.-5)
2
No caso particular o tensor Tµν vale:
 p
Tµν = ρ + 2 uµ uν + pgµν . (15.-5)
c

© s.r. dahmen 2022


254 uma introdução à teoria do espaço e do tempo

Sem entrar em detalhes de como chegar a este tensor, vale a pena


discutirmos o que os termos representam. Lembremos que estamos
falando aqui de um espaço quadridimensional e portanto não basta
termos a energia cinética mas é necessário considerar a energia total
Etotal = mc2 e fazer uso da quadrivelocidade U . A figura abaixo nos dá
uma ideia do que é o tensor de tensões e energia.

Basicamente os termos do tensor (15.1.1) representam o transporte

Figura 15.4: O que cada componente do


tensor Tµν representa.

de energia e o transporte de momentum, que no caso de um gás se


manifesta na forma de uma pressão, motivo pelo qual aparece a pressão
p nas equações acima. Com este valor de tensor, Friedmann substitui os
valores na equação de Einstein, junto ao tensor de Ricci e aos símbolos
de Christoffel de sua métrica, e chegou à duas equações para o termo
de expansão a(t):

a ä + 2ȧ2 + 2kc2 = 4π G (ρ − p/c2 ) a2


4π G
a ä = − (ρ + 3p/c2 ) a2 (15.-4)
3
Estao são as famosas equações de Friedmann para um universo isotró-
pico e homogêneo. O que queremos agora é analisar algumas proprie-
dades deste universo que saem das soluções das equações acima.

15.1.2 Universo de Friedmann e a constante de Hubble


Para facilitar nossa discussão consideremos um espaço plano, isto é de
curvatura k = 0. Sabemos que da forma como definimos a métrica, a
distância ` a uma galáxia distante varia com o tempo segundo

`(t) = a(t)r (15.-3)

© s.r. dahmen 2022


o modelo-padrão do universo: o universo de friedmann, lemaître, robertson e walker 255

com uma velocidade de expansão dada por


ȧ ȧ
`˙ = ȧr = ar = `, (15.-2)
a a
de onde segue que uma galáxia que se afasta o faz com maior velocidade
quanto maior sua distância de nós. Esta é a famosa Lei de Hubble e o
não menos famoso fator de Hubble H é definida por meio de

H= . (15.-1)
a
O fator de Hubble é também chamado de constante de Hubble mas não
nos esqueçamos que ele na verdade não é uma constante mas muda
com o tempo. Disto tiramos a Lei de Hubble

v = Hl (15.0)

que nos diz o quão rápido as galáxias se afastam de nós. O valor atual
da constante de Hubble está em
km s−1
H = (69.8 ± 1.9) (15.1)
Mpc
Para a galáxia mais próxima, a de Andrômeda, isto corresponde a uma
velocidade de aproximadamente 175 km s−1 . Esta velocidade é apenas
a devido à expansão do Universo, e se soma à velocidade relativa entre
Andrômeda e a Via Láctea.

15.1.3 Outras consequências


A segunda das equações de Friedmann (15.-4) implica que não apenas
a energia mas a pressão contribuem para o campo gravitacional. Fato
é, porém, que para a matéria ordinária, p/c2  ρ e a matéria domina,
implicando também que ä < 0. Isto significa, segundo a teoria de Fried-
mann, que a velocidade de expansão está diminuindo, pois a interação
é atrativa e hoje a velocidade de expansão é bem menor do que fora no
passado. Isto também leva à conclusão, e levou Lemaître, a aventar a
hipótese que houve um momento na história de nosso universo quando
toda a matéria estava concentrada num ponto pequeno do Universo
primordial: aí nascia a teoria do Big Bang. Aquilo que convencionamos
chamar de idade do universo é tempo transcorrido deste o momento
inicial até nossos dias e estima-se ser hoje aproximadamente 16.7 × 1019
anos. Se subtrairmos a segunda da primeira equação em (15.-4) ficamos
com
8π G 2
ȧ2 + kc2 = ρa (15.2)
3
Substituindo ȧ em termos do fator de Hubble e dividindo ambos os
lados da equação por a2 temos
kc2 8π G
H2 + = ρ (15.3)
a2 3

© s.r. dahmen 2022


256 uma introdução à teoria do espaço e do tempo

No caso do universo plano (k = 0) esta expressão nos dá uma massa


crítica
3H
ρcrit = (15.4)
8π G
ou seja, a densidade de massa de matéria para que o universo seja
plano. Com o valor da constante de Hubble atual este valor é
kg
ρcrit = 7.2 × 10−27 (15.5)
m3
que corresponde a uma densidade de 4 átomos de Hidrogênio por
metro cúbico. Tomando agora a derivada da equação (15.2) obtemos
uma equação para a variação da densidade de massa no universo
8π G
2ȧ ä = (ρ̇a2 + 2ρa ȧ (15.6)
3
que, com ajuda das equações (15.-4) nos leva finalmente à
 p  ȧ
ρ̇ = −3 ρ + 2 (15.7)
c a
Para termos uma ideia do tipo de resultado ao qual esta equação nos
leva, temos que fazer uma hipótese sobre a relação que existe entre a
densidade de um fluido ideal e a pressão que ele exerce. Normalmente,
na hidrodinâmica, se escreve

p = (1 − β ) ρ (15.8)

onde β é uma constante que caracteriza o fluido. Substituindo esta


hipótese na equação acima ficamos com uma equação envolvendo
diretamente ρ e o fator de escala a:
ρ̇ ȧ
= −3β (15.9)
ρ a
cuja solução é, com a constante de integração K β

ρ a3β = K β (15.10)

Esta equação diz como a densidade da matéria varia com o fator de


escala do universo.

15.1.4 O período de domínio da radiação e da matéria


O universo é composto basicamente de átomos de Hidrogênio e Hélio
frios, e para os quais a pressão dividido pelo fator c2 é desprezível em
relação à densidade de matéria. Isto significa que podemos aproximar
usar a aproximação p = 0 (β = 1). Nesta aproximação o gás recebe o
nome de “poeira ”cósmica (cosmic dust) por não exercer pressão (poeira
não faz pressão!). Sendo assim, na equação (15.10) ficamos com

ρdust a3 = (ρdust )0 a30 (15.11)

© s.r. dahmen 2022


o modelo-padrão do universo: o universo de friedmann, lemaître, robertson e walker 257

onde o subíndice 0 indica “valor na presente idade do universo”. A


densidade de massa estimada do Universo visível é de 0.5% a 5.0% da
densidade crítica. Porém, estudos do movimento das galáxias indica
que deve haver muita matéria escura para completar a massa que falta
para atingir a massa crítica.
Porém, em 1965, Arno e Penzias descobriram a radiação de fundo
cujos resultados mais recentes com o satélite COBE colocam esta radia-
ção de corpo negro numa temperatura de T = 2.726 K. Isto correponde
a uma massa de ρrad = 4.5 × 10−31 kg m−3 . A equação de estado do gás
de fótons é
1 ρrad
p= (15.12)
3 c
Isto corresponde a um valor de β = 4/3, que leva neste caso à equação

ρrad a4 = (ρrad )0 a40 (15.13)

Se imaginarmos os primórdios do Universo, o fator de escala era menor


e a densidade era maior. Nosso resultado diz que ρrad a4 = constante
para o caso da radiação e ρdust a3 = constante para a matéria. A medida
que vamos voltando no tempo, a densidade de radiação cresce mais
rápido de modo a manter o valor constante, quando comparada à
densidade da poeira. Houve um momento em que as duas densidades
se tornaram iguais, e antes deste momento havia mais densidade de
radiação que de matéria e o universo era dominado por radiação. Se
fizermos a razão entre estas duas relações temos

ρrad (ρrad )0
a= a (15.14)
ρdust (ρdust )0 0

No momento em que as densidades se equipararam teq , a razão entre


as densidades do lado direito e torna 1 e ficamos com
(ρrad )0
a(teq ) = a (15.15)
(ρdust )0 0

Substituindo os valores de (ρrad )0 e (ρdust )0 nesta expressão obtemos

a(teq ) ≈ 10−4 a0 (15.16)

Com os valores calculados anteriormente chegamos à

teq = 1.12 × 104 anos (15.17)

ou seja, basicamente os primeiros 10 mil anos desde o surgimento do


Universo a radiação era dominante segundo o modelo de Friedmann.

© s.r. dahmen 2022


258 uma introdução à teoria do espaço e do tempo

15.2 Cosmologia: para onde vamos? Qual a estratégia?

O que percebemos, ao estudar soluções das equações de Einstein, é

Figura 15.5: O princípio cosmológico.


Fonte: H. Stephani, General Relativity: An
introduction to the theory of the gravitational
field, Cambridge University Press, Cam-
bridge 1982, p. 239.

a estratégia adotada: parte-se de uma hipótese de solução na forma


de uma função, forma esta baseada em argumentos de simetria. Uma
vez que as equações de Einstein são equações para o tensor de Ricci
Rµν que contém na sua definição derivadas primeiras dos símbolos de
Christoffel Γ µν e estes símbolos são definidos a partir dos elementos
γ

da métrica gµν e suas derivadas primeiras, a equação de Einstein é


por conseguinte uma equação a derivadas parciais de 2ª ordem para
a métrica gµν . Como estas equações formam um conjunto de EDP’s
acopladas, não lineares e portanto de difícil solução, a estratégia expli-
citada acima é a de reduzir estas equações a uma EDP para a função
que supomos satisfazer as equações de Einstein. Resumindo, teríamos
os seguintes passos:

(1) Escrevemos o elemento de linha ds2 com uma simetria de fundo,


por exemplo, simetria esférica, e.g.: ds2 = c2 dt2 + dr2 + r2 dθ 2 +
r2 sin2 θ dϕ2 .

(2) Generalizamos este elemento de linha mantendo, por exemplo, a


simetria esférica como no caso de Schwarzschild:

ds2 = eα(r) dr2 + r2 dθ 2 + r2 sin2 θ dϕ2 − e β(r) c2 dt2 (15.18)

com 2 funções (fatores de integração eα(r) e e β(r) ) a serem determi-


nadas ou, caso de Friedmann, com uma métrica para um espaço
homogêneo, isotrópico e cuja curvatura (para um t fixo) seja cons-
tante em todo o Universo:

dr2
 
2 2
ds = a (t) + r dθ + r dϕ − c2 dt2 .
2 2 2 2
(15.19)
1 − k r2

© s.r. dahmen 2022


o modelo-padrão do universo: o universo de friedmann, lemaître, robertson e walker 259

Devemos lembrar que Schwarzschild introduz sua métrica para


distribuições esféricas e finitas de massa, que para r → ∞ deve
reproduzir uma métrica plana e para campos fracos deve recuperar
a gravitação de Newton. Já Friedmann propõe uma métrica para
todo universo (modelo padrão da cosmologia).

(3) Definida a métrica hipotética, calculamos os símbolos de Christoffel


e o tensor de Ricci e os colocamos na equação de Einstein. No caso
de Schwarzschild, chegamos a EDP’s para as funções α(r ) e β(r ).
Para Friedmann, obtemos uma EDP para a(t). Devemos fazer então
uma suposição sobre a distribuição de massa e energia, que gera
a curvatura, que entram no lado direito das equações de campo
de Einstein. No caso de Schwarzschild resolvemos as equações
para um ponto fora da massa, e portanto no vácuo (embora seja
possível resolver as equações também para um ponto dentro da
distribuição esférica de massa). No caso de Friedmann, considera-se
uma distruição de massa uniforme por todo o universo (um fluido
ideal).

(4) Encontradas as soluções das EDP’s, introduzimos argumentos físi-


cos para determinar as constantes de integração e o comportamento
limite das soluções. No caso de Schwarzschild, como já dito, busca-se
o limite de espaço plano de Minkowski para distâncias infinitamente
grandes da massa e o limite Newtoniano para distâncias interme-
diárias. Já no caso de Friedmann, o que se faz é usar medidas
observacionais como input e definir os comportamentos possíveis do
universo baseados na física deste modelo.

Vamos então entender um pouco melhor a solução de Friedmann e


suas consequências. Discutamos assim a equação de Friedmann

4π G  p
ä = − ρ+3 2 a (15.20)
3 c
para a qual uma possível interpretação vem da dinâmica de gases, pois
considerou-se a distribuição de massa como um gás ideal. No caso
de um gás ideal, sabemos da Termodinâmica que, à medida que um
gás se expande com velocidade u (pressão p > 0), sua energia diminui
segundo  
d 3k B T
ρ = − p∇ · u (15.21)
dt 2m
pois ∇ · u > 0. Esta equação nada mais é que a lei de conservação de
energia (equação da continuidade) pois um gás ideal tem energia ciné-
tica, segundo o teorema da equipartição de energia, igual à (3/2)k B T
onde k B é a constante de Boltzmann. Ao se expandir com pressão p
ele realiza trabalho e portanto sua energia diminui. Olhando para a
equação de Friedmann podemos então dizer que os termos da direita

© s.r. dahmen 2022


260 uma introdução à teoria do espaço e do tempo

da equação, sendo positivos, fazem com que a aceleração da expansão


do Universo diminua. Vamos tentar entender as consequências desta
equação.

Soluções com pressão nula. Olhando para o conjunto de equações de


Friedmann (15.-4) chegamos, subtraindo uma da outra, à equação (15.2).
Podemos assim estudar as duas equações

8π G 2
ȧ2 + kc2 = ρa
3
4π G
a ä = − (ρ + 3p/c2 ) a2 (15.22)
3

pois a primeira se mostra mais conveniente dela obter uma equação da


continuidade para ρ ou, se preferirmos, para a conservação de energia.
Vamos assim derivar a primeira equação no tempo

8π G
2ȧ ä = (ρ̇ a2 + 2ρ a ȧ) (15.23)
3

e substituir nesta equação o termo ä da segunda equação:

 
4π G 8π G
2ȧ − (ρ + 3p/c2 ) a = (ρ̇ a2 + 2ρ a ȧ)
3 3
8π G 8π G
− (ρ + 3p/c2 ) a ȧ = (ρ̇ a2 + 2ρ a ȧ)
3 3
−(ρ + 3p/c2 ) a ȧ = (ρ̇ a2 + 2ρ a ȧ)
(15.24)

ou seja


ρ̇ + 3(ρ + p/c2 ) =0 (15.25)
a

Lembrando-nos da definição da constante de Hubble H = ȧ/a podemos


escrever esta equação da continuidade como

3H p
ρ̇ + 3Hρ = − (15.26)
c2

Uma interpretação física deste resultado fica mais clara se compararmos


com a Termodinâmica. A equação da continuidade que acabamos de

© s.r. dahmen 2022


o modelo-padrão do universo: o universo de friedmann, lemaître, robertson e walker 261

deduzir pode ser escrita como

3H p
ρ̇ + 3Hρ = −
c2
ȧ 3p ȧ
ρ̇ + 3 ρ a = − 2
c a
3p 2
(× a3 ) → ρ̇a3 + 3ȧ a2 ρ = − 2 a ȧ
c
d  3 p
ρa = −3 2 a2 ȧ
dt c
p
d ρa3 −3 2 a2 ȧ dt
 
= ( ȧ dt = da)
c
d ρc2 a3 −3p a2 da
 
=
d ρc2 a3 = − p da3
 
(15.27)

Mas no universo de Friedmann o volume de um elemento do espaço


vale
r2 sin θ
Z
V (t) = Vk a3 (t) onde Vk = √ dr dθ dϕ (15.28)
1 − kr2

e portanto o termo Vk da3 nada mais é que dV e U = ρ c2 V é a energia


do substrato cósmico. Portanto a equação da continuidade nada mais é
que a relação
dU = − pdV (15.29)
ou seja, o substrato cósmico obedece a primeira lei da Termodinâmica.

Vamos assim olhar para a primeira das equações (15.22):

8π G 2
ȧ2 + kc2 = ρa
3
d  3 p da3
ρa = − 3 (15.30)
dt c dt
As condições do universo hoje são tais que a distribuição de matéria é
tal que temos da ordem de 4 átomos de H por m3 . Isto significa que
o gás não faz pressão (poeira cósmica) e na equação de continuidade
podemos escrever

d  3
ρa = 0 → ρ a3 = constante (15.31)
dt
que, em outras palavras, significa que - segundo modelos mais recentes
- representa um universo dominado pela matéria, o que ocorreu num
tempo t ≥ 4.4 × 105 anos após o Big Bang (440 mil anos). Em outras
palavras vale, para o momento em que vivemos

ρ a3 = ρ0 a30 (15.32)

Substituindo este valor na primeira equação de Friedmann temos

© s.r. dahmen 2022


262 uma introdução à teoria do espaço e do tempo

8π G 2
ȧ2 + kc2 = ρa
3
8π G 1
ȧ2 + kc2 = ρ a3
3 |{z} a
=ρ0 a30
2
8π G ρ0 a30 1

da
+k = 2
cdt {z } a
| 3c
=C
 2
da C
= −k (15.33)
dτ a
Historicamente Friedmann propôs suas equações considerando as equa-
ções de Einstein sem a constante cosmológica (vide figura abaixo).

Figura 15.6: Trecho do artigo original de


Friedmann Über die Krümmung des Rau-
mes (Acerca da curvatura do espaço) no qual
ele diz, no parágrafo antes da equação
(A): “Os potenciais gravitacionais satisfa-
zem o sistema de equações de Einstein
com o termo cosmológico [λ] que pode-
mos tomar como sendo nulo”.

Por este motivo os livros a apresentam neta forma. Lemaître porém viu
que mantendo este termo chegamos a uma equação análoga à (15.30):
8π G ρ + Λ c2 2
ȧ2 + kc2 = a . (15.34)
3
A única modificação que isto traz para a equação (15.33) é a inclusão
de um novo termo na forma
 2
da C Λ a2
= + −k (15.35)
dτ a 3
Vamos considerar a equação com constante cosmológica Λ pois ela nos
permite classificar os diferentes universos.

15.2.1 Solução estática de Einstein


A solução estática de Einstein significa que da/dτ = 0. Portanto (15.35)
se reduz à  
k 1 8π Gρm
= Λ+ (15.36)
a2 3 c2
que, após alguma álgebra, leva à
c
a = aE = p k=1 (15.37)
4π Gρm

© s.r. dahmen 2022


o modelo-padrão do universo: o universo de friedmann, lemaître, robertson e walker 263

Esta solução foi abandonada com a descoberta de Hubble para o desvio


para o vermelho das galáxias distantes.

15.2.2 Solução sem matéria

Se ρm = 0 a equação se reduz à

Λ a2
ȧ2 (τ ) = −k (15.38)
3

que pode ser resolvida de forma geral como

da
Z
τ=± √ (15.39)
Λ a2 /3 − k

As possíveis soluções são:

1. a = const para Λ = 0, k = 0
Solução estática para um espaço plano e vazio.

2. a = τ para Λ = 0, k = −1
Solução da Teoria Especial da Relatividade de E.A. Milne (1896-1950)
para um universo aberto que se expande indefinidamente.

3. a(τ ) = a(0) e± Λ/3τ para Λ > 0, k = 0
Universo de de Sitter que obedece o chamado princípio cosmológico
perfeito de Hermann Bondi e Thomas Gold: on universo não apenas é
igual em qualquer ponto mas também igual em qualquer tempo. Nesta

solução a constante de Hubble vale ± Λ/3. Todas as soluções com
termo cosmológico e mesmo com presença de matéria convergem para
esta solução para todos os valores de a até a → ∞.
√ √
4. a(τ ) = Λ/3 cosh( Λ/3τ ) para Λ > 0, k = 1
Solução também encontrada por de Sitter. Solução que corresponde
a uma velocidade de expansão inicial igual a a(0) = sqrtΛ/3 e que
cresce indefinidamente.
√ √
5. a(t) = Λ/3 sinh( Λ/3τ ) para Λ > 0, k = −1
Solução também encontrada por de Sitter. Solução que corresponde a
uma explosão inicial em τ = 0 quando a = 0 (Big Bang) com expansão
infinita até a → ∞.
√ √
6. a(t) = Λ/3 sin( Λ/3τ ) para Λ < 0, k = −1
Solução também encontrada por de Sitter. Solução que corresponde
a uma explosão inicial em τ = 0 até a velocidade de expansão chegar
ao valor máximo a(0) = 3/sqrtΛ decrescendo à zero (colapso ou Big
Crunch) no tempo τ = 3/sqrtΛπ.

© s.r. dahmen 2022


264 uma introdução à teoria do espaço e do tempo

15.2.3 Soluções sem constante cosmológica Λ = 0


Estamos aqui no famoso Modelo Padrão da Cosmologia de Friedmann-
Lemaître-Robertson-Walker. A equação a resolver é
C
ȧ2 = −k (15.40)
a
Neste modelo sempre há Big Bang pois para a → 0 temos ȧ → ∞ no
instante inicial e isto vale para quaisuqer valores de k, ou curvatura, que
escolhamos: k = −1, ou seja, um universo aberto, k = 0, um universo
plano ou k = 1, um universo fechado.

1. k = 0, universo plano.
A solução neste caso é
 2/3
3H0 t
a ( t ) = a0 (15.41)
2
Este é o modelo de universo chamado de Einstein-de Sitter. Este
universo se expande indefinidamente e traz em si a idade do universo
na forma t0 = 2/(3H0 ), de modo que podemos escrever
 2/3
t
a = a0 (15.42)
t0
é uma ciclóide. O universo começa no Big Bang e termina no Big
Crunch.

2. k = 1, universo fechado.
A solução neste caso é comumente paramatrizada na forma de um
ângulo de evolução θ de tal modo que
C
a(θ ) =(1 − cos θ ) (15.43)
2
onde a relação entre θ e a coordenada τ = ct é
C
τ= (θ − sin θ ) (15.44)
2
A curva a(τ ) é uma ciclóide. O universo começa no Big Bang e termina
no Big Crunch.

3. k = −1, universo aberto


A solução neste caso é similar a solução anterior pela substituição de
cossenos e senos pelas funções hiperbólicas.
C
a(φ) = (cosh φ − 1) (15.45)
2
onde a relação entre φ e a coordenada τ = ct é
C
τ= (sinh φ − φ) (15.46)
2
A curva a(τ ) uma curva que cresce monotonicamente em τ. O universo
se expande indefinidamente. Todas as soluções estão na figura abaixo.

© s.r. dahmen 2022


o modelo-padrão do universo: o universo de friedmann, lemaître, robertson e walker 265

Figura 15.7: As possíveis soluções da


equação de Einstein para diferentes cur-
vaturas k e diferentes valores de cons-
tante cosmológica Λ. A linha do meio
com Λ = 0 corresponde às soluções obti-
das por Friedman e a linha inferior, com
constante cosmológica Λ > 0 por Lemaî-
tre.

© s.r. dahmen 2022


266 uma introdução à teoria do espaço e do tempo

15.2.4 Soluções com matéria ρ e constante cosmológica Λ


Neste caso a equação a ser resolvida é

C Λ a2
ȧ2 − − = −k (15.47)
a 3
Esta equação é semelhante à de uma massa puntual que se encontra
num ponto a(τ ) no instante τ sob a ação de um potencial V ( a) dado
por
C Λ a2
V ( a) = − − (15.48)
a 3
com uma energia igual à −k. Podemos ver isto na imagem a seguir:

Figura 15.8: A equação (15.47) vista como


uma partícula num com energia cinética
ȧ2 num potencial V ( a) com níveis de
energia −k.

Para os casos k = −1 e k = 0, temos um universo aberto ou plano,


respectivamente, e o universo de expande indefidamente. No caso
k = 0 temos
C Λ a2
ȧ2 = − (15.49)
a 3
cuja solução é

3C  √  1/3
a(τ ) = cosh( 3Λτ − 1 (15.50)

Para k = 1 temos uma solução do tipo a ∼ τ 2/3 .


Para um universo fechado k = 1, a dinâmica do universo depende do
máximo do potencial V ( a) estar acima da linha −k ou abaixo dela. O
máximo do potencial ocorre em
1/3
2C2 Λ

3
Vmax =− (15.51)
2 3
ou  
3 4
|Vmax | = Λ/ (15.52)
9C2

© s.r. dahmen 2022


o modelo-padrão do universo: o universo de friedmann, lemaître, robertson e walker 267

Temos então três casos:

1. Λ > 4/(9C2 ), quando então Vmax < −1.


O universo se expande indefinidamente com a → ∞.

2. Λ = 4/(9C2 ), quando então Vmax = −1.


Neste caso há 5 soluções:

(a) solução começa com a = 0 e vai para a → amax para τ → ∞;

(b) solução começa em τ → −∞ com amax e vai para a = 0 em τ → ∞;

(c) solução começa em τ → −∞ com amax e vai para a = ∞ em τ → ∞;

(d) solução começa em τ → −∞ com a = ∞ e vai para amax em τ → ∞;

(e) a equação tem uma solução constante a = amax

3. Λ < 4/(9C2 ), quando então Vmax > −1.


Neste caso há 2 soluções:

(a) solução começa com τ = 0 com a = 0, vai para um máximo e


retorna à a = 0;

(b) solução começa em τ → −∞ com a = ∞, atinge um valor mínimo


de a e cresce indefinidamente para a = ∞.

Estas são as possíveis soluções da métrica de Friedmann-Lemaître-


Robertson-Walker. Do ponto de vista prática o que se faz nos dias atuais
é atualizar os valores das constantes como H e ajustar o modelo para
definir à qual modelo (qual curvatura) nosso Universo provavelmente
segue e, com isso, se houve um Big Bang e se haverá um Big Crunch.

15.2.5 Componentes do substrato cósmico


Hoje o Big Bang é a teoria aceita para o início do Universo conhecido e
a radiação cósmica de fundo (CBR ou Cosmic Background Radiation) é
sua assinatura. A Equação de Friedmann-Lemaître (EFL)

8π G 2
ȧ2 = ρ a − kc2 (15.53)
3
por conter, dentre suas possíveis soluções, uma que apresenta um Big
Bang (e um Big Crunch, dependendo da curvatura do Universo) é a
teoria a partir da qual a descrição em larga escala de nosso universo
se baseia. Porém, a EFL diferente de outras equações da física onde
podemos ir ao laboratório e medir parâmetros que definem as escalas
e constantes das equações, para a EFL não podemos fazer os experi-
mentos mas apenas observar os fenômenos, aprimorando as medidas

© s.r. dahmen 2022


268 uma introdução à teoria do espaço e do tempo

e tornando os parâmetros mais e mais precisos. Por exemplo, se qui-


sermos usar sondas eletromagnéticas para estudar a constituição de
depósitos de petróleo, basta usarmos as equações de Maxwell usando
como parâmetros a susceptibilidade e permissividade dos elementos
constituintes do óleo que são experimentalmente medidas.
A Astrofísica teve uma evolução espantosa nos últimos anos e por
isso hoje dispomos de muitos dados para usar como input na EFL. Hoje,
com a descoberta de vários constituintes do substrato cósmico, a EFL é
escrita como
8π G
ȧ2 = (ρm + ρmr + ρν + ρ R + ρΛ +) a2 − kc2 (15.54)
3
onde os constituintes são dados na tabela abaixo:

Constituinte Densidade de Massa Tabela 15.1: Diferentes constituintes do


substrato cósmico usado na EFL.

matéria não relativística ρm = 4 · 10−28 kg m−3


matéria relativística ρmr
matéria escura contida em ρm e ρmr
neutrinos ρν = 3.3 · 10−31 kg m−3
radiação (fótons, CBR) ρ R = 4.7 · 10−31 kg m−3
energia escura ρΛ

Muita da pesquisa atual em cosmologia computacional está em deter-


minar com grande precisão estes valores a partir da grande quantidade
de dados obtidos por satélites como o Planck, Chandra e experimentos
feitos na Terra (neutrinos). Estes valores estão sendo constantemente
revisados e ainda há muito a ser feito nas próximas décadas.

© s.r. dahmen 2022


A
Experimentos fundamentais da história da Teoria da Rela-
tividade Especial

A Óptica tem um lugar de destaque na história da TRE, não apenas por


ser a teoria que estuda a as propriedades de propagação da luz, entre
tantas outras, como pelo fato que do ponto de vista experimental esta
área atingira ainda na segunda metade do século XIX um nível ímpar
de precisão. Muitas das hipóteses em torno do comportamento da luz
e sua verdadeira natureza puderam ser estudadas com mais detalhe e
teorias postas à prova.
A luz desempenha um papel fundamental na TRE: sua velocidade
entra nas transformações de Lorentz como escala física que determina a
grandeza dos efeitos relativísticos; ela representa a velocidade limite da
propagação das interações físicas; com o auxílio dela podemos definir
procedimentos de medidas de distância e intervalos de tempo; ela é
uma constante universal e é a mesma para todos referencial inercial.
Discutiremos aqui algumas descobertas e experimentos da história
da Física que contribuíram para chegarmos à TRE como hoje a co-
nhecemos. O mais famoso deles é o experimento interferométrico de
Michelson e Morley 1 . A ênfase dada a este experimento advém do fato 1
A. A. Michelson, E. W. Morley, On the
que ele colocou por terra a tão acalentada hipótese da existência do Relative Motion of the Earth and the Lumini-
ferous Ether, American Journal of Science.
Éter, que representava para Maxwell e seus conterrâneos um referencial 34 (203): 333–345.
absoluto. Porém, este experimento não caiu do céu: como em toda
história do conhecimento, ele representa a culminação de aproximada-
mente 250 anos de teorias e tentativas de entender as propriedades da
luz, cujas datas mais relevantes são apresentadas no Apêndice ??.
Como a grandeza física fundamental da Teoria da Relatividade é
a velocidade da luz, discutamos um pouco antes sua determinação
experimental por Rømer.
270 uma introdução à teoria do espaço e do tempo

A.1 Rømer e a velocidade da luz

A questão da finitude da velocidade da luz remonta aos gregos. Eles


acreditavam que a velocidade de propagação da luz era infinita, embora
Aristóteles afirmasse que Empédocles estava errado ao afirmar que a luz
“viajava”. Na verdade os gregos acreditavam que a visão era algo que
emanava dos olhos e atingia os objetos de maneira instantânea, como
argumentou Hero de Alexandria segundo a seguinte observação: se
você olhar para o céu noturno, mantendo os olhos fechados, ao abrí-los
verá imediatamente as estrelas. Portanto, uma vez que entre o abrir dos
olhos e o ver as estrelas não há um lapso de tempo, a visão (luz) deve se
propagar com velocidade infinita 2 . Para Avicena (Ibn Sina, 980 - 1037), 2
G. J. Whitrow, The natural Philosophy of
o grande cientista persa, a luz era composta de partículas emitidas Time, 2nd edition, Clarendon Press, Ox-
ford, 1980, p. 227.
pela fonte e portanto deveriam ter uma velocidade finita. Da mesma
maneira, em seu famoso tratado de Óptica, Alhazém (Alhazen ou Hasan
Ibn al-Haytham, ca. 965 - 1039) conclui que a luz era movimento e em o
sendo, deveria estar em um instante num determinado local e em outro
instante em um local diferente. Consequentemente, uma vez que não
pode estar ao mesmo tempo em dois lugares, deveria levar um tempo
finito para ir de um a outro 3 . Estas conclusões no entanto não foram 3
Alhazém também foi o primeiro a con-
levadas adiante: Kepler argumentava que a luz, sendo imaterial, ela cluir que a visão é devido à reflexão da
luz pelos objetos e que ela ocorre no cé-
não pode oferecer qualquer resistência ao movimento e portanto tem rebro.
velocidade infinita. Galileu retornou à ideia da finitude de c e chegou
a propor um experimento no qual duas pessoas segurando lanternas
com obturadores deveriam se posicionar a uma distância grande um do
outro. Assim que um abrisse o obturador, o outro abriria o seu assim
que visse a luz e mediriam o tempo decorrido entre o abrir dos dois
obturadores. Obviamente que um experimento deste tipo não pode ser
bem sucedido pela distância envolvida e pelo tempo de reação humana,
algumas ordens de grandeza maior que o tempo necessário para a luz
percorrer o trajeto.
Foi o astrônomo dinamarquês Ole Christensen Rømer (1644 - 1710)
quem primeiro forneceu as medidas experimentais que permitiram
que o cientista holandês Christiaan Huygens (1629 - 1695) estimasse
a velocidade da luz. Na realidade o problema que motivou Rømer
não tinha relação direta com a determinação de c mas sim com o
famoso problema da determinação da longitude de um barco em alto-
mar, problema este de suma importante na época das navegações. Era
sabido que a determinação de longitudes pode ser feita observando-se
a hora de uma efeméride astronômica de um relógio a bordo de um
navio com a hora do mesmo fenômeno medido por um relógio padrão
mantido, digamos, em Greenwich. O problema era um construir um
relógio que se mantivesse preciso por tempos longos. Em 1616 Galileu
sugeriu usar os eclipses de Io, o maior satélite de Júpiter, como relógio.

© s.r. dahmen 2022


experimentos fundamentais da história da teoria da relatividade especial 271

Para isto basta que o navio carregue uma tabela com as eclipses de
Io medidas num local padrão e comparasse com horário do eclipse
registrado por um relógio no navio. Este método se mostrou pouco
confiável pelas tabelas não tão precisas de Galileu e pela dificuldade de
se observar os eclipses a bordo de um navio.
Em 1671, Rømer e o astrônomo francês Jean Picard (1620 -1682)
observaram um total de 140 eclipses de Io a partir do observatório
de Uraniborg (o observatório fundado por Tycho Brahe na ilha de
Hven 4 ). Comparando estes resultados com os resultados medidos por 4
Hven, chamada de Ven em sueco, é uma
Giovanni Domenico Cassini (1625 - 1712) em Paris, eles foram capazes pequena ilha no estreito de Øresund, em
torno de 30 km ao norte da estrada que
de determinar a diferença de longitude entre Hven e a Cidade Luz. Em liga a capital dinamarquesa København
Paris Rømer continuou suas observações e por meio delas estabeleceu e a cidade sueca de Malmö.
a finitude da velocidade da luz, algo que já havia sido aventado por
Cassini. Esta finitude teria por consequência uma diferença entre o
horário previsto e o horário efetivamente observado do eclipse de Io.
Isto ocorre pois se fizermos medidas em diferentes épocas do ano, a
distância da Terra a Júpiter terá mudado e portanto a luz de Io leva
mais tempo para chegar até nós. Baseado na hipótese que a velocidade
da luz seria finita, Rømer anunciou em setembro de 1676 – baseado
nas observações que ele fizera em agosto – que o eclipse previsto
para as 5h45m45s no dia 9 de novembro seria observado dez minutos
depois, como de fato foi! Alguns dias depois Rømer explicou perante
à Academia Real de Ciências que o atraso se devia ao fato que entre
agosto e novembro a distância entre a Terra e Júpiter havia aumentado
e portanto a luz necessitava de 10 minutos para percorrer o caminho
extra, uma vez que sua velocidade era finita. A ideia por trás da medida
pode ser explicada pela figura abaixo.

Figura A.1: Figura utilizada por Rømer à


Academia Real de Ciências para explicar
o atraso na observação do eclipse de Io.

Um eclipse de Io ocorre sempre que ela entra na sombra de Júpiter.


Ao longo do ano, a Terra passa pelos pontos EFGHLK em sua órbita
em torno do Sol (A). Io entra na sombra de Júpiter (B) quando atinge

© s.r. dahmen 2022


272 uma introdução à teoria do espaço e do tempo

o ponto C, tornando-se visível novamente em D. Se o ponto L cor-


responde, digamos, ao ponto onde a Terra se encontra em agosto, ela
atingirá o ponto K em meados de outubro e portanto o eclipse será
observado com um atraso pois a luz tem que percorrer uma distân-
cia LK extra quando comparada à distância DL percorrida em agosto.
Durante 8 anos Rømer observou os eclipses de Io, chegando a uma
período orbital de 42.5h quando a Terra se encontrava no ponto mais
próximo do Sol (o ponto H da figura acima). Ele também observou
que 40 órbitas de Io duravam 22 minutos a menos quando a Terra se
aproximava de Júpiter do que as mesmas 40 órbitas duravam quando a
Terra se afastava daquele planeta. Com isto ele concluiu que a luz viaja,
em 22 minutos, a mesma distância que a Terra viaja durante 80 órbitas
completas de Io (aproximando, obviamente, o arco FG da corda FG] 5 . 5
C. Christodoulides, op. cit., p. 9.
Rømer porém nunca calculou esta velocidade. Tivesse ele calculado, ele
teria chegado a uma razão entre c e v dada por
c 40 × 42.5 × 60
= = 9300 (A.1)
v 22
e, usando a distância Terra–Sol então conhecida de d = 1.4 × 108 km,
ele teria calculado uma velocidade orbital v = 28.3 km/s e portanto

c = 260 000 km/s. (A.2)

Quem pela primeira vez calculou esta velocidade, como já dissemos


acima, foi Huygens. Ele porém cometeu um erro pois entendeu, de
sua correspondência com Rømer, que a luz levava 22 minutos para
percorrer uma distância igual ao diâmetro da órbita terrestre. Com
isto Huygens chegou a um valor de c = 220 00 km/s. Se quisermos

Figura A.2: Anotações de Rømer para os


eclipses de Io observados em Paris, co-
brindo um período de 10 anos (1668 a
1678). Quando o satélite desaparece na
sobra de Júpiter fala-se de uma imersão,
do latim immergentia. Ao aparecer nova-
mente, usa-se o termo emersão ou emmer-
gentia em latim. Isto explica o significa
das abreviações ao lado dos dados refe-
rentes às observações. Estas anotações
foram descobertas em 1913 pela física
dinarmarquesa Kirstine Bjerrum Meyer
(1861 - 1941).

calcular a velocidade da luz usando o procedimento de Rømer, devemos

© s.r. dahmen 2022


experimentos fundamentais da história da teoria da relatividade especial 273

proceder da seguinte forma: para um observador em Júpiter, os eclipses


sempre ocorrem em intervalos de tempo τ, onde τ corresponde ao
período de uma órbita de Io. Para um observador na Terra, o eclipse
é observado com um atraso de L/c, onde L é a distância da Terra à
Júpiter. Ao chegar no próximo eclipse, passado um tempo τ, a distância
entre a Terra e Júpiter terá aumentado ou diminuido por uma distância
`. Logo, o próximo eclipse observado na Terra ocorrerá decorrido um
tempo τ + L±`c . Se observarmos n trânsitos lunares, o tempo observado
na Terra será portanto de

`n
tn = nτ + (A.3)
c
onde `n é a variação total da distância L durante este tempo. Há
duas incógnitas nesta equação: por um lado τ, que não conhecemos
exatamente bem como a velocidade c da luz, que queremos determinar.
Com 2 medidas adequadas, podemos determinar estes valores.

1. Primeiramente se mede o número N de eclipses durante um tempo


TN tal que a distância inicial L entre a Terra e Júpiter volte ao
valor que tinha quando feita a primeira medida. Como Júpiter
tem um órbita de 12 anos, durante o período de 1 ano Júpiter
terá se deslocado por 30 ° de arco de órbita. Um simples cálculo
trigonométrico mostra que a nova distância da Terra à Júpiter é
praticamente a mesma de um ano anterior de tal modo que podemos
escrever
T
`N = 0 e τ= N (A.4)
N
2. Mede-se o número N 0 de eclipses durante meio ano, começando
pelo ponto de maior aproximação entre os dois planetas. Neste caso
` N 0 será o diâmetro da órbita terrestre, D ≈ 3 × 108 km. Neste caso
temos
`N0 `N0
tN0 = N 0 τ + −→ c= (A.5)
c tN0 − N0 τ

Dos dados de Rømer podemos concluir que t N 0 − N 0 τ é da ordem de


17 minutos ou 1000 segundos aproximadamente. Disto segue que

3 × 108 km
c= = 300 000 km/s (A.6)
103 s

A.2 O experimento de Michelson e Morley

Para entender o experimento, devemos partir do ponto de vista adotado


por Maxwell e seus contemporâneos e das consequências desta visão
de mundo: as equações da eletrodinâmica são válidas apenas para um
sistema absoluto de referência, o éter.

© s.r. dahmen 2022


274 uma introdução à teoria do espaço e do tempo

Figura A.3: Ao lado esquerdo, a mesa


sobre a qual o aparato foi montado. O ar-
ranjo de múltiplos espelhos permite um
trajeto mais longo dos raios de luz (ima-
gem do artigo original).

As figuras originais do trabalho de 1881 podem ser vistas abaixo:

Um esquema mais simples do experimento de Michelson e Morley


pode ser visto na figura (A.4) abaixo.

Figura A.4: Esquema simplificado do ex-


S1 S1
perimento de Michelson e Morley. Os
raios percorrem um trajeto até S1 e S2 ,
onde são totalmente refletidos e se re-
combinam, criando uma figura de inter-
ferência. Do ponto de vista do referencial
L v
absoluto do Éter, se o laboratório se mo-
ver com velocidade v, as trajetórias per-
corridas pelo raio se modificam (linhas
S2 S2 tracejadas), diferindo do caso no qual o
L
laboratório se encontra parado v = 0 (li-
nhas cheias).

A.2.1 Análise do experimento segundo a mecânica clássica

Para determinarmos a diferença de tempo de percurso do raio de


luz na trajetória paralela e perpendicular a v = v x̂, procedemos da
seguinte forma: consideremos primeiro a propagação longitudinal da
luz e ajustemos nosso cronômetro em t0 = 0 no momento em que a
luz atinge o espelho semi-refletor. Sendo a velocidade da luz no Éter
c, ela atinge o espelho S2 após percorrer uma distância igual a cT1,l .
Como durante este tempo o espelho S2 percorreu uma distância vT1,l , a
distância total que o raio de luz terá que percorrer até atingir o espelho
S2 vale:
L
cT1,l = L + v T1,l =⇒ T1,l = . (A.7)
c−v

© s.r. dahmen 2022


experimentos fundamentais da história da teoria da relatividade especial 275

O mesmo tipo de raciocínio se aplica ao retorno do raio após sua


reflexão no espelho S2 . Neste caso a luz percorre uma distância cT2,l
até atingir novamente o espelho semirefletor. Porém, durante este
trajeto, este espelho se movimentou na direção da luz, percorrendo
uma distância vT2,l . De maneira análoga podemos dizer assim que a
distância total percorrida pelo raio de luz longitudinal na sua viagem
de volta foi:
L
cT2,l = L − v T2,l =⇒ T2,l = . (A.8)
c+v
Disto podemos concluir que o tempo total de ida e volta do raio de luz
foi
v2
 
L L 2L 1 2L
Tl = T1,l + T2,l = + = ≈ 1 + . (A.9)
c−v c+v c 1 − v22 c c2
c

onde escrevemos a expressão até o termo em 2ª ordem em v/c. Este


resultado pode ser interpretado do ponto de vista do referencial do la-
boratório: neste referencial temos um “vento” do Éter para a esquerda, v

isto é com velocidade −v. Assim, a velocidade da luz na ida até o espe-
lho é de c − v (contra o “vento”) ao passo que na volta sua velocidade c (1− v2/c2 )1/2 c (1− v2/c2 )1/2 c

se torna c + v (luz se deslocando a favor do “vento” e portanto por ele


c−v c

carregada. A analogia com o som é clara). v

Calculemos agora o tempo de viagem do raio de luz na direção Referencial do espelho ´


Referencial do Eter

transversal ao movimento do aparato. Neste caso devemos ter um


pouco de cuidado para não incorrermos no mesmo erro que Michelson
e Morley incorreram em seu artigo original. Seu erro foi considerarem Figura A.5: Esquema simplificado do ex-
perimento visto em diferentes referenci-
que o tempo de ida e volta do raio até o espelho S1 seria simplesmente ais. À direita: para quem está parado em
T1,t + T2,t = 2L/c, ou seja que a luz se desloca até o espelho S1 com relação ao espelho, o ângulo de incidên-
cia = ângulo de reflexão. A velocidade
velocidade c, quando na verdade ela se desloca com velocidade menor do feixe de luz vale c − v segundo a me-
segundo a teoria clássica do Éter. Para entender este cálculo podemos cânica clássica. A figura à direita repre-
fazer uma analogia com a propagação do som, analogia esta exata se senta o referencial do observador parado
em relação ao Éter, ou seja, aquele para
assumirmos que o Éter realmente existe (como o ar existe) e que a o qual o espelho se move. Para ir de um
transformação de Galileu se aplica a ele. referencial a outro basta aplicar a trans-
formação de Galileu somando v às duas
Imagine um pulso luminoso de velocidade c emitido em direção a velocidades no referencial à esquerda: a
um anteparo que se afasta da fonte com velocidade v para a direita con- componente horizontal da luz passa a ter
forme a figura ao lado (podemos substituir a palavra Éter pela palavra o valor c = (c − v) + v e a velocidade do
feixe refletido é também acrescida de um
ar e no lugar de um pulso luminoso, um pulso sonoro. Como exemplo fator v. No referencial do Éter o ângulo
podemos imaginar um anteparo preso a um veículo se movendo com de incidência e reflexão são diferentes.
Como a velocidade da luz é c e sendo
velocidade v, onde devemos fazer a suposição que o movimento do ela a soma vetorial de suas componen-
veículo perturbe minimamente o ar). A luz, ao bater num anteparo tes, a componente vertical
√ da velocidade
que se move, vai ser refletido por um ângulo maior que o ângulo de da luz vale c⊥ = c 1 − v2 /c2 . Como a
transformação de referenciais não muda
incidência, descrevendo uma trajetória (para um observador parado a componente vertical da velocidade do
em relação ao ar) oblíqua para a direita. Como a velocidade da luz tem feixe, a conclusão é que no referencial
do laboratório o feixe vertical tem veloci-
que se manter constante no Éter, da mesma maneira que a velocidade dade c⊥ . Estes resultados se aplicam se,
do som se move com velocidade constante se o ar estiver parado, a ao invés de luz, estivéssemos estudando
o som.
© s.r. dahmen 2022
276 uma introdução à teoria do espaço e do tempo

única maneira de isto acontecer é quando a componente vertical da


velocidade da luz tenha o valor como descrito na figura. Isto significa,
do ponto de vista de um observador parado em relação ao anteparo que
a velocidade vertical de propagação é menor. A velocidade vertical,
classicamente falando, seria
p
c⊥ = c 1 − v2 /c2 (A.10)

e portanto o tempo total gasto pela luz na trajetória de ida e volta até o
espelho S1 é
2L 2L
T1,t + T2,t = = √ (A.11)
c⊥ c 1 − v2 /c2
Os livros que tratam deste assunto normalmente contornam esta discus-
são apresentando este resultado de uma maneira diferente na forma
mas igual no conteúdo. No trajeto até o espelho S1 a luz gasta um
tempo T1,t , ou seja, ela percorre uma distância cT1,t . Porém, neste
tempo, o espelho se moveu por uma distância vT1,t para a direita da
figura. Isto significa que a luz percorreu
q um caminho total que, segundo
o Teorema de Pitágoras, vale 2 . Portanto:
L2 + vT1,t
q
2 L
cT1,t = L2 + v T1,t =⇒ T1,t = √ . (A.12)
c2 − v2
Como no retorno o feixo de luz percorre um caminho análogo, temos
que T2,t = T1,t e portanto o tempo total gasto pelo raio para ir e voltar
é:
v2
 
2L 2L
Tt = T1,t + T2,t = 2T1,t = √ ≈ 1+ 2 (A.13)
c2 − v2 c 2c
Note que a equação (A.11) e a penúltima equação em (A.13) são idên-
ticas. A diferença de tempo gasto pela luz para percorrer as duas
trajetórias vale
2L 1 2L 1
Tl − Tt = − √
c 1 − v22 c 1 − v2 /c2
c
v2 v2
   
2L 2L
≈ 1+ 2 − 1+ 2
c c c 2c
v2
≈ L (A.14)
c3
Se a frequência da luz é ν, para uma diferença de tempo Tl − Tt corres-
ponde um deslocamento de fase (franjas) igual a

v2
∆F = ν ( Tl − Tt ) ≈ νL . (A.15)
c3
Nesta dedução supomos que os dois braços do interferômetro tenham
comprimentos exatamente iguais. No entanto, em uma típica mon-
tagem experimental, é difícil garantir esta igualdade. Neste caso, é

© s.r. dahmen 2022


experimentos fundamentais da história da teoria da relatividade especial 277

relativamente fácil mostrar que a expressão (A.14) é substituída por

L1 + L2 v2
Tl − Tt ≈ , (A.16)
2 c3
que reproduz assim, com maior fidedignidade, a situação experimental
real. Isto porém traz em seu bojo uma outra dificuldade: qualquer
∆F observado em condições experimentais pode advir também da
diferença de comprimento dos braços do interferômetro, mascarando o
efeito do arrasto da luz. Contudo, este problema pode ser eliminado
girando o aparato por 90 graus, exatamente como Michelson e Morley
fizeram. Ao girar o equipamento, qualquer diferença de fase devido
à diferença nos braços do equipamento continua presente, mas a fase 6
Fonte: R.S. Shankland, S. W. McCuskey,
F. C. Leone and G. Kuerti: New Analysis
devido ao movimento relativo ao éter se torna −∆F. Assim, as franjas
of the Interferometer Observations of Dayton
de interferência se descolarão por 2∆F. Os experimentos, porém, não C. Miller. Rev. Mod. Phys. 27, no. 2
mostraram qualquer deslocamento nas franjas, como podemos ver na (1955), pp. 167 – 178..

tabela abaixo 6 .
esperado
Autores Ano Local L(m) 2∆F 2∆F medido
(valor esperado) (valor medido)

Michelson 1881 Potsdam 1.2 0.04 0.02 2


Michelson e Morley 1887 Cleveland 11.0 0.40 0.01 40
Morley e Miller 1902 - 1904 Cleveland 32.2 1.13 0.015 80
Miller 1921 Mt. Wilson 32.0 1.12 0.08 15
Miller 1923 - 1924 Cleveland 32.0 1.12 0.030 40
Miller (luz solar) 1924 Cleveland 32.0 1.12 0.014 80
Tomaschek (luz estelar) 1924 Heidelberg 8.6 0.3 0.02 15
Miller 1925 - 1926 Mt. Wilson 32.0 1.12 0.088 13
Kennedy 1926 Pasadena, Mt. Wilson 2.0 0.07 0.002 35
Illingworth 1927 Pasadena 2.0 0.07 0.0004 175
Piccard e Stahel 1927 Mt. Rigi (Suíça) 2.8 0.13 0.006 20
Michelson et. al. 1929 Mt. Wilson 25.9 0.9 0.010 90
Joos 1930 Jena 21.0 0.75 0.002 375

© s.r. dahmen 2022


278 uma introdução à teoria do espaço e do tempo

A dúvida que pode surgir da discussão acima é sobre o fato do


ângulo de incidência e reflexão serem diferentes caso o espelho se
mova ou não, uma vez que este fato é crucial para o entendimento dos
resultados apresentados. Se imaginarmos uma colisão elástica entre
uma bola e uma anteparo que se move para longe da bola, esperamos
(ao menos intuitivamente) que a bola reflita com uma velocidade menor
se comparada aquela com a qual incidiu – do ponto de vista de quem
está parado. Isto porque na colisão o que importa é a velocidade
relativa entre os objetos que colidem. Isto explica o motivo pelo qual
o estudo da reflexão da luz num espelho móvel foi e continua sendo
um assunto relevante, não apenas no contexto do experimento acima
descrito mas por nos permitir, entre outras coisas, entender a diferença
entre os ângulos de incidência e reflexão da luz que incida sobre um
espelho móvel e a mudança de sua frequência neste processo. Este
é um problema também de relevância histórica pois em seu famoso
trabalho de 1905, Einstein forneceu uma solução correta ao experimento
de Michelson e Morley ao estudar, do ponto de vista da sua teoria da
relatividade, a reflexão da luz em espelhos móveis. Se quisermos
entender um pouco mais deste problema, há três possíveis caminhos a
serem tomados:

i. O método dinâmico: através de um estudo da conservação de ener-


gia e momentum linear no processo de espalhamento de fótons pelo
espelho. Esta abordagem, utilizada por exemplo no livro de Frank e
Ruppel 7 , tem a vantagem de ser de fácil entendimento mostrando, 7
G. Frank, W. Ruppel: Mechanik, Relati-
entrementes, que o princípio da conservação de momentum e ener- vität, Gravitation, Springer Verlag, Berlin,
1973.
gia numa colisão são princípios fundamentais da natureza e nos
permitem deduzir as expressões corretas desde que as grandezas
sejam propriamente definidas.

ii. O método geométrico: neste caso se recorre ao princípio de Huygens-


Fresnel para a reflexão da luz. Esta abordagem, utilizada no livro
de Møller de maneira resumida mas explorada em detalhes no
artigo de A. Gjurchinovski 8 requer uma certa familiaridade com a 8
C. Møller, op. cit, pags. 11 – 15; A.
contrução geométrica deste princípio, mas ressalta também o caráter Gjurchinovski, Reflection of light from a
uniformly moving mirror, Am. J. Phys 72,
fundamental da construção. 1316 (2004).

iii. O método eletrodinâmico: a abordagem puramente eletrodinâmica


a partir das equações de Maxwell é a estratégia adotada por Bolo-
tovskii e Stolyarov 9 e também no livro de Ugarov (v. bibliografia no 9
B. M. Bolotovskii, S. N. Stolyarov: Re-
início destas notas). Esta abordagem baseia-se nas relações entre os flection of light from a moving mirror and
related problems, Usp. Fiz. Nauk 159,155-
vetores da onda ki e kr antes e depois da reflexão, combinada com o 180 (1989).
princípio de conservação de energia. Na verdade, se olharmos de
maneira um pouco mais detalhada ela é equivalmente à abordagem
(i) acima mas vestida em outra roupagem.

© s.r. dahmen 2022


experimentos fundamentais da história da teoria da relatividade especial 279

Uma vez que os detalhes destes cálculos se encontram espalhados por


alguns poucos livros ou em textos de revistas científicas, apresenta-
remos abaixo as abordagens (i) e (ii). Uma vez que (iii) é equivalente à
(i), deixaremos ao leitor interessado a indicação da leitura do artigo de
Bolotovskii e Stolyarov.

A.3 O espalhamento de fótons

Para melhor compreendermos as diferentes trajetórias de um feixe de


luz quando este atinge um anteparo móvel ou um anteparo em repouso,
e assim ter uma ideia de como interpretar, classicamente, o experimento
de Michelson e Morley, discutiremos aqui a teoria de reflexão da luz do
ponto de vista de conservação de energia e momentum de um fóton.
Olharemos aqui para uma colisão elástica entre uma partícula que se
move à velocidade da luz (fóton) com um elétron, o chamado espalha-
mento de Compton 10 . O elétron que interage com o fóton é chamada 10
O efeito leva o nome de seu desco-
de elétron de recuo (recoil electron). bridor, o físico americano Arthur Holly
Compton (1892 – 1962), ganhador do prê-
Indiquemos as grandezas referentes ao fóton pelo índice 1 e as do mio Nobel de Física em 1927.
elétron pelo índice 2, da mesma maneira que grandezas iniciais (antes
da colisão) serão indicadas por i e valores finais, pós-colisão, por f .
Consideremos também que o elétron encontra-se em repouso no refe-
rencial do laboratório. Se um fóton atinge o elétron, pela conservação
de momentum temos que:

P1i = P1 f + P2 f , (A.17)

ao passo que a conservação de energia pode ser expressa como

E1i + E2i = E1 f + E2 f . (A.18)

Há porém uma relação entre a energia da partícula e seu momentum.


No caso do fóton esta relação é

E1i = c P1i ; E1 f = c P1 f , (A.19)

ao passo que para o elétron temos


q
E2i = E20 ; E2 f = 2 + ( cP )2 .
E20 (A.20)
2f

Nesta expressão E20 representa a energia de repouso do elétron 11 . 11


A energia de repouso de um corpo
Queremos entender o que acontece ao fóton depois da colisão. Se é a energia que o mesmo tem quando
sua velocidade é nula, isto é v = 0.
tomarmos o quadrado dos dois lados da expressão (A.17), obtemos De um modo geral, supondo a ausên-
cia de interações com campos e portando
P22f = P1i2 + P12f − 2 P1i P1 f cos θ (A.21) de uma energia potencial, a energia de
uma partícula é dada pela soma de sua
energia cinética e de sua energia interna
onde θ é o ângulo entre P1i e P1 f , ou seja o momentum do fóton antes ETOTAL = Ecin + E0 . E, outras palavras,
e depois da colisão, respectivamente. Substituindo a expressão (A.20) mesmo parada, uma partícula tem uma
energia que podemos identificar como
sua energia interna. Segundo Einstein, a
© s.r. dahmen 2022
energia de repouso vale E0 = m0 c2 onde
m0 é a chamada massa de repouso. Não
devemos confundir a energia interna de
uma partícula com a energia interna U
de um sistema termodinâmico.
280 uma introdução à teoria do espaço e do tempo

para a energia final do elétron na equação da conservação de energia


temos q
2 + ( cP2 )
E1i + E20 = E1 f + E20 (A.22)
2f

Podemos isolar em (A.22) o valor P2 f e fazer as substituições E1i = c P1i


e E1 f = c P1 f para os momenta do fóton (vide eq. A.19). Com um
pouco de álgebra elementar a equação (A.22) se torna

E20
P22f = P1i2 + P12f + 2 ( P1i − P1 f ) − 2 P1i P1 f . (A.23)
c
Comparando esta expressão com (A.21) concluimos que

1 1 c 1 1 1
− = (1 − cos θ ) =⇒ − = (1 − cos θ ). (A.24)
P1 f P1i E20 E1 f E1i E20

O que esta expressão nos diz é que pela colisão o fóton transfere parte
de sua energia ao elétron e que o ângulo de espalhamento θ, que
determina a direção do movimento do fóton após a colisão, depende
do quanto de energia ele perdeu. Esta equação pode ser também escrita
para mostrar a mudança de comprimento de onda (ou frequência) de
um fóton depois do espalhamento. Lembrando que para um fóton de
frequência ν e comprimento de onda λ, sua energia pode ser escrita
como E = hν = hc/λ e portanto

h 1 1 h
λ f − λi = (1 − cos θ ) =⇒ − = (1 − cos θ ). (A.25)
me c νf νi m e c2

onde me é a massa de repouso do elétron. A quantidade h/me c é o


chamado comprimento de onda de Compton e vale 2.43 × 10−12 m.

De acordo com esta equação, quando θ = 0 o fóton não transfere


energia para o elétron, pois neste caso a equação nos dá E1 f = E1i .
Isto contradiz nosso senso comum quando comparamos a colisão entre
duas partículas newtonianas, onde sempre haverá transferência de
momentum e energia. O espalhamento de fótons e elétrons é, porém,
um fenômeno quântico e portanto está relacionado à energia do fótons
e dos elétrons ligados com os quais interage. Um fenômeno muito
semelhante para a interação entre fótons e elétrons e portanto para
a transferência de energia em momentum foi explicado em 1905, no
annus mirabilis, por Einstein: o efeito fotoelétrico. A diferença básica
entre o efeito fotoelétrico e o espalhamento Compton diz respeito à
energia dos fótons incidentes e o que isso acarreta. No efeito fotoelétrico
estamos lidando com fótons que são absorvidos completamente pelos
elétrons. Neste caso os elétrons estão em orbitais k mais internos,
sendo ejetados. Pode ocorrer, neste casos, que elétrons de camada mais
externas ocupem o lugar do elétron ejetado, provocando a emissão de

© s.r. dahmen 2022


experimentos fundamentais da história da teoria da relatividade especial 281

um fóton de raio-x. Já no efeito Compton os elétrons de recuo são de


orbitais mais externos e podem ou não serem ejetados.

Estes resultados nos ajudam a entender a reflexão da luz num espelho,


quer ele se mova, quer esteja parado. Olhermos primeiro para o caso
de um espelho parado.

A.3.1 Reflexão da luz num espelho em repouso


Consideremos inicialmente o choque oblíquo num espelho em repouso.
Aqui utilizaremos o índice 2 para representar as grandezas associadas
ao espelho. Se um fóton atinge um espelho (v. figura) temos, pela
conservação de momentum:

P1i − P1 f = P2 f − P2i (A.26)

ou, em termos de componentes

P1i,⊥ = P 1 f ,⊥ + P 2 f ,⊥
P1i,k = P 1 f ,k + P 2 f ,k . (A.27)

Na expressão acima os símbolos ⊥ e k se referem às componentes


do momentum perpendiculares e paralelas (tangenciais) à superfície
do espelho. Podemos escrever estas expressões em uma forma mais
usual, lembrando que a energia de um fóton é dada por E = hν = h̄ω
e consequentemente o momentum vale P = h̄ω/c. Reescrevendo as
equações acima em termos de suas projeções nas respectivas direções
temos:
h̄ω h̄ω 0
cos α = cos β + M2 ∆v x
c c
h̄ω h̄ω 0
sin α = sin β + M2 ∆vy . (A.28)
c c
Nesta expressão, ω 0 representa a frequência do fóton após a colisão,
M2 é a massa do espelho e ∆v x,y representam os eventuais incrementos
da velocidade do espelho (como o espelho continua em repouso após a
colisão, estes incrementos são nulos). Como a energia de repouso do
espelho é muito grande comparado à energia do foton, isto é E20  E1i ,
a equação no lado direito de (A.24) implica que o espelho não absorve
energia do fóton. A equação do lado esquerdo nos leva a concluir que o
módulo do momentum do fóton é conservado, ou seja P1i = P1 f . Segue
disto também que ω = ω 0 e sendo ∆v x = ∆vy = 0 segue, das equações
acima, que
tan α = tan β (A.29)

Logo, o ângulo de incidência e reflexão são iguais.

© s.r. dahmen 2022


282 uma introdução à teoria do espaço e do tempo

Figura A.6: Reflexão oblíqua da luz num


espelho em repouso.
P(1,f) perpendicular
luz refletida
Espelho

P(1,f) tangencial P(1,f)

α P(2,f)−P(2,i) = 2 P(1,i)

P(1,i)
P(1,i) tangencial

luz incidente P(1,i) perpendicular

A.4 A reflexão da luz num espelho em movimento

Imaginemos agora o espelho com um movimento para a direita, com


velocidade v. Neste caso, o que muda em relação à situação anterior,
onde o espelho se encontrava em repouso? Começando pela lei de
conservação de momentum podemos escrever

P1i − P1 f = P2 f − P2i , (A.30)

enquanto por conservação de energia temos:

c P1i − c P1 f = E2 f − E2i . (A.31)

Vamos reescrever estas expressões em termos das grandezas usadas na


seção anterior. Podemos escrever a lei de conservação do momentum
nas direções horizontal e vertical na forma:

h̄ω h̄ω 0
cos α + M2 v = − cos β + M2 (v + ∆v x )
c c
h̄ω h̄ω 0
sin α = sin β, (A.32)
c c
e a conservação de energia como

M2 v2 M2 (v + ∆v x )2
h̄ω + = h̄ω 0 + =⇒
2 2
M2 ∆v2x
=⇒ h̄ω = h̄ω 0 + M2 v∆v x + (A.33)
2
Considerando a expressão para a conservação de momentum na direção
horizontal (eliminando o termo M2 v dos dois lados da igualdade) temos


M2 ∆v x = (ω cos α + ω 0 cos β). (A.34)
c

© s.r. dahmen 2022


experimentos fundamentais da história da teoria da relatividade especial 283

Substituindo este resultado na lei de conservação de energia chegamos


à expressão

h̄v h̄2
h̄ω = h̄ω 0 + (ω cos α + ω 0 cos β) + (ω cos α + ω 0 cos β)2 .
c 2M2 c2
(A.35)
Obviamente podemos tratar o espelho com um corpo clássico, newtoni-
ano, ou seja no limite M2 → ∞ esta expressão se reduz à
v
1− cos α
ω0 = c
v ω (A.36)
1+ c cos β

Combinando esta equação 12 com aquela que dá a conservação de 12


Este resultado tem uma consequência
momentum na direção vertical, chegamos finalmente à interessante. Imaginemos um espelho
que se move com velocidade v em rela-
 v   v  ção a uma fonte de luz em repouso no
sin α 1 + cos β = sin β 1 − cos α (A.37) referencial do laboratório. Consideremos
c c também que o feixe incide normalmente
Com um pouco de álgebra é possível, da expressão acima, achar a à superfície, isto é α = β = 0. Se v  c,
do ponto de vista do laboratório, a luz
relação entre o ângulo de reflexão β e o ângulo de incidência α na refletida em nada se diferencia da luz
forma   emitida por uma fonte situada atrás do
v2
− 2v
c + 1 + c2 cos α
espelho e que se move com velocidade v
cos β = (A.38) em relação a este e portanto a uma velo-
v2
1 − 2v
c cos α + c2
cidade vl = 2v da fonte. Substituindo na
expressão para  ν) a velocidade v
ω (ou 
Da mesma forma, podemos achar a nova frequência angular ω 0 como
v
1− 2cl
obtemos ν0 ≈ ν v , que nada mais
1+ 2cl
função da frequência ω, do ângulo de incidência α e da velocidade v é que a equação (4.42). Em outras pala-
do espelho: vras, recuperamos a equação do efeito
v2 Doppler no limite de baixas velocidades.
0
1 − 2v
c cos α + c2
ω = 2 ω. (A.39)
1 − vc2

Figura A.7: Reflexão oblíqua da luz num


espelho em movimento. Na esquerda, o
espelho se move para a direita e β > α.
P(1,f) perpendicular P(1,f) perpendicular
Na figura da direita, o espelho se move
P(1,f) tangencial P(1,f) tangencial
para a esquerda e β < α
Espelho Espelho
P(1,f) P(1,f)

β β

α v α v

P(1,i) P(1,i)
P(1,i) tangencial P(1,i) tangencial

P(1,i) perpendicular P(1,i) perpendicular

Resumindo: apenas no caso em que o espelho está em repouso (v = 0)


em relação à fonte de luz, o ângulo de incidência e reflexão serão
exatamente iguais. Caso contrário o ângulo de reflexão será tanto

© s.r. dahmen 2022


284 uma introdução à teoria do espaço e do tempo

maior (menor) quanto o maior (menor) for o módulo da velocidade v


(−v). Este resultado pode ser melhor compreendido na figura acima,
onde para um ângulo de incidência de π/4, o ângulo β de reflexão é
ilustrado graficamente para um v > 0.

1.25
Ângulo no lab. Figura A.8: Ângulo de reflexão β como
1.2 pi/4

1.15
função da razão v/c segundo a equação
1.1
(A.38) para α = π/4. Autor: Henrique
1.05 Lengler.
beta'

0.95

0.9

0.85

0.8

0.75
0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
v/c

Portanto a luz refletida por um espelho que se move na mesma direção


do feixe incidente tem seu comprimento de onda aumentado e sua
frequência diminuida (caso o espelho se mova na direção contrária à
luz incidente, o oposto ocorre).

A.5 A reflexão da luz pelo princípio de Huygens–Fresnel

O princípio de Huygens–Fresnel nos permite construir uma frente


de onda num tempo t + dt dado o perfil da frente no instante t: na
construção de Huygens–Fresnel, cada ponto na superfície de uma frente
de onda no instante t funciona como uma fonte primária de onduletas
que se propagam com a mesma frequência e velocidade que a onda
original e cujo envelope forma a frente de onda no instante t + dt.
Seguiremos aqui os passos do artigo de A. Gjurchinovski para entender
como isto funciona 13 . 13
A. Gjurchinovski, op. cit.
Consideremos uma frente de onda plana incidente sobre um espelho
como na figura abaixo: a linha AB representa a frente de onda num
instante t0 (v. figs. A.9 e A.10). Os átomos no ponto A da figura
reemitem a luz incidente na forma de uma onda esférica representada
pelo círculo de raio AC. A medida que o espelho se move, a frente
de onda AB continua perturbando os átomos no espelho até um certo
tempo t quando o ponto D é atingido. Os átomos no ponto D se tornam
uma fonte de onduletas passado um tempo (t − t0 ) desde o momento
que o ponto A foi atingido. Uma vez que pela teoria da relatividade a
velocidade da luz é independente da velocidade da fonte (neste caso o
espelho que se move com velocidade v), a onduleta gerada em A, no
instante em que o ponto D emite, será representada por uma esfera
de raio AC = c(t − t0 ). Em função do movimento do espelho, neste
intervalo de tempo as onduletas geradas tem sua origem sobre a reta
AD. O envelope de todas estas ondas elementares é a linha CD sendo
que agora 10 e 20 representam os limites dos raios refletidos.

© s.r. dahmen 2022


experimentos fundamentais da história da teoria da relatividade especial 285

Figura A.9: Geometria usada na cons-


1
1’
trução do princípio de Huygens–Fresnel
para um espelho móvel. As retas 1 e 2 (10
e 20 ) representam os limites do feixe de
n 2
2’
luz incidente (refletida). O espelho está
inclinado por um ângulo φ em relação
n
ao eixo x e tem uma velocidade v na di-
C reção do eixo x positivo. Baseado em A.
Gjurchinovski, op. cit..
E α β
F

B
A α
β

y D

G
φ
v
x

Figura A.10: Acima: a frente de


onda no instante que o primeiro raio
atinge o espelho no ponto A. Abaixo:
as onduletas geradas pelas sucessi-
vas reflexões sobre o espelho que se
n
t0 t
move, centradas sobre a reta AD, ge-
ram uma onda refletida cuja frente é
A frente de onda no instante t 0 dada pelo envelope CD.
α

n
C

D
φ
v

© s.r. dahmen 2022


286 uma introdução à teoria do espaço e do tempo

Pela figura acima podemos ver que

BD + DG
sin α =
AG
AC − AF
sin β = (A.40)
AG − EF
onde considerou-se que ED = AG. Como já explicado anteriormente,
temos que
AC = BD = c(t − t0 ) (A.41)
Olhando para o entorno do ponto A com um pouco mais de detalhe (v.
fig. A.5), temos que AO = d = v(t − t0 ) sin φ. Disto seguem as relações

AO v(t − t0 ) sin ϕ
DG = AE = =
cos α cos α
AO v(t − t0 ) sin ϕ
AF = = 1

cos β cos β t
1’

β
t0 E
O

(A.43) α
F

Dos triângulos AEO e AFO temos que EO = AO tan α e OF = A d

AO tan β. Sendo porém e EF = EO + OF chegamos à φ φ

v (t − t 0 )

EF = v(t − t0 ) sin ϕ(tan α + tan β) (A.44)


Figura A.11: A região de emissão inicial
Substituindo estas expressões no par de equações (A.40) temos em torno do ponto A.
sin ϕ
c + v cos α
sin α =
AG
t − t0
sin
c − v cos β
sin β = (A.45)
AG
t − t0 − v sin ϕ(tan α + tan β)

Eliminando o termo AG/(t − t0 ) nestas expressões chegamos final-


mente à
v
sin α − sin β = sin ϕ sin(α + β) (A.46)
c
Esta expressão nos dá a relação entre os ângulos de incidência α e
reflexão β para um espelho que se move com velocidade v na direção
do eixo x positivo. Note que se o espelho estiver parado recuperamos
a relação α = β, como também para o caso em que φ = 0. No caso
em que o espelho se move numa direção perpendicular a seu plano
(φ = π/2) obtemos a relação
v
sin α − sin β = sin(α + β), (A.47)
c
que, pela construção acima, corresponde ao caso de um espelho que se
move na direção da fonte de luz. Caso o espelho se movesse na direção

© s.r. dahmen 2022


experimentos fundamentais da história da teoria da relatividade especial 287

contrário teríamos no lugar de v o valor −v e esta espressão seria então


substituída por
v
sin α − sin β = − sin(α + β), (A.48)
c
No primeiro caso, como era de se esperar, α > β. No segundo caso,
α < β. Este resultado condiz com a figura (A.7). Com um pouco
de álgebra é possível mostrar que da equação (A.46) recuperamos a
equação (A.38) da seção anterior que, no caso de um ângulo ϕ arbitrário,
se torna 14 14
A. Gjurchinovski, op. cit. p. 1318.
 
v2
− 2v
c sin ϕ + 1 + c 2 sin 2
ϕ cos α
cos β = 2 (A.49)
v
1 − 2vc sin ϕ cos α + c2 sin ϕ
2

© s.r. dahmen 2022


B
O tempo e espaço na Crítica da Razão Pura de Kant

Gedanken ohne Inhalt sind leer, Anschauungen ohne Begriffe sind blind. Pensamentos sem conteúdo são vazios; intui-
ções sem conceitos, cegas.
(I. Kant, Kritik der Reinen Vernunft, B75, 1781)

A obra do filósofo alemão Immanuel Kant representa um ponto


de inflexão na história da filosofia ocidental. Isto se deve ao fato que
sua obra gira, resumidamente, em torno de duas questões: a ação
humana e suas consequências, ou seja a moral e, não menos importante
1
O substantivo neutro das Urteil tem vá-
rias traduções possíveis. No contexto
e mais relevante ao nosso contexto, a questão do conhecimento, isto é Kantiano é traduzido como juízo. Mas
de sua possibilidade, seus limites e sua abrangência. É esta segunda podemos traduzí-lo também como sen-
tença, como no clássico de Franz Kafka,
grande questão da obra Kantiana que exerceu forte influência sobre
Das Urteil (A sentença).
filósofos e físicos que se ocuparam de questões fundamentais acerca
do tempo e do espaço, pois estes dois conceitos são tratado logo no
início de seu opus magnus, a Crítica da Razão Pura (Kritik der reinen
Vernunft ou KrV). Se quisermos entender o porquê disto é necessário 2
I. Kant, Kritik der reinen Vernunft, Philo-
sophische Bibliotek, Felix Meiner Verlag,
que contextualizemos sua obra, discutindo brevemente seu objetivo e
Hamburg, 2019. Há duas edições que
esclarecendo um conceito em torno do qual Kant a constrói: os juízos Kant publicou ainda em vida: a de 1781
(sing. Urteil, pl. Urteile) 1 . Por isto, ao longo deste apêndice, são é chamada na literatura especializada de
A e a segunda, de 1787, de B. Sempre
apresentados trechos extraídos diretamente da KrV 2 . que nos referimos à obra é comum citar
a página das edições originais. Por exem-
plo A23, B37 significa que o trecho citado
B.1 A obra e seus objetivos corresponde à página 23 da primeira edi-
ção e à página 37 da segunda. Quando
Quando Kant publicou a primeira edição de sua obra em 1781, ela a notação A não aparece, significa que
o trecho em questão foi adicionado na
foi considerada tão obscura e difícil que ele se viu forçado a publicar edição de 1787. Todas as edições mo-
em 1783 uma “introdução” à KrV intitulada Prolegômenos a qualquer dernas da KrV carregam esta numeração
visando facilitar a consulta e comparação
metafísica futura que queira se apresentar como ciência 3 . O título deixa das edições.
clara a ideia: fundamentar uma Metafísica sobre os mesmos preceitos
segundo os quais fundamentamos as duas ciências por excelência: por 3
I. Kant, Prolegomena zu einer jeden künf-
um lado a Matemática, baseada segundo Kant na razão pura e a Física, tigen Metaphysik, die als Wissenschaft wird
auftreten können, Philosophische Bibli-
baseada em parte na razão pura e parte na experiência. Mas o que othek, Felix Meiner Verlag, Hamburg,
significa fundamentar estas duas ciências? Primeiro é preciso entender 2001.
que para Kant Matemática e Física eram a geometria e cálculo de seus
predecessores – Euclides, Descartes, Newton e Leibniz. No universo
290 uma introdução à teoria do espaço e do tempo

Kantiano fundamentar significa entender como é possível chegar ao


conhecimento científico pelo caminho da razão. Neste sentido Kant
não está interessado em responder à pergunta “O que é?” (Was ist es?),
mas à pergunta “Como é possível?” (Wie ist es möglich?). Kant propõe
as bases de um método crítico da razão, pois

[...] há muito a se ganhar quando conseguimos reduzir uma variedade de


investigações à fórmula de um único problema. Isto porque em fazendo isto
facilitamos não apenas nosso próprio trabalho, na medida em que o determinamos
de maneira rigorosa, como também se torna mais fácil o trabalho daqueles que
queiram examinar se o que fizemos foi satisfatório ou não. 4 . 4
Kant, KrV, p. 71, B19.

Se entendermos os fundamentos a partir das quais podemos concluir


que um juízo não apenas é necessário mas também universal, estaremos
pavimentando o caminho seguro para a obtenção do conhecimento.
Dito de modo diferente, ao tomarmos a Física e Matemática como
modelos para a Filosofia, estaremos colocando esta última sobre pilares
sólidos. Por isto Kant define sua obra como uma crítica da razão pura:
entender a razão significa entender o processo pelo qual chegamos aos
juízos que fazemos acerca dos objetos do conhecimento, eliminando
quaisquer dúvidas quanto à sua validade. Nas palavas da matemática
e filósofa alemã I. Strohmeyer 5 : 5
I. Strohmeyer, Tranzendental-
philosophische und physikalische
Kant apresenta em sua Crítica da Razão Pura uma fundamentação transcendental- Raum-Zeit-Lehre. Wissenschaftsverlag,
filosófica do conhecimento empírico e com isto do conhecimento científico, em Bibliographisches Institut, Mannheim,
1978, p. 11.
particular da Física. [... ] É de amplo consenso que a Filosofia Transcendental de
Kant é compatível com a Física Clássica, e pode até mesmo ser entendida como
seu fundamento [filosófico]. 6 6
A premissa de Strohmeyer é que, em-
bora não entendida desta forma, a obra
Discutiremos a seguir o que Kant entende por juízos, discutindo um de Kant é também compatível com os re-
sultados da física moderna. É isto que
pouco sua obra no contexto da filosofia do século XVIII. ela demonstra em sua tese.

B.2 Breve histórico da obra.

De acordo com Kant, foi a obra do empirista inglês David Hume que o
tirou da “sonolência dogmática” e o colocou no caminho de uma crítica
da razão pura cujo objetivo era a “solução do problema de Hume em
sua forma mais geral possível” 7 . O empirismo britânico de Bacon, 7
Prolegomena p. 260, §13 e p. 261, §15.
Locke e Hume enfatiza o papel da experiência sensível e da evidência
na formação de ideias, em detrimento das ideais inatas ou racionalismo 8
Para os empiristas todas as idéias se
de Descartes, Leibniz e Espinosa 8 . originam com a nossa experiência sensível.
O problema ao qual Kant se refere na obra de Hume, e que ele toma Para os racionalistas, há outras maneiras
que independem da experiência, embora
como ponto de partida para sua digressão, é o problema da causalidade 9 : não a excluam enquanto fonte de conhe-
segundo Hume, causa é um evento/objeto que é seguido por outro – cimento.
9
D. Hume, An Enquiry Concerning Human
o efeito – de tal modo que todos eventos similares à causa devem ter
Understanding, in Locke, Berkeley, Hume:
como consequência efeitos similares entre si. Para Hume o problema Britannica Great Books of the Western World,
se resume, filosoficamente falando, ao seguinte: como chegamos ao vol. 35, Chicago, 1957.

© s.r. dahmen 2022


o tempo e espaço na crítica da razão pura de kant 291

conhecimento entre causa e efeito? Qual a razão e a justificativa para


que assumamos uma conexão necessária entre causa e efeito da maneira
como a observamos Natureza? Mas porque isto seria um problema,
filosoficamente falando? Para Hume há dois problemas que carecem
de sollução 10 : 10
I. Strohmeyer, op. cit., p. 13 ff.

(i) a instância contrária à causalidade não implica em qualquer absurdo


ou contradição. Em outras palavras, um evento pode ocorrer sem
que ele necessariamente seja causa (ou efeito) de outro. Ou seja, o
princípio da contradição sozinho não garante a validade do princípio
da causalidade. Para usar um termo Kantiano, que detalharemos
mais adiante, o princípio da causalidade não é analítico, ou seja não é
auto-contido, mas é sintético: sua veracidade só pode ser confirmada
pelo uso de um conceito externo à causalidade em si. A classificação
entre juízos como sendo analíticos ou sintéticos é conhecida como os
“dois dogmas do empirismo”.

(ii) A instância externa à qual recorremos não pode ser a experiência


uma vez que não existe na Natureza qualquer exemplo de cone-
xão necessária entre dois eventos. Para Hume elas se nos mostram
sempre como relacionadas, mas não necessariamente conectadas. Em
outras palavras, o que Hume propugna é que a ideia de conexão, tão
fundamental ao conceito de causalidade, nunca pode ser objeto de
nossa experiência sensível. Nas palavras de Hume, que um objeto
ou evento em todas as situações observadas seja sempre acompanhado
do mesmo efeito – o que chamamos de causa aparece com a mesma
frequência daquilo que chamamos de efeito – é algo totalmente di-
ferente de dizermos que este efeito é sempre acompanhado daquele
outro – que o último necessariamente siga do primeiro 11 . A relação 11
Se pudéssemos fazer uma analogia, isto
entre estas duas relações – em todos os casos observados e sempre – não nos lembra um pouco a ideia da Mecâ-
nica Estatística que basicamente diz que
é algo intuitivo: o espírito humano precisa de algo que lhe permita embora nunca tenhamos visto um copo
relacioná-las. A busca por esta ponte, ou se ela sequer existe, é o de vidro quebrado se juntar sozinho, o
processo de “rejuntamento” não é impos-
problema posto por Hume. sível, só altamente improvável. O fato de
nunca observarmos este evento não ne-
Em seus Prolegomena, Kant dá um exemplo para que entendamos estas cessariamente implica que ele não posso
duas situações 12 . Ao dizermos a frase “quando o Sol bate sobre a ocorrer. Nossa ciência é empírica no sen-
pedra, ela se esquenta”, estamos fazendo uma conexão subjetiva entre tido a ela atribuido por Hume.

percepções sensoriais (o brilho do Sol e o aquecimento da pedra) e por- 12


Kant, op. cit, p. 301, §84 e nota de
tanto um “juízo de percepção”. Este juízo é desprovido de necessidade, rodapé
não importa quantas vezes tenhamos observado este fato. Porém, na
frase “O Sol aquece a pedra” estamos, segundo Kant, proferindo um
“juízo de experiência”, uma vez que a causalidade subsume a sensação
e lhe confere caráter de generalidade e objetividade 13 . 13
Subsumir é um verbo típico da filosofia
Mas, como toda filosofia digna de ser chamada como tal, não basta Kantiana e significa incluir, colocar como
parte de um conjunto mais amplo.
colocar o problema: é preciso lhe dar uma solução. As soluções de
Kant e Hume a este problema são diferentes:

© s.r. dahmen 2022


292 uma introdução à teoria do espaço e do tempo

(i) Para Hume, uma vez que a negação do princípio da causalidade


não implica em qualquer contradição, a validade deste princípio não
pode ser atingida pela razão pura, ou seja, por um juízo apriorístico
(não baseado na experiência). O único motivo segundo o qual
podemos assumir a causalidade na natureza é o hábito adquirido
através da observação que dois eventos sempre são acompanhados
um do outro. Em outras palavras, a causalidade é um conceito empírico,
cuja origem é a observação da natureza e o hábito por ela criado.

(ii) A solução de Kant é exatamente oposto à de Hume: segundo


aquele, a conexão causal no sentido da necessidade da existência
de B, dado que A ocorreu, não é uma constatação empírica, mas
um conceito puro da razão (uma categoria), ou seja, ela só pode ser
pensada. Deste modo, uma vez que sua validade na Natureza não
pode ser analítica, uma vez que o princípio da contradição não se
aplica a ela, a causalidade só pode ser um juízo sintético a priori.
Portanto, a questão-chave do KrV, a saber “como são possíveis os
juízos sintéticos a priori” tem origem no envolvimento de Kant com
a discussão de Hume sobre a causalidade.

B.3 Dos juízos.

Pela discussão anterior podemos ver que o conceito de juízos tem um


papel fulcral na obra de Kant, pois juízos são afirmações acerca do
conhecimento. Alguns exemplos bastante simples de juízos são as
afirmações do tipo “o céu é azul”; “a soma dos ângulos internos de
qualquer triângulo plano é igual à soma de dois ângulos retos”; “a
menor distância entre dois pontos é uma reta”; “o café está doce”;
“homens solteiros não são casados”; “massa depende da velocidade”.
Se olharmos de maneira um pouco mais aprofundada para estes juízos
veremos que alguns parecem evidentes, outros tem caráter axiomático.
Alguns juízos nos trazem novas informações acerca dos objetos aos
quais se referem, alguns não acrescentam qualquer nova informação
e outros são ainda tautológicos. Em alguns só chegamos pela via
da experiência, de maneira empírica, ao passo que outros podem
ser obtidos usando-se simplesmente a razão. Em função disto Kant
categoriza juízos em função da sua origem e sua estrutura interna. No
que tange à origem, ele afirma:
Não resta dúvida de que todo o nosso conhecimento começa na experiência; afinal
que outra coisa poderia despertar e pôr em ação a nossa capacidade de conhecer se
não fossem os objetos que afetam os sentidos e que, por um lado, dão origem eles
mesmos às representações [Vorstellungen] e, por outro, acionam nossa faculdade
intelectual e levam-na a compará-las, ligá-las ou separá-las, transformando assim
a matéria bruta das impressões sensíveis num conhecimento que se denomina

© s.r. dahmen 2022


o tempo e espaço na crítica da razão pura de kant 293

experiência? ... Se, porém, todo o conhecimento se inicia com a experiência,


isso não prova que todo ele derive da experiência. Pois bem poderia o nosso
próprio conhecimento via experiência ser um composto do que recebemos através
das impressões sensíveis e daquilo que a nossa própria capacidade de conhecer
(posta em ação por impressões sensíveis somente) produz por si mesma, acréscimo
este que não distinguimos dessa matéria-prima enquanto nossa atenção não for
desperta por um longo exercício que nos torne aptos a distinguí-los. 14 14
Kant, op. cit, p. 43, B1 e B2.

O conhecimento pode assim vir da experiência, quer dizer ser empírico


(a posteriori, em terminologia Kantiana). Os exemplos acima sobre a
doçura do café ou da cor do céu são exemplos de juízos a posteriori: é
necessário experimentar o café ou olhar para o céu para chegarmos a
estas conclusões. Juízos/conhecimento independentes da experiência,
isto é deduzidos somente pelo uso da razão, são denominados juízos a
priori e têm posição de destaque no universo Kantiano. Esta posição de
destaque se deve ao fato que para Kant, toda a Matemática e boa parte
da Física se baseiam em juízos a priori e portanto
Há no entanto pelo menos uma questão que clama por de um estudo mais atento
e que não se resolve prima facie: se haverá um conhecimento independente
da experiência e de todas as impressões dos sentidos. Este conhecimento é
denominado de conhecimento a priori e é distinto do conhecimento empírico cuja
origem é a posteriori, ou seja na experiência. 15 15
Kant, op. cit., p. 43, B1.

Ao lado da questão da origem, há também o problema da estrutura


interna dos juízos: juízos são afirmações acerca de objetos ou fatos e têm
a forma A é B, onde A é denominado o sujeito e B o predicado do juízo.
Por exemplo, quando dizemos “o céu é azul”, estamos relacionando o
predicado azul ao sujeito céu . Neste exemplo em particular o predicado
nos traz uma nova informação e portanto estamos proferindo um juízo
sintético ou de ampliação. Os juízos que nada acrescentam ao sujeito
são denominados analíticos ou de elucidação. O exemplo de Kant para
um juízo analítico é “corpos são extensos” pois extensibilidade é uma
das propriedades que definem um corpo. É impossível pensar em um
corpo sem pensar na sua extensibilidade. Já a proposição “corpos são
pesados” é um juízo sintético pois dizer que o corpo tem peso significa
estar ele sujeito a um campo gravitacional: um novo predicado, peso,
foi a ele adicionado – peso é algo externo e não intrínseco ao objeto.
Kant não poderia ter colocado isto de maneira mais direta:
Em todos os juízos, nos quais se pensa acerca da relação entre um sujeito e um
predicado (considero apenas os juízos afirmativos, porque depois é fácil estendê-la
aos negativos), esta relação é possível de duas maneiras. Ou o predicado B
pertence ao sujeito A como algo que está contido (implicitamente) nesse conceito
A, ou B está totalmente fora do conceito A, embora a ele ligado. No primeiro
caso chamo o juízo de analítico e, no segundo, denomino-o sintético. Portanto, os
juízos (os afirmativos) são analíticos, quando a ligação do sujeito com o predicado
é pensada por identidade; aqueles, porém, em que essa ligação é pensada sem
identidade, deverão chamar-se juízos sintéticos. Poderíamos chamar os primeiros

© s.r. dahmen 2022


294 uma introdução à teoria do espaço e do tempo

16
Na literatura filosófica usa-se também
igualmente de juízos explicativos ao passo que os segundos de juízos extensivos; os termos juízos de elucidação quando
16 ; isto porque [nos juízos analíticos] o predicado nada acrescenta ao conceito analíticos ou de ampliação quando sintéti-
do sujeito e apenas pela análise o decompõe nos conceitos parciais, que já neles cos.
estavam pensados (embora de maneira confusa). Os juízos sintéticos, ao contrário,
acrescentam ao conceito do sujeito um predicado que nele não estava pensado e
dele não podia ser extraído por qualquer decomposição 17 . 17
Kant, op. cit, p. 57, B10 e B11.

Grande parte das ciências é fundamendata sobre evidências empíricas


e portanto constituem um conhecimento a posteriori. As ciências puras
são fundamentadas sobre juízos a priori, não empíricos. Mas, enquanto
ciência, elas adicionam conhecimento e são portanto sintéticas. Surge
então a questão principal da obra de Kant: como pode um juízo que
não é baseado na experiência associar a um objeto A um predicado
B que o expande, sem antes passar pela experiência sensível? Este é
um dos motivos pelo qual este importante capítulo da Filosofia Crítica
de Kant é chamada de Apriorismo. A KrV se propõe a resolver esta
questão.
Em resumo, dentro do universo Kantiano há dois tipos de juízos
quanto à estrutura:

1. Juízos analíticos: um juízo cujo predicado está contido no conceito


do sujeito; elucidam mas não trazem nova informação ou são tauto-
lógicos.

2. Juízos sintéticos: aqueles cujo predicado não está contido no conceito


do sujeito mas está a ele relacionado, ampliando o objeto.

No que tange à origem temos:

A. Juízos a priori: uma proposição cuja justificativa não se baseia na


experiência. São universais e necessários. Os axiomas da geometria
euclideana são proposições a priori;

B . Juízos a posteriori: uma proposição empírica, baseada na experiência.

Combinando estas categorias temos finalmente:

1A. juízos analíticos a priori: há uma grande discussão na literatura


especializada sobre a relevância (ou significância) desta categoria,
pois segundo alguns filósofos todo conhecimento a priori é por de-
finição analítico. Um conhecimento a priori não requer qualquer
intuição pois ele depende simplesmente de nossa habilidade de
entender o significado do juízo. Por este motivo muitos filósofos
não consideram este tipo de juízo como algo que mereça especial
destaque.

2A. Juízos sintéticos a priori; boa parte da obra de Kant é dedicada a


examiná-los pois a eles Kant associa as propriedades de universali-
dade e necessidade. Eles formam a base da Matemática e boa parte

© s.r. dahmen 2022


o tempo e espaço na crítica da razão pura de kant 295

da Física. Mas este é o ponto nevrálgico de sua obra: como justifi-


car que algo que não é baseado na experiência (apriorístico) possa
acrescentar informação ao sujeito (sintético) sem que passemos pela
experiência sensível que conecte o sujeito ao predicado? Isto é o
mesmo que perguntar: como são possíveis os juízes sintéticos a priori
na Matemática? Na Física? Respondidas estas questões podemos
fundamentar uma Metafísica baseada na razão pura.

1B . Juízos analíticos a posteriori; estes juízos são desprovidos de qual-


quer sentido pois ... Os juízos de experiência, como tais, são todos
sintéticos, pois seria um absurdo fundamentar sobre a experiência um juízo
analítico, uma vez que não preciso sair do meu conceito para formular tal
juízo e, por conseguinte, não necessito do testemunho da experiência 18 . 18
I. Kant, op. cit., p. 59, B11.
Em outras palavras, algo que precisa da experiência para comprovar
o óbvio, não acrescentando nada ao objeto, é tautológico.

2B . Juízos sintéticos a posteriori compõem grande parte dos juízos


que fazemos no dia-a-dia (“neste instante eu escrevo”). Boa parte
das ciências ditas “não puras” são baseadas nos juízos sintéticos a
posteriori.

B.4 A estética transcendental: o tempo e o espaço enquanto


juízos sintéticos a priori

Após expor brevemente as categorias de juízos, preparando assim o


terreno para sua Crítica, Kant trata dos conceitos de espaço e tempo, que
para ele são conceitos de ampliação (sintéticos) mas não apreensíveis
pela experiência (são juízos a priori). Kant coloca a pergunta da seguinte
forma:
Mas o que seriam espaço e tempo? Seriam entes reais ou apenas designações, ou
mesmo relações entre as coisas, mas daquele tipo que não deixariam de existir
mesmo que não intuíssemos sua existência? Ou seriam eles dependentes unica-
mente da forma de intuição e, assim, da constituição subjetiva de nosso espírito,
sem o qual estes predicatos não poderiam ser atribuidos a coisa alguma? 19 19
Kant, op. cit, pp. 97, A23, B37. É im-
portante notar que Kant utilizado termo
Com esta pergunta Kant dá início ao primeiro capítulo da sua obra, Geist, s. m., cuja tradução pode ser tanto
espírito, mas não no sentido religioso –
intitulado (Doutrina Transcendental dos Elementos), com uma seção por ele como em Zeitgeist, o espírito do tempo –
chamada de Estética Transcendental). Mas o que é estética transcendental? como também mente. Espírito no sentido
Recorramos mais uma vez à Kant: religioso em alemão é o s. f. Seele.

Denomina-se sensibilidade a capacidade que temos de receber representações


(receptividade) pelo modo como os objetos nos afetam. Assim, por intermédio
da sensibilidade nos são dados objetos e é apenas ela que nos fornece intuições;
mas é o entendimento que pensa estes objetos e é dele que provêm os conceitos
[...] Denomino assim a ciência de todos os princípios da sensibilidade a priori de
estética transcendental[...] Na estética transcendental, por conseguinte, isolare-
mos primeiro a sensibilidade, separando tudo que o entendimento pensa com os

© s.r. dahmen 2022


296 uma introdução à teoria do espaço e do tempo

seus conceitos, para que apenas reste a intuição empírica. Em segundo lugar,
separaremos ainda desta intuição tudo o que pertence à sensação, de tal modo que
reste somente a intuição pura e simples, forma dos fenômenos, que é a única que
a sensibilidade a priori pode fornecer. Nesta investigação se apurará que há duas
formas puras da intuição sensível, como princípios do conhecimento a priori: o
espaço e tempo, de cujo exame nos ocuparemos a seguir. 20 Kant, op. cit, pp. 93, A19, A22, B33,
20

B36.
Indo diretamente ao ponto, vejamos o que Kant tem a dizer sobre o
espaço. Segundo ele:

O espaço não é um conceito empírico, extraído de experiências externas. Afinal,


para que determinadas sensações sejam relacionadas com algo exterior a mim
(isto é, com algo situado num outro lugar do espaço, diferente daquele em que
me encontro) e igualmente para que eu as possa representar como exteriores e
vizinhas umas das outras, e consequentemente não só distintas mas em distintos
lugares, é necessária de antemão a representação da noção de espaço. Logo,
a representação do espaço não pode ser extraída pela experiência das relações
dos fenômenos externos; pelo contrário, esta experiência externa só é possível,
antes de mais nada, mediante esta representação. O espaço é uma representação
necessária, a priori, que fundamenta todas as intuições externas. Não se pode
nunca ter uma representação de que não haja espaço, embora se possa perfeita-
mente pensar que não haja objetos alguns no espaço. Consideramos deste modo
o espaço como condição da possibilidade dos fenômenos, não uma determinação
que dependa deles; é uma representação a priori, que necessariamente serve de
fundamento a todos os fenômenos externos. 21 21
I. Kant, op. cit., p. 98, A23, B38.

Resumindo, Kant conclui sobre o espaço:

i. o espaço não representa uma propriedade das coisas em si;

ii. o espaço é a condição subjetiva da sensibilidade, sob a qual nos é


possível a intuição externa;

iii. o espaço tem realidade pois tudo o que possa apresentar-se externa-
mente a nós tem comprovação empírica e idealidade transcendental
pois podemos, tão logo deixemos de lado a experiência, imaginá-lo
como algo subjacente a todas as coisas.

O mesmo se aplica ao tempo, sobre o qual Kant afirma:

Aparentemente o tempo não pode ser visto, tanto quanto o espaço, como algo em
nós. [...] O tempo não é um conceito empírico que derive de uma experiência
qualquer. Nem a simultaneidade, nem a sucessão surgiriam na percepção se a
representação do tempo já não estivesse [em nós] a priori. É apenas quando a
pressupomos que podemos representar em nossa mente que uma coisa existe num
só e ao mesmo tempo (simultaneamente), ou em tempos diferentes [...] O tempo
não é um conceito discursivo ou, como se diz, um conceito universal, mas uma
forma pura da intuição sensível. Tempos diferentes são apenas partes do mesmo
tempo.22 I. Kant, op. cit., p. 97, A23, B37; p. 106,
22

A30, B46.
Kant também conclui que:

© s.r. dahmen 2022


o tempo e espaço na crítica da razão pura de kant 297

O tempo não é algo que exista em si mesmo ou seja inerente às coisas enquanto
designação objetiva e portanto continue existindo quando abstraimos todas as
condições subjetivas da intuição. [...] O tempo não é mais do que uma forma
do sentido interno, isto é, da intuição de nós mesmos e de nosso estado interno.
Realmente, o tempo não pode ser determinado pelos fenômenos externos; ele não
pertence a uma figura ou a uma posição etc., mas antes determina a relação
das representações no nosso estado interno. E precisamente por esta intuição
interna não se apresentar como figura, procuramos suprir essa falta de analogias
representando a sequência do tempo por uma linha contínua, que se prolonga
até o infinito e cujas diversas partes constituem uma série que tem apenas uma
dimensão. Das propriedades da reta tiramos todas as propriedades do tempo, com
exceção de uma só, a saber, que as partes da primeira [reta] são simultâneas e as
do segundo [tempo] sucessivas. Por aqui se vê também que a representação do
próprio tempo é uma intuição, pois todas as relações se podem expressar numa
representação externa. [...] o tempo constitui a condição a priori de todos os
fenômenos em geral; é, sem dúvida, a condição imediata dos fenômenos internos
(da nossa alma) em por isso mesmo também, indiretamente, dos fenômenos
externos. 23 Kant, op. cit., pp 109, 110; A33,34 e
23

B50,51.
Tempo e espaço não são portanto conceitos empíricos, discursivos
e portanto analíticos que podemos obter da experiência. Eles estão
presentes antes que possamos apreender algo em seu contexto espacial
e/ou temporal. Para melhor entender isto podemos fazer uso de um
simples exemplo de um juízo que pode nos parecer sintético a priori
mas não o é: o conceito de “vermelho”. Quando dizemos que o sangue
é vermelho – um juízo sintético a posteriori – o conceito de vermelho
pode se nos parecer como estando já presente em nossa cognição,
sendo portanto a priori. Este conceito no entanto não está presente
a priori em nossas mentes uma vez que não trazemos, ao nascer, as
categorias de cores definidas em nossas mentes. “Vermelho” é um
conceito empírico, adquirido em algum momento de nossa primeira
infância quando nossos pais nos ensinaram o que era vermelho nos
mostrando objetos que eram vermelhos, associando a cor ao nome24 . 24
I. Strohmeyer, op. cit, p. 28.
Tempo e espaço são genuinamente conceitos que trazemos prontos em
nossa estrutura mental e que nos permitem entender as relações de
posição e ordenamento temporal nos fenômenos naturais.
Convém notar que muitas pessoas argumentam que, uma vez que
Kant pretende fundamentar os conceitos Newtonianos de espaço e
tempo absolutos, sua filosofia estaria ultrapassada quando a confron-
tamos com as teorias de Einstein. Na realidade, como argumenta I.
Strohmeyer, a filosofia de Kant é compatível com as ideias de Einstein
pois
[...] A Crítica da Razão Pura não tem, como proposta, fundamentar uma teoria
do conhecimento empírico (baseado na experiência) mas um estudo sobre a
possibilidade [de existir] conhecimento a priori 25 . 25
I. Strohmeyer, op. cit., p. 12.

Isto resume de forma simples o tratado Kantiano. Retornando


agora ao ponto principal de nossa discussão: toda pessoa que se vê

© s.r. dahmen 2022


298 uma introdução à teoria do espaço e do tempo

confrontada com os efeitos físicos das teorias da relatividade de Einstein


– a especial e a geral – na verdade se vê face a face com a seguinte
questão: para nós o tempo e o espaço constituem o palco sobre o qual
a física se desenrola. As teorias de Einstein são uma teoria sobre o
próprio palco, ou seja, na Teoria da Relatividade espaço e tempo (em
particular na teoria geral) adquirem uma certa “materialidade”. Um
exemplo simples pode nos ajudar a entender a profundidade desta
mudança de paradigma: quando escrevemos uma equação diferencial
para o movimento de um oscilador harmônico, a equação é expressa
em termos de coordenadas (x,y,z,t) ou de qualquer outro sistema de
coordenadas que julgamos convenientes. O espaço e o tempo já estavam
lá, antes do oscilador harmônico, e são apenas variáveis que usamos
para descrever a dinâmica do sistema. Mas quando a solução que
surge de nossas equações não é um campo elétrico, uma temperatura,
uma energia livre, mas o próprio espaço e o próprio tempo, em que
sistema de coordenadas escrever as equações se o proprio sistema
de coordenadas deve ser a solução que procuramos? Estas e outras
questões serão abordadas nestas notas de aula.
Foi justamente nesta linha de argumentação que a crítica de Einstein,
Mach, Poincaré e de alguns filósofos como Reichenbach, Grünbaum e
Carnap se deu com relação aos conceitos de espaço e tempo da física
clássica: a crítica não é tanto sobre a idéia de um espaço e tempo newto-
nianos absolutos em si, mas ao fato que estes conceitos são meramente
abstrações e não passíveis de se fazerem mensuráveis em quaisquer
experimentos que tenhamos acesso. Podemos adotar duas posturas
com relação a isto: ou adotamos uma abordagem operacional (“o que é
o tempo? Aquilo que um relógio mede”) ou aquela que chamarei aqui
de físico-filosófica, como a definição de Weyl. Basicamente podemos
adotar uma postura, muito comum nos dias de hoje, que nos leva a
sair fazendo contas sem nos preocuparmos com um entendimento mais
profundo da teoria ou tentarmos compreender o que realmente há por
trás da teoria do espaço e do tempo. Estas questões tem envolvidos
físicos e filósofos da ciência desde o surgimento das teorias de Einstein
e a literatura sobre o assunto é muito vasta.

© s.r. dahmen 2022


C
Datas importantes

Algumas das principais datas associadas à TER e TRG e uma curta


descrição dos eventos são apresentadas abaixo. Dentre todas as datas
associadas à TRE e TRG, destacaremos algumas que nos parecem mais
importantes.

1632 Galileo Galilei (1564 - 1642) publica seu famoso livro Dialogo
sopra i due massimi sistemi del mondo: Tolemaico e Copernicano no qual
ele formula o princípio da inércia e a invariância das leis da Física
para referenciais inercias que se movem em relação um ao outro. É
interessante notar que Galileo, diferentemente de outros cientistas da
época, escreveu sua obra em italiano e não latim, como era costume
na época.

1644 René Descartes (1596 - 1650) sugere que o Éter dos antigos filó-
sofos como Platão (em Timaeus) e Aristóteles possui propriedades
mecânicas e através dele as forças entre corpos são impingidas. Ro-
berto Hooke (1635 - 1703) estende para o conceito para o do éter
luminífero, o meio no qual a luz se propaga. Michael Faraday (1791
- 1867) atribui ao Éter propriedades magnéticas - em particular da
força magnética - e Carl Friedrich Gauss (1777 - 1855) e Bernhard
Riemann (1826 - 1866) incluem entre as forças transmitidas pelo Éter
a da gravidade e da interação Coulombiana.

1676 Ole Christensen Rømer, cientista dinamarquês, mede pela pri-


meira vez a velocidade da luz. Do ponto de vista histórico foi a
primeira medida de uma constante universal. Para isto Rømer usou
as eclipses de Io em sua órbita em torno de Júpiter e observou o
ainda desconhecido Efeito Doppler.

1687 Isaac Newton (1642 - 1727) publica seu opus magnum, o Philo-
sophiae Naturalis Principia Mathematica, conhecido hoje simplesmente
por Principia. Nele Newton formula suas 3 leis do movimento e
introduz a idéia de espaço e tempo absolutos.
300 uma introdução à teoria do espaço e do tempo

1725 James Bradley (1693 - 1762) descobre a aberração da luz ao estudar


a paralaxe de estrelas pelo movimento orbital da Terra. Obtém uma
medida da velocidade da luz com boa precisão.

1810 François Jean Dominique Arago (1786 - 1853) tenta detectar a


variação da velocidade da luz de das estrelas pela mudança da
direção da velocidade relativa da Terra ao longo de sua órbita. Seus
resultados foram negativos e Augustin Fresnel (1788 - 1827) sugere
que o insucesso da medida se deve ao fato que a Terra arrasta consigo
o éter ao longo de seu movimento pelo espaço. Esta hipótese foi
estudada em uma série de experimentos por Fizeau a partir da 1851.

1842 Christian Doppler (1803 - 1853) descobre o efeito que leva seu
nome e abre a possibilidade de se medir a velocidade de astros
distantes. A precisão experimental já era suficiente na época para
observar o efeito clássico (da ordem de v/c) sem no entanto ter ainda
precisão para detectar os termos da correção relativística de ordem
v2 /c2 . O efeito Doppler em estrelas distantes foi confirmado pelo
físico alemão Johann Karl Friedrich Zöllner (1834 - 1882) que desen-
volveu espectrômetros da alta precisão com o objetivo de estudar o
espectro de estrelas.

1849 - 1862 Armand Hippolyte Louis Fizeau (1819 - 1896) e Jean Ber-
nard Léon Foucault (1819 - 1868) medem com grande precisão a
velocidade da luz em laboratório usando rodas dentadas e prismas.

1851 Fizeau mede com precisão a velocidade da luz em um fluxo de


água. Fizeau mede valores diferentes para a velocidade da luz na
água em repouso ou em movimento, sendo a diferença dada pela
expressão kv onde v é a velocidade fluido em relação ao laboratório
e k o famoso “coeficiente de arrasto” do Éter pelo meio.

1868 Martin Hoek (1834 - 1873), astrônomo e físico experimental ho-


landês, mede o coeficiente de arrasto, confirmado a teoria de Fizeau.

1861 - 1862 James Clerk Maxwell (1831 - 1879) formula sua teoria para
o eletromagnetismo clássico, provando teoricamente a existência

de ondas eletromagnéticas de velocidade 1/ e0 µ0 = c no vácuo.
Com isto Maxwell afirmou ser a luz uma onda eletromagnética,
unindo portanto a Óptica ao Eletromagnetismo. Em 1888 Heinrich
Rudolph Hertz (1857 - 1894) comprovou experimentalmente a teo-
ria de Maxwell, primeiro na Universidade Técnica de Karlsruhe e
posteriormente na Universidade de Bonn. Alguns anos antes, entre
1873 e 1874, Ludwig Eduard Boltzmann (1844 - 1906) publicou os
resultados de suas medidas da relação entre a constante dielétrica e
e o índice de refração n de diferentes meios, confirmando a previsão
da teoria Maxwelliana que e ∼ n2 .

© s.r. dahmen 2022


datas importantes 301

1881 Albert Abraham Michelson (1852 - 1931) realiza seu primeiro


experimento interferométrico na Universidade de Potsdam para
detectar o movimento da Terra pelo Éter. Seus resultados são incon-
clusivos.

1883 Ernst Mach (1838 - 1916) publica seu famoso livro Die Mechanik
in ihrer Entwicklung: historisch-kritisch dargestellt (A mecânica em seu
desenvolvimento: uma apresentação crítico-histórica) onde propugna suas
idéias a cerca do tempo e do espaço e de que a inércia dos corpos
resulta da interação com todos os outros corpos do universo. Este
trabalho exerceu enorme influência sobre Einstein.

1887 Michelson, junto a Edward William Morley (1838 - 1923) repetem


o experimento de Michelson de 1881 na Case Western Reserve Uni-
versity em Cleveland, Ohio. Com um aparato 10 vezes mais preciso
que o de 1881 (Morley, que era químico, era especialista em medidas
de precisão e determinou, entre outras coisas, o peso atômico do
Oxigênio com grande precisão). Embora negativos, os resultados
do experimento colocaram um limite superior para a velocidade da
Terra pelo Éter em 8 km/s.

1887 Woldemar Voigt (1850 - 1919) introduz uma versão diferente das
transformações de Lorentz que, posteriormente, Voigt afirmou serem
para a resolução de um problema específico e não pensadas como
uma transformação geral entre coordenadas que se movem com
velocidade relativa v na direção do eixo x. O trabalho de Voigt é inti-
tulado Ueber das Doppler’sche Princip (Acerca do Princípio de Doppler).
Lorentz, que por ocasião da publicação das suas transformações em
1902 não conhecia o trabalho de Voigt, reconheceu o pioneirismo de
Voigt, bem como Minkowski em sua palestra de 1908.

1892 George Francis FitzGerald (1851–1901) e Hendrik Antoon Lorentz


(1853–1928) introduzem a hipótese da contração do comprimento
dos corpos na direção do movimento, na tentativa de explicar os
resultados negativos do experimento de Michelson e Morley.

1892 - 1904 Publicações de Lorentz sobre a eletrodinâmica de corpos


em movimento.

1895 - 1905 Publicações de Henri Poincaré (1854 - 1912) sobre a relati-


vidade.

1904 Lorentz publica sua teoria do elétron, descoberto em 1898 Joseph


John Thompson (1856 - 1940). Sua teoria é baseada na hipótese da
contração dos corpos e ele publica pela primeira vez a famosa relação
para a massa inercial m = γ m0 . Dois anos antes, Walter Kaufmann

© s.r. dahmen 2022


302 uma introdução à teoria do espaço e do tempo

(1871 - 1947) havia conduzido experimentos onde observou experi-


mentalmente a variação da massa de elétrons com velocidades entre
0.8 e 0.95 c.

1904 Lorentz deduz as transformações que mantém as equações de


Maxwell invariantes por mudança de referencial inercial, para o
caso das equações no vácuo. Um ano depois Poincaré estendeu o
resultado para as equações na presenca de densidades de carga ρ e
corrente J.

1905 Annus Mirabilis de Einstein. Além dos trabalhos sobre o efeito


fotoelétrico e movimento browniano, Einstein publica seu famoso
Zur Elektrodynamik bewegter Körper (Sobre a Eletrodinâmica dos corpos
em movimento). Nascia a Teoria da Relatividade especial.

1908 Hermann Minkowski (1864 - 1909) mostra que a teoria de seu ex-
aluno quando professor em Zürich, na Suíça, podia ser interpretada
geometricamente num espaço quadridimensional (espaço-tempo)
com uma métrica pseudo-euclideana.

1907 - 1915 Einstein trabalha na sua Teoria Geral a partir da generali-


zação da Teoria Especial para referenciais acelerados.

1911 Einstein prediz a deflexão da luz no campo gravitacional num


trabalho intitulado Über den Einflußder Schwerkraft auf die Ausbreitung
des Lichtes (Sobre a influência da gravidade na propagação da luz).

1912 - 1913 O físico finlandês Gunnar Nordström publica a sua teoria


da gravitação que foi considerada uma séria concorrente da Teoria
Geral de Einstein e poderia ter se tornado a teoria dominante não
fosse a motivação de cunho filosófico de Einstein de combinar sua
teoria com a teoria especial. Em 1914 Nordström introduziu uma
quinta dimensão à sua teoria com o intuito de formular uma teoria
mais geral que englobasse também o Eletromagnetismo. Esta teoria
é conhecida nos dias de hoje como Teoria de Kaluza-Klein (Theodor
Kaluza, 1885 - 1954 e Oskar Klein, 1894 - 1977). Estas teorias multi-
dimensionais foram a inspiração de teorias similares nos dias atuais,
particularmente a teoria de cordas.

1913 Einstein publica em colaboração com o matemático suíço Marcel


Grossmann (1878 - 1936) um artigo intitulado Entwurf einer verall-
gemeinerten Relativitätstheorie und einer Theorie der Gravitation (Esboço
de uma teoria da relatividade generalizada e uma teoria da gravitação).
O artigo é dividido em 2 partes: I. Physikalischer Teil (seção física)
e II. Mathematischer Teil (seção matemática), esta última escrita por
Grossmann. Neste artigo boa parte da teoria é desenvolvida mas as
equações de campo de Einstein ainda não são introduzidas.

© s.r. dahmen 2022


datas importantes 303

1915 Einstein publica as famosas equações que hoje levam seu nome
no artigo Die Feldgleichungen der Gravitation (As equações de campo da
gravitação).

1916 Einstein publica um longo artigo onde apresenta, em forma com-


pleta, sua teoria. O artigo é intitulado Die Grundlage der allgemeinen
Relativitätstheorie (Os fundamentos da Teoria da Relatividade Geral).

1916 Karl Schwarzschild (1873 - 1916) descobre, enquanto soldado no


front russo, soluções para as equações de Einstein geradas por uma
massa com simetria esférica. Estas soluções permitem calcular a
precessão do periélio de Mercúrio, a deflexão da luz num campo
gravitacional e introduzem a singularidade de Schwarzschild (que
mais tarde vieram a ser conhecidos como buracos negros).

1922 Alexander Alexandrovitch Friedmann (1888 - 1925), matemático


russo, apresenta as soluções das equações de Einstein para um
universo que se expande. Inicia-se uma curta polêmica com Einstein,
que inicialmente dúvida das soluções de Friedmann mas acaba por
aceitá-la.

1927 Georges Lemaître, físico e padre belga (1894 - 1966) generaliza as


soluções de Friedmann e sugere que a recessão das galáxias pode
ser explicada pela expansão do Universo descoberta por Friedmann.
Ele também lança a hipótese de um “átomo primevo” ou “início do
universo”, que viria mais tarde ser conhecido como Big Bang, teoria
posteriormente desenvolvida pelo físico russo-americano George
Gamow (1904 - 1968). O nome Big Bang foi dado por J. A. Wheeler
(1911 - 2008)1 . 1
Wheeler orientou 46 doutorandos em
Princeton. Entre seus alunos estão
1929 O astrônomo americano Edwin Hubble (1889 - 1953) descobre Richard Feynman, Hugh Everett, Kip
Thorne, Robert Wald, Bill Unruh, Char-
a expansão do universo, mostrando que quando mais distante a les Misner e do físico brasileiro Jayme
galáxia, maior a velocidade com que ela se afasta de nós (a chamada Tiomno. Com Thorne e Misner escreveu
Lei de Hubble). o clássico livro de relatividade geral, o
Gravitation

1964 Arno Allan Penzias (1933 - ) e Robert Woodrow Wilson (1936 - )


descobrem Radiação Cósmica de Fundo (CMB ou Cosmic Background
Radiation), estabelecendo sobre bases experimentais sólidas a teoria
do Big Bang. Por este trabalho eles foram agraciados com o Prêmio
Nobel de 1978.

© s.r. dahmen 2022


D
O paradoxo dos gêmeos ou dos relógios
na Teoria da Relatividade Geral

D.1 Realidade e Intuição Física

Os fenômenos da contração do espaço e dilatação do tempo se nos


apresentam inicialmente como algo pouco intuitivo. É justamente desta
falta de intuição para a verdadeira natureza do espaço-tempo (um
contínuo quadridimensional) que surgem os chamados “paradoxos” –
como por exemplo o famoso paradoxo dos gêmeos, o mais conhecido da
TER. Como o próprio nome diz, paradoxos são resultados inesperados
cuja contradição com a realidade é apenas aparente1 . Eles são porém de 1
Paradoxo, ou antinomia, é uma afirma-
ção lógica auto-contraditória ou uma cujo
tal modo formulados a nos dar a impressão que a teoria da relatividade
resultado vai contra nossa expectativa do
é inconsistente. Na verdade os paradoxos nada mais são do que aquilo mesmo. Um exemplo de paradoxo lógico
que os matemáticos chamam de ill-posed problems, ou seja, problema é a afirmação “esta sentença é falsa”. A
palavra vem do grego antigo παραδoξoς
incorretamente colocados. No nosso caso em particular, paradoxos que significa “estranho” ou “inesperado”.
surgem de nossa tentativa de aplicar conceitos galileanos no lugar dos
modernos conceitos de espaço-tempo da teoria da relatividade.

D.2 O paradoxo dos gêmeos ou dos relógios na TRE

Façamos nesta seção uma análise detalhada do chamado “paradoxo


dos gêmeos”, talvez o mais conhecido dentre todos os “paradoxos” da
teoria da relatividade. Uma escritora, que chamaremos de Eva, embarca
numa viagem interestelar até uma estrela U, deixando sua irmã Ava
na Terra. Consideramos que a Terra e a estrela U estejam em repouso
relativo. As condições da viagem são as seguintes:
i) A viagem é simétrica: Eva viaja o mesmo tempo na ida e na volta,
se afastando de Ava com velocidade v e se aproximando dela com
velocidade −v.

ii) O ponto de retorno, a estrela U, está em repouso relativo em relação


à H.
306 uma introdução à teoria do espaço e do tempo

iii) Ambas carregam sinalizadores idênticos que enviam sinais de


Ava Eva
frequência ν0 . Terra
v
Estrela U
Eva v
Ava
A idéia da viagem pode ser representada na figura ao lado, visto por Eva
Ava
Ava, que ficou na Terra, e por Eva, que viajou para a estrela. Do ponto −v

de vista de Eva, ele gasta um tempo T 0 /2 na ida e T 0 /2 na volta. Porém,


Ava
Ava terá medido um tempo maior, igual à (γ − 1) T 0 . Do ponto de vista −v
Eva
Ava
de Eva, é Ava quem viaja e o relógio que deveria andar mais rápido é o −v
Eva
Ava
seu, e não o de Ava. v
Eva

Antes de discutirmos porém o paradoxo, é importante que façamos


Figura D.1: O paradoxo dos gêmeos ilus-
uma rápida discussão acerca do efeito Doppler relativístico. Este efeito trado: do ponto de vista de um relógio
é fundamental para que compreendamos o paradoxo dos gêmeos pois usado por Eva (painel superior), a sua vi-
agem de ida dura T 0 /2, e sua viagem de
o usaremos como “relógio”para calcular o tempo transcorrido durante
volta também dura T 0 /2. Ava medirá um
as viagens. Um tratamento detalhado deste efeito foi apresentado no tempo transcorrido maior T > T 0 . Para
capítulo 5 das minhas notas de aula sobre Relatividade Restrita. Eva quem viaja é Ava, e portanto o efeito
inverso deveria ser observado, ou seja,
Uma fonte de ondas eletromagnéticas de frequência própria ν0 = T < T0 .
1/T 0 emite sinais de comprimento de onda λ0 = c/ν0 = cT 0 . Do
referencial de quem o observa, o período é aumentado por um fator
γ devido ao efeito da dilatação temporal, ou seja T = γT 0 . A isto se
soma – em analogia ao caso clássico – o fato que o emissor está em
movimento. O comprimento de onda não é portanto igual à cT, mas
deve levar em conta a distância adicional percorrida pelo emissor, ou
seja r
0 0 1 + v/c
λ = cT + vT = (c + v)γT = cT . (D.1)
1 − v/c
Disto segue que r
λ ν 1 + v/c
= 0 = . (D.2)
λ0 ν 1 − v/c
Façamos agora a análise da viagem de Eva sob o ponto de vista dos
dois referenciais: primeiro o do irmão Ava que ficou na Terra (sistema
I, tabela D.1) e depois de Eva (sistema I’, tabela D.2).

© s.r. dahmen 2022


o paradoxo dos gêmeos ou dos relógios na teoria da relatividade geral 307

a) Primeira parte da viagem de Eva Tabela D.1: Viagem de Eva (na espaço-
nave) vista por Ava (na Terra).
a. Início t=0

b. Velocidade relativa de Eva v

c. Tempo de viagem total de Eva T

T
d. Distância EU entre Ava e Eva quando d= 2v
Eva chega ao ponto de retorno U
q
1−v/c
e. Frequência dos sinais emitidos por Eva νEva ida = ν0 1+v/c
e captados por Ava

T d
f. Tempo t1 no qual Ava fica sabendo do t1 = 2 + c
retorno de Eva

g. Número de sinais de frequência νEva ida NEva ida √


= νS ida · t1 =
d
emitidos por Eva e recebidos por Ava até t1 = ν0 v 1 − v2 /c2

b) Segunda parte da viagem de Eva

h. Velocidade relativa de Eva −v


q
1+v/c
i. Frequência dos sinais emitidos por Eva νEva volta = ν0 1−v/c
e captados por Ava

j. Número de sinais de frequência νEva volta NEva volta√= νS volta · ( T − t1 ) =


emitidos por Eva e recebidos por Ava até = ν0 vd 1 − v2 /c2
o retorno de Eva

k. Número total de sinais recebidos por Ava NEva ida + NEva volta =
NEva = √
= ν0 T 1 − v2 /c2

l. Número total de sinais emitidos por Ava NAva = ν0 T

Analisando as duas tabelas podemos concluir o seguinte: para Ava,


que ficou na Terra, o fato de contar um NAva > NEva significa que um

tempo menor = T 0 = T 1 − v2 /c2 < T decorreu para Eva, pois ela
mandou um menor número de sinais. Já a viajante Eva conclui que Ava
emitiu mais sinais, pois segundo ela NAva > NEva e portanto o tempo
para Ava passou mais rapidamente que o seu! Ou seja, as conclusões
dos gêmeos são condizentes. Ao voltar Eva terá envelhecido menos
quge Ava.
As explicações normalmente apresentadas nos livros-texto sobre as
resolução deste paradoxo são basicamente de três tipos e refletem em
parte uma certa fragilidade em relação aos argumentos apresentados.
Nos próximos parágrafos seguirei de perto a explicação apresentada
pelo físico indiano C. S. Unnikrishnan 2 . O primeiro tipo de argumento 2
C.S. Unnikrishnan, On Einstein’s resolu-
diz respeito à assimetria do problema, afinal Ava está num referencial tion of the twin clock paradox, Current Sci-
ence 89/12 (2005), pp. 2009 - 2015.

© s.r. dahmen 2022


308 uma introdução à teoria do espaço e do tempo

a) Primeira parte da viagem de Eva - Sistema I’ Tabela D.2: Viagem de Eva vista de seu
referencial próprio.
a. Início t0 = 0

b. Velocidade relativa de Ava −v


g
c. Tempo de viagem total de Ava T 0 = T 0 /2 + T 00 /2

T0
d. Distância AU (contraído para Eva pois d0 = d
γ = 2 | − v|
para ela Ava e U estão em movimento)
q
1−v/c
e. Frequência dos sinais emitidos por Ava νAva ida = ν0 1+v/c
e captados por Eva

f. Tempo no qual Ava inicia retorno t10 = T 0 /2(= T 00 /2)

g. Número de sinais de frequência νAva ida NAva ida = νH ida · t10 =


emitidos por Ava e recebidos por Eva até t10 = ν0 dv (1 − v/c)

b) Segunda parte da viagem de Eva - Sistema I”

h. Início t00 = T 0 /2

i. Velocidade relativa de Ava v


q
1+v/c
j. Frequência dos sinais emitidos por Ava νAva volta = ν0 1−v/c
e captados por Eva

k. Distância d00 = d
γ = d0

0 00
l. Número de sinais de frequência νAva volta NAva volta = νH volta T2 = νAva volta T2
emitidos por Ava e recebidos por Eva = ν0 dv (1 + v/c)
até seu retorno

m. Número total de sinais recebidos por Eva NEva = NEva ida + NEva volta =
= ν0 2d
v

n. Número total de sinais emitidos por Eva NEva = ν0 T 0 = ν0 vγ


2d

inercial enquanto Eva não está pois, se retorna, em algum momento


de sua jornada estará submetida à acelerações. Consequentemente,
para calcular o diferença entre os tempos nos diferentes referenciais é
necessário ir além da TER, generalizando a teoria. O próprio Einstein
fez isso, pois só apresentou sua solução do paradoxo após haver criado
a TRG.
O segundo tipo de argumento busca evitar o problema do referencial
acelerado e se baseia na troca de linha de simultaneidade quando Eva
inicia o retorno. Isso equivale dizer que há 3 diferentes relógios no
sistema: o primeiro relógio é o de Ava. O segundo é o de Eva na
viagem de ida. Ao iniciar a viagem de volta ela passa para um terceiro
referencial inercial ao qual está associado um terceiro relógio. Vamos
chamar estes relógios de A, B e C, respectivamente. Nas palavras de

© s.r. dahmen 2022


o paradoxo dos gêmeos ou dos relógios na teoria da relatividade geral 309

C.S. Unnikrishnan:

The second type of resolution invokes a change of line of simultaneity


during the turn back of the twin B. This became necessary when people
posed the twin paradox such that there was no acceleration experienced
by the clocks, but merely involved change of inertial frames, by including
a third clock C. The twin (clock) B moves out in inertial motion, and
after some time transfers the reading of his clock using a light signal
to another clock C that is moving inertially in the opposite direction
towards A. So, A and C can compare their reading as they pass each
other without having to physically turn around the path of one of the
clocks. Since no acceleration is involved, some other physical mechanism
for the asymmetrical aging needs to be invoked. The space-time diagram
in Figure 2 explains the analysis. The diagram is again preferentially
drawn from the rest frame of A. All the clocks, A, B and C are in inertial
motion. I have indicated the line of simultaneity of B and C as LS-B
and LS-C. These represent a set of inertially moving clocks that are
synchronous with the proper time of B and C respectively. The resolution
points out that during the trans- fer of clock information from the frame
of B to the frame of C, the line of simultaneity has changed, with a
discrepancy and advance of time at A of ∆t. Thus it is suggested that
the excess physical time dilation of the B–C system relative to A happens
in the short duration of transfer of information from one inertial frame
to another. There is yet another ‘resolution’ that says that the ‘ticks of
time’ as observed from the frame of the moving twin by receiving light
signals sent by the stationary twin are Doppler-shifted differently during
the outward and in- ward journey and there is a small residual second-
order difference between these remaining at the end of the jour- ney that
correctly accounts for the asymmetrical aging. Thus, in this resolution as
well as in the previous one, asymmetrical physical aging has nothing to
do with acceleration. We will need to come back to this analysis late.

A figura à qual o autor se refere é apresentada abaixo e a solução prévia


por ele mencionada é a de Einstein. Esta solução se baseia no fato que
a situação não é totalmente simétrica, pois a irmã que viaja não pode
ser considerada, durante todo o tempo, um referencial inercial: ela está
submetido à acelerações durante o processo, principalmente quando
dá início à viagem de retorno. Um cálculo aproximado se baseia no
seguinte argumento. Imaginemos que a aceleração se da em pequenos
passos, durante a qual a velocidade do foguete é u é praticamente
constante durante um intervalo de tempo dt0 que, do ponto de vista da
irmã na Terra, vale (considerando que u < v)

dt0
dt = q (D.3)
u2
1− c2

Observe que do ponto de vista de Ava a aceleração ocorre em diferentes


pontos do espaço ao passo que para Eva ela ocorre no mesmo local. A

© s.r. dahmen 2022


310 uma introdução à teoria do espaço e do tempo

dilatação do tempo será dada assim por


Z t0 Z t0
2 dt0 2 dt0 ∆t0
∆t = q ≤ q = q . (D.4)
t10 u2 ( t 0 ) t10 v2 v2
1− c2
1− c2
1− c2

Ou seja, haverá uma dilatação menor que aquela que ocorreria se a


viagem fosse realizada a velocidade constante.
Do ponto de vista de Eva a assimetria surge do fato que ela mudou
de referencial inercial. Analisando o diagrama de Minkowski veremos
que no momento de troca de referencial há, do ponto de vista de Eva,
um pulo abrupto no tempo de Ava.

Figura D.2: A linha de mundo de Eva


que viaja a uma estrela próxima como
representado nas coordenadas de sua
irmã Ava que ficou na Terra. A linha
de mundo de Ava é designada por A
CL (o eixo vertical ct). B representa a linha
C de mundo de Eva em sua viagem para
longe da Terra. C representa sua linha
de mundo na viagem de volta à Terra.
As linhas pontilhadas representam os di-
c ∆t
agramas de Minkowski para o referencial
I 0 da ida (em vermelho) e I 00 da volta (em
azul). CL representa a trajetória de um
A B raio de luz.

Linha de Simultaneidade de B

Linha de Simultaneidade de C

D.3 O paradoxo dos gêmeos na Relatividade Geral

Seguirei aqui o tratamento apresentado por Møller 3 . Embora possamos 3


C.Møller, The General Theory of Relativity,
encontrar exposições mais sucintas, a de Møller é a mais detalhada. A Oxford University Press, Oxford, 1952,
pp. 258–262.
figura ao lado representa esquematicamente a situação física. Pensemos
não em termos das pessoas (Ava e Eva) que viajam mas de dois relógios,
C1 e C2 : no início da viagem os dois se encontram na origem do sistema
de coordenadas. O relógio C2 viaja a bordo da espaçonave e marca o
tempo transcorrido neste referencial. No início ambos se encontram na
origem do referencial S1 de coordenadas X, Y, Z, T. No instante T = 0
o relogico C2 é acelerado por uma força constante F na direção do eixo
X positivo. Ao chegar no ponto A, após ter atingido uma velocidade
v, ele mantém a velocidade constante até o ponto B da trajetória. Ali
passa a sofrer uma força igual e contrária à sofrida entre a origem
O e o ponto A, vindo a parar em C. Neste instante ele é acelerado
novamente com uma força de magnitude F até o ponto B, viaja com

© s.r. dahmen 2022


o paradoxo dos gêmeos ou dos relógios na teoria da relatividade geral 311

velocidade constante −v em direção à Terra e chegando no ponto A da C1 C2


Terra Estrela U
trajetória sofre uma desaleração até parar na superfície do planeta. As
velocidades no trecho sem aceleração e as acelerações são todas iguais,
só trocando de sentido nos respectivos trechos. A B C

Sejam ∆0 T, ∆00 T e ∆000 T o tempo gasto por C2 para percorrer as


acelerado velocidade constante acelerado
distâncias OA, AB e BC, respectivamente. Por questão de simetria, a
viagem de volta de C para A deve ser o inverso da viagem de A para
C, além do que vale Figura D.3: O paradoxo dos gêmeos ilus-
trado do ponto de vista de uma viagem
∆0 T = ∆000 T (D.5) com aceleração. Entre a origem e o ponto
A, o relógio C2 acelera até atingir uma ve-
Denotemos também por ∆τ1 e ∆τ2 o tempo decorrido entre os dois locidade constante v. Entre A e B ele viaja
encontros dos relógios (na partida e na chegada), medidos por C1 e C2 com esta velocidade mas chegando neste
último, sofre uma desaceleração igual à
respectivamente, isto é τ1 e τ2 são seus tempos-próprios. Obviamente sofrida entre a origem e A, mas com sen-
que, por ser C1 um relógio de um referencial inercial, seu tempo próprio tido contrário, vindo a atingir o repouso
τ1 é o tempo-coordenada do referencial S1 , o que significa que ∆τ1 é em C. Ele imediatamente inverte a via-
gem, acelera até B, viaja com velocidade
idêntico ao intervalo ∆T da variável temporal do sistema S1 medido −v até A e novamente desacelera até che-
entre encontros: gar à Terra. Durante toda a viagem, o
relógio C1 permanece na Terra.
∆τ1 = ∆T = 2 (∆0 T + ∆00 T + ∆000 T ) = 2 (2∆0 T + ∆00 T ) (D.6)

Da mesma maneira escrevemos

∆τ2 = 2(τ20 + τ200 + τ2000 ) = 2 (2τ20 + τ200 ) (D.7)

onde τ20 , τ200 τ2000 representa os incrementos do tempo-próprio do relógio


C2 aos percorrer os trechos OA, AB e BC, respectivamente. Como
pudemos ver no curso de relatividade restrita, o movimento de uma
corpo acelerado é um movimento hiperbólico, e portanto pode ser
descrito por
 1
c2 aT 2 2
  
X= 1+ 1+ −1 (D.8)
a c
onde
F
a= (D.9)
m0
e m0 é a massa de repouso do relógio. A velocidade u = dX/dT vale

dX aT
u= = p (D.10)
dT 1 + ( aT/c)2
e portanto
a∆0 T
v= p (D.11)
1 + ( a∆0 T/c)2
é a velocidade adquirida pelo corpo (do ponto de vista do referencial
inercial) atingida depois de um tempo ∆0 T transcorrido. Isto significa
que podemos escrever
v
a∆0 T = √ (D.12)
1 − v2 /c2

© s.r. dahmen 2022


312 uma introdução à teoria do espaço e do tempo


Usando agora a expressão para o tempo-próprio dτ = 1 − u2 /c2 dt
e a expressão para a velocidade u acima, podemos calcular o tempo
próprio τ20 do relógio C2 :
Z ∆0 T p Z ∆0 T 0
dT c −1 a∆ T
τ20 = 1 − u2 /c2 dT = r  2 = a sinh
0 0 c
1 + aTc
(D.13)
Podemos agora usar a equação (D.12) para escrever

a∆0 T v/c aτ 0 aτ 000


= √ = sinh 2 = sinh 2 (D.14)
c 1 − v2 /c2 c c
ou
aτ 0
aτ20 sinh c 2 v
tanh = q = (D.15)
c aτ20 c
1 + sinh2 c
Obtemos da mesma maneira da definição de tempo-próprio que
p
τ200 = 1 − v2 /c2 ∆00 T (D.16)

Agora, se para um valor constante de v aplicarmos uma força F cada


vez maior, a aceleração a = F/m0 também aumentará. No limite de
a → ∞ para v constante vemos de (D.14) que tanto ∆0 T = ∆000 T e
τ20 = τ2000 tendem a zero. Neste limite, no qual a velocidade v é atingida
quase que instantaneamente, obtemos de (eq:C6), (eq:C7) e (D.3)
p
∆τ1 = 2∆00 T, ∆τ2 = 2τ200 = 2∆00 T 1 − v2 /c2 (D.17)

ou seja p
∆τ2 = ∆τ1 1 − v2 /c2 (D.18)
Veremos agora que o mesmo resultado pode ser obtido se todo o pro-
cesso é visto do ponto de vista de um referencial S2 com coordenadas
( x, y, z, t) que segue o movimento do relógio C2 de tal modo que este
relógio se encontra sempre parado na origem. Nos intervalos de tempo
em que S2 está acelerado em relação ao referencial S1 ou a estrelas
distantes, no referencial S2 há um campo gravitacional. Durante o inter-
valo de tempo 0 < t0 < τ20 de magnitude ∆0 t = τ20 o campo gravitacional
é descrito pelo potencial (vide eq. ??)

c2
Φ= ( g00 − 1) = (D.19)
2

© s.r. dahmen 2022


Referências Bibliográficas

[1] C. Moeller, The Theory of Relativity, Oxford University Press, 1952.

[2] A. N. Matveev, Mechanics and Theory of Relativity, Mir Publishers,


Moscow, 1989.

[3] Y.P. Terletskii, Paradoxes in the Theory of Relativity, Plenum Press,


New York, 1968.

[4] V.A. Ugarov, The special theory of relativity, Mir Publishers, Moscow,
1978.

[5] M. Tsamparlis Special Relativity: an Introduction with 200 Problems


and Solutions, Springer Verlag, Berlin, 2010).

[6] M. Born, Die Relativitätstheorie Einsteins (A Teoria da Relatividade de


Einstein), Springer Verlag, Berlin, 2006.

[7] A. Einstein, The Principle of Relativity, Dover Publications, New


York, 1952. (Textos fundamentais da Física Moderna: O princípio
da relatividade. Tradução de Mário J. Saraiva, 4a. edição, Fundação
Calouste Gulbenkian, 1971).

[8] V. Petkov, Relativity and the Nature of Spacetime, Springer Verlag,


New York, 2005.

[9] R. Resnick, Introduction to Special Relativity, John Wiley & Sons,


New York, 1968.

[10] L. D. Landau e I. B. Rumer, O que é a Teoria da Relatividade, Editora


Mir, Moscou, 1980.

[11] H. Reichenbach, The Philosophy of Space and Time, Dover, 1957.

[12] L. Sklar, Space, Time and Spacetime, University of California Press,


1974.

[13] A. Grünbaum, Philosophical Problems of Space and Time, Springer,


1973.
314 uma introdução à teoria do espaço e do tempo

[14] B.C. van Frassen, An Introduction to the Philosophy of Space and Time,
Columbia University Press, 1985.

[15] M. Friedman Foundations of Space-Time Theories, Princeton Univer-


sity Press, 1983.

[16] C.S. Unnikrishnan, On Einstein’s resolution of the twin clock paradox,


Current Science 89/12 (2005), pp. 2009 - 2015.

[17] P. Mittelstaed, Der Zeitbegriff in der Physik (O Conceito de Tempo na


Física), 2. Auflage, Wissenschaftsverlag, Bibliographisches Institut,
Mannheim, 1980.

[18] I. Kant, Kritik der Reinen Vernunft, Philosophische Bibliothek, Felix


Meiner Verlag, Hamburg, 2019.

[19] I. Kant, Prolegomena zu einer jeden künftigen Metaphysik, die als


Wissenschaft wird auftreten können, Philosophische Bibliothek, Felix
Meiner Verlag, Hamburg, 2001.

[20] I. Strohmeyer, Tranzendental-philosophische und physikalische Raum-


Zeit-Lehre (Doutrina física e transcedental-filosófica do espaço-tempo),
Wissenschaftsverlag, Bibliographisches Institut, Mannheim, 1978.

[21] Derek J. Raine and Michael Heller, The Science of Space–Time, Pa-
chart Publishing House, Tucson, 1981.

[22] N. Copérnico, As Revoluções dos Orbes Celestes, 1a. edição, Fundaç


ão Calouste Gulbenkian, Lisboa, 1984. Tradução de A. Dias Gomes
e Gabriel Domingues.

[23] H. Weyl, Raum, Zeit, Materie – Vorlesung über Allgemeine Relati-


vitätstheorie (Espaço, Tempo, Matéria – Aulas sobre a Teoria Geral da
Relatividade), Springer Verlag, Berlin, 1919.

[24] L. I. Mandel’shtam, Collected Works vol. V, Izd. Akad. Nauk SSR,


(1950). Citado em [2].

[25] Aristotle, The works of Aristotle, vol. I, W. D. Ross (ed). Great Books
of the Western World, vol. 8. Encyclopedia Britannica, Chicago,
1952. A tradução do livro Φυσικη por R. P. Hardie e R. K. Gaye.

[26] K. Simonyi, Kulturgeschichte der Physik: von den Anfängen bis 1990
(História cultural da Física, dos primórdios até 1990), Verlag Harri
Deutsch, Thun/Frankfurt am Main, 1995.

[27] E. J. Dijksterhuis, Die Mechanisierung des Weltbildes (A mecanização


da visão do universo), Springer Verlag, Berlin, 1983.

[28] G. Frank, W. Ruppel, Mechanik, Relativität, Gravitation (Mecânica,


Relatividade, Gravitação), Springer Verlag, Berlin, 1973.

© s.r. dahmen 2022


referências bibliográficas 315

[29] A. Pais, Subtle is the Lord. The Science and the Life of Albert Einstein,
Oxford University Press, Oxford, 1982.

© s.r. dahmen 2022

Você também pode gostar