Escolar Documentos
Profissional Documentos
Cultura Documentos
Clareza, legibilidade e rigor combinam-se na segunda edição deste livro amplamente utilizado
para fornecer o primeiro passo para a relatividade geral para estudantes de graduação com uma
formação mínima em matemática.
Tópicos dentro da relatividade que fascinam pesquisadores e estudantes astrofísicos são
abordados com a facilidade e autoridade características de Schutz – de buracos negros a lentes
gravitacionais, de pulsares ao estudo do Universo como um todo. Esta edição agora contém
descobertas recentes de astrônomos que requerem a relatividade geral para sua explicação; um
capítulo revisado sobre estrelas relativísticas, incluindo novas informações sobre pulsares; um
capítulo inteiramente reescrito sobre cosmologia; e um tratamento extenso e abrangente de
detectores de ondas gravitacionais modernos e fontes esperadas.
Mais de 300 exercícios, muitos novos para esta edição, dão aos alunos a confiança para
trabalhar com a relatividade geral e a matemática necessária, enquanto o estilo de escrita informal
torna o assunto facilmente acessível. Soluções protegidas por senha para instrutores estão
disponíveis em www.cambridge.org/Schutz.
Um Primeiro Curso de
Relatividade geral
Segunda edição
Bernard F. Schutz
Instituto Max Planck de Física Gravitacional (Instituto Albert Einstein) e
Universidade de Cardiff
Machine Translated by Google
www.cambridge.org
Informações sobre este título: www.cambridge.org/9780521887052
© B. Schutz 2009
Esta publicação está protegida por direitos autorais. Sujeito a exceção legal e ao
fornecimento de acordos de licenciamento coletivo relevantes, nenhuma reprodução de qualquer
parte pode ocorrer sem a permissão por escrito da Cambridge University Press.
A Cambridge University Press não se responsabiliza pela persistência ou precisão de urls para
sites externos ou de terceiros mencionados nesta publicação e não garante que qualquer
conteúdo em tais sites seja, ou permanecerá, preciso ou apropriado.
Machine Translated by Google
Machine Translated by Google
Machine Translated by Google
Conteúdo
1 Relatividade especial 1
viii Conteúdo
ix Conteúdo
x Conteúdo
Nos 23 anos entre a primeira edição deste livro e a presente revisão, o campo da relatividade geral
floresceu e amadureceu. Sobre seus sólidos fundamentos matemáticos cresceram inúmeras
aplicações, algumas das quais nem sequer eram imaginadas em 1985, quando surgiu a primeira
edição. O estudo da relatividade geral, portanto, mudou da periferia para o centro da educação de
um físico teórico profissional, e cada vez mais alunos de graduação esperam aprender pelo menos o
básico da relatividade geral antes de se formarem.
Meus leitores têm sido pacientes. Os alunos continuaram a usar a primeira edição deste livro para
aprender sobre os fundamentos matemáticos da relatividade geral, embora tenha se tornado
seriamente desatualizado em aplicações como a astrofísica de buracos negros, a detecção de ondas
gravitacionais e a exploração de o universo. Esta segunda edição extensivamente revisada, espero,
finalmente trará o livro de volta ao equilíbrio e dará aos leitores uma introdução consistente e
unificada à pesquisa moderna em gravitação clássica.
Os primeiros oito capítulos sofreram poucas mudanças. Referências recentes para leitura adicional
foram incluídas e algumas seções foram expandidas, mas, em geral, a abordagem geométrica dos
fundamentos matemáticos da teoria parece ter resistido ao teste do tempo.
Em contraste, os quatro capítulos finais, que tratam da relatividade geral na arena astrofísica, foram
atualizados, expandidos e, em alguns casos, completamente reescritos.
Polegada. 9, sobre radiação gravitacional, há agora uma extensa discussão sobre detecção com
interferômetros como o LIGO e o detector espacial planejado LISA. Também incluí uma discussão
sobre prováveis fontes de ondas gravitacionais e o que podemos esperar aprender com as detecções.
Este é um campo que está mudando rapidamente, e a primeira detecção direta pode ocorrer a
qualquer momento. O Capítulo 9 destina-se a fornecer uma estrutura durável para a compreensão
das implicações dessas detecções.
Polegada. 10, a discussão sobre a estrutura de estrelas esféricas permanece robusta, mas inseri
material sobre estrelas de nêutrons reais, que vemos como pulsares e que são fontes potenciais de
ondas gravitacionais detectáveis.
O Capítulo 11, sobre buracos negros, também ganhou um extenso material sobre as evidências
astrofísicas de buracos negros, tanto para buracos negros de massa estelar quanto para buracos
negros supermassivos que os astrônomos surpreendentemente descobriram nos centros da maioria
das galáxias. A discussão da radiação Hawking também foi ligeiramente alterada.
Por fim, Cap. 12 sobre cosmologia é completamente reescrito. Na primeira edição eu
essencialmente ignorei a constante cosmológica. Nisso segui o preconceito da época, que supunha
que a expansão do universo estava desacelerando, embora ainda não tivesse sido medida com
precisão suficiente. Acreditamos agora, a partir de uma variedade de observações mutuamente
consistentes, que a expansão está se acelerando. Este é provavelmente o maior desafio para
Machine Translated by Google
física teórica hoje, tendo um impacto tão grande nas teorias fundamentais da física de partículas
quanto nas questões cosmológicas. Eu organizei o Ch. 12 em torno dessa perspectiva, desenvolvendo
modelos matemáticos de um universo em expansão que incluem a constante cosmológica, depois
discutindo em detalhes como os astrônomos medem a cinemática do universo e, finalmente,
explorando a maneira como os constituintes físicos do universo evoluíram após o Big Bang. Os
papéis da inflação, da matéria escura e da energia escura afetam a estrutura do universo hoje e até
mesmo nossa própria existência. Neste capítulo, é possível apenas dar uma breve amostra do que
os astrônomos aprenderam sobre essas questões, mas espero que seja suficiente para encorajar os
leitores a aprender mais.
Incluí mais exercícios em vários capítulos, onde era apropriado, mas removi as soluções dos
exercícios do livro. Eles já estão disponíveis no site do livro.
O assunto deste livro continua sendo a relatividade geral clássica; além de uma breve discussão
sobre a radiação Hawking, não há referência aos efeitos de quantização. Embora a gravidade
quântica seja uma das áreas mais ativas de pesquisa em física teórica hoje, ainda não há uma
direção clara para apontar um aluno que queira aprender a quantizar a gravidade. Talvez na terceira
edição seja possível incluir um capítulo sobre como a gravidade é quantizada!
Quero agradecer a muitas pessoas que me ajudaram nesta segunda edição. Vários me forneceram
generosamente listas de erros de impressão e erros na primeira edição; Quero mencionar
especialmente Frode Appel, Robert D'Alessandro, JAD Ewart, Steve Fulling, Toshi Futamase, Ted
Jacobson, Gerald Quinlan e B. Sathyaprakash. Quaisquer erros remanescentes são, obviamente, de
minha inteira responsabilidade. Agradeço também aos meus editores da Cambridge University Press,
Rufus Neal, Simon Capelin e Lindsay Barnes, por sua paciência e incentivo.
E é claro que sou profundamente grato à minha esposa Sian por sua generosa paciência durante
todas as horas, dias e semanas que passei trabalhando nesta revisão.
Machine Translated by Google
Este livro evoluiu de notas de aula para um curso de graduação de um ano inteiro em relatividade geral que lecionei
de 1975 a 1980, uma experiência que me convenceu firmemente de que a relatividade geral não é significativamente
mais difícil para os alunos de graduação aprenderem do que os tratamentos padrão de nível de graduação.
eletromagnetismo e mecânica quântica.
A explosão do interesse de pesquisa em relatividade geral nos últimos 20 anos, em grande parte estimulada pela
astronomia, não apenas levou a uma compreensão mais profunda e completa da teoria, mas também nos ensinou
maneiras mais simples e físicas de entendê-la. A relatividade está agora na corrente principal da física e da
astronomia, de modo que nenhum físico teórico pode ser considerado amplamente educado sem algum treinamento
no assunto. A formidável relatividade da reputação adquirida em seus primeiros anos (Entrevistador: 'Professor
Eddington, é verdade que apenas três pessoas no mundo entendem a teoria de Einstein?' Eddington: 'Quem é o
terceiro?') sendo mais amplamente ensinado aos físicos teóricos. O objetivo deste livro é apresentar a relatividade
geral em um nível apropriado para alunos de graduação, de modo que o aluno compreenda os conceitos físicos
básicos e suas implicações experimentais, seja capaz de resolver problemas elementares e esteja bem preparado
para os conceitos mais avançados. textos sobre o assunto.
Na prossecução deste objectivo, tentei satisfazer dois critérios concorrentes: primeiro, assumir um mínimo de
pré-requisitos; e, segundo, evitar diluir o assunto. Ao contrário da maioria dos textos introdutórios, este não pressupõe
que o aluno já tenha estudado eletromagnetismo em sua formulação manifestamente relativista, a teoria das ondas
eletromagnéticas ou a dinâmica dos fluidos. A dinâmica de fluidos necessária é desenvolvida nos capítulos
relevantes. A principal consequência de não assumir uma familiaridade com as ondas eletromagnéticas é que as
ondas gravitacionais têm que ser introduzidas lentamente: a equação da onda é estudada do zero.
1 O tratamento aqui é, portanto, diferente em espírito daquele em meu livro Geometrical Methods of Mathematical
Physics (Cambridge University Press 1980b), que pode ser usado para complementar este.
Machine Translated by Google
alicerce para que o aluno possa ir a tratamentos mais avançados sem ter que recomeçar do
início.
A primeira parte do livro, até o cap. 8, apresenta a teoria em uma sequência que é típica de
muitos tratamentos: uma revisão da relatividade especial, desenvolvimento da análise tensorial
e física do contínuo na relatividade especial, estudo do cálculo tensorial em coordenadas
curvilíneas em espaços euclidianos e de Minkowski, geometria de variedades curvas , física
em um espaço-tempo curvo e, finalmente, as equações de campo. Os quatro capítulos restantes
estudam alguns tópicos que escolhi por causa de sua importância na astrofísica moderna. O
capítulo sobre radiação gravitacional é mais detalhado do que o usual neste nível porque a
observação de ondas gravitacionais pode ser um dos desenvolvimentos mais significativos na
astronomia na próxima década. O capítulo sobre estrelas esféricas inclui, além do material
usual, uma família útil de soluções compressíveis exatas devido a Buchdahl. Um longo capítulo
sobre buracos negros estuda com algum detalhe a natureza física do horizonte, indo até as
coordenadas de Kruskal, depois explorando o buraco negro rotativo (Kerr) e concluindo com
uma discussão simples sobre o efeito Hawking, a emissão mecânica quântica de radiação por
buracos negros. O capítulo final sobre cosmologia deriva as métricas homogêneas e isotrópicas
e estuda brevemente a física da observação e evolução cosmológica. Há um apêndice
resumindo a álgebra linear necessária no texto e outro apêndice contendo dicas e soluções
para exercícios selecionados. Um assunto ao qual decidi não dar tanta importância, como
outros textos tradicionalmente, são os testes experimentais de relatividade geral e de teorias
alternativas da gravidade. Os pontos de contato com o experimento são tratados à medida que
surgem, mas discussões sistemáticas de testes agora exigem livros inteiros (Will 1981).2 Os
físicos hoje têm muito mais confiança na validade da relatividade geral do que tinham uma ou
duas décadas atrás, e acredito que uma extensa discussão de teorias alternativas é, portanto,
quase tão fora de lugar em um texto elementar moderno sobre gravidade quanto seria em um
sobre eletromagnetismo.
Supõe-se que o aluno já tenha estudado: relatividade especial, incluindo a transformação de
Lorentz e mecânica relativista; cálculo vetorial euclidiano; equações diferenciais parciais
ordinárias e simples; termodinâmica e hidrostática; gravidade newtoniana (a estrutura estelar
simples seria útil, mas não essencial); e mecânica quântica elementar suficiente para saber o
que é um fóton.
A notação e as convenções são essencialmente as mesmas de Misner et al., Gravitation
(WH Freeman 1973), que pode ser considerada como um possível texto de seguimento após este.
O ponto de vista físico e o desenvolvimento do assunto também são inevitavelmente
influenciados por esse livro, em parte porque Thorne foi meu professor e em parte porque
Gravitação se tornou um texto tão influente. Mas porque tentei tornar o assunto acessível a um
público muito mais amplo, o estilo e o método pedagógico do presente livro são muito diferentes.
Em relação ao uso do livro, ele foi projetado para ser estudado sequencialmente como um
todo, em um curso de um ano, mas pode ser encurtado para acomodar um curso de meio ano.
Cursos de meio ano provavelmente devem visar objetivos restritos. Por exemplo, seria razoável
tentar ensinar ondas gravitacionais e buracos negros em meio ano para alunos que já
estudou as ondas eletromagnéticas, pulando cuidadosamente alguns dos capítulos. 1–3 e a maioria
dos caps. 4, 7 e 10. Alunos com preparação em relatividade especial e dinâmica de fluidos poderiam
aprender estrutura estelar e cosmologia em meio ano, desde que pudessem passar rapidamente pelos
primeiros quatro capítulos e depois pular os capítulos. 9 e 11. Um curso de nível de pós-graduação
pode, é claro, ser muito mais rápido, e deve ser possível cobrir todo o texto em meio ano.
Cada capítulo é seguido por um conjunto de exercícios, que vão desde os triviais (preenchendo as
etapas que faltam no corpo do texto, manipulando a matemática recém-introduzida) até problemas
avançados que ampliam consideravelmente a discussão no texto. Alguns problemas requerem
calculadoras programáveis ou computadores. Não posso exagerar a importância de fazer uma seleção
de problemas. Os fáceis e médios nos capítulos iniciais fornecem prática essencial, sem a qual os
capítulos posteriores serão muito menos compreensíveis. Os problemas médio-difíceis e difíceis dos
capítulos posteriores são um teste de compreensão do aluno. É muito comum na relatividade os alunos
acharem a estrutura conceitual tão interessante que relegam a resolução de problemas a um segundo
plano. Tal separação é falsa e perigosa: um aluno que não consegue resolver problemas de dificuldade
razoável também não entende realmente os conceitos da teoria. Geralmente, há mais problemas do
que se esperaria que um aluno resolvesse; vários capítulos têm mais de 30. O professor deverá
selecioná-los criteriosamente. Outra rica fonte de problemas é o Livro de Problemas em Relatividade e
Gravitação, Lightman et al. (Princeton University Press 1975).
Sou grato a muitas pessoas por sua ajuda, direta e indireta, com este livro. Gostaria de agradecer
especialmente aos meus alunos de graduação da University College, Cardiff, cujo entusiasmo pelo
assunto e cuja paciência com as inadequações das primeiras notas de aula me incentivaram a
transformá-las em livro. E sou certamente grato a Suzanne Ball, Jane Owen, Margaret Vallender,
Pranoat Priesmeyer e Shirley Kemp por sua paciente digitação e redigitação dos sucessivos rascunhos.
Machine Translated by Google
Machine Translated by Google
1 Relatividade especial
A maneira pela qual a relatividade especial é ensinada em um nível de graduação elementar – o nível
em que o leitor é considerado competente – geralmente se aproxima em espírito da maneira como foi
inicialmente entendida pelos físicos. Esta é uma abordagem algébrica, baseada na transformação de
Lorentz (§ 1.7 abaixo). Neste nível básico, aprendemos como usar a transformação de Lorentz para
converter entre as medidas de um observador e de outro, para verificar e compreender fenômenos
notáveis como dilatação do tempo e contração de Lorentz, e fazer cálculos elementares da conversão de
massa em energia.
Esse ponto de vista puramente algébrico começou a mudar, a se ampliar , menos de quatro anos
depois que Einstein propôs a teoria . espaço tridimensional que agora chamamos de espaço-tempo. Este
foi o início do ponto de vista geométrico, que levou diretamente à relatividade geral em 1914-16. É este
ponto de vista geométrico sobre a relatividade especial que devemos estudar antes de tudo.
Como veremos, a relatividade especial pode ser deduzida de dois postulados fundamentais:
(1) Princípio da relatividade (Galileu): Nenhum experimento pode medir a velocidade absoluta de um
observador; os resultados de qualquer experimento realizado por um observador não dependem de
sua velocidade em relação a outros observadores que não estão envolvidos no experimento.
(2) Universalidade da velocidade da luz (Einstein): A velocidade da luz em relação a qualquer observador
não acelerado é c = 3 × 108 m sÿ1, independentemente do movimento da fonte da luz em relação
ao observador. Sejamos bem claros sobre o significado deste postulado: dois observadores não
acelerados diferentes medindo a velocidade do mesmo fóton descobrirão que ele está se movendo
a 3 × 108 m sÿ1 em relação a si mesmos, independentemente de seu estado de movimento
em relação um ao outro.
Como observado acima, o princípio da relatividade não é um conceito moderno; ela remonta à hipótese
de Galileu de que um corpo em um estado de movimento uniforme permanece nesse estado a menos
que seja atuado por algum agente externo. Ela está totalmente incorporada na segunda
1 O artigo original de Einstein foi publicado em 1905, enquanto a discussão de Minkowski sobre a geometria do
espaço-tempo foi dada em 1908. Os artigos de Einstein e Minkowski são reimpressos (em tradução inglesa) em
The Principle of Relativity por A. Einstein, HA Lorentz, H. Minkowski e H. Weyl (Dover).
Machine Translated by Google
2 Relatividade especial
lei, que contém apenas acelerações, não velocidades em si. As leis de Newton são, de fato, todas
invariantes sob a substituição
onde V é qualquer velocidade constante . Esta equação diz que uma velocidade v(t) relativa a um
observador torna-se v (t) quando medida por um segundo observador cuja velocidade relativa ao primeiro
é V. Isso é chamado de lei galileana da adição de velocidades.
Ao dizer que as leis de Newton são invariantes sob a lei galileana da adição de velocidades, estamos
fazendo uma afirmação do tipo que muitas vezes faremos em nosso estudo da relatividade, então é bom
começar tornando-a muito precisa. A primeira lei de Newton, de que um corpo se move com velocidade
constante na ausência de forças externas, não é afetada pela substituição acima, pois se v(t) é realmente
uma constante, digamos v0, então a nova velocidade v0 ÿ V também é uma constante.
segunda lei de newton
F = ma = m dv/ dt,
Portanto, a segunda lei será válida de acordo com as medidas de ambos os observadores, desde que
adicionemos à lei de transformação de Galileu a afirmação de que F e m são eles mesmos invariantes,
ou seja, os mesmos independentemente de qual dos dois observadores os mede.
A terceira lei de Newton, de que a força exercida por um corpo sobre outro é igual e oposta àquela
exercida pelo segundo sobre o primeiro, claramente não é afetada pela mudança de observadores,
novamente porque assumimos que as forças são invariantes.
Portanto, não há velocidade absoluta. Existe uma aceleração absoluta? Newton argumentou que
havia. Suponha, por exemplo, que eu esteja em um trem em um trilho perfeitamente liso,2 tomando uma
tigela de sopa no vagão-restaurante. Então, se o trem se move com velocidade constante, a sopa
permanece nivelada, não me oferecendo nenhuma informação sobre qual é a minha velocidade. Mas, se
o trem muda sua velocidade, então a sopa sobe por um lado da tigela, e posso dizer, olhando para ela,
quão grande e em que direção é a aceleração.3 Portanto, é razoável e útil destacar um classe de
observadores preferidos: aqueles que não são acelerados. Eles são chamados de observadores
inerciais, e cada um tem uma velocidade constante em relação a qualquer outro. Esses observadores
inerciais são fundamentais na relatividade especial, e quando usarmos o termo 'observador' de agora em
diante nos referiremos a um observador inercial.
O postulado da universalidade da velocidade da luz foi a grande e radical contribuição de Einstein para
a relatividade. Ele quebra a lei galileana da adição de velocidades porque diz que se v tem magnitude c,
então v também tem , independentemente de V. A primeira
experimento
evidência
de Michelson-Morely,
direta para este postulado
embora não
foi o
esteja claro se o próprio Einstein foi influenciado por ela. Todas as previsões contra-intuitivas da
relatividade especial fluem desse postulado e são amplamente confirmadas por experimentos. Na
verdade, é provavelmente justo dizer que a relatividade especial tem uma base experimental mais firme
do que qualquer outra
2
Os físicos freqüentemente têm que fazer tais idealizações, que muitas vezes estão muito distantes da experiência comum!
3
Para a discussão de Newton sobre esse ponto, veja o trecho de seu Principia em Williams (1968).
Machine Translated by Google
nossas leis da física, uma vez que é testada todos os dias em todos os aceleradores de partículas gigantes,
que enviam partículas quase à velocidade da luz.
Embora o conceito de relatividade seja antigo, é costume referir-se à teoria de Einstein simplesmente como
“relatividade”. O adjetivo 'especial' é aplicado para distingui-la da teoria da gravitação de Einstein, que recebeu
o nome de 'relatividade geral' porque nos permite descrever a física do ponto de vista de observadores
acelerados e inerciais e é, nesse sentido, um forma mais geral de relatividade. Mas a verdadeira distinção física
entre essas duas teorias é que a relatividade especial (SR) é capaz de descrever a física apenas na ausência
de campos gravitacionais, enquanto a relatividade geral (GR) estende a SR para descrever a própria gravitação.
geração de físicos havia escolhido nomes mais apropriados para essas teorias!
É importante perceber que um 'observador' é de fato um enorme sistema de coleta de informações, não apenas
um homem com binóculos. De fato, removeremos inteiramente o elemento humano de nossa definição e
diremos que um observador inercial é simplesmente um sistema de coordenadas para o espaço-tempo, que faz
uma observação simplesmente registrando a localização (x, y, z) e o tempo (t) de Qualquer evento. Este sistema
de coordenadas deve satisfazer as três propriedades a seguir para ser chamado de inercial:
(1) A distância entre o ponto P1 (coordenadas x1, y1, z1) e o ponto P2 (coordenadas
x2, y2, z2) é independente do tempo.
(2) Os relógios que ficam em cada ponto marcando a coordenada de tempo t são sincronizados e
todos correm na mesma velocidade.
Isso virá mais tarde. Acontece que apenas um observador não acelerado pode manter seus relógios
sincronizados. Mas preferimos começar com esta definição geométrica de um observador inercial. É uma
questão de experiência decidir se tal observador pode existir: não é auto-evidente que qualquer uma dessas
propriedades deva ser realizável, embora provavelmente esperaríamos que um universo 'bom' as permitisse!
No entanto, veremos mais adiante no curso que um campo gravitacional geralmente torna impossível construir
tal sistema de coordenadas, e é por isso que GR é necessário. Mas não vamos adiantar a história. No momento,
estamos assumindo que podemos construir tal sistema de coordenadas (que, se você quiser, os campos
gravitacionais ao nosso redor são tão fracos que realmente não importam). Podemos imaginar esse sistema de
coordenadas, de maneira bastante fantasiosa, como uma treliça de hastes rígidas preenchendo o espaço, com
um relógio em cada interseção das hastes. Algum sistema conveniente, como uma coleção de GPS
4
É fácil ver que os campos gravitacionais causam problemas para SR. Se um astronauta em órbita ao redor da Terra segura
uma tigela de sopa, a sopa sobe pela lateral da tigela em resposta à “força” gravitacional que mantém a espaçonave em
órbita? Dois astronautas em órbitas diferentes aceleram um em relação ao outro, mas nenhum deles sente uma aceleração.
Problemas como esse tornam a gravidade especial, e teremos que esperar até o Ch. 5 para resolvê-los.
Até então, a palavra 'força' se referirá a uma força não gravitacional.
Machine Translated by Google
4 Relatividade especial
satélites e receptores, é usado para garantir que todos os relógios estejam sincronizados. Os relógios
devem ser espaçados muito densamente, de modo que haja um relógio próximo a cada evento de
interesse, pronto para registrar sua hora de ocorrência sem qualquer atraso. Vamos agora definir como
usamos este sistema de coordenadas para fazer observações.
Uma observação feita pelo observador inercial é o ato de atribuir a qualquer evento as coordenadas x,
y, z do local de sua ocorrência e a hora lida pelo relógio em (x, y, z) quando o evento ocorreu. Não é a
hora t no relógio de pulso usado por um cientista localizado em (0, 0, 0) quando ele toma conhecimento do
evento. Uma observação visual é deste segundo tipo: o olho considera simultâneos todos os eventos que
vê ao mesmo tempo; um observador inercial considera simultâneos todos os eventos que ocorrem ao
mesmo tempo registrados pelo relógio mais próximo dele quando os eventos ocorreram. Essa distinção é
importante e deve ser lembrada. Às vezes, diremos 'um observador vê...', mas isso será apenas uma
abreviação de 'medidas'. Nunca nos referiremos a uma observação visual , a menos que o digamos
explicitamente.
Um observador inercial também é chamado de referencial inercial, que muitas vezes abreviamos para
'reference frame' ou simplesmente 'frame'.
Como a velocidade da luz c é tão fundamental, adotaremos de agora em diante um novo sistema de
unidades de medida em que c tem simplesmente o valor 1! Não há problema em criaturas de movimento
lento, como engenheiros, se contentarem com as unidades do SI: m, s, kg. Mas parece bobagem em SR
usar unidades nas quais a constante fundamental c tem o valor ridículo de 3 × 108.
As unidades do SI evoluíram historicamente. Metros e segundos não são fundamentais; eles são
simplesmente convenientes para uso humano. O que faremos agora é adotar uma nova unidade de tempo, o metro.
Um metro de tempo é o tempo que a luz leva para percorrer um metro. (Você provavelmente está mais
familiarizado com uma abordagem alternativa: um ano de distância – chamado de 'ano-luz' – é a distância
que a luz percorre em um ano.) A velocidade da luz nessas unidades é:
Então, se medirmos consistentemente o tempo em metros, então c não é apenas 1, é também uma dimensão
menor! Ao converter de unidades do SI para essas unidades 'naturais', podemos usar qualquer uma das
seguintes relações:
3 × 108 m sÿ1 = 1, 1 s
= 3 × 108 m,
1
1m= s.
3 × 108
Machine Translated by Google
As unidades do SI contêm muitas unidades 'derivadas', como joules e newtons, que são definidas em
termos das três unidades básicas: m, s, kg. Ao converter de s para m, essas unidades simplificam-se
consideravelmente: energia e momento são medidos em kg, aceleração em mÿ1, força em kg mÿ1,
etc. Faça os exercícios sobre isso. Com a prática, essas unidades parecerão tão naturais para você
quanto para a maioria dos físicos teóricos modernos.
Observe que um raio de luz (fóton) sempre viaja em uma linha de 45ÿ neste diagrama.
t
(m)
Linha do mundo de luz, v = 1
Linha mundial
acelerada Linha mundial de partículas movendo-se em
velocidade |v| < 1
Um evento
x (m)
5
Usamos a palavra 'espaço' de uma forma mais geral do que você pode estar acostumado. Não nos referimos a um espaço
euclidiano no qual as distâncias euclidianas são necessariamente fisicamente significativas. Em vez disso, queremos dizer apenas
que é um conjunto de pontos que é contínuo (em vez de discreto, como uma rede). Este é o primeiro exemplo do que definiremos
no cap. 5 para ser um 'manifold'.
Machine Translated by Google
6 Relatividade especial
(1) Os eventos serão indicados por letras maiúsculas cursivas, por exemplo, A, B,P. No entanto, a letra O é
reservado para denotar observadores.
(2) As coordenadas serão chamadas (t, x, y, z). Qualquer quádruplo de números como (5, ÿ3, 2, 1016) denota
um evento cujas coordenadas são t = 5, x = ÿ3, y = 2, z = 1016. Assim, sempre colocamos t primeiro.
Todas as coordenadas são medidas em metros.
(3) Muitas vezes é conveniente referir-se às coordenadas (t, x, y, z) como um todo, ou a cada uma
indiferentemente. É por isso que damos a eles os nomes alternativos (x0, x1, x2, x3). Esses sobrescritos
denota o 3
não são expoentes, mas apenas rótulos, chamados índices. Assim (x3) 2 quadrado da coordenada
(que é z), não o quadrado do cubo de x. Genericamente, as coordenadas x0, x1, x2 e x3 são chamadas
de xÿ. Um índice grego (por exemplo, ÿ, ÿ,ÿ, ÿ) será assumido para tomar um valor do conjunto (0, 1, 2,
3). Se ÿ não receber um valor, então xÿ é qualquer uma das quatro coordenadas.
(4) Há ocasiões em que queremos distinguir entre t por um lado e (x, y, z) por outro. Usamos índices latinos
para nos referirmos apenas às coordenadas espaciais.
Assim, um índice latino (por exemplo , a, b, i, j, k, l) assumirá um valor do conjunto (1, 2, 3). Se i não
recebe um valor, então xi é qualquer uma das três coordenadas espaciais. Nossas convenções sobre o
uso de índices gregos e latinos não são de forma alguma universalmente usadas pelos físicos. Alguns
livros os invertem, usando latim para {0, 1, 2, 3} e grego para {1, 2, 3}; outros usam a, b, c, ... para um
conjunto e i, j, k para o outro.
que Os alunos
estão devem sempre verificar as convenções utilizadas no trabalho
lendo.
Como qualquer observador é simplesmente um sistema de coordenadas para o espaço-tempo, e como todos
os observadores observam os mesmos eventos (o mesmo espaço-tempo), deve ser possível desenhar as
linhas de coordenadas de um observador no diagrama de espaço-tempo desenhado por outro observador.
Para isso, temos que fazer uso dos postulados da RS.
Suponha que um observador O use as coordenadas t, x como acima, e que outro observador O¯, com
coordenadas ¯t , x¯, esteja se movendo com velocidade v na direção x em relação a O. Onde estão os eixos
de coordenadas para ¯t e x¯ ir no diagrama de espaço-tempo de O?
Eixo ¯t: Este é o lugar geométrico dos eventos na constante x¯ = 0 (e y¯ = ¯z = 0 também, mas vamos
ignorá-los aqui), que é o lugar geométrico da origem das coordenadas espaciais de O¯ . Esta é a linha do
mundo de O, e se parece com a mostrada na Fig. 1.2.
¯
eixo x : Para localizar isso, fazemos uma construção projetada para determinar o local dos eventos
em ¯t = 0, ou seja, aqueles que O¯ mede como simultâneos com o evento ¯t = ¯x = 0.
Considere a figura no diagrama de espaço-tempo de O, mostrado na Fig. 1.3. Todos os eventos no eixo
x¯ têm a seguinte propriedade: Um raio de luz emitido no evento E de x¯ = 0 em, digamos, tempo ¯t = ÿa
atingirá o eixo x¯ em x¯ = a (chamamos isso de evento P); se refletido, retornará ao ponto x¯ = 0 em ¯t = +a,
chamado evento R. O eixo x¯ pode ser definido, portanto, como o lugar geométrico de
Machine Translated by Google
7 1.5 Cons trução das coordenadas utilizadas por outro r obse rver
A tangente deste
ângulo é ÿ
t
uma
uma
x
-uma
eventos que refletem raios de luz de tal maneira que retornam ao eixo ¯t em +a se o deixaram em
-a, para qualquer a. Agora observe isso no diagrama de espaço-tempo de O, Fig. 1.4.
Sabemos onde está o eixo ¯t , pois o construímos na Fig. 1.2. Os eventos de emissão e
recepção, ¯t = ÿa e ¯t = +a, são mostrados na Fig. 1.4. Como a é arbitrário, não importa onde ao
longo do eixo ¯t negativo colocamos o evento E, então nenhuma suposição precisa ser feita sobre
a calibração do eixo ¯t em relação ao eixo t . Tudo o que importa para o
momento é que o evento R no eixo ¯t deve estar tão distante da origem quanto o evento E. Depois
de desenhá-los na Fig. 1.4, desenhamos em seguida o mesmo feixe de luz de antes, emitido de E,
e viajando em um 45 ÿ linha neste diagrama. O feixe de luz refletido deve chegar a R, então é a
linha de 45ÿ com inclinação negativa através de R. A interseção desses dois feixes de luz deve ser
o evento de reflexão P. Isso estabelece a localização de P em nosso dia
grama. A linha que a une com a origem – a linha tracejada – deve ser o eixo x:
Machine Translated by Google
8 Relatividade especial
t
t
uma
-uma
t t
t t
ÿ ÿ
x
ÿ
x x
ÿ
(uma) (b)
não coincide com o eixo x . Se você comparar este diagrama com o anterior, verá porque:
em ambos os diagramas a luz se move em uma linha de 45ÿ , enquanto os eixos te ¯t mudam
a inclinação de um diagrama para o outro. Esta é a concretização do segundo postulado
fundamental de SR: que o feixe de luz em questão tem velocidade c = 1 (e, portanto,
inclinação = 1) em relação a cada observador. Quando aplicamos isso a essas construções
geométricas, descobrimos imediatamente que os eventos simultâneos a O¯ (a linha ¯t = 0,
seu eixo x ) não são simultâneos a O (não são paralelos à linha t = 0, o eixo x ). Essa falha
de simultaneidade é inevitável.
Os diagramas a seguir (Fig. 1.5) representam a mesma situação física. O da esquerda é o
diagrama de espaço-tempo O, no qual O' se move para a direita. O da direita é desenhado
do ponto de vista de O¯, no qual O se move para a esquerda. Os quatro ângulos são todos
iguais ao arco tan |v|, onde |v| é a velocidade relativa de O e O¯.
Machine Translated by Google
É claro que ainda não terminamos a construção das coordenadas de O¯. Nós temos o
posição de seus eixos, mas não a escala de comprimento ao longo deles. Encontraremos essa escala provando
o que é provavelmente o teorema mais importante de SR, a invariância do intervalo.
Considere dois eventos na linha do mundo do mesmo feixe de luz, como E e P
na Fig. 1.4. As diferenças ( t, x, y, z) entre as coordenadas de E e P em
2 2 2 2
algum quadro O satisfaz a relação ( x) + ( s) + ( z) ÿ ( t) = 0, pois a velocidade
da luz é 1. Mas pela universalidade da velocidade da luz, as diferenças de coordenadas
entre os mesmos dois eventos nas coordenadas de O¯( ¯t , x¯, z¯) também satisfazem
y¯,
2 2 2 2
( x¯) + ( y¯) + ( = 0.z¯)Vamos
ÿ ( definir
¯t) o intervalo entre quaisquer dois eventos
(não necessariamente na mesma linha de mundo do feixe de luz) que são separados por coordenadas
incrementos ( t, x, y, z) para be6
2
2 2 2
segundos
= ÿ( t) + ( x) + ( s) + ( z) 2. (1.1)
Segue que se s2 = 0 para dois eventos usando suas coordenadas em O, então s¯ 2 = 0 para
os mesmos dois eventos usando suas coordenadas em O¯. O que isso implica sobre a relação
entre as coordenadas dos dois quadros? Para responder a esta pergunta, vamos supor que
a relação entre as coordenadas de O e O¯ é linear e que escolhemos suas origens
para coincidir (ou seja, que os eventos ¯t = ¯x = ¯y = ¯z = 0 e t = x = y = z = 0 são os mesmos).
Então, na expressão para s¯ 2,
2
2 2 2
segundos
= ÿ( ¯t) + ( x¯) + ( y¯) + ( z¯) 2,
os números ( ¯t, 2 o x¯, y¯, z¯) são combinações lineares de suas contrapartes não barradas,
significa que s¯ que
é uma função quadrática dos incrementos de coordenadas não barradas. Nós
pode, portanto, escrever
3 3
2
segundos
= (1.2)
Mÿÿ( xÿ)( xÿ)
ÿ=0 ÿ=0
para alguns números {Mÿÿ; ÿ, ÿ = 0, ... , 3}, que podem ser funções de v, a relativa
velocidade dos dois quadros. Observe que podemos supor que Mÿÿ = Mÿÿ para todos os ÿ e ÿ,
uma vez que apenas a soma Mÿÿ + Mÿÿ aparece na Eq. (1.2) quando ÿ = ÿ. Agora nós novamente
suponha que s2 = 0, de modo que da Eq. (1.1) temos
2 2
t = r, r = [( x) + ( s) + ( z) 2] 1/2.
6 O aluno para quem isso é novo provavelmente deve considerar a notação s2 como um símbolo único, não como o quadrado
de uma quantidade s. Como s2 pode ser positivo ou negativo, não é conveniente extrair sua raiz quadrada. Algum
os autores, entretanto, chamam s2 de 'intervalo quadrado', reservando o nome 'intervalo' para s = ÿ( s2). Observe também
que a notação s2 nunca significa (s2).
Machine Translated by Google
10 Relatividade especial
M0i = 0i = 1, 2, 3 (1.4a)
1 se i = j,
ÿij = (1.4c)
0 se i = j.
ÿ(v) = ÿM00,
então provamos o seguinte teorema: A universalidade da velocidade da luz implica que os intervalos
s2 e s¯2 satisfazem a relação entre quaisquer dois eventos calculados por diferentes observadores
segundos
2. = ÿ(v) s (1,5)
Vamos agora mostrar que, de fato, ÿ(v) = 1, que é a afirmação de que o intervalo é independente
do observador. A prova disso tem duas partes. A primeira parte mostra que ÿ(v) depende apenas de |
v|. Considere uma haste que está orientada perpendicularmente à velocidade v de O em relação a O.
Suponha que a haste esteja em repouso em O, sobre o eixo y . No diagrama de espaço-tempo de O
(Fig. 1.6), as linhas do mundo de suas extremidades são desenhadas e a região entre eles sombreada.
É fácil ver que o quadrado de seu comprimento é apenas o intervalo entre os dois eventos A e B que
são simultâneos em O (em t = 0) e ocorrem nas extremidades da haste. Isso porque, para esses
eventos, ( x)AB = ( z)AB = ( t)AB = 0. Agora vem o ponto chave da primeira parte da prova: os eventos
A e B são simultâneos medidos por O¯ também. A razão é mais facilmente vista pela construção
mostrada na Fig. 1.7, que é o mesmo diagrama de espaço-tempo da Fig. 1.6, mas no qual a linha do
mundo de um relógio em O é desenhada. Essa linha é perpendicular ao eixo y e paralela ao plano t ÿ
x , ou seja, paralela ao eixo ¯t mostrado na Fig. 1.5(a).
Suponha que este relógio emita raios de luz no evento P que atinge os eventos A e B. (Nem todo
relógio pode fazer isso, então escolhemos um relógio em O que passa pelo eixo y
Machine Translated by Google
Marcar ponto
em t = 0 e pode enviar tais raios de luz.) Os raios de luz refletem de A e B, e podemos ver
pela geometria (se você permitir a perspectiva no diagrama) que eles chegam de volta a
O¯'s relógio no mesmo evento L. Portanto, do ponto de vista de O, os dois eventos ocorrem
ao mesmo tempo. (Esta é a mesma construção que usamos para determinar o eixo x.) Mas
se A e B são simultâneos em O¯, então o intervalo entre eles em O¯ também é o quadrado
de seu comprimento em O¯. O resultado é:
2
(comprimento da haste em O¯) = ÿ(v)(comprimento da haste em O) 2.
Por outro lado, o comprimento da haste não pode depender da direção da velocidade,
porque a haste é perpendicular a ela e não há direções de movimento preferidas (o princípio
da relatividade). Portanto, a primeira parte da prova conclui que
12 Relatividade especial
O segundo passo da prova é mais fácil. Ele usa o princípio da relatividade para mostrar que
ÿ(|v|) = 1. Considere três quadros, O, O¯, e O. O quadro O¯ move-se com velocidade v em, digamos, o
direção x em relação a O. O quadro O se move com velocidade v na direção x negativa em relação
também. É claro que O é de fato idêntico a O, mas por uma questão de clareza vamos manter
notação separada para o momento. Temos, a partir das Eqs. (1.5) e (1.6),
2
2
s2
= ÿ(v) s¯
s¯
2ÿs = [ÿ(v)]2 s 2.
= ÿ(v) s2
2
Mas como O e O são idênticos, s e s2 são iguais. Segue que
ÿ(v) = ±1.
Devemos escolher o sinal de mais, pois na primeira parte desta prova o quadrado do comprimento
de uma haste deve ser positivo. Provamos, portanto, o teorema fundamental de que o
intervalo entre quaisquer dois eventos é o mesmo quando calculado por qualquer observador inercial:
=s 2.
2
segundos
(1.7)
Observe que da primeira parte desta prova também podemos concluir agora que o comprimento de um
haste orientada perpendicularmente à velocidade relativa de dois pórticos é a mesma quando medida
por qualquer quadro. Também vale a pena reiterar que a construção na Fig. 1.7 provou uma relação
resultado, que dois eventos que são simultâneos em um quadro são simultâneos em qualquer quadro
movendo-se em uma direção perpendicular à sua separação em relação ao primeiro quadro.
Como s2 é uma propriedade apenas dos dois eventos e não do observador, pode ser usado
classificar a relação entre os eventos. Se s2 for positivo (de modo que os incrementos espaciais
dominam t), os eventos são ditos como separados no espaço. Se s2 for negativo, os eventos
são ditas como separadas no tempo. Se s2 é zero (portanto, os eventos estão no mesmo caminho da luz),
os eventos são ditos como lightlike ou null separados.
Os eventos que são semelhantes à luz separados de qualquer evento particular A, encontram-se em um cone cuja
vértice é A. Este cone é ilustrado na Fig. 1.8. Isso é chamado de cone de luz de A. Todos os eventos
dentro do cone de luz estão separados de A; todos os eventos fora dele são semelhantes ao espaço
separados. Portanto, todos os eventos dentro do cone podem ser alcançados de A em uma linha de mundo
que em todos os lugares se move em uma direção temporal. Como veremos mais tarde que nada
pode se mover mais rápido que a luz, todas as linhas do mundo de objetos físicos se movem em uma direção
temporal. Portanto, eventos dentro do cone de luz são alcançáveis de A por um objeto físico,
enquanto os de fora não são. Por esta razão, os eventos dentro do 'futuro' ou 'adiante'
cone de luz às vezes é chamado de futuro absoluto do ápice; aqueles dentro do 'passado' ou
cones de luz 'atrasados' são chamados de passado absoluto; e os de fora são chamados de absolutos em outros
lugares. Os eventos no cone são, portanto, a fronteira do passado absoluto
Galileu: t
Futuro do evento
'Para agora
evento
Passado do evento
Futuro
Einstein:
t
do
'Em outro lugar'
'Em outro lugar'
do
do
'Agora' é apenas
em si Passado de
Comum
Futuro
do
Futuro
do
Passado de
x
Passado de
Passado comum
14 Relatividade especial
e futuro. Assim, embora 'tempo' e 'espaço' possam, em certo sentido, ser transformados um no outro
na RS, é importante perceber que ainda podemos falar de 'futuro' e 'passado' de maneira invariável.
Para Galileu e Newton, o passado era tudo "antes" do que agora; todo o espaço-tempo era a união do
passado e do futuro, cuja fronteira era o "agora". Em SR, o passado é apenas tudo dentro do cone de
luz passado, e o espaço-tempo tem três divisões invariantes: SR acrescenta a noção de 'outro lugar'.
Além disso, embora todos os observadores concordem sobre o que constitui o passado, o futuro e
outros lugares de um determinado evento (porque o intervalo é invariante), cada evento diferente tem
um passado e um futuro diferentes; dois eventos não têm passados e futuros idênticos, mesmo que
possam se sobrepor. Essas idéias são ilustradas na Fig. 1.9.
Podemos agora calibrar os eixos das coordenadas de O¯ no diagrama de espaço-tempo de O, Fig. 1.5.
Restringimo-nos ao plano t ÿ x . Considere uma curva com a equação
2 -t + x2 = a2,
onde a é uma constante real. Esta é uma hipérbole no diagrama de espaço-tempo de O, e passa por
todos os eventos cujo intervalo desde a origem é a2. Pela invariância do intervalo, esses mesmos
eventos têm intervalo a2 a partir da origem em O¯, então eles também estão na curva ÿ¯t 2 + ¯x2 = a2.
Esta é uma hipérbole espacial separada da origem. De forma similar,
os eventos na curva
2 -t + x2 = ÿb2
todos têm intervalo de tempo ÿb2 a partir da origem, e também estão na curva ÿ¯t 2 + ¯x2 = ÿb2.
Essas hipérboles são desenhadas na Fig. 1.10. Eles são todos assintóticos às linhas com inclinação
±1, que são, obviamente, os caminhos da luz através da origem. Em um diagrama tridimensional (no
qual adicionamos o eixo y , como na Fig. 1.8), as hipérboles de revolução seriam assintóticas ao cone
de luz.
Podemos agora calibrar os eixos de O¯. Na Fig. 1.11 , os eixos de O e O¯ são desenhados,
juntamente com uma hipérbole invariante de intervalo temporal ÿ1 a partir da origem. O evento A está
no eixo t , então x = 0. Como a hipérbole tem a equação
2 -t + x2 = ÿ1,
segue-se que o evento A tem t = 1. Da mesma forma, o evento B está no eixo ¯t , então tem x¯ = 0.
Como a hipérbole também tem a equação
segue-se que o evento B tem ¯t = 1. Usamos, portanto, a hipérbole para calibrar o eixo ¯t . Da mesma
forma, a hipérbole invariante
2 -t + x2 = 4
Machine Translated by Google
-uma uma x
–b
x
1
2 x
¯
Figura 1.11 Usando as hipérboles através dos eventos A e E para calibrar os eixos x¯ e t .
'distância' no espaço-tempo, e ele tem que adaptar sua intuição de acordo. Isso não está, é claro,
em conflito com a experiência cotidiana. A experiência cotidiana afirma que o 'espaço' (por exemplo, o
Machine Translated by Google
16 Relatividade especial
2
2 2
segundos
= ( x) + ( s) + ( z) 2.
Esta é apenas a sua distância euclidiana. A nova característica do SR é que o tempo pode (e
deve) ser trazido para o cálculo da distância. Não é possível definir 'espaço' de forma única,
pois diferentes observadores identificam diferentes conjuntos de eventos como simultâneos
(Fig. 1.5). Mas ainda há uma distinção entre espaço e tempo, pois os incrementos temporais
entram em s2 com o sinal oposto dos espaciais.
(uma)
t
t
(b)
Figura 1.12 (a) Uma linha de simultaneidade em O é tangente à hipérbole em P. (b) A mesma tangência vista
por O' .
Machine Translated by Google
A fim de usar a hipérbole para derivar os efeitos da dilatação do tempo e da contração de Lorentz, como
faremos na próxima seção, devemos apontar uma propriedade simples, mas importante da
tangente à hipérbole.
Na Fig. 1.12(a) desenhamos uma hipérbole e sua tangente em x = 0, que é obviamente
uma linha de simultaneidade t = const. Na Fig. 1.12(b) desenhamos as mesmas curvas do
ponto de vista do observador O que se move para a esquerda em relação a O. O evento P foi
deslocado para a direita: pode ser deslocado para qualquer lugar na hipérbole, escolhendo o Lorentz
transformação corretamente. A lição da Fig. 1.12(b) é que a tangente a uma hipérbole em qualquer
o evento P é uma linha de simultaneidade do quadro de Lorentz cujo eixo do tempo une P à origem.
Se este referencial tem velocidade v, a tangente tem inclinação v.
1.8 P r tí c ul a r l y importantes
Dilatação do tempo
Da Fig. 1.11 e do cálculo que a segue, deduzimos que quando um relógio se move no
¯t eixo atinge B tem uma leitura de ¯t = 1, mas esse evento B tem coordenada t = 1/ ÿ(1 ÿ v2)
em O. Então, para O, parece correr lentamente:
( ¯t ) medido em O¯
( t) medido em O = . (1,8)
ÿ(1 ÿ v2)
Observe que ¯t é o tempo realmente medido por um único relógio, que se move em um mundo
linha da origem até B, enquanto t é a diferença nas leituras de dois relógios em repouso
eu não; um em uma linha de mundo através da origem e um em uma linha de mundo através de B.
voltar a esta observação mais tarde. Por enquanto, definimos o tempo adequado entre os eventos B e
a origem para ser o tempo marcado por um relógio que realmente passa por ambos os eventos. Isto
é uma quantidade diretamente mensurável e está intimamente relacionada ao intervalo. Deixe o relógio ser
em repouso no referencial O¯, de modo que o tempo próprio ÿ é o mesmo que o tempo coordenado ¯t. Então,
como o relógio está em repouso em O¯, temos x¯ = y¯ = z¯ = 0, então
2 2 = ÿ ¯t
s = ÿ ÿ 2. (1.9)
2 2 2
ÿ = [( t) ÿ ( x) ÿ ( y) ÿ ( z) 2] 1/2
18 Relatividade especial
t
t
Figura 1.13 O comprimento adequado de AC é o comprimento da haste em sua estrutura de repouso, enquanto o de AB é seu comprimento
em O.
Contração de Lorentz
Na Fig. 1.13 mostramos a trajetória mundial de uma barra em repouso em O¯. Seu comprimento em O é a raiz
quadrada de s2 AC,enquanto seu comprimento em O é a raiz quadrada de s2 Se o evento C tem coordenadas
AB.
¯t = 0, x¯ = l, então pelo cálculo idêntico de antes de ter a coordenada x em O
xC = l/ ÿ(1 ÿ v2),
x/ t = v,
e assim temos
xC ÿ xB
= v,
tC - tB
xB = xC ÿ vtC
eu v2l
= ÿ
Convenções
O intervalo s2 é um dos conceitos matemáticos mais importantes de SR, mas não há um acordo
2 2
universal sobre sua definição: muitos autores definem s2 = ( t) ÿ ( x)
ÿ
Machine Translated by Google
2
( y) aosÿquais
( z) 2.nos
Esse
referimos
sinal geral
anteriormente),
é uma questão
poisdea convenção
invariância (como
de s2 implica
o uso dos
a invariância
índices latino
de ÿes2.
grego
O
resultado físico de importância é justamente essa invariância, que surge da diferença em + ( z) 2]
partes. Assim como em outras convenções,
sinal entre o ( t) os alunos2 e [( x) 2 + ( s) 2
devem garantir que sabem qual sinal está sendo usado: afeta todos os tipos de fórmulas, por
exemplo, a Eq. (1.9).
Falha da relatividade?
Os recém-chegados à RS, e outros que não a entendem bem o suficiente, muitas vezes se
preocupam neste ponto com a inconsistência da teoria. Começamos assumindo o princípio da
relatividade, que afirma que todos os observadores são equivalentes. Agora mostramos que se O¯
se move em relação a O, os relógios de O¯ serão medidos por O como sendo mais lentos do que os
de O. Então, não é o caso de O¯ medir os relógios de O como sendo correndo mais rápido que o
seu? Se for assim, isso viola o princípio da relatividade, já que poderíamos facilmente começar com
O e deduzir que os relógios de O andam mais devagar que os de O.
Isso é o que se chama de 'paradoxo', mas como todos os 'paradoxos' em SR, isso vem de não
ter raciocinado corretamente. Vamos agora demonstrar, usando diagramas de espaço-tempo, que
O¯ mede os relógios de O para estarem mais lentos. Claramente, poderíamos simplesmente
desenhar o diagrama de espaço-tempo do ponto de vista de O, e o resultado seguiria. Mas é mais
instrutivo permanecer no diagrama de espaço-tempo de O.
Diferentes observadores concordarão com o resultado de certos tipos de experimentos. Por
exemplo, se A jogar uma moeda, todos os observadores concordarão com o resultado. Da mesma
forma, se dois relógios estiverem próximos um do outro, todos os observadores concordarão em
qual está lendo um horário mais cedo do que o outro. Mas a questão da velocidade com que os
relógios funcionam só pode ser resolvida comparando os mesmos dois relógios em duas ocasiões
diferentes, e se os relógios estão se movendo um em relação ao outro, então eles podem estar
próximos um do outro em apenas uma dessas ocasiões. . Em outra ocasião, eles devem ser
comparados a alguma distância, e diferentes observadores podem tirar conclusões diferentes. A
razão para isso é que eles realmente realizam experimentos diferentes e inequivalentes. Na análise
a seguir, veremos que cada observador utiliza dois relógios próprios e um relógio do outro. Essa
assimetria no 'design' do experimento dá o resultado assimétrico.
Vamos analisar primeiro a medida de O, na Fig. 1.14. Isso consiste em comparar a leitura de um
único relógio de O¯ (que viaja de A a B) com dois relógios próprios: o primeiro é o relógio na origem,
que lê o relógio de O¯ no evento A; e o segundo é o relógio que está em F em t = 0 e coincide com
o relógio de O em B. Este segundo relógio de O move-se paralelamente ao primeiro, na linha
tracejada vertical. O que O diz é que ambos os relógios em A lêem t = 0, enquanto em B o relógio
de O¯ lê ¯t = 1, enquanto o de O lê um tempo posterior, t = (1 ÿ v2) ÿ1/2. Claramente, O' concorda
com isso, pois ele é tão capaz de olhar para os mostradores do relógio quanto O é. Mas para O
afirmar que o relógio de O está andando devagar, ele deve ter certeza de que seus dois relógios
estão sincronizados, caso contrário não há nenhum significado particular em observar que em B o
relógio de O está atrasado em relação ao de O. Agora, do ponto de vista de O, sua
Machine Translated by Google
20 Relatividade especial
t
t
Figura 1.14 O comprimento adequado de AB é o tempo que um relógio em , enquanto o de AC é o tempo em que
repouso em O leva para fazê-lo, medido por O.
os relógios são sincronizados, e a medição e sua conclusão são válidas. Na verdade, são as únicas
conclusões que ele pode tirar corretamente.
Mas O' não precisa aceitá-los, porque para ele os relógios de O não estão sincronizados. A linha
pontilhada que passa por B é o locus dos eventos que O¯ considera simultâneos a B. O evento E
está nesta linha e é o tique-taque do primeiro relógio de O, que O¯ mede como simultâneo ao evento B.
Um cálculo simples mostra que isso é em t = (1 ÿ v2) 1/2, antes do outro relógio de O em B, que está
lendo (1 ÿ v2) ÿ1/2. Portanto, O¯ pode rejeitar a medição de O, pois os relógios envolvidos não estão
sincronizados. Além disso, se O¯ estuda o primeiro relógio de O, ele conclui que ele passa de t = 0 a
t = (1 ÿ v2) 1/2 (ou seja, de A a B) no tempo que seu próprio relógio leva para tiquetaquear de ¯t = 0
a ¯t = 1 (ou seja, de A a B). Assim, ele considera os relógios de O mais lentos do que os seus.
Segue-se que o princípio da relatividade não é contrariado: cada observador mede o relógio do
outro como lento. A razão pela qual eles parecem discordar é que eles medem coisas diferentes. O
observador O compara o intervalo de A a B com o de A a C. O outro observador compara o de A a B
com o de A a E. Todos os observadores concordam com os valores dos intervalos envolvidos. O que
eles discordam é qual par usar para decidir sobre a taxa na qual um relógio está funcionando. Esse
desacordo surge diretamente do fato de os observadores não concordarem sobre quais eventos são
simultâneos. E, para reiterar um ponto que precisa ser entendido, a simultaneidade (sincronização
do relógio) está no centro das comparações de relógio: O usa dois de seus relógios para 'tempo' a
taxa de um relógio de O, enquanto O¯ usa dois de seus próprios relógios para cronometrar um relógio
de O.
Essa divergência é preocupante? Não deveria ser, mas deveria deixar o aluno muito cauteloso. O
fato de diferentes observadores discordarem sobre as taxas de clock ou simultaneidade significa
apenas que tais conceitos não são invariantes: eles são dependentes de coordenadas. Isso não
impede que um determinado observador use tais conceitos de forma consistente. Por exemplo, O
pode dizer que A e F são simultâneos, e ele está correto no sentido de que eles têm o mesmo valor
da coordenada t. Para ele, isso é uma coisa útil de se saber, pois ajuda a localizar os eventos no espaço-tempo.
Machine Translated by Google
Qualquer observador isolado pode fazer observações consistentes usando conceitos que são válidos
para ele, mas que podem não ser transferidos para outros observadores. Todos os chamados paradoxos
da relatividade envolvem, não a inconsistência das deduções de um único observador, mas a
inconsistência de supor que certos conceitos são independentes do observador quando na verdade são
muito dependentes do observador.
Mais dois pontos devem ser feitos antes de nos voltarmos para o cálculo da transformação de
Lorentz. A primeira é que não tivemos que definir um 'relógio', então nossas afirmações se aplicam a
qualquer bom relógio: relógios atômicos, relógios de pulso, ritmo circadiano ou a meia-vida do decaimento
de uma partícula elementar. Verdadeiramente, todo o tempo é 'retardado' por esses efeitos. Dito de
forma mais adequada, como a dilatação do tempo é uma consequência da falha da simultaneidade, ela
não tem nada a ver com a construção física do relógio e certamente não é perceptível a um observador
que olha apenas para seus próprios relógios. O observador O vê todos os seus relógios funcionando no
mesmo ritmo uns dos outros e como sua consciência psicológica do tempo, então todos esses processos
são mais lentos medidos por O. Isso leva ao "paradoxo" gêmeo, que discutiremos mais adiante.
O segundo ponto é que esses efeitos não são ilusões de ótica, pois nossos observadores exercem
o máximo de cuidado possível na realização de seus experimentos. Os alunos iniciantes geralmente se
convencem de que o problema surge na velocidade finita de transmissão dos sinais, mas isso é incorreto.
Os observadores definem 'agora' como descrito em § 1.5 para o observador O¯, e esta é a maneira mais
razoável de fazê-lo. O problema é que dois observadores diferentes definem 'agora' da maneira mais
razoável, mas não concordam. Esta é uma consequência inevitável da universalidade da velocidade da
luz.
Vamos agora tornar nosso raciocínio menos dependente da lógica geométrica estudando a álgebra de
SR: a transformação de Lorentz, que expressa as coordenadas de O em termos das de O. Sem perder
a generalidade, orientamos nossos eixos de modo que O¯ se mova com velocidade v no eixo x positivo
em relação a O. Sabemos que os comprimentos perpendiculares ao eixo x são os mesmos quando
medidos por O ou O¯. A transformação linear mais geral que precisamos considerar, então, é
¯t = ÿt + ÿx y¯ = y,
x¯ = ÿ t + ÿx z¯ = z,
x¯ (¯t = 0): vx ÿ t = 0.
22 Relatividade especial
que dá a transformação
¯t = ÿ(t ÿ vx),
x¯ = ÿ(x ÿ vt).
A Fig. 1.4 nos dá outra informação: os eventos (¯t = 0, x¯ = a) e ( ¯t = a, x¯ = 0) são conectados por
um raio de luz. Isso pode ser facilmente mostrado para implicar que ÿ = ÿ. Portanto, temos,
apenas da geometria:
¯t = ÿ(t ÿ vx), x¯
= ÿ(x ÿ vt).
2 2 2
ÿ( ¯t) + ( x¯) = ÿ( t) + ( x) 2.
Devemos selecionar o sinal + para que quando v = 0 obtenhamos uma identidade em vez de uma
inversão das coordenadas. A transformação completa de Lorentz é, portanto,
t vx
¯t = ÿ
,
ÿ(1 ÿ v2) ÿ(1 ÿ v2)
ÿvt x
x¯ = + ,
ÿ(1 ÿ v2) ÿ(1 ÿ v2) (1.12)
y¯ = y,
z¯ = z.
A transformação de Lorentz contém todas as informações que precisamos para derivar o padrão
fórmulas, como as de dilatação do tempo e contração de Lorentz. Como exemplo de seu uso,
generalizaremos a lei galileana da adição de velocidades (§ 1.1).
Machine Translated by Google
Suponha que uma partícula tenha velocidade W na direção x¯ de O¯, ou seja, x¯/ ¯t = W. Em
outro referencial O, sua velocidade será W = x/ t, e podemos deduzir x e t da transformação de
Lorentz . Se O se move com velocidade v em relação a O, então a Eq. (1.12) implica
x
W= = ( x¯ + v ¯t )/(1 ÿ v2) 1/2 ( ¯t
t + v x¯)/(1 ÿ v2)1/2 x¯/ ¯t + v
W+v
= = . (1.13)
1 + v x¯/ ¯t 1 + Wv
ou seja, v ou W também devem ser iguais a 1. Portanto, duas velocidades 'subluminais' produzem
outra subluminal. Além disso, se W = 1, então W = 1 independentemente de v: esta é a
universalidade da velocidade da luz. Além disso, se |W| 1 e |v| 1, então, de primeira
(1.13) dáordem, a Eq.
W = W + v.
Esta é a lei galileana da adição de velocidade, que sabemos ser válida para pequenas velocidades.
Isso era verdade para nossas fórmulas anteriores no § 1.8: as 'correções' relativísticas para as expressões
galileanas são de ordem v2 e, portanto, são desprezíveis para v pequeno.
24 Relatividade especial
'Sua velocidade máxima é 186 mph – que é 1/3 600 000 da velocidade da luz.'
Figura 1.15 A velocidade da luz está bem longe de nossa experiência usual! (Com a gentil permissão de S. Harris.)
forma a estrutura na qual todo físico moderno deve construir suas teorias. (Para o estudante que
realmente quer estudar um paradoxo em profundidade, veja 'O paradoxo' dissecado' neste
capítulo.)
Psicologicamente, a razão pela qual os recém-chegados à RS têm problemas e talvez dêem
aos 'paradoxos' mais peso do que merecem é que temos tão pouca experiência direta com
velocidades comparáveis à da luz (ver Fig. 1.15). O único remédio é resolver problemas em SR
e estudar cuidadosamente suas previsões 'contra-intuitivas'. Um dos melhores métodos para
desenvolver uma intuição moderna é estar completamente familiarizado com a imagem
geométrica do SR: o espaço de Minkowski, o efeito das transformações de Lorentz nos eixos e
as "imagens" de coisas como dilatação do tempo e contração de Lorentz. Esta imagem
geométrica deve estar no fundo de sua mente à medida que passamos a estudar cálculo vetorial
e tensorial; vamos trazê-lo para a frente novamente quando estudarmos GR.
1.12 P ra l a d o
Há muitas boas introduções à RS, mas uma muito legível que orientou nosso próprio tratamento
e é muito mais detalhada é Taylor e Wheeler (1966). Outro tratamento elementar amplamente
admirado é Mermin (1989). Outro clássico é o francês (1968). Para tratamentos que analisam
mais cuidadosamente os fundamentos da teoria, consulte Arzeliès (1966), Bohm (2008), Dixon
(1978) ou Geroch (1978). Paradoxos são discutidos
Machine Translated by Google
em alguns detalhes por Arzeliès (1966), Marder (1971) e Terletskii (1968). Para uma biografia científica de Einstein,
ver Pais (1982).
Nosso interesse em SR neste texto é principalmente porque é um caso especial simples de GR no qual é
possível desenvolver a matemática que precisaremos mais tarde. Mas a RS é em si a base de todas as outras
teorias fundamentais da física, como o eletromagnetismo e a teoria quântica, e como tal recompensa muito mais
estudo do que lhe daremos.
Veja as discussões clássicas em Synge (1965), Schrödinger (1950) e Møller (1972), e tratamentos mais modernos
em Rindler (1991), Schwarz e Schwarz (2004) e Woodhouse (2003).
' '
1.13 Anexo: O gêmeo paradoxo dissecado
O problema
Diana deixa sua gêmea Artemis para trás na Terra e viaja em seu foguete por 2,2 × 108 s (ÿ 7 anos) de seu tempo
a 24/25 = 0,96 da velocidade da luz. Ela então instantaneamente inverte sua direção (desafiando sem medo
aqueles gs) e retorna à Terra da mesma maneira. Quem é mais velho no reencontro dos gêmeos? Um diagrama
de espaço-tempo pode ser muito útil.
Breve solução
Consulte a Fig. 1.16 na próxima página. Diana viaja pela linha PB. Em seu quadro, o evento A de Artemis é
simultâneo ao evento B, então Artemis está realmente envelhecendo lentamente. Mas, assim que Diana se vira,
ela muda os referenciais inerciais: agora ela considera B simultâneo ao evento C de Artemis! Efetivamente, Diana
vê Artemis envelhecer incrivelmente rápido por um momento. Este jorro mais do que compensa a lentidão que
Diana observou o tempo todo.
Numericamente, Artemis envelhece 50 anos para os 14 de Diana.
Para os leitores que estão insatisfeitos com a afirmação 'Diana vê Artemis envelhecer incrivelmente rápido por um
momento', ou que se perguntam que física está por trás de tal afirmação, discutiremos isso com mais detalhes,
tendo em mente que a afirmação 'Diana vê' realmente significa 'Diana observa', usando as hastes, relógios e banco
de dados que todo bom observador relativista possui.
Diana pode fazer suas medições da seguinte maneira. Decolando da Terra, ela salta para um referencial inercial
chamado O ¯ se afastando da Terra em v = 0,96. Assim que ela se acomoda nesse novo quadro, ela ordena que
todos os relógios sejam sincronizados com o dela, que lê ¯t = 0 ao deixar a Terra. Ela ainda coloca um estudante
de pós-graduação em cada um de seus
Machine Translated by Google
26 Relatividade especial
Reunião
50 anos
tempo
Eixo
do
Figura 1.16 O 'paradoxo' idealizado do gêmeo no diagrama do espaço-tempo do gêmeo que fica em casa.
relógios e ordena a cada um deles que monta um relógio que passa pela Terra para anotar a hora no
relógio da Terra no caso de passagem. Depois de viajar sete anos com seu próprio relógio, ela salta
do referencial inercial O e agarra outro O que está voando em direção à Terra em v = 0,96 (medido no
referencial da Terra, é claro). Quando ela se acomoda nesse quadro, ela novamente distribui seus
alunos de pós-graduação nos relógios e ordena que todos os relógios sejam sincronizados com o dela,
que indica t = 7 anos na troca. (Todos os relógios já estavam sincronizados entre si – ela apenas ajusta
apenas o zero de tempo deles.) Ela ainda ordena que todo estudante de pós-graduação que passar
pela Terra de t = 7 anos até chegar lá registre o tempo de passagem e a leitura de Os relógios da Terra
naquele evento.
Diana finalmente chega em casa depois de envelhecer 14 anos. Sabendo um pouco sobre dilatação
do tempo, ela espera que Artemis tenha envelhecido muito menos, mas, para sua surpresa, Artemis é
uma avó de cabelos brancos, 50 anos mais velha! Diana guarda sua surpresa para si mesma e corre
para a sala de informática para verificar os dados. Ela lê os despachos dos alunos de pós-graduação
que montam os relógios do quadro de saída. Com certeza, Artemis parece ter envelhecido muito
lentamente por seus relatórios. Na época de Diana ¯t = 7 anos, o estudante de pós-graduação que
passava pela Terra registrou que os relógios da Terra marcavam apenas um pouco menos de dois
anos de tempo decorrido. Mas então Diana verifica as informações de seus alunos de pós-graduação
montando os relógios do quadro de entrada. Ela descobre que em seu tempo t = 7 anos, o estudante
de pós-graduação relatou uma leitura dos relógios da Terra em mais de 48 anos de tempo decorrido!
Como um aluno pode ver a Terra em t = 2 anos e outro aluno, ao mesmo tempo, vê-la em t = 48 anos?
Diana sai da sala de informática resmungando sobre os padrões em declínio do ensino de graduação de hoje.
No entanto, sabemos o erro que Diana cometeu. Seus dois mensageiros não passaram pela Terra
ao mesmo tempo. Seus relógios marcaram a mesma quantidade, mas eles encontraram a Terra nos
eventos A e C muito diferentes. Diana deveria ter pedido aos alunos do primeiro quadro para continuar
registrando as informações até que vissem o aluno t = 7 anos do segundo quadro passar pela Terra. o que
Machine Translated by Google
y
Diana atribui t = 7 anos
a ambas as linhas tracejadas!
D
y
C
x
B
ÿ
x
UMA
(uma) (b)
Figura 1.17 A mudança de quadro de Diana é análoga a uma rotação de coordenadas na geometria euclidiana.
importa, afinal, que eles teriam enviado seus despachos datados de ¯t = 171 anos? O tempo é apenas uma
coordenada. Devemos ter certeza de pegar todos os eventos.
O que Diana realmente fez foi usar um sistema de coordenadas ruim. Exigindo informações apenas
antes de ¯t = 7 anos no quadro de saída e somente após t = 7 anos no quadro de entrada, ela deixou todo
o interior do triângulo ABC fora de seus trechos de coordenadas (Fig. 1.17(a)).
Não é de admirar que muita coisa aconteceu que ela não descobriu! Se ela tivesse permitido que os alunos
do primeiro quadro coletassem dados até ¯t = 171 anos, ela poderia ter coberto o interior daquele triângulo.
Podemos inventar uma analogia com as rotações no plano (Fig. 1.17(b)). Considere tentar medir o
comprimento da curva ABCD, mas ser forçado a girar as coordenadas no meio da medição, digamos,
depois de ter medido de A a B no sistema x ÿ y .
Se você girar para x¯ ÿ ¯y, você deve retomar a medição em B novamente, que pode estar na coordenada
y¯ = ÿ5, enquanto originalmente B tinha a coordenada y = 2. Se você medir o comprimento da curva
começando em qualquer ponto que tivesse y¯ = 2 (mesmo y¯ que o valor de y em que você terminou no
outro quadro), você começaria em C e obteria um comprimento muito curto para a curva.
Agora, ninguém cometeria esse erro nas medições em um avião. Mas muitas pessoas o fariam se
fossem confrontadas pelo paradoxo dos gêmeos. Isso vem de nossa recusa em ver o tempo simplesmente
como uma coordenada. Estamos acostumados a pensar em um tempo universal, o mesmo em todos os
lugares para todos, independentemente de seu movimento. Mas não é o mesmo para todos, e devemos
tratá-lo como uma coordenada e garantir que nossas coordenadas cubram todo o espaço-tempo.
Coordenadas que não cobrem todo o espaço-tempo causaram muitos problemas em GR.
Quando estudarmos o colapso gravitacional e os buracos negros veremos que as coordenadas usuais
para o espaço-tempo fora do buraco negro não chegam ao interior do buraco negro. Por esta razão, uma
partícula caindo em um buraco negro leva um tempo de coordenadas infinitas para percorrer uma distância
finita. Isso é puramente culpa das coordenadas: a partícula cai em um tempo próprio finito, em uma região
não coberta pelas coordenadas 'externas'. Um sistema de coordenadas que cobre tanto o interior como o
exterior satisfatoriamente não foi descoberto até meados da década de 1950.
Machine Translated by Google
28 Relatividade especial
1.14 Exercícios
1 = 3 × 108 m sÿ1,
1 = (3 × 108) ÿ1 mÿ1 s,
-2 -2
10 J = 10 kg m2 = s = 10kgm2 s × (1)2
-2
10 kg m2 = 1,1 s × (3 × 108) ÿ2 s2 m-2
× 10ÿ16 kg.
Você pode multiplicar ou dividir por tantos fatores de c quantos forem necessários para cancelar os
segundos.
(c) Os eixos ¯t e x¯ de um observador O¯ que se move com velocidade v = 0,5 na direção x positiva em relação
a O e cuja origem (x¯ = ¯t = 0) coincide com a de O.
(d) O lugar geométrico dos eventos cujo intervalo s2 da origem é ÿ1 m2. (e) O lugar
geométrico dos eventos cujo intervalo s2 da origem é +1 m2. (f) A calibração marca
intervalos de um metro ao longo dos eixos x¯ e ¯t . (g) O lugar geométrico dos eventos cujo
intervalo s2 da origem é 0. (h) O lugar geométrico dos eventos, todos os quais ocorrem no
instante t = 2 m (simultâneos como visto
por O).
Machine Translated by Google
29 1.14 Exercícios
(i) O local dos eventos, todos os quais ocorrem no tempo ¯t = 2 m (simultâneos como visto
por O¯).
(j) O evento que ocorre em ¯t = 0 e x¯ = 0,5 m. (k) O lugar
geométrico dos eventos x¯ = 1 m. (l) A linha de mundo de
um fóton que é emitido a partir do evento t = ÿ1 m, x = 0, viaja na direção negativa de x , é
refletida quando encontra um espelho localizado em x¯ = ÿ1 m, e é absorvido quando encontra
um detector localizado em x = 0,75 m.
4 Escreva todos os termos das seguintes somas, substituindo os nomes das coordenadas (t, x, y, z)
por (x0, x1, x2, x3): (a)
3ÿ=0 Vÿ xÿ, onde {Vÿ, ÿ = 0, ... , 3} é uma coleção de quatro números arbitrários.
3
(b) i=1( xi ) 2.
5 (a) Use o diagrama de espaço-tempo de um observador O para descrever o seguinte experimento
realizado por O. Duas rajadas de partículas de velocidade v = 0,5 são emitidas de x = 0 em t
= ÿ2 m, uma viajando na direção x positiva e o outro no sentido negativo de x . Esses
detectores de encontro localizados em x = ±2 m. Após um atraso de 0,5 m de tempo, os
detectores enviam sinais de volta para x = 0 na velocidade v = 0,75. (b) Os sinais chegam de
volta em x = 0 no mesmo evento. (Certifique-se de que seu diagrama de espaço-tempo mostre
isso!) A partir disso, o pesquisador conclui que os detectores de partículas de fato enviaram
seus sinais simultaneamente, pois ele sabe que estão a distâncias iguais de x = 0. Explique
por que essa conclusão é válida. (c) Um segundo observador O¯ move-se com velocidade v =
0,75 na direção x negativa em relação a O. Desenhe o diagrama espaço-tempo de O¯ e nele
represente o experimento realizado por O. O¯ conclui que os detectores de partículas enviaram
seus sinais simultaneamente? Se não, qual sinal foi enviado primeiro? (d) Calcule o intervalo
s2 entre os eventos nos quais os detectores emitiram seus
¯t = ÿt + ÿx,
x¯ = ÿt + vx ,
y¯ = ay,
z¯ = bz,
onde ÿ, ÿ,ÿ, ÿ, a e b podem ser funções da velocidade v de O¯ em relação a O, mas não dependem
das coordenadas. Encontre os números {Mÿÿ, ÿ, b = 0, ... , 3} da Eq. (1.2) em termos de ÿ, ÿ,ÿ, ÿ,
a e b.
8 (a) Deduza a Eq. (1.3) da Eq. (1.2), para geral {Mÿÿ, ÿ, ÿ = 0, ... , 3}.
(b) Como s¯2 = 0 na Eq. (1.3) para qualquer { xi }, substitua xi por ÿ xi na Eq. (1.3) e subtraia a
equação resultante da Eq. (1.3) para estabelecer que M0i = 0 para i = 1, 2, 3.
Machine Translated by Google
30 Relatividade especial
2
(c) Use a Eq. (1.3) com s¯ = 0 para estabelecer a Eq. (1.4b). (Dica: x, y e z são
arbitrário.)
9 Explique por que a linha PQ na Fig. 1.7 é desenhada da maneira descrita no texto.
10 Para os pares de eventos cujas coordenadas (t, x, y,z) em algum quadro são dadas abaixo,
classifique suas separações como temporal, espacial ou nula. (a) (0, 0, 0, 0) e (ÿ1,1, 0, 0), (b) (1,
1, ÿ1, 0) e (ÿ1, 1, 0, 2), ( c) (6, 0, 1, 0) e (5, 0, 1, 0), (d) (ÿ1, 1, ÿ1, 1) e (4, 1, ÿ1, 6). + x2 = a2 e ÿt
linhas t = ±x, independentemente de aeb . 12 (a) Use o fato de que a tangente à hipérbole DB na
Fig. 1.14 é a linha de simultaneidade para O¯ para mostrar que o intervalo de tempo AE é menor
que o tempo registrado no relógio de O¯ quando ele se move de A a B. (b) Calcule que
2 2
11 Mostre que a hipérbole ÿt + x2 = ÿb2 são assintóticos ao
(c) Use (b) para mostrar que O¯ considera que os relógios de O estão funcionando lentamente, exatamente na 'direita'
avaliar.
13 A meia-vida da partícula elementar chamada méson pi (ou píon) é de 2,5 × 10ÿ8 s quando o píon
está em repouso em relação ao observador medindo seu tempo de decaimento. Mostre, pelo
princípio da relatividade, que os píons que se movem com velocidade v = 0,999 devem ter uma
meia-vida de 5,6 × 10ÿ7 s, medida por um observador em repouso.
14 Suponha que a velocidade v de O¯ relativa a O seja pequena, |v| 1. Mostre que o tempo
dilatação, contração de Lorentz e fórmulas de adição de velocidade podem ser aproximadas por,
respectivamente: (a) t ÿ (1 +
1 v2) ¯t,
(b) x ÿ x¯/
t ÿ ¯t/
ÿ(2ÿ),
ÿ(2ÿ),
(c)(a)
wÿ
1 ÿ ÿ(1 ÿ w)/(1 + w).
31 1.14 Exercícios
a uma velocidade de 0,8 c. Seu amigo permanece em repouso, de pé junto à porta do celeiro. Tente
todas as partes desta pergunta, mesmo que você não consiga responder algumas. (a) Qual é o
comprimento que o amigo mede a estaca quando ela se aproxima do celeiro? (b) A porta do celeiro
está inicialmente aberta e, imediatamente após o corredor e a vara estarem inteiramente dentro do
celeiro, o amigo fecha a porta. Quanto tempo depois que a porta é fechada a frente do poste
atinge a outra extremidade do celeiro, medido pelo amigo?
Calcule o intervalo entre os eventos de fechar a porta e bater na parede.
É semelhante ao espaço, ao tempo
ou nulo? (c) No referencial do corredor, qual é o comprimento do celeiro e da vara? (d) O
corredor acredita que a vara está totalmente dentro do celeiro quando sua frente atinge
o fim do celeiro? Você pode explicar por quê?
(e) Após a colisão, o poste e o corredor param em relação ao celeiro. Do ponto de vista do amigo,
o poste de 20 m está agora dentro de um celeiro de 15 m, pois a porta do celeiro foi fechada
antes do poste parar. Como isso é possível? Alternativamente, do ponto de vista do corredor,
a colisão deveria ter parado o poste antes que a porta se fechasse, de modo que a porta não
pudesse ser fechada. A porta estava ou não fechada com o poste dentro?
(f) Desenhe um diagrama de espaço-tempo do ponto de vista do amigo e use-o para ilustrar
e justifique todas as suas conclusões.
18 (a) A lei de adição de velocidade de Einstein, Eq. (1.13), tem uma forma mais simples se
introduzirmos o conceito do parâmetro de velocidade u, definido pela equação
v = tanh u.
Observe que para ÿÿ< u <ÿ, a velocidade está confinada aos limites aceitáveis ÿ1 <v< 1.
Mostre que se
v = tanh u
w = tanh U,
w = tanh(u + U).
(b) Use isso para resolver o seguinte problema. Uma estrela mede que uma segunda estrela está
se afastando com velocidade v = 0,9 c. A segunda estrela mede um terço para estar
recuando na mesma direção em 0,9 c. Da mesma forma, o terceiro mede um quarto, e assim
por diante, até um grande número N de estrelas. Qual é a velocidade da enésima estrela em
relação à primeira? Dê uma resposta exata e uma aproximação útil para N grande.
19 (a) Usando o parâmetro de velocidade introduzido no Exer. 18, mostram que as equações de
transformação de Lorentz, Eq. (1.12), pode ser colocado na forma
¯t = t cosh u ÿ x sinh u, y¯ = y,
x¯ = ÿt sinh u + x cosh u, z¯ = z.
Machine Translated by Google
32 Relatividade especial
x¯ = x cos ÿ + y sen ÿ,
y¯ = ÿx sen ÿ + y cos ÿ.
2.1 D e fi ni ti onofavetor
(2.1)
x ÿO ( t, x, y, z).
Nesta linha, introduzimos várias novas notações: uma seta sobre um símbolo denota um vetor
(de modo que x é um vetor que não tem nada a ver com a coordenada x), a seta após x significa
'tem componentes' e o O abaixo significa 'no quadro O'; os componentes estarão sempre na
ordem t, x, y, z (equivalentemente, índices na ordem 0, 1, 2, 3). A notação ÿO é usada para
enfatizar a distinção entre o vetor e seus componentes. O vetor x é uma seta entre dois eventos,
enquanto a coleção de componentes é um conjunto de quatro números dependentes de
coordenadas. Devemos sempre enfatizar a noção de vetor (e, posteriormente, qualquer tensor)
como um objeto geométrico: algo que pode ser definido e (às vezes) visualizado sem se referir
a um sistema de coordenadas específico.
Outra notação importante é
(2.2)
x ÿO { xÿ},
onde por { xÿ} queremos dizer todos os x0, x1, x2, x3. Se pedirmos as componentes deste vetor em outro sistema de coordenadas, digamos
xÿ { xÿ¯ }.
O¯
Ou seja, colocamos uma barra sobre o índice para denotar as novas coordenadas. O vetor x é
o mesmo, e nenhuma nova notação é necessária para ele quando o quadro é alterado. Apenas o
Machine Translated by Google
seus componentes mudam.1 Quais são os novos componentes xÿ¯ ? Nós os recebemos do
Transformação de Lorentz:
x0 vx1 _
x0¯ = ÿ
, etc.
ÿ(1 ÿ v2) ÿ(1 ÿ v2)
ÿ=0
0¯
Onde { ÿ} são quatro números, um para cada valor de ÿ. Nesse caso
0¯ 0¯
0 = 1/ ÿ(1 ÿ v2), 1 = ÿv/ÿ(1 ÿ v2),
0¯ 0¯
2= 3 = 0.
ÿ¯
Agora { ÿ} é uma coleção de 16 números, que constitui a transformação de Lorentz
matriz. A razão pela qual escrevemos um índice para cima e o outro para baixo ficará claro
quando estudamos geometria diferencial. Por agora, permite-nos apresentar a última parte da
notação, a convenção de soma de Einstein: sempre que uma expressão contém um índice
como um sobrescrito e o mesmo índice como um subscrito, uma soma está implícita em todos os valores
esse índice pode levar. Aquilo é,
AÿBÿ e Tÿ Eÿÿ
AÿBÿ e Tÿ Eÿÿ ,
ÿ=0 ÿ=0
enquanto
não representam somas em nenhum índice. A transformação de Lorentz, Eq. (2.3), agora pode ser
abreviado para
ÿ¯
xÿ¯ = ÿ xÿ, (2.4)
1
Isso é o que alguns livros de álgebra linear chamam de transformação 'passiva': as coordenadas mudam, mas o vetor
não.
Machine Translated by Google
Uma vez que o índice repetido (ÿ em um caso, ÿ no outro) denota apenas uma soma de
0 a 3, não importa qual letra é usada. Esse índice somado é chamado de índice fictício,
e renomear um índice fictício (como fizemos, substituindo ÿ por ÿ ) geralmente é uma ferramenta útil
em álgebra tensorial. Há apenas uma coisa que não devemos substituir o índice fictício ÿ por:
um índice latino. A razão é que os índices latinos podem (por nossa convenção) apenas tomar os valores
1, 2, 3, enquanto ÿ deve ser igual a zero também. Assim, as expressões
ÿ¯ ÿ¯
ÿ xÿ e eu
XI
ÿ¯ ÿ¯ ÿ¯
ÿ xÿ = 0 x0 + eu
xi . (2.5)
Eq. (2.4) são realmente quatro equações diferentes, uma para cada valor que ÿ¯ pode assumir. Um
índice como ÿ¯, no qual nenhuma soma é realizada, é chamado de índice livre. Sempre que uma equação
é escrito com um ou mais índices livres, é válido se e somente se for verdadeiro para todos
valores possíveis que os índices livres podem assumir. Tal como acontece com um índice fictício, o nome dado a um
índice livre é amplamente arbitrário. Assim, a Eq. (2.4) pode ser reescrito como
ÿ¯
xÿ¯ = ÿ xÿ.
Isso é equivalente à Eq. (2.4) porque ÿ¯ pode assumir os mesmos quatro valores que ÿ¯ poderia
presumir. Se um índice livre for renomeado, ele deverá ser renomeado em todos os lugares. Por exemplo, o
após a modificação da Eq. (2.4),
ÿ¯
xÿ¯ = ÿ xÿ,
não faz sentido e nunca deve ser escrito. A diferença entre essas duas últimas expressões é que a primeira
garante que, qualquer que seja o valor que ÿ¯ assuma, tanto xÿ¯ à esquerda quanto
ÿ¯
ÿ à direita terá o mesmo índice livre. A segunda expressão não liga o
índices desta forma, então não é equivalente à Eq. (2.4).
2
O quadro vetorial geral , é definido por uma coleção de números (seus componentes em alguns
digamos O)
UMA
(2.6)
ÿO (A0, A1, A2, A3) = {Aÿ},
2
Tal vetor, com quatro componentes, às vezes é chamado de quatro vetores para distingui-lo dos três vetores componentes com
os quais estamos acostumados na física elementar, que chamaremos de três vetores. A menos que digamos
,
caso contrário, um 'vetor' é sempre um vetor de quatro. Denotamos quatro vetores por setas, por exemplo, A e três vetores por
negrito, por exemplo, A.
Machine Translated by Google
Ou seja, seus componentes se transformam da mesma forma que as coordenadas. Lembre-se que um vetor
pode ser definido fornecendo quatro números (por exemplo, (108, ÿ10ÿ16, 5,8368, ÿ)) em algum quadro; então
seus componentes em todos os outros quadros são determinados exclusivamente. Os vetores no espaço-tempo obedecem a
regras usuais: se A e B são vetores e ÿ é um número, então A + B e ÿA também são vetores,
com componentes
A+B ÿ
ÿO (A0 + B0, A1 + B1, A2 + B2, A3 + B3),
(2.8)
ÿ
ÿA ÿO (ÿA0,ÿA1,ÿA2,ÿA3). ÿ
Assim, os vetores se somam pela regra usual do paralelogramo. Observe que podemos fornecer quatro
números quaisquer para formar um vetor, exceto que, se os números não forem adimensionais, todos devem ter
as mesmas dimensões, pois sob uma transformação elas serão somadas.
Vetores de base
Em qualquer referencial O existem quatro vetores especiais, definidos por seus componentes:
ÿ
e0 ÿO (1, 0, 0, 0),
e1 ÿO (0, 1, 0, 0),
(2.9)
ÿÿÿÿÿÿ
e2 ÿO (0, 0, 1, 0),
Essas definições definem os vetores de base do referencial O. Da mesma forma, O¯ tem vetores de base
Geralmente, e0¯ = e0, pois são definidos em quadros diferentes. O leitor deve verificar que
a definição dos vetores de base é equivalente a
UMA
A = A0 e0 + A1 e1 + A2 e2 + A3
e3,
A = Aÿ eÿ. (2.11)
Machine Translated by Google
Na última linha, usamos a convenção de soma (lembre-se sempre de escrever o índice em e como um
subscrito para empregar a convenção dessa maneira). O significado da Eq. (2.11) é que A é a soma linear
de quatro vetores A0 e0, A1 e1, etc.
A discussão que leva à Eq. (2.11) poderia ter sido aplicado a qualquer frame, então é igualmente verdadeiro
em O¯:
A = Aÿ¯ eÿ¯ .
Isso diz que A também é a soma dos quatro vetores A0¯ A1¯ e1¯, etc. Estes não são os mesmos quatro
e0¯,
vetores da Eq. (2.11), uma vez que são paralelos aos vetores base de O¯ e não de O, mas somam o
. meramente
mesmo vetor A É importante entender que as expressões Aÿpela
eÿ ereclassificação
Aÿ¯ eÿ¯ não sãodeobtidas
índicesuma
fictícios.
da outra
Índices barrados e não barrados não podem ser trocados, pois possuem significados diferentes.
Assim, {Aÿ¯} é um conjunto diferente de números de {Aÿ}, assim como o conjunto de vetores { eÿ¯} é
diferente de { eÿ}. Mas, por definição, as duas somas são as mesmas:
e isso tem uma consequência importante: dela deduzimos a lei de transformação para os vetores de base,
,
ou seja, a relação entre { eÿ} e { eÿ¯}. Usando a Eq. (2.7) para Aÿ¯ escrevemos a Eq. (2.12) como
À esquerda temos duas somas. Como são somas finitas, sua ordem não importa. Já que os números
ÿ¯
ÿ e Aÿ são apenas números, sua ordem não importa, e podemos escrever
Aÿ ÿ¯ ÿ eÿ¯ = Aÿ eÿ.
Agora usamos o fato de que ÿ e ÿ¯ são índices fictícios: mudamos ÿ para ÿ e ÿ¯ para ÿ¯,
Aÿ ÿ¯ ÿ
eÿ¯ = Aÿ eÿ.
Esta equação deve ser verdadeira para todos os conjuntos {Aÿ}, pois A é um vetor arbitrário. Escrevendo-o como
nós deduzimos
ou
eÿ = ÿ¯ ÿ eÿ¯. (2.13)
Machine Translated by Google
Isso fornece a lei pela qual os vetores de base mudam. Não é uma transformação de componentes: ela
fornece a base { eÿ} de O como uma soma linear sobre a base { eÿ¯} de O¯. Comparando isso com a lei
para componentes, a Eq. (2.7),
Aÿ¯ = ÿ¯ÿAÿ ,
A discussão acima introduziu muitas técnicas novas, então estude-a cuidadosamente. Observe que
a omissão dos sinais de soma mantém as coisas organizadas. Observe também que um passo de
importância fundamental foi reetiquetar os índices fictícios: isso nos permitiu isolar o Aÿ arbitrário do
resto das coisas na equação.
Um exemplo
Deixe O¯ mover-se com velocidade v na direção x em relação a O. Então a matriz [ ÿ¯ ÿ] é
ÿ ÿvÿ 0 0 ÿvÿ ÿ 0 0 0
ÿ ÿ
10
( ÿ¯ÿ ) =
ÿ ÿ
,
ÿ
0 ÿ
ÿ 0 0 01 ÿ
ÿ := 1/ ÿ(1 ÿ v2).
Então, se A
ÿO (5, 0, 0, 2), encontramos seus componentes em O¯ por
0¯ 0¯
A0¯ = 0A0 + 1A1 +···
= ÿ · 5 + (ÿvÿ ) · 0 + 0 · 0 + 0 · 2 = 5ÿ .
De forma similar,
A1¯ = ÿ5vÿ,
A2¯ = 0, A3¯ =
2.
eÿ = ÿ¯ ÿ eÿ¯
ou
= ÿ e0¯ ÿ vÿ e1¯.
Machine Translated by Google
De forma similar,
Isso dá a base de O em termos de O¯'s, então vamos desenhar a figura (Fig. 2.1) no quadro de O¯: Este
é claro que a transformação é exatamente o que é necessário para manter os vetores de base apontando ao longo
os eixos de seus respectivos quadros. Compare isso com a Fig. 1.5(b).
Transformações inversas
ÿ¯
ÿ
= ÿ¯
ÿ(v).
Então
ÿ¯
eÿ = ÿ(v) eÿ¯. (2.14)
ÿ
eÿ¯ = ÿ¯ (ÿv) eÿ . (2.15)
Nesta equação eu usei ÿ¯ e ÿ como índices para evitar confusão com o anterior
ÿ
Fórmula. As barras ainda se referem, é claro, ao quadro O¯. A matriz [ ÿ¯ ] é exatamente a
matriz [ os ÿ¯ ÿ] exceto com v alterado para ÿv. As barras nos índices servem apenas para indicar
nomes dos observadores envolvidos: eles afetam as entradas na matriz [ ] apenas naquela
a matriz é sempre construída usando a velocidade do quadro de índice superior em relação ao
t t
quadro de índice inferior. Isso fica explícito nas Eqs. (2.14) e (2.15). Como v é a velocidade de O¯ (o
quadro de índice superior na Eq. (2.14)) em relação a O, então ÿv é a velocidade de O (o quadro de índice
superior na Eq. (2.15)) em relação a O¯ . Exer. 11, § 2.9, irá ajudá-lo a compreender este ponto.
eÿ¯ = ÿ¯(ÿv) eÿ .
Aqui acabamos de mudar ÿ¯ para ÿ¯. Isso não muda nada: ainda são as mesmas quatro equações, uma
para cada valor de ÿ¯. Nesta forma podemos colocá-lo na expressão para eÿ, Eq. (2.14):
ÿ
eÿ = ÿ¯ ÿ(v) eÿ¯ = ÿ¯ÿ (v) ÿ¯(ÿv) eÿ . (2.16)
Nesta equação apenas a base de O aparece. Deve, portanto, ser uma identidade para todo v. À direita há
duas somas, uma em ÿ¯ e outra em ÿ. Se imaginarmos realizar a soma ÿ¯ primeiro, então a direita é uma
soma sobre a base { eÿ } na qual cada vetor de base eÿ tem coeficiente
ÿ
ÿ¯ÿ (v) ÿ¯(ÿv). (2.17)
ÿ¯
Imagine avaliar a Eq. (2.16) para algum valor fixo do índice ÿ. Se o lado direito da Eq. (2.16) é igual à
esquerda, o coeficiente de eÿ à direita deve ser 1 e todos os outros coeficientes devem ser anulados. A
maneira matemática de dizer isso é
ÿ
ÿ¯ÿ (v) ÿ¯(ÿv) = ÿÿ ÿ,
eÿ = ÿÿ ÿ eÿ ,
ÿ
expressa o fato de que a matriz [ ÿ¯(ÿv)] é a inversarealizamos
de [ soma quando exatamente aÿ¯duas
em ÿ¯ é multiplicamos ÿ(v)],matrizes.
operaçãopoisque
o Isto
A
matriz (ÿÿ ÿ) é, obviamente, a matriz identidade.
ÿ ÿ¯(ÿv)Aÿ¯ = ÿ¯(ÿv) = ÿÿ
ÿAÿ
= Aÿ .
Machine Translated by Google
Isso diz que as componentes de A em O são obtidas daquelas em O¯ pela transformação com ÿv, que é,
obviamente, correta.
As operações que realizamos devem ser familiares para você no conceito de álgebra vetorial no
espaço euclidiano. O novo elemento que introduzimos aqui é a notação de índice, que será uma
ferramenta permanente e poderosa no restante do livro. Certifique-se de que compreende o significado
geométrico de todos os nossos resultados, bem como a sua justificação algébrica.
t e0 = U
geralmente não será importante.) A quatro velocidades de uma partícula acelerada é definida como a
e0 vetor base de seu MCRF naquele evento. Este vetor é tangente à linha do mundo (curva)
da partícula. Na Fig. 2.2 a partícula no evento A tem MCRF O¯, cujos vetores básicos são
são mostrados. O vetor e0¯ é idêntico a U lá.
p = mU , (2.19)
onde m é a massa de repouso da partícula, que é sua massa medida em seu referencial de repouso. Dentro
algum quadro O tem componentes convencionalmente denotados por
(2.20)
p ÿO (E, p1, p2, p3).
Um exemplo
Uma partícula de massa de repouso m move-se com velocidade v na direção x do referencial O.
as componentes de quatro velocidades e quatro momentos? Seu quadro de repouso O¯ tem base de tempo
vetor e0¯, então, por definição de p e U , temos
U = e0¯, p = mU ,
ÿ ÿ ÿ
Uÿ = = 0¯, pÿ = m 0¯. (2.21)
ÿ¯ ÿ¯( e0¯)
Portanto temos
U3 = 0, p3 = 0.
Para v pequeno, as componentes espaciais de U são (v, 0, 0), o que justifica chamá-la de quatro
velocidades, enquanto as componentes espaciais de p são (mv, 0, 0), justificando seu nome. Para v pequeno,
a energia é
As interações de partículas na física galileana são governadas pelas leis de conservação de energia e
de momento. Uma vez que os componentes de p reduzem no limite não relativístico à energia e momento
galileanos familiares, é natural postular que a lei relativística correta é que o quatro vetor p é conservado.
Ou seja, se várias partículas interagem, então
p := p (i), (2.22)
todas as
partículas (i)
onde p (i) é o momento da iésima partícula, é o mesmo antes e depois de cada interação.
Esta lei tem o status de postulado extra, pois é apenas um dos muitos onde o limite não relativista
está correto. No entanto, como os dois postulados fundamentais da RS, este é amplamente verificado
pela experiência. Não menos importante de suas novas previsões é que a lei de conservação de energia
deve incluir a massa de repouso: a massa de repouso pode ser diminuída e a diferença
transformada em energia cinética e, portanto, em calor. Isso acontece todos os dias em usinas nucleares.
t
t
Figura 2.3 Quando várias colisões estão envolvidas, os vetores individuais de quatro momentos que contribuem para a
o total de quatro momentos em qualquer momento particular pode depender do quadro, mas o
total de quatro momentos é o mesmo quatro vetores em todos os quadros; seus componentes se
transformam de quadro em quadro pela transformação de Lorentz.
Machine Translated by Google
(2.23)
p (i) ÿÿCM (ETOTAL, 0, 0, 0).
eu
Assim como nos MCRFs, qualquer outro quadro em repouso em relação a um quadro CM também é um quadro CM.
Magnitude de um vetor
2
UMA
= ÿ(A0) 2 + (A1) 2 + (A2) 2 + (A3) 2 (2,24)
para ser a magnitude do vetor A uma . Porque definimos os componentes para transformar sob
2 2 2
ÿ (A0) 2 + (A1) 2 + (A2) 2 + (A3) 2 = ÿ(A0¯ ) + (A1¯ ) + (A2¯ ) + (A3¯ ) 2. (2,25)
A magnitude assim definida é um número independente do quadro, ou seja, um escalar sob Lorentz
transformações.
Essa magnitude não precisa ser positiva, é claro. Assim como nos intervalos, adotamos o
2
seguintes nomes: se A é positivo, A é um vetor espacial ; se zero, um vetor nulo ; e se
negativo, um vetor timelike . Assim, vetores que apontam espacialmente têm magnitude positiva, como é
usual no espaço euclidiano. É particularmente importante entender que um vetor nulo não é um
2
vetor zero. Ou seja, um vetor nulo tem A = 0, mas nem todos os Aÿ desaparecem; um vetor zero é definido
2
como um, onde todos os componentes desaparecem. Somente em um espaço onde A 2 é positivo-definido
faz A
= 0 requerem Aÿ = 0 para todos os ÿ.
Machine Translated by Google
em algum referencial O. Agora provamos que este é o mesmo número em todos os outros referenciais. Nós notamos
primeiro que A · A é apenas A 2, que sabemos ser invariante. Portanto (A + B ) · (A + B ), que
é a magnitude de A + B , também é invariável. Mas a partir das Eqs. (2.24) e (2.26) segue que
22
(A + B ) · (A + B ) = A +B + 2A · B .
Como o lado esquerdo é o mesmo em todos os quadros, assim como os dois primeiros termos à direita, então
o último termo à direita também deve ser. Isso prova a invariância do quadro do escalar
produtos.
Dois vetores A e B são ditos ortogonais se A · B = 0. O sinal de menos na definição do produto escalar
significa que dois vetores ortogonais um ao outro não são
necessariamente em ângulos retos no diagrama de espaço-tempo (veja exemplos abaixo). Um extremo
exemplo é o vetor nulo, que é ortogonal a si mesmo! Tal fenômeno não é
encontrado em espaços onde o produto escalar é positivo-definido.
Exemplo
Os vetores base de um referencial O satisfazem:
e0 · e0 = ÿ1,
e1 · e1 = e2 · e2 = e3 · e3 = +1,
eÿ · eÿ = 0 se ÿ = ÿ.
Eles formam, assim, uma tétrade de vetores mutuamente ortogonais: uma tétrade ortonormal ,
o que significa ortogonal e normalizado para a unidade de magnitude. (Um vetor timelike tem 'unidade
magnitude' se sua magnitude for -1.) As relações acima podem ser resumidas como
eÿ · eÿ = ÿÿÿ, (2,27)
onde ÿÿÿ é semelhante a um delta de Kronecker, pois é zero quando ÿ = ÿ, mas difere em
que ÿ00 = ÿ1, enquanto ÿ11 = ÿ22 = ÿ33 = +1. Veremos mais adiante que ÿÿÿ é de fato de
importância: é o tensor métrico. Mas, por enquanto, tratamos isso como um delta de Kronecker generalizado.
Exemplo
Os vetores base de O¯ também satisfazem
Figura 2.4 Os vetores base de O¯ não são 'perpendiculares' (no sentido euclidiano) quando desenhados
em O, mas são ortogonais em relação ao produto escalar do espaço-tempo de Minkowski.
de modo que, em particular, e0¯ · e1¯ = 0. Veja isso no diagrama de espaço-tempo de O, Fig. 2.4:
Os dois vetores certamente não são perpendiculares na figura. No entanto, seu produto escalar é
zero. A regra é que dois vetores são ortogonais se eles fazem ângulos iguais com a linha de 45ÿ que
representa o caminho de um raio de luz. Assim, um vetor tangente ao raio de luz é ortogonal a si
mesmo. Esta é apenas outra maneira pela qual a RS não pode ser 'visualizada' em termos de noções
que desenvolvemos no espaço euclidiano.
Exemplo
O U de quatro velocidades de uma partícula é apenas o vetor de base de tempo de seu MCRF,
então da Eq. (2.27) temos
U · U = ÿ1. (2,28)
Suponha que uma partícula faça um deslocamento infinitesimal d x, cujos componentes em O são +
2 (dt, dx, dy, dz). A magnitude desse deslocamento é, pela Eq. (2.24), apenas ÿdt dy2 + dx2 +
dz2. Comparando isso com a Eq. (1.1), vemos que este é apenas o intervalo, ds2:
2 ds = dx · dx. (2,29)
Como a linha do mundo é temporal, isso é negativo. Isso nos levou (Eq. (1.9)) a definir o tempo
próprio dÿ por
47 2.6 Aplicativos
Agora considere o vetor d x/dÿ , onde dÿ é a raiz quadrada da Eq. (2.30) (Fig. 2.5). este
vetor é tangente à linha do mundo, pois é um múltiplo de d x. Sua magnitude é
dx _ dx _ dx · dx _
· = = -1.
dÿ dÿ (dÿ )2
(dt, 0, 0, 0).
d x ÿÿMCRF
dÿ = dt
de modo a
dx _
dÿ ÿÿMCRF (1, 0, 0, 0)
ou
dx _
= ( e0)MCRF.
dÿ
U = dx/dÿ. (2.31)
que é uma espécie de quatro-aceleração. Primeiro diferenciamos a Eq. (2.28) e use a Eq. (2.26):
d dU
(U · U ) = 2U · .
dÿ dÿ
dU
U· = 0.
dÿ
ÿ
dx
Como, no MCRF, U tem apenas um componente zero, essa ortogonalidade significa que
dU
dÿ ÿÿMCRF (0, a1, a2, a3).
dU
a= , U · a = 0. (2,32)
dÿ
Energia e impulso
Mas
Portanto,
3
E2 = m2 + (pi ) 2. (2,34)
i=1
p · U obs = p · e0¯,
onde e0¯ é o vetor base do referencial do observador. Nesse quadro, o quatro momentos tem
componentes
¯
ÿ p · U obs = E. (2,35)
Esta é uma equação importante. Ela diz que a energia da partícula em relação ao observador, E¯, pode
ser calculada por qualquer pessoa em qualquer referencial tomando o produto escalar p · U obs. Isso é
chamado de expressão 'invariante de quadro' para a energia relativa ao observador. É quase sempre
útil em cálculos usar tais expressões.
Machine Translated by Google
2,7 Pótons
dx · dx = 0. (2,36)
Portanto dÿ é zero e a Eq. (2.31) mostra que a quatro velocidades não pode ser definida. Outra maneira
de dizer a mesma coisa é notar que não há nenhum quadro em que a luz esteja em repouso (o
segundo postulado de SR), então não há MCRF para um fóton. Assim, nenhum e0 em qualquer quadro
será tangente à linha do mundo de um fóton.
Observe com atenção que ainda é possível encontrar vetores tangentes ao caminho de um fóton
(que, sendo uma linha reta, tem a mesma tangente em todos os lugares): d x é um. O problema é
encontrar uma tangente de magnitude unitária, já que todas elas têm magnitude nula.
Quatro momentos
O quadrimomento de uma partícula não é um vetor unitário. Em vez disso, é um vetor em que os
componentes em algum quadro fornecem energia e momento da partícula em relação a esse quadro.
Se um fóton carrega energia E em algum quadro, então nesse quadro p0 = E. Se ele se move na
direção x , então py = pz = 0, e para que o quatro momento seja paralelo à sua linha de mundo
(portanto, ser nulo) devemos ter px = E. Isso garante que
p · p = ÿE2 + E2 = 0. (2,37)
Assim concluímos que os fótons têm momento espacial igual à sua energia.
Sabemos pela mecânica quântica que um fóton tem energia
E = hÿ, (2,38)
m2 = ÿ p · p = 0. (2,40)
Qualquer partícula cujo momento de quatro é nulo deve ter massa de repouso zero e vice-versa. A única
partícula de massa de repouso zero conhecida é o fóton. Os neutrinos são muito leves, mas não sem massa.
(Às vezes o 'gráviton' é adicionado a esta lista, já que as ondas gravitacionais também viajam na
velocidade da luz, como veremos mais adiante. Mas 'fóton' e 'gráviton' são conceitos que vêm da
mecânica quântica, e ainda há nenhuma teoria da gravidade quantizada satisfatória, de modo que
'gráviton' não é realmente uma noção bem definida ainda.) A ideia de que apenas partículas com massa
de repouso zero podem viajar na velocidade da luz é reforçada pelo fato de que nenhuma partícula de
repouso finito a massa pode ser acelerada até a velocidade da luz, pois então sua energia seria infinita.
Dito de outra forma, uma partícula viajando à velocidade da luz (na, digamos, direção x ) tem p1/p0 = 1,
enquanto uma partícula de massa de repouso m movendo-se na direção x tem, da equação p · p = ÿ m2, p1/
p0 = [1 ÿ m2/(p0) 2] 1/2, que é sempre menor que um, não importa quanta energia seja dada à partícula.
Embora pareça se aproximar da velocidade da luz, há uma distinção importante: a partícula com m = 0
sempre tem um MCRF, um referencial de Lorentz no qual está em repouso, cuja velocidade v é p1/p0 relativa
ao quadro antigo. Um fóton não tem quadro de repouso.
2.8 P ara
Nós apenas arranhamos a superfície da cinemática relativística e da dinâmica de partículas. Estes são
particularmente importantes na física de partículas, que por sua vez fornece os testes mais rigorosos de SR.
Ver Hagedorn (1963) ou Wiedemann (2007).
2.9 Exercícios
(a) AÿBÿ; (b) AÿCÿÿ para todos os ÿ; (c) Aÿ Cÿ ÿ para todo ÿ; (d) AÿCÿÿ para todos os ÿ; (e) AÿBÿ para
todos os ÿ, ÿ; (f) Ai Bi; (g) Aj Bk para todo j, k.
2 Identifique os índices livres e fictícios nas equações a seguir e transforme-os em expressões equivalentes
com índices diferentes. Quantas equações diferentes cada expressão representa? (a) AÿBÿ = 5; (b) Aÿ¯
= 3 Prove a Eq. (2.5).
ÿ¯ ÿAÿ ; (c ) TÿÿÿAÿCÿÿ = Dÿÿ ; (d) Rÿÿ ÿ 12gÿÿR = Gÿÿ .
51 2.9 Exercícios
(b) Use (a) para provar que se dois vetores têm componentes iguais em um referencial, eles têm
componentes iguais em todos os quadros.
9 Prove, escrevendo todos os termos, que
3 3 3 3
ÿ ÿ =
ÿ¯ ÿAÿ eÿ¯ ÿ ÿ¯ ÿAÿ eÿ¯ .
ÿ¯=0 ÿ¯=0
ÿ ÿ=0 ÿ=0
Como a ordem da soma não importa, temos justificativa para usar a convenção de soma de
o que não especifica a ordem da soma. Einstein ÿ¯ ÿAÿ eÿ¯ , para escrever simplesmente
10 Prove a Eq. (2.13) da equação Aÿ( ÿ¯ ÿ eÿ¯ ÿ eÿ) = 0 fazendo escolhas específicas para os
componentes do vetor arbitrário A 11 Seja .
ÿ¯
ÿ seja a matriz da transformação de Lorentz de O para O¯, dada na Eq. (1.12).
Seja A um vetor arbitrário com componentes (A0, A1, A2, A3) no referencial O. (a)
ÿ
Escreva a matriz de µ¯ (ÿv). (b) Encontre Aÿ¯ para
realizando todo ÿ¯.
a soma (c) Verifique
indicada a Eq.os
para todos (2.18)
valores de ÿ e ÿ. (d) Escreva a matriz de transformação de Lorentz de O¯ para O,
justificando cada entrada. (e) Use (d) para encontrar Aÿ a partir de Aÿ¯ . Como isso está
relacionado com a Eq. (2.18)? (f) Verificar, da mesma forma que (c), que
ÿ ÿ¯
ÿ (ÿv) = ÿÿ¯ ÿ¯.
ÿ¯(v)
e
Aÿ¯ = ÿÿ¯ ÿ¯
Aÿ¯ .
(b) Mostre que a Eq. (2.41) é apenas o produto matricial das matrizes do indivíduo
Transformações de Lorentz.
ÿ
ÿ¯ (v) ÿ¯ ÿ(v )
para v e v , como dado em (c), e mostre que o resultado não é igual ao de (c). Interpretar
isso fisicamente.
14 A matriz a seguir fornece uma transformação de Lorentz de O para O¯:
1,25 0 0 ,75
ÿ 0 10 0 ÿ
ÿ ÿ
.
ÿ
0 01 0 ÿ
ÿ 0,75 0 0 1,25 ÿ
53 2.9 Exercícios
(a) Mostre que isso implica que a sempre tem os mesmos componentes no MCRF do corpo e que
esses componentes são o que se chamaria de 'aceleração' em termos galileanos.
(Esta seria a situação física de um foguete cujo motor sempre dava a mesma aceleração.)
(b) Suponha que um corpo seja uniformemente acelerado com ÿ = 10 m sÿ2 (cerca da aceleração da
gravidade na Terra). Se o corpo parte do repouso, encontre sua velocidade após o tempo t.
(Certifique-se de usar as unidades corretas.) Qual a distância percorrida neste tempo? Quanto
tempo leva para atingir v = 0,999?
(c) Encontre o tempo próprio decorrido para o corpo em (b), em função de t. (Integre dÿ ao longo de
sua linha de mundo.) Quanto tempo próprio se passou até sua velocidade ser v = 0,999? Quanto
uma pessoa aceleraria como em (b) idade em uma viagem da Terra ao centro de nossa Galáxia,
uma distância de cerca de 2 × 1020 m?
20 A linha de mundo de uma partícula é descrita pelas equações
z(t) = 0, < 1,
em algum referencial inercial. Descreva o movimento e calcule os componentes das quatro velocidades
e quatro acelerações da partícula.
21 A linha de mundo de uma partícula é descrita pelas equações paramétricas em alguns Lorentz
quadro
ÿ ÿ
t(ÿ) = um senh , x(ÿ) = um custo ,
uma uma
resulta na destruição das duas partículas e na produção de três novas, duas das quais têm quatro
momentos
2 , 0, 0) kg.
p 3 ÿO (1, 1, 0, 0) kg, p 4 ÿO (1, ÿ1
Encontre os quatro momentos, a energia, a massa de repouso e as três velocidades da terceira partícula
produzida. Encontre a três velocidades do quadro CM.
23 Uma partícula de massa em repouso m tem três velocidades v. Encontre sua energia correta para termos
de ordem |v| 4. A que velocidade |v| o valor absoluto de 0(|v| 4) termo é igual a 2m|v| 2? termo decinética
energia
12
1
24 Prove que a conservação de quatro momentos proíbe uma reação na qual um elétron e
pósitron aniquilam e produzem um único fóton (raio ÿ). Prove que a produção de dois fótons não é
proibida.
Machine Translated by Google
25 (a) Deixe o referencial O se mover com velocidade v na direção x em relação a O. Deixe um fóton ter
frequência ÿ em O e se movem em um ângulo ÿ em relação ao eixo x de O. Mostre que seu
frequência em O¯ é
d dU
(U · U ) = 2U · .
dÿ dÿ
30 A quatro velocidades de um foguete é U ÿ O (2, 1, 1, 1). Ele encontra uma alta velocidade
raio cósmico cujo momento é P ÿO (300, 299, 0, 0) × 10ÿ27 kg. Calcular o
energia do raio cósmico medida pelos passageiros do foguete, usando cada um dos
os dois métodos a seguir.
(a) Encontre as transformações de Lorentz de O para o MCRF do foguete e use
para transformar as componentes de P .
(b) Use a Eq. (2,35).
(c) Qual método é mais rápido? Por quê?
31 Um fóton de frequência ÿ é refletido sem mudança de frequência de um espelho, com
um ângulo de incidência ÿ. Calcule a quantidade de movimento transferida para o espelho. o que
momento seria transferido se o fóton fosse absorvido em vez de refletido?
32 Deixe uma partícula de carga e e massa em repouso m, inicialmente em repouso no laboratório, espalhar
um fóton de frequência inicial ÿi. Isso é chamado de espalhamento Compton. Suponha que o fóton
espalhado saia em um ângulo ÿ da direção do incidente. Use a conservação de
quatro momentos para deduzir que a frequência final do fóton ÿf é dada por
Machine Translated by Google
55 2.9 Exercícios
1 1 1 ÿ cos ÿ
= +h . (2,43)
ÿf ÿi m
33 O espaço é preenchido com raios cósmicos (prótons de alta energia) e a radiação cósmica de
fundo de micro-ondas. Estes podem Compton espalhar-se uns pelos outros. Suponha que um fóton de
energia hÿ = 2 × 10ÿ4 eV espalha um próton de energia 109mP = 1018 eV, energias
medido no quadro de repouso do Sol. Use a Eq. (2.43) no quadro de repouso inicial do próton para
calcule a energia final máxima que o fóton pode ter no quadro de repouso solar após
a dispersão. Que faixa de energia é essa (raio-X, visível, etc.)?
34 Mostre que, se A , B , e C são quaisquer vetores e ÿ e ÿ quaisquer números reais,
(ÿA ) · B = ÿ(A · B ),
A · (ÿB ) = ÿ(A · B ),
A · (B + C ) = A · B + A · C ,
(A + B ) · C = A · C + B · C .
35 Mostre que os vetores { eÿ¯} obtidos de { eÿ} pela Eq. (2.15) satisfaça eÿ¯ · eÿ¯ = ÿÿ¯ÿ¯ para
todos ÿ¯, ÿ¯.
Machine Translated by Google
A = Aÿ eÿ, B = Bÿ eÿ.
A · B = AÿBÿ( eÿ · eÿ),
A · B = AÿBÿÿÿÿ. (3.1)
3.2 D e fi ni ti onoftensores
0
Vejamos o que significa esta definição. Por enquanto, vamos apenas aceitar a notação que sua ;
N
justificativa virá mais adiante neste capítulo. A regra para o produto escalar, Eq. (3.1),
satisfaz nossa definição de tensor. É0uma regra que leva dois vetores, A e B , e
2
produz um único número real A · B . Dizer que é linear em seus argumentos significa o que é
provado em Exer. 34, § 2.9. Linearidade no primeiro argumento significa
(ÿA ) · B = ÿ(A · B ), ÿ
e (3.2)
ÿ
(A + B ) · C = A · C + B · C ,ÿ
A · (ÿB ) = ÿ(A · B ),
A · (B + C ) = A · B + A · C .
Então consideramos g( , ) como uma função que pode receber dois argumentos e que é linear
naquilo
e da mesma forma para o segundo argumento. O valor de g em dois argumentos, denotado por
g(A , B ), é seu produto escalar, um número real.
Observe que a definição de um tensor não menciona componentes dos vetores. UMA
tensor deve ser uma regra que dá o mesmo número real independentemente da referência
quadro no qual os componentes dos vetores são calculados. Mostramos no capítulo anterior
que a eq. (3.1) satisfaz este requisito. Isso nos permite considerar um tensor como uma função de
os próprios vetores em vez de seus componentes, e isso às vezes pode ser útil
conceitualmente.
Observe que uma função ordinária de posição, f(t, x, y,z), é uma função de valor real de não
vetores em tudo. Por isso, é classificado como 0 tensor.
0
y = f(x),
onde y e x são números reais. Mas isso pode ser escrito mais precisamente como: f é uma 'regra'
(chamado mapeamento) que associa um número real (simbolicamente chamado y, acima) com
outro número real, que é o argumento de f (simbolicamente chamado x, acima). A função em si não
é f(x), pois f(x) é y, que é um número real chamado 'valor' do
Machine Translated by Google
função. A função em si é f , que podemos escrever como f( ) para mostrar que ela tem
um argumento. Em álgebra, isso parece muito complicado, já que inconscientemente pensamos em x
e y como duas coisas ao mesmo tempo: são, por um lado, números reais específicos e, por outro,
por outro lado, nomes para números reais gerais e arbitrários. No cálculo tensorial, faremos
esta distinção explícita: A e B são vetores específicos , A · B é um número real específico, e g
é o nome da função que associa A · B com A e B .
Componentes de um tensor
Assim como um vetor, um tensor tem componentes. Eles são definidos como:
0
Os componentes em um quadro O de um tensor do N são os valores da função quando seus argumentos
tipo são os vetores de base { eÿ} do quadro O.
(3.5)
g( eÿ, eÿ) = eÿ · eÿ = ÿÿÿ.
Assim, a matriz ÿÿÿ que introduzimos antes deve ser pensada como uma matriz dos componentes de g com base.
Em outra base, os componentes podem ser diferentes. Nós teremos
muitos outros exemplos disso mais tarde. Primeiro estudamos uma classe particularmente importante de tensores.
0
3.3 O 1
tensores: uma forma
Propriedades gerais
˜
Seja uma forma arbitrária chamada p˜. (Adotamos a notação de que uma forma acima de um símbolo denota
única, assim como acima um símbolo denota um vetor.) Então p˜, fornecido com um vetor
argumento, dá um número real: p˜(A ) é um número real. Suponha que q˜ seja outra forma. Então
podemos definir
s˜ = ˜p + ˜q,
(3.6a)
r˜ = ÿp˜,
Machine Translated by Google
0
59 3.3 O 1 tensores: uma forma
para ser as formas únicas que assumem os seguintes valores para um argumento A :
Com essas regras, o conjunto de todas as formas um satisfaz os axiomas para um espaço vetorial, que
contas para seus outros nomes. Este espaço é chamado de 'espaço vetorial dual' para distingui-lo
do espaço de todos os vetores como A .
Qualquer componente com um único índice inferior é, por convenção, o componente de uma forma única;
um índice superior denota o componente de um vetor. Em termos de componentes, p˜(A ) é
= Aÿp˜( eÿ),
eÿ¯ = ÿ¯ eÿ,
vemos que os componentes de uma forma se transformam exatamente da mesma maneira que os vetores de base
e de maneira oposta às componentes de vetores. Por 'oposto', queremos dizer usar o
transformação inversa. Este uso do inverso garante que Aÿpÿ é independente do quadro
para qualquer vetor A e p˜ de uma forma. Esta é uma observação tão importante que provaremos
explicitamente:
ÿÿÿAÿpÿ, = Aÿpÿ.
ÿAÿpÿ, = ÿÿ¯ = (3.10b)
(3.10c)
(3.10d)
Machine Translated by Google
(Esta é a mesma maneira pela qual o vetor Aÿ eÿ é mantido independente do referencial.) Esta inversa
transformação dá origem à palavra 'dual' em 'espaço vetorial dual'. A propriedade de transformar com vetores de
base dá origem ao co em 'vetor covariante' e sua forma mais curta
'covector'. Como os componentes de vetores comuns se transformam de forma oposta aos vetores de base (em
para manter o quadro Aÿ eÿ independente), eles são freqüentemente chamados de vetores 'contravariantes'. A maioria
desses nomes são antiquados; 'vetores' e 'vetores duais' ou 'formas únicas' são os nomes modernos. A razão pela
qual 'co' e 'contra' foram abandonados é que eles se misturam
duas coisas muito diferentes: a transformação de uma base é a expressão de novos vetores em
termos dos antigos ; a transformação de componentes é a expressão do mesmo objeto em
termos da nova base. É importante que o aluno tenha certeza dessas distinções antes de
seguindo adiante.
Formas básicas
Como o conjunto de todas as formas um é um espaço vetorial, podemos usar qualquer conjunto de quatro formas
um linearmente independentes como base. (Como em qualquer espaço vetorial, diz-se que uma forma é linearmente
independente se nenhuma combinação linear não trivial for igual à forma zero. A forma zero um é aquela cujo valor
em qualquer vetor é zero.) No entanto, na seção anterior,
já usaram os vetores de base { eÿ} para definir os componentes de uma forma. Isso sugere que devemos ser
capazes de usar os vetores de base para definir uma base uniformal associada
{ ˜ÿÿ, ÿ = 0, ... , 3}, que chamaremos de base dual para { eÿ}, sobre a qual uma forma única tem
os componentes definidos acima. Ou seja, queremos um conjunto { ˜ÿÿ} tal que
p˜ = pÿÿ˜ ÿ. (3.11)
ÿ
(Observe que usando um índice elevado em ÿ˜ permite que a convenção de soma funcione.) O
{ ˜ÿÿ} são quatro formas distintas, assim como os { eÿ} são quatro vetores distintos. Esta equação
deve implicar a Eq. (3.8) para qualquer vetor A e p˜ de uma forma:
p˜(A ) = pÿAÿ.
= pÿAÿÿ˜ ÿ( eÿ).
(Observe o uso de ÿ como índice na segunda linha, para distinguir sua soma
de um em ÿ.) Agora, esta linha final só pode igualar pÿAÿ para todos Aÿ e pÿ se
ÿ˜ ÿ( eÿ) = ÿÿ ÿ. (3.12)
0
61 3.3 O 1 tensores: uma forma
0
ÿ˜
ÿO (1, 0, 0, 0),
1 ÿ˜
ÿO (0, 1, 0, 0),
2 ÿ˜
ÿO (0, 0, 1, 0),
3 ÿ˜
ÿO (0, 0, 0, 1).
É importante entender dois pontos aqui. Uma é que a Eq. (3.12) define a base
{ ˜ÿÿ} em termos da base { eÿ}. A base vetorial induz uma base de forma única e conveniente. Esta não é
a única base única possível, mas é muito útil ter a
relacionamento, eq. (3.12), entre as bases que sempre iremos utilizar. O relacionamento,
0
Eq. (3.12), está entre as duas bases, não entre pares individuais, como ÿ˜ e e0.
Ou seja, se mudarmos e0, deixando e1, e2 e e3 inalterados, então, em geral, isso
0
mudanças não apenas na posição de ÿ˜mas também
é que, empossamos
embora ÿ˜ 1, ÿ˜ 2, descrever
e ÿ˜ 3. O segundo pontoquanto
tanto vetores a induzuma-
formas dando um conjunto de quatro
componentes, seu significado geométrico é muito diferente. O aluno não deve perder
vista do fato de que os componentes contam apenas parte da história. A base contém o
restante das informações. Ou seja, um conjunto de números (0, 2, ÿ1, 5) sozinho não define nada; para
transformá-lo em algo, devemos dizer se estes são componentes em um vetor
base ou uma base de uma forma e, de fato, qual do número infinito de bases possíveis é
sendo usado.
Resta determinar como { ˜ÿÿ} se transforma sob uma mudança de base. Ou seja, cada quadro
tem seu próprio conjunto único { ˜ÿÿ}; como os dois quadros estão relacionados? A derivação aqui é
análogo ao dos vetores de base. Isso leva à única equação com a qual podemos escrever
os índices em suas posições corretas:
= ÿ¯
(3.13)
ÿ¯ ÿ˜ ÿÿ˜ ÿ.
Imagem de um formulário
Para vetores, geralmente imaginamos uma seta se precisarmos de uma imagem. É útil ter um
imagem de um formulário também. Em primeiro lugar, não é uma flecha. Sua imagem deve refletir a
fato de que ele mapeia vetores em números reais. Um vetor em si não mapeia automaticamente
outro vetor em um número real. Para fazer isso, ele precisa de um tensor métrico para definir o escalar
produtos. Com uma métrica diferente, os mesmos dois vetores produzirão um produto escalar diferente .
Então, dois vetores por si só não dão um número. Precisamos de uma imagem de um formulário
que não depende de nenhum outro tensor ter sido definido. O geralmente usado
por matemáticos é mostrado na Fig. 3.1. A forma única consiste em uma série de superfícies. o
'magnitude' dela é dada pelo espaçamento entre as superfícies: quanto maior o espaçamento,
menor a magnitude. Nesta imagem, o número produzido quando uma forma única atua em um
vetor é o número de superfícies que a seta do vetor perfura. Então, quanto mais perto deles
Machine Translated by Google
Figura 3.1 (a) A imagem de uma forma complementar à de um vetor como uma seta. (b) O valor
de uma forma em um dado vetor é o número de superfícies que a seta perfura. (c) O valor
de uma forma menor no mesmo vetor é um número menor de superfícies. Quanto maior a
forma, mais 'intensa' é a divisão do espaço em sua imagem.
espaçamento, maior o número (compare (b) e (c) na Fig. 3.1). Em um espaço quadridimensional, as superfícies
são tridimensionais. A forma única não define uma direção única, pois não é um vetor. Em vez disso, define uma
maneira de 'fatiar' o espaço. Para justificar esta imagem, vamos olhar para uma forma particular, o gradiente.
Considere um campo escalar ÿ( x) definido em cada evento x. A linha de mundo de alguma partícula (ou pessoa)
encontra um valor de ÿ em cada uma delas (veja a Fig. 3.2), e esse valor muda de evento para evento. Se
rotularmos (parametrizar) cada ponto na curva pelo valor do tempo próprio ÿ ao longo dele (ou seja, a leitura de
um relógio se movendo na linha), então podemos expressar as coordenadas dos eventos na curva como funções
de ÿ :
dt _ dx _
Uÿ , , ... .
dÿ dÿ
0
63 3.3 O 1 tensores: uma forma
ÿ
ÿ=2 você
ÿ=0
x
Figura 3.2 Uma linha mundial parametrizada pelo tempo próprio , e os valores ÿ(ÿ ) do campo escalar ÿ(t, x, y, z)
ÿ ao longo dela.
dÿ ÿÿ dt ÿÿ dx ÿÿ dy ÿÿ dz
= + + + ÿt
dÿ dÿ ÿx dÿ ÿy dÿ ÿz dÿ
ÿÿ ÿÿ ÿÿ ÿÿ
= Ut + Ux + Uy + Uz . ÿt (3.14)
ÿx ÿy ÿz
Fica claro disso que na última equação criamos um meio de produzir a partir de
o vetor U o número dÿ/dÿ que representa a taxa de variação de ÿ em uma curva na qual
U é a tangente. Este número dÿ/dÿ é claramente uma função linear de U a uma , então nós definimos
forma.
Por comparação com a Eq. (3.8), vemos que essa forma única tem componentes
(ÿÿ/ÿt, ÿÿ/ÿx, ÿÿ/ÿy, ÿÿ / ÿz ). Esta forma única é chamada de gradiente de ÿ, denotado por d˜ÿ:
ÿÿ ÿÿ ÿÿ ÿÿ
, , , . (3.15)
d˜ÿ ÿO ÿt ÿx ÿy ÿz
É claro que o gradiente se encaixa em nossa definição de uma forma. Veremos mais tarde como é
acontece que o gradiente é geralmente introduzido no cálculo vetorial tridimensional
como vetor.
O gradiente nos permite justificar nossa imagem de uma forma. Na Fig. 3.3 desenhamos
parte de um mapa topográfico, mostrando contornos de igual elevação. Se h é a elevação, então
o gradiente d˜h é claramente maior em uma área como A, onde as linhas estão mais próximas,
e menor perto de B, onde as linhas são espaçadas. Além disso, suponha que quiséssemos
para saber quanta elevação uma caminhada entre dois pontos envolveria. Nós nos deitaríamos
no mapa uma linha (vetor x) entre os pontos. Então o número de contornos da linha
1
cruzado daria a mudança de elevação. Por exemplo, a linha 1 cruza 1 contorno, enquanto
2
2 cruza dois contornos. A linha 3 começa perto da 2, mas segue em uma direção diferente, terminando
1
contorno mais alto. Mas esses números são apenas h, que é a contração de d˜h com
2 x : h(ÿh/ÿxi
apenas = ) xi ou o valor de d˜h em x (ver Eq. (3.8)).
eu
Machine Translated by Google
UMA
3
40 2
30
1
20
B
10
Figura 3.3 Um mapa topográfico ilustra o gradiente de uma forma (contornos locais de elevação constante). o
mudança de altura ao longo de qualquer viagem (seta) é o número de contornos cruzados pela seta.
ÿ
V
Portanto, uma forma única é representada por uma série de superfícies (Fig. 3.4), e sua contração com um
vetor V é o número de superfícies que V cruza. Quanto mais próximas as superfícies, maior ÿ˜. Corretamente,
assim como um vetor é reto, as superfícies de uma forma são retas e paralelas.
Isso ocorre porque lidamos com uma-formas em um ponto, não sobre uma região estendida: uma-formas
'tangentes', no mesmo sentido dos vetores tangentes.
Essas imagens mostram por que, em geral , não podemos chamar um gradiente de vetor. Gostaríamos de
identificar o vetor gradiente como aquele vetor apontando 'para cima' da inclinação, ou seja, de tal forma que
ele cruze o maior número de contornos por unidade de comprimento. A frase-chave é 'por unidade de comprimento'.
Se houver uma métrica, uma medida de distância no espaço, então um vetor pode ser associado a um gradiente.
Mas a métrica deve intervir aqui para produzir um vetor. Geometricamente, por si só, o gradiente é uma forma
única.
Tenhamos certeza de que a Eq. (3.15) é uma definição consistente. Como os componentes
transformar? Para uma forma única devemos ter
ÿ
(d˜ÿ)ÿ¯ = ÿ¯ (d˜ÿ)ÿ. (3.16)
ÿÿ ÿxÿ
ÿÿ ÿxÿ
= ,
ÿxÿ¯ ÿxÿ¯
Machine Translated by Google
0
65 3.3 O 1 tensores: uma forma
que significa
ÿxÿ
(d˜ÿ)ÿ¯ = (d˜ÿ)ÿ. (3.17)
ÿxÿ¯
São as Eqs. (3.16) e (3.17) consistente? A resposta, claro, é sim. O motivo: desde
xÿ = ÿ xÿ¯ ,
ÿ¯
ÿxÿ/ÿxÿ¯ = ÿ (3.18)
ÿ¯ .
ÿÿ
ÿx := ÿ,x
e, mais geralmente,
ÿÿ
:= ÿ,ÿ. (3.19)
ÿxÿ
xÿ , ÿÿ,ÿ ÿÿ
Este é um resultado útil, que a base de uma forma é apenas d˜xÿ. Podemos usá-lo para escrever, para qualquer
função f ,
ÿf
df = d˜xÿ.
ÿxÿ
Isso se parece muito com a maneira˜ de 'cálculo desleixado' do físico de escrever diferenciais ou
infinitesimais. A notação d foi escolhida em parte para sugerir essa comparação, mas essa escolha
torna duplamente importante para o aluno evitar confusão nesse ponto. o
objeto d˜f é um tensor, não um pequeno incremento em f ; pode ter um valor pequeno ('infinitesimal')
se for contraído com um vetor pequeno.
Machine Translated by Google
Assim como o gradiente, o conceito de vetor normal – um vetor ortogonal a uma superfície – é
uma que é mais naturalmente substituída pela de uma forma normal. Para um vetor normal
ser definido precisamos ter um produto escalar: o vetor normal deve ser ortogonal a todos
vetores tangentes à superfície. Isso pode ser definido apenas usando o tensor métrico. Mas um
uma forma normal pode ser definida sem referência à métrica. Diz-se que uma forma única é
normal a uma superfície se seu valor for zero em cada vetor tangente à superfície. Se a superfície
é fechado e divide o espaço-tempo em um 'dentro' e 'fora', um normal é dito ser um
uma forma normal externa se for uma forma normal e seu valor em vetores que apontam
para fora da superfície é positivo. Em Exer. 13, § 3.10, provamos que d˜f é normal a
superfícies de constante f .
0
3.4 O 2 tensores
0
Os tensores do tipo têm
2
dois argumentos vetoriais. Encontramos o tensor métrico
já, mas o mais simples desse tipo é o produto de duas formas únicas, formadas de acordo com
0
à seguinte regra: se p˜ e q˜ são uma-formas, então p˜ ÿ ˜q é o tensor que, quando 2
fornecido com os vetores A e B como argumentos, produz o número p˜(A ) q˜(B ), ou seja, apenas o
0
produto dos números produzidos pelos tensores. O símbolo
1
ÿ é chamado de 'exterior
0 tensor é formado a partir de um
sinal do produto' e é uma notação formal para mostrar como as 2
formas. Observe que ÿ não é comutativo: p˜ ÿ ˜q e q˜ ÿ ˜p são tensores diferentes . O primeiro
dá o valor p˜(A ) q˜(B ), o segundo o valor q˜(A ) p˜(B ).
Componentes
0
O tensor mais geral não2 é um simples produto externo, mas sempre pode ser representado
como uma soma de tais tensores. Para ver isso, devemos primeiro considerar os componentes de um
0 tensor f:
2
Como cada índice pode ter quatro valores, existem 16 componentes, e eles podem ser pensados
de como sendo dispostos em uma matriz. O valor de f em vetores arbitrários é
= AÿBÿfÿÿ. (3.22)
(Novamente, observe que dois índices fictícios diferentes são usados para manter os diferentes somatórios
0
distintos.) Podemos formar uma base para esses tensores? Ou seja, podemos definir um conjunto de 16
2
tensores ÿ˜ ÿÿ tal que, análogo à Eq. (3.11),
Machine Translated by Google
0
67 3.4 O 2
tensores
ÿ
Mas ÿÿÿ é (pela Eq. (3.12)) o valor de ÿ˜ é um em eÿ, e analogamente para ÿÿÿ . Portanto, ÿ˜ ÿÿ
tensor cujo valor é apenas o produto dos valores de duas formas de uma base,
e por isso concluímos
Então os tensores ÿ˜ÿ ÿ ˜ÿÿ são uma base para todos 0 tensores, e podemos escrever
2
ÿ
f = fÿÿÿ˜ ÿ ˜ÿÿ. (3.26)
0
Esta é uma maneira pela qual um general 2 tensor é uma soma sobre tensores de produto externo simples.
Simetrias
0
UMA
2
tensor recebe dois argumentos, e sua ordem é importante, como vimos. O comportamento do valor
de um tensor sob um intercâmbio de seus argumentos é uma propriedade importante
disso. Um tensor f é chamado simétrico se
Isso é o mesmo que a condição de que a matriz de matrizes dos elementos seja simétrica. Um
0
arbitrário 2 tensor h pode definir um novo h(s) simétrico pela regra
1 1
h(s)(A , B ) = 2h(A , B ) + 2h(B , A ). (3,29)
Certifique-se de entender que h(s) satisfaz a Eq. (3.27) acima. Para os componentes isso
implica
1
h(s)ÿÿ = (3.30)
2 (hÿÿ + hÿÿ).
Esta é uma propriedade matemática tão importante que uma notação especial é usada para ela:
1
h(ÿÿ) := (3.31)
2 (hÿÿ + hÿÿ).
Machine Translated by Google
ÿfÿÿ. (3.33)
0
Um antisimétrico 2 tensor sempre pode ser formado como
1 1
h(A)(A , B ) = 2h(A , B ) ÿ 2h(B , A ),
1
h(A)ÿÿ = 2 (hÿÿ ÿ hÿÿ).
1
h[ÿÿ] = 2 (hÿÿ ÿ hÿÿ). (3,34)
Notar que
1 1
hÿÿ = 2 (hÿÿ + hÿÿ) + 2 (hÿÿ - hÿÿ)
0
Assim, 2 tensor pode ser dividido exclusivamente em suas partes simétricas e antisimétricas.
qualquer O tensor métrico g é simétrico, como pode ser deduzido da Eq. (2.26):
Apresentamos agora o que veremos mais adiante é o papel fundamental da métrica em diferentes
geometria inicial, para atuar como um mapeamento entre vetores e formas únicas. Para ver como isso funciona,
considere g e um único vetor V . Como g requer dois argumentos vetoriais, a expressão
g(V , ) ainda falta um: quando outro é fornecido, torna-se um número. Portanto, g(V , )
considerado como uma função de vetores (que devem preencher o 'slot' vazio nele) é um
função de vetores que produzem números reais: uma forma. Chamamos de V˜ :
onde espaços em branco entre parênteses são uma maneira de indicar que um argumento vetorial deve ser
fornecido. Então V˜ é a forma única que avalia em um vetor A a V · A :
V˜ (A ) := g(V , A ) = V · A . (3,38)
( g( , V ) := V˜ ).
Machine Translated by Google
Vÿ := V˜ ( eÿ) = V · eÿ = eÿ · V = eÿ
· (Vÿ eÿ)
= ( eÿ · eÿ)Vÿ
Vÿ = ÿÿÿVÿ. (3,39)
= V0(ÿ1) + 0 + 0 + 0
= ÿV0, (3,40)
se V ÿ (a, b, c, d),
As componentes de V˜ são obtidas das de V alterando o sinal da componente de tempo. (Como isso
dependia dos componentes ÿÿÿ, em situações que encontramos mais tarde,
onde a métrica tem componentes mais complicados, esta regra de correspondência entre
V˜ e V também serão mais complicados.)
Aÿ := ÿÿÿAÿ. (3,43)
Machine Translated by Google
O uso da inversa garante que os dois conjuntos de componentes satisfaçam a Eq. (3.39):
Aÿ = ÿÿÿAÿ.
de modo que (ÿÿÿ) é idêntico a (ÿÿÿ). Assim, para passar de uma forma para um vetor, basta
alterar o sinal do componente de tempo.
ÿÿ ÿÿ
d˜ÿ ÿ , , ... ,
ÿt ÿx
ÿÿÿ ÿÿ
d˜ÿ ÿ , , ... . (3,45)
ÿt ÿx
Se tivéssemos simplesmente tentado definir o 'gradiente vetorial' de uma função como o vetor com
esses componentes, sem primeiro discutir formas únicas, o leitor estaria justificado em ser mais do
que um pouco cético. A métrica não-euclidiana de SR nos obriga a estar cientes da distinção básica
entre formas únicas e vetores: ela não pode ser varrida para debaixo do tapete.
Como observamos anteriormente, vetores e formas unitárias são duais entre si. Esses espaços
duais são importantes e são encontrados em outras partes da física matemática. O exemplo mais
simples é o espaço de vetores coluna na álgebra matricial
uma
ÿ b ÿ
..
ÿ . ÿ,
cujo espaço dual é o espaço dos vetores linha (ab ··· ). Observe que o produto
é um número real, de modo que um vetor de linha pode ser considerado uma forma em vetores de coluna.
A operação de encontrar um elemento de um espaço a partir de um dos outros é chamada de
'adjunto' e é 1-1 e invertível. Um exemplo menos trivial surge na mecânica quântica.
Uma função de onda (amplitude de probabilidade que é uma solução para a equação de Schrödinger) é uma
campo escalar complexo ÿ( x), e é extraído do espaço de Hilbert de todas essas funções. este
O espaço de Hilbert é um espaço vetorial, pois seus elementos (funções) satisfazem os axiomas de um
espaço vetorial. Qual é o espaço dual de uma forma? A dica crucial é que o produto interno
de quaisquer duas funções ÿ( x) e ÿ( x) não é ÿ( x)ÿ( x) d3x, mas sim ÿÿ( x)ÿ( x) d3x,
o asterisco denotando conjugação complexa. A função ÿÿ( x) age como uma forma única cuja
valor em ÿ( x) é sua integral com ele (análoga à soma na Eq. (3.8)). A operação
de conjugação complexa age como nosso tensor métrico, transformando um vetor ÿ( x) (no
espaço de Hilbert) em uma forma ÿÿ( x). O fato de que ÿÿ( x) também é uma função no método de Hilbert
o espaço é, neste nível, uma distração. (É equivalente a dizer que os membros do conjunto
(1, ÿ1, 0, 0) podem ser componentes de um vetor ou de uma forma.) O ponto importante
é que na integral ÿÿ( x)ÿ( x) d3x, a função ÿÿ( x) está atuando como uma forma, produzindo um número
(complexo) a partir do vetor ÿ( x). Este dualismo é mais claramente trazido
na notação Dirac 'bra' e 'ket'. Os elementos do espaço de todos os estados do sistema são chamados |
(com etiquetas de identificação escritas no interior), enquanto os elementos da dupla
(adjunto com conjugado complexo) espaço são chamados |. Dois 'vetores' |1 e |2 não
formam um número, mas um vetor e um vetor dual |1 e 2| faça: 2|1 é o nome disso
número.
Dessa forma, o conceito de um espaço vetorial dual surge com muita frequência em
física matemática.
Um p˜ de uma forma é definido para ter a mesma magnitude que seu vetor associado p . Desta forma
nós escrevemos
Isso parece envolver encontrar {pÿ} de {pÿ} antes de usar a Eq. (3.47), mas podemos
facilmente contornar isso. Usamos a Eq. (3.43) para pÿ e pÿ na Eq. (3,47):
(Observe que cada soma independente usa um índice fictício diferente.) Mas como ÿÿÿ
e ÿÿÿ são matrizes inversas entre si, a soma em ÿ colapsa:
ÿÿÿÿÿÿ = ÿÿ ÿ. (3,49)
Assim, o tensor métrico inverso pode ser usado diretamente para encontrar a magnitude de p˜ de seu
componentes. Podemos usar a Eq. (3.44) para escrever isso explicitamente como
2
p˜2 = ÿ (p0) 2 + (p1) 2 + (p2) + (p3) 2. (3,51)
Esta é a mesma regra, de fato, como a Eq. (2.24) para vetores. Por sua definição, este é o quadro
invariante. As formas únicas são semelhantes ao tempo, ao espaço ou nulas, como são seus vetores associados.
Tal como acontece com os vetores, agora podemos definir um produto interno de uma forma. Isto é
1 2
p˜ · ˜q := (p˜ + ˜q) ÿ ˜p2 ÿ ˜q2 . (3,52)
2
Diz-se que um vetor é normal a uma superfície se sua forma associada for normal
Formato. Eq. (3.38) mostra que esta definição é equivalente à usual de que o vetor seja
ortogonal a todos os vetores tangentes. Um vetor normal ou uma forma é dito ser uma unidade normal
se sua magnitude for ±1. (Não podemos exigir que seja +1, já que vetores tipo tempo terão
grandezas negativas. Tudo o que podemos fazer é multiplicar o vetor ou forma por um fator global
para dimensionar sua magnitude para ±1.) Observe que normais nulas não podem ser normais unitárias.
Diz-se que uma superfície tridimensional é temporal, espacial ou nula, de acordo com a qual
dessas classes sua normal se enquadra. (Exer. 12, § 3.10, prova que esta definição é auto consistente.) Em Exer.
21, § 3.10, exploramos as seguintes propriedades curiosas dos vetores normais
temos por conta da nossa métrica. Um vetor normal externo é o vetor associado a
uma forma normal externa, conforme definido anteriormente. Isso garante que seu produto escalar com
qualquer vetor que aponta para fora é positivo. Se a superfície é semelhante ao espaço, o vetor normal externo
aponta para fora. Se a superfície for semelhante ao tempo, no entanto, o vetor normal externo
aponta para dentro. E se a superfície for nula, o vetor externo é tangente à superfície!
Essas peculiaridades simplesmente reforçam a visão de que é mais natural considerar o normal como
um formulário único, em que a métrica não entra na definição.
M
3.6 Para finalizar: N tensores
O dualismo discutido acima é de fato completo. Embora tenhamos definido uma forma como funções de vetores,
agora podemos ver que os vetores podem perfeitamente ser considerados lineares.
,
funções que mapeiam uma forma em números reais. Dado um vetor V uma vez que fornecemos um
de uma forma, obtemos um número real:
Machine Translated by Google
M
73 3.6 Finalmente: N tensores
Desta forma, destronamos vetores de sua posição especial como coisas 'atuadas' por tensores,
e considerá-los como próprios tensores, especificamente como funções lineares de formas únicas
em números reais. A última notação da Eq. (3.54) é novo, e enfatiza o status igual
dos dois objetos.
M
0
tensores
0 2
Todas as nossas discussões anteriores sobre
N tensores se aplicam aqui. Um 0 tensor é V ÿ W ,
simples que, quando fornecido com dois argumentos p˜ e q˜, dá o número V (p˜)W (q˜) :=
2
p˜(V )q˜(W ) = VÿpÿWÿqÿ. Então V ÿ W tem componentes VÿWÿ. Uma base para tensores é 0
M ÿ
eÿ ÿ eÿ. Os componentes de an são seus tensor são seus valores quando a base de uma forma ÿ˜
0
M
argumentos. Observe que os sobrescritos. 0 tensores têm componentes cujos índices são todos
M
N
tensores
A generalização final é:
M
Um N tensor é uma função linear de M uma-formas e N vetores nos números reais.
1
Por exemplo, se R é um tensor,
1 então ele requer uma forma p˜ e um vetor A para dar um
número R(p˜; A ). Tem componentes R(ÿ˜ ÿ; eÿ) := Rÿ ÿ. Em geral, os componentes de um
M
N tensor terá índices M para cima e N para baixo. Em um novo quadro,
ÿ
Rÿ¯
ÿ¯ = R(ÿ˜ ; eÿ¯)
ÿ¯ ÿ
= R( ÿÿ˜ ÿ; ÿ¯ eÿ )
ÿ¯
= ÿ
(3,55)
ÿ ÿ¯Rÿÿ .
Portanto, a transformação dos componentes é simples: cada índice se transforma trazendo a cujos índices
são organizados da única maneira permitida pela convenção de soma. Algum
nomes antigos que ainda estão em uso são: os índices superiores são chamados de 'contravariantes' (porque
M
eles se transformam contrários aos vetores de base) e os inferiores 'covariantes'. Um tensor
N é dito
para ser 'M-vezes contravariante e N-vezes covariante'.
Machine Translated by Google
Raciocínio circular?
Neste ponto, o estudante pode se preocupar que toda a álgebra tensorial tenha se tornado circular: uma
forma foi definida em termos de vetores, mas agora definimos vetores em termos de
um-formas. Essa 'dualidade' está no cerne da teoria, mas não é circularidade. Isso significa
podemos fazer como os físicos fazem, que é identificar os vetores com deslocamentos x
M
e coisas semelhantes (como p e v) e, em seguida, gerar todos os tensores pelas regras de
N
álgebra tensorial; esses tensores herdam um significado físico do significado original que
deu vetores. Mas poderíamos igualmente ter associado as formas únicas a alguns objetos físicos (gradientes,
por exemplo) e recuperado toda a álgebra daquele ponto inicial.
ponto. O poder da matemática é que ela não precisa (ou quer) dizer o que o
vetores originais ou uma-formas são. Ele simplesmente fornece regras para manipulá-los. A associação de,
digamos, p com um vetor está na interface entre a física e a matemática: é
como fazemos um modelo matemático do mundo físico. Um geômetra faz o mesmo.
Ele acrescenta à noção desses espaços tensoriais abstratos a ideia do que é um vetor em um
espaço curvo é. A idéia de vetor do geômetra moderno é algo que aprenderemos
sobre quando chegamos a espaços curvos. Por enquanto vamos praticar com tensores
em situações físicas, onde mantemos nossa noção (reconhecidamente imprecisa) de vetores
'como' x.
3.7 Índice
' ' '
subindo e 'low e ring
Da mesma forma que a métrica mapeia um vetor V em um tensor V˜ de uma , ele mapeia um N tensor
M
em um N-1 N tensor em um N+1 tensor. Nem
forma. Da mesma forma, a inversa mapeia um M M-1
M+1
malmente, estes recebem o mesmo nome e se distinguem apenas pelas posições de seus
2 tensor. Então
índices. Suponha que Tÿÿ são os componentes de um
ÿ 1
Tÿ ÿÿ := ÿÿÿTÿÿ ÿ
(3,56)
1
são os componentes de um 2
tensor (obtido mapeando o segundo argumento de uma forma de
Tÿÿ ÿ
em um vetor), e
ÿ := ÿÿÿTÿÿ (3,57)
Tÿ ÿ ÿ
1
são os componentes de outro (inequivalente) 2
tensor (mapeamento no primeiro índice), enquanto
Tÿÿÿ := ÿÿ ÿTÿÿ ÿ
(3,58)
3
são os componentes de um tensor. Essas operações são, naturalmente, chamadas de índice
0
'elevar' e 'abaixar'. Sempre que falamos em aumentar ou diminuir um índice, queremos dizer
este mapa gerado pela métrica. A regra no SR é simples: ao subir ou descer um
índice '0', o sinal do componente muda; ao aumentar ou diminuir um '1' ou '2' ou '3'
index (em geral, um índice 'i' ) o componente permanece inalterado.
Machine Translated by Google
Os números {ÿÿÿ} são os componentes da métrica e {ÿÿÿ} os da sua inversa. Suponha que elevemos um
índice de ÿÿÿ usando o inverso. Então obtemos os componentes 'mistos' de
a métrica,
ÿÿ ÿ ÿÿÿÿÿÿ. ÿ (3,59)
Mas à direita temos apenas o produto matricial de duas matrizes que são o inverso de
uns aos outros (os leitores que não têm certeza disso devem verificar a seguinte equação por
cálculo), então é a matriz identidade unitária. Como um índice está para cima e outro para baixo, é o
delta de Kronecker, escrito como
ÿ ÿÿ ÿ. (3,60)
ÿÿ ÿ
Elevando o outro índice, obtemos apenas uma identidade, ÿÿÿ = ÿÿÿ. Então podemos considerar ÿÿÿ
2 0
como os componentes do tensor,0 que é mapeado a partir do g, seus 2 tensor g por gÿ1. Então, para
componentes 'contravariantes' são iguais aos elementos da matriz inversa da matriz de
seus componentes 'covariantes'. É o único tensor para o qual isso é verdade.
Sem um, o produto interno de dois vetores é indefinido, pois os números são produzidos
somente quando as formas unitárias atuam sobre vetores e vice-versa. Em física, produtos escalares são
úteis, então precisamos de uma métrica. Mas existem alguns espaços vetoriais na física matemática onde
métricas não são importantes. Um exemplo é o espaço de fase da mecânica clássica e quântica.
Segundo, por que a métrica e não outro tensor? Se uma métrica não foi definida, mas outra
tensor simétrico fez o mapeamento, um matemático apenas chamaria o outro tensor de
métrica. Ou seja, ele o definiria como aquele que gera um mapeamento. Para um matemático,
a métrica é um pouco mais de estrutura na álgebra vetorial. Diferentes espaços na emática matemática podem
ter diferentes estruturas métricas. Um espaço Riemanniano é caracterizado por uma
métrica que fornece magnitudes positivas definidas de vetores. Um como o nosso, com tempo indefinido
sinal, é chamado pseudo-Riemanniano. Podemos até definir uma 'métrica' que é antisimétrica:
um espaço bidimensional chamado espaço espinor tem tal métrica, e acaba sendo de
importância fundamental na física. Mas sua estrutura está fora do escopo deste livro. o
ponto aqui é que não temos SR se apenas discutirmos vetores e tensores. Obtemos SR quando
Machine Translated by Google
dizemos que temos uma métrica com componentes ÿÿÿ. Se atribuirmos outros componentes,
pode obter outros espaços, em particular o espaço-tempo curvo de GR.
Suponha, como fizemos para funções, que nos movemos ao longo de uma linha de mundo com parâmetro ÿ , próprio
Tempo. A taxa de variação de T,
dT T(ÿ + ÿ ) ÿ T(ÿ )
= limite , (3,62)
dÿ ÿÿ0 ÿ
não é difícil de calcular. Como as formas e vetores da base são os mesmos em todos os lugares
(ie ÿ˜ ÿ(ÿ + ÿ ) = ˜ÿÿ(ÿ )), segue que
dT
= dTÿÿ ÿ˜ ÿ ÿ eÿ, (3,63)
dÿ dÿ
dTÿÿ / dÿ = Tÿ ÿ, ÿ Uÿ . (3,64)
1
Agora, o objeto dT/dÿ é um tensor, pois
1 na Eq. (3.62) é definido como sendo apenas o
diferença entre dois desses tensores. Das Eqs. (3.63) e (3.64) temos, para qualquer
vetor U ,
é um 1
2 tensor. Este tensor é chamado de gradiente de T.
Usamos a notação ÿT em vez de d˜T porque a última notação é geralmente reservada por
matemáticos para outra coisa. Também temos uma notação conveniente para a Eq. (3,65):
dT/dÿ = ÿU T, ÿU (3,67)
T ÿ Tÿ ÿ Uÿ . ÿ, (3,68)
Esta derivação fez uso do fato de que os vetores de base (e, portanto, a base que se forma) eram
constantes em todos os lugares. Descobriremos que não podemos assumir isso na curva
espaço-tempo de GR, e levar isso em conta será nosso ponto de entrada na teoria!
Machine Translated by Google
77 3.10 Exercícios
3.9 P ulteriormente
Nossa abordagem para a análise tensorial enfatiza a natureza geométrica dos tensores em vez das
propriedades de transformação de seus componentes. Os alunos que desejarem a ampliação de alguns
dos pontos aqui apresentados podem consultar os primeiros capítulos de Misner et al. (1973) ou Schutz (1980b).
Ver também Bishop e Goldberg (1981).
A maioria das introduções a tensores para físicos fora da relatividade se limitam a tensores 'cartesianos',
ou seja, a componentes tensoriais em coordenadas cartesianas tridimensionais.
Ver, por exemplo, Bourne e Kendall (1991) ou o capítulo de Mathews e Walker (1965).
Uma referência muito completa para análise tensorial no estilo antigo baseado em transformações de
coordenadas é Schouten (1990). Ver também Yano (1955). Livros que desenvolvem esse ponto de vista
para tensores na relatividade incluem Adler et al. (1975), Landau e Lifshitz (1962) e Stephani (2004).
3.10 Exercícios
1 (a) Dado um conjunto arbitrário de números {Mÿÿ; a = 0, ..., 3; ÿ = 0, ... , 3} e dois conjuntos arbitrários
de componentes vetoriais {Aÿ,ÿ = 0, ... , 3} e {Bÿ , ÿ = 0, ... , 3}, mostram que os dois expressões
3 3
MÿÿAÿBÿ := MÿÿAÿBÿ
ÿ=0 ÿ=0
e
3
MÿÿAÿBÿ
ÿ=0
(b) Sejam as componentes de p˜ (ÿ1, 1, 2, 0), as de A sejam (2, 1, 0, ÿ1) e as de B sejam (0, 2, 0, 0).
Encontre (i) p˜(A ); (ii) p˜(B ); (iii) p˜(A ÿ 3B ); (iv) p˜(A ) ÿ 3p˜(B ).
4 Dados os seguintes vetores em O:
UMA
E
ÿO (1, 1, 0, 0);
ÿ˜ 0
ÿO (1, 1, 0, 0),
ÿ˜ 1
ÿO (1, ÿ1, 0, 0),
ÿ˜ 2
ÿO (0, 0, 1, ÿ1),
ÿ˜
3 ÿO (0, 0, 1, 1).
p˜ = lÿÿ˜ ÿ.
Estes são os componentes de p˜ em {ÿ˜ ÿ}, o que quer dizer que eles são os valores de p˜ em
os elementos da base vetorial dual a {ÿ˜ ÿ}.
7 Prove a Eq. (3.13).
8 Desenhe as formas básicas d˜t e d˜x de um referencial O.
9 A Fig. 3.5 mostra curvas de igual temperatura T (isotermas) de uma placa de metal. Nos pontos
P e Q como mostrado, estime os componentes do gradiente d˜T. (Dica: os componentes
y
2
1
30
20
10 20
0
0
10
x
1 2 3 4
79 3.10 Exercícios
são as contrações com os vetores de base, que podem ser estimados contando os
número de isotermas cruzadas pelos vetores.)
10 (a) Dado um referencial O cujas coordenadas são {xÿ}, mostre que
ÿxÿ/ÿxÿ = ÿÿ ÿ.
ÿxÿ/ÿxÿ¯ = ÿ ÿ¯ .
ÿ ÿ¯ = ÿÿ µ.
ÿ¯ ÿ
1 1
h(s)(A , B ) = 2h(A , B ) + 2h(B , A ) (3,69)
é um tensor simétrico.
(b) Prove que h(A) definido por
1 1
h(A)(A , B ) = 2h(A , B ) - 2h(B , A ) (3,70)
é um tensor antisimétrico.
(c) Encontre as componentes das partes simétricas e antissimétricas de p˜ ÿ ˜q definidas em
Exer. 14.
0
(d) Prove que se h é um antisimétrico tensor,
2
h(A , A ) = 0
h(, A ) = ÿh( , B ),
Machine Translated by Google
v. Prove que T( ; v) é um vetor e T( ÿ˜; ) é uma forma única, ou seja, um tensor fornece 11
(b) Encontre os vetores mapeados pelo inverso do tensor métrico da forma p˜ ÿO (3, 0, ÿ1,
ÿ1), q˜ ÿO (1, ÿ1, 1, 1), r˜ ÿO (0, ÿ5, ÿ1, 0), s˜ ÿO (ÿ2, 1, 0, 0). 19 (a) Prove que a matriz
{ÿÿÿ} é inversa a {ÿÿÿ} realizando a multiplicação da matriz
cátion.
(b) Deduza a Eq. (3,53).
20 Em três espaços euclidianos em coordenadas cartesianas, normalmente não distinguimos entre
vetores e formas-um, porque seus componentes se transformam de forma idêntica. Prove isso
em duas etapas. (a) Mostre que
Aÿ¯ = ÿ¯ ÿAÿ
e
ÿ
Pÿ¯ = ÿ¯Pÿ
ÿ¯
são a mesma transformação se a matriz { Tal ÿ} é igual à transposta de sua inversa.
matriz é dita ortogonal. (b) A métrica de tal
espaço tem componentes {ÿij, i, j = 1, ... , 3}. Prove que uma transformação de um sistema de
coordenadas cartesianas para outro deve obedecer
k¯i eu
ÿij = _ ¯j ÿkl
k
e que isso implica { em ¯i } é uma matriz ortogonal. Veja Ex. 32 para o análogo deste
SR.
21 (a) Seja uma região do plano t ÿ x limitada pelas linhas t = 0, t = 1, x = 0, x = 1.
Dentro do plano t ÿ x , encontre as formas unitárias normais para fora e seus vetores
associados para cada uma das linhas de fronteira. (b) Seja outra região limitada pelas
linhas retas que unem os eventos cujas coordenadas são (1, 0), (1, 1) e (2, 1). Encontre uma
normal externa para o limite nulo e encontre seu vetor associado.
22 Suponha que, em vez de definir vetores primeiro, tivéssemos começado definindo formas
únicas, auxiliadas por figuras como a Fig. 3.4. Então poderíamos ter introduzido vetores como
funções lineares de valor real de uma forma, e definido a álgebra vetorial pelos análogos das
Eqs. (3.6a) e (3.6b) (ou seja, trocando setas por tils). Prove que, assim definidos, os vetores
formam um espaço vetorial. Este é outro exemplo da dualidade entre vetores e formas únicas.
Machine Translated by Google
81 3.10 Exercícios
M
23 (a) Prove que o conjunto de todosNos tensores para M,N fixos forma um espaço vetorial. (Você
deve definir a adição de tais tensores e sua multiplicação por números.) (b) Prove que uma
base para este espaço é o conjunto
M vetores N -formas
(Você terá que definir o produto externo de mais de duas formas.) tensor
2
24 (a) Dados os componentes de um 0
Mÿÿ como a matriz
01 00
ÿ 1 ÿ102 ÿ
ÿ ÿ
,
ÿ
20 01 ÿ
ÿ 1 0 ÿ2 0 ÿ
achar:
ÿÿ = ÿÿÿ . ÿ
2 0
25 Mostre que se A é um
0
tensor e B a 2 tensor, então
AÿÿBÿÿ
U ÿ (1 + t 2, t 2, ÿ2 t, 0),
D ÿ (x, 5 tx, ÿ2 t, 0),
Machine Translated by Google
(e) Mostre que UÿUÿ,ÿ = 0 para todo ÿ. Mostre que UÿUÿ,ÿ = 0 para todo ÿ.
(f) Encontre Dÿ,ÿ.
(g) Encontre (UÿDÿ),ÿ para todo ÿ.
(h) Encontre Uÿ(UÿDÿ),ÿ e compare com (f) acima. Por que as duas respostas são semelhantes?
(i) Encontre ÿ,ÿ para todo ÿ. Encontre ÿ,ÿ para todo ÿ. (Lembre-se que ÿ,ÿ := ÿÿÿÿ,ÿ.) Quais são as
números {ÿ,ÿ} os componentes de?
(j) Encontre ÿU ÿ, ÿU D , ÿD ÿ, ÿD U .
31 Considere uma unidade temporal U de quatro vetores, e o tensor P cujos componentes são
dado por
é
(i) ortogonal a U e ,
(b) Mostre que para um vetor não nulo arbitrário q , o tensor que projeta ortogonalmente
para ele tem componentes
Como isso falha para vetores nulos? Como isso se relaciona com a definição de P?
(c) Mostre que P definido acima é o tensor métrico para vetores perpendiculares a U :
T
(¯f) = ( ) (f)( ),
83 3.10 Exercícios
(b) Como nossa definição de um referencial de Lorentz nos levou a deduzir que o tensor métrico tem
componentes ÿÿÿ, isso deve ser verdade em todos os referenciais de Lorentz. Somos assim
levados a uma definição mais geral de uma transformação de Lorentz como aquela cuja matriz ÿÿ¯ satisfaz
ÿ
ÿ¯ÿÿÿ . (3,71)
ÿÿ¯ÿ¯ = ÿÿ¯
Prove que a matriz para um impulso de velocidade ÿ ex satisfaz isso, de modo que esta nova
definição inclui nossa mais antiga.
(c) Suponha ( ) e (L) são duas matrizes que satisfazem a Eq. (3.71), ou seja, (ÿ) = (ÿ)( ) e
() T similarmente para (L). Prove que ( )(L) também é a matriz de um Lorentz
transformação.
33 O resultado do Exer. 32c estabelece que as transformações de Lorentz formam um grupo, representado
pela multiplicação de suas matrizes. Isso é chamado de grupo de Lorentz, denotado por L(4) ou 0(1,3).
(a) Encontre as matrizes do elemento identidade do grupo de Lorentz e do elemento inverso àquele cuja
matriz está implícita na Eq. (1.12). (b) Prove que o determinante de qualquer matriz representando uma
transformação de Lorentz
é ±1.
(c) Prove que os elementos cujas matrizes têm determinante +1 formam um subgrupo,
enquanto aqueles com -1 não.
(d) O grupo ortogonal tridimensional O(3) é o grupo análogo para a métrica do espaço euclidiano
tridimensional. Em Exer. 20b, vimos que ela era representada pelas matrizes ortogonais. Mostre
que as matrizes ortogonais formam um grupo, e então mostre que 0(3) é (isomórfico a) um
subgrupo de L(4).
34 Considere as coordenadas u = t ÿ x, v = t + x no espaço de Minkowski.
(a) Defina eu como o vetor que conecta os eventos com coordenadas {u = 1, v = 0, y = 0,z = 0} e {u = 0,
v = 0, y = 0,z = 0}, e analogamente para eÿ .
Mostre que eu = ( et ÿ ex)/2, ev = ( et + ex)/2, e desenhe eu e ev em um diagrama de espaço-
tempo do plano t ÿ x . (b) Mostre que { eu, ev, ey, ez} são uma base para vetores no espaço de
Minkowski. (c) Encontre os componentes do tensor métrico nesta base. (d) Mostre que eu e ev são
nulos e não ortogonais. (Eles são chamados de base nula para
o plano t ÿ x .) (e)
Calcule as quatro formas um d˜u, d˜v, g( eu, ), g( ev, ) em termos de d˜t e d˜x.
Machine Translated by Google
4.1 Fluidos
No entanto, essas propriedades podem variar de ponto a ponto no lago: a pressão é maior no
fundo do que no topo, e a temperatura também pode variar. A atmosfera, outro fluido, tem uma
densidade que varia com a posição. Isso levanta a questão de quão grande é a média de uma
coleção de partículas: ela deve ser claramente grande o suficiente para que as partículas individuais
não importem, mas deve ser pequena o suficiente para que seja relativamente homogênea: a
velocidade média, energia cinética , e o espaçamento entre partículas deve ser o mesmo em toda a
coleção. Tal coleção é chamada de 'elemento'. Este é um termo um tanto impreciso, mas útil para
uma grande coleção de partículas que podem ser consideradas como tendo um único valor para
quantidades como densidade, velocidade média e temperatura. Se tal coleção não existir (por
exemplo, um gás muito rarefeito), então a aproximação do continuum se desfaz.
Um fluido perfeito é definido como aquele em que todas as forças antiderrapantes são zero, e a única força
entre elementos fluidos vizinhos é a pressão. Veremos em breve como tornar isso matematicamente preciso.
Apresentaremos a descrição relativista de um fluido com a mais simples: 'poeira' é definida como uma
coleção de partículas, todas em repouso em algum referencial de Lorentz.
Não está muito claro como esse uso do termo 'poeira' evoluiu do outro significado como aquela substância
que está em repouso no peitoril da janela, mas tornou-se um uso padrão na relatividade.
A densidade numérica n
A pergunta mais simples que podemos fazer sobre essas partículas é: quantas existem por unidade de
volume? Em seu quadro de repouso, este é apenas um exercício de contar as partículas e dividir pelo
volume que elas ocupam. Ao fazer isso em muitas regiões pequenas, poderíamos obter números diferentes
em pontos diferentes, já que as partículas podem estar distribuídas mais densamente em uma área do que
em outra. Definimos essa densidade numérica como n:
Qual é a densidade numérica em um referencial O* no qual as partículas não estão em repouso? Todos
terão a mesma velocidade v em O¯. Se olharmos para as mesmas partículas que contamos no quadro de
repouso, então há claramente o mesmo número de partículas, mas elas não ocupam o mesmo volume.
Suponha que eles estivessem originalmente em um sólido retangular de dimensão xy z. A contração de
Lorentz reduzirá isso para xyz ÿ(1 ÿ v2), uma vez que comprimentos na direção do movimento se
contraem, mas comprimentos perpendiculares não (Fig. 4.1). Por causa disso, o número de partículas por
unidade de volume é [ÿ(1 ÿ v2)]ÿ1 vezes o que era no
quadro de descanso:
Quando as partículas se movem, outra questão de interesse é: 'quantas' delas estão se movendo em uma
determinada direção? Isso é feito com precisão pela definição de fluxo: o fluxo de partículas através de uma
superfície é o número que atravessa uma unidade de área dessa superfície em uma unidade de tempo. Isso
depende claramente do referencial inercial ('área' e 'tempo' são conceitos dependentes do referencial) e da
orientação da superfície (uma superfície paralela à velocidade das partículas
Machine Translated by Google
ÿz
z z ÿz
ÿx
ÿx
ÿy ÿy
y y
Em MCRF dentro
x x
Figura 4.1 A contração de Lorentz faz com que a densidade das partículas dependa do quadro em que está
medido.
ÿÿt
ÿA = ÿy ÿz
não será atravessado por nenhum deles). No quadro de repouso da poeira o fluxo é zero, pois todas as partículas
estão em repouso. No referencial O, suponha que todas as partículas se movam com velocidade v na direção x, e
vamos, por simplicidade, considerar uma superfície S perpendicular a x (Fig. 4.2). O volume retangular delineado
por uma linha tracejada contém claramente todas e apenas aquelas partículas que cruzarão a área A de S no
tempo ¯t. Ele tem volume v ¯t A, e contém partículas [n/ ÿ(1 ÿ v2)]v ¯t A , pois neste quadro a densidade numérica é
n/ ÿ(1 ÿ v2).
O número que cruza por unidade de tempo e por unidade de área é o fluxo através das superfícies de constante x¯:
nv
(fluxo)x¯ = .
ÿ(1 ÿ v2)
Suponha, de forma mais geral, que as partículas também tenham uma componente y da velocidade em O.
Então a linha tracejada na Fig. 4.3 inclui todas e somente aquelas partículas que cruzam A em S em
Machine Translated by Google
ÿA = ÿy ÿz
x
ÿx ÿt
Figura 4.3 A situação geral do fluxo: apenas a componente x da velocidade transporta partículas através de um
superfície de x constante .
o tempo ¯t. Este é um 'paralelepípedo', cujo volume é a área de sua base vezes sua altura.
Mas sua altura – sua extensão na direção x – é apenas vx¯ ¯t . Portanto obtemos
nvx¯
(fluxo)x¯ . (4.3)
= ÿ(1 ÿ v2)
N = nU , (4.4)
Assim, n é um escalar. Da mesma forma que 'massa de repouso' é um escalar, embora a energia e a
'massa inercial' sejam dependentes do referencial, aqui temos que n é um escalar, a 'densidade de
repouso', embora a densidade numérica seja dependente do referencial. Sempre definiremos n como
um número escalar igual à densidade numérica no MCRF. Faremos definições semelhantes para
pressão, temperatura e outras grandezas características do fluido. Estes serão discutidos mais tarde.
Podemos completar a discussão acima sobre a unidade de densidade numérica e fluxo percebendo
que a densidade numérica pode ser considerada como um fluxo temporal. Para ver isso, vamos olhar
novamente para o fluxo através das superfícies x , desta vez em um diagrama de espaço -tempo, no
qual traçamos apenas ¯t e x¯ (Fig. 4.4). A superfície S perpendicular a x tem a linha do mundo mostrada.
A qualquer momento ¯t é apenas um ponto, pois estamos suprimindo tanto y¯ quanto z¯. As linhas de
mundo dessas partículas que passam por S no tempo ¯t também são mostradas. O fluxo é o número de
linhas do mundo que cruzam S no intervalo ¯t = 1. Realmente, como é uma superfície bidimensional,
seu 'caminho do mundo' é tridimensional, do qual desenhamos apenas uma seção. O fluxo é o número
de linhas do mundo que cruzam uma unidade de 'volume' desta três superfícies: por volume, é claro
Machine Translated by Google
ÿt
Partículas x
Partículas
x
ÿx
¯
Figura 4.5 t=
Densidade numérica como um fluxo através de superfícies const.
significa um cubo de lado unitário , ¯t = 1 , y¯ = 1, z¯ = 1. Assim, podemos definir um fluxo como o número de
linhas mundiais que cruzam uma unidade de três volumes. Não há razão para não podermos agora definir
esses três volumes como um volume espacial ordinário x¯ = 1, y¯ = 1, z¯ = 1, tomado em algum tempo
particular ¯t. Isso é mostrado na Fig. 4.5. Agora o fluxo é o número que cruza no intervalo x¯ = 1 (já que y¯ e
z¯ são suprimidos). Mas este é apenas o número 'contido' na unidade de volume no momento: a densidade
do número. Assim, o fluxo 'timelike' é a densidade numérica.
A maneira como descrevemos as superfícies acima foi um pouco desajeitada. Para empurrar ainda mais
nossa imagem invariável, precisamos de uma representação matemática um pouco mais satisfatória da superfície
Machine Translated by Google
que essas linhas do mundo estão se cruzando. Esta representação é dada por uma forma. Em geral, um
superfície é definida como a solução de alguma equação
O gradiente da função ÿ, d˜ÿ, é uma forma normal. Em certo sentido, d˜ÿ define o
superfície ÿ = const., uma vez que determina exclusivamente as direções normais a essa superfície.
No entanto, qualquer múltiplo de d˜ÿ também define a mesma superfície, então é costume usar o
unidade-normal de uma forma quando a superfície não é nula:
n˜ := d˜ ÿ/|d˜ÿ|, (4.7)
Onde
|d˜ ÿ| é a magnitude de d˜ ÿ :
(Não confunda n˜ com n, a densidade numérica no MCRF: eles são completamente diferentes,
dado, por acidente histórico, a mesma carta.)
Como no cálculo vetorial tridimensional (por exemplo, lei de Gauss), definimos o 'elemento de superfície'
como a unidade normal vezes um elemento de área na superfície. Neste caso, um elemento de volume
em um espaço de três cujas coordenadas são xÿ, xÿ e xÿ (para alguns valores particulares de ÿ, ÿ,
e ÿ , todos distintos) podem ser representados por
e uma unidade de volume (dxÿ = dxÿ = dxÿ = 1) é apenas n˜. (Esses dxs são os infinitesimais que
integramos sobre, não os gradientes.)
O fluxo na superfície
Lembre-se da lei de Gauss em três dimensões que o fluxo através de uma superfície de, digamos, o
campo é apenas E · n, o produto escalar de E com a unidade normal. A situação aqui é exatamente
o mesmo: o fluxo (de partículas) através de uma superfície de constante ÿ é ˜n, N . Para ver isso, seja ÿ
seja uma coordenada, digamos x¯. Então uma superfície de constante x¯ tem d˜x¯ normal, que é uma unidade normal
já desde d˜x¯ ÿO¯ (0, 1, 0, 0). Então d˜x¯, N = Nÿ(d˜x¯)ÿ = Nx¯ , que é o que temos
já visto é o fluxo através das superfícies x. Claramente, se tivéssemos escolhido ÿ = ¯t, então teríamos
acabou com N0¯ , a densidade numérica, ou fluxo através de uma superfície de constante ¯t.
Este é um dos primeiros exemplos físicos concretos de nossa definição de um vetor como um
função de uma forma em números reais. Dado o vetor N podemos calcular o fluxo
,
através de uma superfície, encontrando a forma unitária normal para essa superfície e contraindo-a
com N. _ Além disso, expressamos todo o quadro invariavelmente e de uma maneira que
separa a propriedade do sistema de partículas N da propriedade da superfície n˜. Tudo
disso terá muitos paralelos no § 4.4 abaixo.
Machine Translated by Google
Antes de discutir outras propriedades dos fluidos, devemos mencionar um fato útil. Um referencial inercial,
que até agora foi definido por sua quatro velocidades, pode ser definido também por uma forma, a saber,
aquela associada à sua quatro velocidades g(U , ). Este tem componentes
Uÿ = ÿÿÿ Uÿ
U0 = ÿ1, Ui = 0.
Isto é claramente também igual a ÿd˜¯t (já que seus componentes são iguais). Assim, poderíamos igualmente
definir um quadro dando d˜t. Isso tem uma boa imagem: d˜t deve ser representado como um conjunto de
superfícies de t constante, as superfícies de simultaneidade. Estes definem claramente o quadro, até rotações
espaciais, que geralmente ignoramos. De fato, em certo sentido, d˜t é uma maneira mais natural de definir o
quadro do que U . Por exemplo, a energia de uma partícula cujo momento de quatro
épé
E = ÿp · U .
Até agora, discutimos apenas quantas partículas de poeira existem. Mas eles também têm energia e momento,
e sua energia e momento são a fonte do campo gravitacional em GR. Portanto, devemos agora perguntar
como representá-los de maneira invariante de quadro. Vamos supor por simplicidade que todas as partículas
de poeira têm a mesma massa de repouso m.
Densidade de energia
ÿ = nm (poeira). (4.12)
Em fluidos mais gerais, onde há movimento aleatório de partículas e, portanto, energia cinética de movimento,
mesmo em um referencial de repouso médio, a Eq. (4.12) não será válido.
Machine Translated by Google
No referencial O¯ temos novamente que a densidade numérica é n/ ÿ(1 ÿ v2), mas agora a energia de cada
partícula é m/ ÿ(1 ÿ v2), pois ela está se movendo. Portanto, a densidade de energia é mn/ ÿ(1 ÿ v2):
=
0¯ Esta transformação envolve dois fatores de (1 ÿ v2) ÿ1/2 0, porque tanto o volume quanto a energia se
transformam. É impossível, portanto, representar a densidade de energia como algum componente de um
2
vetor. É, de fato, um componente de um tensor. Isso é mais facilmente
0
visto
definição dedo pontoDefinir
tensor. de vista de nossa
energia requer
uma forma única, a fim de selecionar o componente zero do quatro vetores de energia e momento; definir uma
densidade também requer uma forma única, uma vez que a densidade é um fluxo através de uma superfície
de tempo constante.
Da mesma forma, um fluxo de energia também requer duas formas: uma para definir 'energia' e a outra para
definir a superfície. Também podemos falar de densidade de momento: novamente uma forma única define
qual componente do momento, e outra forma define a densidade. Por analogia, há também fluxo de momento:
a taxa na qual o momento atravessa alguma superfície. Todas essas coisas requerem duas formas únicas.
Portanto, existe um tensor T, chamado tensor de tensão-energia, que tem todos esses números como valores
quando fornecidos com as formas apropriadas como argumentos.
Tensor de tensão-energia
A definição mais conveniente do tensor tensão-energia é em termos de seus componentes em algum quadro
(arbitrário):
(Por momento ÿ queremos dizer, é claro, o componente ÿ de quatro momentos: pÿ := d˜xÿ, p .) Que este é
realmente um tensor é provado em Exer. 5, § 4.10.
Vejamos como essa definição se encaixa com nossa discussão acima. Considere T00. Isto é definido como
o fluxo de momento zero (energia) através de uma superfície t = constante. Esta é apenas a densidade de
energia:
Então Ti0 é o fluxo de i momento através de uma superfície t = const: a densidade de i momento, Ti0 = i
(T00)MCRF = ÿ = mn,
É fácil ver que o tensor p ÿ N tem exatamente essas componentes no MCRF, onde p = mU é o
quadrimomento de uma partícula. Portanto temos
Poeira : T = p ÿ N = mn U ÿ U = ÿ U ÿ U . (4.19)
Tÿÿ = T(ÿ˜ ÿ, ÿ˜ ÿ) =
ÿUÿUÿ. (4.20)
1 vx
Uÿ , , ... ,
ÿ(1 ÿ v2) ÿ(1 ÿ v2)
temos portanto
Estes são exatamente o que calcularíamos, a partir dos primeiros princípios, para densidade de
energia, fluxo de energia, densidade de momento e fluxo de momento, respectivamente. (Fizemos o
cálculo para densidade de energia acima.) Observe um ponto importante: Tÿÿ = Tÿÿ; isto é, T é simétrica.
Isso será verdade em geral, não apenas para a poeira.
Até agora, lidamos com a coleção de partículas mais simples possível. Para generalizar isso para
fluidos reais, temos que levar em conta os fatos de que (i) além dos movimentos de massa do fluido,
cada partícula tem alguma velocidade aleatória; e (ii) pode haver várias forças entre as partículas que
contribuem com energias potenciais para o total.
Machine Translated by Google
você
Quatro velocidades do fluido Quatro velocidades de MCRF
elemento
n Densidade numérica Número de partículas por unidade de volume em MCRF
N Vetor de fluxo N := nU
O conceito de elemento fluido foi discutido no § 4.1. Para cada elemento fluido, vamos para
o referencial em que está em repouso (seu momento espacial total é zero). Este é o seu MCRF. este
O quadro é verdadeiramente comovente momentaneamente : uma vez que os elementos fluidos podem ser acelerados, um momento
mais tarde um quadro inercial diferente será o MCRF. Além disso, dois elementos fluidos diferentes
podem estar se movendo um em relação ao outro, de modo que não tenham os mesmos MCRFs.
Assim, o MCRF é específico para um único elemento de fluido, e qual frame é o MCRF é
função da posição e do tempo. Todas as grandezas escalares associadas a um elemento de fluido em
relatividade (como densidade numérica, densidade de energia e temperatura) são definidas como
valores no MCRF. Assim fazemos as definições apresentadas na Tabela 4.1. Nós confinamos nossos
atenção aos fluidos que consistem em apenas um componente, um tipo de partícula, de modo que (por
exemplo) fluxos interpenetrantes não são possíveis.
Esta lei é simplesmente uma declaração de conservação de energia. No MCRF, imaginamos que
o elemento fluido é capaz de trocar energia com seu entorno de apenas duas maneiras:
condução de calor (absorção de uma quantidade de calor Q) e por trabalho (realização de uma quantidade de trabalho
p V, onde V é o três volumes do elemento). Se deixarmos E ser a energia total do
Machine Translated by Google
elemento, então como Q é a energia ganha e p V é a energia perdida, podemos escrever (assumindo
pequenas mudanças)
E = Q ÿ p V, ÿ
ou (4.22)
ÿ
Q = E + p V. ÿ
Agora, se o elemento contiver um total de N partículas, e se esse número não mudar (ou seja,
nenhuma criação ou destruição de partículas), podemos escrever
N N
V= , V=ÿ n. (4.23)
n n2
E = ÿV = ÿN/n,
E = ÿ V + V ÿ.
ÿ+p
nq = ÿ ÿ n. (4.24)
n
Agora suponha que as mudanças sejam 'infinitesimais'. Pode-se mostrar, em geral, que um fluido
o estado pode ser dado por dois parâmetros: por exemplo, ÿ e T ou ÿ e n. Todo o resto é
uma função de, digamos, ÿ e n. Isso significa que o lado direito da Eq. (4.24),
dÿ ÿ (ÿ + p)dn/ n,
depende apenas de ÿ e n. A teoria geral das equações diferenciais de primeira ordem mostra
que esta sempre possui um fator de integração: isto é, existem duas funções A e B,
funções apenas de ÿ e n, tais que
dÿ ÿ (ÿ + p)dn/ n ÿ A dB
q = T S. (4.26)
mento mostraria que T é a coisa normalmente significada por temperatura, e que S é a coisa
Machine Translated by Google
usado na segunda lei da termodinâmica, que diz que a entropia total em qualquer sistema deve
aumentar. Não teremos nada a dizer sobre a segunda lei. A entropia aparece aqui apenas porque é uma
integral da primeira lei, que é meramente conservação de energia. Em particular, usaremos ambas as
Eqs. (4.25) e (4.26) mais tarde.
A definição de Tÿÿ na Eq. (4.14) é perfeitamente geral. Vamos olhar para isso em particular no MCRF,
onde não há fluxo de massa do elemento fluido e nenhum momento espacial nas partículas. Então no
MCRF temos:
Os componentes espaciais de T, T ij
Por definição, Tij é o fluxo do momento i através da superfície j . Considere (Fig. 4.6) dois elementos
fluidos adjacentes, representados como cubos, tendo a interface comum S. Em geral, eles exercem
forças um sobre o outro. Mostrado no diagrama é a força F exercida por A em B (B naturalmente exerce
uma força igual e oposta em A). Como a força é igual à taxa de variação do momento (pela lei de Newton,
que é válida aqui, já que estamos no MCRF onde
UMA B
z F
Figura 4.6 A força F exercida pelo elemento A sobre seu vizinho B pode ser em qualquer direção
dependendo das propriedades do meio e de quaisquer forças externas.
Machine Translated by Google
velocidades são zero), A está despejando momento em B à taxa F por unidade de tempo. É claro que B
pode ou não adquirir uma nova velocidade como resultado desse novo momento que adquire; isso depende
de quanto momento é colocado em B por seus outros vizinhos. Obviamente , o movimento de B é a
resultante de todas as forças. No entanto, cada força adiciona momento a B.
Há, portanto, um fluxo de momento através de S de A para B à taxa F. Se S tem área A, então o fluxo de
, então
momento através de S é F/A. Se S é uma superfície de fluido xj constante , o elemento A é Fi / A. Tij para
Esta é uma breve ilustração do significado de Tij: representa forças entre elementos fluidos adjacentes.
Como mencionado anteriormente, essas forças não precisam ser perpendiculares às superfícies entre os
elementos (ou seja, viscosidade ou outros tipos de rigidez fornecem forças paralelas à interface). Mas se
as forças forem perpendiculares às interfaces, então Tij será zero a menos que i = j. (Pense nisso – vamos
usá-lo em breve.)
Agora provamos que T é um tensor simétrico. Precisamos apenas provar que seus componentes são
simétricos em um quadro; isso implica que para qualquer r˜, q˜, T(r˜, q˜) = T(q˜,r˜), o que implica a simetria
de seus componentes em qualquer outro referencial. O quadro mais fácil é o MCRF.
(a) Simetria de Tij. Considere a Fig. 4.7 , na qual desenhamos um elemento fluido como um cubo de lado
l. A força que exerce em um vizinho através da superfície (1) (uma superfície x = const.) é Fi = Tixl 2, onde
o fator l 2
1 dá a área do rosto. Aqui, i percorre 1, 2 e 3, pois F não é
necessariamente perpendicular à superfície. Da mesma forma, a força que ele exerce em um vizinho em
(2) é Fi = Tiyl 2. (Vamos
2 também
tomar
exerce
o limite
umal ÿforça
0, então
em seu
tenha
vizinho
em mente
em direção
que o aelemento
direção -x
é pequeno.)
, que chamamos
O elemento
de
Fi Da mesma forma, existe Fi
3. 4 na face olhando na direção negativa de y . As forças sobre ÿFi etc. O
o elemento fluido são, respectivamente, ÿFi 1, primeiro
2,
ponto é que Fi ÿ ÿFi em ordem
3 1
que a soma das forças sobre o elemento deve desaparecer quando l ÿ 0 (caso contrário, a pequena massa
obtida como l ÿ 0 teria uma aceleração infinita). O próximo ponto é calcular
eu
eu
eu
4
z
2
1
torques em torno do eixo z através do centro do elemento de fluido. (Como as forças na parte
superior e inferior do cubo não contribuem para isso, não as consideramos.) Para o cálculo do
torque, é conveniente colocar a origem das coordenadas no centro do cubo. O lTyxl 2, onde
z ÿ1
= 0,
= ÿxFy
F1) força atuando no centro da face, onde r ÿ (l/2, 1 0)aproximamos
(observe particularmente
2 o torque devido
que ay ÿF1
= 0 lé3Tyx.
ÿ(r ×
O torque devido a ÿF2 é ÿ(r × lá). O torque devido a ÿF3 é o mesmo, lTxyl 2. Da mesma forma, o
ÿ1
Portanto, F2) 2 torque devido a ÿF4 é o mesmo, l 3Txy.
z
= +yFx 2 = 12 12
o torque total é
I = ÿÿl 5,
onde ÿ é alguma constante numérica e ÿ é a densidade (se da energia total ou da massa de repouso
não importa neste argumento). Portanto, a aceleração angular é
ÿ Txy - Tyx
ÿ¨ = = . (4,28)
2
EU
ÿÿl
Como ÿ é um número e ÿ é independente do tamanho do elemento, assim como Txy e Tyx, isso irá
para infinito quando l ÿ 0 a menos que
Txy = Tyx.
Assim, como obviamente não é verdade que os elementos fluidos estão girando dentro de fluidos,
os menores girando cada vez mais rápido, temos que as tensões são sempre simétricas:
Tj = Tj. (4,29)
Como não usamos nenhuma propriedade da substância, isso vale tanto para os sólidos quanto
para os fluidos. É verdade tanto na teoria newtoniana quanto na relatividade; na teoria newtoniana
2
Tij são os componentes de um tensor tridimensional
0 qualquer
chamado
engenheiro
tensor de
de tensão.
materiais;
É familiar
e contribui
paracom
seu nome para sua generalização relativista T.
(b) Igualdade de densidade de momento e fluxo de energia. Isso é muito mais fácil de demonstrar.
O fluxo de energia é a densidade da energia vezes a velocidade com que ela flui. Mas como a energia e a
massa são a mesma coisa, essa é a densidade da massa vezes a velocidade com que ela está se movendo;
em outras palavras, a densidade do momento. Portanto T0i = Ti0.
Conservação da energia-momento
Como T representa o conteúdo de energia e momento do fluido, deve haver alguma maneira de
usá-lo para expressar a lei de conservação de energia e momento. Na verdade, é razoavelmente
fácil. Na Fig. 4.8 vemos um elemento de fluido cúbico, visto apenas em seção transversal (direção
z suprimida). A energia pode fluir por todos os lados. A taxa de fluxo através da face (4) é l 2T0x(x
= 0), e através de (2) é ÿl 2T0x(x = a); o segundo termo tem um sinal negativo, pois T0x representa
a energia fluindo na direção positiva x , que está fora do volume através
Machine Translated by Google
eu
4 2
eu
x
rosto (2). Da mesma forma, a energia que flui na direção y é l 2T0y(y = 0) ÿ l 2T0y(y = l). A soma dessas
taxas deve ser a taxa de aumento da energia interna, ÿ(T00l 3)/ÿt (declaração de conservação de energia).
Portanto temos
3
Dividindo por l e tomando o limite l ÿ 0 dá
ÿ ÿ ÿ ÿ
T00 = ÿ T0x - T0y - T0z . (4.31)
ÿt ÿx ÿy ÿz
T0x(x = 0) ÿ T0x(x = l) ÿ
lim ÿÿ T0x (4.32)
lÿ0 eu ÿx .!
ou
T0ÿ ,ÿ = 0. (4.33)
Tÿÿ,ÿ = 0. (4,34)
Isso se aplica a qualquer material em SR. Observe que é apenas uma divergência de quatro dimensões.
Sua relação com o teorema de Gauss, que dá uma forma integral da lei de conservação, será discutida
mais adiante.
Machine Translated by Google
Conservação de partículas
Também pode acontecer que, durante qualquer fluxo do fluido, o número de partículas em um elemento fluido
mude, mas é claro que o número total de partículas no fluido não mudará.
Em particular, na Fig. 4.8 , a taxa de variação do número de partículas em um elemento fluido será devido
apenas à perda ou ganho através dos limites, ou seja, aos fluxos líquidos para fora ou para dentro. Esta lei de
conservação é derivável da mesma forma que Eq. (4,34) foi. Podemos então escrever que
ÿÿÿÿ
N0 = ÿ Nx - Nova - Nz
ÿt ÿx ÿy ÿz
ou
Vamos nos limitar a discutir apenas os fluidos que obedecem a essa lei de conservação. Isso dificilmente é
uma restrição, uma vez que n pode, se necessário, sempre ser considerado a densidade de bárions.
'Baryon', para aqueles que não estão familiarizados com a física de altas energias, é um nome geral aplicado
às partículas mais massivas da física. Os dois mais comuns são o nêutron e o próton.
Todos os outros são muito instáveis para serem importantes na física cotidiana – mas quando decaem formam
prótons e nêutrons, conservando assim o número total de bárions sem conservar a massa de repouso ou a
identidade das partículas. Embora a física teórica sugira que os bárions nem sempre podem ser conservados -
por exemplo, as chamadas 'grandes teorias unificadas' das interações fortes, fracas e eletromagnéticas podem
prever um tempo de vida finito para o próton e colapsar e subsequente evaporação de um preto buraco (veja
cap. 11) não conservará o número bariônico – nenhum fenômeno desse tipo foi ainda observado e, em qualquer
caso, é improvável que seja importante na maioria das situações.
Finalmente, chegamos ao tipo de fluido que é nosso principal assunto de interesse. Um fluido perfeito na
relatividade é definido como um fluido que não tem viscosidade e não tem condução de calor no MCRF. É uma
generalização do 'gás ideal' da termodinâmica comum. É, ao lado da poeira, o tipo de fluido mais simples de se
lidar. As duas restrições em sua definição simplificam enormemente o tensor tensão-energia, como veremos
agora.
Da definição de T, vemos que isso implica imediatamente que, no MCRF, T0i = Ti0 = 0. A energia só pode fluir
se as partículas fluírem. Lembre-se de que em nossa discussão da primeira lei da termodinâmica mostramos
que se o número de partículas fosse conservado, então
Machine Translated by Google
a entropia específica foi relacionada ao fluxo de calor pela Eq. (4.26). Isso significa que em um fluido
perfeito, se a Eq. (4.35) para a conservação das partículas for obedecida, então devemos ter também que
S é uma constante no tempo durante o escoamento do fluido. Veremos como isso resulta das leis de
conservação em um momento.
Sem viscosidade
A viscosidade é uma força paralela à interface entre as partículas. Sua ausência significa que as forças
devem ser sempre perpendiculares à interface, ou seja, que Tij deve ser zero a menos que i = j. Isso
significa que Tij deve ser uma matriz diagonal. Além disso, deve ser diagonal em todos os quadros MCRF,
uma vez que 'sem viscosidade' é uma afirmação independente dos eixos espaciais. A única diagonal da
matriz em todos os quadros é um múltiplo da identidade: todos os seus termos diagonais são iguais.
Assim, uma superfície x terá através dela apenas uma força na direção x , e similarmente para y e z; essas
forças por unidade de área são todas iguais e são chamadas de pressão, p. Então temos Tij = pÿij. De seis
quantidades possíveis (o número de elementos independentes na matriz simétrica 3 × 3 Tij) , a suposição
de viscosidade zero reduziu o número de funções para uma, a pressão.
Forma de T
ÿ 000 0 p 0 0 0
ÿ ÿ
0 p 0 000 p
(Tÿÿ) =
ÿ
ÿ
ÿ
ÿ
. (4,36)
ÿ ÿ
Uma comparação da Eq. (4.38) com a Eq. (4.19) mostra que 'poeira' é o caso especial de um fluido perfeito
sem pressão. Isso significa que um fluido perfeito pode estar livre de pressão somente se sua
Machine Translated by Google
partículas não têm nenhum movimento aleatório. A pressão surge nas velocidades aleatórias das
partículas. Mesmo um gás tão diluído a ponto de ser virtualmente sem colisões tem pressão. Isso
ocorre porque a pressão é o fluxo do momento; se isso vem de forças ou de partículas que cruzam
uma fronteira é irrelevante.
As leis de conservação
Isso nos dá nossa primeira prática real com cálculo tensorial. Existem quatro equações na Eq. (4.39),
um para cada ÿ. Primeiro, vamos supor também
(nUÿ),ÿ = 0 (4,40)
" (ÿ + p)UÿUÿ# ,ÿ
= $ ÿ + np UÿnUÿ ! ,ÿ
ÿ+p
= nUÿ Uÿ . (4.41)
n
,ÿ
Além disso, ÿÿÿ é uma matriz constante, então ÿÿÿ,ÿ = 0. Isso também implica, a propósito, que
Uÿ ,ÿUÿ = 0. (4,42)
ou
O último passo decorre da simetria de ÿÿÿ, o que significa que Uÿ,ÿUÿ ÿÿÿ = UÿUÿ ,ÿÿÿÿ . Por fim, a
última expressão da Eq. (4.44) converte para
2Uÿ ,ÿUÿ,
que é zero pela Eq. (4.43). Isso prova a Eq. (4.42). Podemos fazer uso da Eq. (4.42) da seguinte
maneira. A equação original agora lê, após o uso da Eq. (4.41),
ÿ+p
nUÿ Uÿ + p,ÿÿÿÿ = 0. (4,45)
n
,ÿ
Das quatro equações aqui, podemos obter uma particularmente útil. Multiplique por Uÿ e some em ÿ.
Isso fornece o componente de tempo da Eq. (4.45) no MCRF:
ÿ+p
nUÿUÿ Uÿ + p,ÿÿÿÿUÿ = 0. (4,46)
n
,ÿ
Machine Translated by Google
p,ÿUÿ,
que sabemos ser a derivada de p ao longo da linha de mundo do elemento fluido, dp/dÿ .
O primeiro termo dá zero quando a derivada ÿ opera em Uÿ (pela Eq. 4.42), então obtemos
(usando Uÿ Uÿ = ÿ1)
ÿ+p
(4,47)
n
Uÿ % -n ,ÿ + p,ÿ & = 0.
ÿ+p
(4,48)
ÿ Uÿ $ ÿ,ÿ ÿ n n,ÿ ! = 0.
= 0. (4,49)
dÿ n dÿ
dS
UÿS,ÿ = = 0. dÿ (4,50)
Assim, o escoamento de um fluido perfeito que conserva partículas conserva a entropia específica.
Isso é chamado de adiabático. Como a entropia é constante em um elemento fluido à medida que
escoa, normalmente não precisaremos considerá-la. No entanto, é importante lembrar que a lei
de conservação de energia em termodinâmica está incorporada no componente das equações de
conservação, Eq. (4.39), paralela a Uÿ.
Os três componentes restantes da Eq. (4.39) são deriváveis da seguinte maneira. Escrevemos,
novamente, a Eq. (4,45):
ÿ+p
nUÿ Uÿ + p,ÿÿÿÿ = 0
n
,ÿ
+ p,ÿÿiÿ = 0. (4,51)
n
,ÿ
ÿ Diminuir o índice i torna isso mais fácil de ler (e não muda nada). Como ÿi obtemos = ÿiÿ _
Aqueles familiarizados com a dinâmica de fluidos não relativística reconhecerão isso como a
generalização de
ÿa + ÿp = 0, (4,55)
Onde
a = vÿ + (v · ÿ)v. (4,56)
A relatividade geral é uma teoria relativista da gravidade. Não fomos capazes de mergulhar nele
imediatamente porque não tínhamos uma compreensão suficientemente boa de tensores, de fluidos
em SR e de espaços curvos. Ainda temos que estudar a curvatura (que vem a seguir), mas neste ponto
podemos olhar para frente e discernir os contornos vagos da teoria que estudaremos.
O primeiro comentário é sobre a suprema importância de T em GR. A teoria de Newton tem como
fonte do campo a densidade ÿ. Isso foi entendido como sendo a densidade de massa e, portanto, está
mais próximo do nosso ÿ0. Mas uma teoria que usa a massa de repouso apenas como sua fonte seria
peculiar do ponto de vista relativista, uma vez que a massa de repouso e a energia são interconversíveis.
De fato, podemos mostrar que tal teoria violaria alguns experimentos de altíssima precisão (a serem
discutidos posteriormente). Assim, a fonte do campo deve ser todas as energias, a densidade da
energia de massa total T00. Mas ter como fonte do campo apenas um componente de um tensor daria
uma teoria da gravidade não invariante: precisaríamos escolher um referencial preferido para calcular
T00. Portanto, Einstein supôs que a fonte do campo deveria ser T: todas as tensões, pressões e
momentos também deveriam atuar como fontes. Combinar isso com sua visão sobre espaços curvos o
levou a GR.
O segundo comentário é sobre a pressão, que desempenha um papel mais fundamental na GR do
que na teoria newtoniana: primeiro, porque é uma fonte do campo; e, segundo, por causa de sua
aparição no termo (ÿ + p) na Eq. (4,54). Considere uma estrela densa, cujo forte campo gravitacional
requer um grande gradiente de pressão. Quão grande é medido pela aceleração que o elemento fluido
teria, ai, na ausência de pressão. Dado o campo, e
Machine Translated by Google
portanto, dado ai, o gradiente de pressão necessário é exatamente aquele que causaria a
aceleração oposta sem gravidade:
p,i
ÿai = ÿ + p .
Isto dá o gradiente de pressão p,i. Como (ÿ + p) é maior que ÿ, o gradiente deve ser maior na
relatividade do que na teoria newtoniana. Além disso, como todos os componentes de T são
fontes do campo gravitacional, essa pressão maior aumenta o campo gravitacional, fazendo com
que pressões ainda maiores (em comparação com as estrelas newtonianas) sejam necessárias
para manter a estrela em pé. Para estrelas onde p ÿ (veja abaixo), isso não faz muita diferença.
Mas quando p se torna comparável a ÿ, descobrimos que aumentar a pressão é autodestrutivo:
nenhum gradiente de pressão manterá a estrela em pé, e o colapso gravitacional deve ocorrer.
Essa descrição, é claro, encobre cálculos muito detalhados, mas mostra que mesmo estudando
fluidos em SR podemos começar a apreciar algumas das mudanças fundamentais que a GR traz
para a gravitação.
Vamos apenas nos lembrar dos tamanhos relativos de p e ÿ. Vimos em Exer. 1, § 1.14, que
p ÿ em situações ordinárias. Na verdade, só obtemos p ÿ ÿ para material muito denso (estrela
de nêutrons) ou material tão quente que as partículas se movem perto da velocidade da luz
(um gás 'relativístico').
4,8 G auss
' lei
Nosso tópico final sobre fluidos é a forma integral das leis de conservação, que são expressas na
forma diferencial nas Eqs. (4.34) e (4.35). Como no cálculo vetorial tridimensional, a conversão de
uma integral de volume de uma divergência em uma integral de superfície é chamada de lei de Gauss.
A prova do teorema é exatamente a mesma que em três dimensões, portanto não a derivaremos
em detalhes:
,ÿ (4,57)
' Vÿ d4x = ( Vÿnÿ d3S ,
3 superfícies t2
4 volumes
x1 t1x2 _
'
para trás no tempo. A normal em x2 é d˜x, e em x1 é ÿd˜x. Portanto, a integral de superfície
na Eq. (4,57) é
(ÿV0) dx dy dz
t2 V0 dx dy dz t1
(ÿVx ) dt dy dz
+'+
x2 'Vx dt dy dz +x1
'
+ termos semelhantes para as outras superfícies na fronteira.
4.9 P ara
A mecânica do contínuo e as leis de conservação são tratadas na maioria dos textos sobre
GR, como Mis ner et al. (1973). Os alunos cuja formação em termodinâmica ou mecânica dos
fluidos é fraca são referidos aos trabalhos clássicos de Fermi (1956) e Landau e Lifshitz (1959)
Machine Translated by Google
respectivamente. Além de Exer. 25, § 4.10 abaixo, não estudamos muito sobre eletromagnetismo, mas tem um
tensor tensão-energia e ilustra as leis de conservação particularmente
claramente. Ver Landau e Lifshitz (1962) ou Jackson (1975). Fluidos relativísticos com dissipação apresentam suas
próprias dificuldades, que recompensam o estudo atento. Ver Israel e Stewart (1980).
Outro modelo para sistemas contínuos é o gás sem colisões; ver Andréasson (2005) para
uma descrição de como tratar tais sistemas em GR.
4.10 Exercícios
11 (a) Mostre que a matriz ÿij permanece inalterada quando transformada por uma rotação do
machados.
(b) Mostre que qualquer matriz que tenha esta propriedade é um múltiplo de ÿij.
12 Deduza a Eq. (4.37) da Eq. (4.36).
13 Forneça o raciocínio da Eq. (4.44).
14 Argumente que a Eq. (4.46) é o componente de tempo da Eq. (4.45) no MCRF.
15 Deduza a Eq. (4.48) da Eq. (4.47).
16 No MCRF, Ui = 0. Por que não podemos assumir Ui = 0?
,ÿ
Machine Translated by Google
onde o operador D/Dt é a derivada de tempo 'total' ou 'advectiva' usual da dinâmica dos fluidos.
18 Aprimore a discussão no final do § 4.6 mostrando que ÿÿp é na verdade a força resultante
por unidade de volume no elemento fluido no MCRF.
19 Mostre que a Eq. (4.58) pode ser usado para provar a lei de Gauss, Eq. (4,57). 20
(a) Mostre que se as partículas não são conservadas, mas são geradas localmente a uma taxa ÿ partículas por
unidade de volume por unidade de tempo no MCRF, então a lei de conservação, Eq. (4.35), torna -se
Nÿ = e.
,ÿ
(b) Generalize (a) para mostrar que se a energia e o momento de um corpo não são conservados (por
exemplo, porque ele interage com outros sistemas), então existe uma força relativística diferente de
zero de quatro vetores Fÿ definida por
Tÿÿ,ÿ = Fÿ.
Seja a densidade de massa de repouso dessas partículas ÿ0, medida em seu referencial comovente.
Assuma uma densidade de partículas suficientemente alta para permitir tratá-las como um continuum.
(c) Dois desses anéis de partículas, um girando no sentido horário e o outro no sentido anti-horário, no
mesmo raio a. As partículas não colidem ou interagem de forma alguma.
22 Muitos sistemas físicos podem ser idealizados como coleções de partículas que não colidem (por exemplo,
radiação de corpo negro, plasmas rarefeitos, galáxias e aglomerados globulares). Assumindo que tal
sistema tem uma distribuição aleatória de velocidades em todos os pontos, sem viés em qualquer direção
no MCRF, prove que o tensor tensão-energia é o de um fluido perfeito. Se todas as partículas têm a mesma
velocidade ÿ e massa m, expresse p e ÿ como funções de m, ÿ e n. Mostre que um gás de fóton tem p =
1
23 Use o sistema identidade Tÿÿ para o qual Tÿÿ = 0 fora de uma região3ÿ.
limitada do espaço):
(uma)
ÿ T0ÿ d3x = 0 (conservação de energia e momento).
ÿt
(b) T00xi xj d3x = 2 Tij d3x (teorema tensor virial).
ÿ2
ÿt2
(c) T00(xi xi) 2 d3x = 4 Ti ixj xj d3x + 8 Tijxixj d3x.
ÿ2 ÿt2
24 As observações astronômicas do brilho dos objetos são medições do fluxo de radiação
T0i do objeto na Terra. Este problema calcula como esse fluxo depende da velocidade
relativa do objeto e da Terra. (a) Mostre que, no referencial de repouso O de uma estrela
de luminosidade constante L (energia total irradiada por segundo), o tensor tensão-energia
da radiação da estrela no evento (t, x, 0, 0) tem componentes T00 = T0x = Tx0 = Txx
= L/(4ÿx2). A estrela fica na origem.
(b) Seja X o vetor nulo que separa os eventos de emissão e recepção da radiação. Mostre
que X ÿO(x, x, 0, 0) para a radiação observada no evento (x, x, 0, 0).
Mostre que o tensor tensão-energia de (a) tem a forma invariante de referencial
eu X)X
T= ,
4ÿ · X )4
( EUA
ÿ
ÿ×Bÿ E = 4ÿJ,
ÿt ÿ ÿ × E +
B = 0, (4,59)
ÿt
ÿ · E = 4ÿÿ,
ÿ · B = 0,
com a matriz
10 0 0
ÿ 0 cos ÿ ÿ sen ÿ 0 ÿ
ÿ = ÿ ÿ
.
ÿ ÿ
0 sen ÿ cos ÿ 0 ÿ
ÿ 00 0 1 ÿ
Machine Translated by Google
Fÿÿ = ÿ
ÿ ÿFÿÿ ,
ÿ
defina novos componentes de três vetores elétricos e magnéticos (pela regra dada em (a))
que são exatamente os mesmos que os componentes dos antigos E e B no espaço de três
rotações. (Isso mostra que uma rotação espacial de F faz uma rotação espacial de E e B.) (c)
Defina o atual quatro vetores J por J0 = ÿ, Ji = (J )
, e mostre que dois
eu
Fÿÿ ,ÿ
= 4ÿJÿ. (4,60)
Observe que existem apenas quatro equações independentes aqui. Ou seja, escolha um
valor de índice, digamos zero. Em seguida, os três outros valores (1, 2, 3) podem ser
atribuídos a ÿ, ÿ, ÿ em qualquer ordem, produzindo a mesma equação (até um sinal geral) a
cada vez. Experimente e veja: segue da antisimetria de Fÿÿ .
(e) Agora expressamos as equações de Maxwell na forma tensorial. Mostre que a conservação
da carga, Jÿ,ÿ = 0 (lembre-se da Eq. similar (4.35) para o vetor número-fluxo N ), está implícita
na Eq. (4.60) acima. (Dica: use antisimetria de Fÿÿ .) (f) A densidade de carga em qualquer
referencial é J0. Portanto, a carga total no espaço-tempo é Q = J0 dx dy dz, onde a integral se
estende por toda uma hipersuperfície t = const. Definindo d˜t = ˜n , uma unidade normal para
esta hipersuperfície, mostre que
(4,62)
Q = ' Jÿnÿ dx dy dz.
(g) Use a lei de Gauss e a Eq. (4.60) para mostrar que a carga total contida dentro de qualquer
duas superfícies fechadas S na hipersuperfície t = const. pode ser determinado fazendo uma
integral sobre o próprio S:
F0i E · n dS,
Q=( S n dS = ( S
onde n é a unidade normal a S na hipersuperfície (não o mesmo que n˜ na parte (f) acima).
(h) Faça uma transformação de Lorentz em Fÿÿ para um referencial O¯ movendo-se com
velocidade ÿ na direção x em relação ao referencial usado em (a) acima. Neste quadro defina um
três vetores E¯ com componentes E¯i = F0¯¯i , e similarmente para B¯ em analogia com (a).
Dessa forma, descubra como E e B se comportam sob uma transformação de Lorentz: eles
se misturam! Assim, E e B em si não são invariantes de Lorentz, mas são apenas
componentes de F, chamados de tensor de Faraday, que é a descrição invariante de campos
eletromagnéticos na relatividade. Se você pensar com cuidado, verá que, em termos físicos,
eles não podem ser invariáveis. Em particular, o campo magnético é criado por cargas em
movimento; mas uma carga movendo-se em um referencial pode estar em repouso em outro,
então um campo magnético que existe em um referencial pode não existir em outro. O que é
igual em todos os quadros é o tensor de Faraday: apenas seus componentes são transformados.
Machine Translated by Google
5 Prefácio à curvatura
Até agora discutimos apenas SR. Na RS, as forças têm desempenhado um papel secundário e nunca
introduzimos a gravitação explicitamente como uma força possível. Um ingrediente do SR é a existência de
referenciais inerciais que preenchem todo o espaço-tempo: todo o espaço-tempo pode ser descrito por um
único referencial, todos cujos pontos coordenados estão sempre em repouso em relação à origem, e todos
cujos relógios funcionam no mesmo instante. mesma taxa em relação ao relógio da origem. Dos postulados
fundamentais fomos levados à ideia do intervalo s2, que dá um significado geométrico invariante a certas
afirmações físicas. Por exemplo, um intervalo de tempo entre dois eventos é o tempo decorrido em um relógio
que passa pelos dois eventos; um intervalo semelhante ao espaço é o comprimento de uma haste que une
dois eventos em um quadro em que eles são simultâneos. A função matemática que calcula o intervalo é a
métrica, e assim a métrica de SR é definida fisicamente por comprimentos de hastes e leituras de relógios.
Este é o poder de SR e uma razão para a elegância e compacidade da notação tensorial nele (por exemplo, a
substituição de 'densidade numérica' e 'fluxo' por N ).
Em um pedaço de papel no qual foram plotados todos os eventos e linhas mundiais de interesse em algum
sistema de coordenadas, sempre seria possível definir qualquer métrica apenas dando seus componentes gÿÿ
como algum conjunto arbitrariamente escolhido de funções das coordenadas.
Mas essa métrica arbitrária seria inútil para fazer cálculos físicos. A utilidade de ÿÿÿ é sua estreita relação com
o experimento, e nossa derivação dele se baseou fortemente nos experimentos.
Essa proximidade com o experimento é, obviamente, um teste. Como ÿÿÿ faz certas previsões sobre hastes
e relógios, podemos pedir sua verificação. Em particular, é possível construir um quadro no qual todos os
relógios funcionem na mesma taxa? Esta é uma questão crucial, e mostraremos que em um campo
gravitacional não uniforme a resposta, experimentalmente, é não.
Nesse sentido, os campos gravitacionais são incompatíveis com a RS global : a capacidade de construir um
referencial inercial global. Veremos que em pequenas regiões do espaço-tempo – regiões suficientemente
pequenas para que as não uniformidades das forças gravitacionais sejam pequenas demais para serem
medidas – sempre podemos construir um referencial SR 'local'. Nesse sentido, teremos que construir RS local
em uma teoria mais geral. O primeiro passo é a prova de que os relógios não funcionam todos na mesma
velocidade em um campo gravitacional.
Machine Translated by Google
Vamos primeiro imaginar realizando um experimento idealizado, sugerido pela primeira vez por Einstein. (eu deixo
uma torre de altura h seja construída na superfície da Terra, como na Fig. 5.1. Comece com um
partícula de massa de repouso m no topo da torre. (ii) A partícula é largada e cai livremente
com aceleração g. Ele atinge o solo com velocidade v = (2gh) 1/2, então sua energia total E,
1
medida por um experimentador no solo, é m + (iii) O 2mv2 + 0(v4) = m + mgh + 0(v4).
experimentador no solo tem algum método mágico de mudar toda essa energia
em um único fóton da mesma energia, que ele direciona para cima. (Esse processo não
violam as leis de conservação, uma vez que a Terra absorve o momento do fóton, mas não sua energia,
assim como faz para uma bola de borracha quicando. O aluno cético em relação à 'mágica' deve mostrar
como o argumento procede se apenas uma fração ÿ da energia é convertida em um fóton.)
(iv) Ao chegar ao topo da torre com energia E , o fóton é novamente magicamente
.
transformado em uma partícula de massa de repouso m = E Deve ser que m = m; caso contrário, perpétuo
movimento poderia resultar do ganho de energia obtido pela operação de tal experimento. Então nós
são levados por nossa aversão à injustiça do movimento perpétuo para prever que E = m ou, por
o fóton,
E hÿ m
= = = 1 ÿ gh + 0(v4). m + (5.1)
E hÿ mgh + 0(v4)
Prevemos que um fóton subindo no campo gravitacional da Terra perderá energia (não
surpreendentemente) e, consequentemente, será desviado para o vermelho.
Embora nosso experimento mental seja idealizado demais para ser prático, é possível medir
o redshift previsto pela Eq. (5.1) diretamente. Isso foi feito pela primeira vez por Pound e Rebka (1960)
e melhorado por Pound e Snider (1965). O experimento usou o efeito Mössbauer para
m
ÿ
Figura 5.1 Uma massa m é lançada de uma torre de altura h. A massa total na parte inferior é convertida em
energia e voltou ao topo como um fóton. O movimento perpétuo será executado a menos que o
fóton perde tanta energia na escalada quanto a massa ganha na queda. A luz é, portanto,
redshift à medida que sobe em um campo gravitacional.
Machine Translated by Google
obter grande precisão na medição da diferença ÿ ÿ ÿ produzida em um fóton subindo uma distância
h = 22,5 m. Eq. (5.1) foi verificado com precisão de aproximadamente 1%.
Com as melhorias na tecnologia entre 1960 e 1990, o redshift gravitacional passou de uma
pequena correção exótica para se tornar um efeito central para a sociedade: o sistema de
navegação GPS incorpora correções vitais para o redshift, sem as quais não permaneceria preciso
por mais de alguns minutos. O sistema usa uma rede de relógios atômicos de alta precisão em
satélites em órbita, e a navegação por um aparato na Terra é realizada pela leitura dos carimbos
de hora nos sinais recebidos de cinco ou mais satélites. Mas, como veremos abaixo, o desvio
gravitacional para o vermelho implica que o próprio tempo corre um pouco mais rápido na altitude
mais alta do que na Terra. Se isso não fosse compensado, o receptor terrestre logo receberia
carimbos de hora errados. A operação bem-sucedida do GPS pode ser considerada uma verificação
muito precisa do redshift. Veja Ashby (2003) para uma discussão completa sobre a relatividade e
o sistema GPS.
Esta verificação experimental do redshift é reconfortante do ponto de vista da conservação de
energia. Mas é o golpe mortal para nossas chances de encontrar uma teoria relativista simples e
especial da gravidade, como mostraremos agora.
Se SR for válido em um campo gravitacional, é uma primeira suposição natural supor que o
referencial 'laboratorial' em repouso na Terra é um referencial de Lorentz. O argumento a seguir,
devido originalmente a Schild (1967), facilmente mostra que essa suposição é falsa. Na Fig. 5.2
desenhamos um diagrama de espaço-tempo neste quadro hipotético, no qual a dimensão espacial
plotada é a vertical. Considere a luz como uma onda e observe duas 'cristas' sucessivas da onda
enquanto elas se movem para cima no experimento Pound-Rebka-Snider. O topo e a base da torre
têm linhas verticais neste diagrama, pois estão em repouso. A luz é mostrada movendo-se em
uma linha ondulada, e é propositalmente desenhada curvada de alguma forma arbitrária. Isso é
para permitir a possibilidade de que a gravidade possa agir sobre a luz de uma maneira desconhecida, desvia
t
ÿtbot _
Segunda crista
Primeira crista
ÿtbot _
Fundo Topo
Figura 5.2 Em um campo gravitacional independente do tempo, duas “cristas” sucessivas de uma onda
eletromagnética devem percorrer caminhos idênticos. Por causa do redshift (Eq. (5.1)) o tempo
entre eles no topo é maior do que no fundo. Um observador no topo, portanto, 'vê' um relógio na
parte inferior funcionando lentamente.
Machine Translated by Google
a partir de um caminho nulo. Mas não importa o quanto a luz seja afetada pela gravidade, o efeito deve ser o mesmo
em ambas as cristas de onda, já que o campo gravitacional não muda de uma hora para outra. Portanto, as
trajetórias das duas cristas são congruentes, e concluímos da hipotética geometria de Minkowski que ttop = tbottom.
Por outro lado, o tempo entre duas cristas é simplesmente o recíproco da frequência medida t = 1/ÿ. Como o
experimento Pound–Rebka–Snider estabelece que ÿbottom > ÿtop, sabemos que ttop > tbottom.
A conclusão da geometria de Minkowski está errada, e o referencial em repouso na Terra não é um referencial de
Lorentz.
É este o fim, então, do SR? Não exatamente. Mostramos que o referencial de Lorentz em repouso na Terra não
é inercial. Não mostramos que não existem referenciais inerciais. Na verdade existem
certos referenciais que são inerciais em sentido restrito, e no próximo parágrafo usaremos outro argumento físico
para encontrá-los.
O princípio da equivalência
Uma propriedade importante de um referencial inercial é que uma partícula em repouso nele permanece em repouso
se nenhuma força atuar sobre ele. Para usar isso, devemos ter uma ideia do que é uma força. Normalmente, a
gravidade é considerada uma força. Mas, como Galileu demonstrou em seu famoso experimento na Torre Inclinada
de Pisa, a gravidade se distingue de todas as outras forças de maneira notável: todos os corpos que recebem a
mesma velocidade inicial seguem a mesma trajetória em um campo gravitacional, independentemente de sua
composição interna. Com todas as outras forças, alguns corpos são afetados e outros não: o eletromagnetismo
afeta as partículas carregadas, mas não as neutras, e a trajetória de uma partícula carregada depende da razão
entre sua carga e sua massa, que não é a mesma para todas as partículas. Da mesma forma, as outras duas forças
básicas da física – as chamadas interações “fortes” e “fracas” – afetam diferentes partículas de maneira diferente.
Com todas essas forças, sempre seria possível definir experimentalmente a trajetória de uma partícula não afetada
pela força, ou seja, uma partícula que permanecesse em repouso em um referencial inercial. Mas, com a gravidade,
isso não funciona. Tentar definir um referencial inercial em repouso na Terra, então, é vazio, uma vez que nenhuma
partícula livre (nem mesmo um fóton) poderia ser um 'marcador' físico para ele.
Mas existe um quadro no qual as partículas mantêm uma velocidade uniforme. Este é um quadro que cai
livremente no campo gravitacional. Como esse referencial acelera na mesma taxa que as partículas livres (pelo
menos as partículas de baixa velocidade às quais a física gravitacional newtoniana se aplica), segue-se que todas
essas partículas manterão uma velocidade uniforme em relação a esse referencial. Este quadro é pelo menos um
candidato a um quadro inercial. Na próxima seção iremos
mostram que os fótons não são desviados para o vermelho neste quadro, o que o torna um candidato ainda melhor.
Einstein construiu GR tomando a hipótese de que esses referenciais são inerciais.
O argumento que acabamos de apresentar, de que os referenciais em queda livre são inerciais, talvez seja mais
familiar ao estudante se for invertido. Considere, em um espaço vazio livre de gravidade, um foguete com aceleração
uniforme. Do ponto de vista de um observador no interior, parece que existe um campo gravitacional no foguete: os
objetos lançados aceleram em direção à traseira do navio, todos com a mesma aceleração, independente de sua
composição interna.1
1 Isso foi testado experimentalmente com precisão extremamente alta no chamado experimento de Eötvös. Ver Dicke
(1964).
Machine Translated by Google
Além disso, um objeto mantido parado em relação ao navio tem 'peso' igual à força necessária para
mantê-lo acelerando com o navio. Assim como na gravidade 'real', essa força é proporcional à massa
do objeto. Um verdadeiro referencial inercial é aquele que cai livremente em direção à parte traseira
do navio, com a mesma aceleração das partículas. A partir disso, pode-se ver que campos
gravitacionais uniformes são equivalentes a referenciais que aceleram uniformemente em relação a
referenciais inerciais. Este é o princípio da equivalência entre gravidade e aceleração, e é uma pedra
angular da teoria de Einstein. Embora Galileu e Newton tivessem usado palavras diferentes para
descrevê-lo, o princípio da equivalência é um dos fundamentos da gravidade newtoniana.
Vamos agora ter um ponto de vista diferente sobre o experimento Pound-Rebka-Snider. Vamos vê-lo
em um referencial em queda livre, o qual vimos ter pelo menos algumas das características de um
referencial inercial. Tomemos o referencial particular que está em repouso quando o fóton inicia sua
jornada ascendente e cai livremente depois disso. Como o fóton percorre uma distância h, leva um
tempo t = h para chegar ao topo. Neste tempo, o pórtico adquiriu velocidade gh para baixo em relação
ao aparato experimental. Assim, a frequência do fóton em relação ao quadro em queda livre pode ser
obtida pela fórmula do redshift
ÿ(queda livre) ÿ = 1 + gh
= 1 + gh + 0(v4). ÿ(1 ÿ (5.2)
(aparelho no topo) g2h2)
Da Eq. (5.1) vemos que se negligenciarmos termos de ordem superior (como fizemos para derivar a
Eq. (5.1)), então obtemos ÿ(fóton emitido na parte inferior) = ÿ(no referencial em queda livre quando o
fóton chega ao topo) . Portanto, não há redshift em um quadro em queda livre. Isso nos dá uma base
sólida para postular que o referencial em queda livre é um referencial inercial.
Machine Translated by Google
A discussão acima sugere que o experimento de redshift gravitacional realmente não torna SR e
gravidade incompatíveis. Talvez simplesmente tenhamos que perceber que o referencial em repouso na
Terra não é inercial e aquele em queda livre – no qual não há redshift e, portanto, a Fig. 5.2 não leva a
nenhuma contradição – é o verdadeiro referencial inercial. Infelizmente, isso não salva completamente
SR, pela simples razão de que os quadros em queda livre em diferentes lados da Terra caem em
direções diferentes: não há um único quadro global que esteja caindo livremente em todos os lugares no
campo gravitacional da Terra e que ainda seja rígido, em que as distâncias entre seus pontos
coordenados são constantes no tempo. Ainda é impossível construir um referencial inercial global e,
portanto, o máximo que podemos salvar é um referencial inercial local , que agora descrevemos.
UMA
B Terra
Figura 5.3 Uma estrutura rígida não pode cair livremente no campo da Terra e ainda permanecer rígida.
Machine Translated by Google
como inercial para uma alta precisão. Seremos mais quantitativos em um capítulo posterior. Por enquanto,
apenas enfatizamos a noção matemática de que qualquer teoria da gravidade deve admitir referenciais inerciais
locais: referenciais que, em um ponto, são referenciais inerciais de SR.
Forças de maré
As não uniformidades nos campos gravitacionais são chamadas de forças de maré, pois são elas que elevam
as marés. (Se a Terra estivesse em um campo gravitacional uniforme, cairia livremente e não teria marés. As
marés aumentam devido à diferença dos campos gravitacionais da Lua e do Sol ao longo do diâmetro da
Terra.) Vimos que essas forças de maré impedem a construção de referenciais inerciais globais. São, portanto,
essas forças que são consideradas a manifestação fundamental da gravidade em GR.
O papel da curvatura
As linhas do mundo de partículas livres têm sido nossa sonda da possibilidade de construir referenciais
inerciais. Em SR, duas dessas linhas de mundo que começam paralelas uma à outra permanecem paralelas,
não importa o quão longe elas sejam estendidas. Esta é exatamente a propriedade que as linhas retas têm na
geometria euclidiana. É natural, portanto, discutir a geometria do espaço-tempo como definida pelas linhas do
mundo de partículas livres. Nesses termos, o espaço de Minkowski é um espaço plano , pois obedece ao
axioma do paralelismo de Euclides. Não é um espaço euclidiano, no entanto, uma vez que sua métrica é
diferente: os fótons viajam em linhas retas do mundo de comprimento próprio zero. Então SR tem uma
geometria plana e não euclidiana.
Agora, em um campo gravitacional não uniforme, as linhas de mundo de duas partículas próximas que
começam paralelas geralmente não permanecem paralelas. O espaço-tempo gravitacional, portanto, não é plano.
Na geometria euclidiana, quando abandonamos o axioma do paralelismo, obtemos um espaço curvo. Por
exemplo, a superfície de uma esfera é curva. Linhas retas localmente em uma esfera se estendem a grandes
círculos, e dois grandes círculos sempre se cruzam. No entanto, suficientemente perto de qualquer ponto,
podemos fingir que a geometria é plana: o mapa de uma cidade pode ser representado em uma folha de papel
plana sem distorção significativa, enquanto uma tentativa semelhante para todo o globo falha completamente.
A esfera é, portanto, localmente plana. Isso é verdade para todos os chamados espaços Riemannianos2:
todos eles são localmente planos, mas as linhas localmente retas (chamadas geodésicas) geralmente não
permanecem paralelas.
O importante avanço de Einstein foi ver a semelhança entre os espaços riemannianos e a física
gravitacional. Ele identificou as trajetórias de partículas em queda livre com as geodésicas de uma geometria
curva: são localmente retas, pois o espaço-tempo admite referenciais inerciais locais em que essas trajetórias
são retas, mas globalmente não permanecem paralelas.
2 B. Riemann (1826-1866) foi o primeiro a publicar um estudo detalhado das consequências de abandonar o axioma do
paralelismo de Euclides.
Machine Translated by Google
Vamos seguir Einstein e procurar uma teoria da gravidade que use um espaço-tempo curvo
para representar os efeitos da gravidade nas trajetórias das partículas. Para isso, devemos claramente
tem que estudar a matemática da curvatura. A introdução mais simples é realmente estudar
sistemas de coordenadas curvilíneas em um espaço plano, onde nossa intuição é mais sólida. Nós devemos
ver que isso desenvolverá quase todos os conceitos matemáticos de que precisamos, e o passo para uma
espaço curvo será simples. Então, para o resto deste capítulo, estudaremos o euclidiano
plano: não mais SR (por enquanto!) e não mais produtos internos indefinidos. O que nós
estão atrás neste capítulo é paralelismo, não métricas. Essa abordagem tem o bônus adicional de
dando uma derivação mais sensata para tais fórmulas muitas vezes misteriosas como a expressão para
ÿ2 em coordenadas polares!
x y
r= x+ y = cos ÿ x + sen ÿ y, ÿ
r r
(5.4)
x 1 ÿ
ÿ = ÿ r2 y ÿ1
x+ r2 y = r
sen ÿ x + r cos ÿ y, ÿ
Também é possível usar outros sistemas de coordenadas. Vamos denotar uma coordenada geral
sistema por ÿ e ÿ:
ÿÿ ÿÿ ÿ
ÿ = ÿ (x, y), ÿ = x+
ÿx ÿyy ,
(5.5)
ÿÿ
ÿÿ ÿÿ
ÿ = ÿ(x, y), ÿ= x+
ÿx ÿÿ ÿyy .
Para que (ÿ , ÿ) sejam boas coordenadas, é necessário que quaisquer dois pontos distintos
(x1, y1) e (x2, y2) recebem diferentes pares (ÿ1, ÿ1) e (ÿ2, ÿ2), pela Eq. (5.5). Por
Por exemplo, as definições ÿ = x, ÿ = 1 não dariam boas coordenadas, uma vez que as distintas
pontos (x = 1, y = 2) e (x = 1, y = 3) ambos têm (ÿ = 1, ÿ = 1). Matematicamente, isso
requer que se ÿ = ÿ = 0 na Eq. (5.5), então os pontos devem ser os mesmos, ou x =
y = 0. Isso será verdade se o determinante da Eq. (5.5) é diferente de zero,
ÿÿ/ÿx ÿÿ/ÿy
det = 0. (5.6)
ÿÿ/ÿx ÿÿ/ÿy
A maneira antiga de definir um vetor é dizer que ele se transforma sob uma transformação
ÿ de
coordenadas arbitrária da mesma forma que o deslocamento se transforma. Ou seja, um vetor
poder ser
representado3 como um deslocamento ( x, y), ou em coordenadas polares ( r, ÿ), ou em geral ( ÿ ,
ÿ). Então fica claro que para pequenos ( x, y) temos (da Eq. (5.5))
ÿ ÿÿ/ÿx ÿÿ/ÿy x
ÿ ÿ = ÿ ÿÿÿ ÿ
(5.7)
ÿ ÿÿ ÿ ÿÿ/ÿx ÿÿ/ÿy ÿ yÿ .
Vÿ = ÿÿVÿ , (5.9)
onde os índices não primos referem-se a (x, y) e primos a (ÿ , ÿ), e onde os índices só podem
assumir os valores 1 e 2. Um vetor pode ser definido como algo cujas componentes se transformam
de acordo com a Eq. (5.9). Há uma maneira mais sofisticada e natural, no entanto. Esta é a maneira
moderna, que agora apresentamos.
Considere um campo escalar ÿ. Dadas as coordenadas (ÿ , ÿ) é sempre possível formar as
derivadas ÿÿ/ÿÿ e ÿÿ/ÿÿ. Definimos a forma d˜ÿ como o objeto geométrico cujos componentes são
no sistema de coordenadas (ÿ , ÿ). Esta é uma definição geral de uma infinidade de formas únicas, cada
uma formada a partir de um campo escalar diferente. A transformação de componentes é automática a
partir da regra da cadeia para derivadas parciais:
ÿÿ = ÿx ÿÿ ÿy ÿÿ + ÿÿ
ÿy , (5.11)
ÿÿ ÿÿ ÿx
e similarmente para ÿÿ/ÿÿ. A maneira mais conveniente de escrever isso em notação matricial é como
uma transformação em vetores-linha,
porque então a matriz de transformação para uma forma é definida por analogia com a Eq. (5.8)
como um conjunto de derivadas das coordenadas (x, y) pelas coordenadas (ÿ , ÿ):
3
Vamos denotar vetores euclidianos por setas, e usaremos letras gregas para índices (numerados 1 e 2) para denotar o
fato de que a soma é sobre todos os valores possíveis (ou seja, ambos).
Machine Translated by Google
Observe que a soma nesta equação está no primeiro índice da matriz de transformação,
como esperamos quando um vetor linha pré-multiplica uma matriz.
É interessante que em SR não tivemos que nos preocupar com vetores linha, porque o
matrizes de transformação de Lorentz simples que usamos eram simétricas. Mas se quisermos ir
além até mesmo das situações mais simples, precisamos ver que componentes de forma única são
elementos de vetores de linha. No entanto, a notação matricial torna-se complicada quando vamos além
tensores com dois índices. Em GR precisamos lidar com tensores com quatro índices, e algumas
vezes até cinco. Como resultado, normalmente expressaremos as equações de transformação em suas
forma algébrica, como na Eq. (5,14); os alunos não verão muita notação de matriz mais tarde neste
livro.
O que vimos nesta seção é que, na visão moderna, o fundamento do tensor
álgebra é a definição de uma forma. Isso é mais natural do que a maneira antiga, na qual
um único vetor ( x, y) foi definido e outros foram obtidos por analogia. Aqui um todo
classe de uma forma é definida em termos de derivadas, e as propriedades de transformação de
one-forms seguem automaticamente.
Agora um vetor é definido como uma função linear de uma forma em números reais. As implicações
disso serão exploradas no próximo parágrafo. Primeiro, apenas notamos que tudo isso é o
mesmo que tivemos em SR, de modo que os vetores de fato obedecem à lei de transformação, Eq. (5.9). Isso é
ÿ ÿ
de interesse ver explicitamente que ( ÿ) e ( ÿ) são inversas um do outro. O produto
das matrizes é
ÿÿ/ÿÿ ÿÿ/ÿÿ 10
= , (5.16)
ÿÿ/ÿÿ ÿÿ/ÿÿ 01
Curvas e vetores
A noção usual de uma curva é de uma série conectada de pontos no plano. Isso nós vamos
chame um caminho e reserve a palavra curva para um caminho parametrizado. Ou seja, seguiremos
terminologia matemática moderna e define uma curva como um mapeamento de um intervalo do
linha real em um caminho no plano. O que isso significa é que uma curva é um caminho com um número real
associados a cada ponto do caminho. Esse número é chamado de parâmetro s. Cada ponto
tem coordenadas que podem então ser expressas como uma função de s:
Machine Translated by Google
define uma curva no plano. Se alterássemos o parâmetro (mas não os pontos) para s = s (s), que é
uma função do s antigo, teríamos
{ÿ = f (s ), ÿ = g (s ), como b }, (5.18)
onde f e g são novas funções, e onde a = s (a), b = s (b). Trata-se, matematicamente, de uma nova
curva, ainda que sua imagem (os pontos do plano por onde passa) seja a mesma. Portanto, há um
número infinito de curvas com o mesmo caminho.
A derivada de um campo escalar ÿ ao longo da curva é dÿ/ds. Isso depende de s, então por
alterando o parâmetro, alteramos a derivada. Podemos escrever isso como
onde V é o vetor cujas componentes são (dÿ/ds, dÿ/ds). Este vetor depende apenas da curva,
enquanto d˜ÿ depende apenas de ÿ. Portanto , V é um vetor característico da curva, chamado de
vetor tangente . (Ela é claramente tangente à curva: veja a Fig. 5.4.) Assim, um vetor pode ser
considerado como algo que produz dÿ/ds, dado ÿ. Isso leva à visão mais moderna, de que o vetor
tangente à curva deve ser chamado de d/ds. Alguns textos de relatividade ocasionalmente usam
essa notação. Para nossos propósitos, entretanto, vamos apenas deixar V ser o vetor tangente cujas
componentes são (dÿ/ds, dÿ/ds). Observe que um caminho no plano tem, em qualquer ponto, uma
infinidade de tangentes, todas paralelas, mas com comprimentos diferentes. Estes devem ser
considerados como vetores tangentes a diferentes curvas, curvas que possuem diferentes
parametrizações em uma vizinhança daquele ponto. Uma curva tem uma tangente única , pois o
caminho e o parâmetro são dados. Além disso, mesmo curvas que têm tangentes idênticas em um
ponto podem não ser idênticas em outro lugar. Da expansão de Taylor ÿ (s + 1) ÿ ÿ (s) + dÿ/ds,
vemos que V (s) se estende aproximadamente de s a s + 1 ao longo da curva.
Agora, é claro que sob uma transformação de coordenadas s não muda (sua definição não tinha
nada a ver com coordenadas), mas os componentes de V mudarão , pois pela regra da cadeia
Esta é a mesma lei de transformação que tínhamos para vetores anteriormente, Eq. (5.7).
ÿ
V
s=7
s=6
s=8
ÿ
V s=5
s=4 s=3 s=2
s=1
Para resumir, a visão moderna é que um vetor é uma tangente a alguma curva, e é o
função que dá dÿ/ds quando recebe d˜ÿ como argumento. Dito isto, estamos agora
em posição de fazer coordenadas polares mais detalhadamente.
eÿ = ÿ
ÿ eÿ,
ou
x y
é= ex + _ rey _
(5.21)
ÿx ÿy
= ex +
ÿr ÿr ei
e, da mesma forma,
ÿx ÿy
eÿ = ex + ei
ÿÿ ÿÿ
(Observe a semelhança com o cálculo ordinário, Eq. (5.4).) Da mesma forma, encontramos
Podemos desenhar imagens das bases em vários pontos (Fig. 5.5). Desenhando os vetores de base
não é problema. Desenhar a base de uma forma é feito mais facilmente desenhando superfícies de
constanter e ÿ para d˜r e d˜ÿ. Essas superfícies têm orientações diferentes em lugares diferentes.
Há um ponto de grande importância a ser observado aqui: as bases mudam de ponto a ponto.
Para os vetores, os vetores de base em A na Fig. 5.5 não são paralelos àqueles em C. Isso é
porque eles apontam na direção da coordenada crescente, que muda de ponto a
Machine Translated by Google
dÿ
C
dr
B dÿ
UMA
ponto. Além disso, os comprimentos das bases não são constantes. Por exemplo, da Eq. (5.23) encontramos
de modo que eÿ aumenta em magnitude à medida que nos afastamos da origem. A razão é que o vetor
base eÿ , tendo componentes (0,1) em relação a r e ÿ, tem essencialmente um deslocamento ÿ de uma
unidade, ou seja, um radiano. Deve ser mais longo para fazer isso em grandes raios do que em
pequenos. Portanto, não temos uma base unitária . É fácil verificar que
Novamente, |d˜ÿ| fica maior (mais intenso) perto de r = 0 porque um determinado vetor pode abranger uma faixa
maior de ÿ perto da origem do que longe.
Tensor métrico
Os produtos escalares acima foram todos calculados conhecendo a métrica em coordenadas cartesianas x, y:
ex · ex = ei · ei = 1, ex · ei = 0;
= g( eÿ , eÿ) = eÿ · eÿ gÿ ÿ (5.30)
grÿ = 0. (5.31b)
100
(gÿÿ)polar = (5.32)
r2 ,
Machine Translated by Google
2 dl · dl = ds _ = |dr er + dÿ eÿ | 2
2 = dr + r 2dÿ 2. (5.33)
Não confunda dr e dÿ aqui com as formas de base d˜r e d˜ÿ. As coisas neste
equação são componentes de d l em coordenadas polares, e 'd' significa simplesmente 'infinitesimal'.
Existe outra maneira de derivar a Eq. (5.33) que é instrutivo. Lembre-se da Eq. (3.26) em
0 tensor é escrito como uma soma sobre a base 0
qual é uma tensores d˜xÿ ÿ d˜xÿ. Para o
2 2
métrica geral
Embora isso tenha uma semelhança superficial com a Eq. (5.33), é diferente: é um operador que,
quando fornecido com o vetor d l, cujos componentes são dr e dÿ,
dá a Eq. (5.33). Infelizmente, as duas expressões se assemelham muito de perto
devido à maneira confusa como a notação evoluiu neste assunto. A maioria dos textos e pesquisas
artigos ainda usam a forma 'antiquada' na Eq. (5.33) para exibir os componentes do
métrica, e seguimos a mesma prática.
A métrica tem um inverso:
ÿ1
10 10
= (5,34)
0 r2 0 rÿ2 .
Então temos grr = 1, grÿ = 0, gÿÿ = 1/ r2. Isso nos permite fazer o mapeamento entre
formas e vetores. Por exemplo, se ÿ é um campo escalar e d˜ÿ é seu gradiente, então o
vetor dÿ tem componentes
ÿ
(dÿ) = gÿÿÿ,ÿ, (5,35)
ou
r
(dÿ) = grÿÿ,ÿ = grrÿ,r + grÿÿ,ÿ
= ÿÿ/ÿr; (5.36a)
Assim, enquanto (ÿ,r, ÿ,ÿ ) são componentes de uma forma, o gradiente vetorial tem componentes
(ÿ,r, ÿ,ÿ /r2). Apesar de estarmos no espaço euclidiano, os vetores geralmente têm componentes diferentes de suas formas
O fato de os vetores de base das coordenadas polares não serem constantes em todos os lugares, leva
alguns problemas quando tentamos diferenciar vetores. Por exemplo, considere o simples
vetor ex, que é um campo vetorial constante, o mesmo em qualquer ponto. Em coordenadas polares
r ÿ
tem componentes ex ÿ ( mesmo x, x) = (cos ÿ, ÿrÿ1 sen ÿ). Estes claramente não são constantes,
que ex seja. A razão é que eles são componentes em uma base não constante. Se
fôssemos diferenciá-los em relação a, digamos, ÿ, certamente não obteríamos
ÿ ex/ÿÿ, que deve ser identicamente zero. Assim, a partir deste exemplo, vemos que diferenciar os
componentes de um vetor não fornece necessariamente a derivada do vetor. Nós
também deve diferenciar os vetores de base não constantes. Esta é a chave para a compreensão das
coordenadas curvas e, de fato, dos espaços curvos. Vamos agora fazer essas idéias
sistemático.
ÿ ÿ
er = (cos ÿ ex + sen ÿ ey) = 0, ÿr (5.37a)
ÿr
ÿ ÿ
é= (cos ÿ ex + sen ÿ ey)
ÿÿ ÿÿ
1
= ÿ sen ÿ ex + cos ÿ ey = eÿ . (5.37b)
r
Estes têm uma figura geométrica simples, mostrada na Fig. 5.6. Em dois pontos próximos, A e
B, er deve apontar diretamente para longe da origem e, portanto, em direções ligeiramente diferentes. o
derivada de er em relação a ÿ é apenas a diferença entre er em A e B dividida por ÿ.
B
UMA
ÿÿ
A diferença neste caso é claramente um vetor paralelo a eÿ , o que torna a Eq. (5.37b)
razoável.
De forma similar,
ÿ ÿ
eÿ = (ÿrsin ÿ ex + r cos ÿ ey)
ÿr ÿr
1
= ÿ sen ÿ ex + cos ÿ ey = eÿ , (5.38a)
r
ÿ
eÿ = ÿr cos ÿ ex ÿ rsin ÿ ey = ÿr er. ÿÿ (5.38b)
O aluno é encorajado a fazer um desenho semelhante ao da Fig. 5.6 para explicar essas fórmulas.
ÿÿ r r ÿÿ
1
= ÿ sen ÿ er + cos ÿ eÿ
r
1 1
cos ÿ eÿ ÿ sen ÿ(ÿr er). (5.41)
ÿ
r r
assim como deveríamos ter. Agora, na Eq. (5.40) o primeiro e o terceiro termos provêm da diferenciação das
componentes de ex na base das coordenadas polares; os outros dois termos são os
derivadas dos próprios vetores de base polar, e são necessários para cancelar o
derivados dos componentes.
Um vetor geral V tem componentes (Vr , com a Vÿ ) na base polar. Sua derivada, por analogia
Eq. (5.40), é
ÿV ÿ
= (Vr er + Vÿ eÿ )
ÿr ÿr
ÿVr ÿ er ÿVÿ
= er + Vr + eÿ + Vÿ ÿ eÿ ,
ÿr ÿr ÿr ÿr
ÿV ÿ ÿVÿ ÿ eÿ
= (Vÿ eÿ) = eÿ + Vÿ .
ÿr ÿr ÿr ÿr
Os símbolos de Christoffel
O termo final da Eq. (5.43) é obviamente de grande importância. Como ÿ eÿ/ÿxÿ é ele próprio um
vetor, pode ser escrito como uma combinação linear dos vetores de base; nós apresentamos o
símbolo ÿÿÿ para denotar os coeficientes nesta combinação:
ÿ eÿ
= ÿÿÿ eÿ. ÿxÿ (5,44)
(2) ÿ er/ÿÿ =
1
eÿ ÿ
r
rÿ = 0, ÿ
rÿ
= 1
,
r r
(5,45)
(3) ÿ eÿ /ÿr = (4)
1
eÿ ÿ
r
ÿr = 0, ÿ
ÿr
= 1
, ÿÿÿÿÿ
r r
r ÿ = 0.
ÿ eÿ /ÿÿ = ÿr er ÿ ÿÿ = -r, ÿÿ ÿÿÿÿÿ
Na definição, a Eq. (5.44), todos os índices devem referir-se ao mesmo sistema de coordenadas. Desta forma,
embora tenhamos calculado as derivadas de er e eÿ usando a constância de ex e ey,
as bases cartesianas, no final, não aparecem na Eq. (5,45). O Christoffel
importância dos símbolos é que eles nos permitem expressar essas derivadas sem usar qualquer
outras coordenadas que não as polares.
A derivada covariante
Usando a definição dos símbolos de Christoffel, a Eq. (5.44), a derivada na Eq. (5,43)
torna-se
ÿV ÿVÿ
= (5,46)
eÿ + Vÿ ÿÿÿ eÿ.
ÿxÿ ÿxÿ
ÿV ÿVÿ ÿ
= eÿ + Vÿ (5,47)
ÿÿ eÿ.
ÿxÿ ÿxÿ
A razão para a reclassificação foi que, agora, eÿ pode ser fatorado de ambos os termos:
ÿV ÿVÿ ÿ
= + Vÿ (5,48)
ÿÿ eÿ.
ÿxÿ ÿxÿ
ÿ
ÿVÿ/ÿxÿ + Vÿ ÿÿ. (5,49)
Lembre-se de nossa notação original para a derivada parcial, ÿVÿ/ÿxÿ = Vÿ ,ÿ. Nós mantemos isso
notação e defina um novo símbolo:
ÿ
Vÿ ;ÿ := Vÿ ,ÿ + Vÿ ÿÿ. (5,50)
Em uma base cartesiana os componentes são apenas Vÿ,ÿ. Na base curvilínea, no entanto, o
derivadas dos vetores de base devem ser levadas em conta, e obtemos que Vÿ;ÿ são as
componentes de ÿV em qualquer sistema de coordenadas que os símbolos de Christoffel na Eq. (5,50)
referir-se. O significado desta declaração não deve ser subestimado, pois é a base
1
de todo o nosso trabalho posterior. Existe um único tensor chamado ÿV . Em coordenadas cartesianas sua
1
componentes são ÿVÿ/ÿxÿ. Em coordenadas gerais {xÿ } seus componentes são chamados de Vÿ ;ÿ
e pode ser obtido de duas maneiras equivalentes: (i) calcule-os diretamente em {xÿ }
ÿ
usando a Eq. (5.50) e um conhecimento de quais são os coeficientes ÿÿ nessas coordenadas;
ou (ii) obtê-los pelas leis usuais de transformação tensorial de Cartesiana para {xÿ }.
Qual é a derivada covariante de um escalar? A derivada covariante difere da
Divergência e Laplaciano
Antes de fazer qualquer teoria, vamos relacionar isso com coisas que vimos antes. Dentro
Coordenadas cartesianas a divergência de um vetor Vÿ é Vÿ,ÿ. Este é o escalar obtido
contraindo Vÿ,ÿ em seus dois índices. Como a contração é uma operação invariante de quadro,
a divergência de V pode ser calculada em outras coordenadas {xÿ } também contraindo o
componentes de ÿV em seus dois índices. Isso resulta em um escalar com o valor Vÿ ;ÿ .
Isso é
importante perceber que este é o mesmo número que Vÿ,ÿ em coordenadas cartesianas:
Vÿ ,ÿ
ÿ Vÿ ;ÿ , (5,54)
onde os índices não primos referem-se às coordenadas cartesianas e os primos referem-se às coordenadas arbitrárias
sistema.
Para coordenadas polares (soltando primos por conveniência aqui)
ÿVÿ
Vÿ = +
ÿ
;ÿ ÿÿVÿ.
ÿxÿ
Portanto temos
ÿVr ÿVÿ 1
Vÿ = + + VR ,
;ÿ
ÿr ÿÿ r
1 ÿ ÿ
= (rVr ) + Vÿ . (5,56)
r ÿr ÿÿ
Esta pode ser uma fórmula familiar para o aluno. O que provavelmente é mais familiar é o Lapla cian,
que é a divergência do gradiente. Mas temos apenas a divergência de vetores,
e o gradiente é uma forma única. Portanto, devemos primeiro converter a forma única em um vetor.
Assim, dado um ÿ escalar, temos o gradiente vetorial (veja a Eq. (5.53) e a última parte do § 5.2
acima) com componentes (ÿ,r, ÿ,ÿ /r2). Usando estes como os componentes do vetor no
fórmula de divergência, Eq. (5,56) dá
1 ÿ ÿÿ 1 ÿ2ÿ
ÿ·ÿÿ := ÿ2ÿ = r + . (5,57)
r ÿr ÿr r2 ÿÿ 2
ÿ2ÿ ÿ2ÿ
ÿ2ÿ = + . (5,58)
ÿx2 ÿy2
Como um escalar ÿ não depende de vetores de base, sua derivada d˜ÿ é a mesma que sua covariante
derivada ÿÿ. Quase sempre usaremos o símbolo ÿÿ. Para calcular a derivada de
uma forma (que para um vetor não será simplesmente as derivadas de seus componentes), usamos
Machine Translated by Google
a propriedade de que uma forma única e um vetor dão um escalar. Assim, se p˜ é uma forma única e V é uma
vetor arbitrário, então para ÿ fixo, ÿÿp˜ também é uma forma, ÿÿV é um vetor, e ˜p, V ÿ ÿ
é um escalar. Em qualquer sistema de coordenadas (arbitrário) este escalar é apenas
ÿ = pÿVÿ. (5,59)
ÿpÿ ÿVÿ
ÿÿÿ = ÿ,ÿ = ÿxÿ Vÿ + pÿ . (5,60)
ÿxÿ
Mas podemos usar a Eq. (5.50) para substituir ÿVÿ/ÿxÿ em favor de Vÿ;ÿ, que são os componentes
de ÿÿV :
ÿpÿ ÿ
ÿÿÿ = ÿxÿ Vÿ + pÿ Vÿ ;ÿ ÿ pÿVÿ ÿÿ. (5,61)
Agora, cada termo nesta equação, exceto o entre parênteses, é conhecido por ser o componente de um
tensor, para um campo vetorial arbitrário V . Portanto, como a multiplicação e a adição
de componentes sempre dá novos tensores, deve ser verdade que o termo entre parênteses também é
o componente de um tensor. Esta é, obviamente, a derivada covariante de p˜:
Assim, a diferenciação covariante obedece ao mesmo tipo de regra do produto que a Eq. (5,60). Deve _
faça isso, já que em coordenadas cartesianas ÿ é apenas uma diferenciação parcial de componentes, então
Eq. (5.64) reduz-se à Eq. (5,60).
Vamos comparar as duas fórmulas que temos, Eq. (5,50) e Eq. (5.63):
ÿ
Vÿ pÿ;ÿ= =Vÿ
pÿ,ÿ,ÿÿ+pÿVÿÿÿÿ.
;ÿ ÿÿ,
quando lembramos que a contração ˜ÿÿ, eÿ = ÿÿÿ é uma constante, e sua derivada
deve ser nulo.
ÿ ÿ
ÿÿTÿÿ = Tÿÿ,ÿ ÿ Tÿÿ ÿÿ ÿ Tÿÿ ÿÿAÿÿ = ÿÿ; (5,64)
ÿ
Aÿÿ ,ÿ + Aÿÿ ÿÿÿ + Aÿÿ ÿÿBÿÿ = Bÿÿ,ÿ + Bÿ ÿÿ; (5,65)
ÿ
ÿ ÿÿÿ ÿ Bÿÿ ÿÿ. (5,66)
Inspecione-os de perto: eles são muito sistemáticos. Simplesmente coloque um termo para cada índice;
um índice elevado é tratado como um vetor e um baixo como uma forma única. O geométrico
0 0
significado da Eq. (5.64) é que ÿÿTÿÿ é um componente do tensor ÿT, onde
3 T é um tensor. Da mesma 2
2 tensor e ÿA é um 2
forma, na Eq. (5.65), A é um ÿÿAÿÿ . 0 1 tensor com componentes
O formalismo desenvolvido acima não usou nenhuma propriedade do tensor métrico para derivar
derivadas covariantes. Mas a métrica deve estar envolvida de alguma forma, porque pode converter
um vetor em uma forma única e, portanto, deve ter algo a dizer sobre o relacionamento
entre seus derivados. Em particular, em coordenadas cartesianas os componentes do
uma forma e seu vetor relacionado são iguais, e como ÿ é apenas diferenciação de componentes,
os componentes das derivadas covariantes da forma única e do vetor devem ser iguais.
Isso significa que se V é um vetor arbitrário e V˜ = g(V , ) é sua forma relacionada, então em
Coordenadas cartesianas
Mas a eq. (5.67) é uma equação tensorial, portanto deve ser válida em todas as coordenadas. Concluimos que
Vÿ = gÿ ÿVÿ , (5,69)
Vÿ;ÿ = Vÿ ;ÿ
apenas em coordenadas cartesianas. Para converter isso em uma equação válida em todos os sistemas de
coordenadas, notamos que em coordenadas cartesianas
Mas agora esta equação é uma equação tensorial, então sua validade em um sistema de coordenadas implica sua
validade em todos. Esta é apenas a Eq. (5.68) novamente:
Vÿ ;ÿ = gÿ ÿ ;ÿ ;ÿ . Vÿ + gÿ ÿ Vÿ
A comparação disso com a Eq. (5.70) mostra (já que V é um vetor arbitrário) que devemos ter
gÿÿ;ÿ
ÿ0 (5,71)
em todos os sistemas de coordenadas. Isso é uma consequência da Eq. (5,67). Em coordenadas cartesianas
é uma identidade trivial. No entanto, em outras coordenadas não é óbvio, então vamos trabalhá-lo como
uma verificação da consistência do nosso formalismo.
Usando a Eq. (5.64) dá (agora os índices não primos são gerais)
ÿ ÿ
gÿÿ;ÿ = gÿÿ,ÿ ÿ ÿÿgÿÿ ÿ ÿÿgÿÿ . (5,72)
ÿ
Como grr,r = 0 e ÿ = ÿ,ÿ rr = 0 para todo ÿ, isso é trivialmente zero. Não tão trivial é ÿ = ÿ,
= r:
ÿ ÿ
gÿÿ;r = gÿÿ,r ÿ ÿrgÿÿ ÿ ÿrgÿÿ .
r
Com gÿÿ = r2, ÿ ÿr = 1/r e = 0, isso se torna ÿr
1 1
gÿÿ ;r = (r 2),r ÿ (r 2) - (r 2) = 0.
r r
Machine Translated by Google
Então funciona, quase magicamente. Mas é importante perceber que não é mágica: segue diretamente dos
fatos que gÿÿ,ÿ = 0 em coordenadas cartesianas e que gÿÿ;ÿ são as
componentes do mesmo tensor ÿg em coordenadas arbitrárias.
Talvez seja útil fazer uma pausa aqui para ter alguma perspectiva sobre o que acabamos de fazer.
Introduzimos a diferenciação covariante em coordenadas arbitrárias usando nosso entendimento de paralelismo
no espaço euclidiano. Mostramos então que a métrica de Euclides
o espaço é covariantemente constante: Eq. (5.71). Quando passamos a curva (Riemanniana)
espaços teremos que discutir o paralelismo com muito mais cuidado, mas a Eq. (5.71) será
ainda é verdade e, portanto, todas as suas consequências, como as que agora passamos a
descrever.
O desaparecimento da Eq. (5.72) leva a um resultado extremamente importante. Vemos que a Eq. (5,72)
pode ser usado para determinar gÿÿ,ÿ em termos de ÿÿÿ. Acontece que o inverso também é verdadeiro,
que ÿÿÿ pode ser expresso em termos de gÿÿ,ÿ. Isso fornece uma maneira fácil de derivar os símbolos de
Christof vil. Para mostrar isso, primeiro provamos um resultado de alguma importância em si mesmo: em
qualquer sistema de coordenadas ÿÿÿ ÿ ÿÿÿ. Para provar essa simetria, considere um escalar arbitrário
campo ÿ. Sua primeira derivada ÿÿ é uma forma com componentes ÿ,ÿ. Sua segunda covariante
0
derivada ÿÿÿ tem componentes ÿ,ÿ;ÿ e é um tensor. Em coordenadas
2 cartesianas esses
componentes são
ÿ ÿ
ÿ,ÿ,ÿ := ÿ
ÿxÿ ÿxÿ
e vemos que elas são simétricas em ÿ e ÿ, pois as derivadas parciais comutam. Mas se um
tensor é simétrico em uma base é simétrico em todas as bases. Portanto
ÿ,ÿ,ÿ = ÿ,ÿ,ÿ
ÿÿÿÿ,ÿ = ÿÿÿÿ,ÿ
Usamos isso para inverter a Eq. (5,72) por algumas ginásticas de índice avançado. Nós escrevemos três
versões da Eq. (5.72) com diferentes permutações de índices:
ÿ ÿ
gÿÿ,ÿ = ÿÿgÿÿ + ÿÿgÿÿ ,
ÿ ÿ
gÿÿ,ÿ = ÿÿgÿÿ + ÿÿgÿÿ ,
ÿ ÿ
ÿgÿÿ,ÿ = ÿ ÿÿgÿÿ ÿ ÿÿgÿÿ .
ÿÿ ÿÿ -
Nesta equação, os dois primeiros termos à direita desaparecem pela simetria de e , Eq. (5,74),
obtemos
ÿ
gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ = 2gÿÿ ÿÿ.
Estamos quase lá. Dividindo por 2, multiplicando por gÿÿ (com soma implícita em ÿ)
e usando
gÿÿ gÿÿ ÿ ÿÿ ÿ
dá
1
ÿ
(5,75)
2 gÿÿ (gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ) = ÿÿ.
ÿ
1
rÿ
= (gÿr,ÿ + gÿÿ,r ÿ grÿ,ÿ )
2r2
1 1 1
= gÿÿ,r = (r 2), r = .
2r2 2r2 r
ÿ
Este é o mesmo valor para rÿ , como deduzimos anteriormente. Este método de calcular ÿÿÿ é
tão útil que vale a pena cometer a Eq. (5.75) para a memória. vai ser exatamente igual
em espaços curvos.
A natureza tensorial de ÿ ÿÿ
1
Como eÿ é um vetor, ÿ eÿ é um tensor
1 cujos componentes são ÿÿÿ. Aqui ÿ é fixo e
ÿ e ÿ são os índices de componentes: mudando ÿ muda o tensor ÿ eÿ, enquanto mudando
ÿ ou ÿ altera apenas o componente em discussão. Portanto, é possível considerar ÿ e
Machine Translated by Google
ÿ como índices de componentes e ÿ como um rótulo que fornece o tensor específico referido. Existe um tal tensor
para cada vetor de base eÿ. No entanto, isso não é muito útil, pois sob uma mudança de coordenadas a base
muda e as quantidades importantes no novo sistema são os novos tensores ÿ eÿ que são obtidos dos antigos ÿ
eÿ de uma maneira complicada: são tensores diferentes , não apenas componentes diferentes do mesmo tensor.
Assim, o conjunto ÿÿÿ em um quadro não é obtido por uma simples transformação tensorial do conjunto ÿÿ ÿ de
outro quadro. O exemplo mais fácil disso são as coordenadas cartesianas, onde ÿÿÿ ÿ 0, embora não sejamzero
em outros quadros. Assim, em muitos livros é dito que ÿÿÿ não são componentes de tensores. Como vimos, isso
não é estritamente verdadeiro: ÿÿÿ são os componentes (ÿ, ÿ) de um conjunto de tensores ÿ eÿ. Mas não existe
um tensor único cujos componentes sejam ÿÿÿ, então expressões como ÿÿÿVÿ também não são componentes de
um único tensor. o 11 12
combinação
Vÿ ,ÿ
+ Vÿÿ ÿÿ
Em toda essa discussão, geralmente assumimos que os vetores de base não cartesianos foram gerados por uma
transformação de coordenadas de (x, y) para algum (ÿ , ÿ). No entanto, como mostraremos a seguir, nem todo
corpo de vetores de base pode ser obtido dessa maneira, e teremos que examinar cuidadosamente nossos
resultados para ver quais precisam ser modificados (poucos realmente precisam).
Quase nunca usaremos bases não coordenadas em nosso trabalho neste curso, mas elas são freqüentemente
encontradas nas referências padrão em coordenadas curvas no espaço plano, então devemos fazer uma pausa
para dar uma breve olhada nelas agora.
Os vetores base para o nosso sistema de coordenadas polares foram definidos por
eÿ = ÿÿ eÿ,
onde os índices primos referem-se às coordenadas polares e os não primos aos cartesianos. Além disso, tivemos
ÿ
ÿ = ÿxÿ/ÿxÿ ,
onde consideramos as coordenadas cartesianas {xÿ} como funções das coordenadas polares {xÿ }.
Nós achamos isso
· eÿ ÿ gÿ ÿ = ÿÿÿ , eÿ
Muitas vezes é conveniente trabalhar com vetores unitários . Um conjunto simples de vetores unitários derivados de
a base da coordenada polar é:
1
erˆ = er, eÿˆ = eÿ , (5,76)
r
então estes constituem bases ortonormais para os vetores e formas-um. Nossa notação, que
é bastante padrão, é usar um 'caret' ou 'hat', ˆ, acima de um índice para denotar um ortornormal
base. Agora, surge a questão, existem coordenadas (ÿ , ÿ) tais que
ÿx ÿy
erˆ = eÿ = ex + ey (5.79a)
ÿÿ ÿÿ
e
ÿx ÿy
eÿˆ = eÿ = ex + ei? (5.79b)
ÿÿ ÿÿ
Se sim, então { erˆ, eÿˆ} são a base para as coordenadas (ÿ , ÿ) e, portanto, podem ser chamadas de coordenadas
base; se tal (ÿ , ÿ) puder ser demonstrado que não existe, então esses vetores são uma base não coordenada.
A questão é, na verdade, mais facilmente respondida se olharmos para as formas únicas básicas. Assim, nós
procure (ÿ , ÿ) tal que
ÿ
ÿ˜rˆ = d˜ÿ = ÿÿ/ ÿx d˜x + ÿÿ/ ÿy d˜y,
(5,80)
ÿ
ÿˆÿ˜ _
= d˜ÿ = ÿÿ/ ÿx d˜x + ÿÿ/ ÿy d˜y. ÿ
ÿˆ
Como sabemos ÿ˜rˆ e ÿ˜ em termos de d˜r e d˜ÿ, temos, a partir das Eqs. (5.26) e (5.27),
ÿÿ ÿÿ
= ÿ sen ÿ, = cosÿ. (5,82)
ÿx ÿy
Isso implicaria
ÿ ÿ
(ÿ sin ÿ) = (cos ÿ) ÿy (5,84)
ÿx
Machine Translated by Google
ou
ÿ y ÿ x
+ = 0.
ÿy ÿ(x2 + y2) ÿx ÿ(x2 + y2)
Isso certamente não é verdade. Portanto ÿ e ÿ não existem: temos uma base não coordenada.
(Se esse tipo de prova for surpreendente, tente nos próprios d˜r e d˜ÿ.)
Nos livros que tratam de cálculo vetorial em coordenadas curvilíneas, quase todos usam a base
ortonormal unitária em vez da base coordenada. Assim, para coordenadas polares, se um vetor tem
componentes na base de coordenadas PC,
V (5,85)
ÿÿPC (a, b) = {Vÿ },
V (5,86)
ÿÿPO (a,rb) = {Vÿˆ }.
Então, se, por exemplo, os livros calculam a divergência do vetor, eles obtêm, em vez de nossa Eq. (5,56),
1 ÿ 1 ÿ
ÿ·V= (r Vrˆ ) + Vÿˆ . (5,87)
r ÿr r ÿÿ
A diferença entre as Eqs. (5.56) e (5.87) é puramente uma questão de base para V .
As principais diferenças entre bases coordenadas e não coordenadas surgem do seguinte. Considere
um campo escalar arbitrário ÿ e o número d˜ÿ( eÿ), onde eÿ é um vetor base de alguma base arbitrária.
Usamos a notação
Agora, se eÿ é um membro de uma base coordenada, então d˜ÿ( eÿ) = ÿÿ/ÿxÿ e temos, como definido em
um capítulo anterior,
ÿÿ
ÿ,ÿ = ÿxÿ : base coordenada. (5,89)
Mas se não existem coordenadas para { eÿ}, então a Eq. (5.89) deve falhar. Por exemplo, se deixarmos a
Eq. (5.88) defina ÿ,ÿˆ , então temos
1 ÿÿ
. (5,90)
ÿ,ÿˆ = r ÿÿ
Em geral, obtemos
ÿ ÿÿ
ÿ ÿˆ ÿxÿ
ÿÿˆ ÿ ÿ ÿ,ÿˆ = ÿˆ ÿÿÿ = (5,91)
para qualquer sistema de coordenadas {xÿ} e base não coordenada { eÿˆ}. Portanto, é conveniente
continuar com a notação, Eq. (5.88), e fazer a regra de que ÿ,ÿ = ÿÿ/ÿxÿ apenas em uma base coordenada.
Machine Translated by Google
mas agora
ÿ
ÿ
ÿÿˆ = ÿˆ
, (5,93)
ÿxÿ
onde {xÿ} é qualquer sistema de coordenadas e { eÿˆ} qualquer base (coordenada ou não). Agora, porém,
não podemos provar que ÿˆ = ÿˆ o que era verdade
ÿˆÿˆ , uma vez que essa prova usou ÿ,ÿˆ,ÿˆ = ÿ,ÿˆ,ÿˆ ,
ÿˆÿˆ em uma base coordenada (derivadas parciais comutam), mas não é verdade de outra forma. Daí, também,
Eq. (5.75) para ÿÿÿ em termos de gÿÿ,ÿ aplica-se apenas em uma base coordenada. Mais general
expressões são trabalhadas em Exer. 20, § 5.8.
Qual é a razão geral para a inexistência de coordenadas para uma base? Se { ˜ÿÿ¯} é um
coordenar uma base de uma forma, então sua relação com outra {d˜xÿ} é
ÿxÿ¯
ÿ¯
ÿ¯ ÿ˜ = d˜xÿ = dxÿ. ÿ ÿxÿ (5,94)
ÿ¯
O ponto chave é que ÿ, que geralmente é uma função da posição, deve ser realmente o
derivada parcial ÿxÿ¯ /ÿxÿ em todos os lugares. Assim temos
ÿ ÿ¯
ÿ2xÿ¯ ÿ2xÿ¯ ÿ ÿ¯
= = = (5,95)
ÿ ÿ.
ÿxÿ ÿxÿ ÿxÿ ÿxÿÿxÿ ÿxÿ
ÿ¯ ÿ¯
'condições de integrabilidade' devem ser satisfeitas por todos os elementos para serem uma
ÿ para
base
que ÿ˜ Essas
coordenada. Claramente, podemos sempre escolher uma matriz de transformação para a qual
isso falha, gerando assim uma base não coordenada.
Não teremos ocasião de usar tais bases com muita frequência. Principalmente, é importante entender que
elas existem, que nem toda base é derivável de um sistema de coordenadas. A álgebra
de bases coordenadas é mais simples em quase todos os aspectos. Podemos perguntar por que os
tratamentos padrão de coordenadas curvilíneas no cálculo vetorial, então, se atêm às bases ortonormais. o
razão é que em tal base no espaço euclidiano, a métrica tem componentes ÿÿÿ, então a
forma do produto escalar e a igualdade de componentes vetoriais e de uma forma transitam
diretamente das coordenadas cartesianas (que têm a única base de coordenadas ortonormais!).
Para obter a simplicidade das bases de coordenadas para cálculo vetorial e tensorial, temos
para gastar tempo aprendendo a diferença entre vetores e formas únicas!
5.6 L oo ki ngahead
O trabalho que fizemos neste capítulo desenvolveu quase todas as notações e conceitos
precisaremos em nosso estudo de espaços curvos e espaços-tempos. É particularmente importante que
o aluno entende §§ 5.2–5.4 porque a matemática da curvatura será desenvolvida
Machine Translated by Google
por analogia com o desenvolvimento aqui. O que temos a acrescentar a tudo isso é uma discussão sobre
paralelismo, de como medir até que ponto o axioma do paralelismo euclidiano falha.
Esta medida é o famoso tensor de Riemann.
5.7 P a r a d e r
A matemática das coordenadas curvilíneas é desenvolvida a partir de uma variedade de pontos de vista
em: Abraham e Marsden (1978), Lovelock e Rund (1990) e Schutz (1980b).
5.8 Exercícios
1 Repita o argumento que levou à Eq. (5.1) sob hipóteses mais realistas: suponha que uma fração ÿ da
energia cinética da massa na parte inferior possa ser convertida em um fóton e enviada de volta para
cima, permanecendo a energia restante no nível do solo de forma útil. Crie um motor de movimento
perpétuo se a Eq. (5.1) é violado.
2 Explique por que um campo gravitacional externo uniforme não geraria marés na Terra. 3 (a)
Mostre que a transformação de coordenadas (x, y) ÿ (ÿ , ÿ) com ÿ = x e ÿ = 1
viola a Eq. (5.6). (b)
As seguintes transformações de coordenadas são boas? Calcule o jacobiano e
liste quaisquer pontos em que as transformações falham.
(i) ÿ = (x2 + y2) 1/2, ÿ = arctan(y/x); (ii) ÿ = ln x, ÿ = y;
4 Uma curva é definida por {x = f(ÿ), y = g(ÿ), 0 ÿ 1}. Mostre que o vetor tangente
(dx/dÿ, dy/dÿ) na verdade é tangente à curva.
5 Esboce as seguintes curvas. Quais têm os mesmos caminhos? Encontre também seus vetores tangentes
onde o parâmetro é igual a zero. (a) x
= sen ÿ, y = cos ÿ; (b) x = cos(2ÿt 2), y = sin(2ÿt (d) x = s2, y = ÿ(s ÿ 2 + ÿ); (c) x = s, y = s + 4;
2)(s + 2); (e) x = ÿ, y = 1.
6 Justifique as figuras da Fig. 5.5.
7 Calcule todos os elementos das matrizes de transformação ÿ
ÿ e ÿÿ para a transformação de
cartesiano (x, y) – os índices não prime – para polar (r, ÿ) – os índices prime.
Machine Translated by Google
11 (Usa o resultado dos Exers. 7 e 8.) Para o campo vetorial V cujas componentes cartesianas são (x2 +
3y, y2 + 3x), calcule: (a) Vÿ,ÿ em cartesiano; (b) a transformação
ÿ ÿ
ÿ ÿVÿ,ÿ para polares; (c) os componentes Vÿ ;ÿ diretamente em polares usando o
Símbolos de Christoffel, Eq. (5.45), na Eq. (5,50); (d) a divergência Vÿ,ÿ usando seus resultados
em um); (e) a divergência Vÿ ;ÿ usando seus resultados em (b) ou (c); (f) a divergência
Vÿ
;ÿ usando a Eq. (5.56) diretamente.
12 Para o corpo de uma forma p˜ cujos componentes cartesianos são (x2 + 3y, y2 + 3x), com ÿ
ÿ
pute: (a) pÿ,ÿ em cartesiano; (b) a transformação ÿ pÿ,ÿ em polares;ÿ (c) o
componentes pÿ ;ÿ diretamente em polares usando os símbolos de Christoffel, Eq. (5.45), em
Eq. (5,63).
13 Para aqueles que fizeram os dois Exers. 11 e 12, mostram em polares que gÿ ÿVÿ ;ÿ = pÿ ;ÿ .
14 Para o tensor cujos componentes polares são (Arr = r2, Arÿ = rsin ÿ, Aÿr = r cos ÿ,
Aÿÿ = tan ÿ), calcule a Eq. (5.65) em polares para todos os índices possíveis.
15 Para o vetor cujos componentes polares são (Vr = 1, Vÿ = 0), calcule em polares
todos os componentes da segunda derivada covariante Vÿ;ÿ;ÿ . (Dica: para encontrar o segundo
1
derivada, trate a primeira derivada Vÿ;ÿ como qualquer tensor:
1 Eq. (5,66).)
16 Preencha todos os passos que faltam partindo da Eq. (5,74) para a Eq. (5,75).
17 Descubra como cada expressão Vÿ,ÿ e Vÿÿ ÿÿ se transforma separadamente sob uma mudança
de coordenadas (para ÿ ÿÿ, comece com a Eq. (5.44)). Mostre que nem é o tensor padrão
lei, mas que sua soma obedece à lei padrão.
18 Verifique a Eq. (5,78).
19 Verifique se o cálculo da Eq. (5,81) para a Eq. (5.84), quando repetido para d˜r e d˜ÿ,
mostra que eles são uma base coordenada.
onde a é uma constante e aÿ é o seu tempo próprio (hora do relógio em seu relógio de pulso).
Machine Translated by Google
(a) Mostre que a reta tipo espaço descrita pela Eq. (5.96) com a como parâmetro variável e ÿ fixo é
ortogonal à sua linha de mundo onde eles se cruzam. Mudando ÿ na Eq. (5.96) gera então uma
família de tais linhas.
(b) Mostre que a Eq. (5.96) define uma transformação de coordenadas (t, x) para coordenadas (ÿ, a),
que formam um sistema de coordenadas ortogonal . Desenhe essas coordenadas e mostre que
elas cobrem apenas metade do plano t ÿ x original . Mostre que as coordenadas são ruins nas
linhas |x|=|t|, então elas realmente cobrem dois quadrantes disjuntos. (c) Encontre o tensor métrico
e todos os símbolos de Christoffel neste sistema de coordenadas.
Este observador fará um trabalho perfeitamente bom, contanto que ele sempre use os símbolos
de Christoffel apropriadamente e se atenha aos eventos em seu quadrante. Nesse sentido, a RS
admite observadores acelerados. O quadrante direito nessas coordenadas é algumas vezes
chamado de espaço de Rindler, e as linhas de fronteira x = ±t têm alguma semelhança com os
horizontes de buracos negros que estudaremos mais tarde.
22 Mostre que se UÿÿÿVÿ = Wÿ, então UÿÿÿVÿ = Wÿ.
Machine Translated by Google
6 Coletores curvos
O conceito matemático de um espaço curvo começa (mas não termina) com a ideia de uma variedade.
Uma variedade é essencialmente um espaço contínuo que se parece localmente com o espaço
euclidiano. Ao conceito de variedade é adicionada a ideia da própria curvatura. A introdução da
curvatura em uma variedade será o assunto das seções subsequentes. Primeiro estudamos a ideia de
uma variedade, que podemos considerar apenas uma palavra chique para 'espaço'.
Coletores
Estrutura diferencial
Qualquer combinação linear de vetores também é um vetor. Usando os vetores e as formas unitárias
M
assim definidas, podemos construir todo o conjunto de tensores do tipo
emNSR.
, exatamente
Como aindacomo
não fizemos
escolhemos
0
nenhum tensor para servir de métrica, ainda
2
resto,
não hánocorrespondência
entanto, é exatamente
entre formas
como etínhamos
vetores. em
Todo
SRo e
em coordenadas polares. Tudo isso vem apenas da diferenciabilidade, então o conjunto de todos os
tensores é considerado parte da 'estrutura diferencial' da variedade. Não teremos muita ocasião de usar
esse termo.
Análise
É útil aqui revisar os fundamentos da álgebra tensorial. Podemos resumir as seguintes regras.
˜p, aV + bW = a ˜p , V + b ˜p, Wa p˜ + ,
(5) Uma série de manipulações de componentes de campos de tensores são chamadas de 'operações de
tensor permitidas' porque produzem componentes de novos tensores:
(i) A multiplicação por um campo escalar produz componentes de um novo tensor do
mesmo tipo.
(ii) A adição de componentes de dois tensores do mesmo tipo fornece componentes de um novo
tensor do mesmo tipo. (Em particular, apenas tensores do mesmo tipo podem ser adicionados.)
6.2 Ri em an ni anma ni f o ds
Até agora, não introduzimos uma métrica no coletor. De fato, em certos manifolds uma métrica seria
desnecessária ou inconveniente para qualquer problema que esteja sendo considerado.
Mas no nosso caso a métrica é absolutamente fundamental, já que ela vai carregar as informações sobre
as taxas em que os relógios rodam e as distâncias entre os pontos, assim como no SR. Uma variedade
0
diferenciável na qual um campo tensorial simétrico g foi escolhido 2para
ponto
atuaré como
chamada
a métrica
variedade
em cada
Riemanniana. (Estritamente falando, somente se a métrica for positiva-definida – isto é, g(V , V ) > 0 para
todo V = 0 – ela é chamada de Riemanniana; métricas indefinidas, comopseudo-Riemannianas.
SR e GR, são chamadas de
Esta é uma distinção que não nos incomodaremos em fazer.) É importante entender que ao escolher uma
métrica nós 'adicionamos' estrutura ao manifold; veremos que a métrica define completamente a curvatura
da variedade. Assim, escolhendo uma métrica g , a variedade obtém uma certa curvatura (talvez a de uma
esfera), enquanto um g diferente lhe daria uma curvatura diferente (talvez um elipsóide de revolução). A
própria variedade diferenciável é "primitiva": uma coleção amorfa de pontos, dispostos localmente como
os pontos do espaço euclidiano, mas sem nenhuma relação de distância ou forma especificada. Dar a
métrica g lhe dá uma forma específica, como veremos. A partir de agora estudaremos as variedades
Riemannianas, nas quais se supõe que uma métrica g esteja definida em cada ponto.
(Para completar, devemos observar que é de fato possível definir a noção de curvatura em uma
variedade sem introduzir uma métrica (as chamadas variedades 'afins').
Machine Translated by Google
textos realmente abordam o assunto dessa maneira. Mas como a métrica é essencial em GR, vamos
simplesmente estudar aquelas variedades cuja curvatura é definida por uma métrica.)
A métrica, é claro, fornece um mapeamento entre vetores e formas únicas em cada ponto.
Assim, dado um campo vetorial V (P) (cuja notação significa que V depende da posição
P, onde P é qualquer ponto), existe um único campo de forma V˜ (P) = g(V (P) ,).
O mapeamento deve ser invertível, de modo que associado a V˜ (P) haja um único V (P).
Os componentes de g são chamados gÿÿ; os componentes da matriz inversa são
chamados gÿÿ. A métrica permite aumentar e diminuir os índices da mesma forma que no SR,
que significa
Vÿ = gÿÿVÿ.
Em geral, {gÿÿ} serão funções complicadas de posição, então não será verdade que haveria
uma relação simples entre, digamos, V0 e V0 em um sistema de coordenadas arbitrário.
Como desejamos estudar variedades curvas gerais, temos que permitir qualquer sistema de
coordenadas. No SR estudamos apenas referenciais de Lorentz (inerciais) porque eles eram
simples. Mas como a gravidade impede que tais referenciais sejam globais, teremos que permitir
todas as coordenadas e, portanto, todas as transformações de coordenadas que não sejam
ÿ
singulares. (Não singular significa, como no § 5.2, que a matriz da transformação,
ÿ ÿxÿ / ÿxÿ, tem um
ÿ inversa.) Agora, a matriz (gÿÿ) é uma matriz simétrica por definição. É um teorema bem
conhecido da álgebra de matrizes (veja o Exer. 3, § 6.9) que sempre pode ser encontrada uma
matriz de transformação que transformará qualquer matriz simétrica em uma matriz diagonal
com cada entrada na diagonal principal +1, ÿ1 , ou zero. O número de entradas +1 é igual ao
número de autovalores positivos de (gÿÿ), enquanto o número de -1 entradas é o número de
autovalores negativos. Então, se escolhermos g originalmente para ter três autovalores positivos
ÿ
e um negativo, então sempre podemos encontrar um ÿ paramétricos
fazer com que os componentes
se tornem
ÿ1000
ÿ 0100 ÿ
(gÿÿ ) =
ÿ ÿ
ÿ (ÿÿÿ). (6.2)
ÿ
0010 ÿ
ÿ 0001 ÿ
De agora em diante usaremos ÿÿÿ para denotar apenas a matriz na Eq. (6.2), que é, obviamente, a
métrica de SR.
Há duas observações que devem ser feitas aqui. A primeira é que a Eq. (6.2) só é
possível se escolhermos (gÿÿ) dentre as matrizes que possuem três autovalores positivos e
um negativo. A soma dos elementos diagonais na Eq. (6.2) é chamado de assinatura da
métrica. Para SR e GR é +2. Assim, o fato de deduzirmos anteriormente a partir de
argumentos físicos que sempre podemos construir um referencial inercial local em qualquer
evento encontra sua representação matemática na Eq. (6.2), que a métrica pode ser transformada em
Machine Translated by Google
esse ponto. Isso, por sua vez, implica que a métrica deve ter assinatura +2 para descrever
um espaço-tempo com gravidade.
A segunda observação é que a matriz ÿ
ÿ que produz a Eq. (6.2) em cada ponto pode
ÿ
não ser uma transformação de coordenadas. Ou seja, o conjunto { ˜ÿÿ = base dinate.ÿ Pela
d˜xÿ}nossa
pode discussão
não ser uma
anterior
coor
de bases não coordenadas, seria uma coordenada
transformação somente se a Eq. (5,95) detém:
ÿ ÿ
ÿ ÿ
ÿ = ÿ
.
ÿxÿ ÿxÿ
Em um campo gravitacional geral isso será impossível, porque de outra forma implicaria
a existência de coordenadas para as quais a Eq. (6.2) é verdadeiro em todos os lugares: um quadro global de Lorentz.
No entanto, tendo encontrado uma base em um ponto particular P para o qual a Eq. (6.2) é verdadeira, é
possível encontrar coordenadas tais que, na vizinhança de P, a Eq. (6.2) é 'quase' verdadeira.
Isso está incorporado no seguinte teorema, cuja demonstração (bastante longa) está no final deste
seção. Escolha qualquer ponto P da variedade. Um sistema de coordenadas {xÿ} pode ser encontrado cuja
origem está em P e em que:
mas geralmente
ÿ2
gÿÿ(P) = 0
ÿxÿ ÿxÿ
para pelo menos alguns valores de ÿ, ÿ, ÿ e ÿ se a variedade não for exatamente plana.
A existência de quadros de Lorentz locais é meramente a afirmação de que qualquer espaço curvo tem
um espaço plano 'tangente' a ele em qualquer ponto. Lembre-se de que as linhas retas no espaço-tempo plano são as
linhas mundiais de partículas livres; a ausência de termos de primeira derivada (Eq. (6.5)) na métrica
de um espaço-tempo curvo significará que partículas livres estão se movendo em linhas que são localmente
reta neste sistema de coordenadas. Isso torna tais coordenadas muito úteis para nós, uma vez que o
equações da física serão quase tão simples nelas quanto no espaço-tempo plano, e se construídas
pelas regras do § 6.1 será válido em qualquer sistema de coordenadas. A prova deste teorema está em
no final desta seção, e vale a pena estudar.
Machine Translated by Google
Comprimentos e volumes
A métrica, é claro, dá uma maneira de definir comprimentos de curvas. Seja d x um pequeno deslocamento
vetorial em alguma curva. Então d x tem quadrado de comprimento ds2 = gÿÿ dxÿ dxÿ. (Lembre-se de que
chamamos isso de elemento de linha da métrica.) Se pegarmos o valor absoluto disso e pegarmos seu
raiz quadrada, obtemos uma medida de comprimento: dl ÿ |gÿÿ dxÿ dxÿ| 1/2. Então integrando dá
(6.6)
l = ' junto |gÿÿ dxÿ dxÿ| 1/2
curva
ÿ1 dxÿ * * dxÿ * * dÿ, gÿÿ * * dÿ1/2
**
(6.7)
=' dÿ
ÿ0
onde ÿ é o parâmetro da curva (cujos pontos finais são ÿ0 e ÿ1). Mas como o vetor tangente V
tem componentes Vÿ = dxÿ/dÿ, finalmente temos:
ÿ1
|V · V | 1/2 dÿ (6.8)
l=' ÿ0
ÿ(x0 , x1 , x2 , x3 ) ..
ÿ . ÿ
ÿ
= det( ÿ). (6.10)
Essa seria uma maneira bastante tediosa de calcular o jacobiano, mas existe uma maneira mais
fácil de usar a métrica. Na terminologia matricial, a transformação dos componentes métricos é
T
(g) = ( )(ÿ)( ) , (6.11)
onde (g) é a matriz de gÿÿ, (ÿ) de ÿÿÿ, etc., e onde 'T' denota transposição. Segue que os
determinantes satisfazem
T
det (g) = det ( ) det (ÿ) det ( ). (6.12)
Machine Translated by Google
Portanto, obtemos
dx0 dx1 dx2 dx3 = [ÿdet ( gÿ ÿ)]1/2dx0 dx1 dx2 dx3 = ( ÿg)
Este é um resultado muito útil. Também é conceitualmente um resultado importante porque é o primeiro
exemplo de um tipo de argumento que empregaremos com frequência, um argumento que usa coordenadas
localmente planas para generalizar nossos conceitos de espaço plano para análogos em espaço curvo.
Neste caso começamos com dx0 dx1 dx2 dx3 = d4x em um sistema de coordenadas localmente plano.
Argumentamos que este elemento de volume em P deve ser o volume medido fisicamente por hastes e
relógios, uma vez que o espaço é o mesmo que o espaço de Minkowski nesta pequena região. Descobrimos
então que o valor dessa expressão em coordenadas arbitrárias {xÿ } é a Eq. (6.18), (ÿg) 1/2 d4x, que
portanto,
é,
a expressão para o volume verdadeiro em um espaço curvo em qualquer ponto de qualquer coordenada.
Chamamos isso de elemento de volume apropriado.
Não deveria ser surpreendente que a métrica entre nisso, é claro, já que a métrica mede comprimentos.
Nós só precisamos lembrar que em qualquer coordenada a raiz quadrada do negativo do determinante de
(gÿÿ) é a coisa a ser multiplicada por d4x para obter o verdadeiro, ou próprio,
elemento de volume.
Talvez seja útil citar um exemplo de três dimensões. Aqui o volume adequado é (g) 1/2, já que a métrica
é positiva-definida (a Eq. (6.14) teria um sinal +). Em + r2 sin2 ÿ dÿ2, então a métrica é = dr2 + r2dÿ 2
2
de linha é dl coordenadas esféricas o elemento
10 0 0 r2 0 0 0
ÿ r2 sin2 ÿ ÿ
(gij) = (6.19)
ÿ ÿ.
Seja {xÿ} um sistema de coordenadas dado arbitrário e {xÿ } aquele que é desejado: ele se reduz ao
sistema inercial em um certo ponto fixo P. (Um ponto nesta variedade quadridimensional é, obviamente,
um evento. ) Então há alguma relação
xÿ = xÿ(xÿ ), (6.21)
ÿÿ = ÿxÿ/ÿxÿ . (6.22)
ÿ
Expandindo em uma
ÿÿ série de Taylor em torno de P (cujas coordenadas são x 0 ) dá a
transformação em um ponto arbitrário x próximo a P:
ÿ
ÿ ÿ ÿ ÿ
µ( x) = ÿ(P) + (xÿ ÿ x 0
ÿ) (P)
ÿxÿ ÿ2 ÿ
1
ÿ ÿ
+ (xÿ ÿ x 0 )(xÿ ÿ xÿ 0 ÿxÿ ÿxÿ ÿ2xÿ(P) +··· ) ,
2
*
= ÿ ÿ *
ÿ|P + (xÿ ÿ x 0
) ÿxÿ ÿxÿ
*
*
P ÿ3xÿ
ÿ
2 1 (xÿ ÿ x + 0 )(xÿ ÿ xÿ ) 0 * * +···. * * P (6.23)
ÿxÿ ÿxÿ ÿxÿ
ÿgÿÿ )
*
ÿ *
ÿ ÿ2gÿÿ ) *
*P
= ÿ
(6,25)
gu ÿ ÿÿ ÿgÿÿ,
obter
ÿ ÿ
gµ ÿ( x) = ÿ|P ÿ|Pgÿÿ|P
ÿ ÿ
+ (xÿ ÿ x 0
)[ ÿ ÿ|P ÿ|Pgÿÿ,ÿ |P ÿ ÿ|
ÿ
2 1 (xÿ ÿ x + 0 )(xÿ ÿ xÿ )[···].
0 (6.26)
Agora, não sabemos a transformação, Eq. (6.21), mas podemos defini-lo por sua expansão de Taylor.
Vamos contar o número de variáveis livres que temos para este propósito. A matriz ÿ|P tem 16 números,
ÿ
todos livremente especificáveis. A matriz {ÿ2xÿ/ÿxÿ ÿxÿ |P} tem 4 × 10 = 40 números livres (não 4 ×
4 × 4, pois é simétrica em ÿ e ÿ ).
A matriz {ÿ3xÿ/ÿxÿ ÿxÿ ÿxÿ |P} tem 4 × 20 = 80 variáveis livres, pois a simetria em todas
Machine Translated by Google
rearranjos de ÿ , ÿ e ÿ fornecem apenas 20 arranjos independentes (a expressão geral para três índices
é n(n + 1)(n + 2)/3!, onde n é o número de valores que cada índice pode assumir, quatro em nosso caso).
Por outro lado, gÿÿ|P, gÿÿ,ÿ |P e gÿÿ,ÿ ÿ|P são todos dados inicialmente. Eles têm, respectivamente, 10,
10 × 4 = 40 e 10 × 10 = 100 números independentes para uma métrica totalmente geral. A primeira
pergunta é, podemos satisfazer a Eq. (6.4),
gÿ ÿ|P = ÿÿ ÿ? (6.27)
Por simetria, são dez equações, que para matrizes gerais são independentes. Para satisfazê-los temos
ÿ
torno de uma direção definida por dois outros ângulos. Estes somam seis graus de liberdade em ÿ|P que
deixam o referencial inercial local inercial.
A próxima questão é, podemos escolher os 40 números livres ÿ ÿ ÿ/ÿxÿ |P na Eq. (6.26) de forma a
satisfazer as 40 equações independentes, a Eq. (6.5),
Como 40 é igual a 40, a resposta é sim, apenas um pouco. Dada a matriz ÿ|P, existe uma e apenas uma
maneira de organizar as coordenadas próximas a P tal que |P tenha os valores
ÿÿ,ÿ corretos para
ÿ ,ÿ|P = 0. fazer gÿ
Portanto, não
há liberdade extra além daquela com a qual para fazer transformações locais de Lorentz.
A pergunta final é: podemos fazer isso funcionar em ordem superior? Podemos encontrar 80 números
ÿÿ,ÿ ÿ|P que pode fazer os 100 números gÿ ÿ ,ÿ ÿ|P = 0? A resposta, já que 80 < 100, é não. Existem,
na métrica geral, 20 'graus de liberdade' entre as segundas derivadas gÿ ÿ ,ÿ ÿ|P. Como 100 ÿ 80 = 20,
haverá em geral 20 componentes que não podem ser anulados.
Portanto, vemos que uma métrica geral é caracterizada em qualquer ponto P não tanto por seu valor
em P (que sempre pode ser ÿÿÿ), nem por suas primeiras derivadas (que podem ser zeradas), mas pelos
20 derivadas segundas que, em geral, não podem ser anuladas. Esses 20 números serão vistos como
componentes independentes de um tensor que representa a curvatura; isso mostraremos mais adiante.
Em um espaço plano , é claro, todos os 20 desaparecem. Em um espaço geral eles não.
Vejamos agora o assunto da diferenciação. Por definição, a derivada de um campo vetorial envolve a
diferença entre vetores em dois pontos diferentes (no limite à medida que os pontos se juntam). Em um
espaço curvo a noção da diferença entre vetores em diferentes
Machine Translated by Google
os pontos devem ser tratados com cuidado, pois entre os pontos o espaço é curvo e a ideia de que os
vetores nos dois pontos podem apontar na 'mesma' direção é difusa. No entanto, a planicidade local da
variedade Riemanniana nos ajuda. Nós só precisamos comparar vetores no limite à medida que eles se
aproximam infinitesimalmente, e sabemos que podemos construir um sistema de coordenadas em qualquer
ponto que seja tão próximo de ser plano quanto gostaríamos nesse mesmo limite. Assim, em uma pequena
região a variedade parece plana, e então é natural dizer que a derivada de um vetor cujos componentes
são constantes neste sistema de coordenadas é zero naquele ponto. Em particular, dizemos que as
derivadas dos vetores base de um sistema de coordenadas localmente inercial são zero em P.
Vamos enfatizar que esta é uma definição da derivada covariante. Para nós, sua justificação está na
física: o referencial inercial local é um referencial em que tudo é localmente como SR, e em SR as derivadas
desses vetores de base são zero. Esta definição leva imediatamente ao fato de que nestas coordenadas
neste ponto, a derivada covariante de um vetor tem componentes dados pelas derivadas parciais dos
componentes (ou seja, os símbolos de Christoffel desaparecem):
Vÿ = Vÿ .ÿ atP
neste quadro. :ÿ (6.30)
(A segunda igualdade é apenas a Eq. (6.5).) Agora, a equação gÿÿ;ÿ = 0 é verdadeira em um quadro (o
localmente inercial) e é uma equação tensorial válida; portanto, é verdade em qualquer base:
Este é um resultado muito importante e vem diretamente de nossa definição de derivada covariante.
Lembrando § 5.4, vemos que se temos ÿÿÿ = ÿÿÿ, então a Eq. (6.31) leva à Eq. (5.75) para qualquer métrica:
1
ÿ = (6.32)
ÿÿ gÿÿ(gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ).
2
Resta a Exer. 5, § 6.9, para demonstrar, repetindo o argumento do espaço plano agora no referencial
localmente inercial, que ÿÿÿ é de fato simétrico em qualquer sistema de coordenadas, de modo que a Eq.
(6.32) está correto em quaisquer coordenadas. Assumimos no início que em P em um referencial localmente
inercial, ÿÿÿ = 0. Mas, mais importante, as derivadas de ÿÿÿ em P neste referencial não são todas nulas
geralmente, uma vez que envolvem gÿÿ,ÿ ÿ. Isso significa que, embora as coordenadas possam ser
encontradas em que ÿÿÿ = 0 em um ponto, esses símbolos geralmente não desaparecem em outros
lugares. Isso difere do espaço plano, onde existe um sistema de coordenadas em que ÿÿÿ = 0 em todos os lugares.
Assim, podemos ver que em qualquer ponto, a diferença entre uma variedade geral e uma plana se
manifesta nas derivadas dos símbolos de Christoffel.
Machine Translated by Google
Eq. (6.32) significa que, dado gÿÿ, podemos calcular ÿÿÿ em qualquer lugar. Podemos, portanto,
calcule todas as derivadas covariantes, dada g. Para revisar as fórmulas:
Fórmula de divergência
Muitas vezes lidamos com a divergência de vetores. Dado um campo vetorial arbitrário Vÿ, sua
divergência é definida pela Eq. (5.53),
ÿ
= Vÿ
Vÿ + ;ÿ,ÿ ÿÿVÿ. (6,36)
Esta fórmula envolve uma soma no símbolo de Christoffel, que, da Eq. (6.32), é
1
ÿ
=
ÿÿ
2 gÿÿ(gÿÿ,ÿ + gÿÿ,ÿ ÿ gÿÿ,ÿ)
1 1
= gÿÿ(gÿÿ,ÿ ÿ gÿÿ,ÿ) + (6,37)
2 2 gÿÿgÿÿ,ÿ.
Isso teve seus termos reorganizados para simplificá-lo: observe que o termo entre parênteses é
antisimétrica em ÿ e ÿ, enquanto é contraída em ÿ e ÿ com gÿÿ, que é simétrica.
O primeiro termo, portanto, desaparece (veja Exer. 26(a), § 3.10) e encontramos
1
ÿ
= (6,38)
ÿÿ
2 gÿÿgÿÿ,ÿ.
Como (gÿÿ) é a matriz inversa de (gÿÿ), pode-se mostrar (ver Exer. 7, § 6.9) que a
derivada do determinante g da matriz (gÿÿ) é
ÿ
ÿÿ = ( ÿ ÿ g),ÿ/ ÿ ÿ g. (6,40)
1
= Vÿ
Vÿ ;ÿ ,ÿ ÿÿg Vÿ( ÿ ÿ g),ÿ + (6.41)
Machine Translated by Google
ou
1
Vÿ;ÿ
= ( ÿ ÿ gVÿ),ÿ. ÿ (6,42)
ÿg
Esta é uma fórmula muito mais fácil de usar do que a Eq. (6.36). Também é importante para a lei
de Gauss, onde integramos a divergência sobre um volume (usando, é claro, o elemento de volume
adequado):
;ÿ ÿÿg (6,43)
' Vÿ d4x = ' ( ÿ ÿ gVÿ),ÿ d4x.
Como o termo final envolve derivadas parciais simples, a matemática da lei de Gauss se
aplica a ele, assim como em SR (§ 4.8):
d3S. (6,44)
' ( ÿ ÿ gVÿ),ÿ d4x = ( Vÿnÿ ÿ ÿ g
Isso significa
Portanto, a lei de Gauss se aplica a uma variedade curva, na forma dada pela Eq. (6,45).
Precisamos integrar a divergência sobre o volume próprio e usar o elemento de superfície
apropriado, nÿ ÿ ÿ g d3S, na integral de superfície.
Até agora, usamos o teorema da planicidade local para desenvolver o máximo possível de matemática
em variedades curvas sem considerar a curvatura explicitamente. De fato, ainda temos que dar uma
definição matemática precisa de curvatura. É importante distinguir dois tipos diferentes de curvatura:
intrínseca e extrínseca. Considere, por exemplo, um cilindro.
Como um cilindro é redondo em uma direção, pensamos nele como curvo. Esta é a sua
curvatura extrínseca : a curvatura que tem em relação ao espaço tridimensional plano do qual faz parte.
Por outro lado, um cilindro pode ser feito enrolando um pedaço de papel plano sem rasgá-lo
ou amassá-lo, de modo que a geometria intrínseca é a do papel original: é plano. Isso significa
que a distância na superfície do cilindro entre quaisquer dois pontos é a mesma do papel
original; linhas paralelas permanecem paralelas quando continuadas; na verdade, todos os
axiomas de Euclides valem para a superfície de um cilindro. Uma 'formiga' bidimensional
confinada a essa superfície decidiria que ela era plana; apenas sua topologia global é
engraçada, pois ir em uma certa direção em linha reta o traz de volta ao ponto de partida. A
geometria intrínseca de uma variedade n-dimensional considera apenas as relações entre seus pontos em
Machine Translated by Google
O cilindro, como acabamos de ver, é intrinsecamente plano; uma esfera, por outro lado, tem uma
superfície intrinsecamente curva. Para ver isso, considere a Fig. 6.1, na qual duas linhas vizinhas
começam em A e B perpendiculares ao equador e, portanto, são paralelas. Quando continuadas como
linhas localmente retas, elas seguem o arco de grandes círculos, e as duas linhas se encontram no pólo
P. As linhas paralelas, quando continuadas, não permanecem paralelas, portanto o espaço não é plano.
Há uma ilustração ainda mais impressionante da curvatura da esfera. Considere, primeiro, o espaço
plano. Na Fig. 6.2 é traçado um caminho fechado no espaço plano e, a partir de A, em cada ponto é
traçado um vetor paralelo ao do ponto anterior. Essa construção é realizada ao redor do laço de A a B a
C e de volta a A. O vetor finalmente desenhado em A é, obviamente, paralelo ao original. Uma coisa
completamente diferente acontece em uma esfera! Considere o caminho mostrado na Fig. 6.3. Lembre-
se, estamos desenhando o vetor como ele é visto por uma formiga bidimensional na esfera, então ele
deve sempre ser tangente à esfera. Além disso, cada vetor é desenhado o mais paralelo possível ao
anterior. Neste loop, A e C estão no equador separados por 90ÿ e B está no pólo. Cada arco é o arco de
um grande círculo e cada um tem 90ÿ de comprimento. Em A escolhemos o vetor paralelo ao equador.
À medida que avançamos em direção a B, cada novo vetor é traçado perpendicularmente ao arco AB.
Quando chegamos a B,
UMA B
UMA
UMA
ÿ ÿ
você você
ÿ
V
ÿ
V
os vetores são tangentes a BC. Então, indo de B para C, continuamos desenhando tangentes a BC.
Estes são perpendiculares ao equador em C, e assim de C a A os novos vetores permanecem
perpendiculares ao equador. Assim, o campo vetorial girou 90ÿ nesta construção!
Apesar do fato de cada vetor ser desenhado paralelamente ao seu vizinho, o laço fechado causou uma
discrepância. Como isso não acontece no espaço plano, deve ser um efeito da esfera
curvatura.
Este resultado tem implicações radicais: em uma variedade curva simplesmente não é possível
definir campos vetoriais globalmente paralelos. Ainda podemos definir paralelismo local, por exemplo,
como mover um vetor de um ponto para outro, mantendo-o paralelo e com o mesmo comprimento. Mas
o resultado desse 'transporte paralelo' do ponto A ao ponto B depende do caminho percorrido.
Portanto, não podemos afirmar que um vetor em A é ou não paralelo a (ou o mesmo que) um certo
vetor em B.
Transporte paralelo
A construção que acabamos de fazer na esfera é chamada de transporte paralelo. Suponha que um
campo vetorial V seja definido na esfera, e examinamos como ele muda ao longo de uma curva, como
na Fig. 6.4. Se os vetores V em pontos infinitesimalmente próximos da curva são paralelos e de igual
comprimento, diz-se que V é transportado paralelamente ao longo da curva. É fácil escrever uma
equação para isso. Se U = d x/dÿ é a tangente à curva (ÿ sendo o parâmetro
Machine Translated by Google
ao longo dele; U não é necessariamente normalizado), então em um sistema de coordenadas localmente inercial em um
ponto P as componentes de V devem ser constantes ao longo da curva em P:
dVÿ
= 0 em P. (6,46)
dÿ
dVÿ
= UÿVÿ = UÿVÿ = 0 em P. ,ÿ ;ÿ (6,47)
dÿ
A primeira igualdade é a definição da derivada de uma função (neste caso Vÿ) ao longo do
curva; a segunda igualdade vem do fato de que ÿÿÿ = 0 em P nessas coordenadas.
Mas a terceira igualdade é uma expressão invariante de quadro e vale em qualquer base, então pode ser
tomado como uma definição invariante de quadro do transporte paralelo de V ao longo de U :
d
UÿVÿ dÿ = 0 ÿ V = ÿU¯ V = 0. ;ÿ (6,48)
O último passo usa a notação para a derivada ao longo de U introduzida na Eq. (3,67).
Geodésica
As curvas mais importantes no espaço plano são as linhas retas. Um dos axiomas de Euclides é que
duas linhas retas inicialmente paralelas permanecem paralelas quando estendidas. O que ele faz
quer dizer com 'estendido'? Ele não quer dizer 'continuado de tal forma que a distância entre
permanece constante', porque mesmo assim ambos podem dobrar. O que ele quer dizer é que
cada linha continua indo na direção em que estava indo. Mais precisamente, a tangente a
a curva em um ponto é paralela à tangente no ponto anterior. Na verdade, uma linha reta
no espaço euclidiano é a única curva que transporta paralelamente seu próprio vetor tangente! Em um
espaço curvo, também podemos desenhar linhas que são 'tão quase retas quanto possível' exigindo
transporte paralelo do vetor tangente. São as chamadas geodésicas:
(Observe que em um sistema localmente inercial essas linhas são retas.) Em notação de componentes:
d dxÿ ÿ
dxÿ dxÿ
+ ÿÿ = 0. (6,51)
dÿ dÿ dÿ dÿ
Machine Translated by Google
Como os símbolos de Christoffel ÿÿÿ são funções conhecidas das coordenadas {xÿ}, isso é
uma equação diferencial não linear (quase-linear), de segunda ordem para xÿ(ÿ). Tem um único
solução quando as condições iniciais em ÿ = ÿ0 são dadas: xÿ 0 = xÿ (ÿ0) e Uÿ 0 = (dxÿ/dÿ)ÿ0 .
Então, dando uma posição inicial (xÿ 0 ) e uma direção inicial (Uÿ 0 ), obtemos um único
geodésico.
Lembre-se que se mudarmos de parâmetro, mudamos, matematicamente falando, a curva
(embora não os pontos por onde passa). Agora, se ÿ é um parâmetro de uma geodésica (de modo que
Eq. (6.51) for satisfeito), e se definirmos um novo parâmetro
ÿ = aÿ + b, (6,52)
De um modo geral, apenas transformações lineares de ÿ como a Eq. (6.52) fornecerá novos parâmetros nos quais
a equação geodésica é satisfeita. Um parâmetro como ÿ e ÿ acima é chamado
um parâmetro afim . Uma curva com a mesma trajetória de uma geodésica, mas parametrizada por uma
parâmetro não afim é, estritamente falando, não uma curva geodésica.
Uma geodésica também é uma curva de comprimento extremo entre quaisquer dois pontos: seu comprimento é
inalterado para primeira ordem em pequenas mudanças na curva. O aluno é convidado a provar isso
usando a Eq. (6.7), encontrando as equações de Euler-Lagrange para que seja um extremo para fixo
ÿ0 e ÿ1, e mostrando que estes se reduzem à Eq. (6.51) quando a Eq. (6.32) é usado. Isto é um
exercício muito instrutivo. Também podemos mostrar que a distância adequada ao longo da geodésica é ela mesma
um parâmetro afim (ver Exers. 13–15, § 6.9).
UMA C
D x1=a+ÿa
x2=b
x1=a
x2=b+ÿb
onde a notação 'x2 = b' sob a integral denota o caminho AB. Transporte semelhante de B para C para D
dá
ÿ
ÿ2Vÿ dx2 , (6,55)
Vÿ(C) = Vÿ(B) ÿ ' x1=a+ÿa
ÿ
ÿ1Vÿ dx1. (6,56)
Vÿ(D) = Vÿ(C) + ' x2=b+ÿb
ÿ
ÿ2Vÿ dx2 . (6,57)
Vÿ(Afinal) = Vÿ(D) + ' x1=a
A variação líquida em Vÿ(A) é um vetor ÿVÿ, encontrado pela adição das Eqs. (6,54)-(6,57):
ÿ ÿ2Vÿdx2
= '+' x1=a ÿ ÿ2Vÿdx2 ÿ ' x1=a+ÿa
ÿ ÿ1Vÿdx1. (6,58)
x2=b+ÿb ÿ ÿ1Vÿdx1 ÿ ' x2=b
Observe que eles se cancelariam em pares se ÿÿÿ e Vÿ fossem constantes no loop, como seriam no
espaço plano. Mas no espaço curvo eles não são, então se combinarmos as integrais sobre variáveis
de integração semelhantes e trabalharmos na primeira ordem na separação nos caminhos, chegaremos
à ordem mais baixa,
b+ÿb ÿ
ÿ
ÿa ( ÿx1 ÿ2Vÿ) dx2
ÿVÿ ÿ ' b
a+ÿa ÿ
ÿ
ÿb ÿ1Vÿ) dx1 (6,59)
+'ÿ uma
( ÿx2
ÿ ÿ
ÿ ÿ
ÿ2Vÿ) + ( ÿx2 (6,60)
ÿa ÿb $ ÿ ( ÿx1 ÿ1Vÿ) ! .
(Para obter isso, precisamos rotular índices fictícios nos termos quadráticos em s.) Observe
que isso acaba sendo apenas um número vezes Vÿ, somado em ÿ. Agora, os índices 1 e 2
aparecem porque o caminho foi escolhido para percorrer essas coordenadas. É antisimétrica em
1 e 2 porque a mudança ÿVÿ teria que ter o sinal oposto se dermos a volta
o loop na direção oposta (ou seja, trocando os papéis de 1 e 2). se nós usássemos
linhas de coordenadas gerais xÿ e xÿ, encontraríamos
Agora, ÿVÿ depende de ÿa ÿb, a coordenada 'área' do laço. Então fica claro que se o
o comprimento do laço em uma direção é dobrado, ÿVÿ é dobrado. Isso significa que ÿVÿ depende
linearmente em ÿa eÿ e ÿb eÿ. Além disso, certamente também depende linearmente na Eq. (6.62) em
Vÿ em si e em ÿ˜ ÿ, que é a base de uma forma que dá ÿVÿ a partir do vetor ÿV . Por isso
ÿ ÿ ÿ ÿ ÿ ÿ
Rÿ ÿÿÿ := ÿÿ,ÿ ÿ ÿÿ,ÿ + ÿÿ ÿÿ - ÿÿ ÿÿ,
(6,63)
1
então Rÿÿÿÿ deve ser componentes do ÿ˜ ÿ, V 3
tensor que, quando fornecido com argumentos
, ÿa eÿ, ÿb eÿ , dá ÿVÿ, o componente da mudança em V após transporte paralelo
em torno de um laço dado por ÿa eÿ e ÿb eÿ . Este tensor é chamado de curvatura de Riemann
tensor R. 1
ÿ = 1
(6,64)
ÿÿ,ÿ 2 gÿÿ gÿÿ,ÿÿ + gÿÿ,ÿÿ ÿ gÿÿ,ÿÿ .
Rÿ
= 1
ÿÿÿ 2 gÿÿ (gÿÿ,ÿÿ + gÿ ÿ,ÿÿ ÿ gÿÿ,ÿÿ
gÿÿ,ÿÿ = gÿÿ,ÿÿ,
(6,66)
Rÿ
= 1
(6,67)
ÿÿÿ 2 gÿ ÿ gÿ ÿ,ÿÿ ÿ gÿÿ,ÿÿ + gÿÿ,ÿ ÿ ÿ gÿÿ,ÿÿ .
Se baixarmos o índice ÿ, obtemos (no sistema de coordenadas localmente plano em sua origem P)
1
Tal como acontece com outras definições que introduzimos anteriormente, não há acordo universal sobre o sinal geral de
o tensor de Riemann, ou mesmo na colocação de seus índices. Sempre verifique as convenções de qualquer livro
você lê.
Machine Translated by Google
= 1 (6,68)
Rÿÿÿÿ := gÿÿRÿ ÿÿÿ 2 gÿÿ,ÿÿ ÿ gÿÿ,ÿÿ + gÿÿ,ÿÿ ÿ gÿÿ,ÿÿ .
Assim, Rÿÿÿÿ é antisimétrica no primeiro par e no segundo par de índices, e simétrica na troca dos dois
pares. Uma vez que as Eqs. (6.69) e (6.70) são equações tensoriais válidas verdadeiras em um sistema
de coordenadas, elas são verdadeiras em todas as bases. (Observe que uma equação como a Eq. (6.67)
não é uma equação tensorial válida, pois envolve derivadas parciais, não covariantes. Portanto, é
verdadeira apenas no sistema de coordenadas em que foi derivada.)
Pode-se mostrar (Exer. 18, § 6.9) que as várias identidades, Eqs. (6.69) e (6.70), reduzem o número
de componentes independentes de Rÿÿÿÿ (e, portanto, de Rÿÿÿÿ ) para 20, em quatro dimensões. Este é,
não por coincidência, o mesmo número de gÿÿ,ÿÿ independentes que encontramos no final do § 6.2 não
poderia ser anulado por uma transformação de coordenadas.
Assim Rÿÿÿÿ caracteriza a curvatura de forma tensorial.
Uma variedade plana é aquela que tem uma definição global de paralelismo: um vetor pode ser movido
paralelamente a si mesmo em uma curva arbitrária e retornará ao seu ponto de partida inalterado.
Isso significa claramente que
(Tente mostrar que isso é verdade em coordenadas polares para o plano euclidiano.)
Um uso importante do tensor de curvatura vem quando examinamos as consequências de tomar duas
derivadas covariantes de um campo vetorial V . Descobrimos no § 6.3 que as primeiras derivadas eram
como as do espaço plano, pois poderíamos encontrar coordenadas nas quais a métrica era plana de
primeira ordem. Mas as segundas derivadas são uma história diferente:
Em coordenadas localmente inerciais cuja origem está em P, todos os s são zero, mas suas derivadas
parciais não. Portanto, temos em P
Tenha em mente que esta expressão é válida apenas neste sistema de coordenadas especialmente
escolhido, e isso também é verdade para as Eqs. (6.74) a (6.76) abaixo. Essas coordenadas facilitam o
cálculo: considere agora a Eq. (6.73) com ÿ e ÿ trocados:
ÿÿÿ,ÿ Vÿ . (6,75)
[Vamos fazer uma pausa para lembrar que Vÿ,ÿ é a derivada parcial da componente Vÿ, então pelas
leis da diferenciação parcial as derivadas parciais devem comutar. Por outro lado, ÿÿVÿ é um
componente do tensor ÿV , e ÿÿÿÿVÿ é um componente de ÿÿV : não há razão (do
cálculo diferencial) para que seja simétrica em ÿ e ÿ. Provamos, mostrando que a Eq. (6.75) é diferente
de zero, que a derivada covariante dupla geralmente não é simétrica.] Agora, neste quadro (onde ÿÿÿ
= 0 em P), podemos comparar a Eq. (6,75) com a Eq. (6.63) e veja que em P
Agora, esta é uma equação tensorial válida, então é verdade em qualquer sistema de coordenadas: o
tensor de Riemann fornece o comutador de derivadas covariantes. Podemos descartar a restrição
para coordenadas localmente inerciais: elas eram simplesmente uma maneira conveniente de chegar
a uma expressão geral de tensor para o comutador. O que isso significa é que em espaços curvos,
devemos ter o cuidado de saber a ordem em que as derivadas covariantes são tomadas: elas não comutam.
Isso pode ser estendido para tensores de classificação mais alta. Por exemplo, um 1tensor
1
tem
ÿ
[ÿÿ, ÿÿ]Fÿÿ = Rÿÿ ÿÿFÿ ÿ + Rÿ ÿÿFÿÿ . (6,78)
Ou seja, cada índice recebe um tensor de Riemann nele, e cada um vem com um sinal +. (Todos eles
devem ter o mesmo sinal porque aumentar e diminuir índices com g não é afetado por ÿÿ, já que ÿg =
0.)
Eq. (6.77) está intimamente relacionado à nossa derivação original do tensor de Riemann a partir
do transporte paralelo em torno de laços, porque o problema do transporte paralelo pode ser pensado
como computação, primeiro a mudança de V em uma direção e depois em outra, seguida por
subtraindo as mudanças na ordem inversa: é isso que a comutação de derivadas covariantes também
faz.
Desvio geodésico
Muitas vezes mencionamos que em um espaço curvo, linhas paralelas quando estendidas não
permanecem paralelas. Isso agora pode ser formulado matematicamente em termos do tensor de
Riemann. Considere duas geodésicas (com tangentes V e V ) que começam paralelas e próximas
.
uma da outra, como na Fig. 6.6, nos pontos A e A. Seja o parâmetro afim nas geodésicas chamado ÿ.
Machine Translated by Google
ÿÿ B' ÿ
UMA'
V'
ÿ
ÿ ÿ(B)
ÿ(A) ÿ
V
ÿÿ B
UMA
Figura 6.6 Um vetor de conexão ÿ entre duas geodésicas conecta pontos de mesmo valor de parâmetro.
Definimos um 'vetor de conexão' ÿ que 'alcança' de uma geodésica a outra, conectando pontos em intervalos
, inercial
iguais em ÿ (ie A a AB a B , etc.). Para simplificar, vamos adotar um sistema
em
aponta
de
A, coordenadas
no ao
qual
longo
a coordenada
da
localmente
geodésica
x0 e
avança na mesma taxa que ÿ ali (isto é apenas um escalonamento da coordenada).
d2xÿ *
* = 0, * dÿ2 (6,79)
*A
uma vez que todos os símbolos de Christoffel desaparecem em A. Os símbolos de Christoffel não , assim
d2xÿ * * *
ÿ
+ 00(A ) = 0, (6,80)
dÿ2 *A
onde novamente em A arranjamos as coordenadas de modo que Vÿ = ÿÿ 0 . Mas, como A e A são separados
por ÿ , temos
ÿ ÿ
00(A ) ÿ= 00,ÿÿÿ , (6,81)
d2xÿ * * ÿ
=ÿ
00,ÿÿÿ . (6,82)
* dÿ2 *A
ÿ
Agora, a diferença xÿ(ÿ, geodésica V ) ÿ xÿ(ÿ, geodésica V ) é apenas a componente ÿ vetor ÿ . do
Portanto, em A, temos
=ÿ
(6,83)
00,ÿÿÿ .
dÿ2 *A
dÿ2 *A
Isso então dá como os componentes de ÿ mudam. Mas como as coordenadas são até certo ponto arbitrárias,
queremos ter não apenas a segunda derivada do componente ÿ ÿ, mas a segunda derivada covariante completa
ÿVÿVÿ . Podemos usar a Eq. (6.48) para obter
ÿ
ÿVÿVÿ = ÿV(ÿVÿ ÿ)
d ÿ
= (ÿVÿ ÿ) = dÿ (6,84)
ÿ0(ÿVÿÿ ).
Machine Translated by Google
d d
ÿ
= ÿ
+
ÿ ÿ +0
ÿVÿVÿ ÿ0ÿ
dÿ ÿ dÿ
d2
= ÿ
+
ÿ ÿ (6,85)
ÿ dÿ2 ÿ0,0ÿ
ÿ
= ÿ ÿ ÿ
ÿVÿVÿ ÿ0,0 ÿ 00, ÿÿ
ÿ (6,86)
= Rÿ 00ÿÿ = Rÿ ÿÿÿVÿVÿ ÿ ÿ,
onde a segunda igualdade segue da Eq. (6,63). A expressão final é invariante de quadro,
e A era um ponto arbitrário, então temos, em qualquer base,
ÿ
ÿVÿVÿ = Rÿ ÿÿÿVÿVÿ ÿ ÿ. (6,87)
As geodésicas em espaço plano mantêm sua separação; aqueles em espaços curvos não. Isto é
chamada de equação do desvio geodésico e mostra matematicamente que as forças de maré de
um campo gravitacional (que faz com que as trajetórias de partículas vizinhas divirjam) pode ser
representado pela curvatura de um espaço-tempo em que as partículas seguem geodésicas.
1
Rÿÿÿÿ,ÿ = gÿÿ,ÿÿÿ ÿ gÿÿ,ÿÿÿ + gÿÿ,ÿÿÿ ÿ gÿÿ,ÿÿÿ . (6,88)
2
A partir desta equação, a simetria gÿÿ = gÿÿ e o fato de que as derivadas parciais comutam,
podemos mostrar que
Mas esta é uma equação tensorial, válida em qualquer sistema. É chamado de identidades Bianchi, e
ser muito importante para o nosso trabalho.
Machine Translated by Google
O tensor de Ricci
É a contração de Rÿÿÿÿ no primeiro e terceiro índices. Em princípio, outras contrações também seriam
possíveis: na primeira e na segunda, na primeira e na quarta, etc. Mas como Rÿÿÿÿ é antisimétrica em ÿ e ÿ
e em ÿ e ÿ, todas essas contrações ou desaparecem identicamente ou se reduzem a ±Rÿÿ. Portanto, o tensor
de Ricci é essencialmente a única contração do tensor de Riemann. Observe que a Eq. (6.69) implica que é
um tensor simétrico (Exer. 25, § 6.9).
Da mesma forma, o escalar de Ricci é definido como
O tensor de Einstein
ou
Para derivar este resultado, precisamos de dois fatos. Primeiro, pela Eq. (6.31) temos
gÿÿ;ÿ = 0.
Portanto, gÿÿ e gÿÿ podem ser incluídos e retirados de derivadas covariantes à vontade: aumento e redução
de índice comuta com diferenciação covariante. O segundo fato é que
representando o segundo termo da Eq. (6,93). Eq. (6.93) é chamado de identidades Bianchi contratadas.
Uma equação mais útil é obtida contraindo novamente os índices ÿ e ÿ:
ou
Novamente a antisimetria de R foi usada para obter o sinal correto no último termo. Observação
que como R é um escalar, R;ÿ ÿ R,ÿ em todas as coordenadas. Agora, a eq. (6.96) pode ser escrito em
a forma
Estas são as identidades Bianchi contraídas duas vezes, muitas vezes simplesmente chamadas de Bianchi
identidades. Se definirmos o tensor simétrico
1
Gÿÿ ÿ Rÿÿ ÿ (6,98)
2 gÿÿR = Gÿÿ,
=
Gÿÿ 0. ;ÿ (6,99)
O tensor Gÿÿ é construído apenas a partir do tensor de Riemann e da métrica, e é automaticamente livre de
divergência como identidade. É chamado de tensor de Einstein, pois sua importância
para a gravidade foi entendido pela primeira vez por Einstein. [Na verdade, veremos que o campo de Einstein
equações para GR são
Gÿÿ = 8ÿTÿÿ
Tÿÿ ;ÿ ÿ 0,
que é a equação da conservação local da energia e do momento. Mas isso está procurando
um pouco à frente.]
(1) Trabalhamos em variedades Riemannianas, que são espaços lisos com uma métrica definida
neles.
(2) A métrica tem assinatura +2, e sempre existe um sistema de coordenadas no qual, em
um único ponto, podemos ter
Machine Translated by Google
gÿÿ = ÿÿÿ,
ÿ
gÿÿ,ÿ = 0 ÿ = 0.
ÿÿ
6.8 P ara
6.9 Exercícios
1 Decida se os seguintes conjuntos são múltiplos e diga por quê. Se houver pontos excepcionais
em que os conjuntos não são múltiplos, dê-lhes:
(a) espaço de fase da mecânica hamiltoniana, o espaço das coordenadas canônicas e
momentos pi e qi ;
(b) o interior de um círculo de raio unitário no espaço euclidiano bidimensional; (c) o
conjunto de permutações de n objetos; (d) o subconjunto do espaço euclidiano de
duas dimensões (coordenadas x e y) que é uma solução para xy (x2 + y2 ÿ 1) = 0.
2 Das variedades em Exer. 1, em que é costume usar uma métrica, e o que é isso
métrica? Em que uma métrica normalmente não seria definida e por quê?
Machine Translated by Google
3 É bem conhecido que para qualquer matriz simétrica A (com entradas reais), existe uma matriz H para a
qual a matriz HTAH é uma matriz diagonal cujas entradas são os autovalores de A. (a) Mostre que existe
uma matriz R tal que RTHTAHR é a mesma matriz que HTAH , exceto com os autovalores rearranjados
em ordem crescente ao longo da diagonal principal de cima para baixo.
(b) Mostre que existe uma terceira matriz N tal que NTRHTAHRN é uma diagonal
matriz cujas entradas na diagonal são -1, 0 ou +1. (c) Mostre que
se A tem uma inversa, nenhum dos elementos diagonais em (b) é zero. (d) Mostre de (a)-(c)
que existe uma matriz de transformação que produz
Eq. (6.2).
4 Prove os seguintes resultados usados na prova do teorema da planicidade local em § 6.2:
(a) O número de valores independentes de ÿ2xÿ/ÿxÿ ÿxÿ |0 é 40. (b) O número
correspondente para ÿ3xÿ/ÿxÿ ÿxÿ ÿxÿ |0 é 80. (c) O número correspondente
para gÿÿ ,ÿ ÿ|0 é 100.
5 (a) Prove que ÿÿÿ = ÿÿÿ em qualquer sistema de coordenadas em um espaço Riemanniano curvo. (b) Use
isso para provar que a Eq. (6.32) pode ser derivada da mesma maneira que no espaço plano.
6 Prove que o primeiro termo da Eq. (6.37) desaparece. 7
(a) Dê a definição do determinante de uma matriz A em termos de cofatores de
elementos.
(b) Diferencie o determinante de uma matriz 2 × 2 arbitrária e mostre que ele satisfaz
Eq. (6.39).
(c) Generalize a Eq. (6.39) (por indução ou de outra forma) para matrizes n × n arbitrárias.
8 Preencha a álgebra que falta levando às Eqs. (6,40) e (6,42).
9 Mostre que a Eq. (6.42) leva à Eq. (5,56). Derive a fórmula de divergência para a métrica
na Eq. (6.19).
10 Uma 'linha reta' em uma esfera é um grande círculo, e é bem conhecido que a soma dos ângulos internos
de qualquer triângulo em uma esfera cujos lados são arcos de grandes círculos excede 180°. Mostre que
a quantidade pela qual um vetor é girado por transporte paralelo em torno de tal triângulo (como na Fig.
6.3) é igual ao excesso da soma dos ângulos sobre 180°.
11 Neste exercício vamos determinar a condição de que um campo vetorial V pode ser considerado
ser globalmente paralelo em uma variedade. Mais precisamente, o que garante que podemos encontrar
um campo vetorial V satisfazendo a equação
ÿ ÿ
(ÿV ) = Vÿ = Vÿ ,ÿ+ ;ÿ ÿÿVÿ = 0?
ÿ
(a) Uma condição necessária, chamada de condição de integrabilidade para esta equação, decorre da
comutação de derivadas parciais. Mostre que Vÿ,ÿÿ = Vÿ,ÿÿ implica
ÿ ÿ ÿ ÿ
ÿÿ,ÿ ÿ ÿÿ,ÿ
Vÿ = ÿÿ ÿÿ ÿ
ÿ
ÿÿ ÿÿÿ Vÿ .
13 (a) Mostre que se A e B são transportados paralelamente ao longo de uma curva, então g(A , B ) = A ·
B é constante na curva.
(b) Conclua disso que se uma geodésica é espacial (ou temporal ou nula) em algum lugar,
é semelhante ao espaço (ou temporal ou nulo) em todos os lugares.
14 A distância adequada ao longo de uma curva cuja tangente é V é dada pela Eq. (6.8). Mostre que se a
curva é geodésica, então o comprimento adequado é um parâmetro afim. (Use o resultado do Exer.
13.)
15 Use Exers. 13 e 14 para provar que o comprimento adequado de uma geodésica entre dois pontos é
inalterado em primeira ordem por pequenas mudanças na curva que não alteram suas extremidades.
16 (a) Deduza as Eqs. (6,59) e (6,60) da Eq. (6,58). (b) Preencha
a álgebra necessária para justificar a Eq. (6.61).
17 (a) Prove que a Eq. (6.5) implica gÿÿ,ÿ(P) = 0. (b) Use
isso para estabelecer a Eq. (6,64). (c) Preencha os
passos necessários para estabelecer a Eq. (6,68). 18 (a)
Deduza as Eqs. (6,69) e (6,70) da Eq. (6,68).
(b) Mostre que a Eq. (6.69) reduz o número de componentes independentes de Rÿÿÿÿ de 4 × 4 × 4 ×
4 = 256 para 6 × 7/2 = 21. (Dica: trate pares de índices. Calcule quantas escolhas independentes
de pares existem para o primeiro e os segundos pares em Rÿÿÿÿ.)
(c) Mostre que a Eq. (6.70) impõe apenas mais uma relação independente da Eq. (6,69)
nos componentes, reduzindo o total de independentes para 20.
19 Prove que Rÿÿÿÿ = 0 para coordenadas polares no plano euclidiano. Use a Eq. (5.45) ou resultados
equivalentes.
20 Preencha a álgebra necessária para estabelecer a Eq. (6,73).
21 Considere as sentenças que seguem a Eq. (6,78). Por que o argumento entre parênteses não se aplica
aos sinais em
ÿ
Vÿ = Vÿ ,ÿ + ;ÿ ÿÿVÿ e Vÿ;ÿ = Vÿ,ÿ ÿ ÿÿÿVÿ?
31 Mostre que a diferenciação covariante obedece à regra do produto usual, por exemplo (VÿÿWÿÿ );ÿ =
Vÿÿ ;ÿ Wÿÿ + VÿÿWÿÿ ;ÿ. (Dica: use um referencial localmente inercial.)
32 Uma variedade quadridimensional tem coordenadas (u, v, w, p) nas quais a métrica tem componentes
guv = gww = gpp = 1, todos os outros componentes independentes
desaparecimento.
2 2
dias = ÿ(1 + 2ÿ) dt + (1 ÿ 2ÿ)( dx2 + dy2 + dz 2),
onde |ÿ(t, x, y, z)| 1 em todos os lugares. Em qualquer ponto P com coordenadas (t0, x0, y0, z0),
encontrar uma transformação de coordenadas para um sistema de coordenadas localmente inercial, para primeira ordem em
37 (a) O 'volume próprio' de uma variedade bidimensional é geralmente chamado de 'área própria'.
Usando a métrica em Exer. 28, integre a Eq. (6.18) para encontrar a área adequada de uma esfera
de raio r.
39 (a) Para quaisquer dois campos vetoriais U e V , seu colchete Lie é definido como o campo vetorial
[U , V ] com componentes
Mostrar isso
[U , V ] = ÿ[V , U ],
[U , V ] = Uÿ ÿ Vÿ/ÿxÿ ÿ Vÿ ÿUÿ/ÿxÿ.
Este é um campo tensorial no qual as derivadas parciais não precisam ser acompanhadas por
Símbolos de Christoffel!
(b) Mostre que [U , V ] é um operador derivativo em V ao longo de U escalar, ou seja, mostre que para qualquer
f,
[U , V ] := £ U V , U · ÿf := £U f . (6.102)
£U (fV ) = f £ UV + V £ f. (6.103)
O resultado de (a) mostra que este operador derivativo pode ser definido sem uma conexão ou
métrica e, portanto, é muito fundamental. Veja Schutz (1980b) para uma
introdução.
A essência de uma teoria física expressa em forma matemática é a identificação dos conceitos matemáticos
com certas quantidades fisicamente mensuráveis. Esta deve ser a nossa primeira preocupação quando
olhamos para a relação dos conceitos de geometria que desenvolvemos com os efeitos da gravidade no
mundo físico. Já discutimos isso até certo ponto. Em particular, assumimos que o espaço-tempo é uma
variedade diferenciável e mostramos que não existem referenciais inerciais globais na presença de campos
gravitacionais não uniformes. Por trás dessas declarações estão as duas identificações:
(I) O espaço-tempo (o conjunto de todos os eventos) é uma variedade quadridimensional com uma métrica.
(II) A métrica é mensurável por hastes e relógios. A distância ao longo de uma haste entre dois pontos
próximos é |d x · d x| 1/2 e o tempo medido por um relógio que experimenta dois eventos
intimamente separados no tempo é | ÿ dx · dx| 1/2.
Portanto, geralmente não existem coordenadas nas quais d x · d x = ÿ(dx0) 2 + (dx1) 2 ( dx2) 2 + (dx3 ) +
2 em todos
sugere
os lugares.
claramente
Poro uma
fazem outrovariedade
lado,
produto também
curvada,
escalar em argumentamos
na qual
um ponto podem
que tais
particular ser encontradas
frames
parecer comexistem
coordenadas
localmente.
o espaço-tempo que
de Isso
Minkowski.
(III) A métrica do espaço-tempo pode ser colocada na forma de Lorentz ÿÿÿ em qualquer evento
particular por uma escolha apropriada de coordenadas.
Tendo escolhido esta forma de representar o espaço-tempo, devemos fazer mais duas coisas para obter
uma teoria completa. Primeiro, devemos especificar como os objetos físicos (partículas, campos elétricos,
fluidos) se comportam em um espaço-tempo curvo e, segundo, precisamos dizer como a curvatura é gerada
ou determinada pelos objetos no espaço-tempo.
Consideremos a gravidade newtoniana como um exemplo de teoria física. Para Newton, o espaço-tempo
consistia em espaço euclidiano tridimensional, repetido interminavelmente no tempo.
(Matematicamente, isso é chamado de R3 × R.) Não havia métrica no espaço-tempo como um todo
Machine Translated by Google
múltiplo, mas o espaço euclidiano tinha sua métrica usual e o tempo era medido por um relógio universal.
Observadores com velocidades diferentes eram todos igualmente válidos: essa forma de relatividade foi
incorporada à mecânica galileana. Portanto, não havia um padrão universal de descanso, e observadores
diferentes teriam definições diferentes sobre se dois eventos ocorrendo em momentos diferentes aconteceram no
mesmo local. Mas todos os observadores concordariam com a simultaneidade, se dois eventos aconteceram na
mesma fatia de tempo ou não. Assim, a "separação no tempo" entre dois eventos significava o tempo decorrido
entre as duas fatias euclidianas contendo os dois eventos. Isso era independente das localizações espaciais dos
eventos, então na gravidade newtoniana havia uma noção universal de tempo: todos os observadores,
independentemente da posição ou movimento, concordavam com o tempo decorrido entre dois eventos dados.
Da mesma forma, a 'separação no espaço' entre dois eventos significava a distância euclidiana entre eles. Se os
eventos fossem simultâneos, ocorrendo na mesma fatia de tempo euclidiana, então isso seria simples de calcular
usando a métrica dessa fatia, e todos os observadores concordariam com isso. Se os eventos ocorressem em
momentos diferentes, cada observador pegaria a localização dos eventos em suas respectivas fatias de espaço
e calcularia a distância euclidiana entre eles. As localizações seriam diferentes para diferentes observadores, mas
novamente a distância entre eles seria a mesma para todos os observadores.
No entanto, na teoria newtoniana não havia como combinar as medidas de tempo e distância: não havia
medida invariante do comprimento de uma curva geral que mudasse de posição e tempo à medida que avançava.
Sem uma forma invariável de converter tempos em distâncias, isso não era possível. O que Einstein trouxe para
a relatividade foi a invariância da velocidade da luz, que permite então uma unificação das medidas de tempo e
espaço. O espaço-tempo quadridimensional de Einstein tem uma estrutura muito mais simples que a de Newton!
Agora, dentro deste modelo de espaço-tempo, Newton deu uma lei para o comportamento de objetos que
experimentaram forças gravitacionais: F = ma, onde F = ÿmÿÿ para um dado campo gravitacional ÿ. E ele também
deu uma lei determinando como ÿ é gerado: ÿ2 = 4ÿGÿ. Essas duas leis são aquelas para as quais devemos
agora encontrar análogos em nosso ponto de vista relativista sobre o espaço-tempo. A segunda será tratada no
próximo capítulo. Neste capítulo, perguntamos apenas como uma determinada métrica afeta os corpos no espaço-
tempo.
Já discutimos isso para o caso simples do movimento de partículas. Como sabemos que a 'aceleração' de
uma partícula em um campo gravitacional é independente de sua massa, podemos ir para um referencial em
queda livre no qual as partículas próximas não têm aceleração. Isso é o que identificamos como um referencial
localmente inercial. Como as partículas em queda livre não têm aceleração nesse quadro, elas seguem linhas
retas, pelo menos localmente. Mas as linhas retas em um referencial inercial local são, é claro, a definição de
geodésicas na variedade curva completa.
Assim, temos nosso primeiro postulado sobre como as partículas são afetadas pela métrica:
(IV) Princípio de Equivalência Fraca: Partículas em queda livre se movem em geodésicas do espaço-tempo
semelhantes ao tempo.1
1 É mais comum definir o WEP sem referência a um espaço-tempo curvo, mas apenas dizer que todas as partículas caem com a
mesma velocidade em um campo gravitacional, independente de sua massa e composição. Mas o Princípio de Equivalência de
Einstein (Postulado IV ) é normalmente considerado como implicando que a gravidade pode ser representada pela curvatura do
espaço-tempo, então devemos simplesmente começar com a suposição de que temos um espaço-tempo curvo.
Machine Translated by Google
Por 'queda livre' queremos dizer partículas não afetadas por outras forças, como campos elétricos, etc. Todas as
outras forças conhecidas na física se distinguem da gravidade pelo fato de que existem partículas não afetadas
por elas. Assim, o Princípio de Equivalência Fraca (Postulado IV) é uma afirmação poderosa, passível de teste
experimental. E foi testado, e continua sendo testado, com alta precisão. Os experimentos normalmente comparam
a taxa de queda de objetos compostos de materiais diferentes; os limites experimentais atuais limitam as diferenças
fracionárias na aceleração a algumas partes em 1013 (Will 2006). O WEP é, portanto, uma das leis mais
precisamente testadas em toda a física. Existem até propostas para testá-lo até o nível de 10 a 18 usando
experimentos realizados por satélite.
Mas o WEP refere-se apenas a partículas. Como, digamos, os fluidos são afetados por uma métrica não plana?
Precisamos de uma generalização de (IV):
(IV ) Princípio de Equivalência de Einstein: Qualquer experimento físico local que não envolva gravidade terá o
mesmo resultado se realizado em um referencial inercial em queda livre como se fosse realizado no
espaço-tempo plano da relatividade especial.
Nesse caso, 'local' significa que o experimento não envolve campos, como campos elétricos, que podem se
estender por grandes regiões e, portanto, estender-se fora do domínio de validade do referencial inercial local.
Toda a física local é a mesma em um referencial inercial em queda livre como na relatividade especial. A gravidade
não introduz nada de novo localmente. Todos os efeitos da gravidade são sentidos em regiões extensas do espaço-
tempo. Isso também foi testado rigorosamente (Will 2006).
Isso pode parecer estranho para alguém acostumado a culpar a gravidade por dificultar subir escadas ou
montanhas, ou até mesmo sair da cama! Mas esses efeitos locais da gravidade são, do ponto de vista de Einstein,
realmente os efeitos de sermos empurrados pela Terra e pelos objetos nela. Nosso 'peso' é causado pela Terra
sólida exercendo forças sobre nós que nos impedem de cair livremente em uma geodésica (sem peso, através do
chão). Este é um ponto de vista muito razoável. Considere os astronautas orbitando a Terra. A uma altitude de
cerca de 300 km, eles dificilmente estão mais distantes do centro da Terra do que nós, de modo que a força da
força gravitacional newtoniana sobre eles é quase a mesma que sobre nós. Mas eles não têm peso, desde que
sua órbita os impeça de encontrar a Terra sólida. Uma vez que reconhecemos que o espaço-tempo tem curvas
naturais, as geodésicas, e que quando caímos sobre elas estamos em queda livre e não sentimos gravidade, então
podemos descartar completamente o conceito newtoniano de força gravitacional. Estamos apenas seguindo a
curva natural do espaço-tempo.
A verdadeira medida da gravidade na Terra são suas marés. Estes são efeitos não locais, porque surgem da
diferença da aceleração gravitacional newtoniana da Lua ao longo da Terra, ou seja, do desvio geodésico próximo
à Terra. Se a Terra estivesse permanentemente nublada, um terráqueo não saberia sobre a Lua por sua aceleração
gravitacional geral, já que a Terra cai livremente: não sentimos a Lua localmente. Mas os terráqueos podiam, em
princípio, descobrir a Lua mesmo sem vê-la, observando e compreendendo as marés. As forças de maré são o
único aspecto mensurável da gravidade.
Matematicamente, o que o Princípio de Equivalência de Einstein significa é, grosso modo, que se temos uma
lei local da física que é expressa em notação tensorial em SR, então sua forma matemática deve ser a mesma em
um referencial localmente inercial de um espaço-tempo curvo.
Machine Translated by Google
Esse princípio é freqüentemente chamado de 'regra da vírgula para o ponto e vírgula', porque se uma
lei contém derivadas em sua forma relativista especial ('vírgulas'), então ela tem essas mesmas derivadas
no referencial inercial local. Para converter a lei em uma expressão válida em qualquer referencial de
coordenadas, simplesmente tornamos as derivadas covariantes ('ponto e vírgula'). É uma maneira
extremamente simples de generalizar as leis físicas. Em particular, proíbe o 'acoplamento de curvatura':
é concebível que a forma correta de, digamos, termodinâmica em um espaço-tempo curvo envolva de
alguma forma o tensor de Riemann, que desapareceria em SR. O postulado (IV ) não permitiria nenhum
termo tensor de Riemann nas equações.
Como exemplo de como (IV ) se traduz em matemática, discutimos a dinâmica dos fluidos, que será
nosso principal interesse neste curso. A lei de conservação de partículas em SR é expressa como
(n Uÿ),ÿ = 0, (7.1)
(n Uÿ);ÿ = 0. (7.2)
Essa forma da lei é válida em todos os referenciais e, portanto, nos permite calcular a lei de conservação
em qualquer referencial e ter certeza de que é aquela implícita no princípio de equivalência de Einstein.
Portanto, generalizamos a lei de conservação de partículas para um espaço-tempo curvo. Seguiremos
este método para outras leis da física conforme precisarmos delas.
Este é apenas um jogo com tensores, ou há conteúdo físico no que fizemos? É possível que em um
espaço-tempo curvo a lei de conservação seja algo diferente da Eq. (7.2)? A resposta é sim: considere
postular a equação
onde R é o escalar de Ricci, definido na Eq. (6.92) como o traço duplo da ten sor de Riemann, e onde q
é uma constante. Isso também reduziria para a Eq. (7.1) em SR, pois em um espaço-tempo plano o
tensor de Riemann se anula. Mas no espaço-tempo curvo, essa equação prevê algo muito diferente: a
curvatura criaria ou destruiria partículas, de acordo com o sinal da constante q. Assim, ambas as
equações anteriores são consistentes com as leis da física em SR. O princípio da equivalência de
Einstein afirma que devemos generalizar a Eq. (7.1) da maneira mais simples possível, ou seja, para a
Eq. (7.2). É claro que é uma questão de experiência, ou observação astronômica, para decidir se a Eq.
(7.2) ou Eq. (7.3) está correto. Neste livro, faremos simplesmente a suposição quase universal de que o
princípio da equivalência de Einstein está correto. Não há evidência observacional em contrário.
Machine Translated by Google
UÿS,ÿ = 0. (7.4)
Como não há símbolos de Christoffel na derivada covariante de um escalar como S, essa lei
é inalterada em um espaço-tempo curvo. Finalmente, a conservação de quatro momentos é
Tÿÿ ,ÿ
= 0. (7.5)
A generalização é
Tÿÿ ;ÿ = 0, (7.6)
com a definição
exatamente como antes. (Observe que gÿÿ é o tensor cujos componentes na inércia local
frame igual ao tensor métrico de espaço plano ÿÿÿ .)
Para ver as implicações de (IV ) para o movimento de uma partícula ou fluido, devemos conhecer o
métrica no coletor. Como ainda não estudamos a forma como uma métrica é gerada, vamos
nesta fase tem que se contentar em assumir uma forma para a métrica que derivaremos
mais tarde. Veremos mais adiante que para campos gravitacionais fracos (onde, na linguagem newtoniana,
a energia potencial gravitacional de uma partícula é muito menor do que sua energia de massa de repouso) o
potencial newtoniano ordinário ÿ determina completamente a métrica, que tem a forma
2 2
dias = ÿ(1 + 2ÿ) dt + (1 ÿ 2ÿ) ( dx2 + dy2 + dz 2). (7.8)
(O sinal de ÿ é escolhido negativo, de modo que, longe de uma fonte de massa M, temos ÿ =
ÿGM/r.) Agora, a condição acima de que o campo seja fraco significa que |mÿ| m, de modo que
|ÿ| 1. A métrica, Eq. (7.8), é realmente correto apenas para primeira ordem em ÿ, então trabalharemos para
esta ordem a partir de agora.
Vamos calcular o movimento de uma partícula em queda livre. Denotamos seu momento de quatro
,
por p . Para todas as partículas, exceto sem massa, isso é mU onde U = d x/dÿ . Agora, por (IV), o
caminho da partícula é uma geodésica, e sabemos que o tempo próprio é um parâmetro afim em tal
um caminho. Portanto , U deve satisfazer a equação geodésica,
ÿU U = 0. (7.9)
Por conveniência mais tarde, no entanto, notamos que qualquer constante vezes o tempo próprio é um afim
parâmetro, em particular ÿ/ m. Então d x/d(ÿ/m) também é um vetor que satisfaz a equação geodésica. Este
vetor é apenas md x/dÿ = p. Assim, também podemos escrever a equação de movimento do
partícula como
ÿpp = 0 . (7.10)
Machine Translated by Google
Essa equação também pode ser usada para fótons, que têm um p bem definido, mas nenhum U , pois
m = 0.
Se a partícula tem uma velocidade não relativística nas coordenadas da Eq. (7.8), podemos encontrar um
forma aproximada para a Eq. (7.10). Primeiro vamos considerar o componente zero da equação,
observando que a derivada ordinária ao longo de p é m vezes a derivada ordinária ao longo de U , ou em
outras palavras m d/dÿ :
d 0
m p0 + ÿÿpÿpÿ = 0. (7.11)
dÿ
Como a partícula tem uma velocidade não relativística, temos p0 p1 , então a Eq. (7.11) é
aproximadamente
d
m p0 + 0 00(p0) 2 = 0. (7.12)
dÿ
0
Precisamos calcular 00:
0 1
00 = 2 g0ÿ(gÿ0,0 + gÿ0,0 ÿ g00,ÿ). (7.13)
Agora porque [gÿÿ] é diagonal, [gÿÿ] também é diagonal e seus elementos são os recíprocos
dos de [gÿÿ]. Portanto , g0ÿ é diferente de zero somente quando ÿ = 0, então a Eq. (7.13) torna -se
0 1 1 1
00 = 2 g00g00,0 = (ÿ2ÿ),0
2 ÿ(1 + 2ÿ)
Para ordem mais baixa na velocidade da partícula e em ÿ, podemos substituir (p0) 2 termo no segundo
da Eq. (7,12) por m2, obtendo
d
p0 = ÿmÿÿ . (7.15)
dÿ ÿÿ
Como p0 é a energia da partícula neste referencial, isso significa que a energia é conservada a menos que
o campo gravitacional depende do tempo. Este resultado é verdadeiro também na teoria newtoniana. Aqui,
entretanto, devemos notar que p0 é a energia da partícula somente em relação a este referencial.
Os componentes espaciais da equação geodésica dão a contrapartida da equação newtoniana.
F = m. Eles são
dpi
= -m
eu
00. (7.18)
dÿ
e pegue
onde mudamos ÿ para j porque ÿi0 é zero. Agora notamos que gj0 ÿ 0 e assim obtemos
i ÿ1 00 = 2
g00,jÿij + 0(ÿ2) (7.22)
= ÿ1 2 (7.23)
(ÿ2ÿ),jÿij.
Esta é a equação usual na teoria newtoniana, já que a força de um campo gravitacional é ÿmÿÿ. Isso demonstra
que a relatividade geral prevê o movimento kepleriano dos planetas, pelo menos enquanto os efeitos de ordem
superior negligenciados aqui forem pequenos demais para serem medidos.
Veremos que isso é verdade para a maioria dos planetas, mas não para Mercúrio.
Tanto a equação de conservação de energia quanto a equação de movimento foram derivadas como
aproximações baseadas em duas coisas: a métrica era quase a métrica de Minkowski 1) e a velocidade da
gravidade newtoniana
partícula nãoé era
verificada,
relativística
por isso
(p0 é
pi reconfortante
). Esses dois –limites
de fato,
sãoessencial
(|ÿ| apenas
– que
as circunstâncias
recuperamos as emequações
que a
newtonianas. No entanto, não há mágica aqui. Quase teve que funcionar, dado que sabemos que as partículas
caem em linhas retas em quadros de queda livre.
Podemos fazer o mesmo tipo de cálculo para verificar se as equações newtonianas valem para outros
sistemas no limite apropriado. Por exemplo, o aluno tem a oportunidade de fazer isso para o fluido perfeito em
Exer. 5, § 7.6. Observe que a condição de que o fluido seja não relativístico significa não apenas que sua
velocidade é pequena, mas também que as velocidades aleatórias de suas partículas não são relativísticas, o
que significa p ÿ.
Essa correspondência de nosso ponto de vista relativista com a teoria newtoniana mais antiga no limite
apropriado é muito importante. Qualquer nova teoria deve fazer as mesmas previsões que a velha teoria no
regime em que se sabia que a velha teoria estava correta. O princípio da equivalência mais a forma da métrica,
Eq. (7.8), faz isso.
Embora no limite apropriado nossa imagem da gravidade no espaço-tempo curvo preveja as mesmas coisas
que a teoria newtoniana prevê, é muito diferente da teoria de Newton em conceito.
Devemos, portanto, trabalhar gradualmente para uma compreensão de seu novo ponto de vista.
Machine Translated by Google
Uma segunda diferença diz respeito à energia e ao momento. Na física newtoniana, SR, e em nossa
teoria da gravidade geométrica, cada partícula tem uma energia e um momento definidos, cujos valores
dependem do referencial em que são avaliados. Nas duas últimas teorias, energia e momento são
componentes de um único vetor p de quatro vetores. . Em SR, o total de quatro momentos
de um sistema é a soma dos quatro momentos de todas as partículas, i p (i). Mas em um
curvo, nãoespaço-tempo
podemos
somar vetores definidos em pontos diferentes, porque não sabemos como: dois vetores só podem ser
ditos paralelos se forem comparados no mesmo ponto, e o valor de um vetor em um ponto para o qual
foi transportado paralelamente depende da curva ao longo da qual foi movido. Portanto, não há uma
maneira invariável de somar todos os p s, e se um sistema tem quatro momentos definíveis, não é
apenas a coisa simples que era em SR.
Acontece que para qualquer sistema cuja extensão espacial seja limitada (isto é, um sistema isolado),
uma energia e um momento totais podem ser definidos, de uma maneira que discutiremos mais adiante.
Uma maneira de ver que a energia de massa total de um sistema não deve ser a soma das energias
das partículas é que isso negligencia o que na linguagem newtoniana é chamado de sua auto-energia
gravitacional, uma quantidade negativa que é o trabalho que ganhamos montando o sistema de
partículas isoladas no infinito. Essa energia, se for incluída, não pode ser atribuída a nenhuma partícula
em particular, mas reside na própria geometria. A noção de energia potencial gravitacional, no entanto,
não está bem definida no novo quadro: ela deve, de alguma forma, representar a diferença entre a
soma das energias das partículas e a massa total do sistema, mas uma vez que a soma das energias
das partículas as energias das partículas não estão bem definidas, nem a energia potencial gravitacional.
Apenas a energia-momento total de um sistema é, em geral, definível, além dos quatro momentos de
partículas individuais.
A discussão anterior sobre energia pode nos fazer pensar no que podemos dizer sobre quantidades
conservadas associadas a uma partícula ou sistema. Para uma partícula, devemos perceber que a
gravidade, no antigo ponto de vista, é uma 'força', de modo que a energia cinética e o momento de uma
partícula não precisam ser conservados sob sua ação. Em nosso novo ponto de vista, então, não
podemos esperar encontrar um sistema de coordenadas no qual os componentes de p sejam constantes
ao longo da trajetória de uma partícula. Há uma exceção notável a isso, e é importante o suficiente para
olhar em detalhes.
Machine Translated by Google
A equação geodésica pode ser escrita para os componentes 'rebaixados' de p como segue
pÿpÿ;ÿ = 0, (7,25)
ou
ÿ
pÿpÿ,ÿ ÿ ÿÿpÿpÿ = 0,
ou
mdpÿ = ÿ
(7.26)
ÿÿpÿpÿ .
dÿ
O produto pÿpÿ é simétrico em ÿ e ÿ, enquanto o primeiro e terceiro termos entre parênteses são, juntos,
antissimétricos em ÿ e ÿ. Portanto, eles cancelam, deixando apenas o
meio termo
1
ÿ
ÿÿpÿpÿ = gÿÿ,ÿpÿpÿ. (7,28)
2
1
mdpÿ = (7,29)
gÿÿ,ÿpÿpÿ.
dÿ 2
Temos, portanto, o seguinte resultado importante: se todos os componentes gÿÿ são independentes
de xÿ para algum índice fixo ÿ, então pÿ é uma constante ao longo da trajetória de qualquer partícula.
Por exemplo, suponha que temos um campo gravitacional estacionário (isto é, independente do tempo).
Então, um sistema de coordenadas pode ser encontrado em que os componentes métricos são independentes
do tempo, e nesse sistema p0 é conservado. Portanto , p0 (ou, na verdade, ÿp0) é geralmente chamado de
'energia' da partícula, sem a qualificação 'neste quadro'. Observe que as coordenadas
também pode ser encontrado em que a mesma métrica tem componentes dependentes do tempo:
qualquer transformação de coordenadas dependente do tempo do sistema 'nice' fará isso. Na verdade, a maioria
sistemas inerciais locais em queda livre são assim, pois uma partícula em queda livre vê um campo
gravitacional que varia com sua posição e, portanto, com o tempo em seu sistema de coordenadas.
A estrutura em que os componentes métricos são estacionários é especial e é a 'estrutura oratória de
laboratório' usual na Terra. Portanto , p0 neste referencial está relacionado com a energia usual definida
no laboratório, e inclui a energia potencial gravitacional da partícula, como mostraremos agora.
Considere a equação
p · p = ÿm2 = gÿÿpÿpÿ
2 2
= ÿ(1 + 2ÿ)(p0) 2 + (1 ÿ 2ÿ)[(px ) + (pi ) + (pz ) 2], (7.30)
Machine Translated by Google
onde usamos a métrica, Eq. (7.8). Isso pode ser resolvido para dar
2
onde, por abreviação, denotamos por p2 a aproximação da + (py) 2 + (pz ) 2. Mantendo-se dentro do
soma (px) |ÿ| 1, |p| m, podemos simplificar isso para
ou
O primeiro termo é a massa de repouso da partícula. A segunda e a terceira são as peças newtonianas
de sua energia: energia potencial gravitacional e energia cinética. Isso significa que a constância de p0
ao longo da trajetória de uma partícula generaliza o conceito newtoniano de energia conservada.
Observe que um campo gravitacional geral não será estacionário em nenhum referencial2, portanto,
nenhuma energia conservada pode ser definida.
De maneira semelhante, se uma métrica é axialmente simétrica, então podem ser encontradas
coordenadas nas quais gÿÿ é independente do ângulo ÿ em torno do eixo. Então pÿ será conservado.
Este é o momento angular da partícula. No limite não relativista temos
onde é a velocidade angular da partícula. Agora, para uma métrica quase plana, temos
2 gÿÿ = eÿ · eÿ ÿ r (7,36)
pÿ ÿ mr2 . (7,37)
2 É fácil ver que geralmente não existe um sistema de coordenadas que torne um determinado tempo métrico independente. A
métrica tem dez componentes independentes (o mesmo que uma matriz simétrica 4 × 4), enquanto uma mudança de
coordenadas nos permite introduzir apenas quatro graus de liberdade para mudar os componentes (estas são as quatro funções
xÿ¯ (xÿ)). De fato, é uma métrica especial se todos os dez componentes puderem ser independentes do tempo dessa maneira.
Machine Translated by Google
7.5 P ara
A questão de como a curvatura e a física se encaixam é discutida com mais detalhes por Geroch (1978).
As quantidades conservadas são discutidas em detalhes em qualquer um dos textos avançados.
O material deste capítulo é uma preparação para a teoria dos campos quânticos em um espaço-tempo
curvo fixo. Ver Birrell e Davies (1984) e Wald (1994). Isso, por sua vez, leva a uma das áreas mais ativas
da pesquisa gravitacional hoje, a quantização da relatividade geral. Embora não tratemos dessa área neste
livro, os leitores de trabalhos que abordam esse assunto do ponto de partida da relatividade geral clássica
(em contraste com a abordagem do ponto de partida da teoria das cordas) podem querer examinar Rovelli
(2004) Bojowald (2005) e Thiemann (2007).
7.6 Exercícios
1 Se a Eq. (7.3) foram a generalização correta da Eq. (7.1) para um espaço-tempo curvo, como você o
interpretaria? O que aconteceria com o número de partículas em um volume comovente do fluido, com
a evolução do tempo? Em princípio, podemos distinguir experimentalmente entre as Eqs. (7.2) e (7.3)?
para a métrica, Eq. (7.8). Isso é conhecido como equação de Euler para fluxo de fluido não
relativístico em um campo gravitacional. Você precisará usar a Eq. (7.2) para obter este resultado.
(b) Examine o componente de tempo da Eq. (7.6) sob as mesmas premissas, e
interpretar cada termo.
(c) Eq. (7.38) implica que um fluido estático (ÿ = 0) em um campo gravitacional newtoniano estático
obedece a equação de equilíbrio hidrostático
ÿp + ÿÿÿ = 0. (7,39)
Um tensor métrico é dito estático se existirem coordenadas nas quais e0 é semelhante ao tempo,
gi0 = 0 e gÿÿ,0 = 0. Deduza da Eq. (7.6) que um fluido estático (Ui = 0, p,0 = 0, etc.) obedece à
equação relativística de equilíbrio hidrostático
(d) Isso sugere que, pelo menos para situações estáticas, existe uma relação próxima entre g00 e ÿ
exp(2ÿ), onde ÿ é o potencial newtoniano para uma situação física semelhante.
Mostre que a Eq. (7.8) e Exer. 4 são consistentes com isso.
6 Deduza a Eq. (7.25) da Eq. (7.10).
7 Considere as quatro métricas diferentes a seguir, conforme fornecidas por seus elementos de linha:
2
(i) ds2 = ÿdt (ii) + dx2 + dy2 + dz2;
2
ds2 = ÿ(1 ÿ 2M/r) dt + (1 ÿ 2M/r) ÿ1 dr2 + r2(dÿ 2 + sin2 ÿ dÿ2), onde
M é uma constante;
(iii)
2
ÿ a2 sen2 ÿ dt ÿ 2a dt2Mrsin2
dÿ ÿ2 ÿ2ÿ 2
dias =ÿ (r2 +ÿ2
a2)sen2
2 ÿ a2
ÿ dÿ2
sen2
+ ÿ2
ÿ
+ 2 dr + ÿ2 dÿ 2,
(a) Para cada métrica, encontre tantos componentes conservados ÿÿ de uma partícula em queda livre
quatro impulsos possíveis.
(b) Use o resultado de Exer. 28, § 6.9 para colocar (i) na forma
2 2 2 = ÿdt + dr
(e) ds + r 2(dÿ 2 + sen2 ÿ dÿ2).
A partir disso, argumentam que (ii) e (iv) são esfericamente simétricas. Isso aumenta o número de
componentes conservados pÿ? (c) Pode-se mostrar que para (i) e (ii)–(iv), uma geodésica que
começa com ÿ = ÿ/2 e pÿ = 0 – ou seja, uma que começa tangente ao plano equatorial – sempre tem ÿ =
ÿ/2 e pÿ = 0. Para os casos (i ), (ii) e (iii), use a equação p · p = ÿm2 para resolver pr em termos de
m, outras quantidades conservadas e funções de posição conhecidas .
(d) Para (iv), a simetria esférica implica que se uma geodésica começa com pÿ = pÿ = 0, estes permanecem
zero. Use isso para mostrar a partir da Eq. (7.29) que quando k = 0, pr é uma quantidade conservada.
1
( ÿ ÿ gTÿ ÿ),ÿ = 0. ÿ ÿ g (7.41)
(b) Suponha que nessas coordenadas Tÿÿ = 0 apenas em alguma região limitada de cada hipersuperfície
espacial x0 = const. Mostre que a Eq. (7.41) implica