Você está na página 1de 133

TEORIA DA RELATIVIDADE

RESTRITA
J ulio Cesar Fabris e Antonio Brasil Batista
Departamento de Fsica
Universidade Federal do Esprito Santo
Goiabeiras - Vit oria - CEP29060-900
Esprito Santo
2007
Captulo 1
Introducao
1
Captulo 2
Fundamentos da
Relatividade Restrita
2.1 Mecanica e eletromagnetismo
A Fsica Classica se alicerca em duas teorias fundamentais: a mecanica new-
toniana e o eletromagnetismo de Maxwell. Se nos limitamos aos fenomenos
envolvendo corpos macroscopicos, nao excessivamente massivos, que se deslo-
cam com velocidades ordinarias, signicativamente inferiores `a velocidade da
luz, a mecanica newtoniana fornece resultados em acordo com a experiencia e
a observacao. Isto se aplica em particular ao movimento de objetos sobre a
superfcie terrestre assim como para o movimento dos planetas. Por sua vez, o
eletromagnetismo e uma teoria igualmente bem comprovada, que teve um dos
seus sucessos mais impressionantes na identica cao da luz como onda eletro-
magnetica e na consequente predi cao da existencia de ondas eletromagneticas
em frequencias fora da faixa correspondente `a luz visvel. Faremos a seguir uma
breve revisao destas duas teorias, enfatizando sobretudo os aspectos que serao
relevantes para a posterior constru cao da teoria da relatividade restrita.
2
2.2 A mecanica newtoniana
2.2.1 As leis de Newton
A mecanica newtoniana basea-se nas tres leis de Newton e, conseq uentemente,
esta fortemente alicercada sobre a nocao de referencial inercial. Podemos enun-
ciar as tres leis da seguinte forma:
1. Todo corpo permanece em repouso ou em estado de movimento retilneo
uniforme se nenhuma for ca age sobre ele ou se a soma vetorial de todas
as forcas que agem sobre o corpo e nula;
2. A a cao de uma forca sobre um corpo resultara na aceleracao deste corpo,
a razao entre os modulos da for ca e da aceleracao sendo igual `a massa
inercial do corpo;
3. A toda acao de um corpo A sobre um corpo B corresponde uma rea cao
de mesma intensidade, e de sentido contrario, que agira sobre o corpo que
provoca a a cao, neste caso o proprio corpo A.
A estas leis, podemos acrescentar a lei da Gravitacao Universal:
1. Dois corpos se atraem proporcionalmente ao inverso do quadrado da distancia
que os separa e em proporcao direta ao produto de suas massas gravitaci-
onais.
No enunciado destas leis, introduzimos as no coes de massas gravitacional e
inercial, a primeira estando relacionada ao fato que existe uma interacao gravi-
tacional (constituindo assim uma carga gravitacional: quanto maior a massa
gravitacional, maior a for ca gravitacional que sera exercida), a segunda se refe-
rindo `a resistencia apresentada por um corpo quando sobre ele age uma for ca
(quanto maior a massa inercial de um corpo, menor e a acelera cao transmitida
a este corpo por uma dada forca). A experiencia mostra que as duas massas
sao iguais com uma precisao de 10
12
[1]. Na teoria da relatividade geral, que
sera abordada no nal deste texto, as duas massas sao consideradas exatamente
iguais.
A primeira lei de Newton dene os bonsreferenciais para os quais as de-
mais leis da Fsica devem ser escritas. Estes bons referenciais sao denominados
3
de inerciais. Referencial inercial e aquele para o qual a primeira lei de New-
ton se aplica: neste referencial, se a forca resultante sobre um corpo e nula,
entao a velocidade deste corpo e constante. A segunda lei, por outro lado,
diz qual sera o efeito de uma forca medido por um observador situado naquele
bomreferencial, o referencial inercial. Neste sentido a primeira lei e pre-
requisito indispensavel para a segunda lei: primeiro se dene quem observa
(aquele para quem, na ausencia de uma forca, um corpo deve car em repouso
ou em movimento retilneo uniforme), para depois se dizer qual e a consequencia
da acao de uma forca (ela provoca aceleracao na proporcao inversa de sua massa
inercial). A terceira lei est a relacionada `a conserva cao do momento linear. A
terceira lei determina tambem quando uma dada forca e devida a uma interacao
fsica: `a sua acao, podemos determinar qual e a reacao. Obviamente, podemos
tratar um fenomeno fsico atraves de um referencial nao inercial. Mas, neste
caso, a aceleracao observada nao estara relacionada unicamente `as interacoes
fsicas: for cas ctcias, ditas inerciais, que nao vericam a terceira lei (visto
que, para elas, e impossvel determinar qual e a rea cao), deverao estar presen-
tes.
Para tratarmos quantitativamente estas leis, denimos um referencial (iner-
cial), e denotamos a distancia de um dado corpo `a origem deste referencial pelo
vetor r. A velocidade deste corpo e entao denida como a taxa de variacao da
posi cao com o tempo v =
d
dt
r e a acelera cao e denida como a taxa de varia cao
da velocidade com o tempo, ou ainda como a segunda derivada da posicao em
relacao ao tempo, a =
d
dt
v =
d
2
dt
2
r. Desta maneira, a segunda lei se escreve como

F = m
I
a = m
I
d
dt
v = m
I
d
2
dt
2
r , (2.1)
onde m
I
designa a massa inercial. Se denirmos uma nova quantidade auxiliar
denominada de momento linear, expressa como
p = m
I
v , (2.2)
entao a segunda lei de Newton assume a forma

F =
d
dt
p . (2.3)
As denicoes (2.1,2.3) coincidem quando a massa de um corpo e constante.
Entretanto, elas diferem quando a massa do corpo e variavel, como no problema
4
do foguete cuja massa varia em consequencia da ejecao. A denicao fundamental
da segunda lei de Newton e dada por (2.3).
A independencia da primeira e da segunda leis de Newton, no sentido que
a primeira nao determina a segunda e nem e um caso particular dela, se reete
no fato que, admitida a primeira lei, seria possvel supor que o efeito da forca
poderia ser diferente do produto simples entre a massa e a aceleracao. Um
exemplo disto e a teoria MOND (acronimo para Modied Newtonian Dynamics),
proposta recentemente [2] visando explicar a anomalia observada na curva de
rotacao das galaxias espirais - ver apendice 1 para uma descri cao do conte udo
e das motivacoes para esta teoria. Na teoria MOND, a segunda lei de Newton
e substituida pela expressao

F = m(a/a
0
)a, onde a
0
e uma aceleracao dita
crtica, e (x) e uma funcao tal que (x) 1 se x >> 1 e (x) x se x << 1.
Neste caso, a primeira lei permanece inalterada mas a relacao entre forca e
aceleracao e diferente da expressao correspondente da teoria newtoniana.
2.2.2 As transformacoes de Galileu
Dado um referencial inercial S, qualquer outro referencial S

que se desloca
em rela cao a S com velocidade constante sera tambem inercial. A forma da
segunda lei de Newton e preservada quando passamos do referencial inercial S
para este outro referencial inercial S

. Designemos a velocidade (constante) de


S

, medida por um observador em S, como



V . Esta velocidade relativa, a ttulo
de simplica cao, sera considerada como orientada ao longo do eixo x. Para
simplicar, supomos que no tempo t = 0 as duas origens coincidam, assim como
os respectivos eixos. Neste caso as relacoes entre as coordenadas x, y, z e x

, y

e z

sao,
x

= x V t , (2.4)
y

= y , (2.5)
z

= z . (2.6)
Observamos que estas transforma coes, conhecidas como transforma coes de Ga-
lileu, pressupoem um tempo universal:
t = t

. (2.7)
5
Figura 2.1: Orienta cao dos referenciais S e S

Temos assim:
v

x
=
dx

dt
= v
x
V ; a

x
=
dv

x
dt
= a
x
; (2.8)
v

y
=
dy

dt
= v
y
; a

y
=
dv

y
dt
= a
y
; (2.9)
v

z
=
dz

dt
= v
z
; a

z
=
dv

z
dt
= a
z
. (2.10)
Como consequencia temos que,

= m
I
a

= m
I
a =

F . (2.11)
Desta forma, a for ca medida no referencial S

, assim como a acelera cao sofrida


pelo corpo, e a mesma que a medida no referencial S: as leis de Newton sao
portanto invariantes em relacao `as transformacoes de Galileu. Estamos supondo
a massa inercial do corpo como sendo uma propriedade intrnseca do corpo, logo
independente do observador. Note-se tambem que, frequentemente, utilizaremos
os termos referencial e observador como equivalentes: todo observador pressupoe
um referencial e vice-versa.
Como a lei da Gravita cao Universal esta baseada na posicao relativa entre
dois corpos, sua expressao tambem nao e afetada por esta mudan ca de sistema
de referencia. De fato, na mecanica, todas as leis de forca sao baseadas seja na
posi cao relativa, seja na velocidade relativa entre dois corpos, e permanecem,
em conseq uencia, invariantes pelas transformacoes de Galileu.
6
2.2.3 Leis de conservacao
Quando uma forca e tal que a integral do produto interno desta forca com o
vetor deslocamento do corpo sobre o qual ela age, ao longo de um percurso
fechado l, e nula,
_

F.

dr = 0 (2.12)
entao esta for ca e dita conservativa. Isto implica que o trabalho realizado
por esta forca quando o corpo se desloca de uma posicao inicial r
i
para uma
posi cao nal r
f
independe do caminho empregado neste trajeto. Neste caso, a
forca pode ser obtida como gradiente de um campo escalar:

F = (r). De
fato, usando o teorema de Stokes (ver apendice), temos
_

F.

dr =
_
S


F . d

S = 0 , (2.13)
onde S e a superfcie cuja borda e denida pela curva fechada l. Como esta
expressao e valida para qualquer curva fechada, o integrando devera ser iden-
ticamente nulo para qualquer superfcie S. Isto pode ser obtido se

F for o
gradiente de uma funcao escalar. Logo, a expressao (2.13) implica que, para
uma forca conservativa,

F = , (2.14)
onde o sinal negativo foi introduzido por comodidade futura. Este campo esca-
lar (r) e denominado de energia potencial, sendo uma grandeza auxiliar que,
justamente por ser um escalar, facilita em geral o calculo de certas quantidades
fsicas. Vamos, para o que se segue, suprimir o ndice I que e utilizado para
indicar a massa inercial. Este ndice sera restabelecido quando necessario. Para
um corpo sob a cao de uma forca conservativa, cujo potentical automaticamente
nao pode depender explicitamente do tempo, a energia mecanica, denida como
E =
1
2
mv
2
+ (r) , (2.15)
se conserva.
De fato, podemos, no caso de uma for ca conservativa, escrever a segunda lei
de Newton como
m
d
dt
v = . (2.16)
7
Tomando o produto interno com v, utilizando a deni cao da velocidade como
derivada da posi cao e a noc ao de derivada implcita, encontramos,
mv.
d
dt
v = v =
3

i=1
dx
i
dt


x
i
1
2
m
d
dt
v
2
=
d
dt

d
dt
_
1
2
mv
2
+
_
= 0
1
2
mv
2
+ = E = constante .
Nesta dedu cao, utilizamos o fato que o vetor r indica a posi cao da partcula,
sendo uma fun cao do tempo: r = r(t). Alem do mais, a energia potencial,
por estar relacionada a uma forca conservativa, nao depende explicitamente do
tempo, mas apenas da posicao da partcula. Chamamos E de energia mecanica
da partcula, uma quantidade que se conserva quando a for ca que age sobre esta
partcula e conservativa.
Por outro lado, a conserva cao do momento linear de um sistema de partculas
que interagem entre si pode ser obtido da terceira lei de Newton. Para simpli-
car, consideremos um sistema de duas partculas. A terceira lei de Newton diz
que

F
21
=

F
12

d
dt
p
1
=
d
dt
p
2
d
dt
(p
1
+ p
2
) = 0 p
1
+ p
2
=

P = constante .
Nestas expressoes foi usado o fato que

F
ij
, forca que a partcula i exerce sobre a
partcula j, e igual `a varia cao do momento linear da partcula j. A generalizacao
da expressao para a conservacao do momento linear para um sistema fechado de
n partculas (sistema fechado e aquele sobre o qual nao existem forcas externas
ao sistema agindo sobre seus constituintes) e proposta nos exerccios.
As leis de conservacao da energia e do momento linear representam alguns
dos principais alicerces da mecanica newtoniana. Essas leis sao complementadas
pela a lei da conservacao do momento angular, que e vericada quando a forca
de interacao entre qualquer par de partculas esta na direcao da reta que as une.
O momento angular de uma dada partcula se dene como

L = mr v = r p , (2.17)
8
onde r e o vetor posi cao da partcula e v sua velocidade. Para demonstrar que,
sob a condicao explicitada acima, o momento angular se conserva, vamos con-
siderar um sistema de duas partculas, cujas quantidades correspondentes serao
designadas pelos subscritos 1 e 2. A terceira lei de Newton e sempre satisfeita,
evidentemente. O momento angular total deste sistema de duas partculas e
dado por

L
T
=

L
1
+

L
2
= r
1
p
1
+r
2
p
2
. (2.18)
A taxa de variacao do momento angular total e
d
dt

L
T
= v
1
p
1
+r
1

d
dt
p
1
+v
2
p
2
+r
2

d
dt
p
2
= r
1


F
21
+r
2


F
12
= (r
1
r
2
)

F
21
= 0 .
Nesta dedu cao utilizamos que

F
21
=

F
12
(terceira lei de Newton), onde r
1
r
2
e o vetor de posicao da primeira partcula em rela cao `a segunda e, nalmente,
que a forca esta orientada ao longo desta posicao relativa. Logo, o momento
angular do sistema de partculas se conserva quando nao existem for cas externas
agindo sobre o sistema, e as for cas entre as partculas do sistema estao orientadas
na dire cao do vetor posi cao relativa entre as partculas. No caso onde a forca
depende da velocidade relativa entre as partculas, a dedu cao da conserva cao do
momento angular e mais sutil. Uma situacao onde a for ca depende da velocidade
ocorre no eletromagnetismo, como por exemplo na forca de Lorentz. Neste
caso, e preciso levar em conta tambem o momento transportado pelo campo
eletromagnetico. Esta questao sera analisada mais tarde.
A existencia de leis conservacao reete a presen ca de simetrias no sistema
fsico. A conservacao da energia, por exemplo, esta relacionada `a invariancia
das leis da fsica por translacoes temporais: se as condi coes do sistema sao
as mesmas, pouco importa se fazemos uma dada experiencia hoje ou amanha,
o resultado sera o mesmo. Por outro lado, a conservacao do momento linear
reete a invariancia dos sitemas fsicos por translacoes espacias: mantendo-se
as mesmas condi coes no sistema, o resultado de uma experiencia e independente
de onde ela e feita. Por m, a conserva cao do momento angular esta relacionada
9
com a invariancia do sistema por rotacao. Demonstra coes mais gerais e mais
rigorosas das leis de conservacao podem ser encontradas nas referencias [3, 4, 5].
2.3 O eletromagnetismo
2.3.1 As equacoes de Maxwell
A teoria eletromagnetica e representada matematicamente pelas equacoes de
Maxwell que, na forma integral, sao escritas como se segue:
_

E.d

S =
q

0
, (2.19)
_

B.d

S = 0 , (2.20)
_

E.d

l =
d
dt
_
B.d

S , (2.21)
_

B.d

l =
0
i +
d
dt
_
E.d

S , (2.22)
onde d

S e d

l representam os elementos de integracao sobre uma superfcie e uma


linha, respectivamente. Nestas equacoes

E et

B sao, respectivamente, os campos
eletrico e magnetico, q e i s ao a carga e a corrente que criam aqueles campos,
enquanto
0
e
0
sao as constantes de permissividade eletrica e permeabilidade
magnetica do vacuo.
A equa cao (2.19) e a lei de Gauss (ou equivalentemente, lei de Coulomb)
para o campo eletrico; a equa cao (2.20) estabelece a inexistencia de monopolos
(cargas) magneticos; a equacao (2.21) e a lei de Faraday, que indica que a
variacao no uxo de campo magnetico cria campo eletrico; por m, a equacao
(2.22) e a lei de Amp`ere, suplementada pelo termo de corrente de deslocamento,
que estabelece que correntes eletricas, assim como a varia cao no uxo de campo
eletrico, criam campo magnetico.
Os teoremas de Gauss e Stokes estabelecem que, para um dado campo ve-
torial

A, as seguintes relacoes sao verdadeiras:
_
A.d

S =
_
V
.

AdV , (2.23)
_
A.d

l =
_
S


Ad

S . (2.24)
10
Sendo a densidade de carga e

j a densidade conrrente, a carga total contida
no interior de uma superfcie fechada S e a corrente i que atravessa uma dada
superfcie delimitada por um percurso fechado l, sao expressas como,
q =
_
V
dV , (2.25)
i =
_
S

j.d

S . (2.26)
Lembramos que a densidade de corrente

j se escreve como

j = v, onde v
e o campo de velocidade das cargas. De posse destas informa coes, podemos
re-escrever as equacoes de Maxwell na sua forma diferencial:
.

E =

0
; (2.27)
.

B = 0 ; (2.28)


E =

B
t
; (2.29)


B =
0

j +
0

E
t
. (2.30)
As equa coes (2.28,2.29) sao chamadas de equacoes homogeneas de Maxwell por-
que, nelas, nao aparecem os termos de fontes, representados pelas densidades
de carga e corrente. Ja as equacoes (2.27,2.30) contem estes termos de fontes e
por isto sao chamadas de equa coes de Maxwell nao homogeneas.
As quantidades e

j estao ligadas por uma equacao de conserva cao:

t
+.

j = 0 (2.31)
que pode ser obtida a partir das equacoes de Maxwell tomando-se a derivada
parcial em rela cao ao tempo de (2.27) e combinando com o divergente de (2.30).
2.3.2 Ondas eletromagneticas
A partir das equa coes de Maxwell, nos podemos deduzir uma equa cao de onda.
Podemos escrever a equacao de onda para o campo eletrico tomando-se o rota-
cional de (2.29) e utilizando-se a relacao,


E = (.

E)
2

E =

E . (2.32)
11
Temos assim, empregando ainda a derivada temporal de (2.30),

E
0

E
t
2
=
0

j
t
+

0
. (2.33)
Utilizando a lei de Ohm,

j =

E, onde e a condutividade do meio, esta


equacao pode ser re-escrita como

E
0

E
t
2
=
0

E
t
+

0
. (2.34)
Da mesma forma, tomando-se o rotacional de (2.30) e a derivada em rela cao ao
tempo de (2.29), nos obtemos a seguinte equacao para o campo

B:

B
0

B
t
2
=
0

j . (2.35)
Esta equacao pode ser re-escrita, usando novamente a lei de Ohm e agora
tambem a lei de Faraday, como

B
0

B
t
2
=
0

B
t
. (2.36)
Os termos contendo primeiras derivadas representam um efeito dissipativo de-
vido `as propriedades do meio.
No vacuo, estas duas equacoes se escrevem:

E = 0 , (2.37)

B = 0 , (2.38)
onde denimos o operador DAlambertiano
=

2
t
2

1

2
. (2.39)
Estas expressoes representam a equacao de uma onda que se propaga com a
velocidade
c
2
=
1

0
. (2.40)
As constantes
0
e
0
tem seus valores medidos experimentalmente
1
:
0
=
1, 26 10
6 H
m
e
0
= 8, 85 10
12 F
m
. Substituindo os valores obtidos na ex-
pressao acima, nos obtemos,
c 3 10
10
cm
s
. (2.41)
1
As unidades H (henry) e F (farad) se denem como H =
J
A
e F =
A
2
s
2
J
onde J e A
designam as unidades de energia (joule) e corrente (amp`ere), respectivamente.
12
Esta e a velocidade de propaga cao de uma onda eletromagnetica, que se revela
igual ao valor conhecido para a velocidade de propagacao da luz. Este resultado
permitiu identicar a luz como sendo uma onda eletromagnetica, e foi um dos
maiores sucessos da teoria Eletromagnetica de Maxwell.
A existencia das ondas eletromagneticas revela que o conceito de campo
possui uma realidade, nao sendo apenas uma denicao formal. Os campos
existem e a onda eletromagnetica e a consubstancia cao deste fato: a onda ele-
tromagnetica reete o fato que os campos se induzem reciprocamente, o campo
eletrico variavel criando campo magnetico e vice-versa. A realidade da onda
eletromagnetica ca evidente devido ao fato que a onda transporta momento e
energia, o que e expresso pelo vetor de Poynting [6, 7],

S =
1

E

B , (2.42)
que indica a quantidade de energia por unidade de tempo e unidade de area
transportada pela onda eletromagnetica. O fato que o eletromagnetismo de
Maxwell faz uso dos conceitos de campo, atribuindo uma realidade a estes no-
vos objetos, faz dele a primeira teoria de campo coerentemente formulada. O
programa de teoria de campos sera amplamente explorado, a partir do seculo
XX, tanto a nvel classico quanto quantico, sendo um dos fundamentos da fsica
moderna.
2.3.3 Os potenciais eletromagneticos
Outra formula cao do eletromagnetismo, equivalente `a descrita acima, pode ser
obtida expressando os campos em termos de potenciais. A partir de (2.28),
podemos escrever o campo magnetico como o rotacional de um vetor:

B =

A . (2.43)
Substituindo esta rela cao em (2.29), obtemos
(

E +


A
t
) = 0 , (2.44)
o que nos leva a escrever a quantidade entre parenteses como o gradiente de um
campo escalar, resultando na expressao,

E =


A
t
. (2.45)
13
Podemos substituir agora estas expressoes para

E e

B nas equacoes (2.27,2.30).
Obtemos,

2


t
.

A =

0
, (2.46)
(.

A)
2

A =
0

j +
0

0
_


t


2
t
2

A
_
. (2.47)
Estas sao as equa coes de Maxwell nao homogeneas escritas em termos dos po-
tenciais. Lembre-se que as equacoes de Maxwell homogeneas conduzem `as de-
nicoes dos potenciais. As equacoes escritas em termos dos potenciais parecem
mais complicadas. Mas, isto e apenas aparente, como veremos a seguir. Na
verdade, os potenciais e

A permitem simplicar a obten cao dos campos

E e

B para uma dada distribui c ao de cargas e correntes.


2.3.4 As transformacoes de calibre
Os potenciais escalar e vetor e

A nao sao unicos. As expressoes para os campos

E e

B permanecem inalteradas se zermos as redeni coes

=

A + , (2.48)

=

t
, (2.49)
onde e uma fun cao arbitr aria da posicao e do tempo, = (r, t). Isto e con-
sequencia do fato que os campos

E e

B sao as quantidades fsicas mensuraveis
enquanto que os potenciais e

A sao grandezas auxiliares nao tendo, a nvel
puramente classico, realidade fsica
2
As transformacoes (7.40,7.41) sao denomi-
nadas transforma coes de calibre, e deixam invariante as equacoes de Maxwell,
visto que

E e

B permanecem os mesmos. Observe-se que tratam-se de trans-
formacoes distintas daquelas que envolvem passagem de um referencial inercial
a outro, que implicam mudan cas de coordenadas: as transformacoes de calibre
referem-se aos potenciais e nao aos referenciais.
2
Isto e inteiramente an alogo aos potenciais a partir dos quais se derivam as leis de forca,
quando conservativas, na Mec anica newtoniana. Entretanto, este carater puramente auxi-
liar dos potenciais eletromagneticos n ao e preservado a nvel quantico, como indica o efeito
Aharonov-Bohm, ver por exemplo J.J. Sakurai, Modern quantum mechanics, Addison-
Wesley, Nova Iorque (1994).
14
Utilizando a invariancia resultante das transformacoes (7.40,7.41) podemos
impor uma condicao sobre os potenciais, visto que eles sao denidos a menos de
uma funcao arbitraria . Esta funcao arbitraria pode ser escolhida de maneira a
eliminar uma das componentes do conjunto dos potenciais e

A, ou de forma a
estabelecer uma relacao entre elas. Uma condicao bastante util e a denominada
condicao de Lorentz, que se escreve
3
.

A +
1
c
2

t
= 0. (2.50)
Podemos entender a possibilidade de se impor esta condicao considerando ini-
cialmente o caso onde (2.50) nao e satisfeita. Utilizando as transforma coes
(7.40,7.41), obtemos
.

A +
1
c
2

t
= .

+
1
c
2

t
+
2

1
c
2

t
2
. (2.51)
A funcao e arbitraria. Logo, podemos escolhe-la de tal forma que
.

+
1
c
2

t
=
2
+
1
c
2

t
2
(2.52)
obtendo (2.50).
Usando a condi cao de Lorentz, as equa coes (2.46,2.47) se escrevem,
1
c
2

2
t
2

2
=

0
, (2.53)
1
c
2

2
t
2

A
2

A =
0

j . (2.54)
No vacuo, essas equacoes se reduzem a,
= 0 , (2.55)

A = 0 . (2.56)
Essas sao as equacoes de onda para os potenciais e

A.
A imposicao de um calibre deve em princcipio xar os potenciais

A e .
No caso do calibre de Lorentz expresso pela equacao (2.50), e obtido da forma
3
O fator c nesta express ao e introduzido de maneira a torn a-la homogenea dimensional-
mente, visto que [A]/T = []/L [A] = (T/L)[], onde os colchetes designam a dimens ao
das quantidades em questao.
15
descrita acima, os potenciais nao estao, entretanto, ainda completamente xa-
dos: existe uma liberdade residual na deni cao dos calibres, representada pelas
transformacoes
A A + ,

t
, (2.57)
que conecta diferentes conjuntos de potenciais (,

A) que satisfazem (2.50),
desde que
= 0 , (2.58)
como pode ser vericado a partir de (2.52). Observe que, agora, , ao contrario
do caso anterior, nao e uma funcao completamente arbitraria, mas deve satis-
fazer a equa cao de onda homogenea (2.58). Uma transforma cao do tipo (2.57),
com o campo satisfazendo a condi cao (2.58), nao apenas mantem invariante
as equa coes de Maxwell, mas tambem preserva a condi cao de Lorentz (2.50).
Isto esta relacionado com o fato que as ondas eletromagneticas sao ondas trans-
versais com duas direcoes de polariza cao possveis, contendo portanto dois graus
de liberdade. Observe, assim, que a xa cao do calibre de Lorentz implica em
uma famlia de potenciais, conectadas pelas transformacoes (2.57) suplementa-
das pela condicao (2.58).
A invariancia por transforma coes de calibre implica mais do que a liberdade
para se impor condi coes sobre os potenciais. Na verdade, e necessario utilizar
esta propriedade de invariancia pela redeni cao de potenciais, do contrario o
sistema contera graus de liberdade esp urios, no sentido de serem nao fsicos. A
escolha de um calibre (nao necessariamente o de Lorentz) e uma necessidade di-
tada pelo fato que se tem mais variaveis do que equa coes, visto que a equacao da
continuidade, por exemplo, implica uma relacao entre as equacoes de Maxwell.
Do ponto de vista matematico, e preciso impor uma condi cao de calibre para
que as solu coes sejam unicas.
2.4 O eletromagnetismo e as transformac oes de
Galileu
Vimos na secao (2.2) que as equa coes resultantes das leis de Newton sao in-
variantes pelas transformac oes de Galileu. Uma vez que estas tranforma coes
16
expressam como mudam as relacoes entre as grandezas cinematicas quando se
passa de um referencial inercial a outro, e imprescindvel analisar as implicacoes
das transformacoes de Galileu para as equacoes de Maxwell. Uma transforma cao
geral de coordenadas, passando do sistema x, y, z, t para o sistema x

, y

, z

, t

se escreve,
x

= x

(x, y, z, t), y

= y

(x, y, z, t), z

= z

(x, y, z, t), t

= t

(x, y, z, t) (2.59)
onde incluimos a transforma cao para a coordenada temporal de maneira a pre-
parar o terreno para uma classe de transformacoes mais geral que as de Galileu.
Sob uma transforma cao do tipo (2.59), as derivadas parciais se transformam
como,

x
=
x

+
y

+
z

+
t

, (2.60)

y
=
x

+
y

+
z

+
t

, (2.61)

z
=
x

+
y

+
z

+
t

, (2.62)

t
=
x

+
y

+
z

+
t

. (2.63)
Considerando agora o caso particular das transformacoes de Galileu (2.4, 2.5,2.6,2.7),
obtemos
=

,

t
=

t

V . . (2.64)
Observe que a derivada parcial em relacao ao tempo nao e invariante pelas
transformacoes de Galileu. Isto se deve ao fato que estas transforma coes envol-
vem explicitamente o tempo. Mas, e imediato observar que a derivada total em
relacao ao tempo permanece invariante, como se deveria esperar:
d
dt
=
d
dt

. (2.65)
De fato, a derivada total em relacao ao tempo pode ser escrita como
d
dt
=

t
+v . (2.66)
Usando as transformacoes acima e empregando a lei da adicao das velocidades,
obtemos (2.65).
17
Em relacao aos termos de fonte, densidades de carga e corrente, as trans-
formacoes de Galileu conduzem a

= ,

j = v = (v

+

V ) =

+
0

V

E , (2.67)
onde utilizamos o fato que e uma funcao escalar e que

E = /
o
. Aplicando-
se estas expressoes nas equa coes de Maxwell, obtemos


E =

0
, (2.68)


B = 0 , (2.69)


E =

B
t

+ (

B , (2.70)


B =
0

+
0

0
[

E
t

+

V

E (

E] . (2.71)
Obviamente, as novasequa coes de Maxwell diferem das equacoes originais.
Entretanto, temos ainda a liberdade de redenir os campos

E e

B. Anal,
um observador em repouso em rela cao a uma carga eletrica identica unica-
mente a existencia de um campo eletrico, ao passo que um observador em movi-
mento em rela cao a esta mesma carga identica a existencia de campos eletrico
e magnetico. Portanto, as transformacoes de Galileu, aplicadas a um sistema
de cargas e correntes, devem fazer aparecerou desaparecercomponentes dos
campos eletrico ou magnetico. Em vista disto, e natural admitir que as ex-
pressoes que relacionam os campos eletrico e magnetico medidos por diferentes
observadores inerciais dependam da velocidade relativa entre estes observado-
res. Mas, como determinar as relacoes conectando os campos em diferentes
referenciais? Lembramos inicialmente que as dimensoes dos campos eletrico e
magnetico no sistema SI se relacionam como [E] =
L
T
[B], onde L e T designam
as dimensoes espaciais e temporais respectivemente. Podemos entao, por ar-
gumentos dimensionais e em funcao da situa cao descrita anteriormente sobre a
medida dos campos criados por uma carga eletrica feita por dois observadores
inerciais diferentes, escrever os campos eletrico e magnetico no referencial S em
termos dos campos medidos no referencial S

como

E =

E

+ a

V

B

,

B =

B
b
c
2

V

E

, (2.72)
onde a e b sao constantes adimensionais a serem determinadas ulteriormente.
Estas seriam as rela coes mais simples que visam reobter as equacoes de Maxwell
18
reescritas inteiramente em termos das novas coordenadas x

, y

, z

e dos novos
campos

E

e

B

.
Utilizamos, agora, as relacoes vetoriais,
(

V

A) = (

V )

A +

V (

A)

A(

V ) + (

A )

V ,(2.73)
(

V

A) =

V (

A) +

A (

V ) . (2.74)
Aplicadas aos campos

E e

B, e lembrando que

V e constante, aquelas rela coes
nos fornecem,


E =

E

V (

B

) , (2.75)


B =

B

+
b
c
2

V (E

) , (2.76)


E =

E

a
_
(

V )

V

B

_
, (2.77)


B =

B

+
b
c
2
_
(

V )

V

E

_
, (2.78)
Para que as equacoes de Maxwell que envolvem divergencias dos campos

E e

B
permane cam invariantes, e necessario impor a = b = 0. No entanto, com estas
escolhas, as demais equa coes de Maxwell, aquelas que envolvem os rotacionais
dos campos, sao alteradas pelas transforma coes de Galileu. Assim, uma inspe cao
direta de todas estas transforma coes mostra que nao e possvel recuperar a forma
original das equa coes de Maxwell para nenhum valor das constantes a e b.
Isto pode ser visto de uma forma mais direta, utilizando-se a equa cao de
onda para o potencial . Temos,
=

2

t
2
c
2

2
= 0 . (2.79)
Aplicando-se o fato que =

e que

2
t
2
=

2
t
2
2

V .

t

+(

V .

)
2
, obtemos,

2
t
2
2

V .

+ (

V .

)
2
c
2

2
= 0 , (2.80)
que ja nao representa uma onda se propagando com velocidade c. De fato, se
uma onda plana tal que
(x, t) = Ae
i(t

k.x)
, (2.81)
19
onde A e uma constante, e solucao de (2.79), com = [

k[, por outro lado a


solucao de (2.80) exige que
= [

k[(c

V n) , (2.82)
onde n e o vetor unitario que indica a direcao de propaga cao da onda ele-
tromagnetica. Isto esta em acordo com o fato que, na cinematica galileana,
diferentes observadores medem diferentes velocidades, a diferen ca entre as velo-
cidades sendo determinada pela velocidade relativa dos referenciais. Mas, como
a equa cao da onda (2.79) e consequencia das equacoes de Maxwell, isto quer di-
zer que diferentes observadores escrevem as equa coes de Maxwell de diferentes
maneiras. Assim, o eletromagnetismo nao e invariante pelas transforma coes de
Galileu, ao contrario do que acontece com a mecanica Newtonina.
A nao invariancia das equa coes de Maxwell com rela cao `as transforma coes de
Galileu pode ser resolvida se considerarmos que estas equa coes sao validas em
um referencial bem denido. Isto e o que acontece com as ondas mecanicas, um
exemplo sendo as ondas sonoras: a equa cao de onda correspondente e escrita
no referencial de repouso do meio onde se propaga esta onda, no caso o ar;
em outros referenciais em movimento em relacao a este meio, a equa cao de
propagacao da onda sonora assume uma forma bem diferente da equa cao usual
da onda. Isto implica, por exemplo, que um observador que se aproxima de uma
fonte em repouso neste meio nao e uma situa cao equivalente a uma fonte que se
aproxima, com a mesma velocidade, de um observador em repouso em rela cao
ao meio (isto sera discutido com maior detalhe na secao 3.4); a existencia de um
meio onde uma onda se propaga implica em um referencial privilegiado para os
fenomenos relativos a esta onda. No caso da luz, postulou-se que este referencial
seria o do eter, meio onde as ondas eletromagneticas se propagariam e onde elas
teriam velocidade c. Mas, fazendo experiencias com sinais luminosos, seria em
princpio possvel detectar este meio, como e o caso com as ondas sonoras. Esta
experiencia foi feita por A.A. Michelson e E.W. Morley, em torno de 1888, e
repetida diversas vezes depois, cada vez com maior renamento tecnico, e seu
resultado foi negativo: nao houve indcios da existencia do eter.
20
2.5 A eletrodinamica de Weber
Quase simultaneamente ao eletromagnetismo de Maxwell, houve uma outra for-
mulacao do eletromagnetismo que preservava a invariancia explcita em rela cao
`as transforma coes de Galileu. Trata-se da eletrodinamica de Weber
4
. Na ele-
trodinamica de Weber, o fulcro da formula cao teorica e a lei de forca entre duas
cargas pontuais. Ela se le como [8]

F
12
=
q
1
q
2
4
0
_
1 +
1
c
2
_
v
2

3
2
(r v)
2
+r a
__
r
r
3
, (2.83)
onde r = r
2
r
1
e v = v
2
v
1
, onde r
1
, r
2
, v
1
e v
2
sao a posicao e velocidade
das partculas 1 e 2, respectivamente.
Esta lei de forca pode ser deduzida de um potencial dependente da veloci-
dade:
U(r, v) =
1
4
0
q
1
q
2
r
_
1
1
2
v
2
c
2
_
. (2.84)
Isto implica que

F = U. (2.85)
Neste sentido, a lei de Forca de Weber pode ser obtida a partir de um Lagran-
giano.
A principal caracterstica da lei de Forca de Weber e que e invariante pelas
transformacoes de Galileu, ja que ela depende da posiao e da velocidade re-
lativas das partculas envolvidas na interacao. Neste sentido, trata-se de uma
formulacao de acao a distancia, semelhante `a propria gravitaao newtoniana,
muito embora na gravitacao newtoniana o potencial dependa unicamente da
distancia. Logo, a eletrodinamica de Weber nao comporta o conceito de campo
que e fundamental na eletrodinamica de Maxwell.
Exerccios
1. Considere um sistema de n partculas que interagem entre si. Nenhuma
forca externa age sobre sistema. Utilizando as leis de Newton, mostre que
4
Wilhelm Weber (18041891) publicou esta formulacao em 1846, duas decadas antes da
publicacao denitiva dos trabalhos de Maxwell
21
a soma dos momentos lineares das n partculas se conserva, i.e.,
n

i=1
p
i
=

P = constante .
2. Considerando novamente um sistema de n partculas que interagem entre
si atraves de forcas centrais, mostre que, no caso em que o torque devidos
`as forcas externas e nulo, o momento angular total,

L =
n

i=1

L
i
,

L
i
= r
i
p
i
,
se conserva.
3.

E possvel haver conservacao da energia sem conservacao do momento, ou
o contrario? A conservacao do momento angular requer a conservacao do
momento linear ou da energia?
4. Obtenha a equa cao (2.80).
22
Bibliograa
[1] V.B. Braginsky e V.I. Panov, JETP 34, 464(1971); P.G. Roll, R. Krotkov
e R.H. Dicke, Ann. Phys. 26, 442(1964).
[2] M. Milgrom, Astrophys. J. 270, 365(1983); Astrophys. J. 270, 371(1983);
Astrophys. J. 270, 384(1983).
[3] K.R. Symon, Mechanics, Addison-Wesley, Massachusetts (1978).
[4] L. Landau e E. Lifchitz, Mecanique, Mir, Moscou (1966).
[5] N.A. Lemos, Mecanica Analtica, Editora Livraria da Fsica, Sao
Paulo(2004).
[6] J.D. Jackson, Classical electrodynamics, Wiley, Nova Iorque(1999).
[7] L. Landau e E. Lifchitz, Theorie du champ, Mir, Moscou(1967).
[8] A.K.T. Assis, Webers electrodynamics, Kluwer Academic Publishers,
Dordrecht(1994).
23
Captulo 3
Os axiomas da Relatividade
Restrita e suas
consequencias
3.1 Introducao
No captulo anterior foi mostrado que, do ponto de vista da cinematica tra-
dicional baseada nas transformacoes de Galileu, existe uma incompatibilidade
entre a mecancia newtoniana e o eletromagnetismo de Maxwell. Enquanto a
teoria newtoniana guarda sua forma em diferentes referenciais inerciais quando
se utiliza as transformacoes de Galileu, as equacoes do eletromagnetismo sao
modicadas sob essas condi coes. Existe uma forma simples de resolver este
conito: uma vez que a teoria de Maxwell preve a existencia de ondas eletro-
magneticas, seguindo-se o paradigma das ondas mecanicas, pode-se pensar que
as equa coes que as descrevem devem ser validas apenas no referencial do meio
responsavel pela propagacao destas ondas. Este meio, que seria o suporte das
ondas eletromagneticas, foi denominado eter e deveria preencher todo o espa co,
sendo indetectavel por qualquer experiencia mecanica; apenas fenomenos envol-
vendo a propagacao de ondas eletromagneticas poderiam indicar a existencia
24
do eter. A nao invariancia das equ coes de Maxwell permitiria detectar o movi-
mento em rela cao ao espa co absoluto. Como mostram as equacoes (2.70,2.71),
o uso das transforma coes de Galileu introduz termos contendo explicitamente a
velocidade relativa dos referenciais.
A partir desta hipotese, uma serie de experiencias e observacoes foram ela-
boradas visando detectar o eter. Todas tiveram resultados negativos. Desta
forma, a incompatibilidade original entre a mecanica e o eletromagnetismo se
rearmou. Para supera-la, postulou-se que o grupo de transforma coes conec-
tando os diferentes referenciais inerciais nao seria o grupo de Galileu. A ideia foi
de substitui-lo por outro grupo que deixasse invariante as equacoes de Maxwell.
Mas, para isto, a denicao das grandezas cinematicas, e como consequencia toda
a mecanica newtoniana, deveria ser revista - em particular, o tempo medido por
um dado observador deixa de ser um parametro universal. Isto implica em rever
completamente a no cao de tempo e espaco. Uma nova estrutura cinematica e
geometrica, gerada agora pelas novas leis de transformacao, denomindas trans-
formacoes de Lorentz, surge. E o que e mais impressionante: a experiencia e
a observacao corroboram esta nova estrutura, que foi originalmente ditada por
razoes puramente teoricas.
Neste captulo, as evidencias experimentais contrarias `a existencia de um
referencial privilegiado, no que diz respeito `as equacoes de Maxwell, sao apre-
sentadas. A experiencia de Michelson-Morley e discutida com mais detalhes.
O resultado negativo desta experiencia, do ponto de vista da deteccao do eter
leva a uma modicacao das leis de transformacao para os sistemas inerciais. A
partir dos postulados fundamentais da Relatividade Restrita, as transforma coes
de Lorentz sao obtidas. Suas consequencias cinematicas sao apresentadas, e
a nova rela cao de adicao das velocidades e obtida. A estrutura de grupo das
transformacoes de Galileu e Lorentz e abordada. Isto permite estabelecer um
preambulo para a visao moderna tanto da Relatividade Restrita como tambem
para as teorias das intera coes fundamentais.
25
3.2 A experiencia de Michelson-Morley
A teoria eletromagnetica de Maxwell preve a existencia de ondas eletromagneticas.
A luz e, tao somente, onda eletromagnetica em uma dada faixa de comprimento
de onda. Durante o seculo XIX, admitia-se que a luz se propagava no eter,
que e um referencial bem particular. Esta hipotese era conforme ao paradigma
das ondas mecanicas. Se e assim, e natural assumir que a Terra se desloca em
relacao a este meio. Uma indicacao que a Terra se desloca em relacao aoeter e
o fenomeno da aberra cao da luz. O fenomeno da aberra cao da luz refere-se ao
fato que a dire cao da velocidade da luz emitida por uma estrela, medida por
um observador na Terra, muda durante o perodo de tempo em que a Terra
descreve sua orbita em torno do Sol. Se existe um meio onde a luz se propaga,
no caso o eter, este fenomeno implica que a Terra se desloca em rela cao ao eter:
o movimento aparente da estrela devido `a velocidade de translacao da Terra so
pode ser compreendido se a luz se propaga com velocidade xa c no meio inte-
restelar que seria inteiramente preenchido por este meio material indectetavel
1
.
O fenomeno de aberracao da luz sera discutido mais em detalhe no proximo
captulo
2
. Se Terra se desloca em relacao ao eter, onde a luz teria velocidade
c, seria possvel medir os efeitos devido a este deslocamento, fazendo interferir
feixes de luz que se propagam paralela e perpendicularmente `a dire cao do deslo-
camento da Terra em relacao ao eter.

E um efeito similar ao da propagacao da
onda sonora na dire cao paralela ou perpendicular do vento, que e o movimento
do meio onde se propaga a onda sonora, o ar.
A experiencia de Michelson-Morley consistia precisamente em detectar o
ventodo eter. Trata-se de uma experiencia de interferometria. Envia-se um
feixe luminoso sobre um espelho semi-transparente. O feixe se divide em dois,
1
A nao ser eventualmente pelos fen omenos relacionados ` a propagacao da luz.
2
Entretanto, vale assinalar que a posic ao das estrelas apresenta um movimento aparente,
visto da Terra, devido a dois fenomenos distintos: a paralaxe e a aberra cao. Ambos serao
discutidos no pr oximo captulo. Podemos, no entanto, antecipar que os dois fen omenos podem
ser distinguidos uma vez que o movimento aparente das estrelas devido `a paralaxe depende
da posi cao da Terra ao longo de sua orbita, ao passo que o movimento aparente devido `a
aberracao depende da dire cao da velocidade da Terra ao longo de sua orbita. Alem do mais,
somente as estrelas mais proximas apresentam uma paralaxe apreciavel, enquanto todas as
estrelas apresentam um deslocamento aparente devido `a aberracao.
26
Figura 3.1: O dispositivo experimental de Michelson-Morley
que se propagam em dire coes perpendiculares.
`
A distancias L
1
e L
2
do espelho
semi-transparente se encontram espelhos totalmente reetores. Os feixes sao
assim enviados novamente ao primeiro espelho, onde eles se interferem. Medem-
se as franjas de interferencia resultantes, Figura (3.2).
Considerando que uma das direcoes esta orientada no sentido do desloca-
mento da Terra, e a outra perpendicularmente, que a Terra se desloca com
velocidade V em rela cao ao eter, onde a luz tem velocidade c, usando a lei ga-
lileniana de adicao das velocidades, os tempos gastos na ida e volta ao espelho
semi-transparente, nas direcoes paralela (T
1
) e perpendicular ao movimento de
translacao da Terra (T
2
), sao
T
1
=
L
1
c V
+
L
1
c + V
=
2L
1
c(1
V
2
c
2
)
, (3.1)
T
2
=
2L
2
c
_
(1
V
2
c
2
)
. (3.2)
Estes tempos sao diferentes mesmo se as distancias L
1
e L
2
forem iguais. Mas,
para evitar problemas de medidas, como os relacionados com o conhecimento
impreciso de L
1
e L
2
, e mais simples considerar L
1
,= L
2
, e repetir a experiencia
depois de girar todo o dispositivo de um angulo =

2
. Se a velocidade da luz
depende da direcao, devido ao deslocamento da Terra em relacao ao eter, havera
um deslocamento das franjas de interferencia quando for feita esta rotacao.
Esse deslocamento das franjas nao foi observado. Michelson e Morley re-
petiram e aperfeicoaram esta experiencia por mais de dez anos. A conclusao
imediata e que o ventodo eter nao existe. Isto compromete a existencia do eter
e de um referencial privilegiado para as ondas eletromagneticas. Observe-se, en-
tretanto, que a experiencia de Michelson e Morley nao implica necessariamente
que a luz tem uma velocidade constante que e independente do observador.
Na verdade, as transformac oes de Lorentz, a serem introduzidas ulteriormente,
foram inicialmente propostas visando explicar o resultado negativo desta ex-
periencia: haveria uma contracao dos corpos na direcao do movimento, como
sugerido inicialmente por Fitzgerald e Lorentz, o que explicaria a ausencia de
27
alteracao das franjas de interferencia quando o aparato era girado.
As transforma coes de Lorentz, formuladas originalmente para explicar o re-
sultado negativo das experiencias de Michelson-Morley, foram obtidas conjunta
e independentemente por Lorentz e Poincare antes do surgimento da teoria da
Relatividade Restrita.
3.3 Referenciais inerciais
Um referencial e um sistema em rela cao ao qual dene-se uma posi cao no espa co.
Em Fsica, uma vez que tratamos com fenomenos que ocorrem no espaco e no
tempo, o conceito de referencial desempenha um papel central. Nem todos os
referenciais sao adequados para descreverem as leis da Fsica. O que estabe-
lece a condicao para que um referencial seja adequado para descrever as leis
fundamentais da Fsica, e a primeira lei de Newton. Esta lei diz o que deve
ocorrer se uma dada partcula nao sofre a acao de nenhuma forca: ela devera
apresentar velocidade constante, sendo o caso de velocidade nula uma situacao
particular. Evidentemente esta implcito que nos sejamos capazes de identicar
as forcas existentes, uma vez que elas tem realidade Fsica. Dizer que elas tem
realidade Fsica conduz `a independencia do seu valor em relacao ao referencial
onde ela e medida. Da a importancia dos referenciais inerciais. Por outro lado,
uma intera cao fsica e um processo que resulta em uma for ca que aparece sob a
forma de um par acao-reacao, como estabelecido pela terceira lei de Newton.
Uma vez identicado um referencial onde a primeira lei de Newton e valida,
todos os referenciais que se deslocam com velocidade constante em rela cao a este
referencial tambem satisfazem a primeira lei de Newton, e consequentemente sao
adequados para descrever as leis da Fsica: todos eles medirao uma velocidade
constante para uma partcula sobre a qual nao age nenhuma forca, muito embora
a expressao para esta velocidade seja diferente. Todos estes referenciais sao
chamados de Inerciais.
Nos podemos denir um referencial inercial da seguinte forma: Um refe-
rencial inercial e aquele onde as relacoes espaciais, determinadas por escalas
rgidas em repouso neste referencial, sao euclideanas, onde existe um tempo
universal, e onde partculas livres permanecem em repouso ou continuam a se
28
deslocar com velocidade vetorial constante.
3.4 Os dois axiomas da relatividade restrita
Existe uma classe de bonsobservadores em Fsica: sao os observadores loca-
lizados em referenciais inerciais. A situacao descrita anteriormente mostra que
as leis de Newton sao validas para todos os referenciais inerciais, se as medidas
feitas em diferentes referenciais sao conectadas pelas transforma coes de Galileu.
Entretanto, o eletromagnetismo nao possui esta invariancia, e se quisermos man-
ter as transforma coes de Galileu, temos que supor um referencial privilegiado
onde as equacoes de Maxwell sejam validas. A experiencia de Michelson-Morley
mostra, por outro lado, que nao existe tal referencial privilegiado. Isto cria um
impasse: se aceitarmos que as leis da Fsica sao as mesmas em todos os referen-
ciais inerciais, entao ou as transforma coes de Galileu tem que ser modicados,
conduzindo tambem a uma modicacao da mecanica Newtoniana, ou o eletro-
magnetismo deve ser modicado de forma a se adaptar `as transforma coes de
Galileu.
Este impasse e resolvido na Relatividade Restrita atraves de dois axiomas
fundamentais:
1. Todos os observadores localizados em referenciais inerciais escrevem as leis
da Fsica da mesma forma;
2. A velocidade da luz, c, e uma constante universal, tendo o mesmo valor
em todos os referenciais inerciais.
O primeiro axioma poe todas as leis da Fsica no mesmo nvel, do ponto de
vista da invariancia por uma transformacao de um referencial inercial a outro.
Mas, a mecanica Newtoniana nao obedece `as mesmas leis de transformacao que
o eletromagnetismo. O segundo axioma tem como consequencia que a equacao
para as ondas eletromagneticas guarda a mesma forma em todos os referenciais
inerciais. Assim, o segundo axioma implica que as equa coes de Maxwell sao
invariantes em rela cao `a passagem de um referencial inercial a outro e que,
consequentemente, as transforma coes de Galileu nao constituem a boa forma de
traduzir as medidas d um referencial para outro. Como corolario, temos que a
29
mecanica Newtoniana tem que ser modicada.

E necessario, entao, encontrar
as boas leis de transformac ao, e adaptar a mecanica Newtoniana a elas.
O primeiro axioma seria, de uma certa forma, compartilhado por um fsico
newtoniano. Entretanto, o segundo axioma representa a ruptura com a fsica
newtoniana visto que ele estabelece que a velocidade da luz nao depende de
quem a mede. Este axioma conduz a resultados inesperados. Estes resultados
serao discutidos detalhadamente mais tarde. No momento, analisemos o que
signica denir um sistema de referencia.

E preciso, em primeiro lugar, se ter
uma medida de distancia e uma medida de tempo. Utilizando-se o segundo
postulado da Relatividade Restrita, pode-se estabelecer medidas de distancias
e temporais utilizando-se feixes luminosos. A distancia de um certo ponto `a
origem pode ser obtida, colocando-se neste ponto um espelho reetor: envia-
se um feixe luminoso, que retorna ao ponto de partida. Mutiplica-se o tempo
de ida e volta do feixe por c e divide-se depois por dois. Isto nos fornece a
distancia deste ponto. A medida de tempo, por outro lado, implica em que em
cada ponto do referencial deve-se ter um relogio e o conjunto destes relogios deve
estar sincronizado. Para obter-se a sincronizacao, envia-se um feixe luminoso a
partir da origem, no instante que por conven cao se considera t = 0. Quando o
feixe passar por um relogio a uma distancia x da origem, ele devera indicar o
tempo t =
x
c
.
Um dos problemas que decorre dos axiomas da Relatividade Restrita e que
nao se pode utilisar os dados de um referencial S para se estabelecer medidas
de distancia e tempo em um outro referencial S

em movimento em relacao a
S. Suponhamos um referencial S onde identicamos dois pontos A e B equidis-
tantes da origem, possuindo relogios sincronizados. Consideramos agora pontos
A

e B

, tambem equidistantes da origem no referencial S

. Se o observador em
S

utilizar o sinal luminoso que o observador em S usou para sincronizar seus


relogios, ele podera sincronizar os tempos de A

e B

, mas encontrara que os


tempos de A e B nao estarao sincronizados, ja que a velocidade da luz e a mesma
nos dois referencias, mas para o observador em repouso em S

, os pontos A e
B se deslocam durante o processo de sincronizacao. Em consequencia, relogios
sincronizados em um referencial, nao o serao em outro referencial.
Para entendermos melhor esta questao, precisamos primeiro achar as leis de
30
transformacoes que resultam dos dois axiomas da Relatividade Restrita.
3.5 As transformac oes de Lorentz
Nosso objetivo agora e estabelecer como se traduzem os dados fsicos de um
referencial inercial S para outro referencial inercial S

, quando os axiomas da
Relatividade Restrita sao respeitados. Procuremos inicialmente utilizar a forma
geral de se passar das coordenadas (x,t) medidas no referencial S para as coor-
denadas (x

,t

) no referencial S

. A velocidade relativa, constante, entre os dois


referenciais e

V .
Suponhamos inicialmente que o observador em repouso em S siga o movi-
mento de um relogio que se desloca em relacao a ele com velocidade constante
3
.
O tempo medido por este relogio e . Devido `a homogeneidade do espaco,
incrementos iguais em implicam incrementos iguais nas coordenadas (x,t).
Logo,
dx

d
= constante ,
d
2
x

d
2
= 0 , (3.3)
onde = 0, i, i = 1, 2, 3, x
i
= x, y, z e x
0
= ct. Isto deve ser tambem verdade
para o observador no referencial S

. Mas,
dx

d
=

dx

d
= constante , (3.4)
d
2
x

d
2
=

2
x

dx

d
dx

d
+

d
2
x

d
2
= 0 . (3.5)
Nos obtemos assim as condi coes de transformacao do sistema de coordenadas
x

para o sistema x

:
x

= constante ; (3.6)

2
x

= 0. (3.7)
Assim, a transforma cao de x

para x

tem a forma,
x

+ B

, (3.8)
3
Esta sec ao segue de perto a apresentac ao do texto Introduction to special relativity,
de Wolfgang Rindler.
31
onde A

e B

sao constantes. Suponhamos agora que o relogio esteja em


repouso na origem do sistema S. Assim, x
i
= 0 e diferenciando (3.8), temos
dt

= A
0
0
dt , (3.9)
dx
i

= A
i
0
dt , (3.10)
conduzindo a
dx
i

dt

=
A
i
0
A
0
0
= constante . (3.11)
Isto implica que a primeira lei de Newton e valida: um relogio em repouso em
S tera velocidade constante em S

.
Nos podemos usar a isotropia do espaco (nada se altera se girarmos os eixos
coordenadas), de forma que o eixo x seja paralelo ao eixo x

. Da mesma forma,
nos podemos fazer com que os planos denidos pelas coordenadas y = 0 e y

= 0,
assim como o denido por z = 0 e z

= 0, sejam os mesmos. A homogeneidade


do tempo nos permite que fa camos t = 0 coincidir com t

= 0. Se o referencial
S

se desloca em relacao a S com velocidade constante



V , que por simplicidade e
usando as propriedades de simetria descritas acima, escolhemos como orientada
ao longo do eixo x, entao a origem de S

tera coordenada x = V t, medida em S.


Alem do mais, suponhamos que as equacoes de transformacao de coordenadas
sejam invariantes em relacao `as seguintes opera coes:
t, x, y, z , t

, x

, y

, z

, x

, y

, z

, t, x, y, z ; (3.12)
t, x, y, z , t

, x

, y

, z

, x

, y

, z

, t, x, y, z . (3.13)
Estas operacoes equivalem a inverter os papeis de S e S

.
Nos podemos agora buscar as transformacoes que satisfazem as condi coes
acima. Uma vez que a transformacao deve ser linear, temos,
y

= Ax + By + Dt + E . (3.14)
Mas, y = 0 implica y

= 0. Assim, A = D = E = 0. Considerando a primeira


inversao acima temos,
y = By

= B
2
y B = 1 . (3.15)
32
Figura 3.2: Simetrias que invertem os papeis de S e S

33
Mas, no limite V 0, a transformacao deve se reduzir `a identidade. Assim,
temos B = 1. O mesmo raciocnio se aplica `a coordenada z. Logo,
y

= y , (3.16)
z

= z . (3.17)
Consideremos agora a coordenada x. Utilizando novamente a condi cao de
linearidade, temos
x

= x + Fy + Gz + Ht . (3.18)
Nos ja vimos que x

= 0 implica x = V t. Assim,
x

= (x V t) . (3.19)
A inversao xy conduz a
x = (x

+ V t

) . (3.20)
Para calcularmos o parametro usamos o segundo axioma da Relatividade
Restrita. Como a velocidade da luz e a mesma em todos os referenciais inerciais,
se uma frente de onda e emitida no momento t = t

= 0, nos temos,
ct

= (c V )t , (3.21)
ct = (c + V )t

. (3.22)
Temos entao,
c
2
tt

=
2
tt

(c
2
V
2
) ,
=
c

c
2
V
2
,
=
1
_
1
V
2
c
2
. (3.23)
Escolhemos o sinal positivo da raiz de maneira a se ter a transformacao identi-
dade quando V 0.
A lei de transformacao para t

decorre das precedentes:


x

= (x V t) ,
x = (x

+ V t

) ,
34
x =
_
(x V t) + V t

_
,
V t

= x(1
2
) +
2
V t ,
V t

=
2
_
V t
V
2
c
2
x
_
,
t

= (t
V
c
2
x) , (3.24)
t = (t

+
V
c
2
x

) . (3.25)
Desta forma, nos temos o seguinte conjunto de transformacoes entre as co-
ordenadas do referencial S e as do referencial S

:
t

= (t
V
c
2
x) ; t = (t

+
V
c
2
x

) ; (3.26)
x

= (x V t) ; x = (x

+ V t

) ; (3.27)
y

= y , z

= z ; y = y

, z = z

. (3.28)
Estas expressoes sao denominadas Transformacoes de Lorentz.
Nos podemos mostrar que, se a secao espacial de S e euclidiana, a de S

tambem o sera. A distancia percorrida por um raio luminoso, em S, e dada por


c
2
dt
2
= dx
2
+ dy
2
+ dz
2
. (3.29)
Aplicando as transforma coes de Lorentz, temos,
c
2
_

2
(dt

+
V
c
2
dx

)
2
_
=
2
(dx

+ V dt

)
2
+ dy

2
+ dz

2
,
dt

2
(c
2

2
V
2
) = dx

2
(
2

V
2
c
2

2
) + dy

2
+ dz

2
,
c
2
dt

2
= dx

2
+ dy

2
+ dz

2
. (3.30)
Isto nos assegura que o espa co tridimensional observado por S

permanece eu-
clidiano.
3.6 Forma geral das transformacoes de Lorentz
As transforma coes de Lorentz deduzidas anteriormente supoem que a veloci-
dade relativa entre os dois referenciais inerciais esta orientada ao longo do eixo
dos x. Podemos sem grandes diculdades obter as transformacoes para o caso
35
onde a direcao da velocidade relativa e arbitraria. Em primeiro lugar, e pre-
ciso observar que as transformacoes (5.19,5.20,3.28) continuam validas se for
realizada uma rota cao nos eixos coordenadas. Neste caso, podemos decompor
os vetores posicao medidos nos referenciais S e S

em componentes paralelas e
perpendiculares `a velocidade relativa:
x = x
||
+x

, x

= x

||
+x

. (3.31)
Estas componentes paralelas e perpendiculares podem ser escritas como
x
||
=

V

V x
V
2
, x

||
=

V

V x

V
2
(3.32)
x

= x x
||
, x

= x

||
. (3.33)
Considerando que as coordenadas na direcao paralela `a velocidade relativa entre
os referenciais obedecem `as tranformacoes de Lorentz, assim como a coordenada
temporal, e que as coordenadas nas direcoes perpendiculares nao sao afetadas
por elas, podemos escrever as transformacoes de Lorentz como se segue.
x

||
=
_
x
||

V
c
x
0
_
, (3.34)
x

= x

, (3.35)
x
0

=
_
x
0

V x
c
_
. (3.36)
Por outro lado, temos que

V x

V
2
=
_

V x
V
2

V
c
x
0
_
. (3.37)
x

V x

V
2
= x

V x
V
2
. (3.38)
Assim, as transformacoes de Lorentz para o caso em que a velocidade relativa
entre os referenciais possui direcao assumem a seguinte forma:
x

= x + ( 1)

V x
V
2

V
c
x
0
, (3.39)
x
0

=
_
x
0

V x
c
_
. (3.40)
Estas expressoes foram, pela primeira vez, determinadas por C. Moller
4
4
C. Moller, The theory of relativity, Oxford Clarendon Press, Oxford(1952), pagina 41.
36
3.7 Propriedades das transformacoes de Lorentz
Vamos analisar algumas consequencias das transformacoes deduzidas anterior-
mente. Um conceito importante que sera utilizado sucessivamente aqui e o de
evento. Um evento e um fenomeno que ocorre em um ponto do espaco, em um
dado momento. Assim, a um evento P nos associamos quatro coordenadas, uma
temporal e tres espaciais: P = P(t, x).
3.7.1 O conceito de simultaneidade
Consideremos dois eventos no referencial S tendo coordenadas,
P
1
= (t
1
, x
1
) , (3.41)
P
2
= (t
2
, x
2
) . (3.42)
Suponhamos agora que t
1
= t
2
: os eventos sao simultaneos no referencial S.
Consideremos um referencial S

que se desloca em relacao a S com velocidade


constante V , ao longo do eixo x. As coordenadas temporais destes dois eventos
medidas no referencial S

sao,
t
1

= (t
1

V
c
2
x
1
) , (3.43)
t
2

= (t
2

V
c
2
x
2
) . (3.44)
Como t
1
= t
2
, temos,
t

= t
2

t
1

=
V
c
2
(x
1
x
2
) . (3.45)
Visto do referencial S

, estes dois eventos nao sao simultaneos. Eles so o serao


se x
1
= x
2
. Mas, neste caso, eles constituiriam um unico evento, visto que P
1
ocorreria no mesmo lugar e no mesmo momento que P
2
. Observe-se que, no re-
ferencial S

, o evento P
1
pode ocorrer antes ou depois do evento P
2
, dependendo
do sinal de x = x
1
x
2
. Isto e possvel, como veremos mais tarde, porque se
os eventos sao simultaneos em um dado refencial, necessariamente eles nao tem
conexao causal. Desta forma, a ordem temporal com que eles sao vistos em um
outro referencial e irrelevante.
37
O fato que nem todos os observadores concordam sobre quais fenomenos sao
simultaneos e um das chaves para compreender muitos dos aparentes parado-
xos da relatividade restrita. A nocao de simultaneidade na teoria newtoniana
e absoluta: todos os observadores concordam sobre quais sao os fenomenos que
ocorrem ao mesmo tempo. Mas, este nao e mais o caso quando se substitui as
transformacoes de Galileu pelas transformacoes de Lorentz. Como veremos de-
pois, esta relativizacaodo conceito de simultaneidade esta intimamente ligada
`a nocao de causalidade em relatividade restrita.
3.7.2 A contracao das distancias
Consideremos uma regua de comprimento L em repouso em um referencial S.
Essa regua tera seu comprimento medido em um referencial S

que se desloca
com velocidade V em rela c ao a S. Para fazer esta medida, o observador em S

devera assinalar, simultaneamente, as posi coes das duas extremidades da regua.


Utilizando as transforma coes de Lorentz, e considetrando que as medidas sao
feitas no mesmo tempo t

1
= t

2
, obtemos,
x
2
= (x

2
+ V t

2
) ,
x
1
= (x

1
+ V t

1
) ,
x = x
2
x
1
= x

. (3.46)
Visto que x = L, escrevendo o comprimento da regua no referencial S

como
x

= L

, obtemos,
L

=
L

=
_
1
V
2
c
2
_
1/2
L . (3.47)
Assim, o comprimento da regua medido em S

e menor que o medido em S.


Isto caracteriza o que se denomina de contra cao das distancias. Notemos que a
regua tera comprimento maximo no referencial onde ela esta em repouso.
Essa contracao e, de fato, um efeito de perspectivado observador que ve
a regua em movimento. Consideremos um exemplo. Um observador esta em
repouso em um referencial S

, onde as distancias sao graduadas. Duas reguas


de mesmo comprimento L se deslocam no referencial S com velocidades iguais
mas opostas. As extremidades destas reguas sao designadas por PQ e por
P

. O ponto P(Q) encontra o ponto P

(Q

) no mesmo momento em S. Se
38
nos considerarmos agora estes eventos vistos do referencial S

da regua PQ,
o encontro de PP

ocorre depois do encontro QQ

, ja que, neste referencial,


a regua P

parecera menor que a regua PQ; alem disto, visto a partir do


referencial S

da regua P

, o encontro QQ

ocorre depois que o de PP

, pelo
mesmo motivo. Ve-se aqui um exemplo da relatividade da simultaneidade.
A contra cao das distancias pode conduzir a falsosparadoxos. Considere-
mos o seguinte caso. Um carro de 20m de comprimento, em seu proprio refe-
rencial, se aproxima de uma garagem que, tambem no seu referencial proprio,
mede 10m, com velocidade V . Pode o carro entrar na garagem? Suponhamos
V = 0, 866c, de maneira que = 2. No referencial da garagem, o carro tera
comprimento igual a 10m, e assim ele podera entrar inteiramente na garagem.
Mas no referencial do carro, a garagem medira 5m, e aparentemente o carro nao
caberia nela. Como podemos conciliar isto com o princpio da simetria entre os
referenciais?
Vamos nos por agora no referencial do carro. A frente do carro encontra o
fundo da garagem. A parte traseira do carro ainda nao recebeu o sinal deste
evento. Ela o recebera num tempo t =
20
c
depois. Mas, durante este tempo, a
parte traseira tera se deslocado uma distancia igual a x = tV = 17, 32m. Como
a distancia entre a porta da garagem e a parte traseira do carro era de 15m, todo
o carro tera atravessado a entrada da garagem quando o observador na parte
traseira receber o sinal que a parte dianteira chegou no fundo da garagem:
eventos que eram simultaneos no referencial da garagem, correspondendo `as
partes dianteira e traseira no interior da garagem, nao o sao no referencial do
carro. A solucao deste paradoxo se encontra na propagacao nita dos sinais, em
especial a da luz.
3.7.3 A Dilatacao do tempo
Consideremos, como antes, dois referenciais S e S

com velocidade relativa V .


Suponhamos que no referencial S haja um relogio em repouso. Neste referencial
se escoa um intervalo de tempo T = t medido por este relogio. Qual e o
intervalo de tempo T

= t

correspondente que medira um observador em


repouso no referencial S

? Utilizamos novamente as transforma coes de Lorentz,


39
relacionando os tempos t
1
, t
2
com t

1
, t

2
que marcam o incio e o m deste
intervalo de tempo em cada referencial:
t

2
= (t
2

V
c
2
x
2
) , (3.48)
t

1
= (t
1

V
c
2
x
1
) . (3.49)
Como o relogio esta em repouso no referencial S, temos x
1
= x
2
. Logo,
t

= t T

= T . (3.50)
O intervalo de tempo, que em S e igual a T, sera dilatado para um observador
em S

por um fator . Se T representa um segundo no relogio no referencial S,


este segundo parecera mais longo para um observador em S

, que concluira que


o relogio em repouso em S esta se atrasando em relacao ao seu proprio relogio.
Devido a equivalencia dos referenciais inerciais, o observador em S dira, pe-
las mesmas razoes expostas acima, que o relogio em repouso no referencial S

esta se atrasando. A dilatacao do tempo e um puro efeito de movimento relativo


de referenciais inerciais, e evidentemente nao pode conduzir a uma constatacao
absoluta, visto que isto implicaria que os dois relogios, em S e em S

, deveriam
ter seus indicadores de tempo comparado duas vezes no mesmo ponto do espaco.
Mas isto implicaria que um dos relogios deveria retornar, revertendo seu mo-
vimento, e isto conduz a uma aceleracao de um dos referenciais, que deixaria
portanto de ser inercial. Este e o caso do paradoxo dos gemeos, que novamente
e um falsoparadoxo: dois irmaos gemeos se separam, um cando na Terra e
o outro empreendendo uma viagem interestelar com velocidade proxima `a da
luz. Quando o gemeo astronautaretorna, ele se revela mais jovem que o seu
irmao que cou na Terra. A solu cao para este problema esta no fato que o
retornoimplica na passagem de um referencial inercial para um nao inercial,
e toda a analise acima nao se aplica mais. Nos trataremos deste paradoxo com
mais detalhe posteriormente.
40
3.7.4 Transformacoes de Lorentz na forma diferencial
Escrevamos inicialmente as transformacoes de Lorentz sob a forma de diferen cas
e de diferenciais:
t

= (t
V
c
2
x) ; x

= (x V t) ; (3.51)
y

= y , z

= z . (3.52)
No limite em que o intervalo de tempo e, consequentemente os intervalos de
espaco, tende a zero, obtem-se as seguintes rela coes diferenciais:
dt

= (dt
V
c
2
dx) ; dx

= (dx V dt) ; (3.53)


dy

= dy , dz

= dz ; dy = dy

, dz = dz

. (3.54)
Essa forma de se escrever e possvel uma vez que a velocidade V , e consequen-
temente o fator , e constante.
3.7.5 Existe uma velocidade limite
Consideremos de novo os referenciais S e S

que tem uma velocidade relativa


igual a V . Se V for maior que c, a velocidade da luz, o fator torna-se ima-
ginario. Isto mostra que, para que o formalismo da Relatividade Restrita seja
coerente, contendo unicamente observaveis reais, passveis de serem medidos,
nenhum objeto pode ter velocidade superior `a da luz, j`a que a qualquer objeto
podemos associar um referencial. Alem do mais, nenhum objeto pode ter a
velocidade igual `a da luz, ja que isto implica uma divergencia do fator . A
velocidade da luz e uma velocidade limite na natureza, permitida unicamente
aos objetos nao massivos. Tais objetos, como o foton e o graviton
5
, mediadores
das interacoes eletromagneticas e gravitacional, por serem nao massivos, nao
podem ter a eles associado um referencial no sentido usual, e suas velocidades
serao, como mostraremos mais tarde, invariantes, e sempre iguais a c.
Alem disto, a existencia de uma velocidade superior `a da luz conduziria a
uma violacao da causalidade. Consideremos, por exemplo, dois eventos P
1
=
(t
1
, x
1
) e P
2
= (t
2
, x
2
) vistos a partir do referencial S, tal que t = t
2
t
1
> 0
5
Ao contr ario do f oton, o graviton ainda nao foi detectado experimentalmente
41
e x = x
2
x
1
> 0. Assumamos que o evento P
1
e causa do evento P
2
. No
referencial S

, temos,
t

= (t
V
c
2
x) = t(1
V
c
2
U) (3.55)
onde
U =
x
t
(3.56)
e a velocidade com que o sinal emitido por P
1
se desloca ate atingir P
2
. Se U for
maior que c de forma que UV > c
2
, entao t

< 0, e a ordem de acontecimento


dos dois eventos visto de S

seria invertida: o efeito aconteceria antes da causa,


violando a causalidade. Observe-se que, xando U > c, sempre sera possvel
encontrar um referencial S

tal que a condi cao UV > c


2
sera satisfeita. A unica
forma de se preservar o ordenamento temporal de eventos que tem conexao
causal e impor a impossibilidade de se ter velocidades superiores a c.
3.8 O espaco-tempo de Minkowski
As transforma coes de Lorentz combinam de forma nao trivial as coordenadas
espaciais e temporais. Desta forma, a visao habitual da mecanica newtoniana
de um espa co euclidiano, onde se denem os diferentes referenciais, dotado de
um tempo universal, nao afetado pela mudanca de referenciais, nao e mais ade-
quada.

E preciso agora uma concep cao espaco-temporal, devido ao fato que
cada referencial dene seu tempo, da mesma maneira que dene suas coorde-
nadas espaciais. A estrutura criada pelas transformacoes de Lorentz requer um
contnuo quadri-dimensional, com tres coordenadas espaciais e uma coordenada
temporal, que se deformaquando se passa de um referencial a outro.
Podemos construir um diagrama espaco-temporal, a quatro dimensoes, e
nele representar os efeitos das transformacoes de Lorentz. De forma a simpli-
car esta representa cao, vamos considerar um espaco-tempo bidimensional, com
coordenadas (ct,x) = (x
0
,x
1
). Denimos a nova coordenada x
0
= ct de maneira
a se ter homogeneidade dimensional. O eixo x
0
e denido por x
1
= 0 (t = 0),
e o eixo x
1
por x
0
= 0. Um feixe de luz neste diagrama tem uma trajetoria
retilnea, fazendo um angulo de

4
com o semi-eixo positivo ou negativo de x
1
,
uma vez que para este feixe, x = x
1
= ct = x
0
. As retas que fazem este angulo
42
com o eixo x
1
denem o que e denominado de cone de luz. O interior do cone
de luz e a regiao causalmente conectada com a origem.
De fato, qualquer evento P = (x
0
, x
1
) localizado no interior do cone de luz
tem conexao causal com o evento da origem P
0
= (0, 0), pois um sinal emitido
a partir da P
0
, com velocidade inferior `a da luz, pode atingir o evento P, se
x
0
> 0; ou ainda, um sinal emitido de P com velocidade inferior `a da luz pode
atingir P
0
, se x
0
< 0. Desta forma, a parte superior do cone de luz e constituda
de eventos que sofreram a a cao de P
0
, ao passo que a parte inferior do cone
de luz e constituda de eventos que agiram sobre P
0
. Por este motivo, a parte
superior do cone de luz e chamada de futuro, e a parte inferior de passado. As
nocoes de passado e futuro se referem ao evento da origem, P
0
. Todos os eventos
localizados fora do cone de luz nao tem conexao causal com a origem, ja que
um sinal que os conecte com a origem deve necessariamente se propagar com
velocidade superior `a da luz. Notemos, en passant, que um evento P
1
dentro do
cone de luz de P
0
pode ter conexao causal com um evento P
2
fora do cone de
luz de P
0
; para tanto, basta que P
1
esteja dentro do cone de luz de P
2
.
Temos pelas Transformacoes de Lorentz,
x
0

= (x
0

V
c
x
1
) , (3.57)
x
1

= (x
1

V
c
x
0
) . (3.58)
Podemos construir os novos eixos (x
0

, x
1

). Para denirmos o eixo x


0

, fazemos
x
1

= 0, obtendo
x
1
x
0
=
V
c
. Como
V
c
e menor que a unidade e positivo, o eixo
devera ser como ilustrado na gura. Da mesma forma, para obtermos o eixo
x
1

, fazemos x
0

= 0, obtendo
x
0
x
1
=
V
c
. Pelos mesmos motivos que antes, o novo
eixo temporal tem a forma exibida na gura 4. Os angulos entre os novos eixos
(x
0

, x
1

) e os antigos eixos (x
0
, x
1
) sao dados por tan =
V
c
. Observe-se que,
visto do referencial S, os eixos do referencial S

tem a curiosa forma de uma


cunha, como indicado na gura. Isto se deve `a natureza hiperbolica do espa co-
tempo de Minkowski, como sera discutido mais tarde. Dito de outra maneira,
a forma de cunha e consequencia do fato que a velocidade da luz e a mesma
nos dois referenciais S e S

: ela deve ser representada pela bissetriz dos eixos


(x
0
,x
1
) e (x
0

, x
1

) simultaneamente. A unica possibilidade e que os novos eixos


(x
0

, x
1

), quando vistos de S, possuam a forma indicada na gura.


43
Figura 3.3: Representacao espaco-temporal das transformacoes de Lorentz
Figura 3.4: Representacao das hiperboles invariantes
A partir das transforma coes de Lorentz, e facil vericar (veja o exerccio 5)
que
(x
0
)
2
(x
1
)
2
= (x
0

)
2
(x
1

)
2
. (3.59)
Logo, a hiperbole x
2
c
2
t
2
= (x
1
)
2
(x
0
)
2
= cte permanece invariante quando
aplicamos uma transforma cao de Lorentz. Dependendo do sinal da constante
nessa expressao, a hiperbole corta seja os eixos x
0
, x
1

ou x
0
, x
0

, denindo
unidades de medidas de espa co ou de tempo. Estas hiperboles invariantes estao
representadas na gura 5. Nos analisaremos mais em detalhe a estrutura do
espaco-tempo de Minkowski no captulo 4.
44
3.9 Estrutura de grupo
A teoria de grupo desempenha um papel fundamental nas teorias fsicas moder-
nas. Por exemplo, certas propriedades das partculas elementares sao deduzidas
a partir das estruturas de grupo das teorias que as descrevem. O ultimo quark
(partculas elementares que se combinam para formar os barions e pons) a ser
descoberto foi o quark top. Durante mais de trinta anos os fsicos acreditaram na
existencia do quark top, mesmo que ele nao tivesse sido detectado diretamente.
A certeza na existencia do quark top vinha do fato que ele e fundamental para
completar a estrutura do grupo que descreve os quarks, o grupo SU(3). O quark
top terminou sendo descoberto nos aceleradores de partcula em 2004. A estru-
tura de grupo de uma teoria nos indica freq uentemente o conte udo fsico desta
teoria.
Vamos, neste sentido, vericar as propriedades de grupo para as trans-
formacoes de Lorentz. Vericaremos que a expressao para a adi cao das ve-
locidades pode ser obtida a partir do fato que as transformacoes de Lorentz
formam um grupo.
Mas, antes, vamos rever o conceito de grupo. Primeiramente, consideremos
uma transformacao U que age sobre um vetor x, em um espaco a n dimensoes.
Se o vetor x e representado por um vetor coluna, entao, a transforma cao U e
representada por uma matriz nn. Consideremos agora um outro vetor y nesse
mesmo espa co. Podemos, por exemplo, denir o produto interno entre estes dois
vetores, y x = a, a 1. Logo, a e um n umero. Para que assim seja, se estamos
representando x por um vetor coluna, entao y tem que ser representado por um
vetor linha. Isto signica que o produto interno so e possvel entre elementos que
pertencem a um dado espa co, dito M, e a elementos que pertencem ao espa co
dual `aquele primeiro espa co, dito M

. Assim, um produto interno e denido


como uma aplica cao M

(M) 1. A transforma cao U pode adquirir a forma


x

= Ux. (3.60)
No espaco dual, M

, ela assume a forma


y

= yU
T
, (3.61)
45
onde U
T
designa a transposta a U. Uma transforma cao e dita unitaria se ela
preserva a norma de um elemento denido no espaco M, que dizer:
x

= (xU
T
) (Ux) = x x. (3.62)
Neste exemplo, a condi cao de transformacao unitaria implica U
T
U = 1, quer
dizer U
T
= U
1
, onde U
1
e a matriz inversa a U.
Consideremos agora uma transformacao U denida no espaco M que possui
um espaco dual M

. Essa transformacao forma um grupo G se as seguintes


condicoes forem satisfeitas:
1. Se U
1
G e U
2
G sao duas transforma coes pertencentes ao grupo G,
entao seu produto U
3
= U
2
U
1
tambem pertence ao grupo, U
3
= U
2
U
1
G.
2. Se U e uma transforma cao pertencente ao grupo G, sua inversa U
1
tambem pertence ao grupo, U
1
G.
3. A transformacao unitaria I, tal que x = Ix, pertence ao grupo, I G.
Um grupo para o qual U
3
= U
2
U
1
= U
1
U
2
, quer dizer, onde as transforma coes
comutam, e dito abeliano. No caso contrario ele e dito nao-abeliano.
3.9.1 O grupo das transformacoes galileanas
As transformacoes de Galileu
t

= t, (3.63)
x

= x

V t, (3.64)
constituem um grupo. Usando os criterios acima, e imediato vericar que essas
transformacoes contem a unidade, assim como a transformacao inversa, obtida
quando se troca

V

V . De fato, combinando a transforma cao acima com a


nova transformacao determinada pela inversao do sinal da velocidade, tem-se
t

= t

= t, (3.65)
x

= x

+

V t

= x

V t +

V t = x, (3.66)
o que caracteriza a transformacao unidade. A imposicao que o produto de duas
transformacoes desta natureza constitui ainda uma transforma cao de Galileu
46
gera a lei da adicao das velocidades. De fato, considerando agora uma segunda
transformacao onde a velocidade relativa dos referenciais e

V

, temos
t

= t

= t, (3.67)
x

= x

V

t

= x (

V

+

V )t = x

V

t, (3.68)
onde V

= V

+

V . Isto quer dizer que, se o referencial S

desloca-se com rela cao


ao referencial S com velocidade

V , e se o referencial S

se move em rela cao a


S

com velocidade

V

, entao o referencial S

se desloca em rela cao a S com


velocidade

V

=

V +

V

, que e a lei de adicao das velocidades galilenianas.
A transformacao de Galileu pode ser re-escrita na forma matricial:
_
_
_
_
_
_
t

_
_
_
_
_
_
=
_
_
_
_
_
_
1 0 0 0
V
x
1 0 0
V
y
0 1 0
V
z
0 0 1
_
_
_
_
_
_
_
_
_
_
_
_
t
x
y
z
_
_
_
_
_
_
. (3.69)
As transforma coes de Galileu constituem um sub-grupo das transformacoes eu-
clideanas, que incluem ainda as transla coes t

= t +t
0
e x

= x+x
0
onde t
0
e x
0
sao constantes, alem das rota coes espaciais, denidas por t

= t e x
i

= R
i
j
x
j
,
onde R
i
j
e a matriz de rotacao. Retornaremos a esta questao da estrutura com-
pleta mais tarde. Por enquanto, e importante observar que a transformacao de
Galileu abordada acima revela a geometria da teoria newtoniana: e formada por
uma sequencia de secoes espaciais denida por um parametro evolutivo universal
t. Tal decomposi cao de uma estrutura com quatro dimensoes em uma sequencia
de se coes tri-dimensionais denomina-se foliacao. A estruta geometrica a quatro
dimensoes newtoniana, onde a quarta dimensao aparece simplesmente como um
indicador da sequencia das se coes tri-dimensionais, todas com a mesma estru-
tura euclideana, e um exemplo trivial de folia cao, sendo resultado do fato que
o tempo e um parametro universal, nao se confundindo com as coordenadas
espaciais.
3.9.2 O grupo de Lorentz
Vamos agora considerar o grupo de Lorentz, que substitui, na relatividade res-
trita, o grupo de Galileu. Reescrevemos primeiramente as transformacoes de
47
Lorentz sob a forma matricial:

=
_
_
_
_
_
_

V
c
2
0 0
V 0 0
0 0 1 0
0 0 0 1
_
_
_
_
_
_
. (3.70)
A forma matricial da transformacao de Lorentz pode ser escrita de uma maneira
mais compacta, que usaremos frequentemente mais tarde:
x

. (3.71)
O determinante da matrix

e:
det

=
2

V
2
c
2

2
=
2
(1
V
2
c
2
) = 1 . (3.72)
A transformacao unitaria e inversa existem. Devemos agora mostrar que o
produto de duas transformacoes de Lorentz e tambem uma transformacao de
Lorentz. Consideremos duas transformacoes sucessivas:
t

=
1
(t
V
1
c
2
x) ; x

=
1
(x V
1
t) ;
y

= y ; z

= z ; (3.73)
t

=
2
(t

V
2
c
2
x

) ; x

=
2
(x

V
2
t

) ;
y

= y

; z

= z

, (3.74)
onde V
1
e a velocidade relativa entre S

e S, e V
2
a velocidade relativa entre S

e S

, respectivamente. Obviamente, y

= y e z

= z. Para as transforma coes


de t

e x

em relacao a t e x, obtemos,
t

=
2
_

1
(t
V
1
c
2
x)
V
2
c
2

1
(x V
1
t)
_
=
=
1

2
__
1 +
V
1
V
2
c
2
_
t
_
V
1
c
2
+
V
2
c
2
_
x
_
, (3.75)
x

=
2
_

1
(x V
1
t) V
2

1
(t
V
1
c
2
x)
_
=
=
1

2
__
1 +
V
1
V
2
c
2
_
x
_
V
1
+ V
2
_
t
_
. (3.76)
Temos, por outro lado,

2
_
1 +
V
1
V
2
c
2
_
=
1
_
1
V
2
1
c
2
1
_
1
V
2
2
c
2
_
1 +
V
1
V
2
c
2
_
48
=
1

1
_
V
2
1
c
2
+
V
2
2
c
2

V
2
1
V
2
2
c
4
_
_
1 +
V
1
V
2
c
2
_
=
1
_
(1 +
V
1
V
2
c
2
)
2

1
c
2
(V
1
+ V
2
)
2
_
1 +
V
1
V
2
c
2
_
=
1

1
1
c
2
_
(V
1
+V
2
)
2
(1+
V
1
V
2
c
2
)
2
_
. (3.77)
Denindo,
V
3
=
V
1
+ V
2
1 +
V
1
V
2
c
2
(3.78)
obtemos,
t

=
3
(t
V
3
c
2
x) ; x

=
3
(x V
3
t) ;
y

= y ; z

= z ;
3
=
1
_
1
V
2
3
c
2
. (3.79)
A analise acima nos diz que, para que as transforma coes de Lorentz consti-
tuam um grupo, a velocidade relativa do referencial S

em relacao ao referencial
S, deve ser dada por (3.78). Em outras palavras, esta imposicao nos diz como
compor as velocidades. Mostraremos mais tarde que este resultado e consistente
com as leis de transformacao das velocidades, obtidas diretamente a partir da
denicao usual de velocidade.
O grupo de Lorentz e um caso particular de um conjunto mais geral de
transformacoes que envolvem, alem das transformacoes de Lorentz, a inversao
temporal t t, a inversao espacial x x, e as rotacoes espaciais, caracte-
rizadas pelas matrizes de rotacao R
i
j
, tal que x
i
= R
i
j
x
j
. O caso das rota coes
voltara a ser tratado mais tarde. Considerando todas estas transforma coes, as
transformacoes de Lorentz e as rota coes espaciais sao as unicas que possuem
determinantes unitarios e que preservam a ordena cao causal.
Exerccios
1. Considere o referencial S e o referencial S

, como especicado na gura 1.


O referencial S

tem velocidade constante V em relacao a S. Um corpo se


49
encontra inicialmente em repouso na origem de S no tempo t = 0. Uma
forca F age sobre ele na direcao do eixo x. Calcule:
(a) As energias cineticas inicial e nal deste corpo no referencial S e no
referencial S

;
(b) O trabalho realizado pela for ca F em cada um destes referenciais;
(c) Verique se o teorema trabalho energia e vericado em ambos os
referenciais.
2. Mostre que as transformacoes (2.57) preservam a condicao de calibre de
Lorentz desde que o campo satisfaca (2.58).
3. Mostre que a equa cao = 0 permanece invariante por uma trans-
formacao de Lorentz;
4. Mostre que as transformacoes de Lorentz podem ser escritas como
x
0

= cosh x
0
sinh x
1
, x
1

= cosh x
1
sinh x
0
. (3.80)
Mostre ainda que tanh =
V
c
.
5. Verique explicitamente, utilizando as transforma coes de Lorentz, que (x
1

)
2

(x
0

)
2
= (x
1
)
2
(x
0
)
2
.
6. Dois eventos tem coordenadas P
1
= (0, 10km) e P
2
= (10km, 20km), onde
P = (x
0
, x
1
) = (ctkm, xkm).
(a) Calcule as coordenadas destes eventos em um referencial S

que se
desloca em rela cao a S com velocidade V = 290.00
km
s
;
(b) Compare as separacoes espaciais e temporais x, t em cada um
destes referenciais;
(c) Verique se (x
0

)
2
(x
1

)
2
= (x
0
)
2
(x
1
)
2
= C. Calcule C.
50
Captulo 4
Cinematica Relativista
4.1 Aspectos basicos
Os dois axiomas da Relatividade Restrita conduziram `as transforma coes de Lo-
rentz que estabelecem como podemos obter as coordenadas (x

,t

) de um evento
P medidas em um referencial S

, a partir das coordenadas (x,t) do mesmo


evento, medidas em um referencial S, S

se deslocando com velocidade cons-


tante V em rela cao S. As transforma coes de Lorentz se reduzem `as de Galileu
no limite V << c. Uma das principais consequencias das novas leis de trans-
formacao e que o tempo deixa de ser uma grandeza absoluta, independente do
referencial. Agora, cada referencial mede um tempo que lhe e proprio, da mesma
forma que mede de forma particular a posicao de uma partcula.
O fato de nao termos mais um tempo absoluto, conduz a varias consequencias
importantes. Os relogios medem tempos diferentes em diferentes referenciais
inerciais; o comprimento de um objeto depende igualmente do referencial em que
ele e medido. Em fun cao disto, nos temos que reobter as expressoes cinematicas,
tais como velocidade e acelera cao visto que normalmente elas sao obtidas como
derivadas em rela cao ao tempo. O fato que o tempo deixou de ser um parametro
absoluto, nos obriga a denir uma nova grandeza invariante em relacao `a qual
possamos calcular essas derivadas.
A seguir nos vamos analisar os fenomenos de contra cao das distancias, da
51
dilatacao do tempo, assim como redeniremos as grandezas cinematicas. Isto
nos abrira o caminho para denir uma dinamica relativista.
4.2 Transforma coes de velocidades
O observador no referencial S dene como as componentes da velocidade de um
objeto que se desloca no espaco como sendo
v
x
=
dx
dt
, v
y
=
dy
dt
, v
z
=
dz
dt
, (4.1)
enquanto o observador no referencial S

dene as componentes da velocidade


deste mesmo objeto como sendo
v

x
=
dx

dt

, v

y
=
dy

dt

, v

z
=
dz

dt

, (4.2)
Podemos relacionar as componentes da velocidade deste objeto medidas em S

com as medidas em S atraves das transforma coes de Lorentz. De fato, temos


v

x
=
dx

dt

=
d[(x V t)]
d[[(t
V
c
2
x)]
=
dx V dt
dt
V
c
2
dx
=
v
x
V
1
V v
x
c
2
; (4.3)
v

y
=
dy

dt

=
dy
d[(t
V
c
2
x)]
=
dy
(dt
V
c
2
dx)
=
v
y
(1
V v
x
c
2
)
; (4.4)
v

z
=
dz

dt

=
dz
d[(t
V
c
2
x)]
=
dz
(dt
V
c
2
dx)
=
v
z
(1
V v
x
c
2
)
. (4.5)
Ao fazermos esta dedu cao nos utilizamos o fato que V , a velocidade relativa
entre os dois referenciais, e consequentemente , e constante.
Podemos entao resumir as leis de transforma cao ligando as componentes da
velocidade do objeto medidas em S e em S

pelas expressoes:
v

x
=
v
x
V
1
V v
x
c
2
; (4.6)
v

y
=
v
y
(1
V v
x
c
2
)
; (4.7)
52
v

z
=
v
z
(1
V v
x
c
2
)
. (4.8)
Observe-se que, muito embora o movimento relativo entre os dois referenciais
seja ao longo do eixo x, as componentes da velocidade ao longo dos eixos y e z
sao afetadas. Isto se deve ao efeito de dilatacao do tempo.
Uma consequencia notavel das transforma coes (4.6),(4.7),(4.8) refere-se `a
medida da velocidade da luz. Se no referencial S um feixe de luz se propaga
com velocidade c, ao longo do eixo positivo dos x (logo v
x
= c), este mesmo
feixe sera visto no referencial S

com velocidade
v

x
=
c V
1
V c
c
2
=
c V
1
V
c
= c . (4.9)
Assim, os dois referenciais concordam que a velocidade da luz e igual a c.
As transformacoes (4.6),(4.7),(4.8) se reduzem `as galileanas quando a velo-
cidade relativa entre os referenciais e muito pequena em rela cao `a velocidade da
luz. Neste caso, podemos desprezar todos os termos envolvendo
V
c
, e assumir
1, e reencontramos as transfoma coes usuais da cinematica newtoniana.
4.3 Comparando a cinematica lorentziana com
a galileana
Em situa coes onde a velocidade dos corpos envolvidos no problema e muito pe-
quena em relacao `a velocidade da luz, nos podemos utilizar a formula de adicao
das velocidades galilenianas em vez das transformacoes (4.6),(4.7),(4.8): a dife-
renca entre os resultados fornecidos por essas diferentes expressoes para a adi cao
das velocidades e desprezvel. Entretanto, quando as velocidades dos corpos se
tornam comparaveis com a da luz, entao inevitavelmente deveremos usar as
transformacoes lorentzianas. Exempliquemos isto com dois casos concretos.
Consideremos dois corpos cujas velocidades, medidas em um referencial S,
tem o mesmo valor em modulo, a mesma dire cao mas tem sentidos contrarios.
Identiquemos a direcao destas velocidades como sendo o eixo x. Em um pri-
meiro caso, consideremos que o modulo da velocidade destes corpos e [v
1
[ =
[v
2
[ = 72
km
h
= 20
m
s
. Velocidades como estas aparecem normalmente em uma
53
rodovia. Qual e a velocidade com que o observador localizado em um dos corpos
ve o outro?
Suponhamos que o corpo 1 se mova no sentido positivo dos x. Se identi-
carmos o referencial S

como um referencial co-movel a este corpo, teremos,


utilizando a lei das transformacoes das velocidades galileanas,
v

= v
2
V = 2v
2
= 144
km
h
= 40
m
s
. (4.10)
Utilizando a expressao lorentziana (4.6), temos
v

1
=
v
1
V
1
V v
1
c
2
=
2v
1
1 +
(v
1
)
2
c
2
(4.11)
Logo, as duas formas de calcular a velocidade vista pelo observador no referencial
S

co-movel com corpo 1 diferem por um termo


(v
1
)2
c
2
=
1,610
3
910
16
1, 5 10
13
.
Realizando uma expansao em serie em (4.11), obtemos que a diferen ca no re-
sultado nal em rela cao a (4.10) e v 6 10
12 m
s
. Obviamente, tal erro no
calculo da velocidade esta acima da precisao de praticamente todos os instru-
mentos de medidas normalmente utilizados. Podemos, portanto, usar a formula
galileniana para adicao das velocidades com seguran ca.
Consideremos agora que as velocidades sejam [v
1
[ = [v
2
[ = 270.000
km
s
=
0, 9c. Velocidades comos estas sao usualmente obtidas em aceleradores de
partculas quando se deseja realizar uma colisao entre neutrons, protons ou
eletrons. Se usarmos a rela c ao de velocidades galileana, teremos,
v

= v
2
V = 2v
2
= 540.000
km
s
= 1, 8c . (4.12)
A partcula 2 vera a partcula 1 com uma velocidade bastante superior `a da luz.
Por outro lado, empregando (4.6), obtemos,
v

1
=
v
1
V
1
V v
1
c
2
=
2v
1
1 +
(v
1
)
2
c
2
=
1, 8c
1 + 0, 81
=
1, 8
1, 81
c 0, 994c . (4.13)
Assim, a velocidade da partcula 2 medida referencial da partcula 1 sera maior
que a velocidade medida no referencial S, mas ainda inferior `a velocidade da
luz. O resultado difere substancialmente do obtido usando as transformacoes
de velocidade galileanas.
A razao entre a velocidade do objeto v e a da luz c e uma boa referencia
para decidirmos quando deveremos utilizar as expressoes lorentzianas ou quando
54
podemos nos contentar com as expressoes galileanas. Para o movimento da Terra
em torno do sol, temos que a velocidade orbital e v 30
km
s
, e
v
c
= 10
4
; as
expressoes nao relativistas podem ser utilizadas com seguranca. Entretanto,
para um eletron em um acelerador de partcula, temos v 0, 9c, e
v
c
0, 9:
forcosamente deveremos utilizar as expressoes relativistas.
4.4 O Efeito de arrasto
Um dos problemas classicos da otica refere-se `a medida da velocidade da luz
em um meio em movimento, em um tubo com agua corrente por exemplo. Se
a velocidade da luz no vacuo e c, e se a velocidade da agua e V , a medida da
velocidade da luz neste meio indica um resultado aproximado de
v v

+ V (1
1
n
2
) , (4.14)
onde n e o ndice de refra cao da agua e v

=
c
n
. Este resultado e obtido atraves
do estudo da interferencia de um feixe de luz, que e dividido em dois atraves
de um espelho semi-transparente, de tal forma que um dos feixes resultantes se
propaga neste meio, no sentido da corrente de agua, enquanto que o outro que
se propaga no sentido contrario ao da corrente: a diferenca nal de fase, quando
os feixes voltam a se encontrar esta relacionada com a diferenca nas velocidades
de propagacao; a medida das franjas de interferencia dos feixes permite deduzir
a diferen ca de fase entre eles, que por sua vez fornece a diferenca de caminho
otico. Esta diferenca de caminho otico esta relacionada com a diferenca das
velocidades dos dois feixes na agua corrente. A experiencia foi feita por Fizeau
no incio do seculo XIX.
Do ponto de vista classico, o resultado (4.14) revela-se misterioso. No en-
tanto, ele e facilmente explicado utilizando-se a cinematica relativista mas exi-
gindo, ao contrario um complexo mecanismo envolvendo o conceito do eter
quando se emprega a mecanica newtoniana. No que se segue, empregaremos
diretamente a lei de transforma cao das velocidades (4.6).
Consideremos um feixe de luz que se propaga ao longo de um tubo com
agua corrente. Qual e a velocidade deste feixe de luz medido no referencial do
laboratorio (que podemos tomar tambem como sendo o referencial do tubo)? A
55
velocidade da agua no tubo e V . Esta e, por conseguinte, a velocidade relativa
entre os referenciais da agua e do laboratorio. Se no vacuo a luz tem velocidade
c, na agua (em movimento ou em repouso) ela sera v

=
c
n
onde n e o ndice de
refracao da agua. Uma dedu cao rigorosa desta relacao envolve o problema de
interacao da radia cao com a materia, estando alem dos nossos objetivos aqui.
Vamos assumir que essa e uma relacao emprica.
Utilizando as transforma coes de velocidade inversas, obtemos,
v =
v

+ V
1 +
V v

c
2
. (4.15)
Consideremos que V e muito pequeno em rela cao a c. Podemos fazer uma
expansao em serie , em termos de
V
c
2
, obtendo,
v (v

+ V )(1
V v

c
2
) v

+ V
V v

2
c
2
. (4.16)
Como v

=
c
n
, temos entao,
v v

+ V (1
1
n
2
) . (4.17)
Se usassemos as transformacoes de Galileu, em conjun cao com a teoria do eter, e
considerassemos que o meio onde se propagam as ondas eletromagneticas nao e
arrastado pela agua, encontraramos v = v

; se, por outro lado considerassemos


que a agua arrasta integralmente o eter, teramos v = v

+V . O resultado acima
indica, do ponto de vista da teoria do eter, que temos um arrastoparcial do
eter pela agua. A expressao (4.17) foi obtida no incio experimentalmente, e foi
interpretada, atraves da teoria do eter, como uma indica cao que o eter e parcial-
mente arrastado pela agua em movimento. Entretanto, o uso das transformacoes
de velocidades deduzidas a partir das transforma coes de Lorentz, indica que se
trata na verdade de um efeito relativista, a expressao experimental constituindo
o primeiro termo em uma expansao
V
c
.
4.5 A Aberracao da luz
Quando a Terra descreve a translacao em torno do Sol, a posi cao aparente das
estrelas mais proximas muda devido a dois efeitos. O primeiro e o efeito de
56
paralaxe: a posicao aparente de estrela proxima muda, em relacao `as estrelas
mais distantes, devido `a mudanca de posi cao da Terra ao longo de sua trajetoria
em torno do sol; o segundo e o efeito de aberra cao: como a Terra possui uma
velocidade de translacao, a direcao da luz vinda da estrela sofre uma mudanca,
ganhando um angulo de inclina cao que muda devido `a mudanca na direcao
da velocidade orbital da Terra. Tanto a paralaxe quanto a aberracao fazem
a posicao aparente da estrela se alterar, descrevendo uma elipse ao longo da
translacao da Terra. Entretanto, os dois efeitos podem ser distinguidos, devido
`as suas caractersticas: a paralaxe se deve `a mudanca de posicao da Terra,
enquanto a aberra cao se deve `a mudanca da velocidade de translacao da Terra,
o que implica que a elipse devido `a paralaxe tem uma orienta cao distinta da
devido `a aberracao. Alem disto, o efeito de paralaxe ocorre apenas para estrelas
extremamente proximas, enquanto o efeito de aberracao ocorre mesmo para
estrelas distantes. Na gura 5, as elipses devido `a paralaxe e aberracao sao
mostradas em rela cao `a posicao da Terra em sua orbita em torno do Sol.
Usando as expressoes para a transformacao de velocidade, nos podemos de-
duzir o angulo de aberracao, quer dizer, o angulo de posi cao aparente da estrela
em funcao do angulo sob o qual ela seria visto caso a Terra nao estivesse em
movimento em relacao ao Sol. Para tanto, assumamos que o referencial do Sol
e inercial (referencial S) e que um observador nele em repouso veria a estrela
sob um angulo no plano xy; por outro lado, o observador na Terra, que se
desloca com velocidade V em relacao ao Sol (referencial S

), ao longo do eixo x,
ve a estrela sob um angulo

. A situacao e descrita na gura 6. Esta particula-


rizacao da posi cao do referencial nao compromete a generalidade do problema:
estamos apenas usando a homogeneidade e isotropia do espaco para xarmos
convenientemente os eixos das coordenadas.
Neste caso, a velocidade da luz se decompoe nos referenciais S e S

como se
segue:
v
x
= c cos , v
y
= c sin ; (4.18)
v

x
= c cos

, v

y
= c sin

. (4.19)
57
Usando a transforma cao relativista das velocidades, temos:
v

x
=
v
x
+ V
1 +
v
x
V
c
2
cos

=
cos +
V
c
1 +
cos V
c
, (4.20)
v

y
=
v
y
(1 +
v
x
V
c
2
)
sin

=
sin
(1 +
cos V
c
)
. (4.21)
Para colocarmos estas expressoes numa forma mais conveniente, devemos fazer
algumas manipulacoes trigonometricas. Observamos primeiro que,
sin

1 + cos

=
2 sin

2
cos

2
2 cos

2
= tan

2
. (4.22)
Usando as rela coes (4.20,4.21), temos:
tan

2
=
sin
[(1 +
V
c
) cos + 1 +
V
c
]
=
1
(1 +
V
c
)
sin
1 + cos
=
1
(1 +
V
c
)
tan

2
. (4.23)
Utilizando a denicao de , obtemos nalmente a expressao relacionando o
angulo

com :
tan

2
=
_
_
c V
c + V
_
tan

2
. (4.24)
Empregando agora uma expansao em serie de Taylor, obtemos o limite newto-
niano desta expressao:
tan

2
=
_
1
V
c
_
tan

2
. (4.25)
4.6 Efeito Doppler
A frequencia de uma onda que um observador detecta depende do estado do
movimento da fonte e do observador. No caso de ondas que necessitam de um
meio para se propagarem, a situacao correspondendo `a fonte estar em movi-
mento e o observador em repouso nao e equivalente a uma fonte em repouso
e um observador em movimento. Quando a onda (como por exemplo no caso
do som) exige um meio para se propagar, existe um referencial em rela cao ao
qual o estado de movimento e denido: o referencial do meio onde se propaga a
onda. A fonte estar em movimento em relacao ou o observador correspondem a
58
situacoes fsicas distintas. Nos vamos agora analisar esta questao, para o caso
das ondas sonoras, em detalhe.
As ondas sonoras exigem um meio para se propagar. Vamos considerar
consequentemente a seguinte situacao: a fonte sonora se propaga com velocidade
v
f
em rela cao ao solo, o observador se desloca com velocidade v
0
em rela cao ao
solo, e o meio se desloca com velocidade v
m
tambem em relacao ao solo. A
velocidade da onda em rela cao ao meio e v
s
. A situacao e descrita na gura 7.
Nos utilizaremos as leis de transformacao galileanas, visto que as velocidades
envolvidas sao pequenas em rela cao `a da luz.
No instante t = 0 a fonte emite uma frente de onda. No tempo t = T, T
sendo o perodo, ela emite uma segunda frente de onda. Assim, a separa cao
entre as duas frentes de onda e:

= (v
s
v
m
v
f
)T . (4.26)
O observador recebe a primeira frente de onda no instante t = t
1
e a segunda
frente de onda no instante t = t
2
. Para ele, a velocidade da onda e v
s
v
m
v
0
,
e o perodo T

= t
2
t
1
. Tem-se entao:
T

v
s
v
m
v
0
. (4.27)
Desta relacao extramos,
T

=
(v
s
v
m
v
f
)T
v
s
v
m
v
0

=
v
s
v
m
v
0
v
s
v
m
v
f
. (4.28)
Esta expressao mostra a relacao entre a frequencia da fonte e a frequencia medida
pelo observador. Pode-se notar que constituem situacoes inteiramente distintas
o observador estar em movimento em relacao ao meio ou a fonte estar em mo-
vimento em relacao ao meio. Ao contrario do que poderia se esperar, a rela cao
entre a frequencia medida e a emitida nao depende unicamente da velocidade
relativa. Isto ocorre porque neste caso existe um meio onde a onda se propaga,
o que dene um referencial privilegiado para o estudo das ondas sonoras.
A luz por sua vez nao exige um meio para se propagar. Vamos analisar
entao o efeito Doppler para ondas luminosas; nesta analise empregaremos as
transformacoes de Lorentz, ja que se trata de um fenomeno essencialmente re-
lativista. Consideremos um observador na origem de um referencial S, e uma
59
partcula que se desloca com velocidade v arbitraria. Esta velocidade pode ser
decomposta em componentes radial e tangencial: v = v
r
+ v
t
. A partcula
emite uma onda luminosa de frequencia =
1
T
, onde T e o perodo, compri-
mento de onda , medidos no referencial proprio da partcula. Pela dilata cao do
tempo, o tempo entre a emissao de duas frentes de onda consecutivas, medido
no referencial S, sera
T

= T , =
1
_
1
v
2
c
2
. (4.29)
Por outro lado o comprimento de onda medido sera de

= cT

+ T

v
r
= (c + v
r
)T =
(c + v
r
)
_
1
v
2
c
2

c
=
(1 +
v
r
c
)
_
1
v
2
c
2
. (4.30)
A relacao entre a frequencia medida por um observador no referencial da partcula,
e a frequencia

medida no referencial S e:

=
_
1
v
2
c
2
1 +
v
r
c
. (4.31)
A compara cao entre as equacoes (4.28) e (4.31) revela, como esperado, dife-
rencas essenciais:
1. A expressao relativista depende apenas da velocidade relativa, ao passo
que a das ondas sonoras depende do movimento de cada um dos elementos
em rela cao ao meio onde a onda se propaga. Isto e consequencia do fato
que as ondas luminosas nao exigem um meio para se propagarem;
2. No limite de baixas velocidades (velocidades do meio, da fonte e do obser-
vador pequenas em rela cao `a velocidade de propagacao da onda no meio ou
no vacuo para o caso da luz), as duas expressoes coincidem e so dependem
da velocidade relativa entre fonte e observador;
3. Na equacao (4.31) existe o efeito Doppler mesmo quando a fonte nao
esta se afastando do observador, como ocorre quando a fonte descreve
um movimento circular uniforme em torno do observador. Esse e o assim
denominado efeito Doppler transversale se deve unicamente `a dilatacao
temporal, constituindo-se um efeito puramente relativista.
60
4.7 Transforma cao das acelerac oes
Atraves das transformacoes de Lorentz e possvel obter as coordenadas (t

, x

, y

, z

)
de um evento P em um referencial S

a partir das coordenadas (t, x, y, z)


deste mesmo evento medidas no referencial S. Empregando as transforma coes
(4.6, 4.7, 4.8), obtemos as componentes da velocidade de um corpo no referen-
cial S

a partir das componentes da velocidade deste mesmo corpo, medidas no


referencial S

. Agora, nos estabeleceremos as rela coes entre as componentes da


aceleracao medidas em em S e em S

.
O procedimento e inteiramente analogo `a relacao entre as velocidades. No
referencial S

, temos
a

x
=
dv

x
dt

, a

y
=
dv

y
dt

, a

z
=
dv

z
dt

. (4.32)
Como no caso das transforma coes das velocidades, empregamos novamente as
transformacoes de Lorentz, agora combinadas com (4.6, 4.7, 4.8). Lembrando-se
que V , a velocidade relativa entre os referenciais S e S

e constante, tem-se
a

x
=
dv

x
dt

=
1
dt

_
dv
x
1
v
x
V
c
2
+
v
x
V
(1
v
x
V
c
2
)
2
dv
x
V
c
2
_
=
=
1
(dt
V
c
2
dx
)
_
dv
x
1
v
x
V
c
2
+
v
x
V
(1
v
x
V
c
2
)
2
dv
x
V
c
2
_
=
=
1
(1
v
x
V
c
2
)
3
_
a
x
(1
v
x
V
c
2
) + (v
x
V )
a
x
V
c
2
_
=
=
a
x

3
(1
v
x
V
c
2
)
2
.
Procedemos de forma similar para as componentes y e z das aceleracoes:
dv

y
dt

=
dv
y
(1
v
x
V
c
2
)
+
v
y
dv
x
V
c
2
(1
v
x
V
c
2
)
2
(dt
V
c
2
dx)
=
a
y
(1
v
x
V
c
2
)
+
v
y
a
x
V
c
2
(1
v
x
V
c
2
)
2
(1
V v
x
c
2
)
=
1

2
(1
v
x
V
c
2
)
3
_
a
y
(1
v
x
V
c
2
) + v
y
a
x
V
c
2
_
.
Existe uma expressao semelhante para a relacao entre a

z
e a
z
. Desta forma, as
transformacoes da aceleracao sao,
a

x
=
a
x

3
(1
v
x
V
c
2
)
3
, (4.33)
61
a

y
=
1

2
(1
v
x
V
c
2
)
3
_
a
y
(1
v
x
V
c
2
) + v
y
a
x
V
c
2
_
, (4.34)
a

z
=
1

2
(1
v
x
V
c
2
)
3
_
a
z
(1
v
x
V
c
2
) + v
z
a
x
V
c
2
_
. (4.35)
As transformacoes (4.33,4.34,4.35) tem algumas propriedades importantes.
Em primeiro lugar, elas se reduzem `as transformacoes galileanas corresponden-
tes (a

x
= a
x
, a

y
= a
y
, a

z
= a
z
) obtidas a partir da condicao c ( o que
signica considerar velocidades muito inferiores `a da luz ). Entretanto, e funda-
mental observar que elas implicam que as expressoes para a aceleracao nao se
mantem invariantes quando se passa de um referencial S para um referencial S

.
Consequentemente, as expressoes usuais de for ca nao preservam sua forma. Isto
era de se esperar, visto que a forca medida em um referencial S era identica `a
forca medida em um referencial S

quando se utilizava as transforma coes de Ga-


lileu. Como nos estamos agora empregando as transformacoes de Lorentz, nos
teremos que modicar as rela coes dinamicas entre uma forca e as quantidades
cinematicas. Em outras palavras, teremos que reformular a Mecanica.
Por outro lado, observemos que, se em um referencial S so existe aceleracao
na direcao x, no referencial S

pode-se ter aceleracoes nas dire coes y e z, caso


as velocidades v
y
e v
z
nao sejam nulas. Isto e resultado dos ultimos termos das
equacoes (4.34,4.34). Esses termos sao usualmente denominados de aceleracoes
transversais. Sua origem reside no fenomeno da dilata cao do tempo. De fato,
mesmo que o movimento relativo entre os dois referenciais seja ao longo do
eixo x, as velocidades medidas ao longo dos eixos y e z nao sao as mesmas nos
dois referenciais, e a propria deducao das expressoes (4.7,4.8) mostra que isto
se deve `a nao invariancia do tempo quando se passa de um referencial a outro.
Novamente, isto origina aceleracoes transversais, no sentido que a aceleracao
de um corpo ao longo do eixo x provoca o aparecimento, no referencial S

, de
de acelera coes nas direcoes perpendiculares, a menos que a velocidade do corpo
nestas direcoes perpendiculares seja nula.
Uma vez que mostramos que a forma para as aceleracoes nao se preserva
quando se passa do referencial S para o referencial S

e se utiliza as trans-
formacoes de Lorentz para se realizar esta passagem, e inevitavel se perguntar
o que permanece identico nesta passagem. Para ser preciso, e necessario distin-
62
guir o que permanece invariante, quer dizer, o que preserva o seu valor numerico
sob aquela transformacao, e o que e covariante, quer dizer, o que preserva sua
relacao formal. Mas, para identicar o que e invariante e o que e covariante, e
preciso reformular tudo o que foi feito ate agora, expressando todas as quanti-
dades como grandezas denidas em um espa co-tempo a quatro dimensoes (tres
espaciais e uma temporal), dotado de uma estrutura hiperbolica, quer dizer, o
espaco-tempo de Minkowski. Alem do mais, em fun cao do fato que estaremos
denindo uma nova estrutura geometrica, sera preciso desenvolver a no cao de
tensor, como generalizacao dos conceitos usuais de escalar e vetor.

E o que
faremos a seguir.
63
Captulo 5
Tensores e o espaco-tempo
de Minkowski
5.1 Introducao
A Mecanica Newtoniana e formulada no espaco euclidiano a tres dimensoes, ao
qual se acrescenta o tempo como parametro universal. As transformacoes de Lo-
rentz mostram, por outro lado, que uma teoria que obedece aos dois axiomas da
Relatividade Restrita deve incluir o tempo como uma coordenada dependente
do observador. Assim, a Relatividade Restrita deve lidar com um contnuo
espaco-temporal a quatro dimensoes. A fsica relativista exige uma nova es-
trutura geometrica, distinta da euclideana, e ao mesmo tempo uma linguagem
matematica que lhe seja adequada. Isto nos levara `a no cao de espaco-tempo de
Minkowski e `a linguagem tensorial.
O espa co-tempo de Minkowski ja foi sucintamente abordado anteriormente.
Nos exploraremos um pouco mais suas propriedades, com especial enfase na
questao da causalidade e na denicao da metrica. Por outro lado, desenvolvere-
mos a nocao de tensores partindo dos conceitos mais simples de vetor covariante
e contravariante, explicitando a necessidade de explorar esta distin cao. A partir
da, faremos uma denicao geral de tensores.
De posse das nocoes de espaco-tempo e de tensores, estaremos aptos pos-
64
teriormente a reformular tanto a mecanica quanto o eletromagnetismo na nova
estrutura espaco-temporal, utilizando a linguagem tensorial. A utlizacao do
contnuo espaco-temporal a quatro dimensoes e essencial para o pleno desen-
volvimento da Relatividade Restrita. Como exemplo, reconstruiremos a quatro
dimensoes as quantidades cinematicas fundamentais, como posicao, velocidade
e acelera cao, estabelecendo suas conexoes com as grandezas tridimensionais or-
dinarias.
5.2 O espaco-tempo de Minkowski
Um feixe de luz se propaga de tal forma que a relacao entre a variacao no tempo
e a nas coordenadas espaciais e dada por
c
2
(t)
2
= (x)
2
+ (y)
2
+ (z)
2
. (5.1)
Outra forma de escrever esta expressao e
c
2
(t)
2
(x)
2
(y)
2
(z)
2
= 0 . (5.2)
Se um objeto se propaga com uma velocidade inferior `a da luz, temos
c
2
(t)
2
(x)
2
(y)
2
(z)
2
> 0 , (5.3)
ja que, no mesmo tempo que a luz percorre uma certa distancia, este objeto
obviamente percorreria uma distancia menor. Por outro lado, se fosse possvel
que um objeto viajasse com velocidade superior a da luz, teramos,
c
2
(t)
2
(x)
2
(y)
2
(z)
2
< 0 . (5.4)
Desta forma, podemos denir a quantidade
c
2
(t)
2
(x)
2
(y)
2
(z)
2
= (s)
2
, (5.5)
sendo que (s)
2
pode ser maior, menor ou igual a zero. O fato de s
2
poder
ser negativo e algo, para um geometra eclideano, chocante, uma vez que isto
implica em s imaginario. Mas, e preciso ter em mente que estamos falando de
uma distanciaespa co-temporal, e que nao devemos nos prendermos a certos
65
conceitos oriundos da geometria euclideana, como o que diz que a distancia
entre dois pontos deve ser sempre positiva.
Nos denimos o elemento de distancia espaco-temporal entre dois eventos E
1
e E
2
com coordenadas (t
1
,x
1
,y
1
,z
1
) e (t
2
,x
2
,y
2
,z
2
), medidas em um referencial
S, como
s
2
= c
2
t
2
x
2
y
2
z
2
. (5.6)
Escrita na forma diferencial, (5.6) torna-se,
ds
2
= c
2
dt
2
dx
2
dx
2
dy
2
dz
2
. (5.7)
As transforma coes de Lorentz deixam invariante (5.6). A demonstra cao e sim-
ples: considere-se os mesmos eventos E
1
e E
2
medidos no referencial S

que se
desloca com velocidade constante V em relacao a S. Suas coordenadas neste
referencial sao (t

1
,x

1
,y

1
,z

1
) e (t

2
,x

2
,y

2
,z

2
). Logo,
t = (t

+
V
c
2
x

) , (5.8)
x = (x

+ V t

) , (5.9)
y = y

, z = z

. (5.10)
Inserindo (5.8,5.9,5.10) em (5.6), obtemos,
s
2
=
2
_
c
2
t
2
+
V
2
c
2
x

2
+ 2
V

2
V
2
t

2
2V t

_
y

2
y

2
= c
2
t

2
x

2
y

2
z

2
= s

2
,
onde usamos explicitamente que =
1

1
V
2
c
2
. Quando s
2
e zero, temos a
propagacao de um raio luminoso: os dois eventos E
1
e E
2
representam a passa-
gem de uma frente de onda luminosa no ponto P
1
= (x
1
, y
1
, z
1
) no tempo t
1
e
a passagem desta mesma frente luminosa no ponto P
2
= (x
2
, y
2
, z
2
), no tempo
t
2
. Por outro lado, se s
2
> 0, isto signica que um sinal que se propaga com
velocidade inferior a da luz pode ser emitido de P
1
no tempo t
1
e alcancar P
2
no tempo t
2
. Finalmente, se s
2
< 0
1
, para que um sinal saia de P
1
no tempo
1
Neste caso, s torna-se imaginario. Mas, como ja foi enfatizado anterioremente, isto
nao representa nenhum problema pois s seria uma dist anciano espaco-tempo, nao tendo
uma contrapartida com a nocao usual de dist ancia tal como empregada no sentido puramente
espacial
66
Figura 5.1: Propaga cao de raios luminosos no diagrama ct,x
t
1
e alcance P
2
no tempo t
2
, sua velocidade teria que ser necessariamente supe-
rior `a da luz. Observe que a estrutura causal descrita acima e preservada pelas
transformacoes de Lorentz.
Podemos representar os eventos descritos acima em um diagrama do espaco-
tempo denido por um sistema de coordenadas contendo t, x, y e z. Entre-
tanto, a representacao graca de um tal sistema quadridimensional se revela
impossvel. Por esta razao, e para ns de representacao graca, nos suprimimos
as coordenadas y e z, e construimos um diagrama contendo unicamente t e x.
Se alem disto, ao inves de considerarmos a coordenada t, nos empregarmos ct,
de maneira a ter as mesmas dimensoes que as demais coordenadas espaciais, a
trajetoria do raio luminoso sera representada no diagrama (ct,x) pela equa cao
ct = x, ou seja, por retas de inclinacao igual a

4
rad. O sinal positivo
refere-se a um raio luminoso que se propaga na dire cao positiva dos x e o sinal
negativo refere-se `a propagacao de um raio luminoso na direcao negativa dos x.
A propagacao do raio luminoso esta representada na gura 1. Se considerarmos
a coordenada y, a propagac ao dos raios luminosos dene um cone usualmente
denominado cone de luz; incluindo as coordenadas y e z temos um hpercone,
um cone com superfcie espacial tridimensional, em um espaco-tempo a quatro
dimensoes.
Retornemos `a expressao (5.7). Tomemos agora um objeto que se propaga
com velocidade inferior `a da luz. Neste caso, em um mesmo intervalo de tempo
referente `a propagacao de um raio luminoso, a distancia espacial percorrida por
este objeto e menor que a percorrida pela luz. Logo, dois eventos associados `a
propagacao deste objeto tem ds
2
> 0. Se associarmos a origem a um dos eventos
67
(digamos E
1
), o outro, que denominamos E
2
, estara localizado dentro do cone
de luz. Se o evento E
2
ocorrer antes do E
1
, ele estara no interior da parte inferior
do cone de luz; se ele ocorrer depois, ele estara no interior da parte superior do
cone de luz. Assim, todos os fenomenos que estao no interior da parte superior
do cone de luz podem ter sido inuenciados pelo evento E
1
na origem, no sentido
que um observador em E
1
pode enviar um sinal que se propaga com velocidade
inferior `a da luz, que sera recebido por um observador em E
2
. Inversamente,
se E
2
estiver localizado na parte inferior do cone, um sinal que se propaga com
velocidade inferior a da luz, emitido por um observador situado neste ponto do
espaco-tempo, alcan cara E
1
. Em fun cao disto, a parte superior do cone de luz
e denominado de futuro do evento E
1
, que esta localizado na origem, no sentido
que ela re une todos os eventos que receberao sinais subluminais enviados por
E
1
. Por outro lado, E
1
tera recebido sinais tambem subluminais enviados por
todos os eventos que estao na parte inferior do cone de luz. Por esta razao, a
parte inferior do cone de luz e denominada de passado do evento da origem.
Consideremos agora dois eventos tais que s
2
< 0. Chamemos um dos
eventos novamente de E
1
, localizado na origem, e outro de E
3
. Neste caso, para
que um sinal enviado por E
1
alcance E
3
, seria necessario que ele tivesse uma
velocidade superior `a da luz. Desta forma, uma vez que nao existe propagacao de
nenhum sinal com velocidade superior `a da luz
2
, os eventos que estao localizados
na parte exterior do cone de luz nao tem nenhuma relacao causal com o que
ocorre na origem. Observamos que esta distin cao entre eventos futuros, passados
e eventos sem conexao causal, se referem ao evento E
1
localizado na origem: dois
eventos podem estar no futuro do evento E
1
, e terem consequentemente conexoes
causais com ele, e nao terem nenhuma rela cao causal entre si. Por outro lado, o
evento E
2
, que esta no interior do cone de luz de E
1
, tendo consequentemente
uma relacao causal com E
1
, pode ter conexao causal com o evento E
3
, que por
sua vez nao tem relacao causal com E
1
. Cada ponto do espaco-tempo possui
seu proprio cone de luz, com passado e futuro proprios.
Pares de eventos tais que s
2
> 0 sao chamados tipo tempo, visto que o termo
2
Observe que se algum objeto ou sinal se deslocar com velocidade superior a c, poderamos
associar a ele um referencial inercial para o qual o fator =
1

1
V
2
c
2
seria imaginario e toda
estrutura lorentziana empregada ate aqui perderia todo o sentido
68
temporal predomina sobre o espacial. Se s
2
= 0, os eventos sao chamados tipo
luz, ja que eles le localizam sobre o cone de luz. Finalmente, se s
2
< 0, os
eventos sao denominados tipo espaco, ja que o termo espacial predomina sobre
o temporal. Dois eventos tipo tempo jamais poderao ser feitos simultaneos por
uma transformacao de Lorentz (uma vez que isto implicaria em anular o t, e
conseq uentemente o s se tornaria negativo, contrariando a condi cao de ser tipo
tempo), mas poderao ser transportados, num dado referencial, `a uma mesma
posi cao espacial; dois eventos tipo espa co, poderao ser feitos simultaneos num
dado referencial, mas jamais poderao ter suas posi coes espaciais coincidentes.
Por m, dois eventos tipo luz em um dado referencial, continuarao o sendo em
qualquer outro referencial inercial.
5.3 Transformacoes de Lorentz e rotacoes no espaco-
tempo de Minkowski

E importante notar que o espaco-tempo de Minkowski possui uma estrutura


hiperbolica, devido `a diferen ca de sinal entre a coordenada temporal e as coor-
denadas espaciais na expressao do s
2
. As transforma coes de Lorentz podem
ser consideradas como rota coes neste espa co-tempo hiperbolico, cuja estrutura
geometrica e nao-euclideana. Vamos considerar inicialmente a rotacao de um
sistema de coordenadas S em um espaco euclideano bi-dimensional onde se de-
nem os eixos (x, y). Denimos um novo sistema de coordenadas S

, com eixos
(x

, y

), x

e y

fazendo um angulo com os eixos x e y originais, como indica a


gura 2. Consideremos um ponto P, situado a uma distancia r da origem, que
e comum a S e a S

. O angulo entre o vetor r, que liga a origem ao ponto P, e


o eixo x e ; por outro lado, o angulo entre r e o eixo x

e . Desta forma,
nos podemos calcular as coordenadas x

0
e y

0
do ponto P em S

e relaciona-las
com as coordendas x
0
e y
0
em S. Lembrando que x
0
= r cos e y
0
= r sin ,
temos
x

0
= r cos( ) = r
_
cos cos + sin sin
_
= x
0
cos + y
0
sin , (5.11)
69
y

0
= r sin( ) = r
_
sin cos sin cos
_
= y
0
cos x
0
sin . (5.12)
Esta transformacao pode ser representada por uma forma matricial,
x
i

0
=
2

1
R
i
j
x
j
0
, (5.13)
onde
R
i
j
=
_
cos sin
sin cos
_
. (5.14)
A matriz R
i
j
e uma representa cao do grupo SO(2), grupo de rotacoes espaciais
a duas dimensoes. De fato, todos os requisitos necessarios para que esta matriz
represente um grupo sao satisfeitos: a transforma cao unitaria e um caso parti-
cular; existe uma transforma cao inversa; o produto de duas rota coes espaciais,
uma de angulo
1
, outra de um angulo
2
, e ainda uma rota cao espacial de um
angulo
1
+
2
. Note que o fato da matriz transformacao ser de deteminante
unitario e fundamental para que se veriquem estas propriedades de grupo.
Alem do mais, o elemento de distancia do ponto P `a origem e preservado pela
rotacao:
r
2
= x
0
2
+ y
0
2
= x

0
2
+ y

0
2
. (5.15)
Na nomenclatura deste grupo, O indica que o grupo e ortogonal. Quer dizer,
denindo a transposta R
i
j
T
= R
j
i
, temos que R
i
j
R
j
k
=
i
k
: o produto da
matriz por sua transposta e igual `a matriz unitaria. Por outro lado, o termo S
indica um grupo especial, quer dizer, de determinante igual a 1.
Consideremos agora as transformacoes de Lorentz, levando em conta apenas
as coordenadas x, t. Temos,
t

= (t
V
c
2
x) , (5.16)
x

= (x
V
t
) . (5.17)
Como ja foi dito anteriormente, o elemento de distancia espaco-temporale
preservado por esta transformacao. Se denirmos = cosh e
V
c
= sinh , de
tal forma que a velocidade relativa dos referenciais seja dada por
V = c tanh , (5.18)
70
Figura 5.2: Rota cao dos eixos cartesianos x e y de um angulo , formando os
eixos x

e y

.
e escrevermos x
0
= ct, x
1
= x, obtemos,
x
0

= cosh x
0
sinh x
1
, (5.19)
x
1

= cosh x
1
sinh x
0
. (5.20)
Para visualizarmos o sentido geometrico desta transforma cao, consideremos a
gura 3, onde as coordenadas x
0
e x
1
sao representadas por eixos ortogonais. Um
evento E constitui um ponto neste diagrama espaco-temporal, como indicado
na gura. As coordenadas (x
0
, x
1
) deste evento, sao determinadas atraves da
expressao,
x
0
= s cosh , x
1
= s sinh , (5.21)
onde e o angulo entre a reta que liga a origem ao evento E e o eixo x
1
. Esta
expressao e condizente com o fato que o elemento de distancia no espaco-tempo,
em termos das coordenadas x
0
e x
1
e dado por
s
2
= x
0
2
x
1
2
. (5.22)
Este fato determina a natureza particular da geometria do espaco-tempo: as
proje coes do elemento de distancia espa co-temporal em cada eixo, sao feitas
atraves de fun coes hiperbolicas, e nao trigonometricas. Isto e consequencia
direta da forma de calcular este elemento de distancia (5.22), onde os termos
espacial e temporal entram com sinais opostos. Observe que o fato do sinal de
x
0
ser positivo e o de x
1
ser negativo, nao desempenha um papel essencial; o
fundamental e que eles entram na expressao do s
2
com sinais opostos.
71
Figura 5.3: Representacao do elemento de distancia espa co-temporal.
Observamos entao que a passagem do referencial S para o referencial S

corresponde a uma rota cao hiperbolica dos eixos, como indicam as relacoes
(5.8,5.9). Como representar gracamente esta transformacao? Notemos que se
o eixo x
1

faz um angulo com o eixo x


1
, como indicado na gura 4, as projecoes
do s, que deve ser o mesmo nos dois referenciais, sao dadas por,
x
0

= s cosh( ) = s(cosh cosh sinh sinh )


= x
0
cosh x
1
sinh , (5.23)
x
1

= s sinh( ) = s(sinh cosh sinh cosh )


= x
1
cosh x
0
sinh , (5.24)
onde usamos as decomposicoes de s nos eixos x
0
e x
1
(5.21), e reobtivemos as
transformacoes de Lorentz (5.19,5.20). Surge agora a questao de como repre-
sentar os eixos x
0

e x
1

em relacao aos eixos x


0
e x
1
ja construdos. Para isso,
recordemos o segundo axioma da Relatividade Restrita: a velocidade da luz e
a mesma para os dois referencias e tal que s = s

= 0. No eixo (x
0
, x
1
),
isto implicava em que a propagacao da luz era representada por um reta fa-
zendo um angulo de

4
com o eixo x
1
(ou, equivalentemente, x
0
). Desta forma,
o mesmo feixe de luz devera representar a bissetriz dos novos eixos (x
0

,x
1

),
e assim, a posicao dos eixos (x
0

,x
1

) em rela cao aos eixos (x


0
,x
1
), assume a
forma representada pela gura 3. A forma de giraros eixos e aparentemente
muito exotica, mas observe que e a unica maneira que garante que o observador
em S

veja a luz se propagando com velocidade c, e que conseq uentemente o


72
Figura 5.4: Rela cao dos eixos x
0
e x
1
do sistema S, com os eixos x

0
e x

1
do
sistema S

.
raio luminoso seja a bissetriz dos novos eixos. Note-se tambem que estao sendo
representados os eixos x
0

e x
1

tais como vistos pelo observador em S. Neste


ultimo caso, a partir de (5.18), isto requer , coerentemente com o fato
que na geometria hiperbolica < < +.
A necessidade de girar os eixos (ct, x) da forma indicada tambem pode ser
entendida observando que ela preserva a estrutura causal: eventos que estao
conectados causalmente no referencial S continuam o sendo no referencial S

.
Isto nao aconteceria se os eixos fossem rodados da mesma maneira que no caso
euclideano. Alem do mais, no limite em que a velocidade relativa entre os
referenciais tende para a velocidade da luz, os novos eixos (ct

, x

) passam a
coincidir com o cone de luz, como e de se esperar.
A forma como os pontos no espaco-tempo sao decompostos nos eixos respec-
tivos, pode ser entendida atraves da deni cao de um angulo complexo = i.
Denindo agora os eixos como na gura 5, onde x
0
= ict, temos as relacoes para
a decomposicao do ponto E
0
,
x
0
= s cos , x
1
= s sin . (5.25)
5.3.1 Visao geometrica da dilatacao do tempo e da con-
tracao das distancias
A rotacao hiperbolica descrita anteriormente mantem invariante tanto a pro-
pagacao dos raios luminosos, quanto as hiperboles denidas nesse espaco tempo.
73
De fato, a equacao
s
2
= x
2
0
x
2
1
(5.26)
dene uma hiperbole quando s
2
e uma dada constante, positiva ou negativa,
que e a mesma para o referencial S e para o referencial S

, devido `a invariancia de
Lorentz. Retornemos ao elemento de distancia espa co-temporal de dois eventos
escritos nos referenciais S e S

:
s
2
= x
2
0
x
2
1
= x

2
0
x

2
1
. (5.27)
Se o evento e do tipo luz, de tal forma que s
2
= 0, temos
x
1
x
0
=
x

1
x

1
= 1 , (5.28)
Por outro lado, se o evento e do tipo tempo, s
2
> 0, e a hiperbole denida
pela relacao (5.27) corta os eixos x
0
e x

0
; se o evento e do tipo espaco, entao a
hiperbole resultante cortara os eixos x
1
e x

1
. Essas hiperboles, que se mantem
invariantes pelas transformacoes de Lorentz uma vez que s
2
= s

2
, nos
permitem entender de uma forma mais geometrica os fenomenos de dilatacao
temporal e contra cao das distancias.
Consideremos inicialmente o caso da dilata cao temporal. Os observadores
nos referenciais S e S

querem usar o mesmo padrao para a unidade de tempo,


que eles denominarao segundo. Para tanto, eles utilizam eventos que se locali-
zam sobre o eixo temporal (o que equivale a utilizar relogios em repouso no seu
proprio referencial), e que correspodam a fenomenos fsicos identicos (por exem-
plo, um certo m ultiplo da frequencia de uma dada radiacao eletromagnetica).
Assim, eles utilizarao o mesmo s
2
> 0. Na gura 6, vemos que isto equivale
a utilizar uma hiperbole denida por este s
2
> 0, e que corta o eixo x
0
no
ponto A e o eixo x

0
no ponto A

. Esses pontos denem a unidade de tempo


nos referenciais S e S

, usando um mesmo padrao. Entretanto, observamos que


a projec cao de A

sobre o eixo x
0
, nos fornece,
T = T

cosh = T

, (5.29)
O segundo denido no referencial S

equivale a um tempo igual ao segundo do


referencial S multiplicado por um fator > 1: o observador do referencial S ve
74
o relogio do referencial S

se atrasando em relacao ao seu proprio relogio, muito


embora eles sejam construdos com o mesmo princpio fsico. Isto constitui a
dilatacao temporal. Visto do referencial S

, o diagrama seria o mesmo, trocando


os termos com linha pelos sem linha, e vice-versa. Assim, usando este mesmo
padrao, o observador de S

veria o relogio de S se atrasando. Observe que este


fenomeno se deve a uma perspectiva de referencial, isto e, como o observador
em S ve os eixos (em princpio identicos) de S

: ele os ve inclinados em relacao


aos seus proprios eixos.
Par o caso da contra cao espacial, nos devemos tomar duas hiperboles, cada
uma correspondendo a uma das extremidades da regua padrao. O comprimento
da regua em S

e dada pela distancia L


0
= x

2
x

1
. Entretanto, esta distancia
deve ser projetada em uma reta a tempo constante no referencial S, ja que uma
medida de distancia entre dois pontos devera ser feita assinalando a posi cao des-
tes dois pontos simultaneamente, para que realmente isto corresponda a uma
verdadeira distancia medida em S. Para analisar qual e esta distancia, devemos
tomar pontos das duas hiperboles que correspondam a tempos identicos no re-
ferencial S e projetar no eixo x

1
. Desta forma, encontramos que o comprimento
da regua medida em S e, em rela cao ao comprimento dela medida em S

,
L =
L
0
cosh
. (5.30)
Isto correspode `a contra cao das distancias, e novamente e um efeito de perspec-
tiva de como um referencial ve o outro.
5.3.2 Vetores Contravariantes e Covariantes
Quantidades fsicas diferentes se transformam diferentemente quando da pas-
sagem de um sistema de coordenadas a outro (ou de um referencial a outro).
Consideremos uma transforma cao de um sistema de coordenadas x

para x

.
Se a transforma cao e inversvel, a matriz jacobiana desta transformacao, de-
nida como

=
x

, possui determinante nao nulo. Uma transforma cao de


coordenadas deste tipo pode ser de natureza passiva ou ativa. No caso da trans-
formacao passiva, nos mudamos unicamente as coordenadas permanecendo no
mesmo referencial; na transformacao ativa, nos passamos para um outro refe-
rencial inercial. A passagem do sistema x, y, z cartesiano para o sistema esferico
75
r, , e uma transforma cao passiva. As transforma coes de Lorentz, assim como
as de Galileu, sao ativas.
Consideremos por exemplo, agora, a diferencial dx

, que sao as componentes


do vetor dr. Quando passamos do sistema x

para o sistema x

, temos entao
que estas componentes se transformam como
dx

=
x

dx

dx

. (5.31)
Por outro lado, se considerarmos as componentes do operador vetorial nabla

,
dadas por

x

, temos

=
x

. (5.32)
Note-se que em (5.32) surge a inversa da matriz jacobiana ao contrario do que
ocorre em (5.31). As duas grandezas se transformam diferentemente na passa-
gem de um sistema de coordenadas a outro. Em uma linguagem mais tradicional
dr e chamado de vetor, enquanto

e denominado de co-vetor.
Am de simplicar a notacao, escreveremos daqui por diante

=
x

, (5.33)
designando a matriz Jacobiana, e

=
x

, (5.34)
designando sua inversa. Destas deni coes resulta a propriedade,

(5.35)
sendo

o delta de Kronnecker, que e igual a um quando = e igual a 0


quando ,= .
Uma quantidade vetorial cujas as componentes A

se transformam como
A

, (5.36)
quando se passa do sistema de coordenadas x

para o sistema de coordenadas


x

e dita contravariante. Por outro lado uma quantidade vetorial (na verdade,
co-vetorial), de componentes B

que se transformam como


B

(5.37)
76
e dita covariante.
Podemos denir o produto de um tensor covariante com um contravariante,
resultando em uma grandeza escalar:
A

= C . (5.38)
Podemos mostrar que C e de fato um escalar estudando o seu comportamento
por uma transformacao de coordenadas:
C

= A

=
=

= A

= C . (5.39)
A fun cao C nao sente a transforma cao de coordenadas, sendo efetivamente um
escalar.
5.4 Interpretacao geometrica dos vetores cova-
riantes e contravariantes
Quando lidamos com a geometria euclidiana normal, sobretudo quando se em-
pregam coordenadas cartesianas, a distincao entre vetores contravariante e co-
variantes (ou, vetores e co-vetores) e, muito frequentemente, irrelevante. Entre-
tanto, podemos ter uma nocao do sentido desta distin cao considerando, em um
espaco euclidiano ordinario, um sistema de coordenadas nao convencional. De
fato, considere o sistema de coordenadas cartesiano normal, a duas dimensoes,
com os eixos x e y perpendiculares entre si. Considere agora um vetor neste
espaco e sua projecao naqueles eixos. A proje cao do vetor no eixo x (o mesmo
podera ser dito da projecao no eixo y) pode ser denido de duas formas equiva-
lentes para este caso: tra ca-se uma linha da extremidade do vetor ao eixo x que
seja perpendicular a este eixo; ou traca-se uma linha da extremidade do vetor
ao eixo x que seja paralela ao eixo y. O resultado e o mesmo nos dois casos.
Por outro lado considere agora um novo sistema de coordenadas (x

, y

) em
que os respectivos eixos nao sejam perpendiculares, mas tal que o eixo x

faca
um angulo com o antigo eixo x, enquanto o eixo y

coincide com o eixo y. Para


o novo sistema de coordenadas (x

, y

), os dois procedimentos acima conduzem


77
a resultados diferentes. Chamaremos os sistemas (x, y) e (x

, y

) como sistemas
ortogonal e nao ortogonal, respectivamente.
Um vetor r se escreve no sistema de coordenadas (x, y) e (x

, y

), respecti-
vamente, como
r = x

i + y

j = x

+ y

, (5.40)
onde (

i,

j) e (

) sao os vetores unitarios nos sistemas ortogonal e nao orto-


gonal, respectivamente. Temos

i.

= cos ,

i.

= 0 ,

j.

= sin ,

j.

= 1 . (5.41)
Suponhamos agora que o angulo do vetor r com o eixo dos x seja . Neste caso,
se projetarmos este vetor segundo uma paraleta ao eixo dos x(y), obtemos
x = r cos , y = r sin . (5.42)
Encontremos agora a proje cao nos novos eixos (x

, y

). Temos, por deni cao


para um vetor, e utilizando as decomposicoes (5.40) e as relacoes (5.41)
r.

= x

+ y

sin = xcos + y sin , (5.43)


r.

= y

+ x

sin = y . (5.44)
Podemos expressar entao as novas coordenadas em termos das antigas e vice-
versa:
x

=
x
cos
, y

= xtan + y ; (5.45)
x = x

cos , y = x

sin + y

. (5.46)
Estas transformacoes podem ser escritas como,
x

, x

, (5.47)
sendo que , = 1, 2, e

=
x

=
x

, (5.48)
sao a matriz transforma cao do sistema de coordenadas (x

, y

) para o sistema
de coordenada (x, y) e sua inversa. Estas transformacoes podem ser expressas
78
na forma matricial:
_
x

_
=
_
1
cos
0
tan 1
__
x
y
_
, (5.49)
_
x
y
_
=
_
cos 0
sin 1
__
x

_
. (5.50)
O que discutiu-se ate agora foi a transformacao das componentes de um ge-
nuino vetor quando se passa de um sistema de coordenadas ortogonal para um
sistema de coordenadas nao ortogonal. O que garante que estamos lidando com
vetores usuais e a decomposi cao (5.40), que faz uso explcito da regra do parale-
lograma para a composicao de vetores. Assim, os vetores se representam como
matrizes colunas. O que ocorre se considerarmos agora uma decomposicao onde
as componentes da quantidade r sejam obtidas atraves de uma perpendicular
ao eixo desejado? Obviamente esta quantidade r (para a qual usamos a mesma
notacao que a empregada para os vetores usuais) nao podera ser decomposta
como em (5.40). Por outro lado obtemos agora,
x = r cos , y = r sin , (5.51)
x

= r cos( ) , y

= r sin . (5.52)
Logo,
x

= xcos + y sin , y

= y , (5.53)
x =
x

cos
y tan , y = y

. (5.54)
Do ponto de vista matricial, esta transformacao pode ser escrita como,
( x

) = ( x y )
_
cos 0
sin 1
_
, (5.55)
( x y ) = ( x

)
_
1
cos
0
tan 1
_
. (5.56)
Ha duas observa coes importantes nas transformacoes (5.55,5.56) acima: elas
tem a forma inversa em rela c ao `as transforma coes vetorias (5.49,5.50); as projecoes
perpendiculares aos eixos implicam em representar o vetorcomo uma matriz
coluna. Essas quantidades sao, na verdade, co-vetores ou, em uma linguagem
79
mais moderna, vetores covariantes. Esses vetores sao duais aos vetores usuais.
Isto quer dizer, que os co-vetores (vetores) agem sobre os vetores (co-vetores) de
maneira a resultar em um escalar, quer dizer, uma quantidade que nao e afetada
pela transforma cao de coordenadas. De fato, escrevendo (x
v
, y
v
) e (x
c
, y
c
) como
as componentes de um vetor e de um co-vetor respectivamente, temos
( x

c
y

c
)
_
x
v
y
v
_
= ( x
c
y
c
)
_
cos 0
sin 1
__
1
cos
0
tan 1
__
x
v
y
v
_
,
x

c
x

v
+ y

c
y
v
= x
c
x
v
+ y
c
y
v
. (5.57)
Isto implica que o produto de um vetor por um co-vetor e um escalar, uma
quantidade que permanece invariante por transformacao de coordenadas.
Um espa co dado sempre possui o seu dual. Os elementos do espaco agindo
sobre os elementos do espaco dual, e vice-versa, resultam em um escalar. Os
elementos do espa co vetorial dual, se transformam de maneira inversa aos ele-
mentos do espa co vetorial original. A existencia de um espa co dual a um dado
espaco e condicao necessaria para que possamos denir um produto interno,
onde dois elementos vetoriaisresultam em um escalar. Na verdade, no pro-
duto escalar, um vetor de um dado espaco age sobre o vetor do seu espa co dual,
como explicitado acima.
Por m, e importante ressaltar que, aparentemente, os vetores do espaco
dual, os que denominamos co-vetores, parecem nao obedecer `a regra do pa-
ralelograma para a adicao de vetores, como indica a decomposicao nos eixos
coordenadas. Entretanto, e preciso ressaltar que a base de co-vetores unitarios
nao e a base de vetores unitarios usuais, nem eles se decompoem da mesma
forma. De fato esta base deve ser escrita como
1
,
2
, onde a a cao desses
elementos sobre a base vetorial usual

i e

j resulta em um n umero. Para um
co-vetor, portanto,

A = A
1

1
+ A
2

2
. (5.58)
5.5 Generalizacao da nocao de vetores: tensores
Um tensor e a generaliza cao das no coes de escalar e vetor (ou co-vetor). Como
foi visto anteriormente, um vetor agindo sobre um co-vetor, resulta em um
80
n umero. O vetor esta denido em um certo espa co, e o co-vetor no seu espaco
dual. Como dito acima, e este fato que torna possvel denir o produto interno,
que sempre envolve um vetor e um elemento do seu espa co dual. Quanto ao
tensor, nos podemos deni-lo como sendo uma aplicacao multilinear de vetores
e co-vetores na reta real. Um tensor se dene tambem pela forma como suas
componentes se transformam por uma mudan ca de sistema de coordenadas.
Simbolicamente podemos representar a acao de um tensor sobre vetores e
co-vetores como
T(V
1
, ...V
n
, C
1
, ..., C
m
) = R , (5.59)
onde os V
i
indicam vetores e os C
j
indicam co-vetores, enquanto Re um n umero.
Em termos de componenentes, em um dado sistema de coordenadas, temos
entao,
T

1
...
n

1
...
m
V

1
...V

n
C

1
...C

m
= R . (5.60)
No exemplo acima, temos um tensor T de ordem n+m, n vezes covariante e m
contravariante. A ordem dos ndices covariantes e contravariantes e importante,
e no exemplo em questao, os n primeiros ndices sao covariantes, enquanto que
os m ultimos ndices sao contravariantes. No caso geral, a ordem do tensor, sua
natureza contravariante, covariante ou mista, e a posicao dos ndices dependem
do tipo especco de tensor com o qual lidamos. Exemplos especcos serao
apresentados mais tarde.
Um escalar e um tensor de ordem zero: permanece invariante por trans-
formacoes de coordenadas. Um vetor e um tensor contravariante de ordem 1;
um co-vetor e um tensor covariante tambem de ordem 1. Veremos a seguir
tensores mais gerais, de ordem superior, tais como o tensor metrico e o ten-
sor eletromagnetico, ambos de ordem 2. Na verdade, o conceito de tensor ja e
familiar em outras situa coes. Por exemplo, o estudo de um solido deformavel
e feito com a ajuda do tensor de elasticidade. Neste caso, o conceito de uma
aplicacao multilinear, como denida acima, e bastante importante. Anal, uma
tensao aplicada em um direcao x, pode provocar deformacoes tanto na direcao
x, quanto nas direcoes y e z perpendiculares. Tal relacao nao pode ser expressa
simplesmente atraves de vetores, mas se torna factvel atraves de um tensor, no
caso, um tensor de segunda ordem. De fato, podemos denir a defomormacao
81
sofrida por um solido d
i
sob a aplicacao de uma tensao t
i
, com a ajuda do tensor
de elasticidade E
i
j
:
d
i
= E
i
j
t
j
. (5.61)
Assim, para o caso da aplicacao da tensao na direcao x, o que implica que a
unica componente nao nula da tensao e t
x
, temos para as deformacoes,
d
x
= E
x
x
d
x
, d
y
= E
y
x
d
x
, d
z
= E
z
x
d
x
. (5.62)
Em geral, o tensor de segunda ordem pode ser representado por uma matriz
n n, da mesma forma que um vetor pode ser representado por uma matriz
coluna e um co-vetor por uma matriz linha. Veremos mais tarde, no entanto, que
nem toda matriz nn e um tensor de segunda ordem: o que dene efetivamente
um tensor e a maneira como ele se transforma sob uma mudanca de coordenadas.
No caso do tensor de elasticidade, se a matriz E
i
j
e diagonal, o meio e linear.
Se alem do mais, os elementos da diagonal sao iguais, entao a relacao tensorial
se reduz a uma relacao puramente escalar. De fato, se E
i
j
= E
i
j
entao
d
i
= E
i
j
t
j
d
i
= E t
i
. (5.63)
Neste caso, o meio e dito isotropico. A polariza cao de um meio dieletrico
sob a acao de um campo magnetico externo tambem e um tensor de segunda
ordem. Para meios isotropicos, o tensor de polariza cao se reduz a um escalar,
pelos mesmos motivos que o tensor de elasticidade. Mas, o caso geral deve
incluir anisotropias.
Para o caso do tensor T denido acima, sob a acao de uma mudanca de um
sistema de coordenadas, suas componentes se transformam como
T

1
...

1
...

m
=
x

1
x

1
...
x

n
x

n
x

1
x

1
...
x

m
x

m
T

1
...
n

1
...
m
. (5.64)
Lembrando que um vetor e um co-vetor se tranformam respectivamente como
V

i
=
x

i
x

i
V

i
, C

i
=
x

i
x

i
C

i
, (5.65)
e que
x

i
x

i
x

i
x

j
=

j
,
x

i
x

i
x

i
x

j
=

j
, (5.66)
82
onde a convencao da soma sobre ndices repetidos e a regra da cadeia da de-
rivacao foram usadas. Assim,
T

1
...

1
...

m
V

1
...V

n
C

1
...C

m
=
T

1
...
n

1
...
m
V

1
...V

n
C

1
...C

m
= R , (5.67)
de maneira que a aplicacao tensorial multilinear explicitada acima, resulta efe-
tivamente em um n umero, um escalar.
5.6 Operacoes com tensores
Os tensores podem ser puramente covariantes, contravariantes ou mistos. Por
exemplo, podemos denir um tensor covariante de segunda ordem cujas com-
ponentes sao A

, ou um tensor contravariante de segunda ordem com compo-


nentes B

, ou ainda um tensor misto de segunda ordem com componentes C

.
Tensores de ordem superior devem ser denidos da mesma forma.

E impor-
tante ressaltar que a posicao dos ndices e crucial: por exemplo, em princpio
as componentes de um tensor covariante de segunda ordem A

sao diferentes
das componentes A

. A natureza dos tensores (covariante, contravariante ou


misto), assim como sua ordem (seu n umero de ndices, falando de uma forma
simplicada) depende do contexto em que eles aparecem, determinado pela ma-
neira como eles se transformam sob uma mudanca do sistema de coordenadas.
O vetor deslocamento dr, como ja foi visto anteriormente, se transforma como
um tensor contravariante de primeira ordem; o operador diferencial

se trans-
forma como um tensor covariante de primeira ordem. Veremos posteriormente
como tensores de ordem superior aparecem e como sua ordem e sua natureza
sao denidos.
A primeira operacao com tensores e a sua multiplica cao direta, que pode-
mos tambem denominar de produto tensorial. Consideremos, para sermos es-
peccos, dois tensores de ordens diferentes, que notemos abstratamente como A
e B (nao ha nenhuma men cao aos tensores apresentados acima com as mesmas
letras). Digamos que A e um tensor misto de segunda ordem de componentes
A

, enquanto Be um tensor tambem misto, de terceira ordem, com componen-


tes B

. O produto tensorial entre estes dois tensores, resulta em um tensor


83
misto de quinta ordem, que denominamos C:
C = AB C

= A

. (5.68)
Podemos vericar se C e um tensor misto de quinta ordem vericando como
ele se comporta por uma transforma cao de coordenadas. Uma vez que A e B
foram denidos como tensores, ao passarmos de um sistema de coordenadas x

para um sistema de coordenadas x

, temos,
A

=
x

, (5.69)
B

=
x

. (5.70)
Desta forma, temos que
C

= A

=
x

=
x

=
x

. (5.71)
Logo, C e um tensor misto de quinta ordem duplamente contravariante e tri-
plamente covariante. Novamente, e preciso enfatizar que a posi cao dos ndices
e crucial. Observemos tambem que AB e, em princpio, diferente de BA,
muito embora ambos resultem em tensores mistos de quinta ordem, duplamente
contravariantes e triplamente covariantes. A posi cao dos ndices das componen-
tes e, no entanto, diferente.
Uma outra operacao com tensores e a contracao de ndices no interior de um
mesmo tensor. Consideremos o tensor C do exemplo acima cujas componentes
sao escritas no sistema de coordenadas x

. Somemos nos ndices

, por
exemplo. Temos entao,
C

= C

. (5.72)
A contra cao dos ndices

resultou em um tensor misto de terceira ordem,


uma vez contravariante e duas vezes covariante. A opera cao de contra cao de
84
ndices no seio de um tensor sempre reduz duas vezes sua ordem, suprimindo
um ndice contravariante e um covariante. A demonstracao disto se faz usando
a regra da cadeia para as derivadas:
C

=
x

=
x

=
x

. (5.73)
Logo, C

se transforma como um tensor de terceira ordem, uma vez


contravariante e duas vezes covariante, que podemos escrever como
C

= C

. (5.74)
A contra cao dendices so pode ser feita, evidentemente, entrendices covariantes
e contravariantes.
Um tensor de segunda ordem pode ser decomposto em uma parte simetrica
e uma parte anti-simetrica. De fato, consideremos um tensor covariante de
segundo ordem A

como exemplo. Podemos escrever


A

= A

+
1
2
A

1
2
A

=
1
2
_
A

+ A

_
+
1
2
_
A

_
= A
()
+ A
[]
, (5.75)
onde denimos
A
()
=
1
2
_
A

+ A

_
, (5.76)
A
[]
=
1
2
_
A

_
. (5.77)
Para um tensor puramente simetrico, temos A

= A

, enquanto para um
tensor puramente anti-simetrico, A

= A

.
Podemos tambem gerar um novo tensor, a partir de um tensor dado, derivando-
o. Mas, para tanto, sera preciso generalizar a nocao de derivada covariante.
85
5.7 A nocao de metrica
Os resultados descritos acima parecem indicar que so podemos fazer o produto
entre dois vetores, obtendo uma funcao escalar, quando um deles e covariante
e o outro e contravariante. Isto traria problemas para denir a norma de um
dado vetor, denida como a raiz quadrada do produto interno de um vetor por
ele proprio. Entretanto, podemos de fato denir o produto interno de um vetor
covariante por ele proprio, assim como podemos denir o produto interno de um
vetor contravariante por outro tambem contravariante. Isto e feito com ajuda da
metrica. A metrica e uma quantidade tensorial que permite estabelecer como
se calcula a distancia innitesimal entre dois pontos em uma dada estrutura
geometrica.
A distancia innitesimal entre dois pontos no espaco euclidiano a tres di-
mensoes pode ser escrita, utilizando coordenadas cartesianas, como
ds
2
= dx
2
+ dy
2
+ dz
2
= g

dx

dx

, (5.78)
onde , = 1, 2, 3 e onde introduzimos o termo g

, que neste caso e tal que


g

= 1 se = ,
= 0 se ,= .
O termo g

como apresentado acima e denominado de metrica do espaco eucli-


deano a tres dimensoes: e a quantidade que diz como calcular a distancia entre
dois pontos innitesimalmente proximos no espa co euclideano a tres dimensoes.
No caso temos a expressao para a metrica euclideana quando se emprega o sis-
tema de coordenadas cartesianas.

E claro que este intervalo nao deve mudar
quando fazemos uma transforma cao de coordenadas, visto que ela e uma propri-
edade intrnseca da geometria em questao; no nosso exemplo acima, a geometria
euclideana. Assim, se zermos uma transformacao de coordenadas do tipo
x

= x

(x

) , x

= x

(x

) , (5.79)
o elemento de distancia entre dois pontos transforma da seguinte maneira:
ds
2
= g

dx

dx

= g

dx

dx

, (5.80)
86
onde
g

= g

. (5.81)
Isto nos mostra que a quantidade g

se transforma duplamente como uma quan-


tidade covariante. Dizemos entao que g

e um tensor covariante de segunda


ordem.
Dada uma metrica g

, podemos obter a inversa, que sera um tensor contra-


variante de segunda ordem. Esta inversa e obtida estabelecendo que o produto
da metrica por sua inversa e a identidade:
g

, (5.82)
onde

e a funcao delta de Kronnecker denida anteriormente.


Podemos exemplicar o que foi exposto anteriormente ainda no ambito da
geometria euclideana. Consideremos a transformacao de um sistema de coorde-
nadas cartesianas para um sistema de coordenadas esfericas, denida por
x = r sin cos , y = r sin sin , z = cos , (5.83)
r =
_
x
2
+ y
2
+ z
2
, tan =
_
x
2
+ y
2
z
, tan =
y
x
. (5.84)
Essa transformacao e sua inversa sao bem denidas, `a exce cao quando x =
y = z = 0, ela e degenerada (esse mesmo ponto pode ser representado por
uma innidade de coordenadas r, , ). Neste caso, o elemento innitesimal de
distancia se transforma como,
ds
2
= dx
2
+ dy
2
+ dz
2
= dr
2
+ r
2
d
2
+ r
2
sin
2
d
2
. (5.85)
Neste caso revela-se conveniente representar a metrica como uma matrix:
g

=
_
_
_
1 0 0
0 1 0
0 0 1
_
_
_ ; g

=
_
_
_
1 0 0
0 r
2
0
0 0 r
2
sin
2

_
_
_ . (5.86)
Consequentemente, as matrizes inversas se escrevem como,
g

=
_
_
_
1 0 0
0 1 0
0 0 1
_
_
_ ; g

=
_
_
_
1 0 0
0 r
2
0
0 0 r
2
sin
2

_
_
_ . (5.87)
87
Consideremos agora o caso do espa co-tempo quadridimensional de Min-
kowski. Neste caso, o elemento invariante que permite calcular a distancia entre
dois eventos (pontos no espa co-tempo) e dado por
ds
2
= c
2
dt
2
dx
2
dy
2
dz
2
=

dx

dx

. (5.88)
Observe que neste caso a metrica foi escrita como g

. Isto e feito para


seguir a tradi cao segundo a qual a metrica no espa co-tempo de Minkowski se
simboliza por

. Em coordenadas esfericas (ct, r, , ), a metrica de Minkowski


se torna,
ds
2
= c
2
dt
2
dr
2
r
2
(d
2
+ sin
2
d
2
) =

dx

dx

. (5.89)
A metrica

e sua inversa

se escrevem, em coordenadas cartesianas e


esfericas, como

=
_
_
_
_
_
_
c
2
0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
_
_
_
_
_
_
; (5.90)

=
_
_
_
_
_
_
c
2
0 0 0
0 1 0 0
0 0 r
2
0
0 0 0 r
2
sin
2

_
_
_
_
_
_
. (5.91)

=
_
_
_
_
_
_
c
2
0 0 0
0 1 0 0
0 0 1 0
0 0 0 1
_
_
_
_
_
_
; (5.92)

=
_
_
_
_
_
_
c
2
0 0 0
0 1 0 0
0 0 r
2
0
0 0 0 r
2
sin
2

_
_
_
_
_
_
. (5.93)
A contracao da metrica, na sua forma covariante, com um vetor contrava-
riante, resulta em um vetor covariante. Podemos demonstrar isto facilmente,
88
vericando como esta quantidade se transforma quando passamos de um sis-
tema de coordenadas a outro. Consideremos entao a quantidade B

= g

.
Reescrevamos esta quantidade no sistema de coordenadas x

:
B

= g

= g

=
= g

=
x

(5.94)
o que mostra que o vetor B

construdo a partir do vetor contravariante B

,
com ajuda da metrica, se comporta efetivamente como um vetor covariante.
Da mesma forma, utilizando a metrica inversa g

podemos obter um vetor


contravariante a partir de um vetor covariante.
Desta forma, o produto interno de dois vetores covariantes (ou contravarian-
tes) pode ser feito com ajuda da metrica. De fato, dado um vetor contravariante
A

, podemos construir sua versao covariante utilizando a metrica:


A

= g

. (5.95)
Assim, a norma do vetor pode ser calculada:
A

= g

. (5.96)
No caso da metrica de Minkowski, em coordenadas cartesianas, temos
A

= (A
0
)
2
(A
1
)
2
(A
2
)
2
(A
3
)
2
. (5.97)
Observe que no espaco-tempo de Minkowski, a norma de um vetor contravari-
ante nao e denida positiva.
Da mesma forma, usando a metrica inversa

, podemos associar um vetor


contravariante a um vetor covariante:
B

. (5.98)
A norma de um vetor covariante se escreve entao como
B

. (5.99)
No espaco-tempo de Minkowski, utilizando coordenadas cartesianas, a norma
se le
B

= (B
0
)
2
(B
1
)
2
(B
2
)
2
(B
3
)
2
. (5.100)
89
Como no caso anterior, ela nao e denida positiva.
Note-se que se estamos, por outro lado realizando a contra cao de um vetor
contravariante A

com um covariante B

, obtemos, ainda no espa co-tempo de


Minkowski,
A

= A
0
B
0
+ A
1
B
1
+ A
2
B
2
+ A
3
B
3
. (5.101)
Por outro lado, para contrair um vetor, por exemplo, contravariante A

com ou-
tro vetor contravariante C

, teremos necessidade de introduzir a metrica conver-


tendo uma das quantidades em um vetor covariante (qual delas, nao e relevante
para este proposito):
A

= A

= A

= A
0
C
0
A
1
C
1
A
2
C
2
A
3
C
3
.
(5.102)
A partir das consideracoes acima, pode-se dar conta porque a distincao en-
tre vetores covariantes e contravariantes nao e muito enfatizada quando se de-
senvolve uma teoria no espa co euclideano usual. Utilizando-se o sistema de
coordenadas cartesianos os valores numericos das componentes de um vetor
contravariante A

sao iguais aos valores numericos das componentes covari-


antes correspondentes A

= g

devido `a forma da metrica e sua inversa


neste sistema de coordenadas (5.86,5.87). Entretanto, esta distincao ja se torna
relevante, mesmo no caso euclideano, quando se emprega outros sistemas de
coordenadas, mesmo que ortogonais, como o esferico, cilndrico, etc.
As estruturas geometricas nao se esgotam com o espaco euclideano e o
espaco-tempo de Minkowski. Existem innitas geometrias possveis, com es-
truturas proprias, classicadas pela forma como se calcula a distancia entre dois
pontos innitesimalmente proximos. Estas geometrias, que apresentam em ge-
ral uma curvatura intrnseca, se denominam geometrias riemaniannas. No caso
onde elas apresentam uma coordenada temporal, como no caso minkowskiano,
elas sao denominadas normalmente como pseudo-riemaniannas. Muitas vezes,
utiliza-se a expressao geometria riemanianna para designar em geral estruturas
espaciais ou espa co-temporais dotadas de uma metrica.
90
5.8 Metrica sobre a esfera bi-dimensional
Podemos exemplicar o signicado da metrica estudando o caso da esfera. O
objetivo e denir a metrica sobre a esfera, isto e, como se calcula a distancia
innitesimal entre dois pontos sobre esta superfcie. A esfera esta imersa no
espaco euclideano a tres dimensoes. Em coordenadas cartesianas, a distancia
entre dois pontos no espaco tri-dimensional e dada pela expressao (5.78). Se re-
expressarmos este elemento de distancia em coordenadas esfericas, temos entao
a expressao (5.85). Como queremos nos restringir `a superfcie da esfera, o raio
e constante e igual a R, resultando na metrica bi-dimensional,
ds
2
= R
2
(d
2
+ sin
2
d
2
) . (5.103)
Em que a metrica (5.103) difere da metrica de um plano cartesiano? Em
princpio poder-se-ia realizar uma transformacao para o sistema de coordenadas
cartesiano bi-dimensional. Mas, a situa cao e um pouco mais sutil. O que se tem
a fazer, e projetar os pontos da superfcie da esfera sobre o plano. Isto implica
em realizar uma projecao estereograca, mapear a esfera no plano. Denamos,
para este m, as coordenadas no plano,
x = r cos , y = r sin , (5.104)
r =
_
x
2
+ y
2
, = arctan
y
x
. (5.105)
A partir da gura (5.8), temos que =

2


2
. Isto resulta em
d cos
_

2


2
_
= d sin

2
= 2R , (5.106)
d sin
_

2


2
_
= d cos

2
= r . (5.107)
Podemos agora relacionar as coordenadas (, ) sobre a esfera com as coorde-
nadas (r, ) sobre o plano:
r = 2Rcot

2
, = . (5.108)
A partir destas transformacoes, obtem-se,
d =
4Rdr
4R
2
+ r
2
, sin =
4Rr
4R
2
+ r
2
, d = d . (5.109)
91
Figura 5.5: Projecao estereograca da esfera sobre o plano
Assim, a metrica da esfera (5.103) adquire a forma,
ds
2
=
16R
4
(4R
2
+ r
2
)
2
(dr
2
+ r
2
d
2
) . (5.110)
Ou ainda, utilizando as coordenadas cartesianas (x, y) sobre o plano,
ds
2
=
1
_
1 +
x
2
+y
2
4R
2
_
2
(dx
2
+ dy
2
) . (5.111)
A expressao da metrica sobre a esfera expressa em coordenadas cartesianas
do plano (5.111) mostra que a geometria da esfera e bastante diferente da geome-
tria do plano, como deveramos esperar. A diferenca consiste fundamentalmente
no fator comum em (5.111) que multiplica a metrica do plano euclideano. Por
ser um fator comum, ele e denominado de fator conforme. As componentes da
metrica da esfera neste sistema de coordenadas se escrevem entao,
g
xx
= g
xy
=
1
_
1 +
x
2
+y
2
4R
2
_
2
, g
xy
= g
yx
= 0 . (5.112)
De posse da metrica de uma superfcie esferica, podemos calcular, por exem-
plo, a distancia entre dois pontos sobre a superfcie, a area de uma regiao deli-
mitada por duas latitudes (duas curvas com constante), etc. O espa co denido
pelos elementos metricos (5.112) e um espaco a curvatura constante positiva,
com raio de curvatura k =
1
R
. Este e um exemplo de uma geometria nao eucli-
deana, com o espaco dotado de uma curvatura intrnseca.
92
5.9 A derivada covariante
A derivada ordinaria de um tensor nao e, em geral, um tensor. Isto pode ser
visto de maneira simples. Considere-se, para ser especco, um vetor contrava-
riante A

, cujas componentes sao escritas em um sistema de coordenadas x

,
e considere-se a derivada ordinaria destas quantidades utilizando este mesmo
sistema de coordenadas. Agora, realizemos uma transformacao para um novo
sistema de coordenadas x

, tal que x

= x

(x

). Tem-se entao
A

=
x

_
x

_
=
x

+
x

2
x

. (5.113)
A quantidade inicial, a derivada ordinaria do tensor contravariante de primeira
ordem, nao se transformou como um tensor devido a presenca do segundo termo
em (5.113). O mesmo ocorre para qualquer outro tensor, de qualquer natureza e
qualquer ordem, excetuando o caso do tensor de ordem zero (um escalar) cuja a
derivada ordinaria resulta em um tensor covariante de primeira ordem. A razao
e aue os vetores da base mudam de dire cao de um ponto a outro, e isto tem que
ser levado em conta ao se comparar dois vetores em pontos distintos do espa co.
Entretanto, e fundamental que possamos construir quantidades que deri-
vadas se comportam como tensores. A razao e simples: as leis fsicas, assim
como muitas quantidades matematicas, sao expressas como derivadas de certas
grandezas; se elas nao se transformarem tensorialmente sob uma mudan ca de sis-
tema de coordenadas, isto implicara que as leis fsicas nao guardarao sua forma
quando da passagem de um sistema de coordenadas a outro: a invariancia das
leis fsicas quando da passagem de um sistema inercial a outro nao estaria asse-
gurada. Para tanto, sera preciso generalizar a no cao de derivada, introduzindo
a derivada covariante.
Existem muitas formas de se denir uma derivada covariante, todas obvi-
amente equivalentes. Introduziremos a nocao de derivada covariante impondo
que a derivada covariante das componentes da metrica seja nula. Isto na verdade
nao e obrigatorio e existem estruturas onde a derivada covariante da metrica
nao e nula. Na verdade, ao impormos que a derivada covariante da metrica
93
e nula, estamos supondo que a metrica guarda sua forma sobre toda a varie-
dade, quer dizer, a geometria e puramente denida pela metrica. Isto dene os
espacos riemaniannos. Existem outras estruturas, como as dos espa cos dotados
de tor cao, os espa cos de Weyl, onde isto nao e verdade. Mas, visto que estamos
interessados em espacos riemaniannos, nos deteremos neste tipo de estrutura.
Denotemos a derivada covariante como
D


D
Dx

. (5.114)
A acao da derivada covariante sob a metrica resulta em um valor nulo. A de-
rivacao covariante e a derivacao ordinaria mais a acao de uma conexao. Uma
conexao leva em conta o fato que ao derivarmos, estamos subtraindo a quan-
tidade em dois pontos diferentes da variedade e, neste caso, devemos levar em
conta nao unicamente a variacao intrnseca da quantidade, mas tambem o fato
que os eixos do sistema de coordendas mudam quando passamos de um ponto
a outro, notadamente se a variedade e curva (muito embora esta condi cao nao
seja necessaria, ja que a nocao de derivada covariante e necessaria mesmo em
um espa co plano quando se, por exemplo, coordenadas curvilneas). Denimos
entao a derivada covariante sob um dado tensor, digamos A

, como
D

. (5.115)
Note-se que a acao da conexao sobre ndices contravariantes leva a um sinal
positivo, equanto sua acao sobre ndices covariantes leva a um sinal negativo.
Qual e a forma da conex ao? Para tanto, impomos que a derivada covariante
da metrica seja nula:
D

= 0 . (5.116)
Para descobrirmos a forma da conexao re-escrevamos a expressao acima reali-
zando uma permuta cao cclica dos ndices:
D

= 0 ; (5.117)
D

= 0 ; (5.118)
D

= 0 . (5.119)
94
Ao subtrair (5.118,5.119) de (5.117), e considerando que a conexao e simetrica
nos ndices inferiores, obtem-se

= 2

. (5.120)
Multiplicando pela metrica inversa g

, utilizando o fato que g

,
obtemos nalmente para a conexao,

=
1
2
g

_
. (5.121)
Sob uma transforma cao de coordenadas,
g

=
x

, g

=
x

. (5.122)
Logo, a conexao se transforma como,

=
1
2
g

_
=
1
2
x

_
x

_
x

_
+
x

_
x

_
x

__
=
x

+

2
x

. (5.123)
A presenca do ultimo termo em (5.123) mostra que a conexao, conhecida neste
caso como smbolo de Christoel, nao e um tensor.
Podemos analisar agora o comportamento da derivada covariante sob uma
mudanca de sistema de coordenadas. Temos,
D

=
x

+
x

2
x

+
x

+

2
x

=
x

+
x

2
x

+
x

+
_

x

_
x

__
x

. (5.124)
95
O ultimo termo pode ser re-arranjado conforme se segue:
_

x

_
x

__
x

=

x

_
x

2
x

=

x

_
x

2
x

=

x

]
_

2
x

=
x

2
x

. (5.125)
Assim, o terceiro termo de (5.124) e anulado pelo quarto termo. Temos entao
D

=
x

_
A

_
=
x

. (5.126)
Logo, a derivada covariante se transforma como um tensor. O mesmo pode ser
demonstrado para a derivada covariante de um vetor covariante.
5.10 Os operadores Laplaceano e DAlambertiano
A equa cao de propagacao de uma onda para uma dada quantidade se escreve
como
1
c
2

t
2


2

x
2


2

y
2


2

z
2
= 0 . (5.127)
Ou ainda como
1
c
2

t
2

2
= 0 , (5.128)
onde

2
=

2
x
2
+

2
y
2
+

2
z
2
, (5.129)
e o operador Laplaceano em coordenadas cartesianas.
A equacao da onda pode ser escrita de uma forma mais economica como
= 0 , (5.130)
onde
=
1
c
2

2
t
2

2
, (5.131)
e o operador DAlambertiano em coordenadas cartesianas. As expressoes (5.129,5.131)
representam, na verdade, os operadores Laplaceano e DAlambertiano no espaco
96
euclideano e minkowskiano, respectivamente, em coordenadas cartesianas. Em
particular, esses operadores podem ser escritos como

2
=
ij

j
, =

, (5.132)
onde i, j = 1, 2, 3 e , = 0, 1, 2, 3.
Em uma geometria qualquer denida por uma metrica g

, o operador
DAlambertiano se escreve como
= g

= g

_
. (5.133)
Nesta expressao, foram utilizadas as derivadas covariantes, de maneira que este
operador seja covariante. Podemos pensar que o operador Laplaceano e o caso
particular do operador DAlambertiano quando a metrica e a do espaco eucli-
deano em tres dimensoes. Esta expressao covariante permite, em particular,
calcular o operador Laplaceano em qualquer sistema de coordenadas de uma
maneira muito simples.
De fato, considere-se como exemplo o operador Laplaceano no espa c euclide-
ano em coordenadas esfericas. Primeiro, devemos obter a metrica neste sistema
de coordenadas:
ds
2
= dx
2
+ dy
2
+ dz
2
= dr
2
+ r
2
(d
2
+ sin
2
d
2
) . (5.134)
Assim, os coecientes metricos nao nulos sao:
g
rr
= 1 , g

= r
2
, g

= r
2
sin
2
, (5.135)
g
rr
= 1 , g

= r
2
, g

= r
2
sin
2
. (5.136)
Os smbolos de Christoel nao nulos sao:

= r ,
r

= r sin
2
, (5.137)

= cos sin ,

= cot (5.138)
Assim, temos para o operador Laplaceano, lembrando que estamos neste caso
no espaco euclideano a tres dimensoes:

2
= g

_
=
2
r
+
1
r
2

+
1
r
2
sin
2

+ +
2
r
2

r
+
1
r
2
cot

=
1
r
2

r
_
r
2

r
_
+
1
r
2
_
1
sin

_
sin

_
+
1
sin
2

_
. (5.139)
97
Obtivemos assim a express ao conhecida para o operador Laplaceano em co-
ordenadas esfericas simplesmente atraves da nocao de derivada covariante. Da
mesma forma, podemos determinar a forma do operador Laplaceano (ou DAlambertiano)
em qualquer outro sistema de coordenadas, partindo apenas da distancia inni-
tesimal entre dois pontos naquele sistema de coordenadas.
98
Captulo 6
A Mecanica relativista
6.1 Introducao
O termo mecanica relativista contem uma ambiguidade. A mecanica newto-
niana e sem d uvida relativista, mas pelo grupo de transformacao de Galileu.
Entendemos relativista como uma teoria que mantem sua forma por um certo
grupo de transforma cao. De uma certa maneira, deveramos denominar o que
veremos a seguir como mecanica relativista lorentziana. Mas, visto que foi a re-
latividade restrita que conduziu a uma visao mais ampla da nocao de invariancia
por transformacoes de referenciais, entao adotaremos a denominacao corrente,
sem explicitar o termo lorentziano.
A mecanica newtoniana e inteiramente baseada nas tres leis de Newton.
A primeira lei esta naturalmente incorporada na relatividade restrita. A se-
gunda, deve evidentemente ser modicada. Para proceder a esta generaliza cao
deduziremos as expressoes quadridimensionais de velocidade e de aceleracao `a
partir das quais podemos gerar as expressoes de momento e de for ca a quatro
dimensoes.
Por outro lado, a terceira lei de Newton esta diretamente relacionada com
a no cao de conserva cao do momento linear. As leis de conserva cao desempe-
nham um papel central em qualquer teoria fsica e estao intimamente ligadas `as
simetrias do espa co-tempo: a conserva cao do momento esta relacionada com a
99
invariancia por translacao espacial; a invariancia por translacao temporal leva `a
conserva cao da energia; a conserva cao do momento angular deve-se `a invariancia
por rota coes espaciais. Assim, a generalizacao das leis de conserva cao pode ser
facilmente feita se substituirmos os termos espaciais e temporais, por espaco-
temporais. Deste modo, espera-se unicar a conserva cao do momento e da ener-
gia, numa unica lei de conserva cao, e generalizar a no cao de momento angular
para quatro dimensoes.
Nosso ponto de partida no estudo da mecanica sera fortemente baseado na
nocao de leis de conservacao como princpio fundamental. Introduziremos, e
claro, a nocao de for ca, mas com menos enfase do que na mecanica newtoniana.
Entretanto, alguns problemas mecanicos envolvendo certos tipos de forcas serao
analisados, entre eles o caso da lei gravitacional, o que nos permitira obter o
efeito do avanco do perielio para as orbitas elpticas.
6.2 A cinematica relativista
A cinematica busca descrever o movimento de uma partcula atraves de sua
posi cao, velocidade e aceleracao. Na mecanica newtoniana tais quantidades tem
tres componentes, ja que a mecanica newtoniana e formulada em um espaco eu-
clideano tri-dimensional, ao qual se acrescenta o tempo como parametro univer-
sal. Entretanto, a relatividade restrita indica que vivemos em um espa co-tempo
quadri-dimensional. Portanto, as quantidades correspondentes devem ter qua-
tro componentes, uma delas associada `as coordenadas temporais. Sera preciso,
portanto, generalizar as expressoes usuais newtonianas para as quantidades ci-
nematicas.
No que diz respeito `a posicao, esta generaliza cao e direta, e nos ja a abor-
damos anteriormente. O quadri-vetor (vetor com quatro componentes) posi cao
e, em coordenadas espaciais cartesianas,
x

= (ct, x, y, z) . (6.1)
A velocidade e a variacao da posicao com o tempo. Em mecanica newtoniana
esta deni cao nao traz grandes diculdades, uma vez que a estrutura geometrica
newtoniana e o espa co euclideano tri-dimensional ao qual se acrescenta o tempo
100
como parametro universal. A velocidade, portanto, e a derivada do vetor posi cao
em rela cao a este tempo universal, independente do observador. Em relativi-
dade restrita, por outro lado cada observador mede um tempo particular ao seu
referencial.

E necessario para denirmos a quadri-velocidade um parametro que seja,


como no caso newtoniano, independente do observador. Este parametro e for-
necido pela distancia innitesimal entre dois pontos no espa co tempo,
ds
2
= c
2
dt
2
dx
2
dy
2
dz
2
. (6.2)
Como ja foi visto anteriormente, este elemento de linha tem o mesmo valor
para todos observadores inerciais. Por outro lado, o tempo proprio e o tempo
medido por um observador em repouso em rela cao a partcula. Para este obser-
vador, temos entao
ds
2
= c
2
d
2
. (6.3)
Consequentemente, o tempo proprio tambem e um invariante, pois ele difere de
ds
2
pelo fator constante c. Isto signica que, se dois observadores localizados
em referenciais diferentes, descrevem o movimento de uma dada partcula, eles
discordarao sobre a medida de tempo respectivas, mas concordarao sobre qual
e a medida de tempo do observador em repouso em relacao a partcula, quer
dizer, o tempo proprio da partcula.
Tomaremos entao o tempo proprio como sendo o parametro universal, uma
vez que ele e um invariante. Assim, a quadri-velocidade se dene como
u

=
dx

d
. (6.4)
A quadri-velocidade assim denida e um vetor ou, dito de outra forma, um ten-
sor contravariante de primeira ordem. Podemos facilmente relacionar a quadri-
velocidade, que e um tensor no espaco-tempo a quatro dimensoes, com as gran-
dezas usuais tri-dimensionais. De fato consideremos novamente a distancia in-
nitesimal ds. Temos entao,
ds
2
= c
2
d
2
= c
2
dt
2
dx
2
dy
2
dz
2
,
d
2
= dt
2

dx
2
+ dy
2
+ dz
2
c
2
,
101
d
2
= dt
2
_
1
v
2
c
2
_
,
d = dt
_
1
v
2
c
2
= (v)dt , (v) =
_
1
v
2
c
2
. (6.5)
Desta forma temos
d
dt
= (v) . (6.6)
Assim
u

=
dt
d
dx

dt
= (v)
_
c,
dx
dt
,
dy
dt
,
dz
dt
_
= (v)(c, v
x
, v
y
, v
z
) = (v)(c, v) . (6.7)
Esta e a expressao para a quadri-velocidade expressa em termos da velocidade
tri-dimensional v medida em um referencial inercial especco. Observe que,
neste caso, escrevemos o fator de Lorentz como (v) e nao como (V ) pois
queremos distinguir os fatores de Lorentz que correspondem `a passagem de um
referencial inercial arbitrario para o referencial proprio da partcula ((v)) do
caso onde se processa a passagem de um referencial inercial arbitrario a outro
igualmente arbitrario ((V )). Um dos motivos para isto e que o referencial
proprio pode ser apenas localmente inercial, como no caso onde a partcula
esta sendo acelerada: e preciso neste caso denir uma sequencia de referenciais
inerciais, cada um correspondendo ao referencial proprio da partcula apenas
em um intervalo innitesimal de tempo.
O quadri-vetor velocidade u

e do tipo tempo. Ha duas formas de mostrar


isto. Uma delas seria calcular explicitamente a contra cao u

utilizando (6.7) e a expressao da metrica minkowskiana

. A outra faz uso


da denicao (6.4) e da no cao de elemento de linha ds
2
e do tempo proprio
d. Vamos considerar esta segunda possibilidade, que e bem mais economica.
Utilizando entao a denicao (6.4), temos
u

dx

d
dx

d
=

dx

dx

d
2
=
ds
2
d
2
, (6.8)
onde utilizou-se o fato que ds
2
=

dx

dx

. Lembrando agora que ds


2
= c
2
d
2
,
temos nalmente
u

= c
2
. (6.9)
102
Logo, a norma do quadri-vetor velocidade e igual ao quadrado da velocidade
da luz, sendo portanto positiva denida. Assim, o quadri-vetor velocidade e do
tipo tempo. Isto esta ligado `a no cao de causalidade: uma partcula so pode
seguir uma trajetoria no espaco-tempo de Minkowski tal que a relacao causal
esteja assegurada.
A generalizacao quadri-dimensional da aceleracao segue os mesmos passos.
A acelera cao e a derivada da velocidade. Novamente, para que esta armacao
faca sentido no espaco-tempo quadri-dimensional, a derivada deve ser em relacao
a um parametro universal, no caso o tempo proprio medido pela partcula da
qual se calcula a aceleracao. Temos enao,
a

=
du

d
=
d
2
x

d
2
. (6.10)
Podemos tambem expressar a quadri-aceleracao em termos das grandezas tri-
dimensionais usuais, como a posi cao, a velocidade e a aceleracao medidas em
um referencial especco. Utilizando novamente a relacao entre o tempo proprio
da partcula e o tempo coordenado medido em um referencial inercial t (6.6),
tem-se
a

= (v)
du

dt
= (v)
d
dt
((v)c, (v)v)
= (v)( (v)c, (v)v + (v)

v) . (6.11)
Temos, por outro lado,
(v) =
1
c
2
v.

v
_
1
v
2
c
2
_
3/2
=
3
(v)
v.

v
c
2
. (6.12)
Assim, a quadri-acelera cao expressa em termos das quantidades tri-dimensionais,
medidas em um referencial particular, assume a forma
a

=
_

4
(v)
v.

v
c
,
4
v.

v
v
c
2
+
2
a
_
, (6.13)
sendo a a aceleracao tri-dimensional da partcula medida em um referencial S
especco.
O quadri-vetor aceleracao a

e do tipo espaco. Novamente, pode-se demons-


trar isto de duas formas: utilizando a denicao da quadri-aceleracao (??) em
103
termos das grandezas tri-dimensionais, ou mostrando que a quadri-acelera cao e
ortogonal a um vetor tipo tempo, como a quadri-velocidade. Seguiremos este
ultimo procedimento por ser mais economico e por nos revelar uma rela cao entre
os quadri-vetores velocidade e acelera cao que sera muito util posteriormente.
Considere-se a norma da quadri-velocidade,
u

= c
2
. (6.14)
Diferenciando em relacao ao tempo proprio e observando que o lado direito de
(6.14) e constante, obtem-se
u

du

d
= 0

du

d
=

= u

= 0 . (6.15)
Uma vez que os dois quadri-vetores sao ortogonais entre si e que o quadri-vetor
velocidade e do tipo tempo, o quadri-vetor aceleracao e forcosamente do tipo
espaco.
Ao exprimimos os quadri-vetores velocidade e aceleracao de uma forma ma-
nifestamente tensorial temos que, dadas suas componentes em um sistema de
refencia, podemos calcula-las em outro sistema de referencia. De fato, as compo-
nentes destas duas quantidades, expressas em um referencial S e um referencial
S

, se relacionam como
u

, (6.16)
a

. (6.17)
Utilizando estas relacoes, podemos expressar, por exemplo, as quantidades tri-
dimensionais (velocidade, aceleracao, etc.) medidas em um referencial em ter-
mos das mesmas quantidades em outro referencial.
6.3 O momento e a lei de forca relativista
Na mecanica newtoniana, a segunda lei indica qual e o efeito de uma forca

F
sobre uma partcula:

F = ma. Como vimos anteriormente, utilizando a de-
nicao de a como segunda derivada da posicao em relacao ao tempo, obtemos
que esta expressao e invariante pelas transformacoes de Galileu. Se focalizarmos
104
a atencao nas transformacoes de Lorentz, temos que substituir todas as gran-
dezas tridimensionais por grandezas quadridimensionais denidas no espa co de
Minkowski. Essas grandezas devem ser tensores, se transformando como tais
quando de uma mudanca de um referencial a outro. Construir relacoes ten-
soriais e a unica forma de garantir que teremos expressoes que manterao sua
forma por transforma coes de Lorentz; alem disto, devido `a natureza das trans-
formacoes de Lorentz, tais expressoes sao for cosamente quadri-dimensionais.
Desta forma, a generaliza cao mnima (podemos sempre pensar em algumas ge-
neralizacoes mais complicadas) da segunda lei de tal forma a incorporar estes
princpios relativistas e:
F

= m
0
a

= m
0
du

d
= m
0
d
2
x

d
2
, (6.18)
onde a

, u

, x

e sao a quadri-aceleracao, a quadri-velocidade, a quadri-


posi cao e o tempo proprio, respectivamente. O termo m
0
e a massa de repouso
da partcula; o seu signicado cara mais claro posteriormente.
A quadri-aceleracao e um tensor de primeira ordem. Como m
0
e um escalar,
F

e tambem um tensor de primeira ordem. (Lembramos que o tempo proprio,


sendo proporcional ao elemento ds (ds
2
= c
2
d
2
), mantem-se invariante por
transformacoes de Lorentz). Este fato nos permite relacionar as componentes
de F

com as expressoes usuais newtonianas de for ca. E mais: nos permitira


interpretar sicamente o que signica a componente temporal desta quantidade
F
0
que, aparentemente, e apenas aparentemente, nao tem equivalente newtoni-
ano.
De fato, a quadri-for ca F

, sendo um tensor, visto que e construdo a partir


de quantidades tensoriais, se comporta, por uma transforma cao do sistema de
coordenadas x

para o sistema de coordenadas x

, como
F

, (6.19)
onde

=
x

e a matrix de transformacao do sistema de coordenadas x

ao
sistema de coordenadas x

. No caso especco das transformacoes de Lorentz,


isto conduz a:
F
0

=
_
F
0

V
c
F
1
_
; (6.20)
105
F
1

=
_
F
1

V
c
F
0
_
; (6.21)
F
2

= F
2
; (6.22)
F
3

= F
3
. (6.23)
Nos conhecemos as leis de forca macroscopicas e que obedecem `as relacoes
newtonianas com grande precisao. Como relacionar essas leis de for ca ordinarias
com a expressao aparentemente mais abstrata dada por (7.45)? Para vermos
isto, retomemos a expressao da quadri-aceleracao a

:
a

=
du

d
=
du

dt
dt
d
. (6.24)
Mas,
dt
d
= =
1
_
1
V
2
c
2
. (6.25)
Desta forma,
F

= m
0
(f
0
,

f) , (6.26)
onde

f =
d
dt
v e a componente espacial da quadri-forca medida em um dado
referencial S. Desta forma, a relacao da quadri-forca com a lei de forca ordinaria
se torna
F
i
= f
i
, (6.27)
sendo f
i
a expressao tridimensional de uma for ca medida em um referencial
especco: para o caso de uma forca restauradora, f
i
= kx
i
; para o caso da
forca gravitacional, f
i
= G
Mm
r
3
x
i
.
Necessitamos entretanto, interpretar F
0
. Lembremos que o quadrivetor ace-
leracao e do tipo espaco, ao passo que o quadri-vetor velocidade e do tipo tempo.
Logo, a

= o. Assim,
F

= 0
2
_
f
0
c f
i
v
i
_
= 0 f
0
=
1
c
f
i
v
i
. (6.28)
Desta forma, a componente temporal da quadri-for ca esta ligada `a potencia
transmitida pela forca

f.
O resultado precedente permite reescrever as leis de transformacao das com-
ponentes da for ca relativista:
f

1
=
f
1

V

fv
c
2
1
v
1
V
c
2
, (6.29)
106
f

2
=
f
2
(1
v
1
V
c
2
)
, (6.30)
f

3
=
f
3
(1
v
1
V
c
2
)
. (6.31)
6.4 O momento linear
Na mecanica newtoniana, o momento se escreve como p = mv. A generalizacao
quadridimensional e imediata. Nos escrevemos o momento em quatro-dimensoes
como
p

= m
0
u

= m
0
(c, v) . (6.32)
Novamente, aparece m
0
, a massa de repouso da partcula; v

e, como antes, a
quadri-velocidade. Como v

e um tensor de primeira ordem e m


0
e um escalar,
p

sera tambem um tensor de primeira ordem e se transforma como tal quando


passamos de um sistema de coordenadas x

para um sistema de coordenadas


x

:
p

=
x

. (6.33)
No caso especco da transforma cao de Lorentz, isto conduz `as seguintes ex-
pressoes conectando as componentes do quadri-momento no novo sistema de
coordenadas em relaoes no antigo sistema de coordenadas:
p
0

=
_
p
0

V
c
p
1
_
, (6.34)
p
1

=
_
p
1

V
c
p
0
_
, (6.35)
p
2

= p
2
, p
3

= p
3
. (6.36)
Como o quadri-momento e diretamente proporcional `a quadri-velocidade, ele
tambem e do tipo tempo.
Como no caso da deni cao da quadri-forca, devemos interpretar a com-
ponente temporal do quadri-momento. Para fazermos isto, consideremos no-
vamente a quadri-forca e escrevemo-la como derivada do quadri-momento em
relacao ao tempo proprio:
F

=
dp

d
. (6.37)
107
Esta relacao pode ainda ser reescrita como,
F

=
dp

dt
dt
d
. (6.38)
Mas,
dt
d
= , de maneira que temos,
F

=
dp

dt
. (6.39)
Recordando as expressoes da quadri-forca em relacao `as grandezas tridimensio-
nais usuais, nos obtemos,
f
0
=
dp
0
dt
, f
i
=
dp
i
dt
. (6.40)
Como f
0
=
1
c
dE
dt
, entao p
0
=
E
c
: a componente temporal do quadri-momento
esta relacionada com a energia da partcula. Alem disto, observamos que
p
0
= m
0
c =
E
c
E = m
0
c
2
. (6.41)
Notemos que quando a partcula esta em repouso = 1 e ainda assim ela possui
uma energia dada por
E
0
= m
0
c
2
, (6.42)
denominada energia de repouso da partcula. Essa energia de repouso nao tem
analogo newtoniano
Por outro lado, nos temos,
f
i
=
dp
i
dt
= m
0
d
dt
v
i
. (6.43)
Esta expressao nos permite escrever a relacao entre for ca e momento relativista
projetada no espaco tridimensional:

f = m
0
_
v + a
_
. (6.44)
O resultado obtido anteriormente para o quadri-momento linear poderia, de
certa forma, ser antecipado por razoes puramente conceituais. Ja foi dito anteri-
ormente que as leis de conserva cao estao relacionadas `a invariancias da teoria em
relacao a certos tipos de transformacoes. O fato de um sistema ser invariante por
uma translacao espacial (pouco importa fazer uma experiencia em Vitoria ou
em Cachoeiro, desde que os sistemas sejam identicos) conduz `a conservacao do
108
momento; o sistema fsico e tambem invariante por transformacoes temporais,
o resultado de experiencias feitas sobre sistemas identicos sendo o mesmo inde-
pendentemente se a experiencia foi feita hoje ou ontem: esta simetria conduz
`a conservacao da energia. Como agora estamos trabalhando em um contnuo
espaco-temporal, as conserva coes em separado do momento (invariancia espa-
cial) e da energia (invariancia temporal) se unicam em uma unica invariancia
espaco-temporal, que e expressa pela conserva cao, para um sistema fechado, do
quadri-momento:
p

f
= p

i
, (6.45)
onde os ndices i e f designam momentos inicial e nal, respectivamente. A
equacao (6.45) expressa simultaneamente as leis de conservacao da energia e
do momento linear tridimensional, que se apresentam como leis separadas na
mecanica newtoniana. Essa rela cao de conservacao sera amplamente usada ul-
teriormente.
Da expressao do momento (6.32), e lembrando que v

= c
2
, nos obtemos,
p

= m
2
0
c
2
=
2
_
E
2
c
2
p
2
_
. (6.46)
Denindo,

E = E , p = p , (6.47)
obtemos a expressao,

E =
_
m
2
0
c
4
+ p
2
c
2
, (6.48)
que relaciona a energia da partcula com sua massa de repouso e momento linear.
6.5 Problemas envolvendo leis de forca
Vamos analisar agora em detalhe alguns problemas envolvendo o calculo das
trajetorias de uma partcula para alguns casos particulares.
6.5.1 Forca constante
Vamos inicialmente considerar o exemplo mais simples: uma partcula inicial-
mente em repouso que sofre a acao de uma forca constante, orientada segundo
109
o eixo dos x, de tal forma que, no referencial do laboratorio, ela assume a forma

f = f
x

i = f

i, f sendo uma constante. Neste caso, a quadri-forca se escreve,


F = (

f.v
c
, f, 0, 0) . (6.49)
Considerando que o momento e dado por
P = m
0
(c, v) , (6.50)
e que F =
dP
d
=
dP
dt
, obtemos,
fv
c
= m
0
c
d
dt
, (6.51)
f = m
0
(
d
dt
v +
dv
dt
) . (6.52)
Uma vez que f e constante, temos
v =
f
m
0
t =
0
t , (6.53)
onde zemos
0
=
f
m
0
. A solu cao para a velocidade e,
v =

0
t
_
1 +

2
0
t
2
c
2
, (6.54)
ao passo que a solucao para a distancia percorrida e,
x =
c
2

0
_
_
1 +

2
0
t
2
c
2
1
_
. (6.55)
No limite em que a velocidade da luz tende a innito, obtemos as relacoes
newtonianas usuais,
v
0
t , x =

0
t
2
2
. (6.56)
Por outro lado, podemos observar que a velocidade jamais ultrapassara o valor
limite c:
t v c .. (6.57)
Finalmente, e interessante estabelecer uma rela cao entre o tempo medido no
laboratorio e o tempo proprio medido por um relogio xo na partcula. Temos,
=
_
t
0
_
1
v
2
c
2
dt =
c

0
sinh
1

0
t
c
. (6.58)
110
No limite t , temos a relacao

c

0
ln
2
0
t
c
, (6.59)
o que mostra que o tempo proprio cresce muito mais lentamente que o tempo
do laboratorio.
6.5.2 Forca constante ortogonal `a velocidade inicial
Consideremos agora outro problema classico da mecanica newtoniana: uma
partcula com velocidade inicial v
0
orientada ao longo do eixo x que entra em
uma regiao onde e submetida a uma forca

F orientada ao longo do eixo y.
Na mecanica newtoniana, trata-se de um problema trivial, visto que existira
aceleracao apenas ao longo do eixo y, a velocidade na dire cao x permanecendo
constante. Em relatividade restrita, entretanto, sabemos que existira tambem
aceleracao ao longo do eixo x como efeito da velocidade nao nula nesta direcao.
Vamos escrever as relac oes que nos interessam. Temos,
F

= m
0
a

f
m
0
=
3
va
c
2
v + a

f
m
0
=
d
dt
v . . (6.60)
Obtemos entao,
v =

f
m
0
t +v
0
. (6.61)
Isto nos conduz a duas rela coes:
v
x
=
0
v
0
, v
y
=
f
m
0
t . (6.62)
Elevando ao quadrado as duas expressoes e adicionando-as, obtemos

2
v
2
=
0
v
0
2
+
0
2
t
2
,
0
2
=
f
2
m
0
2
. (6.63)
Esta ultima equa cao, nos permite obter em termos de t:
=
_
1 +

0
v
0
2
+
0
2
t
2
c
2
. (6.64)
Inserindo (6.64) nas das equacoes apresentadas em (6.62), obtemos
v
x
=

0
v
0
_
1 +

0
v
0
2
+
0
2
t
2
c
2
, (6.65)
v
y
=

0
t
_
1 +

0
v
0
2
+
0
2
t
2
c
2
. (6.66)
111
Observemos que no limite t , temos v
x
0 e v
y
c, o que quer dizer que
a partcula se desloca com velocidade praticamente igual `a da luz na direcao y,
em relacao ao que a velocidade na direcao x se torna desprezvel.
Estas rela coes podem ainda serem integradas, fornecendo x e y em fun cao
de t:
x(t) =
v
0
c

0
sinh
1
_

0
t
_
c
2
+ v
2
0
_
, (6.67)
y(t) =
c
2

0
_
_
1 +

0
v
2
0
+
2
0
t
2
c
2

_
1 +

0
v
2
0
c
2
_
, (6.68)
o que nos fornece a rela cao impcita,
x =
v
0
c

0
sinh
1
_
y
2
1
_
. (6.69)
Esta relacao pode ser comparada com sua equivalente newtoniana,
x = (6.70)
Note-se que no limite em que
v
c
0, as duas relacoes coincidem.
6.5.3 Partcula carregada em movimento sob a acao de um
campo magnetico uniforme
Suponhamos uma partcula de massa de repouso m
0
e carga q que se move com
velocidade v perpendicular a um campo magnetico estatico

B. Suponhamos
entao que
v = v
x

i + v
y

j ,

B = B

k . (6.71)
A lei de forca se escreve

f = qv

B = q(v
x

j + v
y

i)B . (6.72)
Usando as rela coes relativistas deduzidas anteriormente, temos
m
0
d
dt
(v)v = q(v
x

j + v
y

i)B .. (6.73)
Por outro lado, devido `a ortogonalidade entre v e

B em qualquer instante de
tempo, temos que

f.v =
dE
dt
=
d
dt
m
0
(v)c
2
= 0 . (6.74)
112
Logo, (v) = constante, implicando que o modulo da velocidade permanece
constante.
Desta forma, podemos entao escrever
v
x
=
2
v
y
, v
y
=
2
v
x
, (6.75)
onde
2
=
qB
m
0
(v)
. Estas equa coes podem ser reduzidas a uma unica equacao:
v
i
+
2
v
i
= 0 , i = x, y . (6.76)
A solucao entao se escreve como,
v
x
= v
x0
cos(t) , v
y
= v
y0
cos(t) , (6.77)
onde a fase foi escolhida de forma a satisfazer as condicoes iniciais. Integrando
novamente para obter x e y, temos
x(t) =
v
x0

sin(t) , y(t) =
v
y0

sin(t) (6.78)
onde xamos que a partcula no tempo t = 0 se encontrava na origem. Desta
forma, a partcula descreve um crculo de raio
r =
_
x
2
+ y
2
=
v
0

, v
0
=
_
v
2
x0
+ v
2
y0
. (6.79)
A expressao newtoniana correspondente a este caso e identica `a obtida an-
teriormente, com a unica diferenca que
n
=
qB
m
0
. O parametro e conhecido
como frequencia de cclotron. Assim, a frequencia de cclotron relativista e me-
nor que a newtoniana, devido `a presenca do fator (v) no denominador, e o raio
do crculo descrito pela partcula e maior.
6.5.4 O movimento da orbita dos planetas. Precessao das
orbitas elpticas
Inicialmente vamos estabelecer o contexto do problema atraves da analise new-
toniana. Neste caso, temos que

F = m
0
a a = G
M
r
2
r , (6.80)
113
ja que

F = G
Mm
0
r
2
r. A acelera cao escreve-se, em coordenadas esfericas,
a = ( r r

2
) r + (r

+ 2 r

. (6.81)
Inserindo esta rela cao em (6.80), obtem-se duas equacoes:
r r

2
= G
M
r
2
, (6.82)
r

+ 2

= 0 . (6.83)
A ultima equa cao pode ser integrada, fornecendo
r
2

= l = constante (6.84)
o que implica que o momento angular e conservado, fato bem conhecido para o
caso da forca central. Observe-se que a quantidade l e, na verdade, o momento
angular por unidade de massa.
Reinserindo este ultimo resultado na primeira equacao, obtem-se
r
l
2
r
3
= G
M
r
2
. (6.85)
Agora, torna-se interessante realizar uma mudanca de variavel, de t para .
Desta forma, escrevemos
r = r

l
r
2
, (6.86)
r =
d
dt
_
r

l
r
2
_
=
l
2
r
2
_
r

r
2
2
r

2
r
3
_
. (6.87)
Assim, a equa cao (6.85) assume a forma:
r

r
2
2
r
2
r
3

1
r
= G
M
l
2
. (6.88)
Ou ainda:
_
1
r
_

+
1
r
= G
M
l
2
. (6.89)
Denindo u =
1
r
, esta equa cao admite uma forma simples:
u

+ u = G
M
l
2
. (6.90)
Tem-se agora uma equacao diferencial de segunda ordem nao homogenea, do
tipo oscilador harmonico. Neste caso, temos que procurar a solucao geral da
114
equacao homogenea correspondente e uma solu cao particular da nao homogenea.
O resultado nal escreve-se
u = Acos + G
M
l
2
, (6.91)
que, em termos de r, resulta em
r =
1
Acos + G
M
l
2
. (6.92)
A solu cao (6.92) corresponde a uma orbita parabolica, hiperbolica ou elptica,
dependendo se A e igual, menor, ou maior que G
M
l
2
. Utilizando a expressao da
energia E =
1
2
m
0
v
2
+G
Mm
0
r
, que e uma constante para a solucao acima (o que
era de se esperar pois a forca central e conservativa), esses casos correspondem
a energia zero, positiva e negativa, respectivamente.
Para o caso de energia negativa, (A > G
M
l
2
) temos uma orbita elptica:
a = 0 o raio da orbita e mnimo (perielio), crescendo ate atingir o valor
maximo em = (afelio), e decrescendo novamente ate o valor mnimo em
= 2. Logo, o perielio ocorre sempre no mesmo lugar, ao m de uma volta
completa. Entretanto, nao e isto que se observa, e os planetas descrevem orbitas
elpticas cujo perielio acusa um pequeno avan co a cada volta completa. O
caso mais notorio e o de Merc urio, cujo perielio avan ca a uma taxa de 42

de
arco por seculo. Uma anomalia pequena, mas detectavel, em relacao `a solu cao
newtoniana apresentada anteriormente.
A anomalia observada nas orbitas elpticas dos planetas, devido ao avanco
do perielio, pode ser em princpio explicada atraves da perturbacao que a orbita
de um dado planeta sofre devido `a presen ca dos demais planetas. Anal, o
problema tratado acima e um tpico problema de dois corpos, mas na verdade
a orbita de um planeta no sistema solar e um problema de N corpos
1
, ja que
um planeta descreve sua trajetoria sob a a cao nao apenas do sol, mas tambem
dos demais oito planetas
2
. Isto e feito atraves de tecnicas perturbativas. Entre-
tanto, mesmo tal analise, mais completa e detalhada, consegue explicar apenas
1
O problema de dois corpos e perfeitamente resol uvel em mec anica newtoniana. Quando
um dado problema envolve mais que dois corpos, e em princpio nao admite solucao exata, ele
e denominado problema de N corpos
2
Para sermos mais precisos deveramos levar tambem em conta a presenca dos satelites no
caso de alguns planetas, dos aster oides, etc.
115
parcialmente o avan co do perielio dos planetas. Para o caso mais extremo, que
e o de Merc urio, o avanco do perielio e de aproximadamente 550

de arco por
seculo; mas somente cerca de 510

de arco por seculo podem ser explicados


como devidos aos efeitos dos outros planetas; algo como 40

de arco por seculo


resistem a qualquer explicacao utilizando a mecanica newtoniana
3
.

E um efeito
pequeno, mas perfeitamente detectavel e que esta alem da margem de erro das
tecnicas perturbativas empregadas.
6.6 Conservacao do momento
3
Foi aventada a possibilidade que este efeito se deveria ao achatamento do sol: se o sol
for achatado, ele tera um momento quadropolar que gera uma precessao do perielio. Mas os
parametros de achatamento do sol conhecidos nao sao capazes de gerar um efeito da magnitude
observada
116
Captulo 7
Eletromagnetismo
7.1 Introducao
A teoria Eletromagnetica de Maxwell e, por ela propria, relativista. Isto foi
expresso anteriormente atraves do segundo axioma da Relatividade Restrita,
ao se estabelecer que a velocidade da luz c e uma constante universal, com
o mesmo valor em todos referenciais inerciais. Nosso objetivo agora, sera o
de explorar a natureza relativista do Eletromagnetismo. Para tanto, tere-
mos que levar em conta alguns fatos. O primeiro, e que os campos eletrico
e magneticos, estao intimamente relacionados. Isto transparece das equa coes de
Maxwell pelo fato que varia coes no tempo no campo eletrico (magnetico) geram
campo magnetico (eletrico), sugerindo que ambos devem ser manifestacoes de
um mesmo fenomeno, e que ambos os campos devem ser acomodados em uma
mesma estrutura matematica. Em segundo lugar, as fontes dos campos eletrico
e magnetico sao as cargas e o vetor corrente tridimensional. Estas fontes podem
ser facilmente acomodadas em um quadrivetor, que devera estar relacionado
com a estrutura matematica que representa os campos.
Nosso objetivo sera, em primeiro lugar, reescrever as equa coes de Maxwell
em uma forma manifestamente covariante. Queremos dizer com isto que elas
deverao ser postas em uma estrutura onde a covariancia pelas transforma coes
de Lorentz seja evidente. As equacoes de Maxwell, na sua forma usual, possuem
117
esta invariancia, mas a notacao vetorial tridimensional empregada obscurece este
fato; um longo calculo e exigido para se demonstrar a invariancia relativista.
Um aspecto fundamental consiste em reescrever as equacoes de Maxwell
em termos de potenciais. Isto foi feito anteriormente, mas de uma forma nao
covariante. Reanalisaremos este problema, considerando a estrutura tensorial.
Isto nos conduz a uma analise simples do problema das ondas eletromagneticas,
que serao estudadas com mais detalhes.
Em seguida, exploraremos a natureza tensorial do eletromagnetismo para
construir escalares, grandezas que guardam seu valor em qualquer referencial
inercial. Posteriormente, estudaremos alguns problemas simples de eletrodinamica,
fazendo uso de sua estrutura relativista. Em particular, estudaremos a for ca de
Lorentz, e o campo criado por cargas em movimento, onde o fato que o campo
se propaga com velocidade nita, igual a c, sera levado em conta. Isto levara
aos potenciais de Lienard-Wichter, o que permitira determinar a expressao para
a energia irradiada por uma carga acelerada.
7.2 As Equacoes de Maxwell
As equacoes de Maxwell relacionam os campos eletrico e magnetico entre si, e
com as fontes, cargas e correntes. Elas se escrevem da seguinte forma:
.

E =

0
; (7.1)
.

B = 0 ; (7.2)


E =

B
t
; (7.3)


B =
0

j +
0

E
t
. (7.4)
A rela cao de compatibilidade entre elas (por exemplo, a divergencia de (2.30
combinada com a derivada parcial em relacao ao tempo de (7.1)) nos conduz `a
equacao da continuidade:

t
+.

j = 0 . (7.5)
As grandezas fundamentais sao os vetores campo eletrico e magnetico e, no que
diz respeito `as fontes, a densidade de carga e o vetor densidade de corrente.
118
Estes ultimos possuem quatro componentes no total e podem ser representados
por um quadri-vetor. Se levarmos em conta a covariancia pelas transformacoes
de Lorentz, deveremos escrever o vetor quadri-corrente como
J

=
0
v

, (7.6)
onde v

= (c, v). Logo,


J

= (c,

j) . (7.7)
O fator revela que a densidade de carga, e consquentemente a densidade de
corrente, sao afetadas quando se passa de um referencial inercial a outro, devido
`a contra cao das distancias.
Os vetores campo eletrico e magnetico tem no total 6 componentes. Elas nao
podem ser acomodadas em um quadri-vetor, i.e., em um tensor de primeira or-
dem, como a densidade e a corrente. Um tensor de segunda ordem, carregando
dois ndices, contem em princpio 16 componentes. Se ele for simetrico, ele tera
dez componentes, e se ele for anti-simetrico, ele tera 6 componentes. Somos
conduzidos assim a pensar que os campos eletrico e magnetico podem ser aco-
modados em um tensor anti-simetrico de segunda ordem. A questao consiste em
como construir este tensor anti-simetrico de segunda ordem, identicando suas
componentes com as componentes dos campos eletrico e magnetico de modo a
satisfazer as equa coes de Maxwell escritas anteriormente.
Como ja vimos, as equacoes de Maxwell homogeneas, (2.28,2.29) permitem
escrever os campos eletrico e magnetico em termos de grandezas auxiliares, os
potencias vetor e escalar:

B =

A , (7.8)

E =


A
t
. (7.9)
Os campos eletrico e magnetico assim obtidos sao invariantes pelas transformacoes
de calibre,

A

A + , (7.10)

1
c

t
. (7.11)
Podemos partir de uma observacao simples: os potenciais eletromagneticos sao
um vetor e um escalar, totalizando quatro componentes. A partir deles podemos
119
pensar em construir um quadri-vetor. Vamos considerar entao o seguinte quadri-
vetor,
A

= (, c

A) . (7.12)
O fator c foi introduzido por razoes dimensionais. Observemos que os campos
sao obtidos a partir dos potenciais por processo de deriva cao. Como desejamos
identicar os campos como componentes de um tensor anti-simetrico de segunda
ordem, e que seja construdo a partir dos potenciais, temos uma escolha natural
para a expressao que relaciona os potenciais ao tensor anti-simetrico de segunda
ordem, que denotamos F

:
F

. (7.13)
Observe-se que o tensor F

foi denido covariante, enquanto o quadri-vetor po-


tencial A

foi denido contravariante. Logo, nas expressoes acima conectando


o tensor F

aos potenciais A

, deveremos considerar que A

= (, c

A). Ob-
viamente, temos que
F

= F

. (7.14)
O nosso problema agora consiste em determinar as componentes deste tensor
de segunda ordem. Temos
F
0i
=
0
A
i

i
A
0
= (


A
t
)
i
()
i
= E
i
, (7.15)
F
12
=
1
A
2

2
A
1
=
A
1
x
2

A
2
x
1
= (

A)
3
= B
3
, (7.16)
F
23
=
2
A
3

3
A
2
=
A
3
x
2

A
2
x
3
= (

A)
1
= B
1
, (7.17)
F
31
=
3
A
1

1
A
3
=
A
1
x
3

A
3
x
1
= (

A)
2
= B
2
. (7.18)
Devido `a anti-simetria do tensor F

, temos F
i0
= E
1
, F
21
= B
3
, F
32
= B
1
,
F
13
= B
2
. Logo, o tensor F

pode ser representado pela matriz,


F

=
_
_
_
_
_
_
0 E
x
E
y
E
z
E
x
0 cB
z
cB
y
E
y
cB
z
0 cB
x
E
z
cB
y
cB
x
0
_
_
_
_
_
_
(7.19)
Esse tensor contem as componentes dos campos eletrico e magnetico.
120
A forma contravariante do tensor F

(que daqui por diante denominado ten-


sor eletromagnetico ou tensor de Maxwell) dada por F

, escreve-
se
F

=
_
_
_
_
_
_
0 E
x
E
y
E
z
E
x
0 cB
z
cB
y
E
y
cB
z
0 cB
x
E
z
cB
y
cB
x
0
_
_
_
_
_
_
(7.20)
As equa coes de Maxwell envolvem derivadas dos campos que, em duas delas,
estao conectadas com os termos de fonte. Desta forma, podemos supor que as
duas equacoes de Maxwell nao-homogeneas podem ser escritas como
F

,
= kJ

, (7.21)
onde a vrgula denota derivada com rela cao `as coordenadas x

, e k e uma
constante a ser determinada.
Podemos desenvolver esta expressao para os casos = 0 e = i:
= 0:

0
F
00
+
i
F
i0
= kJ
0
,

i
F
i0
= kc . (7.22)
A compara cao com a primeira das equa coes de Maxwell e o fato que F
i0
=
E
i
permitem escrever k =
1
c
0
.
= i:

0
F
0i
+
j
F
ji
= kJ
i
,
E
i
ct
+
F
ij

x
j
= k

j . (7.23)
Desenvolvendo esta expressao, observamos que a quarta equacao de Mawxell e
reproduzida se usarmos F
12
= cB
3
, F
31
= cB
2
e F
23
= cB
1
.
Pode-se, a partir do tensor F

, obter outro tensor de segunda ordem anti-


simetrico, utilizando-se o tensor completamente anti-simetrico de Levi-Civita a
quatro dimensoes:

=
1
2

, (7.24)
121
onde
0123
= 1 e qualquer permuta cao de dois ndices conduz a uma mudanca
de sinal.

F

e conhecido como tensor eletromagnetico dual. Calculo direto


nos permite escrever as matrizes associadas a

F

e a

F

=
_
_
_
_
_
_
0 cB
x
cB
y
cB
z
cB
x
0 E
z
E
y
cB
y
E
z
0 E
x
cB
z
E
y
E
x
0
_
_
_
_
_
_
, (7.25)

=
_
_
_
_
_
_
0 cB
x
cB
y
cB
z
cB
x
0 E
z
E
y
cB
y
E
z
0 E
x
cB
z
E
y
E
x
0
_
_
_
_
_
_
. (7.26)
A partir das expressoes acima, podemos observar que a passagem do tensor
eletromagnetico F

ao seu dual implica nas substituicoes



E cB e c

B

E.
As duas equa coes de Maxwell homogeneas podem ser obtidas de

= 0 , (7.27)
como pode ser vericado usando os mesmos passos que no caso anterior das
equacoes com fonte. Assim, as equa coes de Maxwell passam a ser escritas como,

=
J

0
c
, (7.28)

= 0 . (7.29)
Derivando a equa cao (7.28) em relacao `a coordenada , e lembrando que

=
0 devido `a anti-simetria do tensor eletromagnetico, obtemos

= 0 . (7.30)
A equacao (7.30) expressa de forma covariante a equacao da continuidade.
Desta forma, conseguimos construir um tensor eletromagetico, anti-simetrico,
de segunda ordem, que resume as equacoes de Maxwell em duas equacoes ten-
soriais, consequentemente covariantes pelas transforma coes de Lorentz, que sao
(7.28,7.29). Alem disto, a propria construcao do tensor eletromagnetico mostra
como ele se relaciona com o potencial A

dado por (7.12). As fonte sao dadas


pelo quadri-vetor (7.7).
122
Resta-nos agora tornar covariante as transformacoes de calibre (7.10,7.11).
Isto pode ser obtido escrevendo-se
A

= A

. (7.31)
O calibre de Lorentz assume a forma

=
1
c

t
+ c.

A = 0 . (7.32)
Desta forma, todas as relacoes fundamentais do eletromagnetismo de Maxwell
estao escritas em forma tensorial, manifestamente covariante.
7.3 Leis de transformacao para os campos eletrico
e magnetico
Na passagem de um referencial inercial S para um referencial S

, que se move em
relacao a S com velocidade constante V que consideramos, por simplicidade, pa-
ralela ao eixo dos x, os campos eletrico e magnetico devem ser expressos de forma
diferente em um referencial e no outro. O fato que o tensor eletromagnetico F

obedece `a leis de transformacao usuais de um tensor, nos dira exatamente como


devemos escrever os campos

E

e

B

, medidos no referencial S

, em funcao dos
campos

E,

B e da velocidade relativa entre os dois referenciais V .

E obvio que os campos nos referenciais S e S

nao devem ter as mesmas ex-


pressoes. Por exemplo, uma carga em repouso no referencial S cria apenas um
campo eletrico; no referencial S

esta carga tera uma velocidade V e, alem do


campo eletrico, ela criara tambem campo magnetico. Mas, precisamos estabele-
cer exatamente como isto ocorre, nao apenas para esta situacao, relativamente
trivial, como para situacoes mais gerais. A covariancia das equa coes de Maxwell,
em particular do tensor eletromagnetico, pelas transforma coes de Lorentz nos
conduzira nesta tarefa.
O tensor eletromagnetico F

no referencial S

se escreve em termos do
tensor eletromagnetico F

no referencial S como
F

, (7.33)
123
onde, como antes,

representa a matriz da transformacao de Lorentz. Pode-


mos entao calcular as diversas componentes do tensor F

. Para a componente
F

01
temos
F

01
= E

x
=

1
F

=
0
0

1
1
F
01
+
1
0

0
1
F
10
=
2
E
x

V
2
c
2
E
x
= E
x
, (7.34)
onde =
1

1
V
2
c
2
e o fator de Lorentz. As componentes F

02
= E

y
e F

03
= E

z
tem comportamento similar. Assim, apresentamos apenas o caculo para uma
delas:
F

02
= E

y
=

2
F

=
0
0

2
2
F
02
+
2
0

0
2
F
20
+
1
0

2
2
F
12
= E
y
+
V
c
cB
z
= (E
y
+ V B
z
) . (7.35)
Repetindo o calculo para a componente F

03
, obtem-se
E

z
= (E
z
V B
y
) . (7.36)
As componentes do campo magnetico se calculam de forma similar. A com-
ponente F

32
= cB

x
se apresenta como
F

32
= cB

x
=

2
F

=
3
3

2
2
F
32
= cB
x
. (7.37)
Para a componente F

13
= cB

y
obtem-se
F

13
= cB

y
=

3
F

=
0
1

3
3
F
03
+
1
1

3
3
F
13
=
V
c
E
z
+ cB
y
= (cB
y

V
c
E
z
) , (7.38)
enquanto para a componente F

21
se escreve
cB

y
= (cB
y
+
V
c
E
z
) . (7.39)
Resumindo, as expressoes para as transforma coes dos campos eletrico e magnetico
se escrevem como
E

x
= E
x
, B

x
= B
x
, (7.40)
E

y
= (E
y
+ V B
z
) , B

y
= (B
y

V
c
2
E
z
) , (7.41)
E

z
= (E
z
V B
x
) , B

z
= (B
z
+
V
c
2
E
x
. (7.42)
124
Estas expressoes podem ser reescritas de uma forma mais compacta lembrando-
se que a velocidade V entre os referenciais S e S

esta orientada ao longo do


eixo x. Uma inspe cao direta das expressoes (7.40,7.41,7.42) revela que, vetori-
almente, elas podem ser escritas como

=

E

,

B

=

B

, (7.43)

= (E

V

B) ,

B

= (

V
c
2


E) , (7.44)
onde os smbolos | e denotam as direcoes paralela e perpendicular `a velocidade
relativa entre os dois referenciais

V .
7.4 Aplicacao: a forca de Lorentz
De posse das leis de transformacao para o campo eletrico e magnetico, e uti-
lizando tambem as leis de transforma cao para a quadri-for ca, podemos fazer
uma importante aplicacao: deduzir a lei de forca de Lorentz a partir da lei de
forca eletrica devido a um campo

E que age sobre uma carga. Esta aplica cao
e particularmente interessante pois normalmente, vista como uma teoria tri-
dimensional, e ignorando a sua natureza relativista, o eletromagnetismo seria
obrigado a considerar a for ca de Lorentz como uma expressao emprica. Consi-
derando a estrutura relativista do eletromagnetismo, a forca de Lorentz aparece
como consequencia da forca que age sobre uma carga em repouso devido a sua
interacao com um campo eletrico.
Para vericar isto, considere uma carga q sobre a qual age um campo eletrico

E em um dado referencial S onde esta carga esteja em repouso:

f = q

E . (7.45)
As expressoes que relacionam as componentes da forca

f agindo sobre um dado
corpo medidas em S com as componentes da for ca

f

medida em S

sao

+

V

f

c
2
1 +
v

V
c
2
, (7.46)

(1 +
v

V
c
2
)
, (7.47)
125
onde v

e a velocidade deste corpo medida em S

e

V e a velocidade relativa
entre os dois referenciais. Como antes, a for ca e separada em suas componentes
paralela e perpendicular `a velocidade relativa

V . Como a carga se encontrava
em repouso em S, v

V , o que reduz as expressoes acima para


V

f

V
c
2
1

V

V
c
2
=

V
2
c
2
1
V
2
c
2
=

f

, (7.48)

(1
V
2
c
2
)
=

, (7.49)
onde usamos o fato que

V

f

V =

f

V
2
devido `a propria denicao de

f

como
sendo a componente de

f

paralela a

V .
A tarefa agora consiste em inserir (7.48,7.49) na expressao (7.45) e utilizar
as transformacoes (7.43,7.59) inversas. Para a componente paralela encontra-se

=

f

= q

= q

. (7.50)
Para a componente perpendicular, tem-se

= q

= q(

+

V

B

)

f

= q(

+

V

B

) . (7.51)
Utilizando agora as duas expressoes acima, obtem-se

+

f

=

f

= q

+

E

+

V

B

= q

+

V

B . (7.52)
Assim, um observador no referencial S

vera a carga q que se move com veloci-


dade

V em uma regiao onde existem campos eletrico e magnetico

E

e

B

sendo
submetida `a for ca de Lorentz.
A deducao da lei de forca que age sobre uma carga q em movimento subme-
tida a campos eletrico e magnetico, a forca de Lorentz, e um exemplo notavel de
como a exploracao da natureza intrisicamente relativista do eletromagnetismo
pode lancar luz sobre expressoes que, vistas do ponto de vista tridimensional e
nao relativista, devem ser obtidas a partir da experiencia, empiricamente.
7.5 Invariantes eletromagneticos
Como ja foi discutido no captulo 3, escalares construdos a partir das quantida-
des fsicas fundamentais desempenham um papel importante em Relatividade
126
Restrita. Um dos aspectos essenciais da Relatividade Restrita reside na co-
variancia, isto e, na invari ancia das leis fundamentais por transformacoes de
Lorentz. Entretanto, ao resolver um problema especco, escolhe-se um referen-
cial particular. Na analise dos resultados obtidos neste referencial e fundamental
disting uir entre o que e especco ao referencial empregado, e o que independe
do referencial. Uma forma de realizar esta distincao e atraves do estudo dos
escalares (logo, invariantes por mudan ca de referencial) construdos a partir das
quantidades sicamente relevantes. Veremos uma aplica cao concreta disto para
o caso do eletromagnetismo.
As quantidades fundamentais do eletromagnetismo expressas na sua for-
mulacao manifestamente covariante a quatro dimenoes sao o tensor eletromagnetico
F

e o termo de fonte representado pela quadri-corrente j

. Com o termo de
fonte, e possvel formar o escalar j
2
= j

. Usando a expressao explcita para


a quadri-corrente (7.6), pode-se determinar j
2
:
j
2
= j

= j
0
2

i=1
j
i
2
=
2
(c
2

2
0
v
2

2
0
) = c
2

2
0
. (7.53)
Esta expressao apenas nos diz que j
2
esta relacionada com a densidade de carga
no referencial proprio do sistema.
Mais relevantes sao as quantidades que podem ser construdas a partir do
tensor eletromagnetico F

. Na verdade, como foi visto anterioremente, o for-


malismo manifestamente covariante do eletromagnetismo emprega tambem o
tensor eletromagnetico dual

F

. Pode-se construir, em princpio, tres quan-


tidades escalares com o tensor eletromagnetico e o seu dual:
I
1
= F

, I
2
=

F

, I
3
=

F

. (7.54)
Usando a deni cao do tensor dual

F

, e o fato que

, pode-se mostrar que I


3
= 2I
1
. Assim, os unicos invariantes real-
mente independentes sao I
1
e I
2
.
Podemos calcular os invariantes simplesmente atraves da multiplicacao das
matrizes que representam o tensor eletromagnetico e o seu dual. Por exemplo,
127
construindo a matrix M

= F

, tem-se que I
1
= M

= Tr(M

). Assim,
I
1
= Tr
_
_
_
_
_
_
0 E
x
E
y
E
z
E
x
0 cB
z
cB
y
E
y
cB
z
0 cB
x
E
z
cB
y
cB
x
0
_
_
_
_
_
_
_
_
_
_
_
_
0 E
x
E
y
E
z
E
x
0 cB
z
cB
y
E
y
cB
z
0 cB
x
E
z
cB
y
cB
x
0
_
_
_
_
_
_
= 2(E
2
c
2
B
2
) . (7.55)
Da mesma forma, I
2
= Tr(N

), sendo N

=

F

. O calculo explcito de
I
2
conduz a
I
1
= Tr
_
_
_
_
_
_
0 cB
x
cB
y
cB
z
cB
x
0 E
z
E
y
cB
y
E
z
0 E
x
cB
z
E
y
E
x
0
_
_
_
_
_
_
_
_
_
_
_
_
0 E
x
E
y
E
z
E
x
0 cB
z
cB
y
E
y
cB
z
0 cB
x
E
z
cB
y
cB
x
0
_
_
_
_
_
_
= 4c

E

B . (7.56)
Qual e o signicado e a utilidade destes invariantes? O valor numerico destes
invariantes e o mesmo em qualquer sistema de referencia, exatamente porque
tratam-se de invariantes. Sabe-se que em alguns referenciais uma conguracao
de fontes conduz `a existencia apenas de campo eletrico, ao passo que uma outra
conguracao implica a existencia apenas de campo magnetico. Um exemplo do
primeiro caso e uma carga q em repouso, enquanto um exemplo do segundo
caso e uma corrente atravessando um condutor que e globalmente neutro eletri-
camente. Em outros referenciais, estas congura coes levarao a uma combinacao
de campos eletrico e magnetico, devido `as leis de transformacao de campos es-
critas anteriormente. Inversamente, os valores dos invariantes I
1
e I
2
permitem
saber se existe, para uma dada conguracao de campos eletrico e magnetico,
um referencial onde so existira o campo eletrico ou o campo magnetico. Supo-
nhamos, por exemplo, que I
1
> 0 e I
2
= 0. Neste caso, sempre sera possvel
encontrar um referencial onde existira apenas campo eletrico. Por outro lado,
se I
1
< 0 e I
2
= 0, existe um referencial onde apenas ocorrera a presenca de
campo magnetico. No entanto, se I
2
,= 0, em todos os referenciais havera cam-
pos eletrico e magnetico, independentemente do valor de I
1
. O caso particular
128
onde I
1
= I
2
= 0 corresponde a uma onda eletromagnetica: isto implica E = cB
e

E

B, o que, de fato, caracteriza uma onda eletromagnetica.
Neste sentido, por exemplo, o conhecimento dos invariantes, obtido a partir
dos valores dos campos eletrico e magnetico, permite saber se existe uma carga
lquida diferente de zero (sempre havera campo eletrico), ou se a carga total e
nula (e possvel so se ter campo magnetico).
7.6 Exemplos de campos eletrico e magnetico
O calculo dos campos eletrico e magnetico para uma dada distribuicao de fon-
tes nao e, normalmente, uma tarefa simples. No eletromagnetismo classico,
tecnicas matematicas apuradas sao empregadas para se obter respostas a pro-
blemas `as vezes aparentemente simples. Em situacoes estaticas, a determina cao
dos campos eletrico e magnetico se passa da forma habitual, aparentemente
sem nenhuma considera cao relativista. A palavra aparentementefoi usada
porque, no fundo as equacoes de Maxwell sao essencialmente relativistas. En-
tretanto, esta natureza relativista se manifesta de forma mais clara em situa coes
dinamicas, onde a congura cao de campos muda com o tempo. Neste caso, se
se quer manter a estrutura relativista, e preciso ter em mente que os sinais,
inclusive a mudanca do valor do campo em um dado ponto a uma distancia r
de uma carga em movimento, se propagam com a velocidade da luz.
Mesmo que o emprego da relatividade restrita possa conduzir a situa coes ex-
tremamente complexas no estudo de problemas de eletrodinamica, o fato que as
equacoes relativistas em geral, e as do eletromagnetismo em particular, sao cova-
riantes, pode frequentemente simplicar a tarefa de determinar as conguracoes
de campos: calcula-se o campo em um dado referencial, onde o problema adquire
uma forma mais simples, e depois transpoe-se o resultado para o referencial em
que se pretende conhecer aquela congura cao. O fato de que sabemos como
expressar os campos eletrico e magnetico em um referencial S em funcao des-
tes mesmos campos medidos no referencial S

e, obviamente, crucial para que


possamos assim proceder. Daremos a seguir dois exemplos deste procedimento,
um envolvendo essencialmente o campo eletrico e outro o campo magnetico.
129
7.6.1 O campo de uma carga eletrica em movimento
Considere-se uma carga eletrica pontual q que se move com velocidade constante
v em um dado referencial S. Ja que as equacoes sao invariantes por uma rotacao
dos eixos coordenados espaciais, usaremos este fato para xar que a partcula se
move retilineamente ao longo do eixo x: v = v. Normalmente, este problema
apresenta uma diculdade nao trivial: a carga em movimento criara campos
eletrico e magnetico em um dado ponto r, cujo valor em um dado tempo t e
devido `a posicao da carga em um momento t

= t
r
c
anterior.
Entretanto, este problema pode ser tratado de uma forma relativamente
simples se ele e incialmente analisado em um referencial S

onde a carga esta


em repouso, sendo depois os resultados transpostos para o referencial S atraves
das leis de transforma coes para os campo eletrico e magnetico determinadas
anteriormente.
No referencial S

, que se move em rela cao a S com velocidade



V = v = v,
a carga q encontra-se em repouso. Podemos supor sem perda de generalidade
que a carga q encontra-se na origem de S

. Neste caso os campos eletrico e


magnetico em um dado ponto distante r

da carga, assumem a forma

=
1
4
0
q
r

3
r

,

B

= 0 . (7.57)
Utilizando as leis de transforma cao para os campos eletrico e magnetico
(7.43,7.59), podemos escrever

E
x
=

E
x
, E
y
= E

y
, E
z
= E

z
, (7.58)
B
x
= 0 , B
y
= (V )
V
c
2
E

z
, B
z
= (V )
V
c
2
E

y
. (7.59)
Deve-se observar que
r

2
= x

2
+ y

2
+ z

2
= (V )
2
(x V t)
2
+ y
2
+ z
2
. (7.60)
Desta forma, podemos escrever as expressao nais para os campos eletrico e
magnetico para uma carga em movimento uniforme:
E
x
=
1
4
0
(V )
q(x V t)
[(V )
2
(x V t)
2
+ y
2
+ z
2
]
3/2
, (7.61)
E
y
=
1
4
0
(V )
qy
[(V )
2
(x V t)
2
+ y
2
+ z
2
]
3/2
, (7.62)
130
E
z
=
1
4
0
(V )
qz
[(V )
2
(x V t)
2
+ y
2
+ z
2
]
3/2
, (7.63)
B
x
= 0 , (7.64)
B
y
=
1
4
0
(V )
V
c
2
qy
[(V )
2
(x V t)
2
+ y
2
+ z
2
]
3/2
, (7.65)
B
z
=
1
4
0
(V )
V
c
2
qy
[(V )
2
(x V t)
2
+ y
2
+ z
2
]
3/2
. (7.66)
No limite nao-relativista, tem-se que (V ) 1, o que implica que as rela coes
acima tomam a forma
E
x

1
4
0
q(x V t)
[(x V t)
2
+ y
2
+ z
2
]
3/2
, (7.67)
E
y

1
4
0
qy
[(x V t)
2
+ y
2
+ z
2
]
3/2
, (7.68)
E
z

1
4
0
qz
[(x V t)
2
+ y
2
+ z
2
]
3/2
, (7.69)
B
x
= 0 , (7.70)
B
y


0
4
qV y
[(x V t)
2
+ y
2
+ z
2
]
3/2
, (7.71)
B
z

0
4
qV y
[(x V t)
2
+ y
2
+ z
2
]
3/2
. (7.72)
As expressoes para o campo magnetico tomam a forma conhecida para o caso
de uma corrente criada por uma carga pontual, com a propaga cao do campo
sendo considerada como praticamente instantanea, como era de se esperar.
7.6.2 O campo criado por uma corrente uniforme em um
o retilneo eletricamente neutro
Vamos considerar agora um o relnio percorrido por uma corrente uniforme i. O
o e eletricamente neutro. Neste caso tem-se um referencial S onde a densidade
de cargas positivas e negativas e a mesma; consequentemente, o campo eletrico
neste referencial e nulo. Tem-se apenas o campo magnetico que pode ser obtido
aplicando-se diretamente a lei de Amp`ere:

B =

0
4
i
r

, (7.73)
onde

e o vetor unitario associado `a coordenada .
131
No referencial S, as expressoes para os campos eletrico e magnetico sao as
seguintes:

=

E

= 0 , (7.74)

= 0 ,

B

=

0
4
i
r

, (7.75)
onde os termos paralelo e perpendicular referem-se `a direcao de propagacao da
corrente.
Vamos agora buscar as expressoes para os campos eletrico e magnetico em
um referencial S

que se move em relacao a S com velocidade constante V


orientada na mesma direcao e sentido que a corrente. Usando as expressoes
(7.43,7.59), obtemos
A Teoria MOND
132