Você está na página 1de 47

ORIGENS DA TEORIA DA RELATIVIDADE RESTRITA

Prof. Manoel Messias Ferreira JR (DEFIS-UFMA)

INTRODUÇÃO

Neste capítulo, estaremos voltados para a descrição das origens da teoria da relatividade
restrita (TRR), focalizando nos princípios físicos fundamentais envolvidos (natureza corpuscular e
ondulatória da luz, conceito de éter, detecção do movimento da Terra relativa ao éter, princípio da
relatividade). Uma vez apresentado o princípio da relatividade de Galileu, que estabelece a
indistinguibilidade entre o estado de repouso e de MRU (movimento retilíneo uniforme), abordaremos a
problemática da não invariância das equações de Maxwell sob as transformações de Galileu, o que
permitiria distinguir entre o estado de repouso e de MRU através de experimentos eletromagnéticos e
envolvendo luz. Desta forma, as teorias e experimentos para investigar a propagação da luz em meios
materiais, e suas conexões com o conceito de éter como referencial privilegiado para propagação da luz,
tornaram-se um tópico de estudo de 1ª relevância no cenário científico do século XIX. Foi neste século
que despontaram os problemas que direta e indiretamente levaram à formulação da TRR por A. Einstein,
em 1905, mais precisamente: a propagação da luz em meios materiais e a tentativa de usar tais teoria
para detectar o movimento da Terra relativo ao éter.

Temos por objetivo descrever e esclarecer a problemática fundamental que a TRR veio a
resolver, quando proposta por Einstein. A teoria da relatividade restrita começou a ser desenvolvida a
partir das tentativas de se encontrar uma eletrodinâmica satisfatória para os corpos em movimento, num
cenário dotado de éter (referencial privilegiado), para os quais deveria valer as transformadas de
coordenadas de Galileu. Veremos que muitas foram as tentativas de formular uma teoria que explicasse
o comportamento da luz em meios materiais em movimento, sendo a teoria de Lorentz para o elétron a
mais notória neste sentido. Ao mesmo tempo, tais teoria deveriam servir de alicerce para experimentos
que pretendiam detectar o movimento da Terra em relação a este referencial privilegiado. Foram destas
tentativas de detecção do éter e das teorias desenvolvidas para explicar a propagação da luz nos meios
materiais transparentes, que se formou um panorama físico intrincado, que levou à concepção da Teoria
da Relatividade Restrita. Neste capítulo faremos uma revisão das principais ideias que vigoravam no
século XVIII e XIX sobre a natureza da luz e do éter luminífero. Apresentaremos alguns dos experimentos
pioneiros realizados para detectar o éter (experimentos em 1ª ordem de v/c), assim como o decisivo
experimento de Michelson-Morley, o primeiro experimento de 2ª ordem em v/c. Discutiremos como os
teóricos do final do século XIX reagiram diante do resultado nulo do experimento de Michelson-Morley e
as famosas tentativas de “salvar” o éter. Finalizaremos apresentando a solução de Einstein para o grande
impasse teórico e experimental da indetectabilidade do éter.

1.1) Princípio da Relatividade de Galileu

O princípio da relatividade de Galileu estabelece que as leis da mecânica de Newton são as


mesmas (possuem a mesma forma matemática) em todos os referenciais inerciais. Tal invariância de
forma faz com que experimentos ou fenômenos mecânicos ocorram da mesma forma em um referencial
parado ou em MRU (movimento retilíneo uniforme), acarretando na indistinguibilidade entre o estado de
repouso e de MRU. Para entender como esse princípio e suas decorrências são estabelecidos, vamos
precisar comparar equações e leis físicas do ponto de vista de referenciais inerciais distintos. Para esse
propósito, é necessário escrever as famosas transformações de coordenadas de Galileu.
O primeiro passo para a descrição de um sistema físico é estabelecer um sistema de
referência 1, a partir do qual o fenômeno será observado e descrito. Considere o seguinte fenômeno

1Um sistema de referência é um conjunto de eixos coordenados, mutuamente ortogonais ou não, usado para atribuir
coordenadas à posição de partículas e eventos físicos. No caso do sistema cartesiano, os eixos são mutuamente
ortogonais. A atribuição de coordenadas é feita por tomando por base um padrão rígido de medida (escala
milimetrada), um relógio universal e as regras da geometria euclidiana. Um sistema de referência inercial é qualquer

1
físico: movimento de uma partícula ao longo do espaço. Para descrevê-lo de maneira precisa e
matematizada, é necessário atribuir coordenadas à posição da partícula em cada instante de tempo.
Considere a partícula P da Fig. 1, cuja posição no instante t é dada pelas coordenadas cartesianas
( x, y, z ) . Sendo assim, o acontecimento da partícula ocupar esta dada posição do espaço no instante t
pode ser descrito em termos de três coordenadas espaciais e o instante t, que na física newtoniana
funciona como um parâmetro 2. Veremos mais adiante, que na relatividade restrita de Einstein, este
acontecimento é denominado de evento, tendo um sentido mais amplo, uma vez que envolve tempo e
espaço numa só entidade.

P ( x, y , z )

y
x

Figura 1: Sistema de coordenadas cartesiano

De acordo com a lei da inércia, há dois estados indistinguíveis para um sistema de referência
inercial: repouso ou movimento retilíneo uniforme. Consideremos um sistema inercial S e um outro

sistema inercial S’, que se move com uma velocidade constante u em relação a S, ao longo dos eixos x
e x’, como mostra a figura abaixo:

Figura 2 – Sistemas inerciais de referência S e S’ em movimento relativo


Visto de S, o sistema S’ move-se na direção positiva do eixo-x com velocidade u .
Analogamente, visto de S’, o sistema S move-se na direção negativa do eixo-x com velocidade negativa,

− u . Ambos pontos de vista são válidos, e uma relação matemática de conversão destes pontos de vista

um que esteja em MRU ou repouso, ou seja, qualquer um onde seja válida a lei da inércia. Desprezando-se os efeitos
de aceleração devido à rotação e à translação, podemos considerar a Terra, aproximadamente, como um sistema de
referência inercial.
2
Na mecânica newtoniana o tempo é visto como um parâmetro (não é uma coordenada), uma vez que possui o
mesmo valor para todos os observadores e que as coordenadas espaciais podem ser escritas em sua função.

2
precisa ser obtida. Tal relação é exatamente a transformação de coordenadas do ponto P entre os
referenciais S e S'. O ponto P representa um acontecimento físico, cujas coordenadas medidas no
sistema S são ( x, y, z ) , enquanto que no sistema S’ estas estão dadas por ( x ', y ', z ') . As coordenadas
x , y e z dão a posição de P relativa à origem O, medidas pelo observador em S, no instante t (tempo
de ocorrência do fenômeno que o observador em S registra em seu relógio). Do mesmo modo, as
coordenadas x' , y ' e z ' relacionam a posição de P à origem O’, no mesmo instante t ' (medido pelo
relógio do observador inercial em S’), temos t ' = t , uma vez que o tempo é o mesmo em todos os
referenciais inerciais (tempo absoluto) 3. Por simplicidade, suponhamos que os relógios de cada
observador marquem zero no instante em que as origens dos sistemas O e O’ coincidam, ou seja, t = 0 .
Assim, determinaremos, a partir da Fig. 2, as relações entre as medidas feitas nos dois sistemas S e S’
para a posição do ponto P: x = ut + x' → x' = x − ut ,

 x '= x − ut ,

 y ' = y, (1.1)
 z ' = z,

às quais se soma t ' = t . Estas são as famosas transformações de coordenadas de Galileu, que
relacionam as medidas das coordenadas ( x, y, z ) do sistema S com as coordenadas ( x ', y ', z ' ),
medidas no sistema S’. Tais transformações permitem ver que intervalos de comprimento e intervalos de
tempo são absolutos na mecânica de Newton, isto é, tem o mesmo valor em todos os observadores
inerciais. Tendo o tempo o mesmo valor para todos os referenciais inercias, é óbvio que a duração de um
fenômeno (intervalo de tempo) será mesma para todos. Seja então o intervalo de tempo entre a
ocorrência de dois fenômenos P e Q, calculados no ref. S e no ref. S'. Desta maneira, podemos
escrever:

t 'Q − t ' P = t Q − t P . (1.2)

Para o caso do intervalo espacial, vamos considerar as extremidades A e B de uma barra em


repouso em relação ao sistema S, com coordenadas x A e x B . O sistema S’, em relação ao qual a barra

se move com velocidade − u , medirá as posições das extremidades como sendo x' A e x' B . De acordo
com as transformações galileanas, obtemos:

′B xB − ut B , x=
x= ′A x A − ut A ,
x′B − x′A = xB − ut B − x A + ut A → x′B − x′A = xB − x A − u ( t B − t A ) .

Como t A = t B , pois as duas extremidades são medidas no mesmo instante, obtemos como
resultado:

x′B − x′A = xB − x A , (1.3)

o que mostra que o intervalo de espaço é a mesmo em todos os observadores inerciais.


Das transformações de Galileu, podemos encontrar facilmente as transformações de velocidade
e aceleração do ponto P, caso o mesmo esteja em movimento no referencial S'. Podemos expressar a

3
Isto é uma conseqüência da velocidade de transmissão de informação ser suposta infinita na mecânica newtoniana.
Esta suposição constitui um dos graves problemas da mecânica newtoniana, uma vez que está relacionada a chamada
“ação à distância”, que pressupõe interação instantânea entre corpos separados por distâncias arbitrárias.

3
velocidade desta partícula, partindo do conjunto de eqs. (1.1), aplicando-se a derivação temporal da
posição da seguinte maneira:

dx' dx
x' = x − ut → = −u.
dt dt

dx ' dx '
Como t = t ' , temos = , o que leva a:
dt ' dt
′x vx − u .
v= (1.4)

Obtemos assim a fórmula clássica da adição de velocidades, sendo u a velocidade relativa entre os dois
sistemas de referência. Efetuando o mesmo procedimento para as componentes y e z , observamos
que tais componentes permanecem inalteradas, uma vez que são ortogonais à direção do movimento
relativo. Temos o seguinte conjunto de equações que representam as transformações de velocidades,
medidas nos sistemas S e S’:
′x vx − u ,
v=
v′y = v y , (1.5)
v′z = vz .
A partir das transformações de velocidades dadas acima, as transformação de aceleração
são obtidas por derivação direta:
 
{ax′ a=
= ′ a=
x , ay
′ az }
y , az ⇒ a'= a. (1.6)

 
Observe que foi usado du / dt = 0 , uma vez que u é constante.
Portanto, as componentes da aceleração não são afetadas pela velocidade relativa entre os
sistemas de referência, ou seja, pela mudança de referencial. A aceleração é a mesma em todos os
referenciais inerciais, mostrando que a variação de velocidade percebida por um dado referencial será a
mesma percebida por qualquer outro referencial inercial. Podemos assim afirmar que a aceleração é uma
quantidade absoluta na mecânica de Newton. Este é um resultado de fundamental relevância para o
estabelecimento do princípio da relatividade de Galileu.
Uma outra grandeza da Física Clássica que não é afetada pelo movimento relativo é a massa,
que também é igual para todos os observadores inerciais. Como a aceleração e a massa são invariantes,
 
podemos concluir que a segunda lei de Newton, que define força como F = ma , também é invariante
perante uma transformação de coordenadas. Isto significa que as leis de Newton (e da Mecânica
Clássica) são exatamente as mesmas (têm a mesma forma) em todos os sistemas inerciais, uma
conseqüência da sua invariância perante as transformações de Galileu. Portanto, se a segunda lei no
referencial S é
 
F = ma , (1.7A)

no referencial S' tal lei é escrita da mesma forma, ou seja:


 
F ′ = m′a′ . (1.7B)

Esta é uma lei covariante! A consequência imediata desta covariância é que todos os referenciais
inerciais comungam da mesma física e compartilham os mesmos resultados de experimentos ou
fenômenos mecânicos. Desta forma, um experimento realizado num referencial parado ou em um
referencial em MRU fornece os mesmos resultados e fenomenologia (no sentido que são regidos pelas
mesmas expressões matemáticas). Como exemplo podemos mencionar um corpo solto do alto do teto de
um vagão de trem em MRU, que cai em trajetória retilínea e com mesma função horária do ponto de vista

4
de um observador dentro do vagão, quando comparado com um corpo idêntico solto do teto de outro
vagão de trem parado rente à estação ferroviária (analisado desse referencial). Outro experimento
mecânico consiste em pendurar um pêndulo simples no teto do vagão do trem, e coloca-lo em pequenas
oscilações. O pêndulo oscilará com mesmo período que pêndulo idêntico pendurado no teto do vagão em
repouso junto à estação ferroviária.

Este cenário indica que nenhum sistema inercial é privilegiado em relação a qualquer outro, uma
vez que os fenômenos físicos se manifestam de maneira igual em todos eles. Portanto, todos os
referenciais inerciais são equivalentes, sendo na prática impossível distinguir, por meio de experimentos
mecânicos, entre o estado de repouso e o estado de movimento retilíneo uniforme. Este é o conteúdo do
chamado Princípio da Relatividade de Galileu, intimamente relacionado ao fato essencial das leis de
Newton não sofrerem alteração (em sua forma) quando analisadas por referenciais inerciais diferentes.
Note que se a segunda lei de Newton mudasse de forma sob uma transformação de Galileu, a “física” 4
observada por um referencial inercial em MRU seria diferente daquela percebida por um observador em
repouso. Isto seria o suficiente para denunciar o estado de movimento do referencial, e liquidar com a
indistinguibilidade entre os estados de repouso e de MRU. Portanto, a base essencial do Princípio da
Relatividade de Galileu é a covariância da segunda lei de Newton.

De um ponto de vista mais fundamental, pode-se dizer que a indistinguibilidade do estado de


repouso e de MRU advém da lei da inércia, uma vez que esta lei coloca estes dois estados no mesmo
patamar (exatamente equivalentes sob a ação de um fator externo). Dentro do contexto da 1ª lei de
Newton, pode-se afirmar que o custo para imprimir uma certa magnitude de aceleração sobre um corpo
de massa m, estando o mesmo parado ou em MRU, é igual. Daí advém uma equivalência cinemática
entre estes dois estados. Deste modo, é razoável admitir o princípio da relatividade na mecânica
newtoniana como uma consequência da inércia.

OBS.: Importante notar que os valores de algumas grandezas físicas, medidos pelos
referenciais S e S’, podem ser diferentes, e geralmente o são. Tais diferenças, entretanto, não
caracterizam fenomenologias diferentes, uma vez que os cenários “distintos” observados nestes dois
referenciais são regidos pelas mesmas equações de movimento (advindas da segunda lei de Newton).

1.2) A não-invariância do Eletromagnetismo Clássico

Já comentamos a respeito da invariância das leis da Mecânica Clássica, e o seu significado,


perante as transformações de coordenadas de Galileu. Devemos agora nos perguntar o que acontece
quando analisamos as leis do Eletromagnetismo Clássico (equações de Maxwell) perante tais
transformações de coordenadas. Veremos que, diferentemente das leis da Mecânica Clássica, as
equações de Maxwell não preservam a sua forma padrão quando submetidas a uma transformação de
coordenadas de Galileu 5, evidenciando que o princípio da relatividade de Galileu não vale o
eletromagnetismo de Maxwell (sendo válido apenas para a mecânica de Newton). Este fato está
intimamente conectado com um dos problemas teóricos mais discutidos pelos físicos do final do século
XIX e início do século XX: a eletrodinâmica dos corpos em movimentos, o éter e o movimento da luz,
para o qual o físico holandês H.A. Lorentz construiu a sua famosa teoria dos elétrons, e A. Einstein
enunciou as leis da Teoria da Relatividade Restrita, em 1905.

Para verificar que a situação da teoria eletromagnética é diferente da Mecânica Clássica no


que concerne ao seu comportamento perante as transformações de Galileu, consideremos um pulso de
luz movendo-se para a direita em relação ao meio através do qual se propaga, com velocidade constante

4 O termo “física” aqui significa fenomenologia, ou seja, a maneira como um fenômeno ou uma coleção de
fenômenos transcorrem.
5
Infelizmente, este é um resultado que não pode ser aqui demonstrado, uma vez que a teoria de Newton nada fala
sobre a maneira como os campos elétrico e magnético se transformam sob a ação das transformações de coordenadas
de Galileu. Entretanto, no Apêndice tal propriedade é demonstrada indiretamente a partir da equação de onda para o
potencial escalar.

5
e igual a c . Chamaremos de S o sistema inercial vinculado ao meio de propagação no qual a velocidade
da luz vale c , e S’, o sistema movendo-se na mesma direção do pulso, com velocidade constante u em
relação ao sistema S. Observe a figura abaixo:

S S'

u
PULSO LUMINOSO

Figura 2: Propagação de um pulso luminoso

Neste caso, o observador localizado no sistema S mediria para o pulso de luz uma velocidade igual a c ,
enquanto que o observador situado no sistema S’ mediria um valor igual a c′= c − u (lei galileana de
composição de velocidades). Vemos assim que observadores inerciais em movimento relativo entre si
mediriam valores diferentes para a velocidade da luz. No caso genérico, em que o observador S'

locomove-se com velocidade u em direção arbitrária, a velocidade da luz, medida por ele, valeria
  
c′= c + u , o que implica em diferentes valores, de c − u a c + u (de acordo com a lei de composição
de velocidades), dependendo da direção do movimento relativo em relação à direção de propagação da
luz. Portanto, chegamos à seguinte conclusão: se existe um referencial privilegiado (éter) em relação ao
qual a velocidade da luz vale c (por definição de ref. privilegiado), então a luz se locomoverá com
velocidade diferente c′ , onde c − u ≤ c′ ≤ c + u .
Um ponto que corroborava a existência de um éter como meio privilegiado para a
propagação da luz era o fato das equações de Maxwell não permanecerem invariantes perante as
transformações de coordenadas de Galileu. De fato, tais equações não conservam a sua forma padrão
quando analisadas do ponto de vista do ref. S’, que se move com velocidade u relativa ao sistema S 6.
Este quadro evidencia a sua incompatibilidade com o princípio de relatividade de Galileu. Neste contexto,
a validade das equações de Maxwell, na sua forma padrão, estaria restrita apenas ao referencial
privilegiado, no caso, o sistema de referência S em repouso ao éter, no qual a velocidade do pulso é
exatamente c .
O cenário que se vislumbra é a validade do princípio da relatividade de Galileu para a
mecânica de Newton, mas não para o eletromagnetismo de Maxwell. A pergunta-chave que se coloca é:
seria aceitável ter um sistema físico de descrição da natureza, onde somente uma das suas partes
(mecânica newtoniana) respeitasse o princípio da relatividade de Galileu? Importante ressaltar que esta é
uma pergunta típica de um físico do século XX e XXI, e não dos físicos do final do século XIX, para os
quais o conceito de princípio de relatividade não estava ainda estabelecido. Portanto, deixamos claro que
a análise que aqui segue não é válida na forma atual para os protagonistas do cenário físico do sinal do
final do século XIX, que atribuíam ao éter existência e papel de referencial privilegiado. Natural então era

6 Como prova indireta desta afirmação, apresentamos no apêndice deste capítulo uma descrição
matemática que mostra a variação da forma das equações de onda do potencial escalar e quando
submetidas a uma transformação de coordenadas de Galileu. Assim como ocorre para o potencial
escalar, ocorre para outras grandezas eletromagnéticas. Isto mostra que o Eletromagnetismo clássico,
quando analisado sob a perspectiva de referenciais inerciais diferentes, mostra-se diferente em forma,
representando uma física diferente para cada referencial.

6
a expectativa de que experimentos concebidos para detectar a variação da velocidade da Terra em
relação a este meio 7 fornecessem resultados positivos.
Do ponto de vista contemporâneo, a solução para este panorama de impasse, de origem
puramente teórica 8, passa por uma das três possibilidades teóricas abaixo descritas:

a) Um princípio da relatividade existe para a Mecânica Clássica, mas não para o Eletromagnetismo
Clássico; existe um sistema inercial privilegiado (éter) onde as leis de Maxwell são válidas na sua
forma usual e a velocidade da luz vale exatamente c; em todos os outros referenciais, as leis do
eletromagnetismo seriam diferentes (em forma), o mesmo valendo para a velocidade da luz,
  
c′= c + u , o que conduziria à possibilidade de detectar o referencial privilegiado através de
experimentos ópticos.

b) Um princípio da relatividade (GALILEU) existe tanto para a Mecânica Clássica como para o
Eletromagnetismo Clássico, mas as leis do Eletromagnetismo, como são dadas por Maxwell, não são
corretas, pois não permanecem invariantes perante as transformações de coordenada de Galileu.
Neste caso, uma nova teoria eletromagnética (diferente da de Maxwell) deveria ser formulada e
testada, e a hipótese do éter como referencial privilegiado estaria descartada. Vale aqui lembrar que
a teoria de Maxwell era muito bem sucedida nos mais diversos experimentos realizados para testá-la
e confrontá-la, o que já bastava para colocar esta hipótese sob suspeita.

c) Um princípio da relatividade (diferente do de Galileu) existe tanto para a Mecânica Clássica como
para o Eletromagnetismo Clássico, porém as leis da Mecânica enunciadas por Newton e as
transformações de Galileu não são corretas. Neste caso, uma nova mecânica, diferente da
newtoniana, compatível com o novo princípio da relatividade 9, deveria ser formulada e testada.
Observe que as novas transformações de coordenadas devem ser tais que mantenham as equações
de Maxwell invariantes.

Destas três hipóteses, esta última era a menos crível, devido à forte e grandiosa herança do
patrimônio newtoniano sobre a ciência e sobre as crenças dos físicos da época 10. Esta hipótese também
é incompatível com a idéia do éter como referencial privilegiado. A hipótese (a) é compatível com a
existência do éter como referencial privilegiado, o que estava de acordo com as expectativas dos físicos
do final do século XIX, que não julgavam possível a propagação da luz no vácuo. Estava também em
consonância com as previsões da teoria de Maxwell, que parecia coadunar-se com a existência de
referencial especial em que a velocidade da luz valesse c. Entretanto, tal hipótese tem o inconveniente de
estipular um princípio da relatividade apenas para uma parte da Física. Deste modo, teríamos a
possibilidade de um observador detectar o seu estado de movimento ou repouso por meio de
experimentos ópticos, mas não por meio de experimentos mecânicos, o que indica uma espécie de
contradição nos fundamentos da Física e nos mecanismos da natureza. Veremos, posteriormente, que o
experimento mais célebre para detecção do éter (experimento de Michelson-Morley), mostrou um
resultado incompatível com essa primeira alternativa. A hipótese (b), por sua vez, suscitou novas

7
Sendo o éter o referencial privilegiado, a velocidade da luz seria constante (c) em relação ao mesmo, e
diferente de c outros referenciais.
8 Está associado ao fato de existir um princípio da relatividade para toda Física ou não.
9 Ser compatível com um novo princípio de relatividade significa ser invariante sob o novo grupo de

transformações de coordenadas representativo de uma mudança de referencial inercial.


10 A mecânica newtoniana era uma teoria absolutamente bem-sucedida na explicação dos mais diversos

fenômenos pertencentes ao cotidiano de um físico do final do século XIX. Não havia experimento
conhecido cujos resultados estivessem em contração com as previsões desta teoria. Além do mais,
diversas outras teorias bem-sucedidas (acústica e teoria ondulatória, mecânica celeste, engenharias civil
e mecânica, etc...), foram construídas sobre as bases da mecânica de Newton, o que concedia a mesma
um status de teoria exata, perfeita e imutável.

7
propostas de teorias eletromagnéticas, conhecidas com teorias da emissão 11, que foram
gradativamente descredenciadas por sucessivos experimentos. A alternativa (c), a hipótese inicialmente
considerada menos provável, revelou-se como a opção correta depois que A. Einstein enunciou a TRR,
e esta nova teoria foi sendo paulatinamente estabelecida como correta pelos mais diversos
experimentos 12. Na verdade, ao enunciar a TRR, Einstein apresentou não apenas o novo grupo de
transformações de coordenadas (transformações de Lorentz), como também as leis da nova mecânica,
compatíveis 13 com tais transformações, conhecida como mecânica relativística. Essa é uma teoria mais
geral que a mecânica newtoniana, uma vez permanece válida no domínio de altas velocidades 14, onde a
segunda lei de Newton, na sua forma usual, falha fragorosamente.

RESSALVA: Como já ressaltado, estas três possibilidades teóricas são muito claras do ponto
de vista de um físico contemporâneo, já educado à luz do princípio da relatividade. Importante mencionar
que para os físicos da época a ideia predominante era de referencial privilegiado e não de um princípio
da relatividade para toda física. Buscando uma descrição do processo histórico de estabelecimento da
teoria da relatividade restrita mais fiel à complexidade das ideias, conceitos, crenças, e experimentos
realizados no século XIX, buscaremos apresentar um pouco das teorias de descrição do éter e suas
propriedades, da propagação da luz em meios transparentes, e da teoria de Fresnel para arrastamento
parcial do éter, dominante durante boa parte da segunda metade do século XIX. No meio deste
processo, perceberemos que a concepção de um princípio da relatividade só veio à tona, no início do
século XX, com Poincaré. Entre 1900 e 1904, Lorentz publicou uma versão final da sua teoria do elétron,
em que mostrava a invariância das equações de Maxwell sob as transformações de coordenadas de
Lorentz, como forma de explicar os resultados nulos dos experimentos de detecção do movimento da
Terra relativa ao éter 15. Isto sem elaborar ou conceber o princípio da relatividade como o conhecemos
hoje, e continuar defendendo a existência de um referencial privilegiado. Estes fatos mostram a
complexidade do cenário físico em questão, em que as teorias de Lorentz e Poincaré aproximaram-se de
alguns aspectos da TRR, sem contudo terem sido enunciados como tal. Desta forma, não usaremos as
hipóteses (a), (b), (c) aqui apresentadas como guia mestra da sua nossa discussão.

1.3) ÉTER LUMINÌFERO: Histórico e propriedades

A idéia de um meio que preenchesse todo o espaço remonta à Grécia Antiga. Na concepção
de Aristóteles, o éter seria um fluido puro e transparente que preencheria toda a esfera celeste
(delimitada além da esfera lunar). Em seu modelo de mundo, Aristóteles supôs que os elementos
essenciais do Universo seriam a terra, o fogo, o ar e água (os quatro elementos de Empédocles). Tais
elementos, entretanto, comporiam somente as coisas da Terra e da Lua (mundo sublunar), sendo que o
espaço celeste seria formado por um quinto elemento chamado de éter, que foi posteriormente
denominado de “quinta essência”. Este elemento seria adequado para constituir os corpos celestiais em
toda sua perfeição, enquanto os quatro elementos constituiriam apenas os corpos imperfeitos,
localizados no interior da esfera sublunar. Esta distinção era um dos pontos que estabelecia a dicotomia
entre a física do mundo terrestre e a física do mundo celestial, que perdurou até o Renascimento
científico. Foi a partir do século XVII que a idéia do éter voltou a atrair a atenção dos físicos, com o
advento dos trabalhos de Descartes, Huygens, Newton, Young, entre outros. Descartes era favorável à

11 Tais teorias eram baseadas na suposição de velocidade da luz era atrelada ao referencial da fonte, de

modo que um observador em movimento relativo à fonte de luz, deveria detectar uma velocidade
diferente de c.
12 Até o presente momento, não há relato de um só experimento que tenha colocado sob dúvida os

preceitos, leis e previsões da TRR. Entretanto, é importante destacar que a aceitação da TRR por parte
da comunidade científica do início do século XX não ocorreu de maneira rápida. Somente após a
realização de experimentos mais precisos (a partir de 1920-1930), é que a crença na TRR foi sendo
generalizada.
13 Compatível aqui significa ser invariante sob tais transformações.
14 O domínio de altas velocidades é definido como aquele em que as velocidades em questão não podem

ser desprezadas perante a velocidade da luz.


15 Vide Ref. [6], seção 2.4.

8
existência de um meio ou substância que ocuparia todo o espaço, necessário para viabilizar a
transmissão das interações entre os corpos pelo espaço, em clara contraposição à idéia da ação à
distância. Este meio seria similar a um fluido. Para ele, o éter seria o meio dos acontecimentos dos
sistemas físicos, especialmente os ópticos; e a luz, uma ação que se transmitia através desse meio. Em
1690, o cientista holandês Christiaan Huygens (1629-1695) propôs uma teoria ondulatória da luz,
apresentada em sua obra “Treatise on Light” (Tratado Sobre a Luz), que explicava os fenômenos de
reflexão e refração da luz baseada no paradigma ondulatório. Fazendo uma analogia com as ondas
sonoras, que são vibrações mecânicas (longitudinais) em meios materiais (como o ar, os sólidos e os
líquidos), e necessitam de um meio para se propagar, Huygens foi levado a pressupor a existência de um
meio material que preenchesse todo o espaço, e que assim possibilitasse a propagação das ondas
luminosas. A este meio denominou-se de éter luminífero. Este seria também o meio de propagação da
interação gravitacional. A teoria de Huygens era baseada no famoso Princípio de Huygens, que
afirmava que cada ponto do meio (éter) atingido pela perturbação (vibração da onda) transmitia o
movimento aos pontos ao seu redor, atuando com fonte de ondas esféricas secundárias, que se
propagavam apenas para frente. A superposição destas ondas secundárias determinaria então a forma e
a propagação da onda no espaço. Nesta teoria, a luz propagar-se-ia como uma perturbação (vibração
longitudinal) do éter, meio elástico imponderável.

Durante todo século XVIII predominava a visão da teoria corpuscular da luz, uma decorrência
do grande legado e influência de Newton no cenário científico. A teoria ondulatória, apesar de ter seus
adeptos e defensores, não era considerada como uma opção viável na explicação dos fenômenos
ópticos pela maioria dos físicos. Na teoria corpuscular de Newton, a velocidade da velocidade da luz em
um meio de índice de refração n é igual a nc , sendo maior que c , dado que em meios materiais, n > 1 .
Segundo Newton, quando a partícula de luz adentrava um meio material, sofria uma força na direção
normal à superfície, aumentando a componente normal da sua velocidade, de modo o módulo da
velocidade da partícula passava a ser nc , enquanto a componente de velocidade paralela à superfície
permanecia inalterada. Vide Fig. (3).

Isto certamente era consistente com a lei da refração se Snell. De fato, sendo (
v1 = v x1, v y1 ) a

velocidade da partícula de luz incidente (no vácuo ou ar), e θ1 o ângulo de incidência com a normal, vale:
sin θ1 = vx1 v1 .
 
Após adentrar meio 2 de índice de refraçãon , temos: v 2 = cn , e sin θ 2 = v x 2 v 2 , com v x1 = v x 2 .
Note que estas premissas são compatíveis com a lei de Snell, n1 sin θi = n2 sin θ 2 , que impõe:

n1 v x1 v1 = n2 v x 2 v 2 → 1 v1= n v2 → v2= nv1 .

Este é um aspecto crucial de distinção com da teoria corpuscular com a ondulatória, que previa que a
velocidade da luz seria menor que c , igual c / n , no meio de índice de refração n .

A questão da compatibilização da propagação da luz com as propriedades mecânicas do éter


ganhou então importância. As propriedades mecânicas do meio, como elasticidade e rigidez, são
determinantes para o tipo de oscilação (longitudinal ou transversal) suportada. Meios fluidos, como
líquidos e gases, não possuem rigidez (propriedade de resistir à distorção da forma). Logo, só suportam a
propagação de ondas longitudinais. Meios sólidos são dotados de rigidez porque resistem a
deformações. A hipótese da transversalidade da luz não sendo compatível com a ideia de éter fluido,
levaria a atribuir ao mesmo, qualidades de meios sólidos.

9
Nas duas primeiras décadas do século XIX
surgiram os primeiros experimentos favoráveis à
interpretação ondulatória, tal como o
experimento da fenda dupla de Fresnel e as
primeiras evidências da polarização da luz.

Por volta de 1817, as discussões


em torno do éter ganharam uma nova dimensão,
quando Thomas Young lançou a hipótese da
transversalidade das ondas luminosas, em
contraposição à concepção de uma onda
longitudinal (proposta anteriormente por
Huygens). Young baseou sua nova proposta nas
observações de polarização da luz,
propriedade não bem explicada em termos de
Figura 3: Ilustração da refração da luz de acordo ondas longitudinais. Essa nova hipótese trouxe
com a teoria corpuscular de Newton elementos complicadores adicionais para a
discussão do éter.

A teoria ondulatória de Huygens previa apenas a propagação de ondas luminosas


longitudinais, uma vez que o éter era considerado um meio fluido. As investigações iniciais a respeito da
propagação de ondas transversais em meios sólidos coube a Fresnel, que demonstrou esta possibilidade
caso o sólido exibisse rigidez. Pouco depois, em 1828, Poisson formulou uma teoria de propagação de
ondas mecânicas em sólidos, que previa a existência de ondas longitudinais e transversais. Sendo
ρ ,η , κ a densidade, rigidez e o módulo de compressão 16, respectivamente, Poisson mostrou que a
velocidade das ondas longitudinais seria (κ + 4η / 3) ρ , enquanto as ondas transversais se

propagariam com velocidade η ρ . Esta dedução é condizente com a ausência de propagação de


ondas transversais em fluidos, no quais η = 0. Portanto, para o éter suportar ondas transversais,
deveria ser dotado de rigidez, η ≠ 0 , uma propriedade dos sólidos elásticos. Esta necessidade entrou
em contraposição com as características usualmente atribuídas ao éter. De fato, este meio deveria ser
razoavelmente rígido para explicar a alta velocidade de propagação da luz e, simultaneamente, exibir
imponderabilidade e tenuidade, ao ponto não oferecer nenhuma resistência ao movimento dos corpos
(note que os planetas se moviam há séculos pelo éter sem nenhuma depreciação perceptível de seus
movimentos).

Como uma alternativa para contornar esta problemática, George Gabriel Stokes (1819-
1903) lembrou a existência de substâncias intermediárias (fluidos com alta viscosidade – como o piche)
que poderiam suportar a propagação de ondas transversais – vibrações elásticas, e ao mesmo tempo
permitir a passagem dos corpos ponderáveis. Na acepção de Stokes, o éter seria rígido o suficiente
para garantir a propagação de ondas transversais em alta velocidade, e tênue o bastante para permitir o
movimento dos planetas sem perda de momento. Esta teoria do éter como um fluido viscoso que aderia
na superfície dos corpos massivos, sendo totalmente arrastado por estes, foi publicada em 1845.

Em 1818, o pensador francês Augustin Jean Fresnel formulou uma teoria para o éter
baseado na proposição de Young e no resultado nulo do experimento de refração de Arago. Em sua
teoria, o éter permaneceria parado em todo Universo, sendo capaz de permear os corpos materiais,
atravessando-os ou fluindo através dos mesmos. Em geral, este éter permaneceria estático, não
interagindo com a matéria, e não sendo arrastado pelos corpos massivos (como a Terra, por exemplo). A
exceção aconteceria por parte dos corpos transparentes à luz, que seriam capazes de arrastar
parcialmente o éter consigo. A velocidade de arraste seria dada por (1 − 1/ n 2 )v , onde v e n

16 Vide Ref. [18], pg. 130, para maiores detalhes.

10
representam a velocidade e o índice de refração do corpo (meio) em movimento. Esta teoria foi verificada
compatível com o famoso experimento de Fizeau de 1851, destacando-se também por fornecer
explicação para os resultados nulos dos experimentos Hoek (1868) e Airy (1871) para detectar o éter.
Desta forma, a teoria de Fresnel tornou-se bastante famosa e bem sucedida na segunda metade do
século XIX.

Apesar das dificuldades de se estabelecer uma idéia bem definida acerca das propriedades
relacionadas ao éter, a hipótese da sua existência perdurou por muito tempo, obtendo grande
importância por volta de 1861, após Maxwell publicar a sua teoria eletromagnética da luz, na qual ele
apresentou as equações fundamentais do Eletromagnetismo e, em um procedimento puramente teórico,
previu a existência das ondas eletromagnéticas que deveriam se propagar com a velocidade
c = 1/ εµ . Diante desta nova teoria, era possível determinar o valor numérico da velocidade das ondas
luminosas em qualquer meio partindo das propriedades elétricas e magnéticas do mesmo 17. No
desenvolvimento de sua teoria, Maxwell foi deveras influenciado pela idéia de campo, introduzida na
Física por Faraday, para evitar a concepção de força agindo à distância. Com o passar do tempo,
Maxwell foi tornando-se adepto também da ideia de um meio que preenchia todo espaço e que fosse
capaz de transmitir as interações eletromagnéticas (vide ref. [13]), denominando-o de éter, como era
corrente na época. Maxwell então atribuiu ao seu éter propriedades que Faraday havia antes associado
às linhas de força do campo. Neste sentido, o éter de Maxwell poderia transmitir forças à matéria através
de pressões e tensões. Maxwell ainda desenvolveu cálculos quantitativos destas grandezas, obtendo
pela primeira vez a pressão produzida por ondas eletromagnéticas sobre a superfície de um corpo. Em
sua teoria sobre o éter, Maxwell associava a origem do campo magnético a vórtices (turbilhões) de éter,
ao passo que o campo elétrico teria sua origem vinculada à velocidade do fluxo de éter entre as fontes do
campo. Para saber mais sobre a interessante teoria de Maxwell sobre o éter, vide refs. [13] e [14].

Em 1885, o físico alemão Heinrich Hertz mostrou experimentalmente que as ondas


luminosas e as ondas eletromagnéticas têm as mesmas propriedades físicas (velocidade de propagação,
polarização e transversalidade, refração, reflexão, etc...), conseguindo identificar a luz como uma onda
eletromagnética. Com isto, a Óptica passava a ser tratada como um ramo do Eletromagnetismo de
Maxwell. Unificava-se assim o éter das interações elétricas e magnéticas com o éter luminífero,
concebido inicialmente por Huygens como meio de propagação da luz. O éter agora passava a ser o
meio natural de propagação de todas as ondas eletromagnéticas 18 de Maxwell: o meio de transmissão
das vibrações eletromagnéticas. Assim, o éter passou a ser visto como um elemento indissociável desta
teoria, o meio natural de propagação das ondas eletromagnéticas, em relação ao qual a sua velocidade
de propagação vale c = 1/ ε 0 µ0 , e no qual as equações de Maxwell assumem a sua forma conhecida.

1.4 AS PRIMEIRAS TENTATIVAS DE DETECTAR O ÉTER LUMINÍFERO

De acordo com Arthur I. Miller 19, a pesquisa sobre fenômenos ópticos no século XIX estava
basicamente associada com três problemas conectados entre si:

(a) a aberração estelar e sua importância para a teoria ondulatória da luz,


(b) estudos realizados pelos astrônomos sobre a maneira como a luz se propaga e tentativas
de determinar o movimento próprio do sistema solar,

17 Num meio material a velocidade da luz vale c = 1/ εµ , onde ε é a permissividade elétrica e µ a


permeabilidade magnética do meio.
18
Vale ressaltar que, apesar das ondas eletromagnéticas terem características distintas de ondas mecânicas, ambas
satisfazem equações matemáticas de evolução similares, o que acirrava a crença na necessidade de um meio de
propagação para a luz. Essa maneira de pensar também era defendida por Maxwell, para quem, independentemente
das dificuldades que pudéssemos ter para formar uma idéia consistente acerca da constituição do éter, não poderia
haver qualquer dúvida de que os espaços interplanetários e interestelares não eram vazios, mas sim ocupados por
uma substância material que possibilitava a transmissão da luz (chamada de éter).
19
Vide Ref. [12], pg. 14.

11
(c) a relação existente entre a matéria ponderável e o éter e as tentativas de detectar o
movimento da matéria em relação ao éter.

Nesta seção, estudaremos um pouco sobre essas três questões.

1.4.1) Aberração Estelar

As primeiras observações da aberração estelar nasceram de tentativas de observação de


paralaxe realizadas por James Bradley, em 1725. A paralaxe 20 é o efeito de alteração na posição de uma
estrela devido à mudança do ponto de observação. Na época, os astrônomos buscavam observação da
paralaxe como uma prova cabal do modelo heliocêntrico de Nicolau Copérnico, uma vez que este efeito
ainda não havia sido confirmado. James Bradley percebeu que as estrelas descreviam órbitas circulares
ou elípticas no céu à medida que a Terra percorria sua trajetória em torno do Sol, sendo o efeito igual
para estrelas próximas umas das outras. Tais estrelas descreviam um cone com diâmetro angular de
aproximadamente 41 segundos de arco. Este fenômeno só depende da velocidade relativa entre fonte e
observador, sendo diferente do efeito da paralaxe, que depende da posição do observador relativa à
fonte de luz. Bradley denominou-o de aberração estelar, em 1727. Veremos a seguir como esse efeito é
descrito.

Figura 4: Esquema simplificado da aberração estelar de uma estrela no zênite. (a) O esquema mostra a
  
soma galileana de velocidades que fornece a velocidade c′= c − u que fornece a direção de visada da
estrela em sua estrela aparente. (b) Ilustração que permite visualizar o ângulo de desvio α que define a
posição aparente, sempre subtendido para o sentido da velocidade a Terra.

A aberração pode ser explicada em termos da superposição dos movimentos da Terra em sua órbita ao
 
redor do Sol e do movimento da luz da estrela, através de uma soma galileana de velocidades ( c ± u ) –
tanto no modelo corpuscular da luz, quanto no modelo ondulatório. Nesta época e, até o final do século
XVIII, o modelo vigente para a constituição da luz era o corpuscular. Bradley então apresentou uma
explicação para o efeito baseada na natureza corpuscular da luz: a direção aparente da luz em cada

20
A paralaxe é a mudança na posição aparente de uma estrela devido à observação da mesma a partir de pontos
diferentes da órbita terrestre em torno do Sol. Este efeito só é observável para estrelas relativamente próximas da
Terra, pois só depende da razão entre o diâmetro da órbita da Terra e a distância da estrela observada ao Sol. Para
estrelas muito distantes da Terra, esta razão é muito diminuta, e o efeito de paralaxe torna-se desprezível, sendo a
estrela considera fixa.

12
instante seria dada pela velocidade resultante dos corpúsculos (fruto da soma da velocidade da luz com
menos a velocidade da Terra) - do ponto de vista do observador na Terra. Na teoria corpuscular, as
 
partículas de luz apresentam componentes de velocidade c no eixo vertical e velocidade −u no eixo
  
horizontal. Na Fig. (4), visualizamos a soma c′= c − u , que fornece a direção de visada que leva à
posição aparente. Assim, o fenômeno da aberração estelar inicialmente foi entendido como mais uma
evidência que fortalecia a natureza corpuscular da luz.

No caso de uma estrela localizada no zênite, o ângulo formado pela posição real e aparente da luz é
ilustrado na Fig. (4), sendo dado por: tan α =
u ∆T / c∆T , o que implica em:

tan α = u / c , (1.8)
onde u = 30km/s é a velocidade de translação da Terra em torno do Sol e c= 3 ×10 km / s é a
5

velocidade de propagação da luz. Sendo assim, obtemos:

tan α
= 1,0 × 10−4 rad , (1.9)

equivalente a α = 20,5" de arco.

A explicação da aberração estelar dentro da teoria corpuscular da luz é bastante semelhante ao que
ocorre com a direção de chegada dos pingos de chuva quando corremos ou dirigimos sob uma
tempestade.

Figura 5: Ilustração comparativa da explicação da aberração estelar com a inclinação dos pingos de chuva.

É importante, porém, ressaltar que a aberração da luz também pode ser descrita em termos
da teoria ondulatória da luz, desde que o éter seja considerado estático no espaço (neste caso, estático
em relação ao Sol). Neste caso, novamente a velocidade resultante da luz em relação ao observador na
Terra (que fornece sua direção de propagação) é dada como uma soma galileana da velocidade da luz
relativa ao éter com a velocidade da Terra através do éter. De fato, no caso da Terra estar se movendo
 
em relação ao éter com velocidade u , sendo c a velocidade da luz relativa ao éter, a velocidade da luz
   
relativa ao observador na Terra será c ' = c + ( −u ) . O vetor c′ fornece a direção com que os raios de luz
advindos da estrela atingem o observador na Terra, sendo obviamente a direção aparente de
visualização da estrela. Essa será a direção em que devemos apontar (inclinar) o telescópio de
observação, a fim de que os raios emitidos pela estrela passem diretamente para a ocular do telescópio,
permitindo a sua visualização. O ângulo de inclinação é α com a vertical. Esse processo pode ser
igualmente explicado pela ilustração da soma vetorial na Fig. (4). A aberração estelar depende apenas da
velocidade relativa entre o objeto visualizado e a Terra (referencial de observação). Como a Terra se
move em órbita fechada, seu vetor velocidade em relação ao Sol sofre mudança de orientação de 360o
em 1 ano, tempo no qual a posição da estrela também descreve uma pequena elipse de céu, que
subtende um cone de abertura igual a 41’’ de arco (do ponto de vista da Terra). A Fig. (6) ilustra esse
fenômeno para uma estrela situada na região do zênite.

13
Figura 6: Ilustração da obtenção das posições aparentes de uma estrela no processo da aberração estelar.

Observe que se a Terra estivesse em repouso no éter, os raios de luz emitidos por uma
estrela no zênite, chegariam ortogonalmente ao plano de horizonte de um observador situado na Terra.
Nesta situação, o telescópio de observação deveria fazer 90º (com o plano do horizonte) para permitir a
visualização da estrela, não sendo observada nenhuma alteração na posição da estrela devido ao
movimento da Terra.
Note ainda que se a Terra descrevesse um movimento retilíneo uniforme no espaço, a
posição aparente seria sempre a mesma, imutável, e não poderia ser identificada. Porém, como o
movimento da Terra é cíclico, enquanto a Terra completa uma volta em torno do Sol, a posição da estrela
muda a cada época do ano, descrevendo uma trajetória circular que subtende um cone de aberração
com abertura de 2α = 41" de arco, em boa concordância com as observações da época. Para as
estrelas que não se encontram exatamente acima de nós (zênite), o cone de aberração apresenta uma
borda elíptica.
As medidas realizadas por Bradley foram confirmadas por outros astrônomos da época,
sendo a aberração estelar um fenômeno amplamente verificado, considerado uma decorrência do
movimento de translação da Terra em torno do Sol, interpretação rapidamente aceita pela comunidade
científica da época.

Outra comparação importante é sobre a distinção entre as posições aparentes devido à


paralaxe e aberração estelar, o que está ilustrado na Fig. (7).

14
Figura 7: Distinção entre os efeitos da paralaxe e aberração na posição aparente de uma mesma estrela no
zênite observada da Terra.

Devemos agora discutir sua relação com a problemática da existência do éter e seu possível
arrastamento pelos corpos massivos. Se o éter fosse totalmente arrastado pela Terra ao longo do seu
movimento orbital, formando uma espécie de “atmosfera” de éter no seu entorno, a Terra estaria sempre
parada em relação ao éter, de modo que a velocidade da luz medida por um observador na Terra seria
sempre c. Neste caso, não haveria aberração estelar. Decerto, sendo a velocidade da Terra nula em
relação ao éter, não haveria porquê fazer composição de velocidades, e o telescópio não precisaria ser
inclinado (a estrela seria vista na sua posição real durante o ano todo). Note que se a Terra arrastasse
uma nuvem de éter consigo, o éter estaria sempre parado em relação a qualquer observador localizado
na Terra. Com isto, a velocidade da luz em relação a qualquer observador na Terra seria sempre igual a
c. Portanto, não poderia ser observada a aberração estelar. Neste sentido, em 1804, Young já afirmava:
“Considerando-se o fenômeno de aberração estelar, estou pronto a acreditar que o éter luminoso penetra
a substância de todo corpo material com pouca ou nenhuma resistência, talvez tão livre quanto o vento
passe através de um bosque de árvores.” 21

No que concerne às consequências da observação da aberração estelar, podemos afirmar:

• O fenômeno mostrava-se compatível com a constituição corpuscular da luz;


• O fenômeno mostrava-se compatível com a constituição ondulatória da luz e com a ideia de
éter luminífero imóvel (não arrastado pelos corpos massivos).
• O fenômeno não se mostrava conciliável com a ideia de éter totalmente arrastado pela Terra.

Devemos mais uma vez ressaltar que, apesar da aberração estelar ser compatível com a existência do
éter como referencial privilegiado, a observação deste fenômeno não basta para acusar a existência do
éter 22.

21 Vide Ref. [17], p.161.


22
A aberração estelar, assim como alguns outros fenômenos, é compatível com a existência de um éter como
referencial privilegiado. Isto não significa, entretanto, que a hipótese do éter esteja correta. Para ser considerada
correta, uma hipótese científica deve estar em consonância com todos os fenômenos correlacionados com a mesma, e
não apenas com uma ou algumas.

15
1.4.2) O Experimento de Arago

Na verdade antes dos experimentos de Young e Fresnel do início do século XIX, houve
algumas tentativas de confrontar os modelos corpuscular e ondulatório da luz. Uma delas foi proposta por
Roger Boscovich (1711- 1787) em 1766, que imaginou um telescópio cheio de água como instrumento de
decisão entre a teoria corpuscular e a ondulatória. Boscovich previu que este experimento revelaria um
acréscimo ou decréscimo no ângulo de aberração caso a luz fosse composta por corpúsculos ou fosse
uma onda, respectivamente. Isto estaria relacionado ao fato da velocidade da luz no meio material (água)
ser igual a nc de acordo com a teoria corpuscular, e c / n segundo a teoria ondulatória. Embora tenha
proposto, Boscovich não chegou a realizar tal experimento devido à dificuldade de construir e manusear
um telescópio deste tipo.

No final do século XVIII, a abordagem mecanicista da Física, enfatizada pelo legado da teoria
newtoniana, estava no seu apogeu, fortalecido por diversos adeptos e cientistas de calibre, tal como
Laplace, um dos mais notáveis seguidores da tradição newtoniana. Laplace acreditava que todos
fenômenos poderiam ser interpretados “dentro da concepção newtoniana de partículas interagindo
através de forças centrais”, englobando fenômenos como a “refração, a coesão dos sólidos, a
capilaridade e as reações químicas resultavam da ação de forças de pequena ação entre partículas da
matéria” 23. Laplace desfrutava de grande influência e reputação, sendo na época um dos maiores
defensores da teoria corpuscular da luz. Uma das previsões desta teoria era que a velocidade da luz
deveria depender da massa da estrela emissora: quanto maior a estrela, menor seria a velocidade dos
corpúsculos de luz emitidos (consequência da atração gravitacional). Paralelamente, a observação de
iguais ângulos de aberração para diversas estrelas era compatível com a constância da velocidade da luz
no espaço, e incompatível com a teoria corpuscular (na qual deveria ocorrer variação da velocidade com
a fonte). Ciente destes fatos, Laplace propôs a Biot e Arago experimentos que pudessem comprovar a
teoria corpuscular.
Em 1806, Arago e Biot tentaram verificar as sugestões de Laplace, através de
experimentos ópticos, buscando medir efeitos do movimento da Terra sobre o ângulo de refração
da luz advinda das estrelas ao passar por um prisma postado na Terra. Nestes primeiros
experimentos o ângulo de refração não parecia variar com a posição da estrela no céu, o que ia contra as
expectativas de Laplace e dos experimentadores. “Em se tratando de medidas muito delicadas,
inicialmente Biot e Arago propõem-se a verificar se realmente não existia diferença nas velocidades da
luz emitida por diversos astros. Tal verificação é feita em 1806 pelos dois cientistas franceses através da
medida da refração da luz de vários corpos celestes. Seus resultados são apresentados à Academia de
Ciências de Paris, confirmando a constância da velocidade da luz e mantendo a incompatibilidade com a
teoria (corpuscular).” 24
Em 1810, Arago partiu para uma nova série de experimentos para detectar pequenas
variações no ângulo de refração da luz advinda de estrelas. Segundo a teoria corpuscular o ângulo de
refração é uma medida da variação da velocidade da luz ao passar de um meio para o outro. Para
maiores detalhes, vide Ref. [22]. Pensando em termos de uma composição galileana, a velocidade da
luz fora do prisma seria maior ou menor caso a Terra se aproximasse ou se afastasse de uma estrela.
Isto deveria fornecer valores diferentes para o desvio angular da luz quando da passagem de um meio
−4
para outro, sendo tal variação da ordem de 10 . Vide Fig. (7) e (8). Ele fez esta análise com base na
variação da velocidade da luz ao atravessar estes dois meios e, assim, imaginou que o desvio da luz ao
atravessar o prisma poderia depender, portanto, do sentido do movimento da Terra em relação às
estrelas.

23 Vide Ref. [17], Pg. 161.


24 Vide Ref. [17], pg. 162. Vide também Ref. [20], pag. 59.

16
Figura 8:

Figura 9: Fig. (a) - Prisma (Terra) se aproximando da fonte de luz (estrela); Fig. (b) - Prisma (Terra) se
afastando da fonte de luz (estrela).

No entanto, o que Arago observou foi que os desvios sofridos em ambas as situações (aproximação ou
afastamento) eram equivalentes. O resultado nulo deste experimento era dificilmente explicado dentro
das premissas da teoria corpuscular, trazendo dificuldades adicionais para seus adeptos. Mas podia ser
explicado dentro da visão ondulatória da luz, desde que se admitisse que o éter fosse totalmente
arrastado pela Terra.

Vemos assim que o experimento de Arago e da aberração estelar levavam a concepções


opostas de éter:
• A aberração estelar era explicável pela teoria ondulatória da luz e um éter estático não
arrastado pela Terra;
• O experimento de Arago podia ser explicado pela teoria ondulatória da luz e um éter
totalmente arrastado pela Terra;

Essa era uma contradição que só foi resolvida quando Fresnel propôs a sua teoria do arrastamento
parcial do éter.

1.5) A TEORIA DE FRESNEL E O ARRASTAMENTO DO ÉTER

A importância da teoria do engenheiro francês Augustin Fresnel, no século XIX, deve-se ao


fato da mesma estar relacionada tanto à questão da aberração estelar e natureza ondulatória da luz,
quanto à relação da matéria ponderável com o éter, e seu possível arrastamento. A teoria de Fresnel
conseguiu notoriedade ao propor apenas um arrastamento parcial do éter pelos meios materiais
transparentes, obtendo sucesso ao conciliar a teoria ondulatória da luz com as observações da aberração
estelar e ao resultado nulo do experimento de Arago. Esta teoria conseguiu explicar diversos
experimentos propostos ao longo do século XIX, todos sensíveis em primeira ordem em u / c .

Como foi visto anteriormente, Young descobriu a natureza transversal da luz e comunicou
sua descoberta a Dominque Arago, que era presidente da Academia de Ciências da França na época. A
Academia francesa era dominada por defensores ferrenhos da teoria corpuscular (Laplace e Biot), e em
1817 foi proposto um prêmio – desafio - para quem realizasse o melhor trabalho para explicar o
fenômeno da difração, dentro da expectativa que o sucesso caberia a um desenvolvimento realizado
dentro da premissa corpuscular.

17
Na mesma época, Arago resolveu consultar Fresnel sobre o seu experimento envolvendo o
prisma, e perguntando-lhe se havia alguma possibilidade de explicar o efeito nulo deste experimento
utilizando a teoria ondulatória da luz. Fresnel escreveu a Arago uma carta, cujo conteúdo era na verdade
um artigo científico, publicado em 1818 na revista Annales de Chimie et de Physique. Neste artigo,
motivado pelos resultados de Young, Fresnel desenvolvia as bases de uma nova teoria ondulatória que
tentava explicar a óptica dos corpos transparentes (com índice de refração n >1) em movimento em
relação ao éter luminífero. Com esta, Fresnel era capaz de explicar com sucesso o resultado nulo do
experimento de Arago.
De acordo com Fresnel, o éter ocupava todos os espaços vazios do universo e permanecia
completamente estático. O éter não seria afetado pelo movimento dos corpos massivos (opacos) através
dele, como a Terra, mas seria parcialmente arrastado pelos corpos transparentes. Sobre esta ideia,
Fresnel afirmou: “Até agora eu só pude conceber claramente este fenômeno supondo que o éter passa
livremente através do globo e que a velocidade comunicada a este fluido é somente uma pequena parte
daquela da Terra”. 25
Esta teoria de Fresnel, desenvolvida dentro da visão ondulatória, causou tamanha
repercussão na época, que a Academia concedeu o prêmio a Fresnel. A este respeito, Whittaker declara:

“Neste trabalho Fresnel calculou o padrão de difração de uma ponta reta, de um corpo
opaco de lados paralelos, de uma abertura estreita de lados paralelos, mostrando que os resultados
concordavam excelentemente com as medidas experimentais. Poisson, ao ler o trabalho, percebeu que
tal análise poderia ser estendida para outros casos, e que isto indicaria que deveria haver um ponto
brilhante no centro da sombra de um corpo circular. Ele então sugeriu a Fresnel que este fato e algumas
outras consequências deveriam ser testadas experimentalmente. Os testes foram realizados,
confirmando os resultados da nova teoria. A concordância das previsões com as observações foram tão
admiráveis que o prêmio acabou sendo concedido a Fresnel sem maiores hesitações.” 26

Figura 10: Ilustração do ponto brilhante (ponto de Arago) no meio de uma sombra: efeito de difração.

Dentro da concepção da teoria ondulatória, a velocidade da luz em meios transparentes com


índice de refração n , é menor que c , sugerindo que o éter teria propriedades diferentes dentro dos
meios materiais. Fresnel então supôs que algum tipo de interação deveria existir entre o éter e os corpos
transparentes. Na teoria de Fresnel, o éter é considerado como um meio elástico, de densidade ρ .
Fresnel admitiu uma analogia com a propagação do som no ar, propondo que a velocidade da luz seria
proporcional a 1/ ρ , de modo que quanto maior a densidade do éter no meio ( ρ ), menor a velocidade
da onda. Sendo adepto da teoria ondulatória da luz, na qual a velocidade da luz ( c / n ) decresce com o
índice de refração ( n ), Fresnel tentou relacionar estas informações, elaborando uma teoria para a
propagação da luz em meios transparentes baseada na densidade do éter nestes meios.

25 Vide Ref. [17] .


26 Vide Ref. [18], cap. IV, pg. 108.

18
Segundo Fresnel, quando um corpo transparente se desloca, arrasta consigo uma parte
do éter, correspondente ao excesso de éter localizado dentro dele ( ρ − ρ 0 ), onde ρ é a densidade
do éter em meio transparente e ρ0 seria e densidade de éter no vácuo. Com este argumento, uma
densidade sempre maior de éter seria mantida no interior do meio transparente, garantindo a menor
velocidade da luz no interior desse meio.
Considerando que o corpo transparente se desloca com velocidade V, para Fresnel a
velocidade transferida ao éter é proporcional a fração do excesso de éter, ( ρ − ρ 0 ) ρ , que se locomove
junto com o mesmo, ou seja,
 ρ − ρ0   ρ0   1 
u=
 V =
1 − V =
1 − 2 V . (1.11)
 ρ   ρ   n 
Fresnel usou
ρ / ρ0 = n 2 , (1.11B)

e o fator de proporcionalidade α= (1 − 1/ n 2 ) é denominado de coeficiente de arrastamento (do éter) de

Fresnel. Para demonstrar a relação ρ / ρ0 = n 2 , Fresnel considerou dois meios de índice de refração
( n1 , n2 ), para os quais a teoria ondulatória fornece n2 = c / v 2 e n1 = c / v1 , o que implica em:
n2 v1
= , (1.11C)
n1 v 2
onde v1 ,v 2 são as velocidades da luz nestes meios. No caso em que temos um pedaço de vidro no
vácuo (ou ar), vale: n2 = c / v , n1 = 1 . Sabemos ainda que:
v1 ∝ 1 ρ1 , v 2 ∝ 1 ρ2 , (1.11D)
de modo que
v1 ρ ρ n2 ρ
= 2 = 2 → = 2 . (1.11E)
v2 ρ1 ρ1 n1 ρ1

• Sendo o meio 1 o vácuo, temos: c ∝1 ρ0 e n1 = 1 .


• Sendo o meio 2 um material de índice n2 = n , temos: v 2 ∝ 1 ρ .
• Substituindo n1 = 1 , ρ1 = ρ0 e n2 = n , ρ 2 = ρ , na Eq. (1.11E), temos: n = ρ / ρ0 , ou:
ρ
n= → ρ= n 2 ρ0 . (1.12)
ρ0

Uma dedução para a fórmula de arrastamento do éter pode ser obtida através do cenário
ilustrado na Fig. (10), onde há um bloco de vidro de índice de refração n , que se desloca através do éter
com velocidade v . A figura (10) ilustra dois pontos de vista:

(a) referencial do éter, Σ , no qual o bloco se move com velocidade v .


(b) referencial do bloco, Σ′ , que tem o ponto de vista de um observador parado em relação
ao bloco.

Vamos descrever primeiramente o ponto de vista do bloco de vidro, Σ′ . Neste, o bloco é


permeado por um vento de éter que se aproxima com velocidade w0 = − v (fora do bloco). Dada a
interação entre o meio transparente e o éter, a velocidade do vento de éter dentro do bloco é suposta
diferente, w ( w ≠ w0 ). Supondo que a densidade de éter dentro do bloco é constante, o fluxo de éter

19
que entra no bloco por unidade de tempo, φin = w0 Aρ 0 , deve ser igual ao fluxo de éter que sai bloco por
unidade de tempo, φout = w1 Aρ , onde A é a área de seção transversal do bloco. Fazendo φin = φout ,
temos: w0 ρ 0 = w1ρ , o que leva a:
ρ0 v
w1 = w → w1 = , (1.13)
ρ 0 n2

onde fizemos uso da Eq. (1.12). A Eq. (1.13) fornece a velocidade do vento de éter dentro do bloco, que
realmente resulta diferente da velocidade do vento de éter fora do bloco, v .

Figura 11: (a) ilustração do movimento de um bloco de vidro de seção transversal A com velocidade v no éter (ponto
de vista do Ref. Σ do éter); (b) ponto de vista do Ref. Σ′ : bloco de vidro parado sendo permeado pelo vento de éter
que se aproxima com velocidade – v. Figura retirada da Ref. [6].

Sabemos que a velocidade da luz no vidro é c / n . Essa será a velocidade da luz dentro de um
bloco de vidro parado em relação ao éter. A partir desse momento vamos nos referir a c / n como a
velocidade da luz no éter-vítreo. Porém, o bloco da Fig. (10) não está parado em relação ao éter, o que
gera valores de velocidades distintos de c / n em relação ao bloco. Quando o bloco se move em relação
ao éter (ou o éter se move em relação ao bloco), podemos determinar a velocidade da luz dentro do
bloco (permeado pelo vento de éter) através de uma soma galileana de velocidades. Faremos isso a
seguir para duas ondas de luz que se deslocam em sentidos opostos:

a) Na situação em que a luz se move no mesmo sentido do vento de éter (da direita para esquerda),
a velocidade da onda (medida no referencial do bloco) terá magnitude dada por c / n
(velocidade da luz no éter-vítreo) somada à velocidade do vento de éter, w1 , ou seja,
c+′ c / n + w1 . Em detalhes,
=
c  c v 
c+′ =
−  + w1  =
− + 2  , (1.14)
n  n n 
onde o sinal negativo global (simplesmente) designa propagação da luz no sentido contrário ao do eixo-x.

b) Na situação que a luz se move no sentido oposto ao vento de éter (da esquerda para a direita), a
velocidade da onda (medida no referencial do bloco) terá magnitude dada por c / n
(velocidade da luz no éter-vítreo) subtraída da velocidade do vento de éter, w1 , ou seja,
c−′ c / n − w1 . Em detalhes,
=

20
c c v
c−′ = − w1 = − 2 . (1.15)
n n n
Estas são as velocidades da luz dentro do bloco de vidro (medidas no referencial de repouso do bloco -
Ref. Σ′ , que é varrido pelo vento de éter). Podemos agora avaliar essas duas velocidades do ponto de
vista do referencial do éter, no qual o bloco desloca-se com velocidade +v , simplesmente fazendo a
soma galileana devida, que no caso consiste em somar +v para os dois sentidos de propagação:
c= c+′ + v , Σ c=
Σ + − c−′ + v . Temos:
c v  c v  c  1  

Σ c+ c+′ + v =
= − + 2  + v =
− + 2 − v =
−  − 1 − 2  v  , (1.15)
n n  n n  n  n  

c v  c v  c  1 
Σ c− = c−′ + v =  − 2  + v =  − 2 + v  = + 1 − 2  v. (1.16)
n n  n n  n  n 

Vemos assim que o módulo da velocidade dos feixes de luz, que se propagam para a direita ou
esquerda, em relação ao éter, é dada por:
c  1  
Σc =  ± 1 − 2  v  .
n  n  

Do ponto de vista do referencial de repouso do éter, tanto a onda de luz que desloca para a direita quanto
a que se desloca para a esquerda tem sua velocidade afetada pelo fator (1 − 1/ n ) v , como se o éter
2

tivesse sendo arrastado junto com o bloco com a velocidade efetiva (1 − 1/n ) v , o que coincide com
2

termo dado em (1.11). Esta é a origem do fator de arrastamento do éter de Fresnel: χ = (1 − 1 / n 2 ) .

De acordo com a teoria de Fresnel, se o meio transparente estivesse em repouso, a


velocidade da luz seria dada simplesmente por c / n . Se houvesse um arrastamento total do éter,
teríamos um cenário de χ = 1 . A velocidade da luz seria estabelecida como c / n ± v , conforme a onda
se locomovesse no mesmo sentido ou no sentido posto ao éter. Porém, como o éter era apenas
parcialmente arrastado pelo corpo transparente, Fresnel concluiu que a velocidade da luz dentro desse
corpo em movimento, quando medida pelo observador parado no éter, seria:

u=
c
n
c
(
± ξ v = ± 1 − 1/ n 2 v .
n
) (1.17)

A teoria de Fresnel, quando aplicada ao experimento de Airy (telescópio cheio com água) e
ao experimento de Arago, mostrou que existiam alguns termos em primeira ordem em v/c que se
cancelavam, explicando o resultado nulo desses experimentos. Desta forma, a teoria de Fresnel explicou
a impossibilidade de detectar o movimento da Terra relativo ao éter através de experimentos sensíveis a
primeira ordem em v/c. A seguinte passagem ilustra bem este resultado: Fresnel mostrou que a refração
processada sobre um prisma em movimento [em relação ao éter] equivale à refração sobre um prisma
em repouso, isso se a precisão limita-se à primeira aproximação em v/c. A partir dessa equivalência,
Fresnel explicou o resultado nulo encontrado por Arago em sua experiência de 1810. A aproximação
usada na demonstração de Fresnel não causava nenhum problema, uma vez que precisão experimental
da época não podia fornecer valores de ordem superior.

A teoria de Fresnel foi diretamente testada por um experimento concebido especialmente


para este fim por Fizeau e Foucault, em 1851. Tal experimento, comumente discutido em textos sobre
teoria da relatividade, consistia em fazer passar luz por um tubo de vidro em forma de U por dentro do

21
qual havia fluxo de água com velocidade v. A observação de um deslocamento no padrão de franjas de
interferência entre os feixes de luz emergentes do tubo levou Fizeau a concluir que a teoria do
arrastamento parcial do éter era correta, conferindo grande credibilidade à teoria de Fresnel, que passou
a desfrutar de enorme prestígio. A experiência de Fizeau foi repetida em 1886 por Michelson e Morley,
novamente confirmando as previsões de Fresnel com um grau de precisão ainda maior.

1.6) UM EXPERIMENTO PARA VERIFICAR A TEORIA DE FRESNEL - Experiência de Fizeau Medida


do Coeficiente de arraste do éter pelos corpos materiais

A teoria de Fresnel para o arrastamento parcial do éter por meios transparentes foi testada
experimentalmente por Fizeau, em 1851. É importante destacar que na época da realização desse
experimento o objetivo era verificar se um meio material arrastava o éter e, por consequência, também a
luz. O verdadeiramente interessante é que o experimento de Fizeau realmente conduziu a um resultado
positivo 27, interpretado como um arrastamento parcial do éter 28. Abordaremos o processo de
funcionamento do aparato de Fizeau e mostraremos o resultado obtido a partir da sua experiência.

Para obter um efeito de arrastamento, Fizeau fez passar água (meio em movimento) através
de dois tubos de vidro (os quais têm seções terminais planas), de acordo com o esquema mostrado pela
Fig. 10, onde se visualiza uma fonte de luz S, que lança luz sobre um espelho semi-refletor G, onde o
raio original de separa em dois: um segue em direção ao espelho M, perfazendo o circuito S2MS1G em
sentido anti-horário, o outro segue em direção ao espelho M, percorrendo o circuito GS1MS2 em sentido
horário. No espelho G, esses dois feixes refletidos são novamente divididos em dois, havendo então uma
superposição das partes que se propagam em direção ao telescópio de observação, que determina o
aparecimento de um padrão de franjas no ponto S’. Cada tubo (longitudinal ao movimento da luz) do
aparato de Fizeau possui comprimento L . Veja que a disposição geral do aparato de Fizeau guarda
várias semelhanças com a disposição e características de um interferômetro óptico.

O experimento de Fizeau consiste em observar o padrão de franjas formado pelos raios quando
os tubos estão cheios de água (inicialmente estática), e a consequente variação sofrida por este padrão
de interferência (deslocamento de franjas) quando a velocidade de vazão da água dentro do tudo é
variada. É possível mostrar que, se o éter é arrastado (mesmo que parcialmente) pela água deslocando-
se com velocidade v A , há a previsão de um deslocamento mensurável de franjas em decorrência da
variação do caminho óptico da luz.

27 Pode parecer assombroso como um experimento que lida com movimento de água dentro de tubos de vidros (em
baixíssima velocidade quando comparada à velocidade da luz) possa evidenciar um resultado positivo concernente à
hipótese de arrastamento do éter. Ocorre que o experimento de Fizeau é um experimento de interferometria, que
tipicamente possui sensibilidade da ordem do comprimento de onda da luz usada. O resultado do experimento de
Fizeau é em primeira ordem em v A / c , sendo v A a velocidade da água dentro do tubo. Como v A é da ordem de
alguns metros/segundo, obtém-se v A / c  10−8 , valor bastante diminuto, mas compatível com a magnitude do
comprimento de onda da luz usado, λ = 5 × 10−7 m . Observe que se o experimento de Fizeau fornecesse um
resultado em segunda ordem em v A / c , o efeito a ser medido seria da ordem de 10−14 − 10−16 , o que obviamente
estaria muito além da capacidade experimental da época.
28
A interpretação deste experimento foi definitivamente alterada com o advento da TRR, que o explica
simplesmente como uma adição relativística de velocidades, de maneira totalmente independente de qualquer alusão
ao éter como um referencial privilegiado. Portanto, com a entrada da TRR no cenário teórico do século XX, o
experimento de Fizeau, assim como vários outros experimentos ópticos do século XIX, passam a ser vistos como
fenômenos que ratificam as leis da TRR.

22
Figura 12: Visão esquemática do aparato de Fizeau

É fato conhecido que a velocidade da luz num meio material é igual a c n , sendo n o índice de
refração do meio. Se esse meio material estiver em repouso relativo ao éter, c / n será também a
velocidade da luz relativa ao éter, como já sabemos. É importante ainda observar que:

• Caso o meio esteja em movimento em relação ao laboratório e não arraste éter consigo, então a
velocidade da luz continua sendo c n para o referencial do laboratório (suposto parado em
relação ao éter).
• Caso o éter fosse totalmente arrastado com a água, a velocidade da luz em relação ao sistema
do laboratório seria obtida a partir da lei clássica de composição de velocidades, sendo igual a
c n + v A (quando a luz atravessa o tubo no mesmo sentido do fluxo de água) e c n − v A
(quando a luz atravessa o tubo no sentido oposto ao da água).
• Neste experimento, como simplificação inicial considera-se o éter parado em relação ao
referencial do laboratório, por escolha.
• Como Fizeau não conhecia a magnitude do arrastamento do éter, ele usou um coeficiente α
para quantificá-lo. Para α < 1 , teríamos o caso de um arrastamento parcial, e para α = 1 ,
arrastamento total do éter. Nessa situação, para o feixe de luz que percorre em sentido contrário
ao fluxo de água, a velocidade seria igual a: c n + α v A , enquanto para o outro feixe a
velocidade seria igual a: c n −α vA .
• Os tempos de percurso dos dois feixes, t1 no caminho S2MS1G, e t 2 no caminho GS1MS2, são:
2L 2L
t1 = , t2 = . (1.26)
c n + αvA c n −αvA

A diferença de tempo de percurso dos dois feixes, ∆t = t 2 − t1 , é dada por:

23
2L 2L 4 Lα v A
=∆t − →
= ∆t . (1.27)
c n −αvA c n + αvA ( c n ) 2 − (α v A ) 2
Este resultado pode ser expresso numa forma com dependência linear em (v A / c) . Para isto,
devemos colocar ( c n ) em evidência no denominador e, em seguida, expandi-lo em série de Taylor até
2

segunda ordem em (v A / c) . Obtemos assim:

4 Lα v A 4n 2 Lα v A   α v A n  
2
=∆t   
1 +  , (1.28)
( c / n )2 1 − (α v A n / c )2  c2   c  

onde foi usado a seguinte aproximação (binomial ou Taylor): [1 − (α v A n / c ) ]−1 ≅ 1 + (α v A n / c ) , uma


2 2

vez que (α v A n / c )  1 . Desprezando os termos em ordem superior a (u / c) 2 , obtemos:


2

4n 2α v A L
∆t ≅ . (1.29)
c2
Este resultado implica numa diferença de caminho óptico ( ∆x = c∆t ),
4n 2α v A L
∆x ≅ ,
c
que está associada a um determinado padrão de interferência ou franjas. Se a diferença de caminho
óptico permanecer constante, o padrão de interferência fica imutável. Por isso, em experimentos de
interferometria existe o propósito de fazer a diferença de caminho óptico variar. Como no experimento de
Fizeau, ∆x é uma função da velocidade da água, o experimento é então rodado com água em
movimento ( ∆xi ) e com água em repouso ( ∆x f ), sendo observada a variação no padrão de franjas entre
essas duas situações, o que pode ser medido visualmente através do deslocamento de franjas. O
número de franjas que se deslocam (no padrão de interferência) é dado por:

∆x f − ∆xi ∆x f 4n 2α L  v A 
=
∆N = → =
∆N
λ  c 
. (1.30)
λ λ
Essa última fórmula mostra que o experimento de Fizeau prevê a obtenção de um resultado para o
deslocamento de franjas em primeira ordem em v A / c , de acordo com o que já fora dito antes.
Na experiência de Fizeau, foram utilizados os seguintes valores aproximados: L = 1,5 m ,
v A = 7 m / s (velocidade da água), λ = 5,3 ×10 −7 m , n = 1,33 (índice de refração da água), sendo
observado um deslocamento de franjas de N = 0, 23 (deslocamento de franja observado em que relação
a situação inicial: v A = 0 ). Substituindo todos estes valores na eq. (1.30), obtemos o coeficiente de
arrastamento do éter pela água:
α ≅ 0, 48 . (1.31)

Esse resultado numérico está em razoável concordância com a previsão teórica de Fresnel para este
experimento, α= (1 − 1/ n 2 ) , que com n = 1,33 , fornece α ≅ 0, 43 .
A experiência de Fizeau mostrou-se compatível com hipótese do arrastamento parcial do éter
de Fresnel, dando grande credibilidade à teoria de Fresnel na segunda metade do século XIX. Em
resumo: supondo o éter em repouso, a experiência de Fizeau mostrou que a velocidade da luz sofre uma
pequena variação devido a um arrastamento parcial do éter causado pelo movimento da água, o que de

24
fato enfraquece a hipótese de arrastamento total do éter (éter de Stokes 29). Essa experiência foi repetida
por Michelson e Morley, em 1886, e por P. Zeeman e seus colaboradores, na Holanda, durante os anos
compreendidos entre 1914 a 1922, tendo sido obtido, em ambas versões, uma maior precisão. Os novos
resultados confirmaram novamente a previsão de Fresnel e Fizeau para o valor do coeficiente de
arrastamento.
No meado do século XIX havia um cenário científico praticamente decidido a favor da teoria
ondulatória da luz. A dificuldade era entender os resultados dos diversos experimentos realizados para
detectar o movimento da Terra relativo ao éter. A Tabela seguinte resume aspectos destas duas teorias
da luz em relação a diversos experimentos de interesse na época.

TEORIA CORPUSCULAR TEORIA ONDULATÓRIA DA LUZ


DA LUZ
Interferência e difração da Não explica Explica
luz

Polarização da luz Não explica Explica


Velocidade da luz em meios Maior que c Menor que c
materiais transparentes
Aberração estelar Explica realizando soma Explica, exigindo um éter estático (em
galileana de velocidades para relação ao Sol) e não arrastado pela Terra:
os corpúsculos de luz Terra se movendo em relação ao éter
Experimento de Arago Não explica Explica, exigindo um éter totalmente
arrastado - imóvel relativo à Terra
Experimento de Airy Não explica Explica, exigindo um éter parcialmente
arrastado – segundo teoria de Fresnel
Experimento de Fizeau Pode explicar, se as Explica, exigindo um éter parcialmente
partículas de luz forem arrastado – segundo teoria de Fresnel
arrastadas pela água
Experimento de M-Morley Explica Explica, se a Terra não se move em
com luz terrestre relação ao éter

Com a teoria de Fresnel e o resultado do experimento de Fizeau, a hipótese do


arrastamento total do éter é bastante enfraquecida, ainda mais porque também se contrapunha à
observação da aberração estelar. No geral, a teoria de Fresnel conseguiu o que parecia impossível,
conciliar dois resultados aparentemente contraditórios: o resultado do experimento de Arago e as
observações da aberração estelar. Estes dois fenômenos pareciam clamar por explicações opostas, pois
enquanto o resultado nulo de Arago podia ser explicado pela idéia de um éter totalmente arrastado pela
Terra, a aberração estelar mantinha a idéia de um éter estático e não arrastado. A capacidade de explicar
estes dois fenômenos irreconciliáveis à primeira vista, e muitos outros fenômenos sensíveis à primeira
ordem em v/c concedeu à teoria de Fresnel o status de a grande teoria para a óptica dos meios materiais
transparentes em movimento em todo o século XIX. Todos aqueles que depois desenvolveram teorias
para explicar a eletrodinâmica dos corpos em movimento estavam preocupados em obter resultados em
concordância com os resultados da teoria de Fresnel.

Exemplo Resolvido: Uma alternativa ao uso do fluxo água no experimento de Fizeau, que é prejudicado
por efeitos de turbulência, é realizá-lo usando um disco de vidro em rotação, tal como ilustrado na Fig.
(11). (a) Sendo ω a velocidade angular do vidro, n o índice de refração, e α o coeficiente de

29 Além desse resultado, a hipótese do arrastamento entra em contradição também com


aberração estelar e, como tal contradição não foi superada ou contornada, a hipótese do arrastamento do
éter foi logo abandonada.

25
arrastamento do éter, determine a diferença de caminho óptico entre os dois feixes de luz ao chegar no
telescópio.

Solução: Neste caso, devemos saber qual velocidade o disco girante comunica aos feixes de luz por
meio do mecanismo de arrastamento do éter. No caso em que o movimento do bloco através do éter é
translacional com velocidade V, sabemos que a velocidade transferida ao feixe de luz é ± (1 − 1 / n 2 )V ,
caso este se mova paralelo ou antiparalelamente ao bloco.

Figura 13: (a) Ilustração de um disco de vidro girante com velocidade angular ω , atravessado por dois feixes de
luz: um propagando-se no sentido da rotação, outro em sentido oposto. (b) Esquema geométrico para cálculo da
velocidade do feixe horizontal no ponto no ponto A.

Figura 14: Ilustração artística do experimento do disco girante

Precisamos então determinar qual a velocidade do bloco de vidro ao longo do caminho que a luz
percorre. Observando o ponto A na Fig. (11b), percebemos a sua velocidade ao longo do eixo-x será:
v x = v A cos θ , sendo v A = ω s , e r = h / cos θ , de modo que v x = ω h , onde=h R2 − l 2 / 4 é o
comprimento do segmento o centro do círculo ortogonalmente ao segmento l . Por esse procedimento, é
fácil perceber que a velocidade-x de qualquer ponto ao longo do segmento l será v x = ω h , ou melhor:

ωR
v x = ω R2 − l 2 4 = 4 − l 2 R2 .
2

Os trechos da trajetória ao longo do eixo-y estão fora do disco e não são afetados pela rotação. Os
feixes de luz que percorrem os segmentos horizontais do bloco em sentido horário (e anti-horário) terão
velocidades (em relação ao um observador parado em relação ao éter) iguais a:

26
c 
 n ± ξ v x  ,
com ξ= (1 − 1/ n ) . As partes dos feixes que se propagam fora do bloco estão sob as mesmas
2

condições e, portanto, não contribuem no cálculo da diferença de tempo de percurso, que resultam iguais
a:

2l 2l
t1 = , t2 = ,
c n + α vx c n − α vx

A diferença de tempo de percurso é:


2l 2l 4lα v x
=∆t − = . (1.31)
c n + α vx c n − α vx ( c n ) 2 − (α v x ) 2

4n 2lα v x 2n 2lα
∆t  2
= 2
ω R 4 − l 2 R2 . (1.32)
c c
A diferença de caminho óptico, ∆l = c∆t , vale:

2n 2lα V 4 − l 2 R 2
∆x = . (1.33)
c

Para um disco com R = 1m , ω = 10π rad / s (5 voltas por segundo),


= n 1,33, α ≅ 0,43 e l = 1,5m ,
obtemos: ∆x =98,8 / c . O número de franjas que se desloca nesse caso, entre a situação de disco
parado e girando com ω = 10π rad / s , é dado por, N = ∆x λ , ou seja:

98,8 98,8
=
N = = 0,57 . (1.33b)
cλ 174

1.7) O EXPERIMENTO INTERFEROMETRIA DE MICHELSON-MORLEY

O conceito de éter, como referencial privilegiado, está diretamente associado à idéia de que
a velocidade da luz relativa ao mesmo assume um valor fixo e determinado (no caso c ). Tal valor
seria uma prerrogativa apenas deste meio e, por conseguinte, de todos os referenciais inerciais em
repouso em relação a tal meio. Todos os outros referenciais inerciais, em movimento relativo ao éter,
  
mediriam uma velocidade de propagação da luz diferente de c , dada por: c′= c + u , como já explicado.

Atualmente, quando afirmamos que a velocidade da luz no vácuo é c , não mencionamos o


sistema de referência em relação ao qual este valor foi medido. Entretanto, era inconcebível, em fins do
século XIX, aceitar que a luz e outras ondas eletromagnéticas pudessem se deslocar vácuo, sem um
meio de propagação material. Se a existência do éter pudesse ser estabelecida, c = 1/ ε 0 µ0 seria
naturalmente considerado como o valor da velocidade em relação a este meio, em plena analogia ao fato
da velocidade do som ser sempre tomada como referência ao seu meio de propagação (o ar). Esta é
uma idéia-chave para o entendimento da nossa definição de referencial privilegiado.

A experiência adequada para detectar um movimento em relação ao éter seria aquela na


qual pudéssemos medir a velocidade da luz em diversos sistemas inerciais diferentes. De acordo com a

27
lei de adição de velocidades da mecânica newtoniana, seriam obtidos diferentes valores dados por
   
c′= c + u , onde u é a velocidade do referencial inercial (em que é feita a medida) relativa ao éter.
Uma questão que surge é como realizar um mesmo experimento deste tipo em diferentes
referenciais inerciais, sem ter que ficar deslocando o aparato de um referencial para outro, ou seja, sem
ter que ficar mudando de referencial a todo instante, para efeito de comparação de medidas. A resposta a
esta questão é muito simples: vivemos num referencial não-inercial (Terra), dotado de uma velocidade
orbital (relativa ao Sol) da ordem de u  30km / s , que em cada época do ano aponta em direções
diferentes do espaço, ou seja, a Terra, em cada época do ano, pode ser tomada como um referencial
inercial diferente. Portanto, um experimento adequado poderia ser realizado aqui mesmo na Terra,
repetindo-o ao longo das diversas estações do ano 30.

Importante: A confirmação experimental de valores distintos para a velocidade da luz, medidos em


sistemas inerciais diferentes, seria um forte indicativo da existência de um sistema privilegiado, em
relação ao qual a velocidade da luz assumisse o valor de uma constante universal 31.

A título de justiça histórica, condiz afirmar que vários experimentos para detectar o movimento da
Terra relativo ao éter haviam sido propostos e realizados ao longo do século XIX. Entre estes, pode-se
citar o experimento de Arago, de Airy, Hoek, Mascart e Jamim. Todos estes experimentos, cujos efeitos
previstos eram proporcionais a u / c (onde u é a velocidade do referencial em questão relativa ao éter)
falharam na tentativa de detectar o movimento da Terra relativo ao éter. A teoria de Fresnel do
arrastamento parcial do éter notabilizou-se a explicar o resultado nulo destes experimentos, criando a
convicção de que o movimento da Terra relativo ao éter não poderia ser revelado por nenhum
experimento de primeira ordem em u / c (sensibilidade de 1 parte em 104 ). A teoria de Fresnel continuou
sendo bem cotada até o ano de 1887, ano do decisivo experimento de Michelson-Morley.

Também é importante destacar que Lorentz havia conseguido explicar os resultados nulos dos
experimentos de primeira ordem em u / c através de sua teoria para o elétron, desenvolvida a partir de
extensões da teoria de Maxwell. Nesta teoria, Lorentz parecia ter conseguido reconciliar as evidências
experimentais disponíveis antes de 1880 com a hipótese de um éter totalmente imóvel (não sofria
nenhum arrasto). Lorentz conseguia assim explicar a fórmula de Fresnel para a velocidade da luz em
meios materiais em movimento sem lançar mão da hipótese do arrasto. A teoria de Lorentz, entretanto,
2 2
previa que um experimento de detecção do éter, sensível em u / c , deveria acusar um resultado
positivo. Após o experimento de Michelson-Morley, Lorentz propôs-se a alterar sua teoria de modo a
reconciliá-la com o resultado deste experimento. Para maiores detalhes, vide refs. [10], [11], e
principalmente ref. [12].

Por volta de 1870 estava claro que um experimento para detectar o éter deveria ter sensibilidade
2 2
em u / c , ou seja, de 1 parte em 108 . De fato, em um artigo publicado na Enciclopédia Britânica 32,
Maxwell já escrevera: “Se fosse possível determinar a velocidade da luz observando o seu tempo
de ida e volta a duas estações fixas na superfície da Terra, nós poderíamos também, comparando
as velocidades de ida e volta, determinar a velocidade do éter em relação a estas estações
terrestres. ... Todos os métodos de determinação da velocidade da luz, por meio de experimentos
terrestres, são baseados no tempo de ida e volta da luz entre duas estações de medida. A
variação de tal tempo devido ao movimento da Terra relativo ao éter é de um centésimo-
milionésimo do tempo total de ida e volta, o que é uma quantidade totalmente não mensurável”.

30
E nem poderia ser diferente, já que a Terra era de fato o único referencial de medida disponível na época. Como
veremos mais a frente, foi usado um artifício que tornou desnecessário a repetição do experimento em diversas
épocas do ano para efeito de comparação.
31
Observe que esta hipótese também pressupõe que as transformações de Galileu sejam corretas.
32
J. Clerk Maxwell, artigo sobre o éter publicado na Enciclopédia Britânica, Vol. 8 (9a edição). Ver também em: J.
Clerk Maxwell, “Scientific Papers”, Vol. 2, 763-775, Dover Publications, Inc, New York, 1952.

28
Michelson havia sido alertado desta dificuldade ao tomar conhecimento de uma correspondência
de Maxwell endereçada para D. P. Todd 33. Certamente, este foi um dos motivos que o levou a inventar o
interferômetro óptico, planejar e realizar o experimento com a sensibilidade desejada 34 para detectar o
movimento da Terra relativo ao éter.

O experimento de Michelson-Morley é, sem dúvida, um dos mais importantes, conhecidos e


comentados da história da ciência. Tal experimento, concebido para detectar o movimento da Terra
relativo ao éter, é baseado na interferência da luz, fenômeno tipicamente ondulatório, uma vez que as
leis estabelecidas da Óptica Geométrica não são adequadas para explicá-lo. Tal fenômeno pode ser
definido na forma: “a interferência óptica consiste na interação entre duas ou mais ondas com a geração
de um efeito luminoso que difere da simples soma dos efeitos de cada onda em separado.” 35 Isto
significa que, quando ondas idênticas provenientes de duas fontes superpõem-se em um ponto do
espaço, a intensidade resultante das ondas combinantes naquele ponto pode ser maior (interferência
construtiva) ou menor (interferência destrutiva) do que a intensidade de cada uma delas tomada
separadamente. Uma experiência de interferência de luz (interferometria) para proporcionar um padrão
de interferência bem definido requer que os feixes de luz sejam coerentes 36. A primeira experiência,
envolvendo este fenômeno, a notabilizar-se em meio à comunidade científica, foi o célebre experimento
da fenda dupla de Thomas Young, famosa por revelar a natureza ondulatória da luz no início do século
XIX. À despeito de utilizar a interferência da luz no seu desenvolvimento, é importante que se diga que o
experimento de Michelson-Morley não tem por objetivo estudar o padrão de interferência resultante ou as
propriedades ondulatórias da luz em si; o padrão de interferência formado é usado como meio indireto
para obter informações sobre a velocidade da Terra em relação ao éter.

O aparelho que Michelson e Morley utilizaram para a realização da sua famosa experiência é
chamado de interferômetro óptico 37, inventado pelo físico americano Albert A. Michelson 38 por volta de
1880, com o objetivo de realizar experimentos de espectroscopia de alta precisão. A primeira versão

33De acordo com Shankland (vide ref. [10]), Michelson entrou em contato com tal correspondência, datada de
março/19179, quando estava no “Nautical Almanac Office”, onde na mesma época também estava lotado David
Peck Todd.
34
Uma explicação para ordem de magnitude em u 2 / c 2 vem de comparações teóricas que ainda estão inacessíveis
2 2
neste estágio de estudo. Entretanto, uma boa idéia da origem do fator u / c pode advir da comparação da equação
de onda válida para o potencial escalar ( φ ), escrita no referencial de repouso do éter e num referencial em

movimento relativo ao éter com velocidade u . Tais equações são apresentadas no Apêndice deste capítulo. É fácil
2 2
observar que essas equações diferem entre si devido à presença de termos em u / c na equação de onda. Outra
explicação advém das expressões dos tempos de percurso da luz ao longo dos braços do interferômetro (argumento
de Maxwell), dadas pelas eqs. (10) e (11). É fácil perceber que tais equações diferem do tempo de ida e volta
2 2
calculado no caso do aparato estar parado junto ao éter por um fator proporcional a u / c .
35
Vide ref. [9], p. 228.
36
Para fazer experiências de interferência com a luz, usualmente é necessário dividir a luz proveniente de uma única
fonte em duas componentes, devido à exigência de que os feixes interagentes sejam coerentes. O conceito de
coerência está associado à fase dos "trens de onda" que compõem um feixe de luz, uma vez que é necessário que
trens de onda de mesma fase se superponham para que haja interferência. Há muitas maneiras de estabelecer a
coerência dos feixes de luz interagentes. Hoje em dia, esta questão não é mais um problema, uma vez que
experimentos de interferência são realizados preferencialmente com luz laser, que tem elevado comprimento de
coerência.
37 Esse instrumento hoje em dia é usualmente encontrado em laboratórios de ensino de óptica, onde é frequentemente

usado para medir comprimentos de onda ou variações de comprimentos com grande precisão, por meio da contagem
das franjas de interferência (variação no padrão de interferência).
38
Albert A. Michelson foi formado na Escola Naval norte-americana em 1873. Após sua formatura, dedicou-se a
diversos experimentos concebidos com o objetivo de medir a velocidade da luz com grande precisão, o que lhe
rendeu certa notoriedade na Europa. Notabilizou-se pela Invenção do interferômetro óptico, concepção e realização
do experimento que mostrou a impossibilidade de detectar o éter. Foi o primeiro físico norte-americano a ser
laureado com o Prêmio Nobel.

29
deste experimento foi realizada por Michelson, em 1881, em Postdom, não conduzindo a um resultado
conclusivo. De fato, esta primeira versão previa a observação de um deslocamento de 0,04 franjas,
enquanto um deslocamento de 0,02 franjas foi observado. Ocorria que tal deslocamento, de tão pequeno,
poderia estar sendo ocasionado por razões espúrias. Em 1887, junto com E. W. Morley, foi levada a cabo
uma segunda versão deste experimento, mais precisa e confiável, cujo aparato experimental está
mostrado na Fig.13. Nesta nova versão, Michelson e Morley montaram seu aparelho em um bloco de
pedra maciça, flutuante sobre mercúrio líquido, para obter estabilidade e para amenizar os efeitos de
pequenas vibrações, e ao mesmo tempo permitir que o aparato pudesse ser girado em torno de um eixo
central sem corromper o padrão de interferência (por efeitos de vibração). Além disto, o caminho óptico
da luz ao longo dos braços do aparelho foi substancialmente aumentado, o que permitiu a previsão de
um maior efeito resultante. Entraremos, a seguir, em mais detalhes acerca da experiência de Michelson-
Morley. Na Fig.12, exibida a seguir, é visualizado o aparato do interferômetro de Michelson usado no
experimento de Postdam. Na Fig. 13, é exibida ilustração do aparato usado no experimento de Cleveland
(1887). Observe que o último é bem mais elaborado que o primeiro.

Vejamos agora como funciona a lógica do experimento de Michelson-Morley. Tendo por


objetivo detectar a presença do éter, tal aparato deve ser capaz de detectar pequenas variações da
velocidade da luz em relação a um observador postado na Terra, referencial móvel onde se realiza o
experimento, em contínuo deslocamento em relação ao éter 39.
De fato, como prevê a lei de composição de velocidades da Mecânica Clássica, o observador
parado em relação ao aparelho deve medir valores diferentes para a velocidade da luz, que um suposto
observador parado em relação ao referencial do Sol (ref. do éter). Se tal observador realmente obtiver
valores diferentes (para a velocidade da luz), em medidas realizadas em instantes distintos, tem-se então
uma clara indicação da existência do éter. O objetivo do experimento de Michelson-Morley era
justamente comparar medidas da velocidade da luz, realizadas da Terra em instantes diferentes.

É necessário agora localizar a fonte de luz. De acordo com a descrição esquemática do


interferômetro, percebe-se a presença de uma única fonte de luz, parada em relação ao aparelho,
representado de uma forma simplificada na Fig. 13. Tal fonte emite luz em direção a um espelho P semi-
transparente, inclinado de 45º em relação à direção da luz incidente, onde o feixe luminoso é separado
em outros dois feixes, o primeiro sendo encaminhado ao espelho M1, o segundo ao espelho M2, onde são
refletidos, retornando em seguida ao espelho P. Nesse ponto, os dois feixes sofrem nova divisão, sendo
uma parte transmitida, outra refletida. O que nos interessa são as duas partes transmitidas de cada um,
que sofrem interferência, produzindo um padrão de franjas detectado a partir do ponto de observação.
Este padrão de franjas é o elemento observável desta experiência, sendo sensível a qualquer mudança
de caminho óptico.


39
Considerando o éter em repouso em relação ao Sol, a velocidade orbital da Terra v em torno do Sol será igual à
velocidade da Terra em relação ao éter. Deste modo, ao longo do ano, a velocidade da Terra relativa ao éter está em
contínua variação. É importante frisar que estamos desprezando a velocidade de rotação da Terra em torno do seu
eixo, pois a mesma confere a um ponto na sua superfície uma velocidade de apenas 0, 46km / s , desprezível
perante a velocidade orbital (  30 Km / s ).

30
Figura 15: Ilustração do interferômetro de Michelson usado em 1881.


No esquema da Fig. 14, v representa a velocidade da Terra em relação ao éter,
supostamente parado em relação ao Sol. É importante ressaltar que o interferômetro está fixo na Terra,

sendo assim, o aparato também se desloca com velocidade v . Portanto, a Terra e o interferômetro
movem-se juntos, através do éter, com uma velocidade média de 30 km/s (velocidade orbital da Terra)
em diferentes direções, de acordo com as estações do ano 40.

No entanto, ao longo do tempo ( ∆t ) de realização do experimento (alguns minutos), a



velocidade v pode ser tomada como constante, uma vez que ∆t é muito pequeno para implicar numa

mudança significativa de direção da Terra ( v ≅ cte ). Portanto, durante este intervalo de tempo a Terra
pode ser considerada um referencial inercial, uma vez que estamos desprezando o efeito da sua rotação
intrínseca, pelo motivo já apresentado.

Figura 16: Interferômetro de Michelson-Morley usado no experimento de 1887

40 Observe que a Terra é um referencial não-inercial, podendo ser considerado inercial apenas num pequeno

intervalo de tempo em que o seu vetor velocidade varie de uma quantia desprezível em direção.

31
Considerando que os espelhos M1 e M2 formam entre si um ângulo de 90º, veremos, no
ponto de observação, as franjas de interferência, como mostra a Fig. 15, consistindo de linhas (máximos
e mínimos de intensidade da luz) aproximadamente paralelas.

Definimos L1 e L2 como os comprimentos dos braços 1 e 2, respectivamente. Determinaremos a


diferença de fase entre os feixes transmitido e refletido pelo espelho P, lembrando que a diferença de
fase está associada a uma diferença de caminho óptico, que resultará no padrão de interferência gerado
pelos dois feixes. Tal diferença de caminho óptico advém da diferença de velocidade da luz ao longo dos
braços 1 e 2 do interferômetro, e do fato dos braços 1 e 2 não serem estritamente iguais (L1 ≅ L2) quando
analisados na escala do comprimento de onda da luz visível ( λ ≅ 5 ⋅10 −7 m ).

Figura 17: Visão esquemática do interferômetro Figura 18: Franjas de interferência observadas
de Michelson-Morley no referencial da Terra no experimento de Michelson

Baseado na configuração da Fig. 15, supomos que o aparato de Michelson-Morley encontra-



se em movimento juntamente com a Terra, com uma velocidade v medida em relação ao sistema de
referência do éter, alinhada com a direção PM1. Portanto, calculemos o tempo total t1 que leva a luz para
ir desde P até o espelho M1 e retornar; para isto, vamos considerar um observador fixo na Terra, que
percebe a velocidade da luz como sendo ( c − v ) na ida, e ( c + v ) na volta, devido à fórmula galileana de
adição de velocidades. O valor do tempo de ida e de volta da luz ao longo do braço L1 (medido por um
observador postado na Terra) são dados por:
L1 L1
=t IDA = , tVOLTA .
c−v c+v
Então, o tempo de ida e volta é dado por:
L L L (c + v) + L1 (c − v)
t1 = 1 + 1 = 1 ,
c−v c+v c2 − v2

2 L1 1
t1 = . (1.34)
c 1 − v2 c2

De maneira análoga, vamos analisar o que ocorre no braço 2 do interferômetro, onde a luz
percorre um caminho transversal à direção do movimento do interferômetro (relativo ao éter).
Diferentemente do caso anterior, vamos considerar agora um observador agora parado no sistema de

32
referência do éter (Sol) 41, para o qual a configuração do caminho percorrido pelo segundo feixe de luz é
mostrado na figura abaixo:

Figura 19: Ilustração do caminho óptico da luz ao longo dos braços do interferômetro usado na versão de
Cleveland (1887)

vt 2

M2
ct 2 
v
2
P L2
vt2 / 2

Fig. (16b): Percurso transversal do segundo feixe de luz, visto por um observador parado no referencial
do Sol (ref. do éter).

O trajeto exibido na Fig. 16b é exatamente aquele que seria descrito por um observador
parado no éter, para o qual o espelho M2 (junto com todo aparato) desloca-se enquanto a luz trafega do

espelho P até M2. Neste caso, os espelhos movem-se através do éter com uma velocidade v e a luz
propaga-se pelo éter com uma velocidade c . Do ponto de vista deste referencial, a luz segue através da
hipotenusa dos triângulos retângulos de P a M2, e também de M2 a P. Portanto, o tempo total t2, neste
percurso de ida e volta, pode ser calculado como se segue:

41 Note que o tempo de percurso ao longo do braço 1 foi medido por um observador postado na Terra, enquanto o

tempo de percurso ao longo do braço 2 é medido por um observador postado no referencial do Sol (éter). Isto não
representa nenhum problema, uma vez que na mecânica newtoniana o tempo é absoluto (universal), e medidas de
intervalos de tempo são iguais para todos os referenciais. Pode ser mostrado que o cálculo do tempo t2 , realizado no
referencial da Terra, fornece o mesmo resultado exibido na eq. (9).

33
( )
2 2
 ct2  2  vt2 
 = L2 +   , t22 c 2 − v 2 =
4 L22 ,
 2   2 

2 L2 1
t2 = . (1.35)
c 1 − v2 c2

Tendo calculado t1 e t 2 , a diferença nos tempos de percurso nos braços 1 e 2, dada por
∆T = t 2 − t1 , resulta igual a:

2 
∆T = 
L2

L1 . (1.36)

c 1− v c
2 2 1− v c 
2 2
 

Esta diferença de percurso implica diretamente numa diferença de caminho óptico


∆X =( ∆T ) c , que explica a observação de um padrão de interferência estacionário. Mudanças ou
variações neste padrão de interferência ocorrem quando há uma mudança na diferença de
caminho óptico ( ∆X ) dos feixes de luz interagentes. Tal mudança seria ocasionada, por exemplo, se o
tamanho de um dos braços fosse alterado 42, mas também pode ocorrer devido a outros fatores, como
alteração da velocidade da luz ao longo dos braços.

Sabemos que a velocidade translacional da Terra ( v ) em torno do Sol está variando dia-a-

dia. O fato da velocidade v , relativa ao éter, não ser constante leva a pequenas variações diárias da
velocidade da luz em relação ao aparato 43. Tal mudança de velocidade resultaria também em diminuta
variação diária na diferença de caminho óptico, que por sua vez, implicaria na observação de pequenas
alterações no padrão de franjas de interferência. Para haver uma mudança mais significativa (mais
facilmente observável) neste padrão, seria necessário considerar uma maior variação da velocidade da
Terra relativa ao éter, associada a um maior intervalo de tempo, tal como o período de três meses, ao

longo do qual o vetor velocidade v efetua um giro de 90º. Observe que a mudança esperada no padrão
de interferência, decorrente da realização do experimento em dois momentos diferentes, constituiria a
confirmação da existência do éter. De fato, como já dito antes, um experimento capaz de detectar o éter
como referencial privilegiado é aquele que consegue acusar variações na velocidade da luz quando
medida por referenciais inerciais diferentes. Ao se tomar duas realizações do experimento de Michelson-
Morley em momentos diferentes, estamos comparando na realidade efetuando uma comparação indireta
entre medidas da velocidade da luz relativa a dois referenciais inerciais diferentes: a Terra agora e três
meses depois.
Entretanto, não seria admissível aguardar três meses, mantendo o experimento em
funcionamento, para observar tal efeito e o resultado correspondente. E de fato, Michelson e Morley não
esperaram uma mudança de estação, em vez disso, eles lançaram mão de um procedimento que
reproduz, em poucos minutos, a variação esperada para três meses: o giro de 90º do aparato! Desta
forma, torna-se possível comparar (em poucos minutos, o tempo de duração do giro) as medidas da
velocidade da luz feitas por dois referenciais inerciais diferentes: a Terra agora e a Terra 3 meses depois.
Se o éter existisse como referencial privilegiado, a velocidade da luz, medida pelo observador da Terra,
deveria mudar entre essas duas medidas, o que obviamente deveria implicar em uma mudança nos
tempo de percurso t1 e t2 , que por sua vez acarretaria uma mudança no padrão estacionário de franjas.
A nossa tarefa agora é estimar a magnitude da variação esperada no padrão de franjas, objeto final de
observação do experimento de Michelson & Morley.

42 Como este experimento foi realizado numa sala a temperatura constante, não era esperado qualquer mudança de

tamanho dos braços por efeito de dilatação térmica.


43
Supondo-se válidas as transformações galileanas.

34
Quando o giro de 90o do aparato é
realizado, os comprimentos L1 e L2 trocam de
papel e, sendo assim, o caminho PM1, tem
agora a direção transversal à direção do
movimento do aparato, enquanto o caminho PM2
coincide com a direção longitudinal do
movimento. Seguindo o mesmo procedimento
da situação anterior ao giro, determinaremos as
diferenças dos tempos de percurso nesta nova
configuração. Considere t1′ como o tempo de
percurso ao longo do caminho PM1 (direção
transversal), e t2′ o tempo de percurso ao longo
do caminho PM2 (direção longitudinal). Deste
modo, obtemos que:

2 L1 1 2 L2 1
=t1′ = , t2′ .
c 1− v c
2 2 c 1 − v2 c2

Temos agora uma nova diferença de tempos, ∆T ′ = t2′ − t1′ , dada por:

2  L2 L1 
=∆T ′  − . (1.37)
c  1 − v2 c2 − 2 2 
 1 v c 

Comparando as eqs. (1.36) e (1.37), verifica-se que a rotação do aparato modificou as diferenças de
tempos, ∆T . Podemos, agora, determinar a amplitude desta mudança, tomando a diferença da eq.
(1.37) pela eq. (1.36). Sendo assim, escrevemos a variação da diferença de tempo de percurso na
forma:

2  L2 L1 
− 2  L2 L1 
,
∆T ′ − ∆T
= − −
c  1 − v2 c2 − 2 2  c  1 − v2 c2 1 − v2 c2 
 1 v c   

2  L2 + L1 L2 + L1 
.
∆T ′ − ∆T
= − (1.38)
c 1− v c
2 2
1 − v2 c2 
 
Como (v c ) << 1 , podemos utilizar a expansão binomial e desprezar os termos superiores a segunda
2

ordem. Lembrando que:

1 1 1
≅ 1 + v2 c2 , ≅ 1 + v2 c2 ,
[1 − (v c) 2 ] 1 − ( v2 c2 ) 2

temos o seguinte resultado:

35
2 
( L2 + L1 ) 1 + v 2 c 2 − ( L2 + L1 ) 1 + v 2 c 2  
( ) 1
∆T ′ − ∆T ≅
c   2 
 L + L1  v
2
∆T ′ − ∆T ≅  2  2. (1.39)
 c c

Tal variação da diferença de tempo de percurso implica numa mudança de caminho


óptico, dada por: c(∆T '− ∆T ) ≅ (L1 + L2 )v
2
c 2 , que está associada a um deslocamento de N franjas
de interferência, como calculado abaixo:

N= c ( ∆T '− ∆T ) / λ , (1.40)

N=
( L1 + L2 )  v 2  .
 2 (1.41)
λ c 

Michelson e Morley conseguiram obter um comprimento de caminho óptico 44 L1 + L2 de cerca de 22 m .


[Vide fig. 6B para visualizar o caminho óptico da luz ao longo dos braços]. Considerando
λ = 5,5 ×10 − 7 m −4
(comprimento de onda da luz visível), v c = 10 , e substituindo esses dados na eq.
(1.41), obtemos o número de franjas que deve se deslocar enquanto o aparato é girado de 90º:

22 m
(10−4 ) → N =4 ×107 ×10−8 .
2
N= −7
5,5 ×10 m
4 ×10−1 → N =
N= 0, 4 . (1.42)

Portanto, ao longo do giro, deveria ser observado o deslocamento de quatro décimos de uma franja. A
despeito desta previsão teórica, o experimento não evidenciou qualquer deslocamento de franja
mensurável, proporcionando um resultado nulo. Em um primeiro momento, pensou-se em atribuir este
resultado nulo a uma momentânea coincidência do movimento da Terra com o éter. Suponha que o éter

não estivesse parado em relação ao Sol, mas fosse dotado de uma velocidade de translação v (em
relação ao Sol), que em determinado instante coincidisse com a velocidade orbital da Terra. Neste caso,
a Terra estaria parada em relação ao éter durante a realização do experimento, de modo que a
velocidade da luz ao longo dos dois braços do interferômetro valeria exatamente c. Não haveria
deslocamento de franjas nesta situação. Para dirimir esta dúvida, repetições deste experimento foram
realizadas dia e noite ao longo de todas as estações do ano, sempre conduzindo ao mesmo resultado
nulo. O que excluiu esta possibilidade levantada.

O resultado nulo do experimento de Michelson-Morley implicava na impossibilidade de detectar o meio de


referência privilegiado, que de acordo com Maxwell, era concebido como meio natural de propagação da
8
luz. Como este experimento tinha um alto grau de precisão (1 parte em 10 ), o seu resultado não poderia
ser colocado sob dúvida: se o éter não estava sendo detectado neste experimento, era porque ele não
existia como referencial privilegiado ou porque algum mecanismo estava determinando a sua
indetectabilidade. Como veremos mais a frente, os físicos da época conceberam várias hipóteses para
tentar explicar a não detecção do éter. Uma hipótese possível para explicar este experimento, mais não
adotada pelos físicos do séc. XIX, seria adotar a velocidade da luz constante para qualquer referencial
inercial. Essa suposição não implicaria nenhuma diferença de caminho óptico quando os braços do

44Na verdade, este não é o tamanho da soma dos braços do aparelho, que têm um tamanho muito menor. Para
conseguir este percurso óptico, Michelson & Morley usavam um sistema de espelhos nas extremidades dos braços
que faziam a luz ir e voltar várias vezes (pelo mesmo braço). A fig. 6B ilustra a disposição de espelhos que permitia
obter tal comprimento óptico.

36
interferômetro fossem trocados de posição e, portanto, não causaria variação de franjas. Esta hipótese,
porém, iria contrariar a lei de composição de velocidades de Galileu-Newton. Na verdade, somente após
a divulgação do postulado da constância da velocidade da luz por Albert Einstein em 1905, é que esse
impasse pode ser solucionado de forma adequada. Apesar disto, a aceitação da teoria de Einstein não foi
geral, visto que, a teoria de um meio de referência privilegiado para luz continuou sendo defendida 50
anos após a publicação dos postulados de Einstein para a relatividade.
A experiência de Michelson-Morley foi repetida por vários físicos em anos diferentes, que
confirmaram o resultado nulo obtido inicialmente, como mostra os dados exibidos na Tabela 1.

Tabela 1: Repetições da experiência de Michelson-Morley

O resultado preciso do experimento de Cleveland, mostrando a indetectabilidade do éter, ao


contrário da primeira versão de Postdam, foi decisivo para induzir futuras modificações nas teorias de
Lorentz, Fitzgerald, Larmor, Poincaré e Einstein sobre a eletrodinâmica dos corpos em movimento. Se
o éter não podia ser detectado, este era um resultado que deveria ser levado em conta pelas teorias
correntes.
Uma possível explicação para o resultado nulo desse experimento é obtida facilmente
quando se considera que a velocidade luz tem o mesmo valor em todos os referenciais. Neste caso, ao
se efetuar o giro de 900 do aparato, nada muda, pois a velocidade é sempre c em relação ao próprio
referencial do interferômetro. Esta hipótese, obviamente, não foi levantada ou defendida por nenhum dos
grandes físicos do final do século XIX, uma vez que rompia com a lei de composição de velocidades
galileana e com a mecânica de Newton. Importante destacar que nenhuma solução consistente para
essa problemática foi encontrada preservando os paradigmas da Física newtoniana. As tentativas de
justificar a não detecção do éter, em consonância com as transformações de Galileu, falharam uma após
a outra, levando a uma situação de total impasse. A primeira solução consistente para esta problemática
adveio com a TRR de Einstein, que propôs exatamente a invariabilidade da velocidade da luz para todos
os referenciais inerciais (como postulado), explicando de imediato o resultado nulo do experimento de
Michelson-Morley. Mas esse, seria apenas o primeiro de uma longa série de testes a que seria submetida
a TRR, como sucesso, ao longo do século XX.

1.8) HIPÓTESES PARA “SALVAMENTO” DO ÉTER COMO REFERENCIAL PRIVILEGIADO

Para os físicos da época, a inexistência do éter era inconcebível, tão arraigada era a crença
na necessidade de um meio material para viabilizar a propagação da luz. Quando estes físicos se
depararam com o resultado de alta precisão do experimento de Michelson-Morley, confirmado em várias

37
repetições, chegou-se à conclusão que era necessário buscar hipóteses para explicar a não
detectabilidade do éter: as chamadas hipóteses para salvamento do éter.

1.8.1 Hipótese de Contração de Lorentz-Fitzgerald

A existência de um meio de referência para a luz estava de comum acordo com o


pensamento da maioria dos físicos até o início do séc. XX. Para eles, não era concebível que uma onda
luminosa pudesse viajar sem o intermédio de um meio de propagação, tal como ocorre com as ondas
mecânicas em geral, o que no fundo é uma idéia bastante razoável. O experimento de Michelson-Morley
funcionou como um primeiro alerta de questionamento sobre as teorias vigentes na época. O aparato
experimental de Michelson-Morley possuía uma sensibilidade experimental muito grande (1 parte em
108 ), e se houvesse realmente alguma variação na velocidade da luz em relação ao observador parado
na Terra, ela seria percebida pelo interferômetro, que detectaria um deslocamento no padrão de franjas
observável. Os físicos do final do século XIX estavam convencidos de que poderiam provar a existência
do éter e quando se depararam com o resultado nulo encontrado por Michelson-Morley, muitos deles
tentaram explicar a sua não observação utilizando de novas hipóteses, que tentavam explicar o fato do
éter não poder ser detectado experimentalmente, apesar de existir como referencial privilegiado. Um dos
que defendeu a adoção de novas hipóteses para tentar explicar o resultado nulo do experimento de
Michelson-Morley foi Lorentz, que em 1892 iniciou um programa de adaptação da sua (já existente teoria)
dos elétrons para adequá-la ao resultado nulo deste experimento.

O físico holandês Hendrik Antoon Lorentz, que inicialmente duvidou dos experimentos de
Michelson de 1881, foi fortemente influenciado pelo resultado da segunda versão desta experiência,
realizada em 1887, por Michelson & Morley. Lorentz rejeitava as concepções de éter aceita por Hertz 45,
baseado na incapacidade deste em explicar tanto fenômenos ópticos como eletromagnéticos. Por outro
lado, através da demonstração experimental realizada por Hertz sobre a existência das ondas
eletromagnéticas, Lorentz se convenceu da existência de tais ondas e do conceito de campo, passando a
aceitar a teoria de Maxwell como um ponto de partida em seus desenvolvimentos. Lorentz criticava a
hipótese defendida por Hertz e Stokes de um arrastamento total do éter na eletrodinâmica dos corpos em
movimento 46, pois defendia a hipótese de um éter estacionário. Ele não deu ao éter um caráter mecânico
em sua constituição, pelo contrário, diferentemente de Hertz, ele atribuiu ao éter um caráter
eletromagnético.
Lorentz era um grande estudioso da teoria eletromagnética, e era um adepto da teoria de
Fresnel de um éter estacionário permeando toda a matéria e o espaço ao seu redor, não sendo assim
afetado pelo movimento dos corpos 47. A teoria dos elétrons de Lorentz tinha o mérito de conseguir
derivar a fórmula do arrastamento parcial de Fresnel (e os resultados da teoria de Fresnel) sem supor
nenhum arrasto do éter. Com isto, Lorentz conseguia explicar porque nenhum dos experimentos
concebidos para acusar o movimento da Terra, e sensíveis em u/c, a exemplo do experimento de Arago,
conseguia detectar tal movimento. A teoria de Lorentz conseguia explicar o resultado nulo dos
experimentos sensíveis em primeira ordem em u/c.

Entretanto, a teoria de Lorentz previa que os efeitos do movimento da Terra em segunda


ordem em u/c deveriam ser observados. Se um experimento com esta sensibilidade fosse realizado, tal
como o experimento de Michelson-Morley, deveria dar resultado positivo. E os problemas da teoria de
Lorentz começaram a surgir exatamente depois do resultado nulo de Michelson-Morley, o que entrava em
franca contradição com as suas previsões.

45 Hertz acreditava na visão de um éter mecânico que era completamente arrastado pelos corpos em
movimento, mesmo sabendo que sua hipótese contrariava alguns fenômenos ópticos.
46 Ver ref. [7]
47 Ver ref. [3], p. 621-623.

38
Então, com o intuito de conciliar a sua teoria com o resultado de Michelson-Morley,
Lorentz 48 (em 1892) lançou mão de uma nova hipótese, que já havia sido formulada três anos antes por
G. Fitzgerald, de maneira independente. Tal hipótese afirmava que todos os corpos sofrem uma
contração em seu comprimento por um fator 1 − v / c na direção longitudinal ao movimento, sendo
2 2

v a sua velocidade relativa ao éter. Por outro lado, as dimensões ortogonais ao movimento
permaneceriam inalteradas. Com isso, o comprimento da dimensão longitudinal seria dado por:

L = Lo 1 − v 2 / c 2 , (1.43)

onde L0 representa o comprimento do corpo em repouso relativo ao éter, e L a medida do comprimento


do corpo quando este estiver em movimento relativo ao sistema do éter.
Vimos na Fig. 13 (visão esquemática do experimento de Michelson-Morley), que o braço L1
move-se na mesma direção do movimento da Terra em relação ao éter, e o braço L2 na direção
perpendicular a este movimento. Então, aplicando a hipótese de Lorentz-Fitzgerald para o aparato de
Michelson-Morley, temos:
=
L1 L01 1 − v 2 c 2 e L2 = L02 . (1.44)

Para calcular a diferença nos tempos de percurso, obtemos:

2   L01 1 − v 2 c 2 
∆T =   , ∆T 2 
L2 L1 L02
− = − 
c  1− v2 c2 1− v2 c2  c  1 − v2 c2 1 − v2 c2 
   
2 L02 L01 
= ∆T  − ,
c  1 − v2 c2 − 2 2 
 1 v c 
2 1
= ∆T ( L02 − L01 ) . (1.45)
c 1 − v2 c2

Agora, calcularemos a diferença nos tempos de percurso após a rotação de 90º do aparato.
Sendo que, nesta situação, o braço L2 move-se na mesma direção do movimento da Terra em relação ao
éter, e o braço L1 na direção perpendicular. Portanto, de acordo com a hipótese de Lorentz-Fitzgerald
temos:

L1 = L01 e=
L2 L 02 1 − v 2 c 2 . (1.46)

Substituindo as expressões acima na eq. (1.32), obtemos:


2  L2  2  L02 1 − v c 
2 2
∆T ' =  =
L1 L01
− → ∆T '  − ,
c 1− v2 c2 − 2 2  c  1 − v2 c2 − 2 2 
 1 v c   1 v c 

48 Através das pesquisas realizadas entre os anos de 1895 até 1904, Lorentz desenvolveu uma teoria
que permitiu a ele explicar a ação dinâmica do éter sobre os corpos em movimento, causando
conseqüentemente uma contração destes. Isto possibilitou a ele construir as suas famosas
transformações de coordenadas (transformações de Lorentz) que fazem com que a velocidade da luz
seja a mesma para dois observadores com movimento relativo uniforme.

39
2 L02 L01  2 1
=∆T ′ 

− =

→ ∆T ′ ( L02 − L01 ) . (1.47)
c 1− v c
2 2
− 2 2 c 1 − v2 c2
 1 v c 

Verifica-se uma igualdade das eqs. (1.40) e (1.41), de modo que a diferença entre tais equações conduz
a um resultado nulo:
∆T '−∆T = 0 ,
compatível com a ausência de deslocamento de franjas. Portanto, tendo em vista a hipótese de
Lorentz-Fitzgerald, estaria explicada a impossibilidade de observação ou detecção do éter por meio de
um interferômetro com braços iguais.

Para adequar sua teoria à a hipótese da contração dos comprimentos, Lorentz implementou
diversas alterações na sua estrutura, entre 1890 e 1900, culminando na publicação da versão final da sua
teoria em 1904.

Em 1932, Kennedy e Thorndike realizaram um experimento com um interferômetro de braços


desiguais, para testar a hipótese de contração de Lorentz-Fitzgerald. De fato, em razão da diferença de
percurso óptico associado a cada um dos braços, era de se esperar que houvesse um deslocamento de
franjas quando a velocidade do aparato em relação ao éter mudasse de maneira significativa -
mantendo-se o aparato fixo (sem efetuar giro de 900). Nesse caso, a diferença de velocidade seria devido
à rotação da Terra em torno do seu eixo e à rotação orbital da Terra, sendo esperado o seguinte
deslocamento de franjas:
L01 − L02  v 2 v′2 
=∆N  2 − 2 . (1.48)
λ c c 
onde v e v′ são as velocidades da Terra relativa ao éter em diferentes instantes. A observação deste
experimento ao longo de 12 horas, não revelou nenhum deslocamento de franjas, mostrando que a
variação devido à rotação diária da Terra nada implicava. Esse experimento foi ainda monitorado por
meses, para tentar observar o efeito associado à mudança da velocidade orbital da Terra e, novamente,
nada foi constatado. Desta forma, a hipótese de contração de Lorentz-Fitzgerald foi definitivamente
levada ao descrédito. O experimento de Kennedy-Thorndike foi mais um, dentre tantos, que veio a negar
a hipótese de detecção do movimento da Terra relativo ao éter, confirmando as premissas da TRR 49.
Alguns livros didáticos sugerem que este experimento tenha tido um papel importante no
processo de aceitação da TRR em contraposição à teoria dos elétrons de Lorentz. Neste sentido, cabe
observar que no ano de realização deste experimento (1932), a teoria de Lorentz já havia caído em
descrédito na maior parte da comunidade científica.

Teorias da Emissão

Dado o fracasso das tentativas de salvar o éter, a hipótese de um referencial privilegiado


perdia prestígio entre os físicos, parecendo indicar a existência de um princípio da relatividade para toda
Física. Uma das possibilidades consistentes com este cenário era tentar modificar a teoria
eletromagnética de Maxwell de modo que a mesma se tornasse invariante perante as transformações de
Galileu, o que liquidaria a hipótese do éter mas manteria o status da mecânica newtoniana (e das
transformações de Galileu) inabalado. O preço a pagar seria sacrificar a teoria de Maxwell 50: uma nova

49 Vale ressaltar que no ano de realização desse experimento, 1932, a TRR já havia passado em diversos testes
experimentais, sendo aceita por grande parte da comunidade científica internacional. Entretanto, os testes acerca da
sua validade continuavam sendo realizados incessantemente, o que demonstra quão lento é o processo de assimilação
de uma nova teoria.
50 Importante destacar que a teoria de Maxwell era altamente bem sucedida na explicação dos fenômenos

eletromagnéticos. Não havia relatos de experimentos que contradiziam as leis de Maxwell, que na já vinham sendo

40
teoria eletromagnética deveria ser construída. Algumas teorias foram lançadas na tentativa de cumprir
esse propósito, ficando conhecidas como teorias da emissão 51 por vincular a velocidade da luz ao
referencial da fonte de emissão, em vez de ao meio de propagação (éter). Nesse caso, a velocidade da
luz seria c em relação à fonte de emissão, sendo independente do estado de movimento do meio através
do qual se propaga. Como conseqüência, um observador para o qual a fonte esteja em aproximação
(afastamento) com velocidade u iria medir a velocidade da luz com sendo c + u ( c − u ) 52.
Teorias de emissão, tais como a de Ritz, explicam rapidamente o resultado nulo do experimento
de Michelson-Morley, uma vez que, estando a fonte de luz parada junto ao aparato, a velocidade da luz
será c ao longo dos dois braços, não havendo porque fazer composições galileanas nessa situação.
Entretanto, tais teorias não prosperaram na época, principalmente por entrarem em direta contradição
com dois tipos de fenômenos: as observações de estrelas duplas e o experimento de Michelson-Morley
usando como fonte de luz um objeto fora do referencial da Terra (fonte extra-terreste: Sol ou outra estrela
qualquer), que de acordo com as teorias de emissão, deveria proporcionar deslocamento de franjas 53.
De acordo com tais teorias, um sistema de estrelas duplas deveria exibir (pelo menos na aparência)
excentricidade nas órbitas estelares, ou seja, tais órbitas deveriam mostrar-se como elipses para
observadores distantes, mesmo que na realidade fossem círculos do ponto de vista de um observador
postado no centro de massa do sistema. Este efeito é uma consequência do tempo de propagação da
luz, que neste caso varia na dependência da estrela estar de afastando ou aproximando da Terra no
instante de emissão. Observações de sistemas de estrelas duplas, feitas por de Sitter nunca relataram a
observação de excentricidade nas órbitas estelares. Estas duas evidências contra as teorias de emissão
são apontadas em diversos livros-texto antigos e mesmo atuais. Deve ser aqui ressaltado que alguns
autores modernos 54 refutaram a explicação de que as observações de de Sitter e do experimento de
Tomascheck realmente venham a descredenciar as teorias de emissão. Não há nesta linha de
argumentação nenhuma tentativa de tentar salvar ou ressuscitar tais teorias, uma vez que as mesmas
realmente falham na descrição das interações entre partículas ultra-rápidas observadas em aceleradores
e em colisões relativísticas. Há, entretanto, o intento de desfazer enganos cometidos pelos
pesquisadores do início do século.

POSTULADOS DE EINSTEIN PARA CONSTRUÇÃO DA TRR

No início do século XX, havia um cenário físico razoavelmente estabelecido acerca da


impossibilidade de detectar o movimento da Terra relativo ao éter, tal qual verificado no experimento de

colocadas à prova desde a época em que as leis de Faraday, Lenz e Ampère foram enunciadas. Por volta do final do
século XIX, as equações de Maxwell já tinham um status de leis da natureza (compatíveis com todos os
experimentos conhecidos). Desta forma, propor uma nova teoria para o eletromagnetismo, diferente da de Maxwell,
não era uma tarefa simples.
51
Tentativas nesta direção foram realizadas por vários cientistas da época (R. Tolman, J. Kuntz, D. Comstock).
Porém, a mais bem sucedida tentativa foi levada a cabo pelo eminente físico W. Ritz, por volta dos anos de 1907-
1909, que conseguiu construir uma teoria de emissão auto-consistente. Entretanto, é bem sabido que conceber uma
teoria auto-consistente não basta para ter sucesso em descrever a natureza. É necessário que tal teoria descreva com
exatidão experimentos e fenômenos conhecidos. Neste ponto, a teoria da emissão não foi bem sucedida.
52
Na sua teoria, Ritz preservou a forma das duas equações de Maxwell homogêneas, e alterou as duas não-

homogêneas de modo a conseguir inserir nas expressões dos potenciais retardados para A0 e A a informação de que
a velocidade da luz deveria ser c + u ou ( c − u ).
53
Tais experimentos foram realizados por Tomaschek (1924) usando luz solar, e por Miller (1924), usando luz
estelar, ambos detectando resultado nulo (ausência de deslocamento de franjas).
54
Vide J. G. Fox, Am. J. Physics 33, 1 (1965). Nesta referência o autor discute várias evidências a favor e contra a
teoria de emissão de Ritz, chegando à conclusão que várias das observações e fenômenos levantados para contestar e
negar as teoria de emissão na verdade não cumprem este papel (por uma questão de interpretação). A razão está no
fato da luz emitida por estrelas distantes ser absorvida e reemitida pelas partículas da atmosfera, que estão em
repouso em relação ao referencial da Terra. No entanto, no mesmo artigo é destacado que tais teorias são
definitivamente negadas pela fenomenologia de partículas relativísticas e experimentos com fontes de luz ultra-
rápidas, realizados ao longo do século XX.

41
Michelson-Morley. Estas evidências levaram Lorentz a reformular sua teoria para a eletrodinâmica dos
corpos em movimento, inserindo a hipótese da contração do comprimento, tal qual já discutido. Lorentz
ainda argumentou que, dado a nossa incapacidade de detectar o éter por meio de experimentos ópticos,
as equações de Maxwell deveriam se mostrar invariantes perante algum conjunto de transformação de
coordenadas. Buscou as transformações matemáticas que assegurassem tal invariância. Sendo fato
conhecido a não invariância das equações de Maxwell perante as transformações de Galileo, Lorentz
obteve novas transformações que cumprissem este intento em 1904 - ano em que apresentou a forma
final da sua teoria - sendo estas batizadas com seu nome. Há registros históricos que Poincaré também
havia deduzido tais transformações e, mais importante, chegou a conceber ideias muito próximas do que
chamamos hoje de princípio da relatividade. Contudo, não coube a Lorentz ou Poincaré a concepção da
TRR como o fez Einstein em 1905, dando interpretação inovadora às transformações de coordenadas de
Lorentz em uma amplitude não vislumbrada por seus predecessores.

Diante deste cenário físico, Einstein optou em 1905 por um caminho inovador e ao mesmo
tempo simplificador. Considerou duas hipóteses principais: um princípio da relatividade para toda física e
a constância da velocidade da luz para todos os referenciais. O novo princípio da relatividade seria
compatível com a validade das equações de Maxwell em todos os referenciais inerciais, e com a
necessidade de obter novas transformações de coordenadas, diferentes das Galileanas. Implícito estava
a necessidade de rederivar as leis da mecânica newtoniana, tarefa também iniciada por Einstein em
1905. Além do princípio da relatividade, Einstein assumiu uma outra hipótese verdadeiramente
revolucionária: considerar a velocidade da luz como uma constante independente do movimento da fonte
e do observador, o que implicaria em alterações dos conceitos tradicionais de espaço e tempo. Estas
duas hipóteses foram lançadas por Einstein, em 1905, em forma de dois postulados (os dois postulados
da TRR):

1) As leis físicas (mecânicas e eletromagnéticas) são as mesmas para todos os referenciais inerciais, ou
seja, existe um princípio da relatividade para toda física.
2) A velocidade da luz assume o mesmo valor (c) em todos os referenciais inerciais,
independentemente do estado de movimento da fonte.

Estes dois postulados constituem o ponto de partida para obtenção das novas
transformações de coordenadas (transformações de Lorentz) e construção de toda teoria da relatividade
restrita. Com o primeiro postulado, Einstein encerra a questão do papel do éter como referencial
privilegiado, estabelecendo a inexistência de um referencial absoluto e a equivalência entre todos os
referenciais inerciais. Com o segundo postulado, Einstein explica o resultado nulo do experimento de
Michelson-Morley, e estabelece a conexão/interdependência entre tempo e espaço, dando origem à
revolução físico-filosófica em torno dos conceitos destas duas entidades fundamentais. Tais postulados
e suas conseqüências serão melhor discutidos no próximo capítulo.

A seguir, como conclusão, apresentamos uma tabela onde se exibe o resumo, em linhas
gerais, das principais idéias vinculadas às teorias vigentes no final do século XIX e início do século XX
aqui discutidas.

Teorias da Emissão Teoria do éter como Teoria da


referencial Relatividade Restrita
privilegiado
Sistema de referência Não há referencial Referencial do éter Não há referencial
privilegiado privilegiado privilegiado
Princípio da Válido para toda física Válido apenas para a Válido para toda física
relatividade mecânica
Velocidade da luz Dependente da Independente da Independente da
velocidade da fonte, e velocidade da fonte velocidade da fonte e
desatrelada do meio de mas atrelada ao meio desatrelada do meio de
propagação de propagação propagação

42
(constante)
Conexão de espaço e Espaço e tempo são Espaço e tempo são Espaço e tempo são
tempo independentes independentes interdependentes
Transformações de Transformações de Transformações de Transformações de
coordenadas Galileu Galileu Lorentz

APÊNDICE

A não-invariância do eletromagnetismo de Maxwell perante as transformações de


Galileu.

A não invariância da forma das equações de Maxwell perante uma transformação de


coordenadas de Galileu é um dos fatos que motivou os físicos do final do século XIX a conceberem a
existência de um sistema de referência privilegiado, no qual tais equações são válidas em sua forma
padrão. Em todos os outros referenciais inerciais, tais equações assumiriam uma forma diferente. O
nosso objetivo neste apêndice é apresentar uma descrição matemática que evidencie esse fato, ou seja,
mostrar que as leis do eletromagnetismo mudam de forma quando se muda de referencial inercial. No
caso, devido as dificuldades de realizar tal demonstração partindo diretamente das equações de Maxwell,
estaremos focalizando sobre a equação de onda satisfeita pelo potencial escalar, e a variação sofrida
pela mesma sob ação das transformações de Galileu. Tal variação também indica indiretamente que as
equações de Maxwell também mudam de forma, uma vez que a equação de onda é obtida das equações
de Maxwell. Considere as equações de Maxwell:

∇⋅E =ρ , (A1)

∇ ⋅ B =0 , (A2)

 ∂B
∇× E + =0 , (A3)
∂t 
 ∂E 
∇ × B − µ oε o =j . (A4)
∂t
Uma das conseqüências mais importantes destas equações é a existência das ondas
eletromagnéticas que se propagam com a velocidade da luz. Partindo das equações de Maxwell,
podemos facilmente obter as equações de onda que regem a evolução do campo eletromagnético e das
suas ondas. De fato, tirando o rotacional da eq. (A3), temos:
 
  ∂B   ∂B
∇×∇× E + =  0 → ∇× ∇× E +∇× = 0
∂t  ∂t
( )


  ∂(∇ × B )
( )
∇ ∇ ⋅ E − ∇2 E +
∂t
=0 ,

  ∂E
Na ausência de fontes (carga e corrente), temos: ∇ ⋅ E = 0 e ∇ × B = µ0ε 0 . Usando estes resultados
∂t
na expressão acima, obtemos:

 ∂2 E
∇ E − µ0 ε 0 2 =
2
0. (A5)
∂t

43
Esta expressão representa a equação de uma onda tridimensional para o campo elétrico. A
forma geral da equação de onda, considerando uma onda unidimensional, é dada pela seguinte
∂2 f 1 ∂2 f
expressão: − = 0 , onde v é a velocidade de propagação da onda.
∂x 2 v 2 ∂t 2
Comparando a eq. (A5) com a forma geral da equação de onda, obtemos a seguinte relação:
1 1
= µ0 ε 0 → =
v ⇒ v = 2,997925 ⋅108 m / s ,
v2 µ0 ε 0

onde v corresponde à velocidade da luz ( c ) no vácuo. É possível mostrar que, assim como o campo
elétrico, o potencial escalar ( φ ) também satisfaz uma equação de onda, dada abaixo:

 1 ∂ 2φ (r , t )
∇ φ (r , t ) − 2
2
=0,
c ∂t 2
que pode ser escrita explicitamente na forma:
 1 ∂2 ∂2 ∂2 ∂2  
 2 2


∂ 2

∂ 2

∂ φ ( r , t ) =
2 
0. (A6)
 c t x y z 

Observe que toda equação foi multiplicada por -1, o que não altera em nada as suas propriedades ou
soluções. Supondo que essa forma da equação de onda esteja vinculada a um sistema de referência S
em repouso em relação ao éter, vamos submeter tal equação a uma transformação de coordenadas de
Galileu, objetivando escrevê-la para um observador localizado num sistema de referência S’, que se

move com velocidade constante u em relação ao sistema S. Lembrando que o conjunto de
transformação de coordenadas de Galileu é dado por:

{ x '= x − ut , y '= y, z '= z , t '= t} .

Sendo a eq. (A6) uma equação diferencial parcial, para escrevê-la num outro referencial, é
necessário antes escrever as derivadas parciais, para o que se usa a regra da cadeia:

∂ ∂x′ ∂ ∂y ′ ∂ ∂z ′ ∂ ∂t ′ ∂
= + + + , (A7)
∂x ∂x ∂x′ ∂x ∂y ′ ∂x ∂z ′ ∂x ∂t ′
∂ ∂x′ ∂ ∂y ′ ∂ ∂z ′ ∂ ∂t ′ ∂
= + + + , (A8)
∂y ∂y ∂x′ ∂y ∂y ′ ∂y ∂z ′ ∂y ∂t ′
∂ ∂x′ ∂ ∂y ′ ∂ ∂z ′ ∂ ∂t ′ ∂
= + + + , (A9)
∂z ∂z ∂x′ ∂z ∂y ′ ∂z ∂z ′ ∂z ∂t ′
∂ ∂x′ ∂ ∂y ′ ∂ ∂z ′ ∂ ∂t ′ ∂
= + + + . (A10)
∂t ∂t ∂x′ ∂t ∂y ′ ∂t ∂z ′ ∂t ∂t ′

∂y ' ∂z ' ∂t ' ∂x' ∂z ' ∂t ' ∂x' ∂y ' ∂t '


Tendo em vista que: = = =0, = = =0 e = = = 0 , obtém-se como
∂x ∂x ∂x ∂y ∂y ∂y ∂z ∂z ∂z
resultado:
∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂
= , = , = , = −u .
∂x ∂x′ ∂y ∂y′ ∂z ∂z ′ ∂t ∂t ′ ∂x′

Tais resultados implicam em:

44
∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂ ∂2 ∂
= , = , = , = − 2u + u2 2 . (A11)
∂x 2
∂x′ ∂y
2 2
∂y ′ ∂z
2 2
∂z ′ ∂t
2 2
∂t '2
∂x′∂t ′ ∂x′

Substituindo o conjunto de eqs. (A11) na equação de onda (A6), obtemos:

 1  ∂2 ∂2 2 ∂
2
 ∂2 ∂2 ∂2  
 2 2 − 2u + u  − − −  φ ( r ′, t ) =
0,
 c  ∂t ' ∂t ' ∂x ' ∂x '2  ∂x '2 ∂y '2 ∂z '2 

 1 ∂ 2 2u ∂ 2 ∂2 ∂2 ∂2  
 2 2 − − (1 − u 2
c 2
) − −  φ ( r ′, t ) =
0.
 c ∂t ' c 2 ∂t ' ∂x ' ∂x '2 ∂y '2 ∂z '2 

1
Fazendo γ2 = , escrevemos a seguinte equação:
1− u 2 c2
 1 ∂ 2 2u ∂ 2 1 ∂2 ∂2 ∂2  
 2 2 − − − −  φ ( r ′, t ) =
0, (A12)
 c ∂t ' c 2 ∂t ' ∂x ' γ 2 ∂x '2 ∂y '2 ∂z '2 

que corresponde à equação de onda para o potencial escalar escrita no sistema S’. Essa equação
demonstra ser diferente, em sua forma, da equação original, válida no sistema S. Desta forma, percebe-
se que a equação de onda do Eletromagnetismo Clássico não é invariante perante as transformações de
coordenadas de Galileu. Ocorre uma mudança na forma que implica em alteração de comportamento
físico. Isto é que indica a quebra do princípio da relatividade perante experimentos ópticos.
Observe que equação de onda vista pelo ref. S ou S', dada pelas eqs. (A6) e (A12), diferem
2 2 2
entre si por dois termos proporcionais a u / c e u / c , evidenciando que discrepância entre
experimentos ópticos realizados pelo ref. S e S' será proporcional a ordem de magnitude do maior entre
estes dois termos, ou seja: u 2 / c 2 . No caso de um experimento realizado na Terra, que tem uma
−8
velocidade orbital de u  30km / s , temos: u / c  (30 / 3.10 )  10 . Portanto, o efeito decorrente
2 2 5 2

na quebra do princípio da relatividade de Galileu perante experimentos ópticos (devido existência do éter
como referencial privilegiado) seria da ordem de 1 parte em 108, ou seja, uma parte em 100 milhões.
Efeito muito pequeno, porém dentro da faixa de sensibilidade do interferômetro construído por Michelson
e Morley.

Questões: Pense, discuta e responda.

1) Como a medida de comprimento de um corpo está relacionado ao conceito de simultaneidade?


2) Cite e explique as duas principais razões que levaram os físicos do final do século XIX a propor a
existência de um referencial absoluto, o éter.
3) O Princípio da Relatividade de Galileo estabelece que as leis físicas (mecânica newtoniana) são as
mesmas em qualquer referencial inercial, sendo impossível medir a velocidade de qualquer um destes
referenciais inerciais em relação ao espaço absoluto (por meio de qualquer experimento mecânico). E
em quanto as velocidades relativas, é possível medi-las?? E quanto à aceleração de um referencial, é
sempre possível medi-la? Em relação a que tais acelerações são mensuradas?
4) De acordo com a descrição do experimento de Michelson-Morley estudada em aula, responda: (i) Qual o
objetivo deste experimento? (ii) Em que hipótese este experimento deveria apresentar obrigatoriamente
resultado positivo? (iii) Por que é fundamental efetuar o giro de 90o no aparato? (iv) Na hipótese deste
giro não ser realizado, explique o que deve ser feito para produzir uma mudança de caminho óptico
equivalente àquela que seria obtida em tal giro.
5) Suponha que o movimento da Terra, em vez de elíptico em torno do Sol, é retilíneo e uniforme através
de um éter. Neste caso responda: (i) haveria neste caso observação da aberração estelar?? (ii) Explique

45
o porquê. (iii) A aberração estelar, nesta situação, poderia ser usada para medir a velocidade da Terra
em relação ao éter? (iv) Um experimento de Michelson-Morley, realizado nesta situação, deveria
apresentar resultado positivo quando o aparato fosse girado de 90o ? (v) Em caso afirmativo, poder-se-ia
afirmar que tal experimento distingue o estado de repouso do estado de movimento retilíneo uniforme,
quebrando a indistinguibilidade destes dois estados? (vi) Comente a resposta anterior à luz do Princípio
da relatividade de Galileo e do conceito movimento absoluto. (vii) Há sentido em se falar em referencial
inercial neste caso?? Explique.
6) A hipótese da contração do comprimento dos corpos rígidos de Lorentz-Fitzgerald consegue explicar o
resultado nulo do experimento de Michelson-Morley. No entanto, a mesma teve de ser abandonada. Cite
um dos experimentos que a levou ao descrédito, explicando como.
7) Cite e explique evidências que se contrapuseram as chamadas teorias da emissão.
8) Descreva uma versão acústica do experimento de Michelson-Morley em analogia com caso óptico
estudado em aula. Quais seriam as diferenças e similaridades entre estas duas versões?
9) Sabe-se que a observação do fenômeno da aberração estelar pode ser usada para medir a velocidade
da Terra em relação à estrela observada. (i) Seria este um experimento capaz de detectar uma
velocidade absoluta? (ii) Seria capaz de detectar a velocidade da Terra em relação a um éter? (iii) Qual
a diferença, neste sentido, em relação a um experimento de Michelson-Morley?
10) A incompatibilidade entre o eletromagnetismo de Maxwell e as transformações de Galileo evidenciou que
a teoria de Maxwell não admitia um Princípio da Relatividade, de tal maneira que deveria haver um
referencial privilegiado. (i) Qual o papel físico deste referencial privilegiado? (ii) Caso a detecção deste
éter fosse confirmada, a teoria de Maxwell (na forma como a conhecemos) seria dada como incorreta
em qualquer referencial? Esta teoria seria diferente para cada referencial adotado?? Explique.

REFERÊNCIAS BIBLIOGRÁFICAS:

[1] R. Resnick, "Introduction to Special Relativity", Jonh Wiley & Sons, Inc. New York, 1968.
[2] A. Einstein, H. A. Lorentz, H. Weyl, H. Minkowski, "The Principle of Relativity", Dover Publications,
New York, 1952.
[3] W. Pauli, "Theory of Relativity", Dover Publications, New York, 1958; H. Weyl, "Space-time-matter",
Dover Publications, New York, 1952.
[4] W. Rindler, “Introduction to Special Relativity”, Claredon Press, Oxford , 1991.
[5] V. A. Ugarov, "Special Theory of Relativity", Mir Publishers, Moscou, 1979.
[6] W.G.V. Rosser, “An Introduction to the theory of Relativity”, London Butterworths, 1964.
[7] J. G. Fox, "Evidence against Emission Theories", Am. J. Phys. 33, 1 (1965).
[8] G. Holton, "On the origins of the Special Theory of Relativity", Am. J. Phys. 28, 627 (1960).
[9] J. F. ROCHA, R. I L. PONCZEK, S. T. R. PINHO, R. F. S. ANDRADE, O. FREIRE Jr, A. RIBEIRO
Filho, Origens e Evolução das Idéias da Física. Salvador – BA: EDFUBA, 2002.
[10] R.S. Shankland, “Michelson-Morley experiment”, Am. J. Phys. 32, 16 (1964).
[11] J. Stachel, “1905 e tudo o mais”, Revista Brasileira de Ensino de Física 27, 5 (2004). Versão
expandida: J. Stachel, “1905 and all that”, Nature 243, 215 (2005).
[12] Arthur I. Miller, “Albert Einstein´s Special Theory of Relativity – Emergence and Early
interpretation”, Addsion-Wesley Publishing Company, Inc., Massachussets (1981).
[13] Roberto de A. Martins, Revista Brasileira de Ensino de Física 27, 11-26 (2005).
[14] James T. Cushing, “Philosophical Concepts in Physics”, Cambridge University Press, Cambridge
(1998).
[15] Stanley Goldberg, “The Lorentz Theory of Electrons and Einstein’s Theory of Relativity”, Amer.
J. Phys. 37, 982-994 (1969).
[16] C. Cujav, “Henri Poincaré’s Mathematical Contributions to Relativity and the Poincaré
Stresses”, New York: Yeshiva University. p. 5-9. June. 1968.
[17] M. Pietrocola de Oliveira, “Fresnel e o arrastamento parcial do éter: a influência do movimento da
Terra sobre a propagação da luz”, Cad. Cat. Ens. Fís. 10, n.2, 157 (1993).
[18] E. Whittaker, “A history of theories of ether and electricity. The classical theories”, Vol. 1, Thomas
Nelson and Sons, Ltd. (1951).

46
[19] E. Whittaker, “A history of theories of ether and electricity. The classical theories”, Vol. 2, Thomas
Nelso and Sons, Ltd. (1955)
[20] Roberto de A. Martins, “O éter e a óptica dos corpos em movimento: a teoria de fresnel e as
tentativas de detecção do movimento da Terra, antes dos experimentos de Michelson e Morley (1818-
1880)”, Cad. Bras. Ens. Fís. 29, n. 1, p. 52 (2012).
[21] Stanley Goldberg, “Henri Poincare and Einstein's Theory of Relativity”, AMER. J. PHYS. 35, 934-944,
(1967).
[22] Rafael Ferraro,e Daniel M. Sforza, “Arago (1810): the first experimental result against the ether”, Eur.
J. Phys. 26 (2005) 195–204. Doi: 10.1088/0143-0807/26/1/020
[23]

47

Você também pode gostar