Você está na página 1de 170

LAWRENCE SKLAR

A FILOSOFIA DA FÍSICA

TRADUÇÃO
PEDRO GALVÃO, PAULA MATEUS E DESIDÉRIO MURCHO

REVISÃO CIENTÍFICA
ANA SIMÕES E PAULO CRAWFORD
FACULDADE DE CIÊNCIAS DA UNIVERSIDADE DE LISBOA

Título original: Philosophy of Physics


(Westview Press, Colorado, 1992)
Para Pat e Ruby
Índice

Agradecimentos ......................................................................................................................................... 5
1 Introdução: a filosofia e as ciências físicas .......................................................................................... 6
A relação entre a ciência e a filosofia ................................................................................................................... 6
Física moderna e filosofia ...................................................................................................................................... 7
Filosofia da física e filosofia em geral ................................................................................................................ 10
Objectivo e estrutura deste livro ........................................................................................................................ 12

2 Espaço, tempo e movimento ............................................................................................................... 13


Problemas filosóficos tradicionais do espaço e do tempo ............................................................................... 13
Questões sobre o conhecimento ......................................................................................................................... 13
Questões sobre a natureza da realidade............................................................................................................. 16
O debate entre Newton e Leibniz ....................................................................................................................... 18
Do espaço e do tempo ao espaço-tempo ........................................................................................................... 23
As origens da teoria da relatividade restrita ...................................................................................................... 23
O espaço-tempo de Minkowski ........................................................................................................................... 27
Espaço-tempo neo-newtoniano........................................................................................................................... 32
A gravidade e a curvatura do espaço-tempo .................................................................................................... 33
A gravidade e a relatividade .............................................................................................................................. 33
Geometria não euclidiana .................................................................................................................................. 35
O uso das geometrias não euclidianas na física ................................................................................................. 37
Espaço-tempo curvo e gravidade newtoniana .................................................................................................... 40
Resumo ............................................................................................................................................................... 41
Como sabemos qual é a verdadeira geometria do mundo?............................................................................ 41
Mudanças nos pontos de vista sobre o conhecimento da geometria .................................................................. 41
O convencionalismo de Poincaré ....................................................................................................................... 43
Réplicas a Poincaré............................................................................................................................................ 44
Opções realistas ................................................................................................................................................. 46
Opções reducionistas ......................................................................................................................................... 49
Réplicas realistas complementares..................................................................................................................... 50
Pontos de vista pragmatistas .............................................................................................................................. 52
Resumo ............................................................................................................................................................... 52
Que tipo de ser tem o espaço-tempo? ................................................................................................................ 53
Tempo e ser ........................................................................................................................................................ 54
Considerações relativistas.................................................................................................................................. 55
Substantivismo contra relacionismo ................................................................................................................... 56
A proposta de Mach e a relatividade geral ........................................................................................................ 58
Ainda a relatividade geral e o debate entre substantivistas e relacionistas ....................................................... 60
Relações de espaço-tempo e relações causais .................................................................................................... 63
Topologia e estrutura causal .............................................................................................................................. 65
Serão as características do espaço-tempo redutíveis a características causais? ............................................... 66
Resumo ............................................................................................................................................................... 68
Leituras complementares .................................................................................................................................... 68

3 A introdução da probabilidade na física ........................................................................................... 70


«»A probabilidade e a explicação estatística segundo os filósofos ................................................................ 70
Probabilidade: a teoria formal........................................................................................................................... 70
Interpretações objectivistas da probabilidade.................................................................................................... 71
Interpretações subjectivistas da probabilidade .................................................................................................. 73

3
Explicação estatística: explicação, lei e causa................................................................................................... 75
Explicações que invocam probabilidades........................................................................................................... 77
Explicação e redução ......................................................................................................................................... 80
Da termodinâmica à mecânica estatística ......................................................................................................... 82
Termodinâmica................................................................................................................................................... 82
A teoria cinética do calor ................................................................................................................................... 83
A abordagem ergódica da mecânica estatística ................................................................................................. 87
O problema da irreversibilidade e as tentativas para o solucionar ............................................................... 90
A caracterização do equilíbrio ........................................................................................................................... 91
A aproximação ao equilíbrio .............................................................................................................................. 94
Algumas abordagens não canónicas do problema ............................................................................................. 95
Algumas abordagens canónicas do problema .................................................................................................... 97
O problema das distribuições de probabilidade iniciais .................................................................................. 101
Cosmologia e irreversibilidade ........................................................................................................................ 104
Resumo ............................................................................................................................................................. 106
O problema da «direcção do tempo» ............................................................................................................... 107
Leituras complementares .................................................................................................................................. 113

4 A imagem quântica do mundo ......................................................................................................... 115


A base experimental da teoria dos quanta ...................................................................................................... 115
Primeiras tentativas de interpretação da teoria: o princípio da incerteza................................................... 120
A interpretação do formalismo: probabilidade, interferência e medição ......................................................... 120
A interpretação de Copenhaga ......................................................................................................................... 124
O princípio da incerteza ................................................................................................................................... 127
O que é a medida na teoria dos quanta? ......................................................................................................... 129
O problema da medida ..................................................................................................................................... 129
A solução de Bohr e as suas críticas ................................................................................................................ 132
Soluções idealistas ........................................................................................................................................... 134
A medida como uma interacção física .............................................................................................................. 135
A interpretação de Kochen e as interpretações estocásticas ............................................................................ 138
Interpretações de «múltiplos mundos» ............................................................................................................. 139
Lógicas quânticas ............................................................................................................................................. 141
Resumo ............................................................................................................................................................. 144
O problema das variáveis ocultas e do determinismo .................................................................................. 146
Determinismo e indeterminismo ....................................................................................................................... 146
Argumentos contra as variáveis ocultas ........................................................................................................... 147
A inseparabilidade dos sistemas ...................................................................................................................... 153
O argumento de Einstein, Podolsky e Rosen .................................................................................................... 153
O teorema de Bell ............................................................................................................................................. 156
Resumo ............................................................................................................................................................. 160
Leituras complementares .................................................................................................................................. 162

5 Reflexões sobre a interdependência entre a filosofia e a ciência .................................................. 163


Referências .............................................................................................................................................. 167
Glossário inglês-português ...................................................................Error! Bookmark not defined.

4
Agradecimentos

Numa obra deste género, concebida para fazer o levantamento do estado corrente da disci-
plina, as fontes de influência intelectual são tantas que não podem ser mencionadas numa sec-
ção de agradecimentos. As leituras sugeridas no final dos três grandes capítulos indicarão ao
leitor onde encontrei as fontes de muitas ideias importantes da filosofia da física.
A discussão com muitas pessoas, ao longo dos anos, ajudou-me a pôr as minhas ideias em
ordem com respeito aos tópicos aqui apresentados. Jim Joyce e Bob Batterman ajudaram-me
imenso e aprendi muito com John Earman, Clark Glymour, David Malament, Paul Horwich e
Michael Friedman.
Michele Vaidic foi uma ajuda inestimável na organização do manuscrito. Spencer Carr e os
dois consultores da Westview Press ajudaram-me imenso a melhorar o anterior esboço do ma-
nuscrito, sobretudo no que diz respeito ao estilo e à organização. A revisora Marian Safran foi
uma ajuda muito apreciada na tarefa de trazer o manuscrito à sua forma final.
A investigação que contribuiu para o capítulo 3 foi apoiada em parte pela National Science
Foundation, cuja ajuda agradeço reconhecidamente. Devo ainda agradecimentos à Universida-
de do Michigan, relativos a uma bolsa que me ajudou a liquidar parte dos custos da preparação
do manuscrito.
Lawrence Sklar

5
1
Introdução: a filosofia e as ciências físicas

A relação entre a ciência e a filosofia

A demarcação das ciências naturais em relação à filosofia foi um processo longo e gradual
no pensamento ocidental. Inicialmente, a investigação da natureza das coisas consistia numa
mistura entre o que hoje seria visto como filosofia (considerações gerais das mais vastas sobre a
natureza do ser e a natureza do nosso acesso cognitivo a ele) e o que hoje seria considerado co-
mo próprio das ciências particulares (a acumulação de factos da observação e a formulação de
hipóteses teóricas gerais para os explicar). Se olharmos para os fragmentos que nos restam das
obras dos filósofos pré-socráticos, encontraremos não só tentativas importantes e engenhosas
para aplicar a razão a questões metafísicas e epistemológicas vastas, mas também as primeiras
teorias físicas, simples mas extraordinariamente imaginativas, sobre a natureza da matéria e os
seus aspectos mutáveis.
Na época da filosofia grega clássica já podemos encontrar uma certa separação entre as duas
disciplinas. Nas suas obras metafísicas, Aristóteles faz claramente algo que hoje seria feito por
filósofos; mas em muitas das suas obras de biologia, astronomia e física encontramos métodos
de investigação que são hoje comuns na prática dos cientistas.
À medida que as ciências particulares, como a física, a química e a biologia, foram aumen-
tando em número, canalizando cada vez mais recursos e desenvolvendo metodologias altamen-
te individualizadas, conseguiram descrever e explicar os aspectos fundamentais do mundo em
que vivemos. Dado o sucesso dos investigadores das ciências específicas particulares, há muito
quem pergunte se ainda restará algo para os filósofos fazerem. Alguns filósofos pensam que
existem áreas de investigação que são radicalmente diferentes das que pertencem às ciências
particulares, como, por exemplo, a investigação sobre a natureza de Deus, sobre o «ser em si»
ou sobre qualquer outra coisa do género. Outros filósofos tentaram de várias maneiras encon-
trar uma área remanescente de investigação em filosofia que estivesse mais próxima dos desen-
volvimentos mais recentes e sofisticados das ciências naturais.
Segundo uma perspectiva mais antiga, que foi perdendo popularidade ao longo dos séculos
sem nunca desaparecer inteiramente, existe uma maneira de conhecer o mundo que nos seus
fundamentos não precisa de depender da investigação observacional ou experimental própria
do método das ciências particulares. Esta perspectiva foi influenciada parcialmente pela exis-
tência da lógica e matemática puras, cujas verdades firmemente estabelecidas não parecem de-
pender, para que estejam garantidas, de qualquer base observacional ou experimental. De Pla-
tão e Aristóteles a Leibniz e aos outros racionalistas, passando por Kant e pelos idealistas, e
mesmo até ao presente, tem persistido a esperança de que, se fôssemos suficientemente inteli-
gentes e perspicazes, poderíamos estabelecer um corpo de proposições que descreveriam o
mundo e que, no entanto, seriam conhecidas com a mesma certeza com que dizemos conhecer
as verdades da lógica e da matemática. Poderíamos acreditar nessas proposições independen-
temente de qualquer apoio indutivo obtido de factos específicos observados. Se dispuséssemos
de um corpo de conhecimento como esse, não teríamos atingido o objectivo procurado durante
séculos pela disciplina tradicionalmente conhecida por «filosofia»?
Segundo uma perspectiva mais recente, o papel da filosofia não é o de funcionar como fun-
damento ou extensão das ciências, mas como sua observadora crítica. A ideia é a de que as dis-
ciplinas científicas particulares usam conceitos e métodos. As relações entre os diversos concei-
tos, embora estejam implícitas no seu uso científico, podem não ser explicitamente claras para
nós. O papel da filosofia da ciência seria assim o de clarificar essas relações conceptuais. Uma

6
vez mais, as ciências particulares usam métodos específicos para fazer generalizações, a partir
de dados da observação, em direcção a hipóteses e teorias. O papel da filosofia, segundo esta
perspectiva, é o de descrever os métodos usados pelas ciências e explorar as bases de justifica-
ção desses métodos, isto é, compete à filosofia mostrar que os métodos são apropriados para
encontrar a verdade na disciplina científica em questão.
Mas será que podemos diferenciar a filosofia e a ciência, a partir de qualquer uma destas
perspectivas, de uma maneira simples e directa? Muitos especialistas sugeriram que não. Nas
ciências específicas, as teorias por vezes não são adoptadas devido apenas à sua consistência
com os dados da observação, mas também com base na sua simplicidade, força explicativa ou
outras considerações que pareçam contribuir para a sua plausibilidade intrínseca. Quando cons-
tatamos isto, começamos a perder confiança na ideia de que existem dois domínios de proposi-
ções bastante diferentes: aquelas que são apoiadas apenas por dados empíricos, e aquelas que
são apoiadas apenas pela razão. Muitos metodólogos contemporâneos, como Quine, estariam
dispostos a defender que as ciências naturais, a matemática, e até a lógica pura, formam um
contínuo unificado de crenças sobre o mundo. Todas elas, defendem estes metodólogos, são in-
directamente apoiadas por dados da observação, mas todas contêm também elementos de apoio
«racional». Se isto for verdade, não será a própria filosofia, vista como o lugar das verdades da
razão, uma parte do todo unificado? Isto é, não será também a filosofia apenas uma componen-
te do corpo das ciências especializadas?
Quando procuramos a descrição e a justificação apropriada dos métodos da ciência, parece
que estamos à espera que os resultados específicos das ciências particulares entrem de novo em
cena. Como poderíamos compreender a capacidade dos métodos da ciência para nos conduzir à
verdade se não estivéssemos em condições de mostrar que esses métodos têm realmente a fiabi-
lidade que lhes é atribuída? E como poderíamos fazer isso sem usar o nosso conhecimento sobre
o mundo, que nos foi revelado pela melhor ciência de que dispomos? Como poderíamos, por
exemplo, justificar a confiança da ciência na observação sensorial se a nossa compreensão do
processo perceptivo (uma compreensão baseada na física, na neurologia e na psicologia) não
nos assegurasse que a percepção, tal como é usada quando se testam as teorias científicas, é re-
almente um bom guia da verdade sobre a natureza do mundo?
É ao discutir as teorias mais gerais e fundamentais da física que a imprecisão da fronteira en-
tre as ciências naturais e a filosofia se torna mais manifesta. Dado que elas têm a ambição ousa-
da de descrever o mundo natural nos seus aspectos mais gerais e fundamentais, não é surpre-
endente que os tipos de raciocínio usados ao desenvolver estas teorias altamente abstractas pa-
reçam por vezes estar mais próximos dos raciocínios filosóficos que dos métodos usados quan-
do se conduzem investigações científicas de âmbito mais limitado e particular. Mais adiante, à
medida que explorarmos os conceitos e os métodos usados pela física quando esta lida com as
suas questões fundamentais mais básicas, veremos repetidamente que pode estar longe de ser
claro se estamos a explorar questões de ciência natural ou questões de filosofia. Na verdade,
nesta área da investigação sobre a natureza do mundo, a distinção entre as duas disciplinas tor-
na-se bastante obscura.

Física moderna e filosofia

Será útil ter uma visão preliminar de algumas das maneiras como os resultados da física
moderna afectaram questões filosóficas. Isso pode acontecer quando um estudo teórico em físi-
ca alarga aquelas que se pensavam ser as fronteiras do seu domínio de investigação. Considere-
se, por exemplo, a cosmologia actual. O Big Bang é o modelo mais amplamente aceite da estru-
tura do nosso universo à escala do muito grande. Neste modelo, traça-se a evolução do universo
actual ao longo do tempo, em direcção ao passado, e as dimensões espaciais do universo con-
traem-se nessa direcção de recuo no tempo. Aparentemente, podemos compreender grande
parte da estrutura e dinâmica presentes do universo se o concebermos como algo que se expan-
diu de uma maneira explosiva a partir de uma singularidade ocorrida no passado, há um tempo
finito. Isto é, parece que num certo momento do passado (que decorreu, quando muito, há al-

7
gumas dezenas de biliões de anos atrás) toda a matéria do universo estava concentrada «num
ponto» do espaço (ou melhor, o próprio espaço estava concentrado dessa forma).
No entanto, é óbvio que um modelo do universo como este suscita perplexidades que pare-
cem ultrapassar os modos de procurar respostas a que estamos habituados quando discutimos
problemas de causalidade à escala astronómica. Se podemos ligar o estado actual do universo à
singularidade inicial por meio de uma sequência retrospectiva de causas e efeitos, que podere-
mos fazer depois para continuar o processo científico de pergunta-resposta em busca da expli-
cação causal da existência e natureza desse estado inicial singular? Não é claro, pura e simples-
mente, que tipo de resposta explicativa poderemos oferecer para uma questão como «Por que
razão se deu o Big Bang e por que razão se deu daquela maneira?» É como se já não tivéssemos
espaço para respostas explicativas do tipo a que estamos habituados. A cadeia do raciocínio
causal regressivo, que vai de um estado a um outro estado anterior, que se postula como causa
suficiente, parece parar no único Big Bang inicial.
Isto não quer dizer que não se possa imaginar qualquer coisa como uma explicação da ocor-
rência e natureza do Big Bang, mas apenas que neste ponto parece que os modos de pensamen-
to científico habituais têm de ser complementados com modos de pensamento que o filósofo
conhece bem. O que está em questão é a própria natureza da nossa exigência de explicação e o
tipo de resposta a essa exigência que será de esperar. Este é o ponto em que a física e a filosofia
parecem fundir-se, ficando as questões específicas sobre a natureza do mundo inextrincavel-
mente enredadas com questões, de um género mais metodológico, sobre quais são exactamente
os tipos de explicações e descrições do mundo que é legítimo esperar da ciência.
Certas mudanças na nossa imagem física do mundo exigem uma revisão radical da nossa
concepção do mundo, o que dá origem a outra pressão para «filosofar» na física contemporâ-
nea. Quando tentamos acomodar os enigmáticos dados da observação que as novas revoluções
científicas nos impuseram, depressa descobrimos que a viabilidade de muitos dos conceitos que
mais valorizamos para lidar com o mundo depende da presença de certos aspectos estruturais
da nossa imagem do mundo. Em alguns casos, nem nos apercebemos da existência desses as-
pectos, até eles serem colocados em questão pelas novas teorias físicas revolucionárias. No en-
tanto, quando esses aspectos da nossa imagem teórica se tornam duvidosos, os conceitos que
deles dependem deixam de poder funcionar para nós como antes, e temos de rever os nossos
conceitos; mas uma tal revisão conceptual é exactamente o tipo de coisa que nos impõe uma in-
vestigação tipicamente filosófica sobre o próprio significado dos conceitos que temos usado
desde sempre, e sobre as revisões de significado necessárias para acomodar a nova compreen-
são conceptual do mundo.
Considere-se, por exemplo, a revisão do nosso conceito de tempo que a teoria da relativida-
de restrita implica. Por razões que iremos explorar mais tarde, a adopção desta teoria faz-nos
dizer muitas coisas sobre o tempo que poderiam parecer manifestamente absurdas. Dois acon-
tecimentos que ocorrem ao mesmo tempo para um «observador» podem, segundo esta teoria,
não ser simultâneos para outro observador que esteja em movimento em relação ao primeiro. A
própria ordem temporal de alguns acontecimentos (daqueles que não são causalmente conectá-
veis entre si) pode apresentar-se invertida para observadores diferentes. No entanto, o nosso
conceito anterior de tempo presume, quase inconscientemente, que o que é simultâneo para um
observador é simultâneo para todos, e que se o acontecimento a se deu antes do acontecimento
b, este é um facto «absoluto» para qualquer observador.
A natureza da nova teoria do espaço e do tempo, ao trazer consigo os seus conceitos revolu-
cionários, impõe-nos uma reconsideração ponderada do que terá produzido o nosso aparato
conceptual e os nossos pressupostos teóricos anteriores. Essa reconsideração leva-nos a tentar
determinar cuidadosamente o que na nossa concepção anterior se fundamentava na experiência
e o que nela se pressupunha sem garantia ou justificação; e as viragens revolucionárias im-
põem-nos o dever de investigar com cuidado a maneira pela qual os conceitos dependem da es-
trutura teórica de que fazem parte, e como podem as mudanças nessa estrutura exigir-nos legi-
timamente uma renovação conceptual. Como veremos quando passarmos da teoria da relativi-
dade restrita para a teoria da relatividade geral, precisaremos de estruturas ainda mais inova-
doras para o espaço e para o tempo. Torna-se possível apoiar a possibilidade, no mínimo, de
mundos nos quais, por exemplo, um dado acontecimento está, num sentido perfeitamente coe-

8
rente, no seu próprio passado e futuro. Este tipo de mudança conta claramente como uma revo-
lução conceptual. A compreensão precisa de como tais revoluções conceptuais podem ter lugar,
e do que acontece exactamente quando têm de facto lugar, é o tipo de problema apropriado à
investigação filosófica. A filosofia integra-se agora na teorização da física.
Outro exemplo deste tipo de revolução científica conceptual que exige que a reflexão filosó-
fica faça parte da ciência comum relaciona-se com o impacto da mecânica quântica nas nossas
noções tradicionais de causalidade. A ideia de que cada acontecimento pode ser explicativa-
mente associado por meio de leis a alguma condição anterior do mundo estava pressuposta em
muita da nossa ciência. Este pressuposto foi em muitos aspectos um princípio orientador na
procura de explicações científicas cada vez mais abrangentes para os fenómenos da experiência.
Se um acontecimento parecia não ter causa, isso só podia ser um reflexo da nossa ignorância, do
facto de ainda não termos encontrado a causa cuja existência era assegurada pelo princípio ge-
ral de que «todos os acontecimentos têm uma causa».
No entanto, como veremos, muitos especialistas têm sustentado que já não se pode ter o
princípio como verdadeiro no mundo descrito pela mecânica quântica. Que tipo de teoria nos
poderia dizer que no mundo existem acontecimentos sem causa, acontecimentos relativamente
aos quais a procura de uma causa determinante subjacente será garantidamente infrutífera? A
resposta não é nada simples. O fracasso da causalidade universal que a mecânica quântica im-
plica faz parte de uma revolução conceptual muito mais profunda que nos foi imposta por esta
teoria. Na verdade, dos especialistas que investigaram cuidadosamente estes problemas poucos
acreditam que qualquer imagem do mundo já construída fará justiça aos factos que a mecânica
quântica diz que encontraremos no mundo. Ideias básicas sobre o que constitui a «realidade ob-
jectiva», por contraste com a experiência subjectiva que temos dela, tornam-se problemáticas à
luz desta teoria assombrosa. Uma vez mais (e isso é tudo o que se pretende fazer notar), a natu-
reza revolucionária dos dados da experiência e das teorias construídas pela física moderna para
os integrar impõe-nos o tipo de investigação crítica e cuidada sobre o papel desempenhado (por
vezes apenas implícita e inconscientemente) por certos conceitos fundamentais nas nossas teori-
as anteriores. Além disso, essa mesma natureza revolucionária exige uma investigação filosófica
cuidada do modo como a revisão das teorias acarreta uma revisão da estrutura conceptual. No
contexto das revoluções conceptuais, os tipos de pensamento e raciocínio comuns nos contextos
filosóficos tornam-se uma parte integrante da ciência.
A filosofia também tem sido integrada na prática científica da física moderna por meio da
intromissão na teorização científica de um tipo de crítica epistemológica que antes só se encon-
trava na filosofia. A física mais antiga apoiava-se em pressupostos sobre os dados legítimos em
que se devem basear as inferências que culminam nas teorias físicas, e sobre as regras legítimas
que nos permitiriam passar de sumários de dados observados para hipóteses generalizadas e
teorias postuladas. Aos filósofos deixavam-se habitualmente as perplexidades sobre os pressu-
postos implicitamente admitidos na ciência, assim como a tarefa de elucidar a sua natureza e
examinar a sua legitimidade. Mas na física mais recente os especialistas passaram a ter necessi-
dade, como parte da sua prática científica, de explorar estes temas básicos sobre as razões que
temos para aceitar e rejeitar hipóteses. O trabalho de Einstein na teoria da relatividade e de Bohr
na mecânica quântica é particularmente revelador desta nova tendência epistemológica.
No seu influente artigo sobre a teoria da relatividade restrita, por exemplo, Einstein confron-
ta várias dificuldades observacionais e teóricas da física existente que são extremamente enig-
máticas. A sua abordagem desses problemas fundamenta-se numa discussão extraordinaria-
mente original e brilhante da questão seguinte: «Como poderemos determinar, em relação a
dois acontecimentos espacialmente separados, se estes ocorrem ou não ao mesmo tempo?» Esta
exploração das bases empíricas e inferenciais dos nossos pressupostos teóricos legítimos conduz
Einstein ao núcleo fundamental da sua nova teoria — a relatividade da simultaneidade face ao
estado de movimento do observador. Embora Einstein derive dos seus postulados básicos al-
gumas consequências observacionais surpreendentemente novas e fundamentalmente impor-
tantes, muitos dos seus resultados previstos estavam contidos na teoria anterior de Lorentz;
mas, mesmo relativamente a estas consequências, a investigação de Einstein constitui um avan-
ço de importância fundamental. Do ponto de vista da sua nova perspectiva, as fórmulas antigas
adquirem um significado totalmente diferente. É crucial notar que esta nova perspectiva se ba-

9
seia num exame crítico e filosófico das bases empíricas das nossas inferências teóricas. Surpre-
endentemente, como veremos mais adiante, no próprio coração da outra teoria fundamental de
Einstein sobre o espaço e o tempo (a teoria da relatividade geral) reside um exame crítico e epis-
temológico muito parecido com o das teorias anteriores.
A mecânica quântica oferece-nos outro exemplo central de como a crítica epistemológica de-
sempenha um papel crucial na física moderna. A questão da natureza do processo de medida, o
processo pelo qual um sistema físico é explorado por um observador externo para determinar o
seu estado, torna-se fundamental para uma compreensão do significado das fórmulas funda-
mentais da mecânica quântica. Desde os primórdios desta teoria, as questões sobre o que é ob-
servável desempenharam um papel conceptual importante. Mais tarde, as tentativas para com-
preender consequências curiosas da teoria, como o chamado «princípio da incerteza», exigiram,
uma vez mais, um exame crítico sobre o que podia ser determinado em termos de observação.
Em última análise, as tentativas para compreender o enquadramento conceptual fundamental
da teoria levaram Niels Bohr a afirmar que a nova teoria física exigia uma revisão extraordina-
riamente radical das nossas ideias tradicionais sobre a relação entre o que sabemos sobre o
mundo e o que nele se verifica. A própria noção de uma natureza objectiva do mundo, inde-
pendente do conhecimento que temos dele, foi alvo de crítica no programa de Bohr. Mais uma
vez, ideias que antes só eram comuns no contexto da filosofia tornaram-se parte da física. Na
filosofia, a negação da objectividade e as afirmações a favor de várias doutrinas relativistas ou
subjectivistas têm uma longa história.
A interacção entre a filosofia e a física não começou com estas teorias do século XX. Como ve-
remos, os problemas filosóficos estavam entrelaçados com o desenvolvimento inicial da dinâ-
mica (especialmente em Isaac Newton). No século XIX, os debates filosóficos desempenharam
um papel crucial no desenvolvimento da nova teoria molecular e atómica da matéria. Outros
debates de carácter filosófico foram importantes para estabelecer a base conceptual da teoria do
electromagnetismo, com a sua invocação do «campo» como uma componente fundamental do
mundo físico. Mas a física moderna alargou as suas investigações às próprias fronteiras do
mundo. Ao fazê-lo, enfraqueceu os dispositivos conceptuais adequados para lidar com questões
mais limitadas. A física, na sua tentativa de fazer justiça aos fenómenos enigmáticos e inespera-
dos revelados pelas técnicas experimentais modernas, exige uma revisão radical de conceitos
nunca antes colocados em questão. As novas teorias tornam necessário um exame das bases
empíricas e inferenciais que estão por detrás dos seus pressupostos. Assim, a física teórica re-
cente tornou-se um palco onde os modos filosóficos de pensar são uma componente essencial
do progresso na física. É este entrelaçamento entre a física e a filosofia que iremos explorar.

Filosofia da física e filosofia em geral

Acabámos de passar em revista algumas das razões que tornam a filosofia importante para
quem se interessa pela natureza das teorias físicas. Pode ser útil explicar também por que razão
o estudo dos fundamentos das teorias físicas e dos seus aspectos filosóficos é útil para os filóso-
fos que não estejam especialmente preocupados com a natureza da física. Gostaria de sugerir
que os problemas investigados pelos filósofos da física e os métodos que usam para abordar es-
ses problemas podem também trazer alguma luz às questões filosóficas mais gerais.
Os filósofos da ciência estão interessados em questões como a natureza das teorias científi-
cas, saber como explicam estas os fenómenos do mundo, quais são as bases empíricas e inferen-
ciais destas teorias, e como esses dados empíricos podem ser vistos como algo que apoia ou de-
sencoraja a crença numa hipótese. Podemos ganhar em perspicácia ao abordar estes problemas
mais gerais no contexto de teorias específicas da física contemporânea. O vasto alcance das teo-
rias e a sua natureza altamente explícita proporcionam um contexto onde muitos problemas da
filosofia da ciência geral, que de outro modo seriam bastante vagos, se tornam mais «fixos»
quando centramos a atenção nessas teorias físicas específicas.
Como essas teorias apresentam um elevado grau de formalização, o lugar nelas ocupado por
conceitos cruciais encontra-se estabelecido de uma maneira simples e clara. Questões sobre o
significado de conceitos cruciais, sobre a sua eliminabilidade ou irredutibilidade, sobre as suas

10
relações definicionais, etc., ficam assim sujeitas a um exame rigoroso. É mais difícil conduzir es-
se exame em relação a conceitos mais «vagos» de ciências menos bem formalizadas. Como ve-
remos também, a relação entre a estrutura teórica e os factos observacionais a partir dos quais
esta é inferida é particularmente clara em muitos casos da física formal. Nas teorias sobre o es-
paço e o tempo, por exemplo, o próprio contexto da teorização científica pressupõe noções bas-
tante definidas sobre o que pode contar como «factos acessíveis a uma inspecção observacional
directa», que deverão fornecer toda a base empírica da teoria. Deste modo, questões como a de
saber se a totalidade desses factos poderá seleccionar apenas um concorrente teórico viável,
apoiando-o mais do que a todos os seus rivais, são tratadas de uma maneira esclarecedora, ma-
neira essa que não é possível no contexto geral da ciência. Neste último contexto, não existe
uma noção clara dos limites da observabilidade nem uma delimitação clara da classe das alter-
nativas teóricas possíveis a ter em consideração. Se explorarmos, no contexto das teorias fun-
damentais da física, problemas como o da eliminabilidade ou não eliminabilidade dos conceitos
teóricos, ou o de saber até que ponto os factos observacionais impõem limites às escolhas teóri-
cas, teremos uma maneira de lidar com estes problemas metodológicos gerais: olhamos para ca-
sos específicos que dão uma clareza especial às questões filosóficas. As ideias adquiridas nesta
área mais formalizável e delimitada podem beneficiar aqueles que se ocupam de problemas
mais gerais.
Estas considerações podem de algum modo ser generalizadas. Os filósofos interessados nos
problemas gerais da metafísica, epistemologia e filosofia da linguagem descobrirão que abordar
questões desses domínios, tal como estão exemplificadas em casos particulares e concretos da
teoria física, lançará luz sobre as maneiras apropriadas de lidar com questões gerais. Não po-
demos progredir muito na compreensão das estruturas específicas das teorias físicas parciais
sem usar os recursos fornecidos por aqueles que abordam os problemas mais gerais e funda-
mentais da filosofia. Além disso, não podemos progredir decisivamente nessas áreas mais ge-
rais sem ver como os métodos e soluções gerais se comportam quando se aplicam a casos espe-
cíficos. E os casos específicos dos fundamentos filosóficos das teorias físicas fundamentais são,
também aqui, bastante apropriados para testar pretensões filosóficas gerais.
Devemos dar um pouco de atenção a um último assunto relacionado com este. Encontramos
frequentemente na bibliografia sobre o tema afirmações muito ousadas segundo as quais a física
contemporânea resolveu conclusiva e decisivamente debates filosóficos muito antigos. «A me-
cânica quântica refuta a tese de que todos os acontecimentos têm uma causa» é um exemplo
frequente. Por vezes, surpreendentemente, ambos os lados de um debate filosófico afirmam que
uma teoria resolve um problema a seu favor. Assim, tem-se defendido que a teoria da relativi-
dade geral resolve decisivamente o problema da natureza do espaço; mas há quem defenda que
ela refuta o substantivismo, enquanto outros sustentam que ela resolve o debate a favor dessa
doutrina! Estas afirmações ousadas e injustificadas são enganadoras, pois os problemas são
complexos e os argumentos são por vezes frustrantes na sua subtileza e opacidade. Nestas cir-
cunstâncias, as pretensões a uma vitória decisiva de qualquer tipo devem ser encaradas pelo
menos com algum cepticismo.
Temos de ter um cuidado especial em relação às conclusões filosóficas derivadas de resulta-
dos da física. Por analogia com o princípio GIGO das ciências da computação (garbage in, garba-
ge out — «entra lixo, sai lixo»), chamaremos a este o princípio MIMO: metaphysics in, metaphysics
out — «entra metafísica, sai metafísica». Não há dúvida que qualquer tese filosófica deve ser re-
conciliada com os melhores resultados disponíveis da ciência física, nem tão pouco que o pro-
gresso da ciência tem produzido um antídoto útil para muito dogmatismo filosófico, mas ao
considerar o que a física nos diz sobre questões filosóficas devemos ter sempre o cuidado de
perguntar se a própria teoria física incorpora pressupostos filosóficos. Se descobrirmos que es-
ses pressupostos foram incorporados na própria teoria, devemos estar preparados para exami-
nar cuidadosamente se essa maneira de a apresentar é a única maneira de acomodar os seus re-
sultados científicos, ou se poderão haver outros pressupostos que nos levariam a derivar con-
clusões filosóficas bastante diferentes, caso a teoria os incorporasse.

11
Objectivo e estrutura deste livro

Para terminar, vou apresentar algumas considerações sobre o objectivo e a estrutura deste
livro. A investigação cuidada e sistemática de qualquer um dos grandes problemas da filosofia
da física é uma tarefa demorada e difícil. Um domínio dos conteúdos das teorias fundamentais
da física contemporânea requer um estudo prévio de um corpo de matemática vasto e difícil, já
que as teorias se formulam frequentemente na linguagem poderosa e abstracta da matemática
contemporânea. À formação matemática acresce ainda o estudo dos elementos específicos da
física. Além de tudo isto, a investigação filosófica requer uma formação firme em muitos aspec-
tos da filosofia analítica contemporânea: na metafísica, na epistemologia e na filosofia da lin-
guagem.
Tentar fazer inteira justiça a qualquer um dos problemas centrais da filosofia da física numa
obra introdutória deste tipo está, obviamente, fora de questão. O objectivo é antes o de propor-
cionar ao leitor um mapa das áreas de problemas centrais deste domínio. Este livro centra-se
naquelas questões que, do meu ponto de vista, se apresentam como as mais importantes da filo-
sofia da física. Muitos outros tópicos interessantes quase não serão considerados, e alguns não
serão mesmo abordados, com o objectivo de dirigir a atenção tanto quanto possível para as
questões mais cruciais e centrais.
Relativamente aos tópicos abrangidos, ofereço um esboço ou sinopse dos aspectos funda-
mentais das teorias físicas que estão em interacção mais profunda com a filosofia. A minha es-
perança é oferecer uma abordagem dos problemas suficientemente concisa e clara de modo a
orientar o leitor interessado pelos caminhos, por vezes labirínticos, dos debates centrais. Os ca-
pítulos 2, 3, e 4 são complementados por um guia bibliográfico anotado. O leitor interessado em
seguir com algum pormenor os temas esboçados no texto encontrará nessas secções de referên-
cias um guia para os materiais de formação básica em matemática, física e filosofia, assim como
um guia para as discussões contemporâneas mais importantes sobre o problema em causa. Não
se pretende que as secções de referências sejam um levantamento exaustivo da bibliografia so-
bre qualquer dos temas considerados (uma bibliografia por vezes muito extensa), mas antes um
guia selectivo dos materiais mais úteis para conduzir o leitor mais além de um modo sistemáti-
co.
Embora tenha tentado incluir nas secções de referências materiais acessíveis ao quem não
tem uma vasta formação em matemática e física teórica, não excluí aqueles cuja compreensão
requer uma formação nessas áreas. O material que exige uma formação bastante modesta desse
tipo (ao nível intermédio de uma licenciatura, digamos) está assinalado com (*). O material que
exige uma familiarização mais vasta com os métodos e conceitos técnicos está assinalado com
(**).
As três áreas principais que vamos explorar neste livro são a do espaço e do tempo, a das te-
orias probabilísticas e estatísticas do tipo «clássico» e a da mecânica quântica. Isto vai permitir-
nos examinar muitas das actuais áreas de problemas mais enigmáticas e fundamentais da filoso-
fia da física. Uma outra área principal só será considerada casualmente, embora seja responsá-
vel pela introdução de muitos problemas extremamente interessantes que só em parte têm sido
explorados. Trata-se da teoria geral da matéria e da sua constituição, tal como é descrita pela
física contemporânea. Questões que surgem quando se postula o campo como um elemento bá-
sico do mundo, ou que emergem de problemas da teoria da constituição da matéria, ou dos mi-
croconstituintes da hierarquia que nos conduz das moléculas e dos átomos às partículas ele-
mentares (e talvez mais além), ou da teoria fundamental sobre as próprias partículas elementa-
res, só serão focados de passagem quando lidarmos com as três áreas de problemas centrais
acima indicadas.

12
2
Espaço, tempo e movimento

Problemas filosóficos tradicionais do espaço e do tempo

Questões sobre o conhecimento

Os grandes filósofos da Grécia antiga colocaram-se perante o problema de compreender o


que é ter conhecimento sobre o mundo. Quais, perguntaram eles, são os fundamentos e os limi-
tes da nossa capacidade para conhecer o que realmente se verifica no mundo que nos rodeia?
Como seria de esperar, o projecto de tentar distinguir o conhecimento genuíno da simples opi-
nião começou com um exame das crenças vulgares sobre o que uma pessoa racional comum
pode considerar como conhecimento bem fundamentado.
É claro que existiam muitas crenças particulares comuns acerca da existência e natureza de
objectos individuais do mundo, encontrados na vida quotidiana. Mas existiriam além disso
verdades gerais acerca do mundo que pudessem também ser conhecidas, verdades acerca de to-
dos os objectos ou características de um dado tipo?
Algumas verdades gerais pareciam poder ser estabelecidas por generalização a partir da ex-
periência quotidiana. Parecia assim que se podia inferir, a partir da observação, que as estações
do ano iriam seguir perpetuamente o seu curso habitual. As pedras caíam, o fogo subia, os seres
vivos reproduziam-se e acabavam por morrer depois de um processo de maturação: estas e
inúmeras outras verdades gerais faziam parte do inventário comum de crenças. No entanto, a
reflexão crítica mostrou que a observação, estando sujeita à ilusão e ao erro perceptivo, não era
frequentemente de confiança, e que as crenças gerais inferidas a partir da experiência se revela-
vam muitas vezes insustentáveis quando surgiam novas experiências. Além disso, as verdades
inferidas pareciam carecer de exactidão e precisão, excepto em esferas limitadas da experiência
observacional, como a astronomia, onde se observava uma regularidade mais perfeita e contí-
nua do que aquela que se encontrava na experiência das coisas terrestres vulgares.
Todavia, ao procurar verdades gerais acerca da estrutura fundamental do mundo, os gregos
tinham também à sua disposição as teorias dos primeiros grandes filósofos especulativos. Entre
as muitas teorias gerais grandiosas que foram propostas, estava a de que todas as coisas são fei-
tas de um pequeno número de substâncias básicas, a de que a mudança deve ser explicada pela
reorganização de átomos imutáveis, a de que o mundo é fundamentalmente imutável, ou, pelo
contrário, a de que está em fluxo constante. Mas, embora estas teorias fundamentais do univer-
so fossem empolgantes e profundas, pareciam carecer do tipo de apoio experimental que pode-
ria convencer um céptico a aceitá-las como verdadeiras. É certo que os seus autores argumenta-
vam a seu favor, invocando às vezes verdades gerais básicas derivadas da observação, e afir-
mando outras vezes que podiam estabelecer doutrinas pelo processo do raciocínio puro. No en-
tanto, nenhuma doutrina teve aceitação universal, isto é, não existiu nenhuma doutrina cuja
verdade pudesse mostrar-se por meio de dados indisputáveis.
Mas depois havia a geometria. Aí parecia estar disponível um corpo de asserções cujo signi-
ficado era completamente claro, asserções acerca da natureza do mundo que eram exactas e
precisas, e que podiam ser indubitavelmente conhecidas como verdadeiras. Como exemplos
dessas verdades, temos a de que duplicar o comprimento de um lado de um quadrado multipli-
ca a sua área por quatro, e a de que o quadrado do comprimento da hipotenusa de um triângulo
rectângulo é a soma dos quadrados dos comprimentos dos outros dois lados. Estas e outras
afirmações da geometria tinham a clareza e o carácter indubitável que não se encontravam em
nenhum outro tipo de asserções acerca do mundo.

13
Esse carácter indubitável existia porque as proposições da geometria podiam ser demonstra-
das, um facto que tinha sido descoberto pelos gregos algum tempo antes do grande período da
filosofia grega clássica. As proposições podiam ser derivadas por meio de raciocínios puramen-
te lógicos a partir de primeiros princípios, axiomas ou postulados, que à mente sensata pareci-
am auto-evidentes. Os raciocínios usados garantiam intuitivamente que nunca conduziam de
uma verdade a uma falsidade. Começava-se com verdades óbvias, como a de que dois pontos
fixam uma e apenas uma linha recta que os contém a ambos, e a de que a soma de iguais com
iguais dá iguais. Por meio de uma cadeia de raciocínios na qual cada passo era uma transição de
uma proposição para outra, que conduzia de forma auto-evidente de verdades a outras verda-
des, podia-se assim chegar por fim a uma conclusão cuja verdade ficava então indubitavelmente
garantida. Estas eram as verdades acerca da complexa estrutura geométrica do mundo.
Esta característica da geometria — a sua capacidade para nos dar um conhecimento da estru-
tura do mundo certificado por inferências indubitáveis que partem de verdades também indu-
bitáveis, simples e básicas — era tão impressionante que todos os outros tipos de conhecimento
hipotético pareciam aos filósofos, no máximo, uma espécie de conhecimento de segunda catego-
ria. O conhecimento baseado nos sentidos estava sujeito aos tipos comuns de erros dos sentidos
— erro perceptivo e ilusão —; e o conhecimento que tinha origem em saltos de generalização
realizados a partir das informações específicas das sensações sofria de uma dupla desvantagem:
a possibilidade de erro sensorial e a possibilidade de as nossas inferências generalizadoras po-
derem elas próprias conduzir-nos da verdade à falsidade. Ao passo que as inferências puramen-
te lógicas, que nos conduzem de postulados básicos a teoremas geométricos, pareciam intuiti-
vamente preservar a verdade, as regras para ultrapassar a experiência dos sentidos e alcançar
afirmações gerais acerca da natureza pareciam não ter uma tal garantia intuitivamente certifica-
da.
Para muitos especialistas, as crenças fundadas na observação sensorial e as inferências reali-
zadas a partir delas tornaram-se apenas um preliminar útil ao estabelecimento do conhecimento
genuíno pelo método «geométrico». Os filósofos defenderam durante muito tempo o ideal se-
gundo o qual poderemos, se formos suficientemente inteligentes, acabar por construir um edifí-
cio de conhecimento que abranja todos os campos de investigação — a física da natureza, a psi-
cologia da mente e até mesmo os princípios básicos da moral que regem as verdades sobre o
bem e o mal, a rectidão e a sua ausência —, descobrindo em todos estes campos os seus verda-
deiros princípios básicos auto-evidentes, comparáveis aos axiomas da geometria. Poderíamos
então derivar desses primeiros princípios todas as verdades de cada área, do mesmo modo que
os teoremas da geometria se seguem, apenas pela lógica, dos postulados geométricos básicos.
Com o papel cada vez maior desempenhado pela observação e pela experimentação na fun-
damentação da ciência que surgiu depois da revolução científica, e com a incapacidade de for-
mular uma «geometria» da natureza e da moral, os especialistas começaram a mostrar-se cépti-
cos quanto à adequação do modelo geométrico relativamente à estrutura do conhecimento cien-
tífico. Ao invés, os modelos de conhecimento baseados na observação e nas generalizações rea-
lizadas a partir dela tornaram-se mais atraentes, pelo menos para a maior parte dos filósofos.
David Hume sugeriu que não pode existir, de facto, um conhecimento genuíno sobre o
mundo fundado em auto-evidências intuitivas e em derivações lógicas. Um tal conhecimento
infalível, sugeriu Hume, só poderia ser um conhecimento de proposições «vazias», proposições
verdadeiras apenas em virtude da definição dos seus termos (como a proposição de que ne-
nhum solteiro é casado). Todas as proposições genuínas com conteúdo só poderiam ser conhe-
cidas, se é que o podiam, confiando nos sentidos e por meio de generalizações realizadas a par-
tir deles que nos conduzissem a crenças acerca das relações causais que ocorrem no mundo.
Hume negou, em particular, a própria possibilidade da metafísica, o ramo da filosofia onde se
procura estabelecer, com base apenas em raciocínios puros, verdades profundas e gerais acerca
da natureza do mundo.
A réplica de Immanuel Kant a Hume foi especialmente importante. Embora concordasse
com a rejeição céptica de Hume da maior parte da metafísica tradicional, Kant reservou uma
pequena porção dela, que consistia em asserções genuinamente com conteúdo, estabelecidas
sem referência à observação nem à experimentação. Que tais verdades com conteúdo podiam
ser conhecidas pela razão pura, argumentou Kant, era comprovado pela existência dos dois ra-

14
mos da verdade matemática pura: a geometria e a aritmética. Ambas as disciplinas consistiam
em verdades de que nenhuma pessoa racional podia duvidar, e que tinham sido estabelecidas
apenas pela razão pura. No entanto era óbvio, pensava Kant, que as verdades destas disciplinas
não eram «vazias». Não faz parte do significado de «triângulo» que a soma dos ângulos interio-
res de um triângulo seja de 180º, no mesmo sentido em que faz parte do significado de «soltei-
ro» que um solteiro não seja casado.
Kant sustentou que existiam tais verdades com conteúdo, que podiam ser estabelecidas pela
razão, porque reflectiam a estrutura do dispositivo perceptivo e cognitivo da nossa mente, com
o qual compreendíamos a natureza do mundo. Kant afirmou que uma pequena parte da metafí-
sica tradicional, que incluía asserções como «todos os acontecimentos têm uma causa», parti-
lhava com a geometria e com a aritmética esta característica que consistia em ter conteúdo genu-
íno e mesmo assim poder ser conhecida sem se apoiar na observação nem na experimentação.
Para os nossos propósitos, o aspecto importante das teses gerais de Kant é o papel que a geome-
tria nelas desempenha. Ainda que seja vã a esperança numa física, psicologia ou ética fundadas
em raciocínios puros, não continuará a teoria do espaço — a geometria —, a par da aritmética, a
ser um corpo de conhecimento que não se funda em generalizações realizadas a partir da ob-
servação de factos particulares, fornecidos pelos sentidos?
Nos anos que se seguiram a Kant, muitos especialistas tentaram justificar a afirmação de
Hume de que a correcção de todas as asserções que fazem afirmações informativas genuínas
acerca do mundo só pode ser exibida por meio do confronto com os dados da experiência ob-
servacional. O estatuto problemático da geometria e da aritmética recebeu bastante atenção,
uma vez que, se Hume tivesse razão, as disciplinas matemáticas podiam ter o mundo por objec-
to ou ser conhecidas por meio da razão pura, mas não ambas as coisas. Alguns especialistas ten-
taram mostrar que essas disciplinas só podiam manter o seu estatuto cognitivo sem referência à
experiência observacional porque careciam de conteúdo genuinamente informativo. Foi esta a
motivação de várias tentativas para mostrar que as verdades matemáticas resultavam da lógica
pura, combinada com a definição de um vocabulário puramente lógico de termos matemáticos.
Outros especialistas procuraram antes manter o conteúdo genuinamente informativo das ci-
ências matemáticas, rejeitando a afirmação kantiana de que elas poderiam ser estabelecidas por
um tipo de raciocínio puro que as tornaria, contrariamente às ciências vulgares, imunes ao con-
fronto com a observação enquanto teste último de credibilidade. John Stuart Mill, por exemplo,
defendeu que mesmo as proposições da aritmética eram estabelecidas pelo processo de genera-
lização a partir de resultados de observações particulares. Poderia parecer que as leis básicas da
aritmética teriam uma espécie de certeza auto-garantida, mas isto era uma ilusão: derivávamos
as leis da aritmética da nossa experiência sensorial. Esta experiência, contudo, era tão comum e
estava de tal modo presente que éramos conduzidos ao erro de pensar que as leis da aritmética
não necessitavam de qualquer confirmação empírica. De facto, pensava Mill, tal como as leis da
física e da química, as leis da aritmética só poderiam ser estabelecidas por meio de generaliza-
ções realizadas a partir da experiência empírica.
Certos especialistas em teoria do conhecimento reflectiram sobre o modo como as nossas
crenças formam uma rede complexa de asserções, algumas das quais são invocadas sempre que
está em questão a razoabilidade de acreditar em algumas das outras. Concederam também
atenção ao grau com que as nossas crenças têm de estar fundadas em princípios de inferência,
como o de aceitar como razoável a teoria mais simples que conseguirmos imaginar que esteja de
acordo com os dados empíricos relevantes. Estes especialistas defenderam também que estes
princípios parecem inteligíveis e justificáveis apenas quando pressupomos um conjunto previ-
amente existente de crenças que por momentos permaneçam incontestadas, e mostravam-se
cépticos quanto à utilidade de qualquer distinção rígida entre proposições que podem ser co-
nhecidas pela razão pura e proposições que só podem ser conhecidas com base nos dados da
experiência. De facto, muitos especialistas mostravam-se cépticos quanto à possibilidade de se-
parar as nossas crenças em dois grupos, tal como Hume pretendera fazer: aquelas que são ver-
dadeiras por convenção (ou por definição, ou pelo simples significado dos termos) e aquelas
com conteúdo informativo genuíno.
Nesta perspectiva, todas as nossas crenças fazem parte de uma teia contínua de crenças teó-
ricas. Cada proposição contém elementos convencionais e elementos factuais. Segundo estes fi-

15
lósofos, uma proposição só é confrontada com a experiência sensorial quando está associada a
um vasto corpo de crenças aceites. Uma proposição só pode ser testada pela experiência ou con-
firmada por ela enquanto parte de uma estrutura teórica geral. É este corpo de crenças aceites,
afirmam, que fundamenta os nossos princípios de inferência científica legítima.
Neste livro não procuraremos explorar estas opções em profundidade. Em vez disso, abor-
daremos mais adiante o impacto das mudanças sobre o papel da geometria na matemática e na
física, mudanças essas que influenciaram e foram influenciadas pelo problema mais geral dos
fundamentos das crenças científicas legítimas. Fizemos já notar que a existência precoce da ge-
ometria como corpo ideal de conhecimento verdadeiramente científico fez muitos filósofos limi-
tarem o conhecimento genuíno àquele que pode ser estabelecido por meio de derivações lógicas
rigorosas, realizadas a partir de postulados primeiros auto-evidentes e indubitáveis. A desco-
berta e a exploração, realizada pelos matemáticos, de alternativas à geometria euclidiana famili-
ar — que durante muitos séculos tinha prevalecido como a única geometria matemática —, e a
posterior aplicação das geometrias alternativas recentemente descobertas a teorias físicas desti-
nadas a descrever o mundo real, exerceram uma influência determinante sobre os filósofos que
procuravam resolver os problemas levantados pelo conflito que surgira entre Kant e Hume, e
que fora alimentado por outros. Esses problemas diziam respeito ao fundamento último das
nossas crenças científicas sobre o mundo, e ao grau com que essas crenças respondiam aos da-
dos particulares da observação e da experimentação.

Questões sobre a natureza da realidade

A geometria é a ciência que descreve o espaço. Mas que tipo de coisa é o espaço? Ou melhor,
como poderemos integrar a espacialidade do mundo na nossa concepção geral sobre os tipos de
coisas e propriedades que existem? É óbvio que a espacialidade é um dos aspectos mais gerais e
fundamentais do mundo tal como é dado e tal como interpretamos a sua natureza por meio de
inferências realizadas a partir do que é dado. Na nossa linguagem e prática comuns usamos,
sem qualquer problema, noções espaciais — como a de distância, a de espaço como contentor e
a de continuidade e descontinuidade espaciais — ao lidarmos com estruturas importantes que
regem o comportamento do mundo material que nos rodeia; mas quando tentamos reflectir so-
bre o que é o espaço em si e por si mesmo ficamos perplexos.
Talvez nos ocorra em primeiro lugar que o espaço é uma espécie de «contentor» da matéria
do mundo. Pensamos que todas as coisas existem no espaço, aliás, num e num só espaço englo-
bante, que contém todas as coisas materiais do mundo. Mas mesmo esta noção de «contentor»
causa perplexidade, já que parece que o espaço contém objectos em virtude da coincidência es-
pacial destes com partes do próprio espaço. Um objecto ocupa uma porção de espaço na qual
reside. Esta é certamente uma forma de estar contido diferente daquela que tem um objecto que,
digamos, está contido numa caixa.
Ocorre-nos com naturalidade a ideia de que podemos imaginar um mundo destituído de to-
das as coisas materiais, mas tendo, mesmo assim, algum tipo de realidade. Seria um espaço va-
zio à espera de ser preenchido, ou parcialmente preenchido, por pedaços de matéria. Esta ideia
de espaço como uma espécie de entidade — o contentor permanente e imutável das coisas ma-
teriais comuns que podem surgir e desaparecer, e cuja natureza pode mudar — está presente,
provavelmente, no discurso que Platão profere no Timeu acerca do espaço como o «receptáculo»
do ser material.
Mas que tipo de coisa peculiar é o próprio espaço, essa entidade fantasmagórica? É certo que
nos sentimos autorizados a falar do «espaço vazio entre as estrelas», ou mesmo a imaginar o es-
paço totalmente vazio de um mundo no qual toda a matéria tivesse sido, de alguma forma, des-
truída por magia. Mas que tipo de coisa é esta a que queremos chamar «espaço vazio»? Será um
objecto único particular, do qual os espaços, tal como o espaço de um quarto, são partes, da
mesma forma que uma fatia de pão é uma parte de um pão inteiro? Esta coisa, o espaço, tem ca-
racterísticas como, por exemplo, as que são descritas pelas verdades da geometria. Contudo, as
nossas intuições dizem-nos que o próprio espaço é demasiado diferente da matéria vulgar, de-
masiado insubstancial para contar realmente como uma coisa do mundo, a par das coisas vul-
gares que nele existem. Mas de que outro modo poderemos ver este assunto?

16
Aristóteles falou de «lugar». É difícil decifrar o que tinha Aristóteles ao certo em mente, mas
parece que concebia o lugar como a fronteira ou limite de um pedaço de matéria. O movimento
é a mudança de lugar, algo que ocorre quando um objecto troca uma superfície que o limita por
outra. Mas significará isto que o espaço é algo adicional que não se reduz à matéria que nele
existe? Percebe-se que Aristóteles tenta evitar tal conclusão, mas fica sem saber que outro es-
quema conceptual há-de colocar no seu lugar. Veremos já de seguida a principal tentativa, feita
por filósofos posteriores, de encontrar um esquema conceptual que faça justiça às asserções que
desejamos afirmar sobre a existência de objectos no espaço, o facto de ocuparem um lugar, de
serem capazes de mudar de lugar, e assim por diante, e que faça também justiça a noções intui-
tivas como a da possibilidade de um espaço que não esteja ocupado por matéria. Esta última
proposta tentará também evitar o ultraje aparente de conceber o espaço como uma componente
adicional do ser, que pode ter uma realidade independente da própria existência da matéria que
o preenche.
Se o espaço levanta perplexidades, o tempo intriga-nos ainda mais. Mais uma vez, a nossa
intuição diz-nos que tudo o que acontece no mundo acontece no tempo. Apesar de pensarmos
por vezes que os nossos estados mentais subjectivos poderão não estar no espaço (onde estarão
localizados, por exemplo, os pensamentos?), pensamos que mesmo os nossos pensamentos têm
de ocorrer em algum momento do tempo. Temos a intuição de que existe um único tempo no
qual acontece tudo o que acontece, e de que qualquer processo que tenha uma duração ocupa
uma porção do tempo total do mundo. Parece também poder dizer-se, em relação ao tempo,
que este é como um contentor, tal como o espaço. Nos processos que ocupam tempo, a sua du-
ração coincide com momentos do «próprio tempo». E julgamos que é possível imaginar perío-
dos de tempo em que não ocorrem acontecimentos materiais. Não podemos nós imaginar, afi-
nal, um mundo onde toda a matéria e as suas transformações tenham desaparecido, mas no
qual o tempo continue a decorrer como sempre?
Mas se é estranho pensar no tempo como uma «coisa», muito mais estranho é pensar no
tempo como uma «entidade» no sentido comum da palavra. Todavia, se o tempo pode conti-
nuar a decorrer mesmo que a matéria deixasse de existir, não deveríamos atribuir ao tempo al-
gum tipo de ser independente da existência das coisas vulgares do mundo e das suas mudanças
vulgares ao longo do tempo?
Outras conexões entre a temporalidade e o ser deixam-nos ainda mais perplexos. Parece que
pensamos que a própria existência das coisas vulgares está ligada ao tempo de uma maneira di-
ferente daquela que a liga ao espaço. Se uma coisa existiu no passado mas não existe agora,
pensamos que, propriamente falando, ela não tem qualquer existência; e o mesmo é verdade em
relação aos objectos futuros, que ainda não existem. Mas, como Santo Agostinho fez notar, o
presente é um pequeno momento diáfano de tempo, o que nos faz perguntar como se pode em
rigor afirmar que as coisas, dada a sua natureza temporal, chegam realmente a ter alguma exis-
tência. Ao contrário do espaço, o tempo parece ter um aspecto assimétrico. O passado e o futuro
parecem-nos muito diferentes: o passado parece-nos uma realidade fixa, ainda que desapareci-
da, mas o futuro parece-nos algo que não tem, talvez, nenhum tipo determinado de ser até ocor-
rer.
Outros aspectos da temporalidade das coisas intrigaram de tal forma os filósofos antigos que
alguns se mostraram completamente cépticos quanto à realidade do tempo e das mudanças que
o acompanham. Zenão de Eleia formulou argumentos para tentar mostrar que as noções vulga-
res de tempo estão repletas de contradições. Como podia existir o movimento, por exemplo, se
em cada momento particular um objecto estava em repouso no espaço que ocupava nesse preci-
so momento? Acontece que alguns dos argumentos de Zenão, destinados a revelar as contradi-
ções internas das noções de tempo e de movimento, seriam hoje considerados falaciosos. Con-
tudo, os dilemas que suscitou noutros argumentos proporcionam ainda hoje um ponto de par-
tida fecundo para discussões sobre alguns assuntos, como o que diz respeito aos esquemas con-
ceptuais correctos para lidar com as noções de espaço e de tempo como contínuos e com o con-
ceito de movimento. Alguns resultados importantes da filosofia, assim como o desenvolvimento
da matemática correcta para lidar com o movimento, inspiraram-se em tentativas para resolver
os enigmas levantados por Zenão.

17
Aristóteles impressiona uma vez mais o leitor moderno com o seu discernimento, ainda que,
de um ponto de vista moderno, o que tem para dizer possa ser interpretado de múltiplas for-
mas. Aristóteles concebe o tempo como algo distinto do movimento ou da mudança das coisas
materiais, como algo que, tal como o espaço, não pode ser identificado com os objectos que es-
tão nele. Todavia, Aristóteles faz notar que sem o movimento ou a mudança não teríamos cons-
ciência da passagem do tempo. Assim, de uma maneira análoga à sua noção de lugar como a
espacialidade dos corpos, distinto destes mas sem existir como uma entidade independente e
separada dos corpos do mundo, Aristóteles fala do tempo como uma medida do movimento e
da mudança. Mas fica ainda por esclarecer, então, o que é supostamente o tempo. É algo que
depende das coisas e do seu movimento e mudança; todavia, não é nem o próprio movimento
nem a própria mudança. O que será então?
Subjacente a grande parte da perplexidade suscitada pela natureza do espaço e do tempo,
encontra-se a sua dupla função de proporcionar um palco tanto para o desenrolar dos fenóme-
nos físicos como para os conteúdos do que intuitivamente consideramos a nossa própria consci-
ência subjectiva ou privada. Os filósofos defenderam frequentemente que, ao passo que os ob-
jectos físicos e os seus processos decorrem no espaço e no tempo, os conteúdos mentais das nos-
sas mentes existem apenas no tempo. Todavia, parece-nos que algum modo espacial é apropri-
ado até para descrever, digamos, os conteúdos visuais dos nossos sonhos. O gato sonhado e o
tapete sonhado podem ser irreais enquanto objectos genuínos, mas pode muito bem parecer-nos
que o gato sonhado está no tapete sonhado de uma forma que consideramos pelo menos pare-
cida com a forma de um gato real estar num tapete real. Deste modo, até as nossas quimeras
mentais parecem envolver algum tipo de espacialidade.
Além disso, é certo que os acontecimentos dos nossos sonhos ocorrem numa ordem tempo-
ral, mesmo que estejamos convencidos de que essa é uma ordem temporal de acontecimentos
irreais. Todavia, também aqui parecem existir algumas diferenças entre o espaço mental e a sua
temporalidade. O espaço onde o gato sonhado e o tapete sonhado existem parece um «lugar
nenhum» no que diz respeito ao espaço real. Parece ser um tipo de espaço separado do espaço
das coisas físicas. No entanto, parece-nos que os processos oníricos ocorrem no mesmo tempo
que abrange os acontecimentos físicos. O meu sonho do acidente de automóvel ocorreu depois
de adormecer e antes de acordar, na mesma ordem temporal em que ocorreu o acontecimento
de estar deitado na cama. Contudo, o espaço do acidente de automóvel ilusório não pode de
forma alguma encaixar-se em qualquer lugar real, nem mesmo no espaço real da minha cabeça
onde está localizado o mecanismo dos meus sonhos — o cérebro.
Como veremos, não há uma solução fácil para o problema de colocar num esquema coerente
um modelo da natureza do tempo e do espaço que faça justiça às intuições que acabámos de
passar em revista. A nossa descrição deve explicar em que consiste a natureza do espaço e do
tempo. Que tipo de existência terão, e como estará a sua existência relacionada com a existência
das coisas e dos processos mais comuns que ocupam espaço e têm lugar no tempo? Como fará
esta natureza do espaço e do tempo justiça às nossas intuições acerca da espacialidade e tempo-
ralidade tanto dos acontecimentos físicos do mundo como dos conteúdos da nossa experiência
subjectiva? Finalmente, qual será o aspecto da natureza do espaço e do tempo que nos dá acesso
ao conhecimento que afirmamos ter sobre a sua natureza, um tipo de conhecimento que foi con-
siderado por alguns especialistas como o próprio modelo da certeza que podíamos ter acerca do
mundo com origem unicamente na nossa razão pura?

O debate entre Newton e Leibniz

No século XVII, a filosofia do espaço e do tempo tornou-se um tema central da metafísica e da


epistemologia. A discussão atingiu um ponto elevado no importante debate entre Leibniz, o
grande filósofo e matemático alemão, e Newton, o grande físico e matemático inglês. Neste de-
bate foram delineadas duas teorias opostas sobre o lugar do espaço e do tempo no mundo, e
muitas das questões fundamentais relacionadas com o espaço e o tempo que vieram mais tarde
a ocupar os filósofos receberam aí a sua formulação mais clara.

18
Leibniz avançou uma concepção do espaço e do tempo que apresentava finalmente uma
compreensão clara de como uma teoria podia, num tom aristotélico, negar ao espaço e ao tempo
um tipo de existência independente da existência das coisas materiais comuns e dos aconteci-
mentos materiais, mas manter, mesmo assim, um lugar crucial na estrutura do mundo para o
espaço e para o tempo. Na filosofia «profunda» de Leibniz, na sua verdadeira metafísica, nega-
se a existência per se da matéria, assim como a do espaço e do tempo. Para este Leibniz esotéri-
co, o mundo é constituído por entidades fundamentais de tipo mental, as mónadas, que existem
totalmente isoladas umas das outras, não estando em interacção nem sequer em termos causais.
Cada mónada contém na sua natureza uma imagem completa de todo o universo, o que explica
como, sem interacção, as mónadas possam exibir uma evolução coerente ao longo do tempo.
Temos de pôr de parte esta «profunda» e estranha visão leibniziana do mundo, que foi, no en-
tanto, defendida de forma engenhosa e importante. A sua visão menos profunda, exotérica, do
espaço e do tempo ocupa um lugar intermédio entre o ponto de vista de que a matéria, o espaço
e o tempo existem, e o ponto de vista monadológico final.
Nesta posição intermédia pode admitir-se a existência de objectos e de acontecimentos mate-
riais. O que são, então, o espaço e o tempo? Considere-se quaisquer dois acontecimentos, conce-
bidos como eventos instantâneos que ocorrem no domínio das coisas materiais. Os aconteci-
mentos têm uma relação temporal entre si, sendo o primeiro acontecimento posterior, simultâ-
neo, ou anterior ao segundo acontecimento. Podemos ir mais além ao definir uma relação quan-
titativa entre os acontecimentos, dizendo que o primeiro acontecimento está separado do se-
gundo por um intervalo de tempo definido, que pode ser positivo, nulo ou negativo. A ideia
simples de Leibniz é a de que o tempo é apenas a colecção de todas estas relações temporais en-
tre acontecimentos. Se não existissem acontecimentos, não existiriam relações, e assim, neste
sentido, o tempo não teria uma existência independente dos acontecimentos que nele ocorrem.
Contudo, as relações entre os acontecimentos são uma componente real do mundo (nesta pers-
pectiva exotérica). Por isso, seria também enganador dizer que o tempo não existe realmente.
Se considerarmos todas as coisas do mundo num único instante de tempo, veremos as rela-
ções espaciais que ocorrem entre elas. Estão a certas distâncias umas das outras, e em certas di-
recções umas em relação às outras. O espaço é a colecção de todas estas relações espaciais entre
os objectos do mundo num certo instante. Uma vez mais não existe qualquer contentor, qual-
quer espaço em si à espera de ser ocupado pelos objectos. Há apenas os objectos e as inúmeras
relações espaciais que eles estabelecem entre si.
A analogia com as relações familiares pode tornar isto mais claro. Qualquer família consiste
em várias pessoas que estão relacionadas entre si das maneiras habituais. A pode ser pai de B, C
o primo direito de D, e assim por diante. De que é feita a realidade de uma família? Resposta:
das pessoas da família. Mas é óbvio que as relações que essas pessoas têm entre si são caracte-
rísticas perfeitamente reais do mundo. Mas será que poderíamos conceber essas relações como
algo que existe independentemente das pessoas? Será que poderia existir uma espécie de «espa-
ço relacional» que existisse em si e por si, e que estivesse à espera de ser ocupado por pessoas?
Estas sugestões são manifestamente absurdas. Bem, diz Leibniz, o que acontece com o «espaço
relacional» acontece com o espaço vulgar. Há coisas e há relações espaciais entre elas, mas não
há qualquer contentor com existência independente, o espaço em si, tal como não há um «espa-
ço relacional» com existência independente.
Todos os acontecimentos que ocorrem no mundo mental ou material estão temporalmente
relacionados entre si, e todos os objectos materiais estão espacialmente relacionados entre si. Es-
tas duas famílias de relações abrangem assim toda a realidade. Mas elas existem como uma co-
lecção de relações entre os acontecimentos substanciais e as coisas do mundo, e não como subs-
tâncias independentes.
Mas isto não é assim tão simples. Que diremos dos momentos do tempo em que nada acon-
tece? E das regiões do espaço que não estão ocupadas, onde não há nada? Deveremos limitar-
nos a negar a sua realidade? Leibniz sugere uma maneira de mantermos estas noções como legí-
timas e mesmo assim continuarmos a ser relacionistas. Considere-se o espaço vazio entre nós e
uma estrela. Não há nada que mantenha com respeito a nós a relação espacial de estar a meio
caminho entre nós e a estrela. Todavia, poderia haver algo que tivesse essa relação espacial com
respeito a nós e à estrela. Podemos assim conceber os lugares desocupados como relações espa-

19
ciais que algo poderia ter com os objectos do mundo, mas que de facto nada tem. O espaço é,
afirma Leibniz, a colecção das relações espaciais entre as coisas «quanto à possibilidade». As-
sim, a família das relações contém tanto relações possíveis como relações efectivas. Poderemos
mesmo pensar em recuperar a noção de espaço totalmente vazio. Mesmo que não existissem re-
almente objectos, poderiam existir — e, se existissem, teriam relações espaciais entre si. Assim, o
espaço totalmente vazio, que os anti-relacionistas consideram uma noção inteligível, poderia
tornar-se, para o relacionista, a colecção das relações possíveis (mas não efectivas) que os objec-
tos materiais possíveis (mas não efectivos) poderiam manter entre si, caso existissem tais objec-
tos. Saber se tolerar essas «relações possíveis» é dar a vitória ao anti-relacionista continua a ser
tema de debate filosófico.
Leibniz não se limita a propor dogmaticamente a sua concepção relacionista do espaço e do
tempo, como uma alternativa ao ponto de vista de que o espaço e o tempo são um certo tipo de
coisas com existência independente. A concepção do espaço como contentor parece considerar o
espaço como um tipo de substância. As coisas existem no espaço, segundo esta concepção, coin-
cidindo com um pedaço limitado da substância espacial. Mas, defende Leibniz, tal concepção
está repleta de dificuldades.
Imaginemos que o espaço vazio já existe e que Deus tenta decidir onde colocar o universo
material. Não há nenhuma razão para o colocar num lugar e não noutro. Dado que todos os
pontos ou regiões do «espaço em si» são como todos os outros, não pode haver qualquer fun-
damento para escolher uma localização para o universo material em vez de outra. Mas, segun-
do Leibniz, todos os factos têm de ter uma razão suficiente para que se verifiquem. Uma vez
que a localização do universo material no espaço em si não pode ter tal razão suficiente, não
pode existir tal coisa. Contudo, a concepção do espaço como contentor, e não como um mero
conjunto de relações espaciais entre as coisas, implica a existência de localização no espaço em
si. Logo, esse espaço como contentor não pode existir.
Leibniz defende, além disso, que não existiria qualquer diferença observacional entre o facto
de o mundo material estar localizado num determinado lugar do espaço em si em vez de nou-
tro, mas mantém que um tal facto (a localização no espaço em si), sem consequências observaci-
onais, não é realmente um facto. Aliás, Leibniz defende que a noção de espaço em si é incoeren-
te, usando o princípio de que um mundo possível que seja exactamente como outro mundo
possível em todos os aspectos tem de ser o mesmo mundo possível. Se o espaço em si existisse,
poderiam existir dois mundos possíveis exactamente iguais, excepto quanto a uma diferente lo-
calização (no espaço em si) do mundo material em cada um desses mundos possíveis. Mas uma
tal diferença de localização no espaço em si não é uma diferença real. Não podem, portanto,
existir esses dois mundos possíveis. Logo, a teoria do espaço em si como contentor, que implica
que esses dois mundos possíveis poderiam existir, tem de estar errada.
A posição relacionista de Leibniz consiste, pois, em afirmar que considerar o espaço como
uma coisa autónoma conduz à incoerência. Além disso, considerar o espaço como a colecção de
todas as relações espaciais entre coisas materiais permite-nos dizer tudo o que de coerente pre-
cisamos dizer sobre a espacialidade do mundo. Logo, a concepção relacionista é a que devemos
adoptar. Alega-se também que uma visão semelhante do tempo, concebido como a família das
relações temporais entre acontecimentos materiais, suprime qualquer debate sobre o «tempo em
si» como uma entidade que faça parte do mundo.
Todavia, existem objecções claramente filosóficas ao relacionismo, em especial à versão que
invoca relações possíveis. Para o relacionista, a estrutura do espaço, tal como é revelada pela
geometria, é a estrutura da colecção de todas as relações espaciais possíveis entre os objectos.
Mas qual é o «fundamento» desta estrutura de possibilidades? Com isto quero dizer o seguinte:
se pensarmos na maior parte das possibilidades físicas, verificaremos que elas só são compreen-
síveis devido a uma estrutura subjacente efectiva. Uma pedra de sal, por exemplo, possui a
«possibilidade» de se dissolver, ainda que não esteja dissolvida. Dizemos que é solúvel. Mas es-
ta solubilidade reside no facto de a pedra de sal não dissolvida ser efectivamente constituída
por iões. No caso da estrutura do espaço em si, que o relacionista considera ser a estrutura que
descreve a colecção de todas as relações espaciais possíveis, qual será a realidade subjacente que
fundamenta essa ordem entre as possibilidades, se ela não é a estrutura do «espaço em si» como
o anti-relacionista o concebe?

20
O opositor de Leibniz, o grande físico Newton, era anti-relacionista. Newton considerava o
espaço e o tempo como algo que não consiste apenas em meras relações espaciais e temporais
entre objectos e acontecimentos materiais, mas não tinha a certeza do que seriam exactamente.
Considerava-os como algo semelhante a uma substância, mas por vezes preferiu concebê-los
como atributos ou propriedades — na verdade, como propriedades de Deus. Embora tenha ofe-
recido argumentos puramente filosóficos contra o relacionismo de Leibniz, Newton é mais co-
nhecido por ter defendido que os resultados da observação e da experimentação podem refutar
conclusivamente a doutrina relacionista.
Na física desenvolvida por Newton a partir das investigações anteriores de Galileu, entre
outros, existe um contraste claro entre movimentos inerciais e não inerciais. Os movimentos
inerciais são os movimentos de um objecto com uma velocidade constante, isto é, de um objecto
que se move a uma velocidade imutável e numa direcção fixa. Ora, para um relacionista, noções
como as de «velocidade imutável» e «direcção fixa» só podem ser entendidas em relação a um
quadro de referência estabelecido por alguns objectos materiais. Algo que está em repouso em
relação à superfície da Terra, por exemplo, está em movimento rápido e a mudar constantemen-
te de direcção em relação a um quadro de referência localizado, digamos, no Sol. Mas, defende
Newton, a noção de movimento não inercial não é a de um movimento «meramente relativo»,
mas a de um movimento «absoluto».
Porquê? Os movimentos não inerciais geram «forças» que se revelam em efeitos demonstrá-
veis. A água de um balde que descreve movimentos rotativos transborda. Os passageiros de um
comboio inclinam-se para a frente ou para trás consoante este acelera ou trava para parar.
Quando dois comboios estão em aceleração relativa, os passageiros de um dos comboios podem
sentir a aceleração, enquanto os do outro podem não sentir nada. Um comboio pode estar, por
exemplo, em repouso na estação, enquanto o outro efectua uma travagem brusca. Contudo, em
relação um ao outro, os comboios estão ambos em aceleração. A única explicação que pode ha-
ver para a assimetria entre os comboios é a existência de uma aceleração «absoluta», uma acele-
ração que seja uma mudança de velocidade não apenas em relação a um quadro de referência
material arbitrário.
Newton defende que tais efeitos inerciais serão sempre os mesmos em todo o lado e em todo
o universo. Afinal, são apenas estes efeitos inerciais que, por exemplo, impedem os planetas de
caírem no Sol. Logo, podemos afirmar que a aceleração, a aceleração absoluta, produz efeitos
observáveis. Mas a aceleração, mesmo a aceleração absoluta, é relativa a algo. Se não pode ser
entendida como relativa aos objectos materiais vulgares, só pode sê-lo relativamente ao «espaço
em si». Por isso, o espaço em si não é apenas o «contentor» dos objectos — talvez uma forma
desajeitada de nos referirmos ao facto de as coisas materiais estarem espacialmente relacionadas
entre si. É um objecto que entra numa relação causal com outros objectos materiais. Tal como o
movimento relativo do tijolo e da janela causa o estilhaçar da janela provocado pelo tijolo, tam-
bém a aceleração relativa dos passageiros e do espaço em si se revela nas forças inerciais que
resultam desse movimento relativo.
Segundo Newton, apesar de ser menos plausível conceber o tempo como um tipo de «objec-
to», este, tal como o espaço, tem também de ser absoluto num certo sentido importante. Para o
relacionista, a medida de um lapso de tempo é uma mudança ou movimento numa coisa mate-
rial. Um processo pode ser regular em relação a um relógio, o que acontece quando um aconte-
cimento se repete em intervalos de tempo iguais. Contudo, o mesmo processo pode parecer ir-
regular em relação a um outro relógio determinado. Isso acontecerá a não ser que o segundo re-
lógio seja «regular» pelos padrões do primeiro. Para o relacionista não há qualquer medida «ab-
soluta» de lapsos de tempo; preferimos simplesmente escolher alguns relógios em função da
simplicidade da descrição do mundo que a sua medição do tempo nos permite obter. Ora, o
movimento em aceleração dá origem a efeitos que o movimento que não esteja em aceleração
não provoca. E essa aceleração é absoluta. Mas o movimento rectilíneo acelerado pode ser re-
presentado como não sendo acelerado se escolhermos uma medida de tempo suficientemente
peculiar que faça a velocidade parecer uniforme, acelerando ou abrandando a medida de tempo
de acordo com a mudança de velocidade dos objectos. Mas a aceleração real é absoluta, e por
isso a medida de tempo tem também de ser absoluta. Há um tempo «em si» que «flúi unifor-

21
memente, seja qual for a medida dos relógios particulares». Os bons relógios estão de acordo
com este tempo absoluto, os maus, não.
Encontramos assim em Newton a introdução de um novo elemento no velho debate filosófi-
co entre aqueles que consideram o espaço e o tempo como constituintes autónomos do mundo,
e aqueles que os consideram simplesmente como compêndios de colecções de relações entre as
coisas fundamentais do mundo: os objectos materiais e as suas mudanças. Para o newtoniano, o
espaço e o tempo são elementos teóricos postulados, cuja existência tem de se pressupor para
poder explicar os fenómenos a que temos acesso ao nível experimental e observacional.
As reacções à transformação introduzida por Newton no velho debate filosófico foram mui-
tas e variadas ao longo dos dois séculos que se seguiram aos seus argumentos. As primeiras
tentativas de encontrar uma explicação para os fenómenos newtonianos, postulando apenas as
coisas materiais e as relações entre elas, debateram-se com dificuldades. Até mesmo Leibniz
admitiu que a noção de «qual dos objectos está em movimento» nos movimentos relativos era
essencial, e procurou uma explicação para essa distinção no próprio objecto em que actua a cau-
sa do movimento.
Compreendeu-se rapidamente que a doutrina de Newton tinha consequências peculiares.
Dado que o «espaço em si» existia, a posição de um objecto no espaço em si e o movimento uni-
forme de um objecto em relação ao espaço em si eram aspectos reais do mundo, apesar de estes
factos, ao contrário da aceleração de um objecto em relação ao espaço em si, não darem origem
a qualquer fenómeno observacional. Alguns resultados da física sugeriram que o movimento
uniforme absoluto podia implicar a possibilidade de detectar fenómenos de um tipo óptico, e
não de um tipo mecânico; como veremos, estas conclusões revelaram-se erradas. Propostas pos-
teriores, que surgiram depois das inovações na concepção do espaço e do tempo inspiradas na
teoria da relatividade, postularam noções de espaço e de tempo que nos permitiram definir a
aceleração absoluta, mas o mesmo não aconteceu com a posição espacial e a velocidade absolu-
tas.
No século XIX, o físico e filósofo Ernst Mach tentou, uma vez mais, conciliar os resultados da
física newtoniana com a abordagem relacionista do espaço e do tempo. Mach chamou a atenção
para o importante facto de que a taxa de rotação da Terra, determinada pela observação das es-
trelas fixas, é a mesma que a taxa absoluta de rotação da Terra, determinada por experiências
puramente mecânicas baseadas nas forças geradas pela rotação. Poderia isto sugerir uma ori-
gem das forças inerciais que Newton não tivesse imaginado? Suponhamos que a aceleração de
um objecto material em relação a outro produz forças, tal como a velocidade relativa de duas
partículas electricamente carregadas produz uma interacção magnética. Suponhamos que tal
força é independente da separação dos objectos (num grau elevado), mas dependente das suas
massas. Não poderão as forças geradas por acelerações, que Newton atribuía à interacção causal
do objecto experimental com o espaço em si, ser antes atribuídas à aceleração relativa do objecto
experimental em relação às estrelas fixas, ou, mais propriamente, em relação à média da restan-
te matéria «espalhada» pelo universo? Se assim for, não poderemos reconciliar os factos obser-
vacionais que Newton usou para argumentar a favor da existência de um tipo de espaço subs-
tantivo com um relacionismo leibniziano que considerasse todas as posições, velocidades e ace-
lerações como características de uma coisa material em relação a outra?
No final do século XIX, a situação era assim mais ou menos a seguinte: todos concordavam
que existiam duas amplas dimensões da realidade — todas as coisas materiais existiam no espa-
ço, e todos os acontecimentos, materiais ou mentais, decorriam no tempo. A estrutura destes
palcos do mundo era conhecida. O tempo podia ser concebido como um simples contínuo uni-
dimensional. O espaço era uma estrutura tridimensional, descrita pela conhecida geometria eu-
clidiana. Parecia que podíamos conhecer esta estrutura inferindo-a de primeiros princípios cuja
verdade era, num certo sentido, indisputável, isto é, cuja verdade podia ser conhecida por uma
pessoa racional por meio de um tipo qualquer de razão pura. De um ponto de vista filosófico, a
natureza destes contentores de todas as coisas e acontecimentos não era clara. Os substantivis-
tas de inspiração newtoniana rivalizavam com os relacionistas que seguiam as ideias de Lei-
bniz. Outros defendiam concepções metafísicas diferentes. Kant, por exemplo, pensava que o
espaço e o tempo eram estruturas organizadoras da mente, por meio das quais dávamos às sen-
sações um formato compreensível.

22
O espaço e o tempo podiam descrever-se matematicamente, tal como acontecia com o mo-
vimento das coisas materiais no espaço ao longo do tempo. A caracterização deste movimento
por meio das leis da cinemática (a descrição do movimento) e da dinâmica (a sua explicação em
termos de forças) constituía a disciplina central da física. Um aspecto desta teoria física foi a sua
necessidade de distinguir as classes preferidas de movimento inercial dos movimentos em ace-
leração que produziam forças inerciais. Isto forneceu o núcleo do argumento científico newtoni-
ano da concepção substantivista sobre a natureza do espaço.
Ao passo que a aceleração em relação ao espaço em si tinha consequências observáveis, a po-
sição no espaço em si e a velocidade uniforme em relação ao espaço em si não tinham tais con-
sequências. Mas existia a esperança de que, por meio de fenómenos ópticos, se pudesse deter-
minar o estado de repouso no espaço em si. A tentativa de determinar o estado de repouso em
relação ao espaço em si por meio de experiências com a luz foi o que conduziu, graças ao traba-
lho do grande físico Albert Einstein, às espantosas revisões das nossas ideias de espaço e de
tempo. A possibilidade de novas ideias puramente filosóficas sobre a natureza do espaço e do
tempo já existia antes do seu trabalho, mas foi à luz dos resultados de Einstein e das penetrantes
ideias por eles proporcionadas que se explorou a maior parte da filosofia contemporânea do es-
paço e do tempo. Em «Do espaço e do tempo ao espaço-tempo» e em «A gravidade e a curvatu-
ra do espaço-tempo», esquematizarei as novas teorias sobre o espaço e o tempo propostas por
Einstein, regressando depois à filosofia do espaço e do tempo no contexto dessas novas teorias
físicas.

Do espaço e do tempo ao espaço-tempo

As origens da teoria da relatividade restrita

Vimos que, embora Newton tivesse postulado o «espaço em si» como o objecto de referência
em relação ao qual as acelerações geravam forças inerciais observáveis, considerava-se que o
movimento uniforme em relação ao espaço em si não tinha consequências observáveis. Isto se-
guia-se da famosa observação de Galileu de que num laboratório fechado não podemos dizer,
por meio da realização de qualquer experiência mecânica, em que estado de movimento uni-
forme está o laboratório. No entanto, continuava a ser concebível que outros fenómenos, não
mecânicos, dependessem de alguma maneira do movimento uniforme do dispositivo em rela-
ção ao espaço em si. Este movimento revelar-se-ia então numa consequência observacional.
No século XIX, a esperança de que isso viesse a acontecer surgiu da redução da luz à radiação
electromagnética. Na teoria da electricidade e do magnetismo de Maxwell prevê-se que as on-
das electromagnéticas, das quais as ondas de luz são uma espécie, tenham uma velocidade de-
finida em relação a um observador. Essa velocidade deveria ser a mesma em todas as direcções,
e deveria ser independente da velocidade da fonte de luz em relação ao observador. Um obser-
vador em repouso num tanque de água determinará uma certa velocidade do som na água, ve-
locidade essa que é a mesma em cada direcção. Esta velocidade do som será completamente in-
dependente do movimento da fonte do som na água. Logo que a onda de água seja gerada, a
sua velocidade dependerá apenas das propriedades da água em que a onda viaja. O mesmo de-
veria acontecer com a luz, chamando-se «éter» (aquilo que é para a luz o que a água é para o
som) ao meio de transmissão da luz.
Um observador que se mova no tanque através da água não vê a mesma velocidade do som
em todas as direcções, já que vai ao encontro do som numa direcção, afastando-se dele na direc-
ção oposta. Por isso, um observador em movimento em relação ao éter deverá ser capaz de de-
tectar esse movimento, mesmo que se trate de um movimento uniforme e sem aceleração, ao
medir a velocidade da luz em todas as direcções. Se admitirmos o pressuposto de que um ob-
servador em repouso no éter estará em repouso num dos sistemas inerciais da mecânica em que
não se produzam quaisquer forças mecânicas inerciais, torna-se plausível identificar o éter com
o espaço em si de Newton. Este pressuposto foi sempre afirmado no século XIX e, numa versão
reinterpretada, continua a ser correcto na teoria da relatividade. Poderíamos assim usar experi-
ências com a luz para determinar o nosso movimento uniforme em relação ao espaço em si.

23
Concebeu-se uma série de experiências engenhosas para detectar que estado de movimento
uniforme era o estado de repouso no éter ou no espaço em si. Estas experiências consistiram em
enviar luz a partir de um ponto ao longo de trajectórias diferentes, fazendo depois regressar a
luz ao seu ponto de origem. A luz deveria demorar diferentes intervalos de tempo para percor-
rer as diversas trajectórias, dependendo do comprimento destas e do estado de movimento do
dispositivo no éter. Mudar a orientação do dispositivo, ou deixar que o movimento da Terra fi-
zesse isso por nós à medida que a Terra rodava sobre o seu eixo e viajava na sua órbita em torno
do Sol, mudaria os tempos relativos que a luz precisaria para percorrer as diferentes trajectórias.
Essa mudança temporal poderia ser detectada por um observador na origem da luz, que veria
uma mudança na posição das linhas de interferência, linhas alternadas de luz e escuridão que se
produzem quando os dois feixes de luz regressam e se encontram, fazendo as regiões de inten-
sidade variável somarem-se (ou subtraírem-se) mutuamente. (Veja-se a figura 2.1.)

==========================================
INSERIR A FIGURA DA PÁGINA 27 COM A SEGUINTE LEGENDA:

Figura 2.1 A experiência de Michelson-Morley. Um feixe de luz é dividido em dois no vidro parcialmente
espelhado B. Um feixe vai para o espelho C e é reflectido, o outro vai para o espelho D. Se o dispositivo
estiver a mover-se através do éter — o meio de transmissão da luz pressuposto pela antiga teoria das on-
das — na direcção indicada pela seta v, a luz deveria demorar mais tempo a percorrer a trajectória BCB de
comprimento l do que a percorrer a trajectória BDB, também com um comprimento l. Se depois se rodar o
dispositivo 90 graus, a diferença de tempo dos percursos ficará invertida. Mas esta mudança não é detec-
tada quando se realiza a experiência, mesmo que tornemos o comprimento da trajectória BC diferente do
comprimento BD. Em geral, nenhuma experiência de ida e volta revela qualquer movimento através do
éter do laboratório.
==========================================

Quando se realizaram as experiências, para espanto daqueles que as fizeram, não se podia
discernir qualquer diferença detectável nos tempos de viagem da luz. Era como se a luz viajasse
com a mesma velocidade fixa, a velocidade que a teoria prevê para a luz no sistema em repouso
no éter, em qualquer sistema laboratorial que esteja em movimento uniforme. (Estes «resultados
nulos» não se registam, a propósito, quando o dispositivo está em movimento não uniforme. A
rotação pode ser detectada, por exemplo, por um giroscópio laser de anel, que detecta a mu-
dança na velocidade da luz em direcções opostas em torno de uma trajectória circular à medida
que o laboratório vai rodando.) Ora, pode parecer que este surpreendente resultado nulo pode-
rá dever-se a alguma peculiaridade da luz ou do electromagnetismo. Se pensarmos por que ra-
zão há-de a velocidade do sinal variar quando o laboratório está em movimento em relação ao
meio de transmissão do sinal, veremos rapidamente que nesta experiência está a ser posta em
questão uma intuição muito fundamental sobre o movimento. Essa intuição é a de que, por
exemplo, se corrermos atrás de uma coisa em movimento, ela mover-se-á mais devagar em rela-
ção a nós do que em relação a alguém que não participe na perseguição.
Poderíamos justificar estes resultados surpreendentes de diversas maneiras. Uma das suges-
tões foi a de que a Terra, no seu movimento, arrastava o éter consigo, localmente, de tal modo
que a porção de éter próxima da Terra estava sempre em repouso em relação à Terra e ao dispo-
sitivo. Esta proposta entrava em conflito, no entanto, com observações astronómicas bem esta-
belecidas.
Inventaram-se uma série de teorias compensatórias para explicar estes inesperados resulta-
dos nulos. Se considerássemos que o comprimento do dispositivo se contrai na direcção do seu
movimento em relação ao éter, e considerássemos também que todos os processos físicos medi-
dos por relógios do dispositivo se atrasam quando esses relógios são colocados em movimento
em relação ao éter, poderíamos justificar como simples aparência o facto de a velocidade da luz
parecer ser a mesma em todas as direcções. Embora a luz estivesse realmente a mover-se a di-
versas velocidades, em relação ao dispositivo, em direcções diferentes, as consequências obser-
vacionais que se esperavam em resultado disto teriam sido canceladas na proporção certa pelas
mudanças induzidas (pelo movimento do dispositivo através do éter) nos componentes do dis-
positivo usados para determinar velocidades — comprimentos e intervalos de tempo medidos
por réguas e relógios. O resultado final seria assim, uma vez mais, o de tornar o movimento
uniforme em relação ao espaço indetectável por quaisquer meios experimentais!
24
A brilhante sugestão de Einstein foi a de que se tomasse o fenómeno aparente de a luz ter a
mesma velocidade, em todas as direcções e em todos os estados de movimento uniforme, como
algo que indica o que na realidade acontece. Por que razão não postular, defendeu Einstein, que
o que parece acontecer com base nas experiências de ida e volta acontece realmente? Para cada
observador em movimento uniforme, a luz no vácuo desloca-se à velocidade prevista pela teo-
ria do electromagnetismo em qualquer direcção. É importante frisar quão radical é esta propos-
ta. Se um feixe de luz se está a afastar de um observador numa dada direcção à velocidade c, e
se um segundo observador está a viajar na direcção da luz à velocidade v, por exemplo, em re-
lação ao primeiro observador, consideramos que a luz está a viajar à velocidade c, e não à velo-
cidade c - v, como nos diz a intuição, em relação também ao segundo observador.
Como poderá isto acontecer? O núcleo do argumento de Einstein consiste numa crítica pers-
picaz da noção de simultaneidade no que respeita a acontecimentos separados por uma certa
distância. Para dois acontecimentos separados por uma certa distância espacial, o que significa
«ocorrer ao mesmo tempo»? No pensamento pré-einsteiniano, limitamo-nos a presumir que, se
dois acontecimentos ocorrem ao mesmo tempo em relação a um observador, ocorrem também
ao mesmo tempo relativamente a todos os observadores. É um desafio lançado a esta última no-
ção que fornece a diferença principal entre o espaço e o tempo tal como antes eram entendidos,
e o espaço-tempo tal como é entendido na teoria de Einstein conhecida por «teoria da relativi-
dade restrita».
Einstein sustenta que, para determinarmos a velocidade da luz numa dada direcção, pode-
mos pensar em contornar os resultados nulos das experiências de ida e volta medindo directa-
mente a velocidade da luz de um ponto, A, a outro, B. Mas só poderíamos fazer isto se pudés-
semos determinar a distância entre os pontos e o tempo que a luz leva para ir de A até a B, sen-
do a velocidade a distância dividida pelo tempo. No entanto, para obter o intervalo de tempo
entre a emissão e a recepção de um sinal de luz temos de ser capazes de sincronizar relógios nos
dois pontos, de modo a que estes marquem «zero» no mesmo momento. Como se poderia reali-
zar esta sincronização?
Se pudéssemos transportar instantaneamente um relógio de A para B, poderíamos estabele-
cer a sincronização sincronizando os dois relógios em A e mudando um instantaneamente para
B. Mas, presume Einstein, os objectos não podem ser transportados de um lugar para outro sem
que decorra algum tempo. Einstein parte do princípio, de facto, que a velocidade da luz no vá-
cuo é uma velocidade limite — nada pode viajar mais depressa. Sendo assim, por que razão não
sincronizar dois relógios em A, mover um deles a uma velocidade qualquer para B, e considerar
que os dois acontecimentos são simultâneos quando se lê o valor n num relógio em A e se lê n
num relógio em B?
Neste ponto, devemos recordar o objectivo de tentar estabelecer a simultaneidade relativa-
mente a acontecimentos distantes. Queríamos fazer isto para que pudéssemos determinar a ve-
locidade da luz de A para B. E queríamos fazer isso para que pudéssemos contornar o problema
dos resultados nulos das experiências de ida e volta, um fenómeno explicado pela combinação
da ideia de que a luz tinha velocidades diferentes nas diferentes direcções com as afirmações
compensatórias sobre como as réguas encolhem e os relógios se atrasam quando se movem em
relação ao éter. Recordemos que o interesse das experiências de ida e volta foi, desde logo, o de
determinar em que referencial a velocidade da luz era realmente a mesma em todas as direc-
ções, de modo a determinar que referencial estava realmente em repouso no éter ou no espaço
em si.
Mas se a teoria compensatória é correcta, os relógios transportados de A para B não vão es-
tar, de uma maneira geral, sincronizados em B, mesmo que o estivessem em A. Isto porque
quando se movem de A para B vão estar, de uma maneira geral, a viajar a velocidades diferen-
tes em relação ao éter e, logo, vão ficar «atrasados» de um modo desigual. É óbvio que o relógio
apropriado para determinar a sincronização dos relógios em A e B será aquele que se mover
muito devagar em relação ao éter, sofrendo assim uma distorção mínima à medida que se mo-
ve. Mas, para sabermos que relógio é esse, teríamos de saber qual o referencial em que o éter es-
tava em repouso, que era o que estávamos a tentar determinar desde o início!
Suponha-se que sabíamos qual o referencial de repouso do éter. Como a luz, em relação ao
éter, viaja com a mesma velocidade em todas as direcções, uma maneira fácil de sincronizar re-

25
lógios em A e B seria enviar um sinal de luz de A que fosse reflectido em B e regressasse a A.
Como a luz demora o mesmo tempo para chegar de A a B que demora para chegar de B a A,
poderíamos considerar que o acontecimento que em A seria simultâneo com a reflexão em B se-
ria o acontecimento ocorrido em A no momento I, sendo I metade do tempo decorrido entre a
emissão e a recepção do sinal de luz em A, tal como é determinado por um relógio em repouso
em A. Mas, diz Einstein, tanto quanto podemos saber pelas experiências de ida e volta, é como
se a luz tivesse esta mesma velocidade em todas as direcções, seja qual for o estado de movi-
mento uniforme do observador. Suponhamos que a luz viaja realmente à mesma velocidade em
relação a qualquer observador em movimento uniforme. Nesse caso, cada um desses observa-
dores pode usar o método da luz reflectida para determinar que acontecimentos ocorrem ao
mesmo tempo que outros acontecimentos.
É fácil ver que ao tomar isto como a nossa definição de simultaneidade relativamente a acon-
tecimentos distantes terá como resultado a discordância entre observadores quanto à questão de
saber que pares de acontecimentos decorrem ao mesmo tempo, como podemos ver na figura 2.2
e na sua explicação. Bem, que observador terá razão nas suas atribuições de simultaneidade? Se-
gundo a teoria do éter, só o observador em repouso no éter. Os outros estão a ser iludidos por
considerarem que a luz viaja à mesma velocidade em todas as direcções em relação aos seus la-
boratórios, quando na verdade isso não acontece. Segundo Einstein, todos os observadores têm
razão nas suas atribuições de simultaneidade. Acontece apenas que «ocorrer ao mesmo tempo»
é algo que não existe; só existe o «ocorrer ao mesmo tempo em relação a um estado específico de
movimento uniforme». Podemos reconciliar os resultados nulos das experiências de ida e volta
com o pressuposto galilaico segundo o qual todos os observadores em movimento uniforme vê-
em os mesmos fenómenos físicos, abandonando pura e simplesmente a noção intuitiva de que
há uma noção absoluta, não relativa, de «ocorrer ao mesmo tempo».

==========================================
INSERIR A FIGURA DA PÁGINA 30 COM A SEGUINTE LEGENDA:

Figura 2.2 A definição de simultaneidade de Einstein e a relatividade da simultaneidade. OS representa


os acontecimentos da história da vida de um observador, um observador que se mantém numa posição
constante, x, à medida que o tempo, t, vai decorrendo. OS’ representa a história da vida de outro observa-
dor que se move (em relação a OS) para a esquerda. Como e’ está a meio caminho no tempo de O para r
(onde se dão os acontecimentos de emitir e receber um feixe de luz reflectido no acontecimento e), S, con-
siderando que a velocidade da luz na direcção e sentido de e e no sentido oposto é a mesma, pensa que e’ é
simultâneo com e. S’, raciocinando de uma maneira semelhante, considera e’’ como simultâneo com e, por-
que está a meio caminho no tempo de O para r’. No entanto, como um sinal causal pode deixar e’ e chegar
a e’’, S e S’ concordam que e’ e e’’ não podem ser simultâneos. Na relatividade, os acontecimentos só são
simultâneos ou não em relação a um «referencial inercial de movimento» escolhido, como o de S ou o de
S’.
==========================================

Podemos mitigar alguma da estranheza desta conclusão se pensarmos no conceito de «estar


no mesmo lugar». Imaginemos dois observadores que estão em movimento um em relação ao
outro. O primeiro observador é atingido na cabeça em dois momentos diferentes. Será que as
duas pancadas ocorreram «no mesmo lugar»? «Sim», diz o observador atingido, «ambos ocorre-
ram no lugar onde se situa a parte de cima da minha cabeça». «Não», diz o outro observador,
«um ocorreu perto de mim e o outro longe de mim». Que afirmação está correcta? A não ser que
acreditemos no «espaço em si» de Newton, em relação ao qual um e apenas um dos observado-
res pode realmente estar em repouso, por que razão não haveremos de dizer que «no mesmo
lugar» é simplesmente uma noção relativa? Dois acontecimentos podem estar no mesmo lugar
em relação a um observador, e em lugares diferentes em relação a outro observador que esteja
em movimento relativamente ao primeiro. E, se Einstein tiver razão, passa-se exactamente o
mesmo com «no mesmo momento».
Para obtermos uma ideia completa do espaço e do tempo que Einstein propõe temos de ad-
mitir outro pressuposto. Este envolve a afirmação de que todos os lugares e direcções do espaço
e do tempo são semelhantes, mas vai além disto ao admitir um pressuposto que é equivalente à
suposição de que a estrutura espácio-temporal do mundo é plana. Examinaremos esta noção de
espaço-tempo plano mais minuciosamente em «A Gravidade e a Curvatura do Espaço-Tempo».

26
O pressuposto necessário é o da linearidade das relações de separações espaciais e temporais
para um observador em relação às de outro observador. Com este pressuposto adicional, cons-
trói-se uma estrutura do espaço e do tempo na qual dois observadores em movimento recíproco
irão fazer atribuições de separações espaciais entre acontecimentos bastante diferentes um do
outro, acontecendo o mesmo com as atribuições de separações temporais. As separações espaci-
ais e temporais atribuídas a um par de acontecimentos por um observador podem, no entanto,
ser calculadas a partir daquelas que foram atribuídas a esse par por outro observador em mo-
vimento em relação ao primeiro. Pode fazer-se isto por meio de fórmulas conhecidas por «trans-
formações de Lorentz», originalmente derivadas no contexto das teorias compensatórias anteri-
ores.
Embora as distâncias espaciais e temporais entre dois acontecimentos variem de observador
para observador, é importante notar que uma consequência dos postulados básicos da teoria é a
de que uma outra quantidade, conhecida por «quadrado do intervalo entre os acontecimentos»,
terá um valor invariante: será o mesmo para todos os observadores em movimento uniforme.
Pode ser calculado a partir da separação temporal entre os acontecimentos ocorridos no sistema
de um observador, t, da separação espacial nesse mesmo sistema de referência, x, e da velocida-
de da luz, c, por meio da seguinte fórmula: I2 = x2 – c2 t2. Ao passo que t e x irão variar de obser-
vador para observador, I2 manter-se-á o mesmo para todos eles. Um passo crucial nesta de-
monstração depende do facto de todos os observadores estarem a atribuir à luz a mesma velo-
cidade invariante, c.

O espaço-tempo de Minkowski

Todas as consequências da teoria de Einstein no que diz respeito a uma nova conceptualiza-
ção do espaço e do tempo podem ser resumidas na noção de espaço-tempo de Minkowski, o
palco de todos os processos físicos na teoria da relatividade restrita. A ideia básica é começar
com localizações de pontos de acontecimentos como os constituintes fundamentais a partir dos
quais se constrói o espaço-tempo. Podemos concebê-los como localizações possíveis de eventos
instantâneos e destituídos de extensão espacial. Estes pontos de acontecimentos tomam o lugar
dos pontos espaciais e dos instantes de tempo da teoria pré-relativista. O que constitui o quadro
de referência da nova imagem do espaço e do tempo são as estruturas básicas impostas sobre o
conjunto destes pontos de espaço-tempo, os acontecimentos ou localizações de acontecimentos.
(Veja-se a figura 2.3.)

===========================================
INSERIR A FIGURA DA PÁG. 32, COM A SEGUINTE LEGENDA:

Figura 2.3 Alguns elementos do espaço-tempo de Minkowski. A linha t representa um observador iner-
cial, sendo o um acontecimento da sua vida. A linha x representa todos os acontecimentos que, para o ob-
servador, são simultâneos com o. A e B representam sinais luminosos que vêm do passado, passam por o e
se dirigem para o futuro. Os acontecimentos das regiões I e II estão tão longe, espacialmente, de o e tão
próximos de o, temporalmente, que um sinal teria de viajar mais depressa do que a luz para conectar um
tal acontecimento ao acontecimento o. Presume-se geralmente que não existem tais sinais. Os acontecimen-
tos das regiões III e IV podem ser conectados ao acontecimento o por sinais causais que viajem mais deva-
gar do que a luz.
===========================================

Cada par destes acontecimentos tem um intervalo definido entre si, invariante e absoluto na
estrutura. Para um dado observador num estado específico de movimento uniforme, pode deri-
var-se uma separação espacial definida e um intervalo definido de tempo entre acontecimentos,
mas os seus valores são relativos ao estado específico de movimento do observador.
Dois acontecimentos cujo intervalo invariante seja nulo são tais que um sinal luminoso no
vácuo, emitido a partir do primeiro acontecimento, pode chegar ao outro. Repare-se que o in-
tervalo invariante ou o intervalo de espaço-tempo se distingue da distância espacial porque
pontos diferentes podem ter um intervalo nulo. Diz-se que tais acontecimentos têm um interva-
lo de espaço-tempo do tipo luz. Acontecimentos cujo intervalo invariante elevado ao quadrado
seja negativo estão suficientemente perto no espaço e suficientemente distantes no tempo para

27
que os sinais que se propaguem mais devagar do que a luz possam ir de um para outro; diz-se
que esses acontecimentos têm um intervalo invariante temporal ou de tipo temporal. Pares de
acontecimentos cujo intervalo invariante elevado ao quadrado seja positivo estão demasiado
distantes no espaço e demasiado próximos no tempo para que qualquer sinal que viaje a uma
velocidade idêntica ou menor à da luz possa conectá-los. Se presumirmos que a luz é o sinal
mais rápido e que representa um limite, os acontecimentos anteriores não podem ser conecta-
dos por qualquer processo causal, seja ele qual for, e diz-se que têm um intervalo invariante de
tipo espacial. Se tomarmos um ponto como origem, a classe dos acontecimentos com intervalo
nulo em relação à origem divide o espaço-tempo em duas regiões distintas: a dos acontecimen-
tos interiores que têm um intervalo temporal invariante e a dos exteriores que têm um intervalo
espacial invariante em relação ao acontecimento de origem. Esta classe de acontecimentos que
têm um intervalo tipo luz em relação ao acontecimento de origem é constituída por uma com-
ponente futura e outra passada. Tomadas conjuntamente, diz-se que estas componentes são os
«cones de luz» do acontecimento de origem. (Na verdade, só são cones num espaço-tempo de
duas dimensões e não num espaço-tempo que tenha as três dimensões espaciais efectivamente
existentes.)
No espaço plano habitual da geometria euclidiana existem linhas rectas. O espaço-tempo de
Minkowski tem também trajectórias rectilíneas. Se os intervalos entre os pontos de um caminho
geodésico são de tipo espacial, o caminho representa uma linha recta espacial. Esta última é
uma linha recta no espaço e num dado instante, gerada a partir do espaço-tempo escolhendo-se
um observador em movimento uniforme e tomando-se como espaço uma colecção de aconteci-
mentos simultâneos, no seu sistema de referência. Linhas rectas cujos acontecimentos tenham
uma separação nula representam as trajectórias de raios de luz que viajem no vácuo. Linhas rec-
tas de tipo temporal representam a trajectória ao longo do espaço e do tempo de uma partícula
em movimento uniforme.
Num diagrama, poderíamos representar por uma linha recta um observador em repouso
num referencial em movimento uniforme. Qualquer outro observador em movimento uniforme
que coincida com o nosso primeiro observador no acontecimento de origem seria representado
por uma linha recta com um certo ângulo em relação à vertical. É importante reconhecer que a
questão de saber qual das linhas é vertical não tem qualquer significado físico. Só se tivéssemos
uma noção newtoniana sobre quem está realmente em repouso no próprio espaço é que teria
algum significado real representar-se um observador sempre no mesmo sítio e os outros obser-
vadores que estivessem em movimento uniforme a mudar de sítios ao longo do tempo. Mas o
espaço-tempo de Minkowski não conhece uma tal noção de qual observador em movimento
uniforme tem uma velocidade real nula, pois todas as velocidades uniformes estão fisicamente a
par nesta imagem do espaço-tempo.
Tendo escolhido um observador em movimento uniforme, podemos também representar
com uma linha recta, no nosso diagrama, todos os acontecimentos simultâneos com o aconteci-
mento de origem relativamente ao estado de movimento desse observador. Esquematicamente,
esta linha recta representa realmente o «espaço num dado instante» do observador, que é, claro,
tridimensional. Mas temos de suprimir duas dimensões espaciais para colocarmos o diagrama
num plano; logo, representa-se com uma linha todo um «espaço num dado instante», espaço
esse infinito, não curvo, euclidiano e tridimensional. Para um observador em movimento em
relação ao nosso primeiro observador, uma linha recta diferente representará todos os aconte-
cimentos simultâneos com o acontecimento de origem relativamente ao estado de movimento
deste novo observador. É preciso uma nova linha porque os dois observadores agrupam acon-
tecimentos diferentes como simultâneos com o acontecimento de origem, e o que conta como
espaço no momento do acontecimento de origem depende do estado de movimento do obser-
vador. Mostra-se facilmente que a linha da simultaneidade (o espaço num dado instante) para o
segundo observador representado no diagrama teria de ser inclinada em relação à linha da si-
multaneidade do primeiro observador.
Notámos que, nas teorias compensatórias concebidas inicialmente para explicar os resulta-
dos nulos das experiências de ida e volta, postulou-se que o comprimento dos objectos em mo-
vimento relativamente ao éter diminuía, e que os relógios em movimento relativamente ao éter
se atrasavam. No espaço-tempo de Minkowski não há, obviamente, qualquer éter, mas a con-

28
tracção do comprimento e a dilatação do tempo ainda ocorrem. Suponhamos que uma vara com
um metro de comprimento está em repouso num sistema de referência em movimento unifor-
me. Irá declarar-se, em qualquer outro sistema em movimento uniforme, que essa vara de um
metro tem um comprimento inferior a um metro. Suponhamos que um relógio está em repouso
num sistema em movimento uniforme. Um observador que esteja em qualquer outro sistema
em movimento uniforme irá declarar que esse relógio está a «atrasar-se», isto é, a demorar mais
do que um segundo para avançar um segundo.
É notável que esta contracção do comprimento e dilatação do tempo seja perfeitamente simé-
trica. Se o leitor e eu estivermos em movimento relativo, considerarei mais curtas as varas de
um metro que estiverem em repouso no seu sistema de referência, mas o leitor considerará mais
curtas as varas de um metro que estiverem no meu sistema. E o atraso dos relógios é igualmente
simétrico. Embora pareça o contrário, não há aqui qualquer inconsistência, porque o compri-
mento e o intervalo de tempo são agora relativos a um observador, e as asserções proferidas são
assim perfeitamente consistentes. Encontram-se indícios directos a favor da existência efectiva
destes fenómenos, por exemplo, na duração das partículas instáveis — inexplicavelmente longo
em termos pré-relativistas — criadas na atmosfera superior e observadas da superfície da Terra.
Só o atraso relativo do seu processo de decaimento, provocado pela sua velocidade elevada re-
lativamente a nós, pode explicar o fenómeno.
Esta consequência da relatividade dá origem a uma ampla variedade de paradoxos, a con-
tradições aparentes que não são realmente contradições. Podemos encontrar alguns deles em
qualquer texto sobre a teoria da relatividade. Um atleta que transporta uma vara, por exemplo,
corre para dentro de um celeiro, entrando por uma extremidade e saindo pela outra. Quando a
vara está em repouso relativamente ao celeiro, tem o mesmo comprimento que o celeiro. Como
a vara em movimento é mais curta que o celeiro, alguém pode fechar ambas as portas enquanto
o atleta e a vara estão no celeiro. Mas para o atleta o celeiro é mais curto que a vara, e assim isto
é claramente impossível. A solução é pensar na ordem temporal em que os processos decorrem
a partir das diferentes perspectivas do atleta e do observador em repouso no celeiro. Para o ho-
mem em repouso no celeiro, ambas as portas estão fechadas enquanto o atleta está no celeiro
com a vara. O atleta vê a porta mais distante aberta, e a sua vara sai do celeiro antes de a porta
mais próxima chegar a fechar-se atrás de si.
O espaço-tempo da relatividade restrita, o espaço-tempo de Minkowski, exige que façamos
outra distinção sobre o tempo que não ocorre na teoria pré-relativista. Notámos já que qualquer
observador atribuirá um certo intervalo de tempo entre dois acontecimentos, e que este interva-
lo irá variar de observador para observador. A isto chama-se o «intervalo de tempo coordena-
do» entre os acontecimentos relativos ao observador em questão. Surge outra noção de tempo
quando consideramos alguém que se move de um acontecimento (um lugar num certo instante)
para outro acontecimento (um lugar diferente num instante diferente) ao longo de uma trajectó-
ria no espaço-tempo, através de uma sucessão de lugares num certo instante. Suponhamos que
esse agente transporta consigo um relógio que mostra o valor zero no primeiro acontecimento.
Este relógio irá mostrar um valor definido no acontecimento final. Todos os observadores irão
certamente estar de acordo quanto a esse valor, porque todos aceitarão a coincidência do valor
indicado pelo relógio com o acontecimento final, já que estes acontecimentos decorrem no
mesmo lugar e nesse caso não existe relatividade da simultaneidade. A este tempo chama-se o
«tempo próprio» decorrido entre os dois acontecimentos.*
Mas o tempo próprio decorrido entre dois acontecimentos irá variar em função da trajectória
de espaço-tempo ao longo da qual se transporta o relógio de um acontecimento para outro. Este
fenómeno não tem paralelo na física pré-relativista. De facto, pode-se mostrar facilmente que o
tempo decorrido num relógio transportado de um acontecimento para outro será máximo se a
trajectória seguida do primeiro acontecimento para o segundo for uma trajectória de movimen-


* Entende-se que os dois acontecimentos ocorrem «no mesmo lugar» no referencial do observador que
transporta o relógio, embora ocorram em lugares diferentes para diferentes observadores. Neste sentido, o
«tempo próprio» entre os dois acontecimentos é uma quantidade universal, embora corresponda a tempos
coordenados diferentes para diferentes observadores. (Nota dos R. C.)

29
to uniforme que não esteja em aceleração. Esta é a fonte do famoso paradoxo dos gémeos, se-
gundo o qual se um gémeo se mantiver num sistema de movimento uniforme enquanto o outro
realiza um percurso no espaço e no tempo que envolva movimento com aceleração, mas que o
traz de novo para junto do gémeo que permaneceu em casa, então o gémeo aventureiro será
mais jovem que o seu irmão — irá exibir, por exemplo, menos envelhecimento biológico —
quando os dois se encontrarem de novo. Partículas instáveis lançadas ao longo das trajectórias
circulares dos aceleradores proporcionam provas de que esta consequência da relatividade é
real. As partículas que decaem são em menor número que as suas compatriotas de um grupo
que permaneça em repouso no laboratório entre o primeiro momento, quando coincidem, e o
segundo momento, em que voltam a coincidir. Como é habitual, não há aqui qualquer contradi-
ção na teoria, mas apenas fenómenos que não esperávamos, fenómenos que resultam da sur-
preendente natureza do espaço-tempo. (Veja-se a figura 2.4.)

===========================================
INSERIR A FIGURA DA PÁGINA 36 COM A SEGUINTE LEGENDA:

Figura 2.4 O paradoxo dos gémeos. S é um observador que se mantém num estado inercial e transporta
um relógio do acontecimento o para o acontecimento o’. O tempo decorrido no relógio é representado pe-
los mostradores da esquerda. S’, inicialmente em repouso em relação a S, acelera para a direita, viaja para
a direita a uma velocidade uniforme, muda o sentido do movimento relativo, regressa à posição de S e ace-
lera de novo de modo a ficar em repouso relativamente a S, na posição o’. Os mostradores da direita repre-
sentam o tempo decorrido no relógio transportado por S’. A relatividade restrita prevê que terá decorrido
menos tempo no relógio transportado por S’ ao longo do percurso em aceleração de o para o’ do que no
relógio de S.
===========================================

Notámos que a mecânica newtoniana estava de acordo com o princípio de Galileu segundo o
qual todos os fenómenos físicos pareceriam idênticos para qualquer observador que estivesse
num estado de movimento uniforme, embora o facto de o seu laboratório estar em aceleração se
traduzisse em consequências observáveis. Se aplicarmos a antiga teoria da mecânica ao novo
espaço-tempo relativista, ela deixa de satisfazer este princípio. Por isso, Einstein desenvolveu
uma nova mecânica que reconcilia a relatividade galilaica dos fenómenos mecânicos com a no-
va imagem do espaço-tempo. A fonte desta teoria é simples. A mecânica anterior obedecia a
princípios como o da conservação da energia, o da conservação da quantidade de movimento e
o da conservação do momento angular. Compreende-se agora que estes princípios são conse-
quências de simetrias fundamentais na estrutura do espaço-tempo (em particular, do facto de
todos os pontos do espaço-tempo, tal como todas as direcções no espaço-tempo, serem estrutu-
ralmente semelhantes). Estas simetrias obtêm-se também no novo espaço-tempo, e assim po-
demos preservar as antigas regras de conservação e derivar delas a nova mecânica. Na nova
mecânica encontra-se, por exemplo, a famosa consequência da relatividade que consiste na
equivalência entre a massa e a energia, isto é, no facto de que quanto mais energia cinética um
objecto possuir, maior será a sua resistência a uma aceleração suplementar produzida por uma
força.
Também notámos que Einstein partiu do princípio que a velocidade da luz no vácuo é a ve-
locidade máxima de propagação para qualquer sinal. Este pressuposto encaixa-se bem na nova
imagem do espaço-tempo.
Podemos, por exemplo, encontrar pares de acontecimentos, A e B, e observadores O1 e O2,
tal que A é anterior a B relativamente a O1 e B é anterior a A relativamente a O2. Mas estes
acontecimentos terão sempre um intervalo de tipo espacial. Isto significa, presumindo que a ve-
locidade da luz é a velocidade limite, que os acontecimentos terão ordens temporais diferentes
relativamente a dois observadores somente se os acontecimentos não forem conectáveis por
qualquer sinal causal. Os acontecimentos conectáveis por um sinal causal que viaje a uma velo-
cidade igual ou inferior à da luz surgirão com a mesma ordem temporal para todos os observa-
dores, embora a quantidade de tempo que os separa varie de observador para observador. (Ve-
ja-se a figura 2.5.)

30
===========================================
INSERIR A FIGURA DA PÁGINA 37 COM A SEGUINTE LEGENDA:
Figura 2.5 A relatividade da ordem temporal de acontecimentos na relatividade restrita. O é um obser-
vador inercial. O’ é outro observador inercial que se move para a direita em relação a O. A linha S é a clas-
se dos acontecimentos que O considera como simultâneos com o acontecimento a. A linha S’ é a classe dos
acontecimentos que O’ considera como simultâneos com a. Para O o acontecimento c é posterior ao aconte-
cimento b’ e, logo, posterior ao acontecimento a. No entanto, para O’ o acontecimento c é anterior ao acon-
tecimento b e, logo, anterior ao acontecimento a. Esta inversão da ordem temporal só pode ocorrer com
acontecimentos que não sejam causalmente conectáveis entre si, como o acontecimento a e o acontecimento
c.
===========================================

Tem-se chamado a atenção para o facto de que, para termos uma teoria consistente onde o
espaço-tempo seja o de Minkowski — o espaço-tempo da relatividade restrita — não precisa-
mos de preservar o pressuposto de que a velocidade da luz é a velocidade limite. Se insistirmos
apenas que as condições do mundo evitam os paradoxos causais, podemos tolerar «taquiões»,
sinais causais com velocidades superiores à da luz. Esta restrição de consistência é necessária,
pois postular taquiões no espaço-tempo de Minkowski admitiria a possibilidade de círculos
causais fechados em que um acontecimento se causa a si mesmo. Se as condições iniciais pude-
rem ser livremente escolhidas, pode gerar-se uma situação paradoxal (atinjo-me a mim próprio
com um tiro antes de carregar no gatilho que lança a bala). No entanto, não se detectaram
quaisquer velocidades superiores à da luz, e as versões canónicas da relatividade restrita adop-
tam o pressuposto de que a luz é o sinal causal mais rápido da estrutura do espaço-tempo de
Minkowski, no qual a velocidade da luz é invariante para todos os observadores inerciais.
Como já notámos, não há nada no espaço-tempo da relatividade restrita que desempenhe
inteiramente o papel do espaço de Newton. Para Newton, o próprio espaço proporcionava um
critério genuíno para determinar quando um objecto estava realmente em repouso, mesmo que
nenhumas consequências empíricas surgissem do movimento uniforme relativamente ao pró-
prio espaço. No espaço-tempo de Minkowski, nada há que proporcione um critério para deter-
minar quando dois acontecimentos não simultâneos estão «no mesmo lugar». Assim, não faz
sentido perguntar se um objecto se mantém num e num só lugar ao longo do tempo, embora
faça todo o sentido perguntar se a posição relativa de um objecto, isto é, a sua posição relativa-
mente a outros objectos materiais considerados como sistema de referência, se mantém a mesma
ao longo do tempo. Mas a distinção entre estar ou não estar genuinamente em movimento uni-
forme continua a existir neste espaço-tempo. Saber se a trajectória de uma partícula material ao
longo do espaço-tempo — a trajectória de tipo temporal que representa a sucessão de instantes-
lugares que o objecto ocupa — é ou não uma linha recta, isto é, saber se essa é uma das trajectó-
rias de tipo temporal que é uma geodésica do espaço-tempo, é uma questão que faz todo o sen-
tido.
Deste modo, a distinção entre um objecto estar em movimento uniforme e estar em movi-
mento acelerado — aceleração essa representada por uma trajectória curva de tipo temporal no
diagrama de espaço-tempo — continua a ser absoluta no sentido em que esta distinção não tem
nada a ver com o movimento do objecto em questão relativamente a outros objectos materiais.
Esta distinção é determinada pelo movimento de um objecto relativamente às estruturas do
próprio espaço-tempo. Na física newtoniana, o movimento genuinamente acelerado revelava-se
na presença (no laboratório em aceleração) de forças inerciais que agiam sobre o objecto e que
eram produzidas, alegadamente, pela aceleração dos objectos em relação ao próprio espaço. Na
relatividade restrita, a aceleração real revela-se desta e também de outras maneiras. Notámos,
por exemplo, que só se obtiveram os resultados nulos quando se realizaram experiências de ida
e volta com a luz num laboratório em movimento uniforme. Num dispositivo com aceleração os
intervalos de tempo que a luz leva a percorrer as trajectórias revelam a existência da aceleração
absoluta do dispositivo experimental. Deste modo, embora «estar no mesmo lugar» seja algo
que só existe relativamente a um padrão material, «estar em movimento uniforme» num senti-
do absoluto tem tanta importância real na relatividade restrita como na teoria newtoniana.

31
Espaço-tempo neo-newtoniano

Assim que se construiu o espaço-tempo de Minkowski da relatividade restrita notou-se que


podíamos voltar atrás e construir um espaço-tempo apropriado para a anterior teoria de New-
ton, um espaço-tempo com algumas vantagens sobre a noção de espaço em si tradicionalmente
postulada na física newtoniana. As principais ideias surgiram da compreensão de que a melhor
maneira de construir sistematicamente um espaço-tempo apropriado para as quantidades ob-
serváveis postuladas em qualquer teoria seria tomar como primitivas localizações desses acon-
tecimentos, e construir depois o espaço-tempo, impondo uma estrutura ao conjunto dessas loca-
lizações de acontecimentos.
Na física newtoniana pressupõe-se a noção de simultaneidade para acontecimentos distantes
como uma noção absoluta. Deste modo, para construir o novo espaço-tempo para a física new-
toniana, impomos à colecção de acontecimentos um intervalo de tempo definido entre qualquer
par de acontecimentos. Quando esse intervalo é nulo, os acontecimentos são simultâneos. No
espaço-tempo de Minkowski da relatividade restrita, os espaços são colecções de acontecimen-
tos simultâneos relativamente a um dado observador. Presume-se que esses espaços «relativos»
têm uma estrutura tridimensional comum, descrita pela geometria de Euclides. No espaço-
-tempo newtoniano revisto, com a sua noção absoluta de simultaneidade, podemos também
considerar os espaços como colecções de acontecimentos simultâneos. Assim, cada aconteci-
mento está num único espaço, pressupondo-se também que o espaço é tridimensional e euclidi-
ano.
No contexto newtoniano, tal como na relatividade restrita, a noção de trajectória de um ob-
jecto em movimento uniforme está bem definida. Então, impomos a este novo espaço-tempo
newtoniano uma exigência semelhante à que encontramos no espaço-tempo de Minkowski: tem
de haver uma noção definida de trajectórias em linha recta que representem as trajectórias pos-
síveis ao longo do espaço e do tempo de partículas em movimento livre e uniforme. Ora, New-
ton presumia que existiam acontecimentos que estavam «no mesmo lugar» que outros aconte-
cimentos não simultâneos. Se impusermos essa estrutura — uma noção definida de estar no
mesmo lugar para acontecimentos não simultâneos — ao espaço-tempo que estamos a cons-
truir, teremos o espaço absoluto da imagem newtoniana do espaço e do tempo. Mas disto resul-
tarão aspectos do mundo que não têm consequências empíricas, como a magnitude da veloci-
dade uniforme de um objecto relativamente ao «próprio espaço». Se, no entanto, deixarmos de
fora essa estrutura de «mesmo lugar em instantes diferentes», obteremos um novo espaço-
-tempo, conhecido por vezes como «espaço-tempo galilaico» e outras vezes como «espaço-
-tempo neo-newtoniano». Neste espaço-tempo, o movimento uniforme absoluto está bem defi-
nido, mas o mesmo não acontece com a noção absoluta de estar no mesmo lugar ao longo do
tempo.
Nesta nova imagem do espaço-tempo, as acelerações absolutas existem e têm consequências
observáveis, mas não há qualquer velocidade absoluta de um objecto. Isto é precisamente aqui-
lo que queríamos. A necessidade que os físicos sentiram de uma nova abordagem do espaço e
do tempo, capaz de enfrentar os resultados surpreendentes e enigmáticos das experiências ópti-
cas de ida e volta, conduziu a ideias penetrantes e profundas sobre quais eram as componentes
da imagem do espaço e do tempo que aceitávamos intuitivamente e que, numa versão refinada,
sustentavam a imagem física do mundo da ciência newtoniana. Por meio do confronto com os
novos factos experimentais e da construção de um dispositivo conceptual capaz de lhes fazer
justiça, os físicos encontraram novas maneiras de perspectivar possíveis teorias para acomodar
os factos da observação anteriormente pressupostos. Como veremos, a existência destas novas
estruturas para descrever e explicar as características espácio-temporais do mundo tiveram um
efeito importante na nossa compreensão filosófica da natureza do espaço e do tempo, e também
no nosso acesso ao conhecimento sobre a sua natureza. Antes de considerarmos estes temas,
vamos abordar uma segunda mudança revolucionária nos nossos pontos de vista sobre a natu-
reza do espaço e do tempo, produzida uma vez mais pela fértil imaginação científica de Eins-
tein.

32
A gravidade e a curvatura do espaço-tempo

A gravidade e a relatividade

Na sua obra mais importante, os Principia, Newton propôs uma teoria que, entre outras coi-
sas, iria explicar o movimento dos planetas em torno do Sol por meio das órbitas elípticas que
Kepler descrevera com grande cuidado. A teoria que explica este movimento tem duas compo-
nentes. Uma deles é a teoria da dinâmica — a teoria geral de Newton que relaciona os movi-
mentos com as forças que agem sobre os objectos em movimento. Baseando-se no pressuposto
de fundo de que há um espaço absoluto e uma taxa de tempo absoluta e definida, a teoria in-
corpora o princípio de Galileu segundo o qual os objectos que não sofrem a acção de quaisquer
forças permanecem num estado constante de movimento uniforme. Postula depois que a mu-
dança de movimento (aceleração) será proporcional às forças que agem sobre um corpo e inver-
samente proporcional à propensão intrínseca de um corpo para resistir a mudanças de movi-
mento, conhecida por «massa inercial».
A outra componente da teoria de Newton diz respeito à força responsável pelos movimentos
observados nos corpos astronómicos (e em muitos outros fenómenos, como as marés e a queda
dos corpos em direcção à Terra). Baseando-se uma vez mais na importante observação de Gali-
leu segundo a qual, pondo de parte a resistência do ar, todos os objectos sofrem uma aceleração
uniforme em direcção à Terra quando estão em queda livre perto da sua superfície, Newton
postula uma força geral de gravidade que actua entre todos os objectos materiais. A gravidade é
sempre uma força de atracção. Considera-se que a magnitude da força exercida entre os corpos
é proporcional à massa inercial de cada corpo e inversamente proporcional ao quadrado da dis-
tância que os separa. A terceira lei do movimento de Newton afirma que a força exercida pelo
primeiro corpo sobre o segundo será compensada por uma força com intensidade igual — com
a mesma direcção mas sentido oposto — exercida pelo segundo corpo sobre o primeiro.
O facto de a força aumentar proporcionalmente à massa inercial, mas de a resistência do
corpo à aceleração ser também proporcional à massa inercial, produz imediatamente o resulta-
do obtido por Galileu de que todos os corpos aceleram de modo idêntico quando estão sujeitos
à força gravitacional exercida por um corpo fixo, caso os objectos experimentais estejam no
mesmo lugar relativamente ao objecto que exerce a força gravitacional. Newton demonstrou
que a combinação das leis da dinâmica com a lei da força gravitacional por ele postulada con-
duzirá às leis do movimento planetário de Kepler, ou melhor, a uma versão ligeiramente corri-
gida dessas leis.
Não é assim surpreendente que Einstein, depois de ter demonstrado que era preciso ter um
novo sistema dinâmico e de o ter construído de uma maneira consistente com o novo espaço-
-tempo da relatividade restrita, tenha enfrentado o problema de construir uma nova teoria da
gravidade. Esta teoria, claramente indispensável, tem de ser consistente com as novas ideias so-
bre o espaço-tempo. A teoria de Newton, por exemplo, considera que a interacção gravitacional
entre os corpos é instantânea, mas segundo a relatividade todos os sinais se propagam a uma
velocidade igual ou inferior à da luz. É possível construir muitas alternativas à teoria newtonia-
na compatíveis com o novo espaço-tempo relativista. Na verdade, um programa de investiga-
ção contínuo da física experimental consiste em testar comparativamente essas alternativas,
procurando possíveis observações que excluam algumas das possibilidades. No entanto, a nova
teoria gravitacional que enfrentou melhor as experiências realizadas e a mais elegante teorica-
mente é a do próprio Einstein. É conhecida por «teoria da relatividade geral». É também a teoria
que postula uma natureza do mundo de grande interesse para os filósofos. No que resta desta
secção vou esboçar algumas das ideias que conduziram Einstein a esta nova teoria da gravidade
que, como veremos, consiste numa nova teoria sobre a estrutura do próprio espaço-tempo. Vou
esboçar algumas das componentes básicas da teoria e explorar algumas das suas consequências
importantes para os filósofos.
Einstein parte da observação de Galileu segundo a qual a aceleração induzida num objecto
pela gravidade é independente do tamanho do objecto e daquilo de que ele é feito. A gravidade
difere de qualquer outra força por ter este efeito universal. Consideremos o caso em que um ob-
jecto que gravita, localizado suficientemente longe, força o objecto a acelerar, de tal forma que o

33
campo gravitacional é efectivamente constante no laboratório. Einstein faz notar que um pe-
queno objecto experimental, situado num laboratório, ficaria em aceleração em relação a esse
laboratório exactamente da mesma maneira que ficaria se nenhuma força estivesse a actuar so-
bre ele e se o próprio laboratório estivesse uniformemente em aceleração na direcção oposta à
da aceleração da partícula. No último caso, qualquer objecto experimental com qualquer massa
ou composição pareceria acelerar uniformemente em relação ao laboratório. É a universalidade
da gravidade que nos permite substituir a força gravitacional por uma aceleração do sistema de
referência.
Talvez, sugere Einstein, seja possível reproduzir todos os efeitos da gravidade numa tal ace-
leração do laboratório. Isto conduz à hipótese de que a gravidade terá efeitos sobre outras coisas
que não a matéria constituída por partículas. Se emitirmos um feixe de luz que atravesse um la-
boratório em movimento de aceleração, é de esperar que o feixe não siga uma trajectória em li-
nha recta relativamente ao laboratório. Não deverá então a gravidade deflectir os feixes de luz
que passam perto de um corpo que gravite?
Talvez a conclusão de que é de esperar que a gravidade tenha um efeito sobre medições de
intervalos de tempo e de espaço, tal como relógios e réguas idealizados as revelam, seja ainda
mais surpreendente. O argumento a favor do efeito temporal é o mais fácil de seguir e construir.
Imagine-se um laboratório em aceleração que tem um relógio na sua extremidade superior e ou-
tro relógio idêntico na sua extremidade inferior. Enviam-se sinais do relógio inferior para o su-
perior, e compara-se a taxa de emissão dos sinais, determinada pelo relógio inferior, com a da
sua recepção, determinada pelo relógio superior. Quando um sinal enviado da parte de baixo
atinge a parte de cima, o relógio de cima está em movimento relativamente ao sistema de refe-
rência em movimento uniforme onde o relógio de baixo estava em repouso quando o sinal foi
enviado. Quer se argumente a partir do efeito de dilatação do tempo da relatividade restrita
quer a partir do chamado «efeito de Doppler» — que, mesmo na física pré-relativista, mostra
que um sinal enviado de uma fonte com uma dada frequência parece ter uma frequência mais
baixa quando é observado por alguém em movimento de afastamento relativamente à fonte —
torna-se plausível afirmar que o relógio de baixo parecerá estar a atrasar-se relativamente ao de
cima. Ou seja, a frequência do sinal recebido pelo relógio de cima é, segundo o relógio de baixo,
inferior à frequência do sinal emitido. (Veja-se a figura 2.6.)

==========================================
INSERIR A FIGURA DA PÁGINA 43 COM A SEGUINTE LEGENDA:
Figura 2.6 O desvio gravitacional para o vermelho. (a) representa um laboratório em aceleração que tem
um relógio no chão e outro preso ao tecto. Como um sinal emitido a partir do relógio do chão será recebi-
do pelo relógio do tecto enquanto o laboratório se move com uma certa velocidade relativamente ao refe-
rencial em movimento em que o sinal foi emitido (devido à aceleração do laboratório), o relógio do tecto
registará um «atraso» no do chão. Esta situação é semelhante àquela em que um assobio que se afasta de
um observador é ouvido por esse observador com um tom mais grave que aquele que este ouviria caso o
assobio estivesse parado relativamente si. A relatividade geral postula que se obterá um resultado seme-
lhante num laboratório que não esteja em aceleração mas que, como em (b), esteja fixo num campo gravi-
tacional. Um relógio situado mais acima no potencial gravitacional registará um «atraso» num relógio si-
tuado mais abaixo no campo gravitacional. Chama-se a isto «desvio gravitacional para o vermelho». Este
fenómeno indica uma das maneiras como a gravidade pode afectar a estrutura métrica do espaço-tempo.
==========================================

Mas considere-se agora um laboratório que não está em aceleração, onde todo o dispositivo
está em repouso num campo gravitacional. Pelo argumento de Einstein (frequentemente conhe-
cido por «princípio da equivalência»), seria de esperar que o relógio situado mais abaixo no
campo gravitacional pareça atrasar-se, do ponto de vista do relógio situado mais acima. Note-se
que isto nada tem a ver com a força gravitacional sentida pelos dois relógios; ao invés, é deter-
minado por quão abaixo está um relógio em relação ao outro no «declive» gravitacional. Assim,
é de esperar que a gravidade tenha efeitos na medição de intervalos de tempo. É possível ofere-
cer argumentos semelhantes, mas um pouco mais complexos, que nos levam a prever que a
gravidade também afecta as medições espaciais.
Considerados conjuntamente, estes argumentos conduziram Einstein à sugestão assombrosa
de que a maneira de lidar com a gravidade num contexto relativista é tratá-la não como um

34
campo de forças que actua no espaço-tempo, mas antes como uma modificação da própria es-
trutura geométrica do espaço-tempo. Na presença da gravidade, defendeu Einstein, o espaço-
-tempo é «curvo». Para saber o que isto significa, no entanto, temos de olhar um pouco para a
história da geometria tal como esta última é estudada pelos matemáticos.

Geometria não euclidiana

Na geometria canónica, tal como Euclides a formalizou, derivam-se todas as verdades geo-
métricas a partir de um pequeno conjunto de postulados básicos alegadamente auto-evidentes.
Embora a axiomatização da geometria realizada por Euclides não seja realmente completa (isto
é, não é suficiente em si mesma para permitir a realização de todas as derivações sem se pres-
suporem outras premissas subjacentes ocultas), é possível completá-la. Durante um longo perí-
odo de tempo, o postulado de Euclides conhecido por «postulado da paralela» foi gerador de
perplexidade. Este postulado é equivalente à afirmação de que, passando por um ponto que não
esteja numa dada linha, só pode traçar-se uma única linha que esteja no mesmo plano da linha e
ponto dados e que não intersecte a linha dada em qualquer direcção, por muito que as linhas se
prolonguem. Os geómetras consideravam que este postulado não possuía a auto-evidência das
outras hipóteses, que são mais simples (como «Iguais adicionados a iguais dão iguais» e «Uma
linha recta é determinada por dois pontos»). Poderia este postulado «suspeito» ser derivado a
partir dos outros postulados, tornando-se desnecessário enquanto pressuposto independente?
Se pudéssemos mostrar que a negação do postulado da paralela era inconsistente com os outros
postulados, poderíamos mostrar que esta derivação era de confiança pelo método da reductio ad
absurdum. Mas poder-se-ia mostrar tal coisa?
Podemos negar o postulado da paralela de duas maneiras. O postulado diz que existe uma e
apenas uma linha paralela que passa pelo ponto; para negar isto podemos afirmar que não exis-
te qualquer linha paralela ou que existe mais do que uma. Em 1733, Saccheri mostrou que o pos-
tulado da inexistência de paralelas era realmente inconsistente com os restantes axiomas, pelo
menos quando os entendemos da maneira habitual. Mas foi incapaz de mostrar que a negação
do postulado das múltiplas paralelas também era inconsistente. No século XIX, Bolyai, Lo-
bachevsky e Gauss compreenderam que podemos construir geometrias consistentes que adop-
tem os postulados de Euclides, mas que tenham um postulado de múltiplas paralelas em vez do
postulado da paralela. Riemann mostrou então que, se os outros axiomas forem ligeiramente
reinterpretados, poderemos construir uma nova geometria, também logicamente consistente,
onde um postulado da inexistência de paralelas ocupa o lugar do postulado da paralela. As
reinterpretações necessárias são as seguintes: «Uma recta é determinada por dois pontos» tem
de ser lida de maneira a que por vezes mais do que uma linha recta contenha um dado par de
pontos; «Uma linha pode ser prolongada arbitrariamente em ambos os sentidos» tem de ser lida
como a afirmação de que uma linha não encontraria um ponto último se fosse prolongada, mas
sem implicar que uma linha tão prolongada quanto possível tenha um comprimento infinito.
Mais tarde compreendeu-se que, quando se tomam estas novas geometrias não euclidianas
como geometrias planas bidimensionais, pode-se entendê-las à maneira euclidiana como a ge-
ometria das curvas de menor distância (geodésicas) em superfícies curvas bidimensionais. Em
particular, a geometria axiomática de Riemann era apenas a geometria das figuras construídas
por arcos de círculos máximos (geodésicas) na superfície de uma esfera. Mas essas geometrias
não euclidianas, tridimensionais e logicamente consistentes poderiam ser tomadas como sendo
sobre o quê? Ou seria que, apesar de logicamente consistentes, eram absurdas por outras ra-
zões?
Gauss levou a geometria mais longe ao desenvolver uma teoria geral sobre as superfícies bi-
dimensionais arbitrariamente curvas. Estas caracterizam-se por um número — conhecido por
«curvatura gaussiana» — em cada ponto. A variação desta curvatura em função da distância, tal
como é medida ao longo de curvas situadas na superfície, determina a forma da superfície cur-
va. Segundo Gauss, estas superfícies curvas estão imersas no espaço euclidiano tridimensional
comum. Um resultado importante do seu trabalho, no entanto, foi o de que se podia caracterizar
alguns dos aspectos da curvatura (a curvatura «intrínseca») por meio de quantidades que pode-
riam ser determinadas por uma criatura bidimensional imaginária que estivesse confinada à

35
superfície curva e que nem sequer se apercebesse da existência do espaço tridimensional que a
envolveria. A partir desta nova perspectiva, verificou-se que se pode entender as geometrias
descritas pelos sistemas axiomáticos anteriores como casos próprios. A geometria euclidiana bi-
dimensional, a geometria do plano, é a geometria da superfície cuja curvatura de Gauss seja ze-
ro em todo o lado. A geometria de Riemann, a geometria das superfícies bidimensionais das es-
feras, é apenas a geometria de uma superfície cuja curvatura de Gauss seja constante e positiva.
A geometria de Lobachevsky-Bolyai é a geometria de uma superfície bidimensional cuja curva-
tura de Gauss seja negativa e idêntica em cada ponto. A curvatura negativa caracteriza um pon-
to como aquele ponto no centro do desfiladeiro de uma montanha no qual a superfície se curva
«em sentidos opostos», passando por ele ao longo de trajectórias diferentes.
Riemann foi então mais longe, e generalizou a teoria de Gauss das superfícies curvas a espa-
ços de qualquer dimensão. Ao passo que Gauss pressupôs que as superfícies em questão estão
imersas num espaço euclidiano plano, Riemann não presumiu tal coisa. Afinal, um dos resulta-
dos do trabalho de Gauss era o de que alguns aspectos da curvatura estavam ao alcance de uma
criatura bidimensional que não soubesse da existência do espaço envolvente. A geometria geral
de Riemann lida com estes aspectos da curvatura, os aspectos intrínsecos. (Não deve confundir-
se esta geometria geral de Riemann de espaços n-dimensionais curvos com a anterior geometria
axiomática de Riemann.) O pressuposto básico desta geometria é o de que o espaço n-
dimensional curvo é susceptível de ser aproximado, em regiões suficientemente pequenas, por
um espaço euclidiano plano e n-dimensional. Para superfícies curvas num espaço não curvo
tridimensional, estas superfícies aproximadas podem ser representadas como planos tangentes
à superfície curva num certo ponto; os planos estão também localizados no espaço tridimensio-
nal envolvente. Para um espaço geral de Riemann, curvo e n-dimensional, postula-se a existên-
cia destes «planos tangentes» só no sentido em que, no que diz respeito aos aspectos intrínsecos
n-dimensionais, o espaço curvo n-dimensional pode ser aproximado num certo ponto por um
espaço euclidiano não curvo e n-dimensional.
Quais são alguns dos aspectos dos espaços curvos? Como, por exemplo, poderia uma criatu-
ra tridimensional que vivesse num espaço tridimensional curvo descobrir que o espaço era re-
almente curvo? A curvatura intrínseca revela-se na medição de distâncias. Uma criatura n-
dimensional pode realizar medições de distâncias entre pontos em número suficiente para se
assegurar de que não há qualquer possibilidade de esses pontos estarem situados num espaço
plano n-dimensional e terem as distâncias mínimas entre si ao longo de curvas que os pontos da
criatura fazem. Uma verificação das distâncias aéreas mais curtas entre cidades terrestres, por
exemplo, pode dizer-nos que a Terra não tem uma superfície plana, mas antes uma superfície
que se aproxima da de uma esfera. Num espaço curvo n-dimensional, as curvas de menor dis-
tância, conhecidas por «geodésicas do espaço», seriam linhas rectas caso o espaço fosse plano.
Estas linhas são também as linhas de «menor curvatura» do espaço. Intuitivamente, isto signifi-
ca que as linhas, embora não possam ser rectas devido à estrutura do espaço, não diferem das
linhas rectas mais do que aquilo que a curvatura do próprio espaço lhes impõe.
A curvatura pode também revelar-se de outras maneiras. Se pegarmos num segmento de
recta orientado (um vector), por exemplo, e o movermos em torno de uma curva fechada num
espaço plano, mantendo-o tanto quanto possível paralelo a si próprio enquanto o movemos,
quando regressarmos ao ponto de origem o vector apontará aí na mesma direcção e sentido do
que quando começámos. Mas num espaço curvo este transporte paralelo de um vector em torno
de uma curva fechada irá, de uma maneira geral, mudar a direcção ou o sentido do vector, de
tal forma que no fim do transporte ele apontará para uma direcção ou sentido diferente da di-
recção ou sentido que tinha no início do percurso.
Um espaço plano tridimensional tem uma extensão infinita e um volume infinito. Um plano
euclidiano tem uma extensão infinita e uma área infinita. Mas a superfície intrinsecamente cur-
va de uma esfera, embora não tenha limites, tem uma área finita. Uma criatura bidimensional
que vivesse numa superfície esférica poderia pintar a superfície. Nunca encontraria um limite
na superfície, mas depois de um tempo finito toda a superfície ficaria pintada e o trabalho esta-
ria concluído. Do mesmo modo, uma criatura tridimensional que vivesse no espaço curvo tri-
dimensional análogo à superfície esférica, vivendo naquilo a que se chama uma tri-esfera, pode-
ria encher a região com um plástico espumoso. Embora nunca encontrasse uma parede que li-

36
mitasse o espaço, concluiria o trabalho num tempo finito, quando todo o volume do espaço tri-
dimensional ficasse ocupado por uma quantidade finita de plástico espumoso.
Parece assim claro que a noção de espaço n-dimensional curvo, onde se inclui a noção de es-
paço tridimensional curvo, além de ser consistente de um ponto de vista lógico, não é, manifes-
tamente, absurda. Enquanto ficarmos pelas características intrínsecas da curvatura, não estamos
a presumir que o espaço esteja imerso num outro espaço plano envolvente e com mais dimen-
sões. E os aspectos da curvatura intrínsecos ao espaço podem ser manifestamente determinados
por meio de técnicas directas por uma criatura que viva nesse espaço. Será então que podemos
verificar se o verdadeiro espaço tridimensional do nosso mundo é curvo, e não o espaço plano
caracterizado pelos postulados básicos da geometria euclidiana tridimensional? Estas especula-
ções acompanharam naturalmente a descoberta das novas geometrias.

O uso das geometrias não euclidianas na física

No século XIX houve alguma especulação sobre a possível realidade do espaço curvo.
Clifford, por exemplo, sugeriu que era concebível que a matéria consistisse realmente em pe-
quenas regiões de espaço altamente curvo situadas num espaço tridimensional que na sua mai-
or parte não fosse curvo. Era óbvio que só se podia detectar uma curvatura espacial de grande
escala nas escalas de maior dimensão, ou seja, nas escalas astronómicas, já que séculos de expe-
riência nos tinham mostrado que a geometria euclidiana não curva tridimensional funcionava
bem nas nossas descrições do mundo. Não havia dúvida de que ela funcionava bem nas medi-
ções comuns e até na descrição de coisas como a estrutura do sistema solar.
No entanto, foi só com a nova teoria relativista da gravidade de Einstein — a teoria da rela-
tividade geral — que a geometria curva se tornou uma parte essencial de uma teoria física plau-
sível. Vimos que podemos defender com plausibilidade que a gravidade afecta dinamicamente
todos os objectos da mesma maneira, independentemente do seu tamanho e da sua constituição.
Deste modo, um objecto material que seguisse uma trajectória com direcção e velocidade uni-
formes na ausência de gravidade ou de outras forças, seguiria um percurso diferente na presen-
ça da gravidade. Mas a mudança de trajectória depende apenas do campo gravitacional e do lu-
gar e velocidade iniciais do objecto. Não depende da massa do objecto ou do material de que ele
é feito. É esta independência do efeito da gravidade em relação ao tamanho e à estrutura dos
objectos que torna possível uma «geometrização» do campo gravitacional.
A ideia de tratar a gravidade como uma curvatura torna-se plausível quando a combinamos
com os argumentos a favor de um efeito gravitacional sobre os aspectos métricos do mundo, tal
como estes são determinados por réguas e relógios. No entanto, Einstein não postula um espaço
curvo, pelo menos de maneira fundamental, mas um espaço-tempo curvo. No espaço-tempo de
Minkowski da relatividade restrita, as partículas livres viajam em linhas rectas de tipo tempo-
ral, que são as geodésicas temporais do espaço-tempo. Ora, sugere Einstein, temos de conceber
as partículas que só sofrem a acção da gravidade como partículas «livres» que viajam, não ao
longo de linhas rectas de tipo temporal, mas ao longo de geodésicas curvas de tipo temporal
num espaço-tempo curvo. Um resultado fundamental da geometria de Riemann é o de que por
um ponto, numa dada direcção, só passa uma trajectória geodésica. Nos espaços de Riemann, as
geodésicas são simultaneamente as trajectórias de curvatura mínima e (localmente) de distância
mais curta. Com a nova métrica do espaço-tempo, é melhor considerar como fundamental a de-
finição das geodésicas enquanto linhas de «curvatura mínima». No espaço-tempo, se especifi-
carmos uma direcção num certo ponto, estaremos simultaneamente a especificar uma direcção
espacial e uma velocidade em cada direcção. Deste modo, a geodésica de tipo temporal que
passa por um ponto numa dada direcção corresponderá à especificação do lugar inicial e da ve-
locidade inicial de uma partícula. A trajectória especificada pela geodésica será assim única. E
isto é exactamente o que queríamos para a gravidade porque, dado um lugar e uma velocidade
iniciais, a trajectória de qualquer partícula num campo gravitacional é a mesma. A luz, que na
relatividade restrita segue as geodésicas nulas em linha recta do espaço-tempo de Minkowski,
segue agora as geodésicas nulas do espaço-tempo curvo, que em geral não são linhas rectas.
(Veja-se a figura 2.7.)

37
===========================================
INSERIR A FIGURA DA PÁGINA 48 COM A SEGUINTE LEGENDA:
Figura 2.7 Movimento num campo gravitacional ao longo de geodésicas curvas. Em (a) entende-se que o
espaço-tempo é «plano». A linha recta t representa a trajectória que uma partícula «livre» teria no espaço-
-tempo, e a linha recta l representa a trajectória de um feixe de luz «livre». Sob a influência de uma força
como a gravidade, a partícula e o feixe de luz terão trajectórias curvas como t’ e l’. Mas estas são encaradas
como desvios das trajectórias mais rectas no espaço-tempo. Em (b) as trajectórias em linha recta desapare-
cem. Entende-se antes que o espaço-tempo é «curvo» na presença da gravidade, e considera-se agora que t’
e l’ — as trajectórias das partículas e dos feixes de luz «livres», isto é, das partículas e dos feixes de luz que
não sofrem a acção de qualquer força não gravitacional — são geodésicas, ou seja, trajectórias tão rectas
quanto possível num espaço-tempo curvo.
===========================================

Podemos determinar a curvatura de um espaço-tempo ao seguir as trajectórias dos feixes de


luz e das partículas «livres», isto é, das partículas e dos raios luminosos que agem apenas sob a
influência da gravitação, agora vista simplesmente como a curvatura do espaço-tempo. Mas
podemos também, pelo menos em princípio, determinar a estrutura da curvatura realizando
um número suficiente de medições de intervalos temporais e espaciais entre acontecimentos e
combinando estas medições no intervalo espácio-temporal, que define a métrica do espaço-
-tempo. A relatividade geral postula que o espaço-tempo assim determinado irá ser consonante
com o espaço-tempo determinado ao seguir-se os movimentos geodésicos das partículas e dos
raios luminosos, sendo os relógios e as réguas usados para efectuar as medições espaciais e
temporais que estão também sob a acção do campo gravitacional, no sentido em que os relógios
e as réguas medem convenientemente estas qualidades métricas no espaço-tempo curvo.
A teoria tradicional da gravidade tinha duas partes: uma que especificava a acção da gravi-
dade sobre partículas-teste; e outra que especificava o tipo de campo gravitacional gerado por
uma fonte de gravidade. Na teoria mais antiga, a gravidade era uma força que acelerava igual-
mente todos os objectos materiais que estivessem num certo lugar de um campo gravitacional.
Na nova teoria, a gravidade é a estrutura do espaço-tempo curvo. Ela afecta partículas e raios
luminosos, no sentido em que estes percorrem agora curvas temporais e geodésicas nulas no
espaço-tempo, e afecta instrumentos idealizados de medição temporal e espacial.
E quanto ao segundo aspecto da teoria, aquele que especifica que tipo de campo gravitacio-
nal é gerado por uma fonte de gravidade? Na teoria mais antiga, qualquer objecto com massa
gerava um campo gravitacional. Na nova teoria relativista, associa-se a gravidade à massa-
energia do mundo material. As equações de campo da relatividade geral têm no seu lado es-
querdo uma expressão matemática que caracteriza a curvatura do espaço-tempo. No seu lado
direito têm uma expressão, conhecida por «tensor das tensões-energia», que nos diz como a
massa-energia está distribuída no espaço-tempo. Esta equação relaciona a gravidade, vista ago-
ra como espaço-tempo curvo, com as suas fontes na massa-energia não gravitacional. (O «não
gravitacional» é importante porque o próprio campo gravitacional, o espaço-tempo curvo, tam-
bém possui massa-energia.) Seria um erro pensar que a matéria «causa» o campo gravitacional
num sentido simplista, porque conhecer o lado direito da equação, que diz como a massa-
energia está distribuída pelo espaço-tempo, requer que se postule uma estrutura de espaço-
-tempo. A equação diz-nos se um dado espaço-tempo é ou não compatível com uma distribui-
ção postulada de massa-energia nesse espaço-tempo. O mundo postulado só é um mundo pos-
sível à luz da nova teoria quando a equação é satisfeita tanto pela estrutura postulada de espa-
ço-tempo como pela distribuição postulada de massa-energia nessa estrutura.
É interessante que a partir da equação de campo se siga a lei dinâmica da gravidade, segun-
do a qual as partículas materiais pontuais percorrem geodésicas de tipo temporal quando estão
«livres». Ao contrário do que se verifica na teoria newtoniana, não é preciso postular a lei di-
nâmica enquanto lei independente, já que ela própria é derivável a partir da equação de campo
básica.
Se aceitarmos esta nova teoria da gravidade do espaço-tempo curvo, enfrentaremos depois,
enquanto habitantes do mundo, a tarefa de tentar determinar a sua verdadeira estrutura de es-
paço-tempo. A teoria diz-nos que a geometria do espaço-tempo deve estar correlacionada com a
distribuição de matéria e energia nesse espaço-tempo. E a estrutura do espaço-tempo em ques-
tão revela-se em trajectórias geodésicas curvas de raios luminosos e partículas «livres», e tam-

38
bém em intervalos espaciais e temporais medidos por réguas (ou por fitas métricas, num mun-
do curvo) e relógios. Obviamente, se o espaço-tempo mostrar uma curvatura, isso acontecerá a
escalas astronómicas, porque temos uma vasta experiência empírica que nos assegura de que
em medições locais de pequena escala a geometria plana de Minkowski funciona adequada-
mente.
Alguns efeitos desta nova compreensão da «gravidade como curvatura do espaço-tempo»
revelam-se à escala do sistema solar. Considera-se que os planetas percorrem geodésicas no es-
paço-tempo curvado pela presença da massa do Sol. Isto introduz mudanças ligeiras no movi-
mento kepleriano dos planetas explicável pela teoria newtoniana. Sabemos que mesmo no sis-
tema solar a curvatura do espaço-tempo é pequena. As trajectórias dos planetas no espaço-
-tempo desviam-se pouco das geodésicas em linha recta (que não devemos confundir com as
elipses, obviamente curvas, que eles percorrem). No entanto, o efeito da curvatura é o de sobre-
por pequenos efeitos adicionais às trajectórias elípticas habituais dos planetas, tal como um mo-
vimento (relativo a um sistema inercial fixo no Sol) do ponto de maior aproximação do planeta
ao Sol na sua órbita, um movimento detectável no caso do planeta Mercúrio.
Podem também observar-se outros efeitos métricos da gravidade a uma escala razoavelmen-
te pequena, em particular no atraso de um relógio relativamente a outro quando o primeiro re-
lógio está mais abaixo num potencial gravitacional que o segundo. Mas é à grande escala astro-
nómica que a teoria dá origem às mais interessantes das suas novas previsões e à possibilidade
das manifestações mais fascinantes das consequências observacionais da curvatura do espaço-
-tempo. Lidamos com modelos altamente idealizados de universos, em relação aos quais se po-
dem retirar conclusões teóricas. Obviamente, a esperança é a de que pelo menos algumas destas
imagens idealizadas do mundo à escala cosmológica estejam suficientemente perto da realidade
para melhorar a compreensão do mundo que descobrimos com as observações astronómicas do
espaço profundo. Presume-se habitualmente, por exemplo, que se pode considerar que a maté-
ria do universo está distribuída uniformemente e que a distribuição é a mesma em todas as di-
recções espaciais do mundo cosmológico. Este pressuposto está agora sob um exame observaci-
onal intensivo.
Os teóricos têm explorado uma ampla variedade de mundos de espaço-tempo possíveis. Em
muitos deles, a estrutura de continuidade do mundo difere da dos mundos da física newtonia-
na ou da física da relatividade restrita. Em alguns mundos, por exemplo, pode haver trajectórias
fechadas de tipo temporal, colecções de acontecimentos tais que quando um observador avança
de cada acontecimento para o que lhe é posterior acaba por regressar ao acontecimento inicial.
Outros espaços-tempos, embora não sejam causalmente tão patológicos, podem estar perto de
incluir essas trajectórias causais fechadas. Outros espaços-tempos peculiares têm uma não ori-
entabilidade inscrita em si; são torcidos, como a conhecida fita de Möbius — uma superfície bi-
dimensional torcida imersa no tri-espaço. (Veja-se a figura 2.8.)

===========================================
INSERIR A FIGURA DA PÁGINA 50 COM A SEGUINTE LEGENDA:
Figura 2.8 Um espaço não orientável. A fita de Möbius é o exemplo mais simples de um espaço não orien-
tável, neste caso com duas dimensões. B e B’ representam figuras orientadas que, caso tivessem sido dese-
nhadas numa superfície plana normal, não se poderiam transformar uma na outra por meio de um movi-
mento rígido. Mas se pegarmos em B e a movermos ao longo da fita torcida de Möbius, podemos acabar
por a trazer até Q de modo a que coincida com B’. Isto revela a natureza não orientável da superfície. No
espaço-tempo, uma não orientabilidade pode ser espacial, temporal ou espácio-temporal.
==========================================

Num tal espaço não orientável, pode ser impossível fazer uma distinção global entre objectos
situados à esquerda e objectos situados à direita, pois um objecto situado à direita é transformá-
vel num objecto que está à esquerda no mesmo lugar por meio de uma viagem em torno do es-
paço-tempo. Pode também haver uma ausência de orientabilidade temporal, o que torna impos-
sível dizer globalmente qual é a direcção temporal do «passado» e qual é a do «futuro» de um
certo acontecimento.
Em alguns espaços-tempos, é possível que os observadores tenham o espaço-tempo dividido
em espaços num certo instante. Isto significa que nesses mundos, para um observador que este-

39
ja num estado de movimento específico, o espaço-tempo pode ser segmentado em espaços de
acontecimentos tridimensionais, sendo possível atribuir a todos eles um instante específico nu-
ma ordem temporal que pode ser globalmente válida. Noutros espaços-tempos, é impossível tal
segmentação do espaço-tempo em «segmentos de simultaneidade» de tri-espaços num certo
instante. Quando essa divisão do espaço-tempo em espaços num certo instante é possível, os
próprios espaços podem ser espaços tridimensionais curvos do tipo que Riemann estudou na
sua generalização da geometria de Gauss das superfícies curvas. Num desses universos, o mo-
delo de Einstein, o tempo prolonga-se para sempre tanto em direcção ao passado como em di-
recção ao futuro. Para um observador, o mundo espacial existe em cada instante como uma es-
fera tridimensional fechada de tamanho finito e constante. Os universos de Robertson-Walker
têm espaços num certo instante de curvatura constante, mas a curvatura pode ser positiva, nula
ou negativa. O parâmetro de dimensão destes espaços pode mudar com o tempo, o que os torna
modelos plausíveis de universos com Big Bang, onde existe um ponto singular em que toda a
matéria do mundo está comprimida num ponto espacial. À luz da observação, o nosso universo
parece ter esse ponto.
Além disso, a curvatura do espaço-tempo ajuda a explicar os dados possíveis da experiência
noutra área: a descrição das singularidades geradas pela matéria em colapso das estrelas com
grandes massas. Estes são os famosos buracos negros, regiões do espaço-tempo tão curvadas
pela presença de matéria altamente densa que a luz não pode escapar para o espaço-tempo ex-
terior a partir da região de espaço-tempo interior que está imediatamente em torno do ponto de
colapso singular da estrela. Os modelos destas regiões do espaço-tempo localmente muitíssimo
curvas, que correspondem a estrelas em colapso electricamente carregadas e/ou em rotação, as-
sim como os do tipo original estudado, proporcionam casos fascinantes para estudar os efeitos
peculiares que a gravidade pode ter enquanto curvatura do espaço-tempo. Embora os dados
observacionais sejam ainda inconclusivos, parece que alguns dos geradores de radiação alta-
mente energética do cosmos, como os quasares e os centros das chamadas «galáxias activas»,
podem muito bem ser buracos negros.

Espaço-tempo curvo e gravidade newtoniana

Ao discutirmos a transição do espaço e do tempo para o espaço-tempo, quando se formula-


ram os fundamentos da teoria da relatividade restrita, notámos que, depois de se ter construído
o espaço-tempo de Minkowski como o espaço-tempo apropriado para a relatividade restrita, os
cientistas compreenderam que podíamos usar a noção de espaço-tempo para construir um es-
paço-tempo que em alguns aspectos era mais apropriado para a física de Newton do que o seu
próprio espaço e tempo absolutos: o espaço-tempo galilaico ou neo-newtoniano. A partir da
concepção da gravidade enquanto espaço-tempo curvo, própria da teoria da relatividade geral,
tornou-se claro que mesmo na imagem pré-relativista podemos redescrever a gravidade por
meio de um espaço-tempo curvo. Nesta imagem pré-relativista, a gravidade não tem os efeitos
nas medições de tempos e distâncias que tem na versão relativista, nem se dá qualquer atenção
ao efeito da gravidade na luz. Em vez disso, são os efeitos dinâmicos habituais da gravidade
que são transformados na curvatura do espaço-tempo.
Nesta imagem, o tempo é precisamente tal como Newton o concebia. Há um intervalo de
tempo absoluto e definido entre quaisquer dois acontecimentos. Acontecimentos que são todos
simultâneos formam espaços num certo instante. Estes são, tal como o eram para Newton, espa-
ços euclidianos tridimensionais não curvos. Tal como no espaço-tempo neo-newtoniano, não
existe qualquer noção não relativa de dois acontecimentos não simultâneos estarem no mesmo
lugar; logo, neste espaço-tempo não há a noção newtoniana absoluta de estar no mesmo lugar
ao longo do tempo nem de velocidade absoluta. No entanto, tal como na concepção neo-
newtoniana existem geodésicas de tipo temporal que correspondem a trajectórias possíveis de
partículas em movimento livre, também existem geodésicas de tipo temporal nesta nova ima-
gem do espaço-tempo. Mas ao passo que as geodésicas de tipo temporal da imagem neo-
newtoniana são as trajectórias em linha recta de partículas em movimento uniforme (partículas
que não sofrem a acção de forças e que, seguindo a lei da inércia, mantêm constante a sua velo-
cidade), agora as geodésicas de tipo temporal são linhas curvas. Estas são concebidas como tra-

40
jectórias de partículas que são «livres» no novo sentido que se tornou conhecido com a teoria da
gravidade de Einstein, isto é, que não sofrem a acção de outras forças que não a da gravidade.
Uma vez mais, elimina-se a força gravitacional da teoria, concebendo-se a gravidade como a
curvatura de geodésicas de tipo temporal, de tal forma que as partículas sofrem o efeito da gra-
vidade não ao ser deflectidas do seu movimento geodésico pela força do objecto gravitacional,
mas antes ao seguir as trajectórias geodésicas «livres» no espaço-tempo, trajectórias que agora
são curvas devido à presença do objecto gravitacional, que funciona como uma «fonte» da cur-
vatura do espaço-tempo. Tal como na teoria de Einstein, é só o efeito uniforme da gravidade
sobre uma partícula-teste — que consiste no facto de todos os objectos afectados pela gravidade
sofrerem a mesma modificação no seu movimento, seja qual for a sua massa ou constituição —
que permite esta «geometrização» da força gravitacional. Este espaço-tempo curvo da gravida-
de newtoniana não é, como o espaço-tempo de Minkowski ou o espaço-tempo curvo da teoria
da relatividade geral, um espaço-tempo riemanniano (ou melhor, pseudo-riemanniano) porque,
contrariamente aos espaços-tempos da relatividade restrita ou geral, não tem qualquer estrutura
métrica de espaço-tempo. Há um intervalo de tempo definido entre quaisquer dois aconteci-
mentos. Para acontecimentos simultâneos, há uma separação espacial definida entre quaisquer
dois acontecimentos. Neste sentido, este espaço-tempo tem uma métrica de tempo e uma de es-
paço. Mas não há, ao contrário do caso relativista, qualquer intervalo de espaço-tempo entre um
par de acontecimentos. A curvatura revela-se apenas no facto de as geodésicas de tipo temporal
não serem rectas, e não em qualquer característica métrica do espaço-tempo.

Resumo

O desenvolvimento das elegantes teorias de Einstein, que tentaram fazer justiça aos surpre-
endentes factos obtidos pela observação sobre o comportamento da luz, das partículas livres e
dos relógios e réguas, oferece-nos assim duas revoluções nos nossos pontos de vista sobre o es-
paço e o tempo. Em primeiro lugar, substitui-se o espaço e o tempo pela noção unificada de es-
paço-tempo, relativamente à qual os aspectos temporais e espaciais do mundo se tornam deri-
vados. Em segundo lugar, invoca-se a noção de curvatura para encontrar um lugar natural para
os efeitos da gravidade nessa imagem espácio-temporal do mundo.
É óbvio que estas revoluções na nossa perspectiva científica sobre o que são realmente o es-
paço e o tempo devem traduzir-se numa reapreciação profunda das questões tipicamente filosó-
ficas sobre o espaço e o tempo. Como deveremos conceber o estatuto das nossas pretensões ao
conhecimento da estrutura do espaço e do tempo num contexto em que, pela primeira vez, se
encontram disponíveis para inspecção científica várias propostas possíveis distintas sobre a es-
trutura do espaço e do tempo? E que efeito deverão ter essas novas estruturas sobre o espaço e o
tempo nos nossos pontos de vista sobre a natureza metafísica do espaço e do tempo? Em parti-
cular, que efeito deverão ter estas concepções científicas revolucionárias no debate tradicional
entre substantivistas e relacionistas? São estas questões filosóficas que vamos agora abordar.

Como sabemos qual


é a verdadeira geometria do mundo?

Mudanças nos pontos de vista sobre o conhecimento da geometria

Já referimos a mudança de atitude na comunidade científica e filosófica, que se seguiu à re-


volução científica do século XVII, perante o tema dos fundamentos ideais do nosso conhecimen-
to do mundo. Anteriormente pensava-se que uma proposição podia ser conhecida com um tipo
de certeza que se seguia apenas da razão pura; mais tarde, a ideia de que o nosso conhecimento
sobre o mundo — constituído por verdades teóricas gerais sobre a natureza das coisas — só po-
dia ser inferido a partir de verdades básicas sobre o mundo foi-se tornando gradualmente pre-
dominante. Tais inferências eram fidedignas, mas falíveis. A crença nessas verdades básicas ba-
seava-se nos dados fornecidos pelos sentidos por meio da observação e da experimentação.

41
Mas a geometria continuou a ser um espinho para esta abordagem empirista à teoria do co-
nhecimento. Suponhamos que a geometria nos dá verdades sobre a natureza do mundo que
podem ser conhecidas porque se seguem, por meio de certas inferências lógicas, de verdades
básicas cuja verdade é auto-evidente e cognoscível por meio da razão pura. Podemos assim sa-
ber que a geometria é verdadeira sem nos apoiarmos na observação nem na experimentação.
Não haverá então pelo menos um domínio de conhecimento sobre o mundo que não tem de ser
estabelecido pelos dados dos sentidos, podendo ser estabelecido apenas pelo pensamento puro?
E, se a geometria fosse uma disciplina desse tipo, não continuaria a ser possível que todo o nos-
so conhecimento físico acabasse por vir a basear-se nessa base epistémica superior?
A descoberta das geometrias não euclidianas veio enfraquecer as teses deste género. Se a ge-
ometria euclidiana não era a única geometria possível, como poderíamos então afirmar que as
verdades da geometria podiam ser conhecidas independentemente da experimentação? Não era
afinal a estrutura do espaço revelada pela geometria (tal como qualquer outra estrutura física)
susceptível de ser descrita por qualquer uma de várias teorias alternativas incompatíveis? Não
deveríamos nesse caso apoiar-nos na observação, como fazemos nas outras ciências, para saber
qual das teorias possíveis descreve verdadeiramente a estrutura do mundo?
Os defensores do ponto de vista de que a geometria euclidiana descreve a natureza do mun-
do tentaram por vezes questionar a própria consistência lógica das geometrias não euclidianas.
Esta estratégia fracassou logo que se construíram demonstrações de consistência relativa para as
geometrias axiomáticas não euclidianas. Estas demonstrações mostravam que a lógica pura po-
dia assegurar-nos que, se as geometrias não euclidianas fossem inconsistentes, o mesmo aconte-
ceria com a geometria euclidiana. Logo, as geometrias não euclidianas eram pelo menos tão
respeitáveis de um ponto de vista lógico como a geometria euclidiana. Os kantianos puderam
continuar a defender, recorrendo a outras razões, que a geometria euclidiana era a verdadeira
geometria do mundo, defendendo que havia um tipo de necessidade na verdade da geometria
euclidiana que ultrapassava a necessidade das verdades que eram verdadeiras apenas em vir-
tude da lógica. Mencionaremos daqui a pouco uma resposta a estes kantianos. No entanto, a
maior parte dos especialistas que estavam familiarizados com a existência das novas geometrias
estavam convencidos que a geometria do mundo, tal como a sua física ou a sua química, era al-
go que só poderíamos conhecer por meio da experimentação.
Como vimos, foi só no contexto relativista que as geometrias não euclidianas começaram re-
almente a desempenhar um papel importante na física teórica. A rota partiu do espaço e do
tempo newtonianos, passou pelo espaço-tempo da relatividade restrita e chegou ao espaço-
tempo curvo da teoria da relatividade geral. Em cada fase de transição, os factos empíricos, os
resultados da observação e da experimentação, desempenharam um papel decisivo. O postular
do espaço-tempo de Minkowski, o espaço-tempo da relatividade restrita, repousou na descober-
ta surpreendente de que, pelo que se podia saber por meio das experiências de ida e volta, a ve-
locidade da luz era a mesma em todos os estados de movimento inerciais e em todas as direc-
ções. Além disso, o facto de a velocidade da luz ser a velocidade máxima de propagação dos si-
nais causais desempenhou também um papel importante na fundação da teoria, e esse era tam-
bém um facto da experiência observacional. Além disso, havia ainda os factos previstos pela te-
oria da relatividade restrita — como os que diziam respeito à duração aparente de partículas
instáveis em movimento relativamente ao observador, ao aumento aparente da massa inercial
em função do aumento da velocidade, e assim por diante — que eram vistos, repetidamente,
como uma confirmação experimental da nova representação do mundo através do espaço-
tempo.
Os factos revelados pela observação foram importantes também para o avanço da relativi-
dade geral tanto ao sugerir a nova teoria como ao confirmá-la. Os factos verificados por obser-
vação, que já Galileu conhecia, sobre o modo como a gravidade actua nos objectos independen-
temente da sua constituição e do seu tamanho, sugeriram inicialmente a Einstein a ideia de con-
siderar a gravidade como uma característica geométrica do espaço-tempo. Os factos previstos
relativamente às trajectórias curvas da luz perto de objectos gravitacionais e às taxas relativas
de relógios ideais em lugares diferentes de um potencial gravitacional são encarados como con-
firmações da teoria. Das subtis mudanças previstas nas órbitas dos planetas relativamente às
trajectórias previstas pela teoria newtoniana vem uma confirmação factual adicional. A longo

42
prazo, espera-se que as observações a uma escala astronómica maior (de buracos negros, por
exemplo), ou mesmo à escala cósmica (dos efeitos observacionais da estrutura curva global da
geometria do universo, por exemplo), voltem a testar as previsões da teoria e que, caso sejam
como estava previsto, confirmem a sua verdade.
Não será então claro que os empiristas têm razão? Podemos imaginar inúmeras teorias sobre
a natureza do mundo. Só a observação e a experimentação podem dizer-nos que teoria está cor-
recta. Isto é tão verdade para a geometria como para a física, para a química, para a biologia ou
para a psicologia. Deste modo, é a observação que tem de decidir como é realmente a geometria
do mundo. Qualquer esperança de ter um conhecimento geométrico sobre o mundo que seja
certo e independente da observação e da experimentação é uma ideia ultrapassada. Mas serão
as coisas assim tão simples?

O convencionalismo de Poincaré

O grande matemático Henri Poincaré, num exame brilhante do estatuto do conhecimento


geométrico, sugeriu que as coisas não são assim tão simples. O seu estudo precedeu as revolu-
ções da relatividade, mas lançou muita luz sobre o estatuto da geometria nessas novas teorias.
Numa série de ensaios, Poincaré começa por apresentar uma demonstração da consistência rela-
tiva de uma geometria não euclidiana, refutando qualquer afirmação que defenda que as novas
geometrias devem ser abandonadas por serem logicamente inconsistentes. De seguida, enfrenta
a tese kantiana de que a geometria euclidiana é a geometria do mundo necessariamente correc-
ta. Segundo essa tese, a necessidade da geometria reside no facto de o espaço ser uma compo-
nente da nossa percepção do mundo, descrevendo a geometria euclidiana a estrutura do per-
cepcionado com a qual a mente perceptiva contribui para a percepção. Poincaré defende que se
deve distinguir o espaço da física, o espaço em que decorrem os acontecimentos materiais, de
qualquer «espaço perceptivo», como o chamado «campo visual» da percepção visual. Defende,
de facto, que não temos conhecimento da existência nem da natureza do espaço físico por meio
de qualquer contacto perceptivo directo, mas antes por inferência a partir do que percepciona-
mos directamente. Poincaré defende que é a ordem e a regularidade dos fragmentos da nossa
experiência fenoménica perceptiva que nos levam a postular que essa experiência tem uma ori-
gem causal em acontecimentos físicos que não são, eles próprios, componentes imediatas da
consciência perceptiva. Inferimos a existência e a natureza do mundo físico, incluindo a do es-
paço físico, como uma hipótese explicativa para acomodar a ordem e regularidade de que temos
experiência nas nossas percepções directas. Essa é assim uma inferência a favor de uma hipóte-
se, e nenhuma hipótese deste género pode ter qualquer necessidade que seja gerada a partir de
quaisquer alegados «princípios estruturantes do directamente percepcionado», pois a hipótese é
sobre o físico e é inferida, não sendo de maneira nenhuma sobre o conteúdo da percepção direc-
ta.
Neste ponto, é de esperar que Poincaré proponha que a geometria se apoia em inferências
realizadas a partir dos dados da observação, e que se poderia, de facto, descobrir que as geome-
trias não euclidianas se ajustam melhor aos dados que resultam da observação do que a euclidi-
ana. Mas, em vez disto, Poincaré surpreende-nos com um argumento que visa mostrar que a
geometria euclidiana não pode ser refutada por nenhuma experiência. Ele defende, de facto,
que a geometria euclidiana será sempre considerada por nós como a geometria do mundo. Esta
geometria tem assim um certo tipo de necessidade, mas essa necessidade é só uma questão de
determinação convencional da nossa parte, e não um reflexo de um facto metafísico do mundo.
O argumento de Poincaré baseia-se numa parábola famosa. Imaginemos cientistas bidimen-
sionais confinados a um disco euclidiano plano e finito. Eles tentam determinar a geometria do
seu mundo usando réguas importadas. Mas nós enganamo-los. Damos-lhes instrumentos de
medição que se expandem e contraem — todos por igual — com as mudanças de temperatura e
dispomos a temperatura do disco em que habitam de modo a que as réguas encolham para um
comprimento zero na sua periferia. Com uma diminuição apropriada da temperatura entre o
centro do disco e a sua extremidade, é fácil enganá-los, fazendo-os pensar que vivem numa su-
perfície bidimensional de Lobachevsky negativamente curva. Se tentarem usar a luz para des-
cobrir a geometria do seu mundo, colocamos à superfície uma atmosfera com um índice de re-

43
fracção variável, curvando assim as trajectórias dos feixes de luz de modo a enganá-los mais
uma vez. São induzidos no erro de pensar que a sua geometria é não euclidiana, quando isso
não é verdade. (Veja-se a figura 2.9.)

==========================================
INSERIR A FIGURA DA PÁGINA 56 COM A SEGUINTE LEGENDA:
Figura 2.9 A parábola de Poincaré. Certos habitantes bidimensionais estão confinados ao interior de um
disco comum situado no plano euclidiano. Estão equipados com réguas que mudam de comprimento com
a temperatura de uma maneira linear. A temperatura no centro do disco é TR2, onde R é o raio do disco e T
uma constante. Em qualquer ponto do disco a temperatura é T(R2 – r2), onde r é a distância do ponto em
questão ao centro do disco. Na orla do disco, a temperatura atinge assim o zero e as réguas encolhem para
o comprimento zero. É fácil mostrar que, se os habitantes considerarem que as suas réguas têm um com-
primento constante, chegarão à conclusão que vivem num plano de Lobachevsky curvo que tem uma cur-
vatura constante negativa e que se prolonga infinitamente.
==========================================

Consideremos agora o nosso mundo tridimensional. Sejam quais forem as medições que fa-
çamos usando réguas e feixes de luz (ou partículas livres, ou relógios, se quisermos determinar
a geometria do espaço-tempo), não poderá acontecer que qualquer aparência não euclidiana da
geometria se deva a campos que esticam e encolhem e a campos que desviam as partículas e os
feixes de luz dos seus caminhos geodésicos, e não a um desvio genuíno do espaço em relação à
geometria euclidiana?
Ora, no caso das criaturas bidimensionais, postulamo-nos como as autoridades últimas no
que diz respeito ao que está realmente a acontecer. Mas no caso em que tentamos determinar a
geometria do nosso mundo, o que estabelecerá a diferença entre uma geometria não euclidiana
real e um mundo euclidiano com campos de distorção que afectam até dispositivos de medição
idealizados? A sugestão de Poincaré é a de que nada há nos factos da questão que determine
qual a hipótese «correcta». Cabe-nos a nós escolher a descrição do mundo. A «verdadeira» geo-
metria do mundo é uma questão de decisão ou convenção da nossa parte. Como veremos, po-
demos atribuir muitas interpretações diferentes a esta tese. Poincaré acaba por sugerir que como
a geometria euclidiana é mais simples que a não euclidiana, devemos sempre escolher a primei-
ra enquanto a «verdadeira» geometria do mundo, restituindo a geometria euclidiana como um
aspecto necessário do mundo, que no entanto só é «convencionalmente necessário». Obviamen-
te, desde então muitos especialistas fizeram notar que pode ser mais simples descrever o mun-
do em termos não euclidianos se isso tornar mais simples o resto da nossa teoria, e que esta es-
colha (se é que é uma escolha) se verifica, por exemplo, no espaço-tempo curvo da relatividade
geral.
Mas a ideia principal de Poincaré é clara. Os dados que podemos acumular por meio da ob-
servação e da experimentação exigem uma explicação teórica. Mas as hipóteses que oferecemos
para explicar os factos da observação contêm uma estrutura com vários elementos. Podemos
manter firmemente um pressuposto sobre a constituição de uma parte desta estrutura perante
todos e quaisquer dados, desde que estejamos dispostos a postular mudanças suficientes noutra
parte da estrutura. Seja o que for que as nossas experiências nos mostrem, podemos preservar a
geometria euclidiana, por exemplo, desde que estejamos dispostos a postular coisas como um
campo físico que estica e encolhe réguas, deflecte feixes de luz e assim por diante. Logo, defen-
de Poincaré, não é uma questão de facto, mas de convenção, que seja uma geometria e não outra
que descreve o espaço (ou espaço-tempo) do mundo.

Réplicas a Poincaré

Houve muitíssimas réplicas diferentes à tese de Poincaré, uma tese que ameaçava não só a
ideia de que podemos determinar a geometria do mundo por meio de inferências realizadas a
partir da observação e da experimentação, mas também a possibilidade geral de atingir conclu-
sões definitivas sobre a estrutura do mundo que fosse remota em relação à observação directa.
Uma classe de réplicas nega a premissa fundamental do argumento de Poincaré, isto é, nega
que se possa isolar uma classe de alegados factos do mundo como os factos da observação pura,
colocando depois esses factos num domínio de «percepções da mente», só permitindo que as
44
asserções sobre o mundo físico sejam cognoscíveis, caso o sejam, com base num tipo qualquer
de inferência. Algumas pessoas negariam que um tal domínio do imediatamente percepcionado
seja inteligível, defendendo que as nossas percepções não são percepções de «dados dos senti-
dos na mente» mas percepções do mundo físico. Elas negariam a existência de algo como itens
susceptíveis de serem conhecidos pela percepção independentemente de uma postulada teoria
do mundo. Poderemos acreditar seriamente que o espaço em que vemos mesas e cadeiras não é
o espaço físico, mas um «espaço visual» que não pertence de maneira nenhuma ao domínio da
ciência física?
Mais importante é o facto de que estas pessoas negariam habitualmente a tese segundo a
qual existem factos sobre o mundo que, por princípio, são imunes a serem inspeccionados por
«observação directa» ou por «experimentação directa». É crucial para a tese de Poincaré que fac-
tos como o de saber se o espaço do mundo é realmente curvo ou não só possam ser conhecidos
por meio de inferências; não se pode determiná-lo por nenhum tipo de inspecção directa. Esta
imunidade dos factos geométricos ao observável dá origem a teorias alternativas que «salvam
os fenómenos observáveis». E esta imunidade está no âmago do argumento de Poincaré, se-
gundo o qual nunca poderemos afirmar legitimamente que conhecemos a geometria do mundo
(excepto, como é óbvio, quando a estipulamos convencionalmente).
No entanto, muitos especialistas mostraram-se cépticos quanto à possibilidade de postular
um domínio do ser que seja para sempre imune à inspecção directa. Se negamos um domínio
do directamente inspeccionado «na mente», mas considerarmos que coisas como mesas e árvo-
res são susceptíveis de serem vistas por nós, não será que um argumento derrapante nos con-
vencerá que em princípio tudo pode ser «observado»? Não podemos nós ver bactérias usando
microscópios, vírus usando microscópios electrónicos e núcleos usando aceleradores de partícu-
las? Como pode então Poincaré ter a certeza de que nunca poderíamos observar pura e sim-
plesmente se o espaço é plano ou não?
Mesmo assim, o pressuposto de Poincaré de que não podemos fazer isso, de que a estrutura
geométrica faz parte do domínio do ser que está para sempre imune ao directamente observá-
vel, parece ter força persuasiva. O que seria observar não raios luminosos ou partículas, réguas
ou relógios, mas «a estrutura do próprio espaço»? Há aqui obviamente muitos enigmas. Por
exemplo, não observamos nós «directamente» intervalos de tempo entre as nossas experiências?
Devem eles ser rejeitados como nada mais senão «intervalos mentais de tempo» que devemos
distinguir do tempo físico real do mundo material?
Uma linha de argumentação favorável a Poincaré é a de que grande parte da física contem-
porânea que lida com o espaço e o tempo parece basear-se precisamente no género de afirmação
da imunidade de alguns factos do mundo à observação directa pressuposta por Poincaré. Os
argumentos de Einstein a favor da teoria da relatividade restrita na sua crítica sobre a noção de
simultaneidade relativamente a acontecimentos distantes, por exemplo, pressupõem que essa
simultaneidade deve ser determinada pela luz, por sinais causais de um tipo qualquer ou por
relógios deslocados. Não se pode considerar que a simultaneidade é algo que está aberto à ins-
pecção directa. Também os argumentos a favor da «geometrização» da gravidade que funda-
mentam a relatividade geral se baseiam no pressuposto de que só se pode conhecer o campo
gravitacional por meio dos seus efeitos. Observamos o comportamento dos raios luminosos e
das partículas, das réguas e dos relógios, e não o próprio campo gravitacional. Em particular, há
dois pressupostos das teorias relativistas que parecem incluídos nos seus fundamentos: 1) o que
observamos é o comportamento de coisas materiais — raios luminosos, partículas, relógios e ré-
guas —, e não a estrutura do próprio espaço-tempo; 2) só podemos determinar por observação
o comportamento das coisas materiais num certo ponto, isto é, só podemos determinar coisas
como a coincidência das extremidades de duas réguas rígidas. Não podemos considerar como
um facto da observação que duas réguas rígidas, separadas por uma certa distância, têm ou não
o mesmo comprimento, tal como não podemos considerar a simultaneidade à distância como
uma característica observável do mundo no sentido de observabilidade directa.
Pode muito bem acontecer que estes pressupostos sobre classes de características do mundo
para sempre imunes à determinação por observação directa estejam erradas, mas elas estão
pressupostas na análise que fundamenta a nossa aceitação das teorias contemporâneas do espa-

45
ço-tempo. Presumamos pois, por agora, que Poincaré tem razão quanto à ideia de que estas es-
truturas inobserváveis fazem parte das nossas teorias.
Poincaré defende que as estruturas que postulamos têm de ultrapassar os factos observáveis.
É este facto que introduz nas teorias a «dualidade» que permite que inúmeras explicações alter-
nativas tenham as mesmas consequências ao nível da observação. Como ultrapassam as teorias
de Einstein o observável? Na teoria restrita, ao passo que as coincidências de acontecimentos
são observáveis, a simultaneidade para acontecimentos distantes é obtida por meio da suposi-
ção da uniformidade da velocidade da luz em todos os sistemas inerciais e em todas as direc-
ções — um «facto» que não está aberto à inspecção observacional. Uma vez mais, para obtermos
a estrutura completa do espaço-tempo da relatividade restrita, temos de adicionar o postulado
da linearidade, que corresponde a postular que o espaço-tempo é plano. Também este é um
postulado teórico que escapa à inspecção directa. Só se introduzirmos estes postulados é que
obteremos a teoria canónica e não, por exemplo, a antiga teoria de um éter absoluto com «reais»
diminuições compensadoras de réguas em movimento e atrasos compensadores de relógios em
movimento. Na teoria geral, postula-se que os raios luminosos curvos e as partículas «livres»
influenciadas pela gravidade estabelecem, respectivamente, as geodésicas nulas e temporais do
espaço-tempo. E considera-se que os relógios e as réguas locais são indicadores correctos dos
intervalos métricos do espaço e do tempo em que estão posicionados. Só com estes pressupostos
se consegue que as observações dos efeitos da gravidade afirmem que o espaço-tempo tem uma
curvatura. Com outros postulados, poderíamos manter a estrutura de espaço-tempo não curvo
na relatividade geral, considerando a gravidade, tal como na teoria de Newton, um campo de
forças sobreposto que tanto tem efeitos métricos como dinâmicos nas partículas em movimento
e na luz.
O modelo de Poincaré parece assim descrever bem o contexto em que se construíram as teo-
rias relativistas. Obtêm-se novos factos que resultam da observação. Estes estão confinados aos
factos materiais locais que dizem respeito aos nossos instrumentos de medição. Para acomodar
e explicar estes factos postula-se uma estrutura de espaço-tempo. Mas, na sua riqueza, as estru-
turas postuladas ultrapassam a totalidade dos factos observacionais possíveis que as apoiam. E,
tal como na parábola de Poincaré das criaturas bidimensionais no disco, há diversas estruturas
de espaço-tempo possíveis que fazem justiça àquilo que consideramos como a totalidade dos
factos observacionais que poderemos encontrar. Isto acontecerá, pelo menos, se estivermos pre-
parados para fazer as mudanças necessárias noutras partes da nossa teoria física.

Opções realistas

Assim, se considerarmos seriamente o problema de Poincaré e nos recusarmos a pô-lo de la-


do por se basear em noções ilegítimas sobre o que é ou não observável ou na ideia de que o do-
mínio do teórico ultrapassa, em princípio, o domínio do observável, como deveremos conti-
nuar? Uma classe de réplicas enfrenta sem rodeios o postular da estrutura teórica do espaço-
tempo, admitindo que as teorias sobre o espaço e o tempo propõem genuinamente estruturas
reais, mas inobserváveis, do mundo. Estaremos então, como Poincaré defendeu, reduzidos à
convenção para escolher a teoria correcta?
Uma das réplicas seria limitarmo-nos a adoptar uma atitude céptica. Suponhamos que só
uma, de entre as muitas teorias possíveis do espaço-tempo compatíveis com os dados da obser-
vação, é a correcta. Defendamos que só os factos da observação nos podem levar legitimamente
a escolher uma teoria em vez de outra. Defendamos depois que temos pura e simplesmente de
suspender o juízo, caso sejamos razoáveis, sobre a questão de saber qual das teorias alternativas
do espaço-tempo descreve realmente o mundo. Talvez haja pura e simplesmente limites no que
diz respeito ao que podemos saber sobre o mundo. Não deveremos, então, enfrentar essas limi-
tações honestamente e recusarmo-nos a pretender ter conhecimento daquilo que não pode, pura
e simplesmente, ser conhecido?
Para evitar esta recomendação desesperada, muitos especialistas sugeriram que devemos
confiar naqueles aspectos das teorias que usamos — e que, pensam eles, devemos usar — para
seleccionar a melhor teoria, a mais credível, a partir de um certo conjunto de alternativas, quan-
do a escolha de uma delas não pode ser feita a partir das diferenças de compatibilidade com os

46
factos observáveis. Nesta perspectiva, defende-se que existem muitas considerações próprias da
escolha de teorias que ultrapassam a simples comparação das consequências observacionais de
uma teoria com os factos observados. Tais considerações podem legitimamente ajudar-nos a de-
cidir qual é a teoria mais credível. Defende-se frequentemente que algumas teorias têm uma
plausibilidade intrínseca superior a outras. Noutros casos, alega-se que a relação de uma teoria
com a restante ciência em que ela está a ser apreciada funciona como algo que pode distinguir
as teorias mais credíveis das menos credíveis.
Como exemplo do segundo género de abordagem, podemos considerar a alegação de que o
conservadorismo metodológico pode ter um papel a desempenhar ao indicar-nos que uma teo-
ria é preferível a outras quando nenhuma se pode distinguir em termos de observação. Defen-
de-se que há uma regra do método científico que nos diz que ao escolhermos uma nova teoria
seleccionamos, e devemos seleccionar, aquela que se afasta menos das velhas teorias que já acei-
támos, mas que agora rejeitamos devido à sua incompatibilidade com os dados empíricos.
Como se poderia aplicar esta regra, por exemplo, ao caso da relatividade geral? Procuramos
uma nova teoria da gravidade. A teoria de Newton é incompatível com a teoria da relatividade
e deve ser rejeitada, mas a teoria que colocarmos no seu lugar deve ser aquela que for compatí-
vel com os novos dados da observação e que naquilo que disser for a que estiver mais próxima
daquilo que dizia a teoria anterior. Poderia uma tal regra metodológica levar-nos a preferir a
teoria de Einstein às suas alternativas do tipo «estica e encolhe mais campo de forças»? É sem
dúvida verdade que na teoria antiga considerávamos que as réguas e os relógios indicavam cor-
rectamente os intervalos espaciais e temporais. Isto é verdade na relatividade geral, mas não na
sua alternativa com espaço-tempo plano. Sendo assim, não nos levará o conservadorismo me-
todológico a seleccionar a relatividade geral como a alternativa preferida?
No entanto, na teoria anterior o espaço-tempo era plano. Continua a sê-lo na alternativa dos
campos, mas na relatividade geral faz-se a sugestão radical do espaço-tempo curvo. Deste ponto
de vista, parece que a alternativa do «espaço-tempo plano mais um campo gravitacional» é a
escolha mais conservadora e, por isso, a que devemos preferir. O problema, obviamente, é que a
regra da conservação relativamente à teoria anterior é ambígua. Tanto as teorias mais antigas
como as mais recentes têm muitos aspectos. A conservação de alguns desses aspectos pode le-
var à escolha de uma alternativa, e a conservação de outros aspectos pode levar-nos a uma esco-
lha bastante diferente.
Mas a situação é ainda pior. Mesmo que o conservadorismo nos leve a uma escolha e não a
outra, não poderá acontecer que a teoria mais antiga possa ser retrospectivamente substituída
por uma alternativa? Considere-se, por exemplo, a teoria gravitacional de Newton. Suponha-se
que consideramos que a alternativa do «espaço-tempo plano mais forças» é a teoria relativista
mais conservadora relativamente à de Newton, devendo por isso ser a preferida. Mas, como no-
támos, é possível substituir a teoria de Newton por uma teoria da gravidade com um espaço-
tempo curvo que daria origem às mesmas previsões observacionais que a teoria de Newton.
Não seria então a teoria do espaço-tempo curvo da relatividade geral a mudança mais conser-
vadora a partir da versão revista da física newtoniana? Não será assim completamente arbitrá-
ria a regra da conservação quanto ao desenvolvimento das teorias? Não nos diz ela apenas para
projectar no futuro as decisões arbitrárias anteriores, os acidentes da história? Como poderá isso
ser um guia para a verdade?
Como exemplo da outra sugestão, segundo a qual devemos confiar em aspectos intrínsecos
das teorias para fazermos uma escolha entre alternativas, podemos tomar em consideração a
noção de simplicidade teórica. Afirma-se com frequência que os cientistas, dadas duas alterna-
tivas teóricas entre as quais os dados observacionais não são decisivos, escolhem a mais simples
das duas, revelando a sua intuição que a hipótese mais simples é, provavelmente, a hipótese
verdadeira.
A noção de simplicidade, no entanto, está repleta de enigmas. Em algumas versões, depende
de como a teoria está formulada. Numa linguagem ou representação, uma teoria pode parecer
mais simples que outra, mas a ordem de simplicidade pode inverter-se se exprimirmos as teori-
as de uma maneira diferente. Outras noções de simplicidade que dependem de aspectos estru-
turais das teorias, da forma lógica das suas premissas básicas, podem evitar alguma desta apa-
rente relatividade da simplicidade com respeito à forma de expressão. Existem, na verdade, sen-

47
tidos intuitivos de simplicidade que tornam a relatividade restrita mais simples do que as teori-
as alternativas do éter ou do que as teorias alternativas que não presumem que o espaço-tempo
é plano. Intuições semelhantes sobre a simplicidade fazem a relatividade geral parecer mais
simples do que as teorias alternativas com «espaço-tempo plano mais campos impostos». Em
ambos os casos, a ideia é a de que a teoria de Einstein não tem a estrutura desnecessária e pro-
blemática que contamina as suas alternativas.
Para vermos isto, comparemos primeiro o espaço-tempo da relatividade restrita de Einstein
com uma das teorias do éter. Einstein considera que a velocidade da luz é a mesma em todas as
direcções em qualquer sistema de referência inercial. As teorias do éter negam isto. Nelas sus-
tenta-se que a luz só tem uma velocidade uniforme em todas as direcções no sistema que se en-
contra em repouso no éter. Nos outros sistemas de referência, a luz só parece ter a mesma velo-
cidade em cada direcção devido ao efeito do movimento do laboratório relativamente ao éter
em instrumentos de medição como réguas e relógios. Assim, enquanto Einstein explica os resul-
tados nulos das experiências de ida e volta por meio da uniformidade da velocidade da luz em
todas as direcções ao longo das trajectórias, a teoria do éter explica-os ao introduzir, primeiro,
uma variação na velocidade da luz em diferentes direcções, e, depois, uma variação compensa-
tória nos instrumentos laboratoriais, estando cada variação dependente da velocidade do labo-
ratório através do éter. Os efeitos destas variações cancelam-se completamente. É assim óbvio
que a explicação da teoria do éter para os resultados observados é desnecessariamente compli-
cada. Para obter os resultados observacionais precisamos de especificar um parâmetro da teoria,
isto é, a velocidade do laboratório em relação ao éter. Mas, seja qual for o valor que especifica-
mos para esta quantidade, obtemos exactamente as mesmas previsões observacionais, pois os
efeitos da velocidade cancelam-se. Por esta razão, nenhuma experiência que possamos realizar
pode determinar a velocidade do laboratório relativamente ao éter. É óbvio que a teoria de Eins-
tein, que nega simplesmente que exista um tal referencial do éter ou uma tal velocidade indetec-
tável, é mais simples enquanto hipótese explicativa, devendo por isso ser preferida às outras.
Acontece uma situação semelhante no caso da relatividade geral. Einstein explica as trajectó-
rias curvas da luz e das partículas por meio da afirmação de que estas seguem as geodésicas de
um espaço-tempo curvo. Postular uma alternativa do tipo «espaço-tempo plano mais forças»
tomaria esta curvatura como o resultado de as forças deflectirem as partículas das verdadeiras
geodésicas em linha recta do verdadeiro espaço-tempo não curvo. Um exame cuidado das teo-
rias mostra que a cada mundo descrito pela teoria do espaço-tempo curvo corresponde um nú-
mero infinito de mundos com «espaço-tempo plano mais campos», tal como um número infini-
to de mundos de «sistema inercial do éter mais compensação» corresponde a um único mundo
de «espaço-tempo de Minkowski da relatividade restrita». E tal como não se distingue cada um
dos «mundos de sistemas inerciais do éter» dos outros ao nível da observação, também não se
distingue cada um dos novos mundos de «espaço-tempo plano mais campos» de todos os ou-
tros mundos desse tipo. Isto é uma generalização de algo que Maxwell e outros compreenderam
sobre a teoria da gravitação pré-relativista. Suponhamos que existia no universo um campo
gravitacional constante em todo o lado (ou seja, em cada ponto a força gravitacional teria a
mesma magnitude e apontaria para a mesma direcção). Todo o universo material estaria então a
cair com uma aceleração constante neste mundo. Embora todos os objectos estivessem em acele-
ração, esta aceleração, ao contrário da aceleração normal, não seria detectada. Isto aconteceria
porque todos os dispositivos de medição sofreriam a mesma aceleração que o próprio mundo.
Deste modo, não se pode determinar que campo gravitacional constante existe, se é que existe
tal campo, pois esse é um facto indetectável do mundo.
No entanto, na relatividade geral não existe qualquer campo gravitacional, e todos os mun-
dos da teoria anterior insusceptíveis de serem distinguidos em termos de observação são assi-
milados num único mundo de espaço-tempo curvo. Isto corresponde com exactidão à maneira
como a relatividade restrita substitui um número infinito de sistemas inerciais possíveis do éter
por um único espaço-tempo de Minkowski. Deste modo, num sentido importante, as teorias de
Einstein são mais simples que as suas alternativas que são indiscerníveis em termos de observa-
ção. Algumas teorias da confirmação usaram factos como este para produzir novas noções so-
bre a confirmação de uma teoria por dados. As noções anteriores de confirmação tinham ten-
dência para atribuir a mesma confirmação a quaisquer duas teorias indiscerníveis observacio-

48
nalmente, a não ser que antes se tivesse introduzido alguma plausibilidade intrínseca anterior
que as permitisse distinguir. Nas novas noções de confirmação admite-se que teorias como a da
relatividade restrita e a da relatividade geral sejam confirmadas pelos dados, mas atribui-se só
confirmação zero a quaisquer teorias, como as do éter e as gravitacionais do espaço-tempo pla-
no, que contenham parâmetros insusceptíveis de serem determinados pela observação.
Mas, obviamente, há quem recuse esta solução para o enigma de Poincaré. Por que razão
havemos de acreditar que a teoria mais simples, mesmo que possamos tornar coerente a noção
de simplicidade, é aquela que devemos aceitar como verdadeira? O que nos assegura que a
simplicidade, independentemente de como a concebemos, tem de ser considerada como um in-
dício da verdade de uma teoria? É claro que podemos preferir a teoria mais simples por esta ser
esteticamente apelativa, mas por que razão havemos de considerar a complexidade como um
indício de falsidade, colocando-a a par da ausência de um acordo de uma teoria com os dados
da observação? Será que considerações como a simplicidade de uma teoria deverão contar a fa-
vor da sua credibilidade para quem adopta a postura realista de que existe um mundo inde-
pendente das nossas teorias, e de que essas teorias ou descrevem genuinamente esse mundo ou
não?

Opções reducionistas

Em contraste com todas estas abordagens do problema de Poincaré, temos as abordagens


que tentam eliminar o desafio céptico ao negarem a existência real de teorias alternativas entre
as quais temos de escolher. Se considerarmos que a própria identidade de uma teoria é deter-
minada pelas suas consequências ao nível da observação, não deveremos chegar à conclusão de
que todas as alegadas teorias alternativas são realmente uma e a mesma teoria, e que parecem
diferir entre si só porque se escolheu exprimir as mesmas afirmações sobre o mundo em lingua-
gens que diferem entre si?
A ideia subjacente é clara. É certo, diz-se, que podemos compreender casos em que duas ex-
pressões de uma teoria estão aparentemente em conflito, de tal forma que parece que não po-
dem ser ambas correctas, mas onde o conflito é só aparente: resulta de os termos estarem a ser
usados com significados diferentes nas duas expressões da teoria. Se, por exemplo, alguém
propusesse uma teoria da electricidade exactamente igual à teoria corrente, excepto no facto de
as palavras «positivo» e «negativo», que se referem a cargas, estarem trocadas, compreenderí-
amos imediatamente que não tinha sido proposta qualquer nova teoria. Em vez disso, tinha-se
repetido a teoria anterior trocando o significado de duas palavras-chave. Suponhamos então
que postulamos que todo o conteúdo real de uma teoria está contido nas suas consequências ao
nível da observação, e que quaisquer duas teorias com as mesmas consequências ao nível da
observação correspondem a uma única teoria. As diferenças aparentes entre as duas expressões
ficariam a dever-se, na realidade, a simples diferenças no significado de alguns dos termos en-
volvidos.
Propuseram-se diversas abordagens «positivistas» às teorias e ao significado teórico. Suge-
riu-se por vezes que para que os termos de uma teoria tenham realmente um significado genuí-
no devem receber definições individuais inteiramente formuladas no vocabulário que se refere
a observáveis. Quando temos duas teorias aparentemente incompatíveis com as mesmas conse-
quências em termos de observação, poderíamos localizar que termos na expressão das duas teo-
rias diferem em significado. É possível defender, por exemplo, que o facto de os raios luminosos
percorrerem geodésicas nulas na relatividade geral corresponde a uma definição nessa teoria de
«geodésica nula» enquanto trajectória de um raio luminoso. Na teoria do «espaço-tempo plano
mais forças» os raios luminosos não percorrem geodésicas nulas. Defende-se assim que «geodé-
sica nula» deve ter um significado diferente nesta nova expressão da teoria. Noutras versões
desta abordagem exige-se que qualquer frase da teoria possa traduzir-se noutra frase que se ex-
prima apenas em termos observacionais. Outros especialistas ainda consideram demasiado se-
veras estas exigências de definibilidade estrita de termos ou da possibilidade de traduzir de fra-
se para frase. Para estes especialistas, é a teoria como um todo que tem significado, e o seu sig-
nificado esgota-se na totalidade das suas consequências em termos de observação. No caso das
teorias da gravidade com espaço-tempo curvo ou plano, eles sustentariam que não leva a nada

49
perguntar quais os termos que mudaram de significado de uma teoria para outra. Como alter-
nativa, defendem, podemos dizer que todos mudaram, excepto aqueles que se referem a fenó-
menos observáveis. O que podemos dizer, no entanto, é que, como as duas teorias têm as mes-
mas consequências observacionais, consideradas como um todo «dizem a mesma coisa».
As abordagens reducionistas deste género eliminam certamente o problema céptico que re-
sulta de as teorias ultrapassarem os dados empíricos. Deste ponto de vista, a ultrapassagem do
observável é apenas ilusória. Por vezes, diz-se que escolher uma teoria em vez de outra que lhe
é equivalente em termos de observação é apenas, na verdade, escolher uma maneira de expri-
mir uma teoria. Alega-se por vezes que é como escolher um sistema de coordenadas em vez de
outro para descrever a localização de acontecimentos. Ao realista, que afirma que as teorias po-
dem diferir em simplicidade e, por isso, também naquilo que dizem e talvez até no seu grau de
credibilidade intrínseca, estes especialistas responderiam que essa diferença no que respeita à
simplicidade é apenas uma diferença de simplicidade na maneira de expressão. Não é uma di-
ferença de simplicidade real como, por exemplo, a que existe entre uma função linear e uma
função quadrática, que relacionam observáveis com observáveis. Escolher uma entre várias al-
ternativas equivalentes em termos de observação é assim uma simples escolha do modo de ex-
primir as nossas crenças teóricas. Segundo este ponto de vista, as crenças teóricas na realidade
são apenas resumos linguisticamente convenientes da totalidade das suas consequências obser-
vacionais. Embora não seja completamente claro o que Poincaré queria dizer quando disse que
a escolha da geometria é convencional, talvez fosse isto que tinha em mente.
A objecção mais grave a esta abordagem das teorias surge quando a conduzimos ao seu limi-
te quase inevitável. Como duas teorias que aparentemente dizem coisas bastante incompatíveis
sobre a estrutura do inobservável são vistas na verdade como inteiramente equivalentes, é evi-
dente que não devemos considerar o que elas dizem sobre inobserváveis de uma maneira sim-
plesmente referencial. Se considerarmos que uma teoria que diz que o espaço-tempo é curvo é
inteiramente equivalente a uma teoria que diz que o espaço-tempo é não curvo, então é claro
que ambas as teorias usam apenas a referência ao espaço-tempo como um dispositivo instru-
mental para gerar o seu conteúdo real, que consiste na ordem legiforme entre os observáveis
que prevêem. Sendo assim, na verdade não devemos considerar que o que se diz sobre o espa-
ço-tempo é algo que diz realmente respeito a um certo objecto e que lhe atribui uma certa carac-
terística. Para entendermos isto, precisamos apenas de considerar o seguinte facto: se quaisquer
duas expressões de uma teoria que têm o mesmo conteúdo em termos de observação são intei-
ramente equivalentes, então o simples conjunto das consequências observacionais que as teorias
têm em comum é equivalente a ambas. E esta terceira «teoria» não refere de maneira nenhuma
entidades nem estruturas teóricas (como o espaço-tempo e a sua curvatura). O facto de esse con-
junto de consequências observacionais poder ser uma colecção infinita de asserções não parece
ser, desta perspectiva positivista radical, relevante para a tese irrealista.
Mas, sendo assim, considerar a equivalência em termos de observação como suficiente para
uma equivalência completa parece implicar um irrealismo radical em relação ao inobservável.
Toda a referência, excepto a referência ao que está directamente aberto à inspecção observacio-
nal, é pseudo-referência, e qualquer descrição da estrutura do inobservável torna-se apenas
uma maneira de falar, e não uma descrição séria de uma alegada parte real do mundo. Se essa
referência ao espaço-tempo e à sua estrutura é totalmente fictícia, não será igualmente fictícia a
referência aos electrões? E se seguirmos o percurso filosófico habitual de considerar aquilo que
é imediatamente observável como algo que consiste apenas em dados dos sentidos da percep-
ção directa, e não em características físicas e em coisas físicas, não seremos levados a conceber
todo o mundo físico como uma ficção? Certamente este irrealismo radical relativamente àquilo
que é físico nos faz pagar um preço demasiado elevado para evitar o desafio céptico relativo ao
nosso conhecimento da estrutura geométrica real do mundo.

Réplicas realistas complementares

Muitos realistas, em resposta às consequências da abordagem positivista que acabei de esbo-


çar, defenderam que o erro nuclear do positivismo está na ideia de que a equivalência observa-
cional entre teorias é suficiente para a sua completa equivalência. Estes realistas desejariam ad-

50
mitir que teorias aparentemente incompatíveis dizem por vezes, na verdade, «a mesma coisa»,
mas negariam que ter as mesmas consequências observacionais seja suficiente para uma com-
pleta equivalência. Afirmam que se duas teorias tiverem a mesma estrutura ao nível teórico, de
tal modo que se possa obter uma teoria a partir da outra por meio de uma substituição termo a
termo (como a inversão já mencionada de «positivo» e «negativo» na teoria da electricidade),
então será apropriado dizer que as teorias são equivalentes; mas quando elas têm as mesmas
consequências observacionais mas diferem na sua estrutura ao nível teórico não se deve consi-
derar que são equivalentes. Alega-se que esta situação ocorre nos casos do espaço-tempo já aqui
apresentados. A relatividade restrita é estruturalmente diferente das teorias compensadoras do
éter, o que se revela no facto de um número infinito de teorias distintas do éter corresponderem
a uma única teoria do espaço-tempo de Minkowski. E a relatividade geral é estruturalmente di-
ferente das alternativas do «espaço-tempo plano mais forças» porque, uma vez mais, ao único
espaço-tempo da relatividade geral corresponde um número infinito de alternativas possíveis.
Isto é só repetir a asserção de que as teorias relativistas são preferíveis às suas alternativas devi-
do a uma simplicidade de um tipo estrutural. Deste modo, não precisamos de presumir que as
teorias relativistas são simplesmente equivalentes às suas alternativas, porque não precisamos
de aceitar a tese positivista de que a equivalência observacional implica uma equivalência com-
pleta.
Obviamente, o regresso a esta perspectiva realista conduz-nos de novo às questões já colo-
cadas sobre como poderemos escolher razoavelmente entre várias teorias que, embora não se-
jam equivalentes, sejam indiscerníveis observacionalmente. Também nos conduz à questão de
saber como, para o realista, os termos teóricos de uma teoria adquirem o seu significado. A
maior parte dos realistas subscreve a ideia de que o significado é adquirido, em primeiro lugar,
pelos termos do nosso discurso que estão associados a elementos da nossa experiência observa-
cional, e que os restantes termos de uma teoria obtêm o seu significado por meio de uma relação
que mantêm com os termos observacionais (embora outros realistas neguem até esta «precedên-
cia semântica» limitada ao vocabulário observacional). Uma abordagem realista comum consis-
te em sustentar que os termos teóricos adquirem o seu significado, seja ele qual for, simples-
mente pelo papel que esses termos desempenham na rede de leis da teoria que acaba por con-
duzir a consequências observacionais. A ideia é aqui a de que enquanto os termos observacio-
nais adquirem o seu significado à margem do papel que desempenham na teoria, os termos teó-
ricos adquirem o seu significado, seja ele qual for, a partir do seu papel enquanto elementos da
estrutura teórica. Diz-se assim que «geodésica nula» tem o seu significado inteiramente deter-
minado pelo lugar que este termo ocupa, por exemplo, nas leis da relatividade geral.
Defende-se frequentemente que esta teoria do significado dos termos teóricos não é incom-
patível com o realismo sobre entidades e propriedades teóricas. «Geodésica nula», por exemplo,
tem o seu significado estabelecido pelo papel que o termo desempenha na teoria do espaço-
tempo, mas isso não significa que não existam quaisquer geodésicas nulas. Se a teoria for correc-
ta, existem. Elas são aquilo que o termo «geodésica nula» refere. O problema é que é fácil inven-
tar novas referências para os termos de modo a que as teorias sejam correctas mesmo que os
termos já não refiram as entidades e características teóricas que considerávamos reais. Poderí-
amos, por exemplo, interpretar todos os termos teóricos da teoria do espaço-tempo não como
algo que refere aquilo que intuitivamente concebemos como estruturas do espaço-tempo, mas
antes como algo que refere certos objectos abstractos, como os números. A teoria seria então
reinterpretada como a tese de que se podem atribuir números às características e entidades ob-
serváveis de tal maneira que, seguindo as regras da matemática, se poderia inferir a existência
de certas regularidades legiformes entre os observáveis, mas só aquelas regularidades que se
seguem da teoria original do espaço-tempo tal como ela é entendida em termos realistas. O dis-
curso sobre entidades e características teóricas torna-se assim no discurso sobre como podemos
incorporar o comportamento observável numa estrutura abstracta que tem consequências para
a ordem e regularidade entre os observáveis. Sempre que adoptarmos o ponto de vista sobre os
termos teóricos segundo o qual «o significado é dado apenas pelo papel desempenhado na teo-
ria», estas reconstruções «representacionalistas» das teorias irão atormentar o realista.
Por esta razão, alguns realistas prefeririam defender que os termos teóricos, incluindo aque-
les que referem as estruturas do espaço-tempo, adquirem o seu significado de outra maneira.

51
Neste ponto, trazem-se frequentemente a lume analogias de significado com termos observá-
veis. Afirma-se que as moléculas são descritas como partículas, e sabemos o que «partícula»
significa a partir das partículas observáveis. Sabemos assim algo sobre o que significa «molécu-
la» que nos assegura que, sejam as moléculas o que forem, não são objectos abstractos como os
números. Talvez a analogia entre uma trajectória enquanto estrutura do espaço-tempo e uma
trajectória constituída por uma coisa material nos possa oferecer uma porta de entrada para o
significado dos termos do espaço-tempo que ultrapassem o papel desempenhado na previsão
do comportamento local dos objectos materiais.

Pontos de vista pragmatistas

As opções que explorámos não esgotam todas as reacções que podemos ter perante enigmas
como os que Poincaré nos apresentou. Alguns filósofos tentaram argumentar a favor da ideia de
que todos os debates entre realistas e anti-realistas assentam em confusões. Alguns desses ar-
gumentos recuperam o cepticismo já mencionado quanto à possibilidade de tornar as conse-
quências observáveis numa classe distinta das consequências de uma teoria. Outros assentam
numa tese segundo a qual não leva a nada tentar saber qual de certas teorias alternativas possí-
veis é a verdadeira. Talvez existam diversas explicações alternativas que, consideradas a partir
de uma certa totalidade de dados observacionais possíveis, sejam igualmente dignas de «credi-
bilidade racional». Suponhamos que consideramos essas explicações genuinamente incompatí-
veis, não as reduzindo a simples variações linguísticas como fazem os positivistas. Se escolher-
mos uma dessas teorias, afirmaremos que as suas consequências serão verdadeiras e que as
consequências incompatíveis das suas rivais serão falsas. Obviamente, se tivéssemos escolhido
uma das outras alternativas teríamos mudado os nossos pontos de vista no que diz respeito a
saber que asserções seriam verdadeiras e que asserções seriam falsas, mas teríamos sido igual-
mente racionais. Mas afinal o que é a verdade? Não será apenas uma maneira de caracterizar, ao
nível do que dizemos sobre as frases, aquilo que exprimiríamos ao usar as próprias frases, no
sentido em que declaramos como verdadeiras todas as frases, e apenas aquelas frases, que es-
tamos dispostos a afirmar? Deste modo, talvez Poincaré tivesse razão ao dizer que a geometria
do mundo é uma questão de convenção, no sentido em que nos compete escolher uma das op-
ções racionais disponíveis e, depois de termos feito isso, declarar que as suas consequências são
«verdadeiras».
Então e se a opção que escolhermos não estiver realmente de acordo com aquilo que aconte-
ce no mundo? Neste ponto, alguns especialistas mostram-se cépticos em relação à própria ideia
de um mundo independente de teorias ao qual as teorias correspondem ou não. Saber se este
ponto de vista, por vezes associado ao pragmatismo, outras vezes conhecido por «realismo in-
terno», constitui realmente uma posição estável, uma posição que não se reduz ao cepticismo ou
a um tipo de positivismo reducionista, continua a ser uma questão em aberto.

Resumo

Seja como for, podemos ver agora como os desenvolvimentos da matemática pura e da física
teórica mudaram radicalmente as nossas atitudes, tanto perante a geometria como perante o lu-
gar que ela ocupa no nosso corpo de conhecimentos. A geometria continuou durante séculos a
ser o melhor exemplo de uma teoria que parecia comunicar-nos factos significativos sobre o
mundo em que vivemos; podíamos conhecer as verdades geométricas, e conhecê-las com certe-
za, já que estas eram deriváveis por meio de certas inferências lógicas a partir de primeiros
princípios cuja verdade era auto-evidente. A geometria era o paradigma para o conhecimento
em geral. Se fôssemos suficientemente inteligentes, poderíamos conhecer todas as verdades
acerca do mundo do mesmo modo como conhecíamos as geométricas. Mais tarde, como vimos,
a tendência empirista levava muitos filósofos a afirmar que só poderíamos conhecer o mundo
por meio de generalizações e de inferências realizadas a partir de dados básicos da observação e
da experimentação, mas a geometria parecia continuar a ser a excepção a esta regra geral, uma
excepção cuja natureza específica exigia uma explicação como a que Kant tentou oferecer.

52
Com a descoberta de uma multiplicidade de geometrias axiomáticas logicamente consisten-
tes, com a posterior generalização que conduziu às geometrias curvas multidimensionais de Ri-
emann e depois às geometrias concebidas para o estudo da topologia e da estrutura diferencial
dos espaços (que não mencionámos), o estatuto da geometria enquanto algo cognoscível sem
recurso à observação ou à experimentação ficou sob sérias dúvidas. Essas dúvidas tornaram-se
muito mais significativas no século XX com a descoberta dos novos espaços-tempos, essenciais
para o tratamento relativista do comportamento da matéria e da luz, e depois com a descoberta,
inerente à teoria da relatividade geral, da possibilidade de utilizar o espaço-tempo curvo como
teoria da gravidade. Não parecia então que o carácter cognoscível da geometria, tal como de to-
das as outras teorias sobre o mundo, só podia ser baseado na observação e na experimentação?
Mas, como vimos, isto não é assim tão simples. É certo que na perspectiva moderna parece
que a geometria se tornou muito mais parecida com as outras teorias físicas gerais e fundamen-
tais, mas ainda assim baseadas na observação. Como vimos, no entanto, a reflexão sobre como
podem e não podem exactamente os resultados determinar em que geometria do mundo de-
vemos racionalmente acreditar revela-nos o grau com que a geometria, tal como todas as teorias
físicas fundamentais, ultrapassa a simples generalização realizada a partir de dados empíricos,
generalização que um empirismo grosseiro tomaria como o modelo da inferência a favor de teo-
rias.
Saber como responder à possibilidade de reconciliar diversas geometrias com quaisquer da-
dos observacionais possíveis é, como vimos, uma questão muito problemática. Podemos assu-
mir uma atitude realista e mostrarmo-nos pura e simplesmente cépticos quanto ao problema de
saber qual das geometrias descreve realmente o mundo. Ou podemos tentar encontrar regras
metodológicas para a crença racional, regras que, perante muitas geometrias alternativas, nos
guiem na escolha daquela que for a mais credível racionalmente. Ou podemos tentar evitar o
desafio céptico e invocar uma tese reducionista que nos diga que todas as geometrias alternati-
vas, quando são complementadas com teorias físicas precisas que as tornam — cada uma à sua
maneira — compatíveis com os dados da observação, são realmente equivalentes. Finalmente,
podemos tentar desacreditar o problema da «subdeterminação da geometria em relação a
quaisquer dados possíveis» ao negar algumas das suas premissas sobre a distinção entre o «ob-
servável em princípio» e o «inobservável em princípio» ou ao questionar o pressuposto implíci-
to de uma única teoria verdadeira que corresponda a um mundo real independente de teorias.
Uma vez mais a geometria colocou problemas à nossa teoria geral do conhecimento. Estes
problemas da subdeterminação teórica são problemas gerais, e têm de ser enfrentados por
quem queira compreender como podemos fundamentar racionalmente uma teoria sobre o
mundo em toda a sua generalidade — o que inclui a sua referência a entidades e estruturas con-
sideradas imunes à observação directa — a partir dos dados limitados que podemos adquirir
por meio da experiência observacional.

Que tipo de ser tem o espaço-tempo?

Como vimos, é impossível explorar os problemas acerca do nosso conhecimento do espaço e


do tempo sem entrar nas questões do ser, nas chamadas «questões metafísicas». Uma aborda-
gem positivista do significado das teorias, destinada a eliminar o problema da subdeterminação
por meio da identificação do conteúdo de uma teoria com o conteúdo das suas consequências
observacionais, requer uma atitude irrealista em relação às entidades e características aparen-
temente postuladas pela teoria ao nível do não observável. Mas há muitas outras questões de
um género metafísico que, embora possam acabar por suscitar preocupações epistemológicas,
não partem de questões sobre o conhecimento. Muitas dessas questões são próprias do estudo
do espaço e do tempo, embora, como veremos, o seu tratamento levante frequentemente ques-
tões metafísicas mais amplas.

53
Tempo e ser

Considere-se, por exemplo, as doutrinas tradicionais que relacionam o tempo e o ser. Segun-
do algumas delas, parecia intuitivamente óbvio que apenas o que existe agora existe realmente.
O futuro ainda não tinha começado a existir e o passado já tinha deixado de existir. Só das enti-
dades que existem no presente se podia dizer propriamente que existiam realmente. Para outras
doutrinas, o passado e o presente eram reais, mas o futuro irreal. A ideia intuitiva era neste caso
a de que o passado e o presente, tendo já ocorrido ou vindo à existência, tinham uma realidade
determinada. Saber o que eles eram era uma questão de conhecer os factos brutos. Segundo esta
ideia, o futuro era um domínio daquilo que ainda não veio à existência, não tendo por isso
qualquer realidade determinada. Afinal, seguindo este raciocínio, se fosse agora um facto de-
terminado que um certo acontecimento futuro tinha uma realidade, como poderia estar ainda
em aberto a possibilidade de ele vir a ocorrer? Como poderia haver ainda lugar para decidir
quais seriam as nossas acções futuras, por exemplo, se no presente já fosse verdade, e sempre
tivesse sido verdade, que o que faremos amanhã era já hoje um facto determinado? A questão
aqui não era a do determinismo, não era a questão de saber se os acontecimentos do presente e
do passado fixavam ou não, por meio de conexões legiformes com outros acontecimentos, os
acontecimentos que iriam ocorrer no futuro. A questão era antes a de que, se os acontecimentos
do futuro tivessem a realidade do presente e do passado (se fosse um facto hoje que eu amanhã
irei comprar um gelado), então não poderia haver qualquer sentido segundo o qual se pudesse
dizer que o futuro tinha ainda possibilidades em aberto.
A estas intuições opunham-se as perspectivas que nos diziam que quaisquer pretensas cone-
xões entre o tempo e o ser eram meras ilusões de linguagem. Estas perspectivas defendiam que
o presente, o passado e o futuro eram igualmente reais.
Não consideramos o facto de as coisas não estarem aqui, onde estamos localizados, como
uma razão para defender que não são reais — por isso, por que razão havemos de considerar o
facto de as coisas não existirem quando pensamos ou falamos delas como uma razão para negar
a sua realidade? Seria disparatado defender, por exemplo, que as coisas que estão atrás de nós
ou localizadas no sítio onde estamos são reais, mas que as coisas que estão à nossa frente care-
cem de verdadeira realidade. Sendo assim, por que razão não consideramos igualmente absur-
do postular que o passado e o presente são reais, mas negar que o mesmo aconteça com as rea-
lidades futuras?
Estas questões encontram-se ligadas a muitas outras que aqui só vamos poder considerar
com muita brevidade. Alega-se por vezes que o tempo é radicalmente diferente do espaço: en-
quanto o espaço pode ser visto correctamente a partir de uma espécie de ponto de vista «sem
perspectiva», uma compreensão adequada da temporalidade das coisas requer um ponto de
vista perspectívico. Defende-se que poderíamos descrever todos os fenómenos espaciais de du-
as maneiras igualmente adequadas. Podemos atribuir a todas as localizações espaciais um nome
de coordenada e dizer onde as coisas ocorreram especificando as localizações nestes termos; ou
podemos também especificar onde algo aconteceu em relação ao «aqui», ao lugar onde estamos
localizados.
Se tentarmos o mesmo truque com o tempo, encontraremos um enigma. Será que a informa-
ção proporcionada por dizer quando as coisas aconteceram, mesmo em relação umas às outras,
comunica inteiramente todos os aspectos temporais daquilo que aconteceu? Há quem diga que
não. Suponhamos que indicamos a data da morte de Júlio César e a data de hoje. Suponhamos
que acrescentamos o facto de a data em que morreu Júlio César ser anterior à data de hoje, con-
siderando «ser anterior a» como uma relação primitiva entre instantes. Será que quando tiver-
mos dito tudo isso teremos dito tudo o que há para dizer, temporalmente, acerca da morte de
César? A resposta negativa baseia-se na ideia de que quando dizemos «César morreu», ou ex-
plicamos de outra maneira que a morte de César faz parte do passado, estamos a fazer mais do
que indicar que esse acontecimento ocorreu, por exemplo, antes de 1989. Este último facto é «in-
temporalmente verdadeiro», mas o facto de que César morreu não era verdadeiro antes de ele
morrer, mesmo que o facto de a morte de César ser (intemporalmente) anterior a 1989 seja, num
certo sentido, sempre verdadeiro.

54
Não poderemos então captar o «carácter pretérito» da morte de César dizendo que ela ocor-
reu antes de agora? Com certeza, responde-se, mas «agora» é o nome do presente, e ao colocar-
mos as coisas desta forma reintroduzimos uma temporalidade linguística essencial na descrição
temporal das coisas. Quem nega que neste aspecto haja uma diferença essencial entre o espaço e
o tempo responde que «agora» é uma palavra como «aqui». A referência destas palavras, co-
nhecidas por vezes como «espécime-reflexivas» ou «indexicais», varia com o seu uso. Cada uso
de «aqui» refere-se ao lugar no qual a pessoa que fala está localizada. Da mesma forma, cada
uso de «agora» refere-se ao instante em que se realiza a elocução. Será que existe algo mais mis-
terioso na expressão «César morreu», além do facto de a morte de César ser (intemporalmente)
anterior a 1989 e de agora ser 1989, do que existe no facto de uma supernova ocorrer a uma certa
distância da Terra e de a Terra ser aqui?
Sim, respondem os defensores do ponto de vista de que no tempo há algo radicalmente dife-
rente que o distingue do espaço. Ao passo que as coisas que existem em qualquer outro lugar
do espaço existem realmente, as coisas que não existem agora não existem realmente. Eles insis-
tem que «agora» não é um mero indexical; é o termo que capta o instante de tempo no qual as
coisas existem, que é obviamente o presente! E assim este debate sobre a temporalidade linguís-
tica essencial do tempo regressa, uma vez mais, à intuição de Santo Agostinho de que, propria-
mente falando, apenas o que existe agora existe realmente.

Considerações relativistas

É evidente que a reestruturação radical do espaço e do tempo por meio do espaço-tempo


postulado na teoria da relatividade restrita tem de ter um impacto forte neste debate. O que
acontecerá à tese de que «só o que existe agora existe verdadeiramente», dado que acontecimen-
tos que são simultâneos para um observador ocorrem em instantes diferentes para um segundo
observador que esteja em movimento relativamente ao primeiro, mesmo que os dois observa-
dores coincidam momentaneamente? O próprio significado de «agora» tornou-se problemático.
No mínimo, determinar quais os acontecimentos que ocorrem exactamente «agora» tornou-se
uma questão relativa.
Suponhamos que dois observadores coincidem no acontecimento e mas estão em movimento
um em relação ao outro. Haverão acontecimentos, como o acontecimento a, que estão depois de
e para o primeiro observador, mas que são simultâneos com e para o segundo. Mas, então, como
poderemos dizer que a é irreal para o primeiro observador se a é real para o segundo observa-
dor no instante em questão (já que é simultâneo com e para esse segundo observador), e se o se-
gundo observador é certamente real para o primeiro quando o acontecimento e tem lugar? A
situação é ainda pior que isto. Na relatividade, um acontecimento pode ser posterior ao aconte-
cimento e ou «absolutamente posterior» ao acontecimento e. Falamos de «absolutamente poste-
rior» quando o acontecimento b está depois de e, e pode ser conectado causalmente a e por um
sinal que viaje à velocidade da luz ou a uma velocidade inferior a essa. No caso de acontecimen-
tos como a, que não podem ser conectados causalmente a e, a aparecerá depois de e, ao mesmo
tempo que e ou antes de e para diferentes observadores. Mas todos os observadores concorda-
rão que b, que está absolutamente depois de e, está depois de e. Contudo, pode ainda verificar-
se que haja um outro observador cuja vida seja o acontecimento e’, simultâneo (para si) com b,
mas de tal forma que e’ seja simultâneo com e para o primeiro observador. Assim, o primeiro
observador dirá que a vida do segundo observador em e’ é real em e, e o segundo observador
dirá que b é real em e’. Como poderá então o primeiro observador considerar b, no seu futuro
absoluto, como irreal em e?
Estes argumentos são concebidos para convencer o leitor de que a aceitação do espaço-
tempo da relatividade ridiculariza a concepção tradicional, segundo a qual «apenas o que agora
é presente é real». Defende-se que a relatividade só é claramente compatível com a concepção
alternativa segundo a qual, tal como consideramos tradicionalmente que tudo o que acontece
no espaço, onde quer que aconteça, é real, também todos os acontecimentos do passado, presen-
te e futuro são reais. Se o passado, o presente e o futuro são tão relativos aos estados de movi-
mento como a teoria da relatividade restrita afirma, como poderemos conceber a realidade co-

55
mo algo que varia com o lugar temporal de um acontecimento, relativamente ao acontecimento
presente na vida do agente considerado?
Mas é óbvio que isto não é assim tão simples. A tentativa de retirar uma conclusão metafísica
de uma teoria científica requer mais cuidado do que aquele que tivemos até aqui. Mesmo acei-
tando a relatividade, formalmente poderíamos manter-nos fiéis às velhas doutrinas da irreali-
dade de tudo excepto do presente, negando simplesmente que «é real» seja uma noção inteira-
mente transitiva. Se na relatividade «é simultâneo» se caracteriza por e’ poder ser simultâneo
com e para o primeiro observador, b poder ser simultâneo com e’ para o segundo observador,
mas b não ser simultâneo com e para nenhum dos observadores (e terá certamente esta caracte-
rística), por que razão não haveremos então de relativizar da mesma maneira «é real para», de
modo a que, apesar de e’ ser real para e para o primeiro observador, e de b ser real para e’ para o
segundo observador, b não ser real para e para ninguém? Deste modo, nenhum observador no
acontecimento e irá alguma vez afirmar que b é um acontecimento real, seja qual for o seu esta-
do de movimento quando ele coincide com e.
Uma réplica mais interessante procura, antes de mais, as fontes da intuição de que o passado
e o futuro são irreais. Uma motivação para essa ideia, embora não seja a única, é a distância
epistémica do passado e do futuro relativamente ao presente. É uma ideia comum que o presen-
te nos é «apresentado» imediatamente na experiência, mas que só se pode conhecer o que acon-
teceu no passado e o que acontecerá no futuro por meio de inferências realizadas a partir da ex-
periência presente (incluindo experiências como «ter memória de que tal acontecimento ocor-
reu»). Como vimos na secção «Como Sabemos Qual é a Verdadeira Geometria do Mundo?», o
estatuto ontológico daquilo que se infere está frequentemente sujeito a dúvidas. Há argumentos
concebidos para suscitar dúvidas cépticas quanto à adequação de qualquer pretensão ao conhe-
cimento de uma proposição cuja verdade só possa ser conhecida indirectamente por meio de
processos de inferência. Se basearmos a tese da irrealidade do passado e do futuro na sua dis-
tância relativamente ao tipo de cognoscibilidade que o presente tem para nós, então torna-se
evidente que há uma forma de preservar a intuição de que o passado e o futuro são irreais no
contexto relativista.
Quando considerámos os fundamentos da teoria da relatividade, vimos que ela se baseava
num exame crítico do conhecimento de acontecimentos muito afastados de nós no espaço. Esse
exame encontra-se no argumento crítico em que se baseou a crítica original de Einstein à noção
intuitiva de simultaneidade com respeito a acontecimentos distantes. Seguir as sugestões dos
comentários acima realizados sugere uma leitura metafísica apropriada à relatividade para
quem deseja preservar a ideia de que o passado e o futuro são irreais. Ela destina-se a negar tan-
to a realidade de outros lugares como a de outros instantes, considerando-se que só o que coinci-
de com o nosso lugar-tempo enquanto observadores tem uma realidade genuína. É certo que
uma tal redução do real a um ponto no espaço-tempo é ainda pior que restringir a realidade ao
infinitamente pequeno instante de tempo do agora. Não é preciso dizer que não estou a defen-
der esta diminuição radical do que consideramos real. Afirmo, contudo, que as razões e intui-
ções que estão por detrás da anterior atitude irrealista relativamente ao passado e ao futuro não
podem ser afastadas apenas por se apontar a relatividade das noções de passado e de futuro ao
estado de movimento de um observador num espaço-tempo relativista. O leitor interessado em
saber por que razão há quem defenda este irrealismo dramático antes de mais em relação ao
passado e ao futuro, e por que razão, num contexto relativista, pessoas aparentemente sãs po-
dem ser tentadas pelo irrealismo ainda mais radical em relação aos outros lugares, terá de pro-
curar obras que abordem estas questões mais em pormenor.

Substantivismo contra relacionismo

Um tópico muito mais prometedor é o do impacto das teorias da relatividade no debate en-
tre substantivistas e relacionistas que já aqui apresentei. Como veremos, há aqui múltiplas ques-
tões subtis e complexas. Mas, como veremos também, verifica-se mais uma vez que devemos
precaver-nos contra a tendência para inferir prematuramente uma perspectiva metafísica a par-
tir dos resultados da ciência. Vale a pena empreender a tarefa de tentar chegar a alguma conclu-
são filosófica em relação à existência e natureza do espaço e do tempo, examinando o que as

56
melhores teorias científicas disponíveis nos dizem sobre o espaço e o tempo, mas esta tarefa re-
quer uma dose saudável de prudência e cuidado filosóficos.
Os relacionistas negaram que devêssemos postular o espaço e o tempo enquanto entidades
autónomas, defendendo que tudo o que se podia postular eram as relações espaciais e tempo-
rais que os objectos materiais mantinham entre si. Depois do desenvolvimento da teoria da rela-
tividade restrita, afirmava-se com frequência que Einstein tinha finalmente realizado o progra-
ma relacionista leibniziano. Mas estas pretensões eram muito enganadoras. Apesar de a teoria
restrita nos dizer que algumas características do mundo que antes julgávamos absolutas são re-
almente relativas, isso não é de maneira nenhuma o mesmo que dizer que o relacionismo é cor-
recto. Na concepção de Newton do espaço e do tempo há uma separação espacial e temporal
definida, não relativa, entre quaisquer dois acontecimentos. Na teoria da relatividade, tais sepa-
rações só são relativas a uma escolha de um sistema de referência inercial, diferindo em função
do sistema escolhido. Mas essa relatividade não tem nada a ver com o problema de saber se, pa-
ra acomodar os fenómenos observáveis, temos ou não de postular o espaço e o tempo, ou o no-
vo espaço-tempo, enquanto estruturas que não se reduzem às características do mundo nem das
coisas materiais. Devemos também aqui notar de passagem que, embora a relatividade restrita
torne relativas algumas noções anteriormente não relativas, introduz novas características pró-
prias não relativas. O intervalo de separação no espaço-tempo entre acontecimentos é, na teoria
restrita, uma relação absoluta entre acontecimentos independente de qualquer observador, e o
mesmo sucede com o tempo próprio decorrido durante uma trajectória específica de um acon-
tecimento para outro no espaço-tempo.
Se era correcto o argumento de Newton, usado eficazmente por este contra Leibniz, a favor
de uma concepção substantivista do espaço-tempo, então a relatividade restrita parecia ser
também uma teoria que postulava um espaço-tempo substantivista. Como notámos, a distinção
entre sistemas inerciais em movimento genuinamente uniforme e sistemas absolutamente em
aceleração, tão importante no argumento newtoniano, mantém-se na teoria da relatividade res-
trita. Na nova teoria, os sistemas inerciais são aqueles que, tal como na teoria newtoniana, não
sofrem a acção de forças inerciais. Mas eles distinguem-se agora também por serem os estados
de movimento nos quais as experiências ópticas de ida e volta produzem os seus famosos resul-
tados nulos. A distinção entre estar ou não realmente em movimento de aceleração, que está no
centro do argumento newtoniano contra o relacionismo, mantém-se na teoria da relatividade
restrita.
Será que isto significa que se aceitarmos a teoria da relatividade restrita, teremos de aceitar a
posição metafísica do anti-relacionista newtoniano (obviamente, tendo como estrutura do espa-
ço-tempo substantivista o espaço-tempo de Minkowski no lugar do espaço absoluto newtonia-
no)? Precisaremos ainda de algo como o «próprio espaço-tempo», relativamente ao qual a acele-
ração absoluta seja aceleração, e cuja existência seja postulada enquanto parte da explicação da
existência de forças inerciais e dos efeitos ópticos que revelam a aceleração absoluta? Talvez,
mas uma vez mais seria precipitado saltar de uma teoria científica para uma conclusão metafísi-
ca sem mais considerações. Não poderemos encontrar uma maneira de reconciliar a relativida-
de restrita com uma concepção relacionista do espaço-tempo?
Talvez. Mas as questões filosóficas envolvidas são complexas, subtis e problemáticas. Há ar-
gumentos concebidos para mostrar que o programa substantivista de postular o espaço-tempo
enquanto entidade necessária para explicar a distinção entre movimentos que estejam absolu-
tamente em aceleração e movimentos que não estejam absolutamente em aceleração é imperfei-
to, e que as explicações oferecidas são ilegítimas. As forças inerciais e os efeitos ópticos da acele-
ração são explicados por meio da aceleração do laboratório relativamente aos «sistemas de refe-
rência inerciais» do próprio espaço-tempo, tomando estes o lugar do «próprio espaço» newtoni-
ano na relatividade restrita. Mas as próprias estruturas do espaço-tempo continuam, num certo
sentido, a ser imunes à observação directa, revelando-se apenas indirectamente por meio dos
efeitos causais do movimento em relação a elas. Não poderemos explicar tudo o que há para
explicar sem postular o próprio espaço-tempo?
Podemos explicar agora as diferenças nos efeitos inerciais sentidos em dois laboratórios por
meio da aceleração de um em relação ao outro. «Mas», diz o substantivista, «não se pode expli-
car por que razão num conjunto destes sistemas não se sentem quaisquer efeitos inerciais, sendo

57
esses efeitos sentidos apenas nos laboratórios em aceleração relativamente a esses laboratórios
preferidos. Eu», diz, «posso explicar por que razão se preferem esses sistemas: são os que não
estão em aceleração relativamente ao próprio espaço-tempo.» O relacionista pode contra-
argumentar afirmando que, embora não possa explicar por que razão um conjunto desses sis-
temas é preferencialmente inercial, pode simplesmente considerar isso «um facto bruto e básico
da natureza» que fica simplesmente por explicar. Afinal, poderá ele dizer, tem de haver alguns
factos brutos fundamentais. Então por que razão não hão-de ser estes? O relacionista defenderá
depois que em todo o caso o substantivismo precisa de factos brutos. Para o substantivista, é um
facto bruto da natureza que a aceleração relativamente às geodésicas inerciais do espaço-tempo
induz os efeitos inerciais. Por isso, sustenta o relacionista, o substantivista não está melhor em
termos explicativos que o relacionista, mas o primeiro tem de postular a misteriosa entidade o
«próprio espaço-tempo», que não desempenha qualquer função explicativa real. E, seguindo
Leibniz uma vez mais, o relacionista apresentará uma série de argumentos para mostrar que a
perspectiva substantivista postula outros factos, tais como os que dizem em que lugar-
acontecimento no espaço-tempo ocorre um acontecimento específico, que não têm quaisquer
consequências observáveis. Sendo assim, continua o relacionista, postular o próprio espaço-
tempo introduz «diferenças teóricas sem uma diferença na observação». Essas diferenças teóri-
cas eram um aspecto enigmático do próprio espaço newtoniano.
Há ainda muitos outros aspectos enigmáticos em ambos os lados envolvidos neste debate.
Na verdade, como em qualquer outro debate metafísico em filosofia, os próprios termos com
que se está a conduzir o debate são altamente problemáticos. Será que compreendemos real-
mente o que o substantivista defende que devemos postular de forma a explicar os fenómenos
observáveis? Compreenderemos realmente o que o relacionista nega e o que apresenta no seu
lugar? Poderemos compreender inteiramente, em particular, em que diferem as duas aborda-
gens? Direi alguma coisa sobre estas questões mais tarde.

A proposta de Mach e a relatividade geral

Por agora, regressemos à proposta de Mach que afirma ser possível, apesar de tudo, oferecer
uma explicação alternativa, aceitável em termos relacionistas, dos famosos efeitos inerciais. Não
poderíamos nós presumir que as forças inerciais, e agora também os efeitos ópticos inerciais,
resultavam da aceleração do dispositivo experimental não relativamente ao próprio espaço, ou,
no caso relativista, relativamente à estrutura geodésica inercial do espaço-tempo de Minkowski,
mas relativamente à matéria cósmica do universo? Afinal, na teoria do electromagnetismo es-
tamos familiarizados com forças magnéticas que dependem da velocidade que as partículas car-
regadas têm em relação umas às outras. Não poderá também haver forças dependentes da ace-
leração entre pedaços de matéria vulgar? Se estas forças dependerem muito pouco da separação
entre as coisas, mas dependerem muito das quantidades de matéria envolvida, não será possí-
vel explicar os efeitos inerciais como o resultado da aceleração do objecto experimental relati-
vamente àquilo que Mach chamou «estrelas fixas», e aquilo que diríamos agora que é a matéria
distante dos super-agregados de galáxias que compõem a matéria cósmica do universo?
Embora a relatividade restrita não forneça um contexto apropriado para as ideias de Mach,
talvez a relatividade geral seja mais promissora para esse efeito. Afinal, esta lida com a gravi-
dade — uma força de longo alcance. A gravidade newtoniana não podia fornecer, certamente, o
tipo de interacção de longo alcance e dependente da aceleração que Mach postulou ser respon-
sável pelos efeitos inerciais, mas talvez uma teoria de tipo machiano seja bem sucedida quando
a gravidade for reconciliada com a relatividade à maneira da nova teoria da gravidade do espa-
ço-tempo curvo. Na verdade, Einstein estava certamente motivado por tais esperanças quando
começou a investigação que o conduziu à teoria da relatividade geral.
Se Mach tivesse razão ao postular que os efeitos inerciais resultam da interacção do sistema
experimental com a restante matéria do universo, quais seriam algumas das consequências dis-
to? Considere-se, antes de mais, os primeiros comentários de Newton acerca do que aconteceria
num universo vazio. Do ponto de vista newtoniano, teria de existir uma distinção entre um ob-
jecto em rotação e um objecto que não estivesse em rotação, ainda que o objecto experimental
fosse o único objecto do universo. A rotação revelar-se-ia pelos efeitos inerciais no objecto expe-

58
rimental gerados pelo movimento absoluto. Mach duvida que devamos sequer pensar em uni-
versos vazios. O universo só nos é dado uma vez, diz Mach, «completo e com as estrelas fixas
intactas». Isto poderia querer dizer que não temos qualquer maneira de inferir o que aconteceria
num universo radicalmente diferente a partir do que observamos; ou poderia ser a tese mais
forte segundo a qual, como as leis da natureza não passam de resumos do que de facto ocorre
no mundo tal como é, não faz sentido falar do que ocorreria num universo radicalmente dife-
rente do actual. Seja como for, podemos certamente perguntar em relação a uma teoria como a
relatividade geral, que pode descrever a gravidade em muitos tipos diferentes de mundos pos-
síveis, se as suas previsões para um universo vazio, como o de Newton, conduziriam ainda à
distinção entre objectos em rotação absoluta e objectos que não estivessem em rotação, ou se es-
sa distinção desapareceria nesse mundo — sem se ter a matéria cósmica de Mach como o siste-
ma de referência para o movimento absoluto.
Seria de esperar que, num mundo machiano, os efeitos inerciais gerados num objecto expe-
rimental variassem caso a matéria do universo que circundasse o objecto fosse radicalmente
modificada, uma vez que os efeitos inerciais resultam da interacção do sistema experimental
com a matéria circundante. Será que a teoria da relatividade geral prevê isto? Não devia fazer
qualquer diferença falar de um objecto em rotação num mundo machiano sem que a matéria
circundante estivesse em rotação, ou falar, em vez disso, da matéria que descreve uma rotação
em torno do laboratório experimental, pois, segundo Mach, são apenas as acelerações relativas
do sistema experimental que determinam as forças inerciais detectadas. Será isto o que a relati-
vidade geral prevê? Por fim, se Mach tiver razão, tem de ser absurdo dizer que a própria maté-
ria do universo está em rotação absoluta. Se os efeitos da rotação no sistema experimental se
devem ao seu movimento relativamente à matéria cósmica, então deveria ser impossível existi-
rem efeitos devidos à rotação absoluta da própria matéria cósmica, uma vez que isso implicaria
a rotação desta matéria em relação a si própria, o que é absurdo. Que tem a teoria geral a dizer
acerca disto?
Algum do trabalho inicialmente realizado com a teoria da relatividade geral sugeriu que esta
tinha aspectos machianos. É certamente verdade que aquilo que um objecto experimental em
movimento de aceleração sofre dependerá da distribuição geral da matéria no universo, pois na
relatividade geral a aceleração absoluta é o desvio de movimento das geodésicas locais, curvas,
de tipo temporal do espaço-tempo. E, como a curvatura global do espaço-tempo está correlacio-
nada com a distribuição da matéria no espaço-tempo, mudar radicalmente a quantidade ou dis-
tribuição da matéria cósmica terá efeitos nas forças inerciais geradas pelo movimento local.
Uma vez mais, pode mostrar-se na relatividade geral que um objecto que está em repouso, mas
que está rodeado de matéria em rotação elevada, sofrerá a acção de forças semelhantes àquelas
que o objecto experimental teria sofrido caso tivesse sido colocado em rotação e a matéria cir-
cundante estivesse em repouso.
No entanto, se avançarmos mais, a teoria parece-se cada vez menos com o que Mach teria
desejado. Embora os efeitos inerciais sejam modificados por mudanças na distribuição da maté-
ria externa do mundo, tudo se passa como se houvesse um efeito inercial básico devido à rota-
ção absoluta, ao qual se acrescentam os novos efeitos modificadores. Por outras palavras, mes-
mo para um universo destituído de matéria externa, a relatividade geral prevê que haja uma
distinção entre estar e não estar em rotação absoluta. Tal como para descobrir o que é um cam-
po eléctrico não basta saber que cargas estão presentes, para determinar o que é o espaço-tempo
num mundo que esteja de acordo com a relatividade geral é preciso especificar condições de
fronteira para o espaço-tempo. O pressuposto habitual da relatividade geral, pelo menos para
universos abertos, é o de que o espaço-tempo distante da matéria é o espaço-tempo plano de
Minkowski. Um espaço-tempo razoável para um universo vazio seria então este espaço-tempo
plano de Minkowski da relatividade restrita. Mas, sendo assim, num tal mundo a anterior dis-
tinção newtoniana entre a rotação absoluta e a não rotação ainda se manteria. Na verdade, a re-
latividade geral admite espaços-tempos vazios ainda mais estranhos. A curvatura do espaço-
tempo tem a sua própria auto-energia gravitacional. Por isso, é possível que haja uma curvatura
diferente de zero num universo vazio, ou que haja regiões de espaço-tempo curvo cujo desvio
em relação à curvatura nula não se baseie em qualquer matéria, mas apenas na auto-energia da

59
região de espaço-tempo curvo. Logo, a ideia de Mach de que num mundo vazio não haveria
quaisquer efeitos inerciais não se mantém na relatividade geral.
Uma vez mais, embora a matéria que gira em torno de um objecto produza efeitos inerciais,
podemos considerar que a situação se afasta daquilo que Mach esperaria. Se um objecto expe-
rimental estiver rodeado por dois cilindros que girem um em relação ao outro e em relação ao
objecto experimental, o que nos acontece no laboratório dependerá não só da rotação relativa
envolvida, mas também de qual dos cilindros estiver «realmente em rotação», o que vai direc-
tamente contra as expectativas de Mach. O mais dramático de tudo foi a descoberta realizada
por Kurt Gödel de que há mundos possíveis consistentes com a relatividade geral em que toda
a matéria do universo está em rotação. As coisas não se passam como se essa matéria fosse uma
esfera rígida giratória, gigantesca e cósmica. Isso seria impossível em termos relativistas. Mas,
neste mundo, um observador colocado em qualquer ponto cujo laboratório estivesse em repou-
so relativamente à matéria cósmica poderia realizar uma experiência para mostrar a si próprio
que estava em rotação juntamente com toda essa matéria. Para cada observador, há um plano
especial. Se o observador disparar partículas livres ou raios luminosos ao longo desse plano,
eles seguirão trajectórias em espiral no sistema de referência fixo na matéria cósmica. Isto indica
que essa matéria está em rotação, tal como a trajectória de uma partícula que se mova em linha
recta a partir do centro num disco fonográfico que esteja em rotação num gira-discos irá marcar
uma ranhura em espiral no disco. Assim, é como se cada observador se pudesse considerar nu-
ma posição central relativamente à rotação da matéria cósmica. Para um machiano isto parece
absurdo, mas é uma possibilidade consistente com a relatividade geral, o que revela uma vez
mais os aspectos não machianos da teoria. (Veja-se a figura 2.10)

==========================================
INSERIR A FIGURA DA PÁGINA 79 COM A SEGUINTE LEGENDA:
Figura 2.10 A rotação absoluta da matéria no universo de Gödel. Numa solução para as equações da rela-
tividade geral descoberta por Gödel, é plausível dizer que a matéria distribuída uniformemente no univer-
so está em «rotação absoluta». O que significa isto? Em qualquer ponto há um plano com a seguinte carac-
terística: fixem-se as coordenadas x e y no plano de forma a ficarem em repouso relativamente à matéria
média do universo. Envie-se agora do ponto o uma partícula livre ou um feixe de luz, a. Nas coordenadas
em repouso na matéria, a partícula ou o feixe de luz irá traçar uma trajectória em espiral à medida que a
partícula ou o feixe de luz se afastar de o. Se presumirmos que as partículas livres e os feixes de luz se mo-
vem em linha recta relativamente a um sistema de referência «absoluto», tudo se passa «como se» a maté-
ria média estivesse em rotação relativamente a esse sistema.
==========================================

Há tentativas para tornar a relatividade geral mais machiana. Algumas das objecções a uma
interpretação machiana da relatividade geral baseiam-se no facto de a distribuição de matéria
nem sempre ser suficiente para determinar inteiramente a estrutura do espaço-tempo, não sen-
do por isso adequada para determinar inteiramente quais os efeitos de movimento inerciais que
existirão. Em universos que são sempre espacialmente fechados, contudo, há um vínculo mais
estreito entre a distribuição da matéria e a estrutura do espaço-tempo, de tal forma que só uma
estrutura do espaço-tempo é compatível com a distribuição completa de matéria. Assim, tem
sido proposto que a versão machiana da relatividade geral é aquela em que o espaço-tempo é
apropriadamente fechado. Mas entre isto e o relacionismo prático e determinado de Mach há
uma grande distância.

Ainda a relatividade geral e o debate entre substantivistas e relacionistas

Há aspectos na teoria do espaço-tempo da relatividade geral que nos fazem começar a pen-
sar se a distinção entre o relacionismo e o substantivismo, tal como estes foram tradicionalmen-
te entendidos, será ou não coerente. Notámos já que na relatividade geral o próprio espaço-
tempo tem massa-energia. Mas a massa-energia é o aspecto básico característico da matéria, tal
como a entendemos habitualmente. Se até a distinção entre a matéria e o próprio espaço-tempo
é problemática, poderemos ainda falar de «relações entre coisas materiais» em oposição ao
«próprio espaço-tempo»?

60
Mesmo antes de a teoria da relatividade geral ter colocado as questões que acabámos de dis-
cutir, já era claro que a distinção entre o substantivismo e o relacionismo, tal como era tradicio-
nalmente entendida, era suspeita. No final do século XIX, o conceito de «campo» tornou-se es-
sencial na física. Para lidar com os factos da electricidade e do magnetismo, por exemplo, tor-
nou-se necessário acrescentar aos elementos da natureza itens bastante diferentes das partículas
materiais próprias da física anterior. Entidades como o campo eléctrico são concebidas como al-
go que se estende por todo o espaço, tendo intensidades diferentes em pontos espaciais diferen-
tes. Têm uma evolução dinâmica ao longo do tempo. «Objectos» físicos como os campos são es-
senciais para normalizar as teorias físicas, mas é óbvio que são um tipo de coisa diferente dos
objectos materiais localizados pressupostos pelo relacionista. Em muitos aspectos são mais co-
mo o «próprio espaço» do substantivista do que como as partículas materiais comuns. Quando
vemos até que ponto tem de mudar a nossa concepção sobre o que há quando se admitem cam-
pos na imagem física do mundo, parece claro que a crise nos termos do debate entre substanti-
vistas e relacionistas começou logo com a introdução dos campos na física.
Se focarmos um aspecto diferente da relatividade geral, veremos outro modo de a existência
da teoria fundamental do espaço-tempo afectar o debate tradicional entre substantivistas e rela-
cionistas. O problema do determinismo na física é tremendamente complexo. O cientista do sé-
culo XVIII Pierre Simon de Laplace é famoso por ter afirmado que, dada a verdade da newtonia-
na imagem mecânica do mundo, a especificação do estado do mundo num certo instante de-
terminava o seu estado em todos os instantes futuros, porque as leis da natureza geravam a par-
tir desse estado todos os estados que se seguiam necessariamente em instantes posteriores. Mas
tudo o que diz respeito à questão de saber se Laplace tinha razão, se o mundo era realmente de-
terminista, torna-se complexo e problemático.
Antes de mais, há alguns problemas filosóficos. Como Russell fez notar, se deixarmos que a
noção de «estado do mundo» seja suficientemente ampla, e que a noção de «lei da natureza» se-
ja suficientemente flexível, o determinismo torna-se uma doutrina trivial, dado que, seja o
mundo como for, poderemos simplesmente considerar as leis como afirmações que dizem que
os estados actuais se seguem a outros. Suponhamos que temos uma maneira de evitar que o de-
terminismo se trivialize, exigindo que as leis genuínas obedeçam a algumas restrições mais for-
tes. A partir daí surgem muitos problemas científicos. Existem problemas com o determinismo
até na mecânica newtoniana. Se lidamos com partículas pontuais cuja força de interacção se tor-
na ilimitada à medida que as partículas se aproximam da separação nula, torna-se impossível
acompanhar os estados de uma maneira determinista por meio das colisões das partículas. Uma
vez mais, se especificamos o mundo num certo instante, o futuro pode ser influenciado por uma
partícula que «surge do infinito» depois desse instante, impedindo que o futuro seja determina-
do pelo estado completo do mundo no momento em questão.
Quando avançamos para a relatividade restrita e depois para a relatividade geral, os seus
novos espaços-tempos colocam questões muito mais complexas. Os estados do mundo «num
certo instante» são algo relativo na relatividade restrita. Na relatividade geral, até pode nem ser
possível segmentar o espaço-tempo do mundo em «espaços num certo instante», de tal forma
que a própria noção de estado do mundo em todo o lado num certo instante pode deixar de fa-
zer sentido. O padrão das possíveis influências causais é, obviamente, mais complexo nestas te-
orias do que nas teorias newtonianas, e a complexidade da estrutura causal conduz aos proble-
mas matemáticos importantes e interessantes de tentar indicar que mundos são deterministas
nos diversos sentidos que se pode dar ao termo. Na relatividade geral, a possibilidade (e, mui-
tas vezes, a inevitabilidade) das singularidades do espaço-tempo levanta outro problema. O Big
Bang com que começou o nosso universo de espaço-tempo (se é que houve Big Bang) é uma
dessas singularidades, e o mesmo sucede com o centro dos chamados «buracos negros». Estas
singularidades são pontos do espaço-tempo onde a curvatura se torna infinita. A sua presença
num espaço-tempo torna impossível prever por meio delas estados posteriores do mundo a par-
tir de estados anteriores. Introduzem assim uma forma de indeterminismo na imagem do mun-
do.
A própria conexão entre determinismo e previsibilidade, que para Laplace significavam
quase o mesmo, também é problemática. Será que dizer que o mundo é determinista implica
que ele seja previsível, pelo menos em princípio? Muitos especialistas defenderam que tal im-

61
plicação não se verifica. Afinal, o determinismo diz que o estado do mundo num certo instante
fixa, por meio das leis da natureza, estados de outros instantes. Mas se não pudermos conhecer
o estado completo do mundo num certo instante, sendo esse um princípio fundamental, então o
mundo pode ser determinista, mas não previsível. O espaço-tempo de Minkowski tem esta na-
tureza. O estado completo do mundo num espaço (relativo a um sistema inercial) pode muito
bem fixar o estado do mundo em espaços posteriores. Mas, para qualquer observador dado, é
possível que ele nunca venha a poder acumular a informação sobre o estado do mundo em
qualquer totalidade de espaço-num-certo-instante, pois a informação que ele obtém é a que o
pode alcançar causalmente a partir do passado, e isto restringe-se àquilo que se situa no interior
do seu cone de luz do passado. Por outras palavras, ele só pode obter informação acerca de
acontecimentos do passado que possam estar conectados a si no presente por meio de sinais
causais do passado. Por esta razão — e, como veremos, também por outras —, é ingénuo identi-
ficar precipitadamente o determinismo com a previsibilidade. Contudo, se o determinismo e a
previsibilidade estão inteiramente desvinculados, torna-se difícil resolver o problema levantado
por Russell de encontrar uma maneira de restringir o que pode contar como estado e como lei,
de forma a que a questão do determinismo não se reduza a uma trivialidade.
No Capítulo 3 voltaremos ao tema do determinismo. Aí veremos como o facto de o desen-
volvimento de um sistema ser sensível às suas condições iniciais exactas levou alguns especia-
listas a negar o determinismo. Que tipo de mundo determinista será este se mesmo uma mu-
dança infinitésima no estado inicial de um sistema pode conduzir a vastas mudanças no seu de-
senvolvimento futuro? No Capítulo 4, exploraremos algumas das questões do determinismo e
do indeterminismo que se levantam no contexto ainda mais radical da mecânica quântica. Aí
veremos por que razão há quem defenda que, se a mecânica quântica descreve realmente o
mundo, o determinismo tem de ser radicalmente falso.
Mas, por agora, quero concentrar-me num argumento acerca do determinismo na teoria da
relatividade geral, um argumento concebido para apoiar uma versão de relacionismo leibnizia-
no por meio da afirmação de que, se interpretarmos a relatividade geral de uma forma inteira-
mente substantivista, teremos de considerá-la uma teoria indeterminista — cujo indeterminismo
é surpreendentemente peculiar. Alguns dos argumentos mais significativos de Leibniz contra o
substantivismo baseavam-se na suposição de que cada ponto do espaço era como todos os ou-
tros, e de que cada direcção no espaço era como todas as outras. Por isso, se o mundo material
fosse retirado do espaço onde está actualmente, ele seria qualitativamente idêntico àquilo que é
agora. Não haveria qualquer razão suficiente para ele estar num certo lugar do espaço e não
noutro. E o mundo pareceria exactamente o mesmo para qualquer observador, independente-
mente do lugar do espaço onde estivesse o mundo material.
Isto já não é verdade na relatividade geral, uma vez que o espaço-tempo pode ter uma estru-
tura que varie consoante o lugar e o instante. Deslocar a matéria comum ao longo do espaço-
tempo fará uma grande diferença num mundo onde a curvatura (o campo gravitacional) varia
consoante a localização no espaço-tempo. Mas é possível reconstruir um argumento parecido
com o de Leibniz no qual a deslocação da matéria ao longo do espaço-tempo seja acompanhada
por uma deslocação compensatória na própria estrutura do espaço-tempo.
Um problema levantado por Einstein, conhecido por «problema do buraco», é uma conse-
quência disto. Suponha-se que uma pequena região do espaço-tempo não tem matéria. Supo-
nha-se também que a distribuição da matéria e a estrutura do espaço-tempo fora desta região
são arbitrárias. Nesse caso, as estruturas do espaço-tempo que parecem ser distintas umas das
outras no buraco são igualmente compatíveis, segundo as leis da relatividade geral, com a ine-
xistência de matéria no buraco e com a distribuição de matéria e o espaço-tempo que lhe é exte-
rior. Há uma forma de interpretar este resultado que tenta justificá-lo afirmando que ele se limi-
ta a dizer que se pode descrever a estrutura no buraco por meio de sistemas alternativos de co-
ordenadas. Mas se considerarmos seriamente as localizações dos pontos no espaço-tempo, que
sem dúvida fazem parte da interpretação substantivista da teoria, há uma maneira de interpre-
tar este resultado segundo a qual, por muito pequeno que seja o buraco, há nele estruturas de
espaço-tempo genuinamente diferentes que são compatíveis com o espaço-tempo e a estrutura
da matéria circundantes. Alega-se que este é o novo tipo de indeterminismo que se impõe a
quem se prende à interpretação substantivista da nova teoria do espaço-tempo.

62
É evidente que a discussão não está concluída. Temos um longo caminho a percorrer até
percebermos quais são os muitos tópicos de discussão que separam os substantivistas e os rela-
cionistas de vários tipos. E temos também de compreender melhor muitos aspectos das teorias
físicas correntes do espaço-tempo. Enquanto os aspectos filosófico e físico das questões não se
tornarem mais claros e precisos, será impossível dizer qual é a interpretação metafísica que me-
lhor se adequa ao que a física corrente nos diz acerca do espaço e do tempo. Aqui, as questões
são importantes, já que os argumentos teóricos subjacentes à crítica ao substantivismo e à defesa
do relacionismo, assim como à oposição dos substantivistas a esses argumentos, são usados de
formas semelhantes noutros debates filosóficos.

Relações de espaço-tempo e relações causais

Temos estado a explorar o debate entre quem considera o espaço-tempo como uma entidade
fundamental do mundo e quem considera que só as relações espácio-temporais entre as coisas e
os acontecimentos materiais constituem a realidade espácio-temporal do mundo. Outro grupo
de questões importantes relacionadas com a natureza da realidade espácio-temporal centra-se
na relação entre os aspectos espácio-temporais e os aspectos causais do mundo. Existe uma es-
trutura causal entre os acontecimentos do mundo. Alguns acontecimentos causam outros, ou,
pelo menos, são causas parciais de outros, pois só com outros acontecimentos são suficientes
para causar o acontecimento produzido. Há relações profundas e importantes entre o que con-
sideramos ser a estrutura espácio-temporal do mundo e o que consideramos ser a estrutura
causal dos acontecimentos. Apercebemo-nos da existência destas relações muito antes da des-
coberta das teorias relativistas, mas tornaram-se bastante importantes quando a atenção dos fi-
lósofos se dirigiu para as questões que dizem respeito àquilo que as teorias relativistas nos di-
zem acerca da natureza do mundo. Um grupo de teses que nos dizem que a estrutura causal
dos acontecimentos é a sua estrutura real, a estrutura física mais fundamental que constitui a
realidade, tem um importância especial. Segundo estas teses, as relações espácio-temporais só
são reais na medida em que podem ser reduzidas a relações causais ou na medida em que po-
dem ser definidas por meio delas. Essas teses são complexas e subtis.
Talvez tenha sido Leibniz quem estabeleceu a primeira conexão deste tipo entre noções cau-
sais e noções espácio-temporais. Suponhamos que certos acontecimentos causam outros por
meio de sinais enviados ao longo de uma trajectória de espaço-tempo contínuo que vai de um
acontecimento anterior a um acontecimento posterior. Suponhamos, como fizemos antes da re-
latividade, que estes sinais podem viajar a qualquer velocidade que queiramos, desde que essa
velocidade seja finita. Nestas circunstâncias, qualquer acontecimento está possivelmente conec-
tado a qualquer outro acontecimento por meio de um sinal causal, a não ser que os dois aconte-
cimentos ocorram exactamente ao mesmo tempo. Não poderemos assim «definir» a noção de «x
é simultâneo com y» por meio da noção «x não é causalmente susceptível de ser conectado com
y»? Na verdade, não poderemos nós dizer que afirmar que um acontecimento é simultâneo com
outro significa que os dois acontecimentos não são causalmente conectáveis entre si?
Consideremos agora o que acontece na teoria da relatividade. Como há uma velocidade má-
xima de propagação de um sinal causal, a velocidade da luz no vácuo, haverão muitos aconte-
cimentos que serão causalmente conectáveis entre si (e que, por isso, obviamente não são simul-
tâneos), mas que estão no domínio daquilo que não é causalmente susceptível de ser conectado
com um certo acontecimento. Parece assim que neste caso não podemos definir «x é simultâneo
com y» como «x não é causalmente susceptível de ser conectado com y», e temos de usar outro
método, como o que Einstein escolheu, usando sinais reflectidos de luz e relógios. É fácil afir-
mar a partir daqui que, uma vez que a simultaneidade não pode ser causalmente definida como
«não ser causalmente susceptível de ser conectado», a simultaneidade não é uma relação real na
relatividade, mas uma questão de mera convenção ou estipulação.
Para ver como esta afirmação pode ser problemática, temos de olhar para algumas descober-
tas do matemático Robb realizadas pouco depois de Einstein ter descoberto a relatividade. Robb
foi capaz de mostrar que há uma relação, definível em termos apenas da noção de conectibili-
dade causal, que se verifica entre acontecimentos no espaço-tempo da relatividade restrita se, e
só se, esses acontecimentos forem simultâneos de acordo com a definição de simultaneidade

63
dada por Einstein. Sendo assim, «no mesmo instante» é causalmente definível, embora a relação
causal que define a simultaneidade seja mais complexa do que a simples noção intuitiva, usada
por Leibniz, de algo não ser causalmente susceptível de ser conectado. Na verdade, Robb foi
capaz de ir muito mais longe e mostrou que noções como as de separação espacial e separação
temporal (relativas a um observador) podem também ser definidas por meio da mesma noção
de conectibilidade causal. (Na verdade, Robb usou a noção de «depois» para a sua definição,
significando isso «absolutamente depois» no sentido relativista, mas podemos reconstruir o seu
trabalho usando a noção temporalmente simétrica de conectibilidade causal.)
Será que isto significa que a simultaneidade e as outras noções métricas da relatividade são
reais, e não convencionais, por serem redutíveis a noções causais? Uma vez mais, as coisas não
são assim tão simples. Suponha-se que passamos para o contexto da relatividade geral, onde
diversos espaços-tempos são possíveis — e não apenas o espaço-tempo da relatividade restrita.
Em alguns desses mundos, não são verdadeiros vários dos postulados usados por Robb acerca
da estrutura das relações causais entre os acontecimentos. Em tais mundos, é óbvio que as defi-
nições de Robb das relações métricas do espaço-tempo em termos de relações causais não po-
dem manter-se. Mesmo quando os postulados de Robb ainda se mantêm, as suas definições po-
dem fracassar. Há espaços-tempos permitidos pela relatividade geral em que todos os postula-
dos de Robb acerca da conectibilidade causal se mantêm, mas são tais que, se alguém usasse as
definições de Robb das quantidades métricas (como a simultaneidade e a separação espacial e
temporal), atribuiria valores a essas quantidades que difeririam dos valores atribuídos pela teo-
ria da relatividade geral. Os valores atribuídos usando as definições de Robb difeririam dos va-
lores que se obteriam, por exemplo, com fitas métricas, relógios e sinais de luz reflectidos usa-
dos da maneira relativista habitual.
Parece que o que realmente se passa aqui é o seguinte: é verdade que no espaço-tempo da
teoria da relatividade restrita coincidem diversas noções métricas com noções definíveis usando
apenas a conectibilidade causal. Mas parece ser muito mais duvidoso afirmar que este facto
mostra que as noções métricas espácio-temporais se reduzem de alguma maneira às noções
causais ou que são susceptíveis de serem definidas por meio delas. Uma analogia pode tornar
isto mais claro. Imagine-se um mundo em que se verifica (ou por acidente ou como resultado de
uma lei da natureza) que todas as coisas azuis são quadradas e que todas as coisas quadradas
são azuis. Isto, por si mesmo, não implica que a propriedade de ser azul se reduza à proprieda-
de de ser quadrado ou que seja definível por meio dela, ou vice-versa.
No entanto, parece haver algo que apoia a ideia de que, embora o facto de os acontecimentos
serem ou não causalmente conectáveis seja um facto bruto da natureza, a escolha dos aconteci-
mentos considerados simultâneos na teoria da relatividade parece conter um elemento de arbi-
trariedade ou convencionalidade. Poderemos obter mais alguma ideia perspicaz acerca das in-
tuições que estão por detrás disto?
O que temos até agora é o seguinte: na física pré-relativista há uma associação natural entre
uma noção causal (conectibilidade não causal mútua) e a noção espácio-temporal de simulta-
neidade. Há quem seja levado a defender que a relação real que há no mundo é a relação causal,
e que a simultaneidade é redutível à relação causal ou definível por meio dela. Quando passa-
mos para a teoria da relatividade restrita, esta associação natural entre relações causais e rela-
ções espácio-temporais sucumbe, o que leva alguns especialistas a afirmar que a relatividade
mostra que a simultaneidade é meramente convencional ou estipulativa. Os resultados de Robb
mostram que não só a simultaneidade, mas também todas as noções métricas do espaço-tempo
da relatividade restrita, podem ser definidas em termos causais. Isto leva alguns especialistas a
afirmar que elas são não convencionais. Mas se pensarmos melhor percebemos que as defini-
ções causais de Robb são peculiares. As associações que utilizam não são tão naturais como as
de tipo leibniziano. No contexto da relatividade geral, estas associações sucumbem, geralmente.
Os axiomas de Robb não se conseguem manter na maior parte dos casos e, mesmo quando se
mantêm, as relações métricas, tal como Robb as define, estão frequentemente em desacordo com
as relações métricas canónicas. Que podemos inferir a partir de tudo isto?

64
Topologia e estrutura causal

Antes de responder a esta questão, exploremos uma série de argumentos muito semelhantes
que têm lugar no contexto da relatividade geral; esta série de argumentos lida uma vez mais
com o grau com que se pode dar uma definição causal de uma relação espácio-temporal, e com
as alegadas consequências filosóficas da existência ou inexistência de tais definições causais. No
estudo da relatividade geral, cedo se compreendeu que dois espaços-tempos metricamente dis-
tintos podiam ter a mesma estrutura causal. Isto é, embora as relações métricas de espaço-
tempo entre os acontecimentos dos diversos mundos tivesse uma estrutura bastante diferente, a
estrutura das relações causais entre os acontecimentos poderia ser a mesma. Qualquer esperan-
ça de obter uma definição causal da métrica estava assim afastada. Para determinar completa-
mente a estrutura métrica de um espaço-tempo, teríamos de acrescentar algo à estrutura causal.
Isso poderia ser a estrutura métrica espacial, tal como é determinada por fitas métricas, ou a es-
trutura métrica temporal, tal como é determinada por relógios ideais. Mais tarde constatou-se
que especificar a estrutura causal e as trajectórias percorridas por partículas materiais livres
ideais (isto é, partículas sobre as quais só a gravidade actue) determinava completamente a es-
trutura métrica. Mas as relações causais não chegavam para isso.

==========================================
INSERIR A FIGURA DA PÁGINA 86 COM A SEGUINTE LEGENDA:
Figura 2.11 Espaços-tempos causalmente patológicos. No espaço-tempo com círculos causais fechados —
ilustrado em (a) — um sinal causal pode deixar um acontecimento o e prosseguir para o futuro. Seguindo
o sinal, sempre para o «futuro local», traçamos uma trajectória que regressa ao acontecimento de origem, o.
Mesmo que não tenha um destes círculos causais fechados, um espaço-tempo pode ser bastante «patológi-
co» causalmente. Isto é ilustrado em (b). Embora nenhum sinal vindo de o possa «regressar» ao próprio o,
ainda assim pode verificar-se o seguinte: em qualquer região do espaço-tempo que circunde o, não importa
quão pequena esta seja, um sinal que parta de o e deixe uma região, e, pode acabar por regressar a e, re-
gressando assim a uma área «arbitrariamente próxima» do acontecimento de origem o.
==========================================

A topologia de um espaço-tempo constitui uma estrutura muito mais fraca que a sua métrica.
Dois espaços-tempos podem ser topologicamente análogos, isto é, podem ser análogos com res-
peito a tudo o que se relacione com a continuidade no espaço-tempo, e no entanto ser metrica-
mente bastante distintos. Pode-se pensar intuitivamente nas características topológicas de um
espaço como aquelas características que se preservam sob qualquer deformação do espaço que
mantenha intactas as propriedades da continuidade. O espaço pode ser deformado de qualquer
maneira que a sua topologia se manterá igual desde que nenhum «corte» separe pontos que es-
tavam originalmente «juntos uns aos outros» e desde que nenhum «colagem» junte pontos pre-
viamente separados. Será que as estruturas de continuidade primitivas do espaço-tempo, des-
critas pela topologia, são definíveis causalmente mesmo que a totalidade da estrutura métrica
não o seja? A resposta é fascinante, embora seja um pouco complexa. Se tomarmos «o aconteci-
mento x é susceptível de ser causalmente conectado com o acontecimento y» como a nossa no-
ção causal básica, então a topologia poderá por vezes ser definida por meio da conectibilidade
causal, mas acontecerá só em espaços-tempos «causalmente bem-comportados» e não em espa-
ços-tempos «causalmente patológicos». O que é um espaço-tempo causalmente patológico? Ba-
sicamente, é qualquer espaço-tempo onde haja uma curva causal fechada ou onde uma mudan-
ça infinitesimal no espaço-tempo possa gerar uma dessas curvas. Tais trajectórias constituem
sequências de acontecimentos causalmente conectados que «dão uma volta completa em torno
do tempo» para regressar, ou quase regressar, ao acontecimento inicial. Só em mundos com um
grau especificado de bom comportamento causal é que a conectibilidade causal pode ser sufici-
ente para especificar a topologia. Isto revela-se de um modo particularmente pungente em cer-
tos espaços-tempos patológicos onde a topologia não é trivial (alguns acontecimentos estão
«perto» de outros acontecimentos e outros não), mas onde todos os acontecimentos são causal-
mente conectáveis entre si. (Vejam-se as figuras 2.11 e 2.12)

==========================================
INSERIR A FIGURA DA PÁGINA 87 COM A SEGUINTE LEGENDA:
65
Figura 2.12 Um universo «fechado no tempo». Considere-se o habitual espaço-tempo de Minkowski da
relatividade restrita e «dividamo-lo» em duas linhas de simultaneidade relativas a um certo observador,
ficando uma dessas linhas no instante t0 e a outra no instante t0 + t. No diagrama, t representa a direcção
do tempo e x a direcção do espaço. «Identifiquemos» depois as duas extremidades desta porção de espaço-
tempo de Minkowski, e enrolemo-lo de modo a formar um cilindro. O resultado é um espaço-tempo que
está «fechado no tempo», mas que se estende para o infinito espacial. Naturalmente, um tal espaço é muito
artificial. Ninguém o considera um modelo possível do verdadeiro espaço-tempo do mundo. Mas a sua
consistência com as equações que regem a teoria do espaço-tempo sugere que possam muito bem existir
modelos mais realistas do universo que contenham círculos causais fechados, como acontece neste espaço-
tempo patológico.
==========================================

A situação não é assim muito diferente da que vimos antes. Só em alguns casos é que a no-
ção causal especificada será adequada para definir as relações de espaço-tempo desejadas. Nou-
tros casos não se pode encontrar a definição. Mas a situação é ainda mais complicada. Temos
vindo a tomar como noção causal — à qual se têm de reduzir as noções que dizem respeito ao
espaço-tempo — a relação que um acontecimento mantém com outro quando eles são causal-
mente conectáveis. Uma noção causal mais rica é a de uma trajectória no espaço-tempo que seja
uma trajectória causal contínua. Se imaginarmos uma partícula pontual (ou uma partícula de
luz) que viaje de um ponto para outro no espaço-tempo, a trajectória seguida é uma dessas tra-
jectórias causais contínuas. O resultado é importante e pode ser formulado da seguinte maneira:
se dois espaços-tempos forem exactamente iguais na sua estrutura de trajectórias causais contí-
nuas, então serão exactamente iguais na sua topologia, pelo menos se considerarmos apenas os
tipos canónicos de topologias (as chamadas «topologias das variedades»). A noção de conectibi-
lidade causal diz apenas que dois acontecimentos são conectáveis por uma ou outra trajectória
causal contínua. Esta nova noção causal exige que se especifique com exactidão os fragmentos
de trajectórias no espaço-tempo que são genuinamente as trajectórias causais contínuas. O resul-
tado diz-nos que todos os factos topológicos acerca do espaço-tempo ficam completamente de-
terminados logo que se determine quais são as colecções de acontecimentos no espaço-tempo
que constituem trajectórias contínuas de propagação causal, ou melhor, que isto é verdade se só
tivermos em consideração as topologias triviais. Aqui temos então um resultado positivo na re-
latividade geral sobre a definibilidade da topologia (pelo menos) unicamente em termos de fac-
tos causais.

Serão as características do espaço-tempo


redutíveis a características causais?

Mas como serão todos estes resultados relevantes para a nossa ideia inicial de que os factos
causais que relacionam os acontecimentos entre si são os factos reais ou observáveis acerca da
estrutura do mundo? Recordemos que o defensor da causalidade queria defender a tese segun-
do a qual, na medida em que os factos do espaço-tempo eram factos brutos, eles eram redutíveis
a factos causais, e na medida em que os factos do espaço-tempo não eram redutíveis a factos
causais, não eram de maneira alguma factos reais, mas apenas o resultado de uma escolha con-
vencional ou de uma estipulação da nossa parte.
As questões que aqui se colocam são controversas, mas seja-me permitido esboçar uma res-
posta a estas afirmações. Uma abordagem para compreender a motivação intuitiva que está por
trás das teorias causais sobre as características do espaço-tempo centra-se na questão epistemo-
lógica de saber como acabamos por conhecer o espaço-tempo do mundo. Aqui, tal como discu-
timos antes, defende-se por vezes que as características a que podemos ter acesso por meio de
um processo directo de inspecção são aquelas que temos de considerar como factos genuínos
acerca do mundo do espaço-tempo. Outras características, que podemos atribuir ao espaço-
tempo apenas ao escolher uma hipótese acerca da estrutura do espaço-tempo que não é direc-
tamente susceptível de ser testada, são consideradas nesta concepção como uma questão de
convenção, uma vez que não há factos observáveis, susceptíveis de inspecção directa, que façam
por nós a escolha da hipótese correcta. Tanto na versão inicial de Leibniz como nas versões rela-
tivistas modernas das teorias causais do espaço-tempo, presume-se que a influência causal se
propaga ao longo das trajectórias contínuas no espaço-tempo susceptíveis de serem percorridas

66
por uma coisa material como uma partícula. É óbvio que para Leibniz qualquer trajectória de
espaço-tempo dirigido para o futuro é susceptível de ser percorrida; nas versões relativistas
apenas aquelas trajectórias que representem uma velocidade inferior ou igual à da luz podem
ser percorridas. Mas se uma partícula pode percorrer uma tal trajectória, também, em princípio,
um observador o poderá fazer.
Alguém poderá então argumentar da seguinte maneira: as características de um espaço-
tempo que podem ser determinadas num único ponto do espaço-tempo, como a simultaneidade
relativa a acontecimentos que decorrem no mesmo lugar, podem ser directamente determina-
das por nós por meio da observação. Por isso, elas constituem factos brutos acerca do espaço-
tempo. Os factos acerca da continuidade de trajectórias causais, isto é, que são tais que um ob-
servador pode mover-se ao longo da trajectória e inspeccionar directamente as suas proprieda-
des de continuidade, também são, em princípio, acessíveis pela observação. É por esta razão
que, na relatividade restrita, devemos tomar a simultaneidade num certo ponto como um facto
bruto, mas devemos tomar como questões de convenção a simultaneidade com respeito a acon-
tecimentos separados e outras características métricas que não sejam como pontos. Uma vez
mais, deve-se considerar a continuidade ao longo das trajectórias causais como um facto bruto.
Qualquer outro facto topológico deve ser ou reduzido a estes factos ou considerado convencio-
nal. É por isso que é importante mostrar que a continuidade das trajectórias causais determina
inteiramente a topologia na relatividade geral. Só então podemos estar certos de que todos os
factos topológicos são factos brutos (pois eles são inteiramente determinados por factos topoló-
gicos directamente acessíveis).
Se interpretarmos desta maneira as teorias causais das características do espaço-tempo, po-
deremos ver que chamar-lhes «teorias causais» é um pouco enganador. Para Robb, a conectibi-
lidade causal (sob forma da relação «depois») era a única relação legítima para fundar as carac-
terísticas métricas de um espaço-tempo da relatividade restrita. Para os defensores da causali-
dade da topologia do espaço-tempo, a continuidade ao longo das trajectórias causais é a única
característica do espaço-tempo legítima para fundar todos os factos topológicos. Mas estas ca-
racterísticas causais básicas são assim privilegiadas não porque sejam factos sobre relações cau-
sais, isto é, factos sobre como os acontecimentos do mundo determinam, fazem surgir ou fazem
acontecer outros acontecimentos. Elas são privilegiadas porque são as características do espaço-
tempo que podemos determinar sem nos basearmos em hipóteses que, por não poderem ser
avaliadas por meio de um processo de inspecção directa, estão contaminadas por uma arbitrari-
edade que só pode ser resolvida com uma decisão arbitrária ou convencional.
Desta perspectiva, não são os factos causais, mas um subconjunto limitado de factos do es-
paço-tempo, que são fundamentais. A ordem do espaço-tempo não deve ser reduzida à ordem
causal ou definida por meio da ordem causal. Em vez disso, toda a estrutura do espaço-tempo
deve ser reduzida ao subconjunto limitado dos factos do espaço-tempo que estão genuinamente
abertos ao nosso acesso epistémico — ou definida por meio dele. Na verdade, neste ponto po-
der-se-á pensar nas tentativas de analisar a noção de causalidade conhecidas na filosofia. Ge-
ralmente, pensa-se que a própria causalidade está ligada ao espaço-tempo. Hume, por exemplo,
quando tentou dizer a que correspondia a causalidade, insistiu que a continuidade do espaço-
tempo era um elemento necessário para definir o processo causal. Afirmou que uma causa e um
efeito têm de ser «contíguos no espaço e no tempo». Obviamente, isto não é suficiente para ana-
lisar a relação causal. Tem de haver algo que constitua a determinação do efeito pela causa.
Mas, desta perspectiva, as características do espaço-tempo, pelo menos algumas delas, são pri-
mitivas e não são redutíveis à causalidade propriamente dita. Em vez disso, a causalidade tem
uma relação fundamental de espaço-tempo entre acontecimentos enquanto parte da sua análise.
O problema das inter-relações entre a causalidade e as características do espaço-tempo do
mundo dificilmente se revolve com os breves comentários anteriores. A nossa concepção do
mundo como algo que existe no espaço e no tempo, e a nossa concepção do mundo como algo
regido por um processo de acontecimentos que determinam outros acontecimentos, isto é, pela
causalidade, são duas das concepções mais amplas e profundas que temos acerca do mundo. O
modo como estes dois aspectos fundamentais do mundo se relacionam, e o modo como depen-
dem um do outro para que signifiquem qualquer coisa e para que sejam inteligíveis, são ques-
tões em aberto para uma exploração filosófica aturada.

67
No capítulo 3, abordaremos uma questão relacionada com as que acabámos de discutir. Aí
veremos como alguns cientistas e filósofos relacionam uma característica especial do tempo, a
sua assimetria (no sentido em que o passado e o futuro parecem radicalmente diferentes em
muitos aspectos), com outra assimetria fundamental do mundo, a tendência dos sistemas físicos
para passar de estados ordenados a estados desordenados. Por vezes, coloca-se erradamente na
categoria geral das «teorias causais da estrutura do espaço-tempo» a perspectiva de que a de-
sordem crescente do mundo é fundamental para as nossas ideias de assimetria do tempo e de
sistemas no tempo. A teoria em questão não é realmente uma teoria causal; é uma tese adicional
que visa mostrar que se pode reduzir parte da estrutura do espaço-tempo a um tipo diferente
de estrutura. Examinaremos de perto esta tese no capítulo 3.

Resumo

Acabámos de ver que o problema de saber que tipo de «ser» se deve atribuir ao espaço e ao
tempo tem uma história e um futuro ricos. As próprias questões metafísicas básicas têm uma
estrutura complexa que se desenvolveu ao longo de muito tempo. Continua inteiramente em
aberto a questão de saber se devemos ver o espaço, por exemplo, como uma substância que não
se reduz aos conteúdos materiais do mundo, como um conjunto de relações entre os objectos
materiais do mundo ou como algo diferente. Vimos também que a questão de saber se há algum
sentido no qual a espacialidade ou a temporalidade é redutível a algum outro aspecto do mun-
do, tal como o aspecto causal, está também por responder. E, mais importante que tudo, vimos
que cada avanço científico revolucionário na nossa compreensão do espaço e do tempo traz
consigo um novo contexto no qual os debates filosóficos têm lugar. Embora os resultados cientí-
ficos por si próprios não possam resolver inteiramente as questões metafísicas, qualquer trata-
mento filosófico adequado da natureza do espaço e do tempo tem de fazer inteira justiça a esses
feitos científicos.

Leituras complementares

Alguns dos livros que abrangem os tópicos tratados neste capítulo com maior pormenor e
profundidade são Reichenbach (1956), que é historicamente muito importante, e Grünbaum
(1973), que tem uma abrangência enciclopédica. Van Fraassen (1970) é muito útil porque apre-
senta o enquadramento histórico de muitas das questões importantes. Sklar (1974) é uma intro-
dução sistemática às questões principais e Sklar (1985) desenvolve diversos problemas. Fried-
man (1983) introduz o leitor ao vocabulário técnico da moderna física matemática do espaço e
do tempo, e investiga as controvérsias filosóficas em profundidade.
Smart (1964) contém excertos breves e importantes dos textos históricos principais. Jammer
(1954) é um breve levantamento histórico das concepções filosóficas do espaço. Alexander
(1956) contém o debate original entre Leibniz e o newtoniano Clarke sobre a natureza do espaço
e do tempo. Barbour (1989) é um levantamento conciso da história das ideias sobre o espaço, o
tempo e o movimento, que parte dos gregos antigos e passa por Galileu, Huyghens, Descartes,
Leibniz e Newton. Pode-se encontrar a teoria do espaço de Kant na parte 1 de Kant (1783) e na
«Estética Transcendental» de Kant (1787).
Há muitas introduções à teoria da relatividade restrita e ao seu espaço-tempo. Taylor e Whe-
eler (1963) é excelente, tal como Bohm (1989). Møller (1952), Synge (1956) e Rindler (1977) são
úteis. Toretti (1983) e Lucas e Hodgson (1990) têm uma orientação histórica e filosófica, tal como
Anderson (1967).
Há também inúmeras introduções à teoria da relatividade geral. Geroch (1978) fornece os
elementos básicos. Møller (1952), Rindler (1977), Anderson (1967) e Wald (1984) são clássicos.
Misner, Thorne e Wheeler (1973) é enciclopédico. Toretti (1983) é histórico e filosófico. Einstein
et al. (1923) contém os artigos originais deste campo traduzidos para inglês.
Para a história da epistemologia da geometria veja-se Toretti (1978). Os artigos originais de
Poincaré estão em Poincaré (1952). Eddington (1920) contém uma discussão estimulante que se

68
conta entre as primeiras. Reichenbach (1956) é um clássico do convencionalismo. Pode-se en-
contrar discussões gerais recentes em Sklar (1974) e Friedman (1983).
Um levantamento útil de questões filosóficas acerca do tempo encontra-se em Newton-Smith
(1980). Mellor (1981) é uma boa introdução às questões sobre tempo e tempos verbais. Para al-
guns aspectos da discussão acerca dos tempos verbais no contexto da relatividade restrita, veja-
se Rietdijk (1966), Putnam (1967), o capítulo 11 de Sklar (1985) e Stein (1991).
O tema do substantivismo versus relacionismo nas teorias do espaço-tempo é examinado
exaustivamente em Earman (1989). Trata-se a história do tema com grande pormenor em Bar-
bour (1989). Friedman (1983) e Nerlich (1976) oferecem argumentos a favor do substantivismo.
No capítulo 3 de Sklar (1974) apresenta-se uma discussão geral sobre estas questões. Em Graves
(1971) discute-se em pormenor a «geometrodinâmica» de uma perspectiva filosófica.
Uma discussão completa do determinismo encontra-se em Earman (1986). O papel do de-
terminismo no argumento do «buraco» na relatividade geral é tratado em Earman (1989). A es-
trutura da causalidade na relatividade geral é tratada (de um ponto de vista muito avançado)
em Hawking e Ellis (1973). Algumas reflexões filosóficas acerca das teorias causais do espaço-
tempo estão em van Fraassen (1970) e nos capítulos 9 e 10 de Sklar (1985). Para a teoria causal
de Robb sobre o espaço-tempo, veja-se Winnie (1977) para uma exposição e o capítulo 3 de Sklar
(1985) para uma crítica.

69
3
A introdução da probabilidade na física

A probabilidade e a explicação
estatística segundo os filósofos

Probabilidade: a teoria formal

É para nós muito vantajoso ter a capacidade de prever de modo fidedigno o que vai aconte-
cer no futuro. Em certos casos muito excepcionais, podemos prever que o futuro terá um e ape-
nas um resultado, o que acontece, por exemplo, quando prevemos a posição futura de um dos
planetas a partir da sua condição presente e das leis dinâmicas do movimento. Em muitos casos,
só temos uma ideia muito vaga do que o futuro nos irá trazer. Existe um conjunto especial de
casos em que não podemos dizer com segurança o resultado que irá ocorrer, de entre um con-
junto de resultados possíveis, mas em que podemos ter um conhecimento fidedigno da propor-
ção com que esses resultados ocorrerão num grande número de ensaios repetidos de um tipo
semelhante. Quem lança dois dados não sabe o que trará o próximo lançamento, mas sabe que
numa longa série de lançamentos o resultado 7 surgirá aproximadamente uma em cada seis ve-
zes. A investigação de situações como esta, tendo começado com a típica situação de jogo, teve
como resultado o desenvolvimento da teoria de probabilidades. A probabilidade de um resul-
tado foi vista como algo intimamente relacionado com a frequência com que se podia esperar
que esse resultado ocorresse num grande número de ensaios repetidos e idênticos de um certo
tipo especificado.
Construiu-se uma teoria matemática formal da probabilidade, que tem uma simplicidade e
uma elegância incomparáveis. Surpreendentemente, embora as suas ideias básicas já fossem co-
nhecidas há centenas de anos, só foi formalizada nos anos trinta do século XX. Define-se uma
colecção de resultados básicos — por exemplo, o número de resultados possíveis de um dado.
Atribui-se números de 0 a 1 a subcolecções da colecção de resultados básicos. Assim, atribuímos
à colecção que consiste exactamente em «sair o número 1» o número — isto é, a probabilida-
de — 1 6 . À colecção caracterizada por «sair um número par» atribuímos o número 1 2 . Ao resul-
tado vazio (não ocorrer nenhum dos resultados possíveis) é dada uma probabilidade de 0, e ao
resultado trivial (ocorrer qualquer um dos resultados possíveis) é dada uma probabilidade de 1.
O postulado mais importante é o da aditividade. Suponhamos que, se um resultado está na co-
lecção A, não pode estar na colecção B, e vice-versa. Então, considera-se que a probabilidade
atribuída ao resultado «A ou B» é a soma das probabilidades atribuídas a A e a B. Deste modo,
se não podemos ser simultaneamente alentejanos e beirões, a probabilidade de sermos de uma
das regiões é a soma da probabilidade de sermos alentejanos com a de sermos beirões.
Em circunstâncias comuns, estamos familiarizados com a situação em que o número de re-
sultados básicos possíveis é finito: o dado com seis faces, a roleta com trinta e sete casas, e assim
por diante. No entanto, o matemático e, como veremos, o físico, têm de lidar com casos em que
o número de resultados básicos é infinito. Por exemplo, um resultado básico pode ser uma par-
tícula pontual ter qualquer uma de um número infinito de posições possíveis numa caixa. Pres-
supõe-se, geralmente, uma generalização do postulado da aditividade, conhecida por «aditivi-
dade contável». Este pressuposto é natural, mas tem algumas consequências peculiares. Uma
das consequências é a de que a probabilidade 0 já não é atribuída apenas ao conjunto vazio em
que não ocorre nenhuma consequência básica, passando também a ser atribuída a conjuntos não
vazios. Por exemplo, se o jogo em que estamos envolvidos consistir em escolher um número
que esteja entre todos os números reais entre 0 e 1, a aditividade contável implica que a proba-
bilidade de obter um número racional, isto é, que pode ser representado como uma fracção de
70
dois números inteiros, é 0. No entanto, existe obviamente um número infinito desses números
racionais na colecção. A ideia é a de que existem «muitos mais» números reais não fraccionários
do que fracções. Assim, nestes contextos um acontecimento impossível tem uma probabilidade
0, mas nem todos os acontecimentos com probabilidade 0 são impossibilidades. E ter probabili-
dade 1 não significa que um acontecimento tenha necessariamente de ocorrer.
Uma noção importante na teoria da probabilidade é a de probabilidade condicional. Supo-
nhamos que sabemos que saiu um 7 no lançamento de dois dados. Qual é a probabilidade, dado
esse resultado, de num dos dados ter saído o 1? Bem, o 7 pode sair de seis maneiras, e só em
dois dos casos é que num dos dados sai o 1. Por isso, a probabilidade é 1 3 . A frequência previs-
ta de um tipo de resultado B, dada a ocorrência de um tipo de resultado A, é aproximadamente
a probabilidade de B sob a condição de A, ou a probabilidade condicional de B dado A. Se a
probabilidade de B, dado A, for apenas a probabilidade incondicional de B (e se a probabilidade
de A, dado B, for apenas a probabilidade de A), diz-se que A e B são probabilisticamente inde-
pendentes entre si. Considera-se habitualmente que dois lançamentos sucessivos de uma moeda
são independentes neste sentido. A probabilidade de sair caras no segundo lançamento conti-
nua a ser 1 2 : o resultado do primeiro lançamento é irrelevante para esta probabilidade. No en-
tanto, ser alentejano e ser do sul do país não são, certamente, independentes. A probabilidade
de uma pessoa ser alentejana dado ser do sul do país é certamente mais elevada que a probabi-
lidade de essa pessoa ser alentejana dada apenas o facto de ser portuguesa.
Pode demonstrar-se a partir dos postulados básicos de teoria de probabilidades um grupo
importante de teoremas conhecidos por «leis dos grandes números». Será que, num número re-
duzido de lançamentos de uma moeda, é de esperar que saiam caras metade das vezes? Se o
número de lançamentos for ímpar, isso não pode acontecer. Mesmo que o número de lançamen-
tos seja par, é de esperar que o resultado real divirja da proporção exacta de 1 2 , dada qualquer
sequência de lançamentos. No entanto, à medida que o número de lançamentos se tornar muito
elevado, é de esperar uma espécie de convergência da frequência das caras observadas em rela-
ção à probabilidade postulada de 1 2 . O que as leis dos grandes números nos dizem é que a pro-
babilidade de uma tal convergência (em vários sentidos de convergência, que pode ter diferen-
tes forças) aproxima-se de 1 (a «certeza probabilística») à medida que o número de lançamentos
tende para o infinito. Isto verifica-se se os ensaios forem probabilisticamente independentes en-
tre si. Deste modo, embora certamente não possamos demonstrar que, em qualquer sequência
de ensaios que tendam para o infinito, a frequência irá convergir para a probabilidade, pode-
mos demonstrar, dada a independência dos ensaios, que um tal resultado é uma certeza proba-
bilística.

Interpretações objectivistas da probabilidade

Uma coisa é termos um conjunto de axiomas formais da probabilidade (eles exibem algumas
variações, mas não levantam problemas de compreensão); outra coisa muito diferente é concor-
darmos sobre o que é a probabilidade. De que estamos a falar quando falamos de probabilida-
des? Dada a conexão íntima entre frequências de resultados no mundo e atribuições de probabi-
lidade, não seria mais simples identificar probabilidades com frequências relativas e efectivas
de ocorrências? Para acomodar os casos em que o número de resultados básicos não é finito mas
infinito, poderíamos querer generalizar e falar de proporções efectivas em vez de falar de fre-
quências efectivas, mas a ideia básica seria a mesma. No entanto, esta perspectiva simples en-
frenta a conhecida objecção de que não é de esperar que, em qualquer classe efectiva de experi-
ências, as frequências ou proporções efectivas sejam as probabilidades exactas. É de esperar
uma espécie de «centralização» dos resultados efectivos nos valores da probabilidade, mas não
a sua identidade.
Para obviar a isto, sugere-se frequentemente que devíamos identificar as probabilidades com
as frequências ou proporções relevantes «a longo prazo», isto é, à medida que o número de en-
saios tende para o infinito. Um dos problemas desta perspectiva é que, como é óbvio, o número
efectivo de ensaios é sempre finito. O que é esta peculiar e idealizada «sequência de ensaios que
tendem para infinito» na qual se deverão determinar as frequências? Será, supostamente, algo
efectivo ou, antes, uma espécie de idealização? E se é esta última, o que aconteceu à perspectiva

71
original das probabilidades como frequências ou proporções efectivas? Outra dificuldade com
esta perspectiva é que, mesmo a longo prazo, a conexão entre probabilidades e frequências é
meramente probabilística. As leis dos grandes números só são válidas quando os ensaios são
independentes entre si — e isso é uma noção probabilística. Pior ainda, a identidade entre fre-
quência e probabilidade, mesmo a longo prazo, só é assegurada «com probabilidade 1» e, como
fizemos notar, isso não significa que numa qualquer sequência infinita e efectiva de ensaios os
limites da frequência e probabilidade relativas tenha de ser idêntico.
Sugere-se muitas vezes uma conexão menos precisa entre probabilidades e frequências ou
proporções efectivas. Tome-se «probabilidade» como um termo não definido e as probabilida-
des como uma característica primitiva atribuída a sistemas físicos. De que característica se trata
é algo fixado pelo papel desempenhado pela probabilidade na nossa maneira de prever, contro-
lar e explicar acontecimentos. Temos, por exemplo, regras «ascendentes», que nos dizem como
inferir probabilidades atribuídas a partir de frequências e proporções observadas, e regras «des-
cendentes», que nos dizem, dada a atribuição de uma probabilidade a um fenómeno, com que
tipos de frequências e proporções podemos contar em ensaios finitos. Assim, em vez de identi-
ficar a probabilidade com uma proporção ou frequência efectivas, talvez devamos pensar que
tais frequências e proporções efectivas só especificam em que consiste a probabilidade dada a
sua conexão a outras probabilidades por meio destas regras de inferência ascendentes e descen-
dentes, regras que conectam frequências e proporções efectivas com probabilidades atribuídas.
Há a sugestão, entre outras, de olhar para todo o esquema de atribuições estatísticas e legi-
formes que conferimos ao mundo. Temos uma ampla e profunda estrutura hierárquica de gene-
ralizações — algumas legiformes e sem excepções, algumas de carácter estatístico e que usam
atribuições de probabilidade. Todas estas generalizações são sobre a ordem das conexões entre
os fenómenos do mundo. Talvez devamos conceber as probabilidades como essas atribuições
idealizadas de frequência e proporção que surgem nos postulados que desempenham um papel
fundamental nesta estrutura de generalizações. Seria então um erro conceber a probabilidade
como frequência num sentido ingénuo; a probabilidade é uma espécie de proporção simples
idealizada encarada como algo que representa a estrutura geral do mundo ao nível das genera-
lizações fundamentais. Pode propor-se vários esquemas diferentes para tentar tornar esta noção
de «proporção idealizada» um pouco menos vaga.
O objectivo de todas estas interpretações é atribuir probabilidades a um resultado de uma
classe de ensaios, quer seja a frequência ou proporção desse resultado, quer seja uma projecção
ou idealização disso. Outra interpretação objectivista da probabilidade olha, antes, para o pro-
cesso pelo qual as frequências exigidas seriam geradas. A probabilidade, de acordo com esta
perspectiva, é uma característica do objecto, ou do processo que envolve um objecto, em função
da qual um resultado pode ser produzido ou não. Tal como uma janela pode ser frágil apesar de
não estar partida, o lançamento de uma moeda, nesta perspectiva, tem uma disposição ou ten-
dência para exibir caras ou coroas, ainda que esta tendência não se efective em certos casos.
Descrever como 1 2 a probabilidade de sair caras no lançamento de uma moeda é atribuir ao
equipamento de lançamento ou à situação uma «propensão» para gerar caras metade das vezes,
caso se tente fazer um número elevado de lançamentos. Assim, a probabilidade, segundo esta
perspectiva, é o atributo de um único lançamento — a sua magnitude disposicional para origi-
nar um resultado de um género especificado.
Como veremos posteriormente neste capítulo e no seguinte, determinar o grau de probabili-
dade inerente a um acontecimento único, ao invés de ser apenas uma medida de uma classe de
resultados com respeito a uma classe de acontecimentos, irá envolver mais do que questões pu-
ramente filosóficas. Quero dizer com isto que envolve questões como a de saber se a perspectiva
disposicional pressupõe uma base de apoio frequencista e se essa perspectiva pode resolver as
dificuldades que encontramos nas outras perspectivas. Irão levantar-se também questões de fí-
sica, pois a questão de saber se as proporções que observamos no mundo são, num sentido in-
susceptível de ser reduzido, inerentes a acontecimentos únicos está intimamente relacionada
com a questão de saber se há, em todos os acontecimentos, condições suficientes que determi-
nem completamente que só um dos resultados possíveis irá efectivamente ocorrer. Será que po-
de haver casos em que subsista uma multiplicidade de resultados, ainda que se especifiquem
todas as condições (conhecidas, desconhecidas ou mesmo insusceptíveis de serem conhecidas)

72
que regulam o acontecimento? Esta é uma questão importante na mecânica quântica, como ve-
remos, na qual a questão dos parâmetros determinantes «ocultos» é importante.
Há uma outra área de problemas que tem de ser explorada por qualquer pessoa que deseje
compreender a probabilidade como uma característica objectiva do mundo. Trata-se do pro-
blema da aleatoriedade. Suponha que uma sequência de lançamentos de moedas tem o seguinte
aspecto: Cara, Coroa, Cara, Coroa, Cara, Coroa,…, etc. Deveremos dizer que numa tal sequência a
probabilidade de sair caras num dado lançamento é 1 2 ? Esta é, afinal, a frequência limitadora
na qual ocorre caras. No entanto, a ordem da sequência — uma ordem que nos permite dizer se
irá surgir cara ou coroa no próximo lançamento, dado o resultado do nosso último lançamen-
to — faz muita gente afirmar que seria enganador pensar que a probabilidade de sair caras num
dado lançamento é de 1 2 . Para que possamos realmente atribuir probabilidades, não deverí-
amos atribuir a caras a probabilidade 1 nos lançamentos ímpares e a probabilidade 0 nos lan-
çamentos pares? A probabilidade só é igual à frequência relativa limitadora, afirmam os defen-
sores desta perspectiva, numa sequência aleatória. Mas o que é exactamente uma sequência alea-
tória?
O estudo da aleatoriedade, do ponto de vista objectivista, conduziu a resultados interessan-
tes, ainda que não completamente conclusivos. Especialistas como von Mises e Church tenta-
ram definir a aleatoriedade como uma propriedade que existe quando as frequências de resul-
tados de uma sequência são iguais a qualquer subsequência derivada da sequência original por
qualquer processo «mecânico». Assim, a sequência anterior não é aleatória, pois a subsequência
de lançamentos ímpares pode ser mecanicamente seleccionada por um computador automático
apropriadamente programado. E a frequência de caras nessa sequência é 1 e não 1 2 . Pode dar-
se exactidão matemática ao conceito de uma sequência susceptível de ser mecanicamente selec-
cionada. No entanto, há sequências que são aleatórias neste sentido mas que não são, intuitiva-
mente, aleatórias, no sentido em que pode adoptar-se, com respeito a elas, estratégias de jogo
«desleais».
Uma proposta diferente para explicar a aleatoriedade objectiva apoia-se na intuição de que
«quase todas» as sequências deveriam ser aleatórias. Na colecção de todas as sequências, as se-
quências ordenadas deveriam ser esparsas, uma noção que podemos tornar formal exigindo
que uma sequência seja aleatória «com probabilidade 1». Procuramos assim definições de não
aleatoriedade que seleccionem, a partir de todas as sequências, uma colecção cuja probabilidade
seja 0. O problema básico com as definições que resultam quando seguimos esta intuição é que
elas perdem a conexão íntima com a noção intuitiva de aleatoriedade com que começámos.
Uma outra definição de aleatoriedade concebe um processo efectivo «universal» para testar a
não aleatoriedade e declara uma sequência como aleatória se passar este teste.
Uma quarta alternativa adopta uma estratégia altamente intuitiva. Considere-se um compu-
tador programado para gerar como dados de saída a sequência de resultados experimentais que
efectivamente ocorrem. Que tamanho terá de ter o mais pequeno programa que consiga fazê-lo?
É óbvio que há um programa que irá sempre funcionar: a instrução diz apenas «Imprimir…»,
em que «…» é a sequência em questão. Mas as sequências «não aleatórias» têm, intuitivamente,
programas mais curtos. Por exemplo, a sequência Cara, Coroa, Cara, Coroa,… pode ser dada sim-
plesmente como «Imprimir Cara e Coroa alternativamente». Assim, uma sequência será tanto
menos aleatória quanto mais pequeno puder ser o programa que lhe dá origem. Pode tornar-se
tudo isto formalmente respeitável. Mas o resultado não é exactamente o que o objectivista que-
ria porque, afinal, uma definição satisfatória parece pressupor, uma vez mais, que a sequência
seja previamente compreendida como algo gerado por um processo probabilístico. Isto torna
difícil usar a noção de aleatoriedade objectiva, definida deste modo, para servir, juntamente
com a noção de frequência de limitação relativa, como um meio para dizer o que é afinal a pro-
babilidade.

Interpretações subjectivistas da probabilidade

Uma compreensão da natureza da probabilidade radicalmente diferente de todas as perspec-


tivas objectivistas que vimos até agora concentra-se não no que está no mundo, mas antes no
que está em nós. Usamos a probabilidade como um guia da acção face ao risco, apostando num

73
dado resultado só se acharmos que as hipóteses de ganhar são suficientemente elevadas para
ultrapassar as nossas dúvidas sobre se o resultado irá efectivamente ocorrer. Assim, talvez de-
vamos conceber a probabilidade como uma medida do nosso grau de confiança na ocorrência de
um resultado, uma medida da «crença parcial» da nossa parte, se quisermos.
Suponha-se que as probabilidades são valores da crença parcial, no sentido em que são indi-
cadoras das hipóteses mínimas de ganhar perante as quais apostaremos num resultado. Nesse
caso, por que motivo deverão as nossas probabilidades obedecer às leis normais da teoria de
probabilidades? Que devem obedecer a estas leis é um resultado bastante trivial do ponto de
vista frequencista, mas o subjectivista tem necessidade de um argumento que o justifique. Fo-
ram concebidos alguns argumentos para mostrar que só se as nossas probabilidades obedece-
rem às regras normais é que seremos imunes à possibilidade de ficarmos numa situação em que
um corretor de apostas nos oferece hipóteses que aceitamos, apesar de estas garantirem perdas
da nossa parte, aconteça o que acontecer. Outra abordagem tenta mostrar que se as nossas pre-
ferências, reveladas pela nossa escolha de um bilhete em vez de outro, entre «bilhetes de lota-
ria» (ganhamos A se x ocorrer e B se x não ocorrer) forem racionais (no sentido em que se prefe-
rirmos o bilhete 1 em relação ao 2 e o 2 ao 3, preferiremos o 1 ao 3), será sempre possível repre-
sentar as nossas crenças parciais nos resultados de modo a que elas obedeçam aos axiomas
normais da probabilidade.
Logo, para o objectivista, as probabilidades são características do mundo à espera de serem
descobertas; para o «subjectivista», são graus de crença parcial do agente que guiam as suas
crenças e acções num mundo incerto. Mas que probabilidades deverá o agente racional atribuir
aos acontecimentos? Os argumentos que acabamos de esboçar foram concebidos para mostrar
que sejam quais forem as probabilidades que se escolham, terão de satisfazer, conjuntamente, os
axiomas normais da probabilidade. Mas haverá mais alguma restrição à racionalidade probabi-
lística?
Foi concebido um conjunto de argumentos para descrever e justificar um processo de modi-
ficar as nossas probabilidades subjectivas à luz de nova informação. Um teorema fundamental
da teoria de probabilidades, o teorema de Bayes, relaciona a probabilidade de uma hipótese
com base na informação (uma probabilidade condicional) com a probabilidade condicional da
informação, dada a verdade da hipótese e a probabilidade inicial de que a hipótese seja verda-
deira. Suponha que pensamos que, depois de obtida a informação, devemos adoptar, para esta-
belecer a nossa nova probabilidade relativa à verdade da hipótese, a sua velha probabilidade,
condicionada à informação. Temos então um modo de mudar as nossas probabilidades à luz de
nova informação — modo esse que é «conservador» e que faz as mais pequenas mudanças ima-
gináveis nas nossas probabilidades antecedentes. E as novas probabilidades, tal como as velhas,
irão coadunar-se aos axiomas da teoria de probabilidades. Este processo de modificação da
probabilidade à luz da informação é conhecido por «condicionalização». Pode ser generalizado
de modo a abranger casos em que não se conhece com grau de certeza a nova informação, sen-
do-lhe unicamente atribuída uma probabilidade. Uma pessoa que siga esse processo poderia,
por exemplo, começar com o pressuposto de que uma moeda, que poderia estar viciada, tem
uma probabilidade 1 2 de sair caras. À medida que se fazem novos lançamentos, o agente modi-
ficará então essa probabilidade à luz dos resultados observados. Uma sequência dominada por
caras, por exemplo, levará o agente a aumentar a sua estimativa da probabilidade que a moeda
tem de dar origem a caras. Uma vez mais, podemos argumentar a favor da ideia de que a modi-
ficação das nossas probabilidades pelo processo de condicionalização é o que há de racional a
fazer. Alguns destes argumentos são como os argumentos usados para tentar convencer-nos de
que era racional que as nossas probabilidades se coadunassem com os axiomas habituais.
Fiz notar que, ao obter novas probabilidades para certas hipóteses à luz da informação, nos
apoiamos nas probabilidades iniciais no que respeita à verdade das hipóteses em causa. Não
teremos, por isso, de começar com uma plausibilidade «intrínseca» relativa às hipóteses, as suas
chamadas «probabilidades a priori»? Qual poderá ser a sua origem? Alguns especialistas defen-
deram que só devíamos aceitar hipóteses probabilísticas no nosso corpo de crenças aceites com
base em frequências observadas, encaradas como informação. Alega-se mais frequentemente
que podemos gerar probabilidades intrínsecas para as hipóteses sem nos apoiarmos nas fre-
quências observadas. Na verdade, essas probabilidades a priori foram o objecto de estudo dos

74
mais antigos trabalhos sobre teoria das probabilidades, nos séculos XVII e XVIII. Se lançarmos
uma moeda, há dois resultados «simétricos» possíveis: caras e coroas. Mas, então, não será que
parece razoável presumir inicialmente que a probabilidade de cada uma delas é 1 2 ? Se lançar-
mos um dado, há seis faces simétricas. Não deveremos, então, na ausência de indícios a favor
da ideia de que os dados estão viciados, atribuir uma probabilidade de 1 6 a cada resultado em
que uma face específica fica voltada para cima? Assim, podemos tentar chegar a probabilidades
a priori dividindo os resultados em casos simétricos e atribuindo a cada um a mesma probabili-
dade. Este é o famoso princípio da indiferença.
Os filósofos posteriores formalizaram estas noções e fizeram generalizações com base nelas.
Se escolhermos uma linguagem para descrever o mundo, podemos encontrar vários meios de
ordenar as possibilidades do mundo, tal como esta linguagem o descreve, em possibilidades
simétricas. A probabilidade inicial é então distribuída sobre as possibilidades de modo intuitivo
e simétrico. Uma vez obtidas as nossas probabilidades «racionais» a priori, podemos modificá-
las face à informação experimental (especialmente face à informação sobre frequências efectivas
e observadas de resultados), usando o processo de condicionalização anteriormente descrito. Os
métodos inventados pareceram a alguns especialistas uma generalização da teoria formal da
dedução porque contemplavam a definição de um tipo de «implicação lógica parcial» entre
proposições, isto é, de uma noção de apoio lógico gradual entre proposições. Por isso, os siste-
mas formais receberam o nome de «lógicas indutivas».
Tomou-se consciência há muito tempo que estas técnicas enfrentam dificuldades quando
submetemos o princípio da indiferença à análise e à crítica. Todas estas técnicas se baseiam na
divisão dos resultados possíveis em casos simétricos. Mas a justificação racional por detrás de
tal divisão nem sempre é clara. Sim, podemos dizer que num dado pode sair um 1, um 2, etc.,
num total de seis casos. Mas podemos também dizer que num dado pode sair um 1 ou não, per-
fazendo assim dois casos. Por que motivo não dar então o valor 1 2 à probabilidade de «sair um
1»? Noutros casos, a necessidade de ter um princípio para escolher como ser «indiferente» torna-
se mais clara. Imagine-se um vaso feito de tal modo que, quando cheio, o seu volume não seja
proporcional à área molhada da superfície do seu interior (o que é fácil de fazer se o vaso tiver
lados curvos). Se nada soubermos sobre quão cheio está o vaso, deveremos nós supor, usando o
princípio da indiferença, que está meio cheio? Ou deveremos supor, com idêntica justificação,
que metade do seu interior está molhado? As duas suposições são incompatíveis entre si, mas
ambas parecem estar igualmente justificadas, a priori, por considerações de pura simetria.
Mais adiante, neste capítulo, iremos explorar o modo como a probabilidade é utilizada na
mecânica estatística, a primeira área da física na qual a probabilidade desempenhou um papel
fundamental. Veremos que, quando tentamos compreender exactamente de que modo deveria a
probabilidade entrar na física, as disputas entre os filósofos, com respeito à natureza da proba-
bilidade e acerca da origem e justificação das atribuições de probabilidades iniciais, são cruciais.
Como veremos, várias descobertas físicas não só lançam luz sobre as questões filosóficas, como
revelam questões adicionais que complicam ainda mais a situação do problema filosófico.

Explicação estatística: explicação, lei e causa

Não desejamos apenas descrever o mundo tal como o encontramos, mas também explicar o
que nele acontece. Temos a sensação que explicar é responder à questão de saber por que razão
acontece aquilo que acontece, e não apenas descrever o que de facto acontece. Mas o que é res-
ponder a um «Porquê?»? E o que é proporcionar uma explicação para um fenómeno?
A noção intuitiva de causa tem desempenhado um certo papel nas tentativas de analisar a
noção de explicação científica desde que o problema de oferecer tal análise ocorreu pela primei-
ra vez a um filósofo. Explicar um acontecimento é indicar a sua causa, e explicar uma classe de
acontecimentos é indicar o tipo de causa que os produz.
Numa das primeiras análises da causalidade, Aristóteles distinguiu quatro tipos diferentes
de causas: a matéria em que a mudança ocorre, a natureza da mudança, o fim ou propósito da
mudança e o gerador imediato da mudança. Chamou-lhes causas materiais, formais, finais e efi-
cientes. Hoje concebe-se a matéria e as propriedades envolvidas não como causas de um proces-
so, mas como constituintes da mudança a ser explicada. A questão das causas finais — fins ou

75
propósitos — ainda suscita muita discussão. Na actividade intencional de um agente, talvez na
biologia (sob a forma de explicações funcionais de um órgão, por exemplo) e nas ciências soci-
ais, algo parecido com a ideia aristotélica segundo a qual indicar um fim ou propósito tem po-
der explicativo parece ainda atraente. Mesmo na física não é claro que não haja absolutamente
qualquer lugar para as «causas finais». Alega-se por vezes que a explicação do percurso da luz
em termos do que demora o menos tempo possível tem uma natureza finalista. E na termodi-
nâmica (apresentada mais à frente neste capítulo) tem-se defendido que explicar um processo
concebendo o avanço de um sistema para um estado de equilíbrio como um «objectivo» é dar
uma explicação que usa a noção de «causa final».
Mas quando um cientista contemporâneo pensa em causas, pensa habitualmente em causas
eficientes, ou seja, nos acontecimentos que «dão origem» à ocorrência do acontecimento a ser
explicado. Mas o que é explicar um acontecimento demonstrando a sua causa eficiente? A ideia
intuitiva parece ser a de que se explica um acontecimento quando se descobre um acontecimen-
to anterior que «torne necessária» a ocorrência do outro. Ligar um interruptor causa o acender
da luz, empurrar um objecto causa a sua aceleração e assim por diante. Mas qual é a natureza
desta «necessitação» ou «produção», que torna apropriado descrever a causa como algo que
produz o efeito ou acontecimento explicado?
Num exame crítico merecidamente famoso sobre a noção de causalidade, David Hume de-
fendeu que seria errado conceber as relações causais como algo que se baseasse num «nexo cau-
sal» ou «conexão necessária» especial entre acontecimentos. Hume defendeu antes que o que
encontramos no mundo quando olhamos para acontecimentos relacionados causalmente é, an-
tes de tudo, uma relação espácio-temporal entre esses acontecimentos, pela qual eles estão num
contacto espácio-temporal em que o acontecimento da causa precede no tempo o acontecimento
do efeito. Também descobrimos que os acontecimentos constantemente conjugados estão conti-
dos numa classe de pares de acontecimentos do mesmo tipo. Isto é, o acontecimento 1 causa o
acontecimento 2 se, e só se, 1 e 2 têm a relação espácio-temporal apropriada, e se, e só se, aos
acontecimentos do tipo 1 se seguem sempre acontecimentos do tipo 2 e se os do tipo 2 são sem-
pre precedidos pelos do tipo 1. Segundo Hume, embora pensemos que podemos explicar esta
«conjunção constante» de tipos de acontecimentos ao dizer que os acontecimentos do tipo 1
«causam» os do tipo 2, na verdade, ao falar de causalidade, estamos apenas a redescrever essa
conjunção constante.
Para Hume isto não é assim tão simples, pois ele pergunta onde obtemos a ideia de que o
acontecimento da causa «torna necessário» o acontecimento do efeito. Quanto a isto, Hume en-
tende que a necessitação não é um reflexo de uma relação real entre os acontecimentos do mun-
do, mas uma projecção no mundo de um fenómeno psicológico. Ao vermos que os aconteci-
mentos do tipo 1 estão sempre acompanhados pelos do tipo 2, ficamos acostumados a ver os
acontecimentos do primeiro tipo ser sempre seguidos por acontecimentos do segundo tipo. Por
isso, quando temos a experiência de um acontecimento do primeiro tipo, a nossa mente salta
imediatamente para a expectativa da ocorrência de um acontecimento do segundo tipo. É esta
expectativa, fundada no «costume ou hábito», que constitui a origem da nossa noção de que o
primeiro tipo de acontecimento torna necessário o segundo tipo. No entanto, defende Hume,
isto é uma questão psicológica. Tudo o que há no mundo dos próprios acontecimentos são as
relações espácio-temporais de «contiguidade e precedência» e a conjunção constante dos acon-
tecimentos dos tipos em questão.
Um modelo de explicação científica, conhecido por «modelo nomológico-dedutivo», está es-
treitamente associado a esta análise humeana da causalidade (embora possamos aderir a ele
sem sermos humeanos). Neste modelo defende-se que explicar um acontecimento é mostrar que
uma asserção sobre a ocorrência do acontecimento em questão pode ser logicamente deduzida a
partir de asserções sobre a ocorrência de outros acontecimentos, geralmente anteriores, se, além
da descrição desses acontecimentos explicativos, usarmos asserções de «leis da natureza» que
conectem esses dois tipos de acontecimentos. Para um humeano, estas leis são apenas asserções
gerais sobre conjunções constantes dos tipos relevantes de acontecimentos.
Os defensores deste modelo de explicação científica chamam a nossa atenção para a estreita
conexão existente entre as explicações, tal como eles as concebem, e os objectivos de previsão e
controlo partilhados pela maior parte dos agentes humanos. Se formos capazes de explicar

76
acontecimentos de um certo tipo, disporemos de generalizações legiformes que conectam os
acontecimentos de um tipo com outros tipos de acontecimentos usados na explicação. Assim, se
soubermos que tipos de acontecimentos «causais» ocorreram noutras circunstâncias, podemos
prever que acontecimentos irão ocorrer usando as generalizações que descobrimos na procura
de explicações nomológico-dedutivas. Ou, manipulando a ocorrência do tipo apropriado de
acontecimentos «causais», podemos controlar o mundo, determinando que tipos de aconteci-
mentos manipuláveis irão dar origem a (ou impedir a ocorrência de) acontecimentos do tipo
que desejamos que ocorra. Uma vez mais, as conexões entre os tipos apropriados de aconteci-
mentos revelam-se nas asserções gerais legiformes descobertas na procura de explicações.
Como veremos, há quem critique o modelo de deduzir uma descrição de um acontecimento
a partir de descrições de outros acontecimentos e de asserções gerais de leis dizendo que este
exige demasiado de uma explicação. Outros especialistas dizem que ele exige menos do que de-
via. Uma vez mais, há aqui um problema importante que se relaciona com a noção de causali-
dade. Defende-se que, se os acontecimentos explicativos não tiverem o tipo apropriado de rela-
ção causal com o acontecimento explicado, as conexões entre as suas descrições não constituirão
explicações, mesmo que as condições do modelo dedutivo de explicação sejam satisfeitas. Po-
demos derivar a posição que um planeta ocupava ontem a partir das leis da dinâmica e da sua
posição e velocidade de hoje, mas, diz-se, isso não explica por que razão o planeta estava ontem
nessa posição — pois o passado explica o futuro e não o contrário. E afirma-se que isto é assim
porque a direcção da causalidade é do passado para o futuro. Defende-se assim que explicar é
revelar causas. Além disso, dois acontecimentos dados podem estar correlacionados de uma
maneira legiforme por serem o efeito comum de um terceiro acontecimento que seja a sua causa
comum. Deste modo, os dois acontecimentos não se explicam mutuamente, embora ambos se
expliquem pela causa comum. Se uma infecção bacteriana produzir uma borbulha e um incha-
ço, não se diz que a borbulha explica o inchaço nem que o inchaço explica a borbulha; ao invés,
ambos se explicam pela sua causa: a infecção bacteriana. Mas qual será o elemento causal adici-
onal necessário para a explicação que vá além da conjunção constante?

Explicações que invocam probabilidades

Muitos dos especialistas que pensam que o modelo dedutivo de explicação é demasiado exi-
gente referem-se às explicações históricas. Aí parecemos aceitar respostas explicativas em que
não se usam quaisquer generalizações legiformes. Afinal, quais são as leis que regem aconteci-
mentos históricos? Para nós, têm mais interesse as explicações em que os acontecimentos estão
conectados através de generalizações, mas em que as generalizações não são leis da natureza
sem excepção, mas conexões probabilísticas ou estatísticas entre acontecimentos. Fumar nem
sempre causa cancro do pulmão, mas certamente aumenta a sua probabilidade. Não teremos,
então, oferecido pelo menos uma explicação parcial para o facto de a pessoa ter um cancro num
pulmão se indicarmos que essa pessoa fuma muito, mesmo que fumar não produza necessari-
amente tal doença? Que tipo de relação probabilística entre o acontecimento explicativo e o
acontecimento explicado será suficiente para se dizer que o primeiro explica o segundo?
Um pensamento que ocorre naturalmente em primeiro lugar é o de que se explica um acon-
tecimento se pudermos encontrar outros acontecimentos tais que a ocorrência do acontecimento
em questão se siga da ocorrência dos acontecimentos explicativos com uma elevada probabili-
dade. O «segue-se de» é mediado pela existência de generalizações estatísticas legiformes que
tomam o lugar das leis que não admitem excepções usadas nas explicações nomológico-
dedutivas. Constatamos imediatamente que tal «explicação estatística» de um acontecimento é
bastante diferente de uma explicação em que se usem leis puras. No caso dedutivo, por exem-
plo, se podemos explicar o acontecimento 1 e explicar o acontecimento 2, podemos produzir,
automaticamente, uma explicação para «o acontecimento 1 ocorreu e o acontecimento 2 ocor-
reu» conjugando simplesmente os recursos explicativos usados para explicar cada acontecimen-
to individual. Mas se o acontecimento 1 se segue de uma base explicativa com uma «elevada
probabilidade» — isto é, com uma probabilidade superior a um certo valor especificado — e se
o acontecimento 2 se segue da sua base explicativa com uma probabilidade igualmente elevada,

77
não há garantia de que «o acontecimento 1 e o acontecimento 2» se sigam conjuntamente das
bases explicativas conjugadas com uma probabilidade acima do valor mínimo.
Além disso, se um acontecimento tiver uma probabilidade elevada relativamente à sua base
explicativa, poderá ter uma probabilidade reduzida relativamente a essa base complementada
com mais informação. Embora se possa considerar altamente provável que uma pessoa que te-
nha crescido num ambiente muito mau tenha tendências criminosas, quando se acrescenta que
essa pessoa é filha de uma família saudável, e assim por diante, reduzimos essa probabilidade
na nossa estimativa. Isto não pode acontecer com os acontecimentos explicados por meio de ex-
plicações nomológico-dedutivas.
Não é preciso muito para pensar em casos em que achamos que se pode dar uma explicação
probabilística para um acontecimento mesmo que ele não tenha uma probabilidade elevada re-
lativamente àquilo que se apresenta como explicação. Quando algo entra em combustão espon-
tânea, explica-se isso dizendo que por vezes, embora raramente, esse fenómeno ocorre na situa-
ção relevante. Como poderemos ter explicado um acontecimento através de factos relativamen-
te aos quais ele tem uma probabilidade reduzida? Fazendo notar que sem os factos explicativos
o acontecimento em questão teria uma probabilidade ainda mais reduzida. Assim, podemos
explicar por que razão acontece algo referindo factos que tornam esse acontecimento mais pro-
vável do que o seria noutro caso, mesmo que depois da adição dos factos explicativos a sua
probabilidade continue a ser reduzida.
Constata-se depois que há muitos casos em que explicamos um acontecimento por meio de
outro acontecimento, mesmo que, dada a nova informação, reduzamos a probabilidade do acon-
tecimento relativamente ao nosso conhecimento de fundo. Um médico explica a morte de um
paciente, sobre o qual se sabia que sofria de uma doença grave, ao indicar que nesse caso parti-
cular foi um efeito secundário muito improvável de um medicamento que matou o paciente e
não a doença. A causa da morte pode ser o medicamento, mesmo que seja muito mais provável
que a morte tivesse resultado da doença, tratada ou não, e não de um efeito secundário do me-
dicamento.
Podemos combinar estas observações com outras, semelhantes às apresentadas pelos que
discutem as explicações nomológico-dedutivas defendendo que o elemento causal está ausente
da teoria da explicação segundo a qual explicar é subsumir numa asserção geral. O que obtemos
é uma teoria que afirma que explicar, tanto em termos probabilísticos como em termos de leis
sem excepção, é indicar a origem causal de um acontecimento. Mas considera-se agora a causa-
lidade como uma relação que admite uma conexão probabilística. A ideia aqui em jogo é a de
que um acontecimento pode causar diversos resultados diferentes, tendo cada um desses resul-
tados uma probabilidade especificada de ser causado. Embora uma causa possa resultar numa
multiplicidade de efeitos, é ainda uma relação causal que produz o acontecimento do efeito a
partir do acontecimento da causa. Ao ver as coisas desta maneira, poderemos fazer justiça aos
casos acima indicados. Também seremos capazes de distinguir as correlações que, por não se-
rem causais, não são explicativas, das correlações explicativas que, mesmo que sejam probabilís-
ticas, são genuinamente causais.
Mas surgem agora outras questões interessantes. Será que seremos forçados a defender que
no mundo há relações causais irredutivelmente probabilísticas, se dermos uma explicação pro-
babilística causal? Será que temos de afirmar que, na sua base, o mundo tem uma natureza ge-
nuinamente «tiquista» ou aleatória, não sendo regido por relações causais inteiramente deter-
ministas? Não necessariamente. Há quem tenha defendido que poderão existir explicações pro-
babilísticas causais que expliquem um acontecimento como o resultado «puramente aleatório»
(embora causal) de certos acontecimentos antecedentes que tenham disposições causais para ge-
rar resultados do tipo a explicar. Noutros casos, a explicação probabilística, revelando uma vez
mais uma estrutura causal, pode ser explicativa, em virtude de a relação probabilística causal
estar fundada em certas relações causais subjacentes inteiramente deterministas. Veremos parte
da defesa deste ponto de vista ainda neste capítulo. Neste segundo tipo de explicação, o estado
posterior de um sistema está inteiramente determinado pelo seu estado dinâmico anterior. Mas
defende-se que muitos estados dinâmicos iniciais possíveis são consistentes com a descrição ini-
cial do sistema. Cada um desses estados iniciais tem um resultado futuro diferente. Cada evolu-
ção é inteiramente determinista. Neste caso, a probabilidade entra na explicação quando come-

78
çamos a falar da «probabilidade de um certo estado dinâmico inicial» consistente com a descri-
ção inicial do sistema. Assim, teremos elementos probabilísticos na nossa estrutura explicativa.
A estrutura explicativa repousará numa base que consiste em revelar os processos causais sub-
jacentes que geram os acontecimentos a explicar. Mas a probabilidade surgirá não por a relação
causal ser «intrinsecamente aleatória», mas porque se estão a explorar muitas das possíveis evo-
luções causais diferentes. Mais tarde, quando discutirmos a mecânica quântica, no capítulo 4,
veremos por que motivo tem alguma plausibilidade a tese de que nesse contexto se deve postu-
lar uma causalidade genuinamente «aleatória».
Sendo assim, desta perspectiva as exigências de elevada probabilidade ou de um aumento
de probabilidade parecem erradas. Quando explicamos um acontecimento em termos probabi-
lísticos, estamos a tentar colocar esse acontecimento numa estrutura de relações causais, onde a
estrutura revelada é probabilística ou por as relações causais serem intrinsecamente indetermi-
nistas ou por se estar a considerar simultaneamente diversas evoluções causais alternativas.
Mesmo que o acontecimento em questão tenha, na cadeia causal que conduz a ele, uma probabi-
lidade baixa ou reduzida, poderemos explicá-lo. Obviamente, isto não significa negar que redu-
zir a surpresa mostrando que um acontecimento é altamente provável, ou mostrando que é
mais provável do que teríamos de outro modo sido levados a esperar, não tem qualquer valor.
Fazemos estas coisas e pensamos que, de alguma maneira, elas nos oferecem explicações.
Será que toda esta importância atribuída à revelação de relações causais nas explicações sig-
nifica que estamos a virar as costas a uma teoria humeana sobre o que é uma coisa ser a causa
de outra? Não necessariamente. Há quem defenda que, como as explicações exigem referência a
relações causais entre acontecimentos, temos de pressupor a noção de relação causal como um
elemento primitivo na nossa compreensão da natureza do mundo. Outros especialistas procu-
ram compreender a relação de causalidade por meio de outras relações que os acontecimentos
mantenham entre si. Numa certa abordagem, que encontramos já nalgumas passagens de Hu-
me, tenta-se compreender a causalidade por meio daquilo que «aconteceria» no mundo se as
coisas fossem diferentes daquilo que são. Assim, pode-se conceber uma causa como o aconteci-
mento que, se não tivesse ocorrido, também não teria ocorrido o acontecimento do efeito. Na
verdade isto não é assim tão simples. Fenómenos como a sobredeterminação (um efeito é cau-
sado por múltiplas causas) e a perempção (algo é causado por um acontecimento que, se não
tivesse ocorrido, permitiria que um outro acontecimento desse origem ao efeito, numa situação
em que o primeiro acontecimento impeça o segundo de ocorrer) exigem uma análise mais sofis-
ticada da relação entre «o que teria ocorrido se» e aquilo em que consiste um acontecimento
causar outro. A existência de conexões não causais também associadas àquilo «que teria aconte-
cido» dão origem a mais problemas. Além disso, queremos ter alguma compreensão sobre o
que queremos exactamente dizer quando falamos de coisas como o que teria acontecido se as
coisas tivessem sido diferentes — compreensão essa que não dependa de se pressupor uma re-
lação causal previamente compreendida.
Outras tentativas de analisar a causalidade baseiam-se numa combinação da conjunção cons-
tante de Hume com outros elementos efectivos do mundo. Sublinha-se com frequência, por
exemplo, que a estrutura do mundo só nos faz identificar uma conjunção constante como uma
relação causal se os acontecimentos em questão estiverem ligados por meio de percursos apro-
priadamente contínuos de acontecimentos constantemente conjugados. Assim, tem de haver
percursos de «influência causal» ou «propagação causal».
Por fim, é muito importante reflectir sobre o facto de as regularidades inteiramente legifor-
mes ou meramente probabilísticas que usamos nas explicações científicas formarem uma hie-
rarquia unificada de proposições numa estrutura teórica. Algumas dessas generalizações são
mais amplas, profundas e fundamentais que outras. Pode-se defender que a diferença entre me-
ras correlações e correlações causais apropriadas às explicações está no facto de as segundas in-
tegrarem a correlação dos acontecimentos em questão nos níveis de correlação mais profundos
das teorias mais fundamentais. Assim, defende-se que a referência ao facto de termos causali-
dade — e, logo, explicação — apenas quando o mecanismo de correlação dos acontecimentos es-
tiver claramente estabelecido pode ser tomada não como uma indicação de que, além das corre-
lações, temos de apresentar uma relação causal misteriosa, mas como uma indicação de que
uma correlação só é explicativa quando integra a relação dos acontecimentos em questão nas

79
correlações fundamentais da teoria básica apropriada. Não será que isto esclarece o debate entre
aqueles que pensam que as correlações conhecidas entre fumar e desenvolver o cancro são sufi-
cientes para defender que fumar causa o cancro e aqueles que o negam? Não estarão os segun-
dos a exigir a causalidade explicativa no sentido de algo que integra a correlação entre fumar e
ter a doença num enquadramento muito mais amplo e profundo? A biologia, a química e a físi-
ca são usadas para complementar a correlação manifesta com correlações muito mais subtis que
estão presentes nas leis muito mais profundas da ciência. Estas ciências dão-nos pormenores
como as correlações entre a inalação de diversos químicos, a correlação entre a presença dos
químicos e as mudanças genéticas — sendo estas minuciosamente seguidas em termos das mais
profundas correlações da totalidade da física, que mostram o que se passa ao nível molecular.
Assim, desta perspectiva, a exigência de causalidade nas explicações está garantida, mas não
com fundamentos basicamente humeanos.
Este último aspecto do papel da causalidade nas explicações é especialmente relevante para
os nossos propósitos. À medida que formos entrando nos pormenores do papel da probabilida-
de na teoria da mecânica estatística, veremos que aí a termodinâmica — uma teoria de «nível
superficial» sobre o comportamento macroscópico — se relaciona em termos explicativos com
uma teoria dinâmica de «nível profundo». Esta teoria de nível profundo é a teoria do compor-
tamento dos sistemas fundados nas leis básicas da dinâmica das componentes microscópicas do
sistema macroscópico (tal como as moléculas de um gás). As considerações probabilísticas sur-
gem quando tentamos integrar os dois níveis de descrição, usando a teoria de nível profundo
para explicar a teoria de superfície. Assim, pressupõe-se que podemos apresentar uma explica-
ção causal da evolução do sistema, através da dinâmica dos seus constituintes microscópicos.
Esse é o nível de descrição científica amplo, profundo e fundamental já mencionado. A probabi-
lidade desempenha o seu papel ao integrar a descrição do sistema formulada nos termos de ní-
vel superior a toda esta imagem causal. Como veremos, a relação de correlação e de causalidade
introduz aqui enigmas especiais.

Explicação e redução

A nossa discussão tem avançado como se os acontecimentos individuais fossem os objectos


primários da compreensão científica, isto é, como se desejássemos explicar acontecimentos es-
pecíficos. No entanto, na ciência é mais frequente tentar compreender generalizações, leis ou
correlações probabilísticas. Como poderemos aumentar a compreensão de generalizações legi-
formes? Como poderemos explicá-las?
A ideia principal é a de que as generalizações legiformes, sejam inteiramente legiformes ou
estatísticas, se explicam ao serem colocadas sob generalizações mais amplas, profundas e fun-
damentais. As leis formam uma hierarquia que vai de generalizações de superfície limitadas
(como a lei da refracção de Snell, na óptica, ou a lei de Ohm, na electricidade) às leis extrema-
mente gerais e profundas das teorias físicas fundamentais. Explicamos leis de ordem inferior ao
mostrar que elas se seguem de leis de ordem superior. As leis de ordem inferior podem aplicar-
se só em certas circunstâncias específicas que podem ser bem definidas (isto é, quando a situa-
ção possui as condições específicas apropriadas). Explicamos a óptica geométrica ao mostrar
que ela se segue da óptica física (ondulatória), explicamos a óptica física exibindo-a como uma
consequência da teoria electromagnética, explicamos o electromagnetismo mostrando que é
uma componente do campo electrofraco descrito pela teoria quântica dos campos, e assim por
diante.
Geralmente, a ideia é a de que se explicam as leis mais superficiais ao derivá-las a partir de
leis de um tipo mais geral e fundamental. Mas na verdade as coisas são muito mais complica-
das. Afirma-se com frequência que, ao explicar as leis mais superficiais, se descobre geralmente
que elas não são realmente verdadeiras. Em muitos casos são apenas boas aproximações à ver-
dade, e mesmo isso só em certas circunstâncias. Assim, mal se compreende a teoria ondulatória
da luz, compreende-se que a óptica geométrica só se aplica quando o comprimento de onda da
luz for pequeno por comparação com as dimensões dos objectos físicos que estiverem no per-
curso da luz. Neste caso, não é fácil tornar rigorosa a noção de aproximação à verdade.

80
Quando as leis e as generalizações estatísticas menos profundas que se pretende explicar se
apresentam com conceitos diferentes dos usados nos princípios explicativos mais profundos,
surgem questões mais problemáticas. Isto acontecerá sempre que uma teoria menos profunda
for reduzida a uma teoria mais profunda, pois isso exige que se faça uma conexão entre os con-
ceitos das duas teorias, que por vezes são bastante diferentes. Enquanto a biologia fala de orga-
nismos e células, por exemplo, a química molecular fala de coisas como moléculas ou graus de
concentração. Como estarão as células, por exemplo, relacionadas com os seus constituintes mi-
croscópicos? Aqui a resposta parece clara, já que as células são feitas de moléculas, mas é preci-
so tornar isto inteiramente claro.
No caso com que vamos lidar neste capítulo, esta conexão inter-teórica é muito mais pro-
blemática. A reduzida teoria que vou descrever, a termodinâmica, lida com características do
mundo como a temperatura, a quantidade de calor e a entropia. No entanto, a teoria explicativa
— a redutora — lida com sistemas em termos da sua construção a partir de constituintes mi-
croscópicos, como as moléculas. Embora os objectos macroscópicos sejam feitos de componen-
tes microscópicos, é uma tarefa complexa e subtil conseguir relacionar as propriedades dos sis-
temas usados para os caracterizar ao nível que se pretende explicar (temperatura e entropia, por
exemplo) com as propriedades dos sistemas (o seu número de constituintes microscópicos e o
espaço a que estes estão limitados, por exemplo) e com as propriedades dos próprios constituin-
tes microscópicos (a sua quantidade de movimento e a sua energia, massa e dimensão, por
exemplo).
Isto torna-se ainda mais difícil devido à curiosa interacção que ocorre no esquema explicati-
vo entre as leis que não admitem excepções e as generalizações estatísticas. Inicialmente, as leis
a explicar pareciam ter o estatuto de leis que não admitiam excepções, mas o próprio acto de as
explicar torna este pressuposto duvidoso. Ao nível explicativo mais profundo situam-se as leis
fundamentais da dinâmica dos constituintes microscópicos. Uma vez mais, tais leis não admi-
tem excepções, embora na versão da mecânica estatística — que faz da dinâmica quântica a teo-
ria dinâmica fundamental —contenham um elemento fundamentalmente estatístico, como ve-
remos no capítulo 4. O que é importante fazer notar agora é que entre as leis dinâmicas funda-
mentais dos microconstituintes e as leis explicadas da teoria a ser reduzida, encontramos gene-
ralizações que introduzem elementos estatísticos ou probabilísticos na imagem explicativa. Por
isso, como veremos, defende-se com frequência que a dinâmica fundamental explica o compor-
tamento térmico ao nível macroscópico apenas ao apresentá-lo como o comportamento esma-
gadoramente mais provável ou, noutros casos, como o comportamento médio previsto.
Quando tentamos compreender a mecânica estatística, as questões mais interessantes e im-
portantes surgem precisamente neste ponto. Como será que se relacionam as generalizações es-
tatísticas que formam os postulados centrais da teoria, por um lado, com as leis dinâmicas fun-
damentais que regem os constituintes microscópicos do sistema em questão e, por outro lado,
com as leis que regem o comportamento macroscópico dos sistemas, tal como estes são caracte-
rizados pelos conceitos da física térmica tradicional? A explicação do comportamento ao nível
macroscópico deve ser apresentada em termos que o entendam como uma consequência de o
sistema maior ser constituído por partes microscópicas e em termos das leis fundamentais que
regem a dinâmica dessas partes. Que tipo de explicação será esta? Como veremos, trata-se de
um esquema explicativo que introduz, ao nível intermédio, noções fundamentalmente probabi-
lísticas e estatísticas.
Mas o que fundamentará a introdução destes postulados e pressupostos probabilísticos adici-
onais? Poder-se-á derivá-los da própria dinâmica fundamental? Ou serão precisos postulados
fundamentais adicionais para os introduzir na física? Esta questão é muito difícil e complexa. E
é muito importante, porque a resposta determinará que tipo de explicação a física proporciona
para os fenómenos macroscópicos. Embora existam casos em que se pode dizer que se explicou
uma generalização de nível inferior com base numa teoria mais fundamental, por meio de uma
derivação da primeira a partir da segunda — incluindo-se, possivelmente, algumas noções de
aproximação —, no caso da mecânica estatística há outros elementos importantes que têm um
papel a desempenhar na derivação, elementos esses que são bastante diferentes dos elementos
habituais dos modelos filosóficos canónicos da explicação estatística de generalizações.

81
??Da termodinâmica à mecânica estatística

Termodinâmica

Na nossa experiência quotidiana temos acesso ao fenómeno do calor, e por isso não é sur-
preendente que a física tenha tentado compreendê-lo. Os primeiros esforços incluíram o desen-
volvimento de dispositivos, como o termómetro, para atribuir medidas numéricas precisas ca-
pazes de substituir as sensações subjectivas de calor e frio que experimentamos. Com algum es-
forço intelectual, distinguiu-se o grau de temperatura da quantidade de calor, sendo o primeiro
uma quantidade «intensiva» e a segunda uma quantidade «extensiva». Esta distinção é análoga
àquela que se faz entre densidade e quantidade de matéria, respectivamente. Assim, quando
misturamos uma quantidade mais pequena de água que tenha uma temperatura mais elevada
com uma certa quantidade de água fria obtemos a mesma temperatura final relativa à mistura
do que obteríamos se misturássemos uma maior quantidade de água que estivesse a uma tem-
peratura mais baixa com a mesma quantidade de água fria; logo, podemos afirmar que acres-
centámos nos dois casos a mesma quantidade de calor, apesar de as temperaturas diferirem.
Nas primeiras tentativas para compreender estes resultados concebeu-se o calor como uma
espécie de substância, chamada «calórico», e a temperatura como uma espécie de medida da
densidade do calórico na matéria. Quanto mais calórico houvesse numa certa porção de matéria
comum, mais alta seria a temperatura. Esta concepção substantivista faz justiça a muitos resul-
tados experimentais quando se introduz um princípio de «conservação do calórico». Mas outros
resultados, especialmente a produção de calor por acção mecânica ou a conversão do calor em
acção mecânica (como numa máquina termodinâmica a vapor), não se adequam perfeitamente
à hipótese do calórico. Mesmo numa fase muito remota, alguns pensadores conceberam o calor
como uma espécie de movimento de componentes minúsculos do sistema, demasiado pequenos
para serem detectados como habitualmente.
Ainda antes de a teoria do calor enquanto movimento interno se ter imposto, progrediu-se
bastante na formalização de uma teoria do calor. Ao reflectir sobre a experiência dos que traba-
lhavam com máquinas termodinâmicas, S. Carnot chegou à importante observação de que,
mesmo numa máquina perfeitamente eficiente, a quantidade de calor que poderia ser converti-
da em trabalho mecânico estava limitada pela diferença de temperaturas entre o calor introdu-
zido na máquina e o calor expelido na sua descarga. Isto conduziu imediatamente à ideia de um
zero absoluto de temperatura, a temperatura do calor de descarga de uma máquina capaz de
transformar todo o calor introduzido em trabalho mecânico utilizável. R. Clausius e outros es-
pecialistas desenvolveram uma teoria formal do calor a partir das ideias de S. Carnot.
Primeiro notou-se que, embora o trabalho mecânico e o calor possam ser mutuamente con-
vertidos, a sua quantidade total é invariante. Esta é a chamada «primeira lei da termodinâmi-
ca». Depois, o facto de a obtenção de trabalho útil a partir do calor exigir que este último seja
colocado na máquina a uma temperatura mais elevada do que a descarga de calor conduziu,
após uma brilhante reflexão, ao princípio geral da irreversibilidade, a chamada «segunda lei da
termodinâmica». Há muitas formulações subtis desta lei. Uma delas diz basicamente o seguinte:
considere-se um sistema energeticamente isolado. Suponha-se que algum calor do sistema se
transforma em trabalho mecânico. Suponha-se que o sistema parte de um dado estado. Então,
no fim do processo, o sistema não pode estar no seu estado inicial. No final do processo, pode-
remos ter transformado o trabalho obtido de novo em calor, mas o resultado líquido de todo o
processo será que, embora a quantidade de calor total tenha o mesmo valor do que no início,
estará agora a uma temperatura mais baixa e, por isso, estará menos «disponível» para ser con-
vertido em trabalho.
A noção de um estado de equilíbrio de um sistema torna-se crucial. Suponha-se que um sis-
tema está energeticamente isolado do resto do mundo. Mais tarde ou mais cedo fixar-se-á num
estado macroscopicamente imutável, sendo esse o seu estado de equilíbrio. Assim, uma barra
de ferro quente numa extremidade e fria na outra fixa-se num estado de temperatura intermé-
dia uniforme. Um gás que esteja inicialmente num dos lados de uma caixa fixa-se numa condi-
ção de densidade uniforme por toda a caixa. Uma «lei zero» da termodinâmica convida-nos a
considerar três sistemas, A, B e C, todos no seu estado de equilíbrio, e onde A e B são tais que,

82
quando entram em contacto energético, mantêm-se no mesmo estado de equilíbrio. Suponha-se
que acontece o mesmo relativamente a B e C quando estes entram em contacto. Sendo assim, A
e C manter-se-ão nos seus estados de equilíbrio originais ao entrarem em contacto. Podemos
identificar o carácter comum do equilíbrio dos sistemas pela sua temperatura comum. Por fim, é
preciso introduzir o novo conceito de entropia. A entropia regista a «utilidade» do calor para
conversão em trabalho mecânico. Embora a quantidade de calor a uma temperatura alta e a uma
temperatura baixa possa ser a mesma, a primeira tem mais utilidade como fonte de trabalho
mecânico. Assim, diz-se que tem uma entropia mais baixa. Se conduzirmos um sistema de um
estado de equilíbrio para outro, a quantidade de calor transferido e a quantidade de trabalho
mecânico obtido podem diferir entre dois sistemas que tenham os mesmos estados finais. Mas a
mudança de entropia de um estado para o outro será a mesma. Sendo assim, os estados de equi-
líbrio de um sistema têm uma temperatura absoluta definida e uma entropia definida (a menos
de uma constante arbitrária). Estas, juntamente com várias características mecânicas (ou eléctri-
cas, e assim por diante) — como a pressão e o volume de uma «porção» de gás em equilíbrio —
caracterizam completamente a natureza dos estados de equilíbrio.
Ficamos assim com uma elegante teoria formal do calor. Os sistemas têm estados de equilí-
brio. Quando se transforma um no outro, pode-se produzir ou absorver trabalho mecânico. A
energia pode também ser transferida sem que tal trabalho seja realizado. A isto chama-se «fluxo
do calor». Os estados de equilíbrio caracterizam-se pelas suas temperaturas, e por isso o calor
flúi apenas entre sistemas com temperaturas diferentes. A quantidade de trabalho que se pode
obter numa transição de um estado de equilíbrio para outro depende da temperatura dos esta-
dos. Só se o estado final tiver um zero absoluto de temperatura é que todo o calor disponível
terá sido transformado em trabalho mecânico. Em máquinas não ideais a transformação do ca-
lor em trabalho é irreversível. Isto é, num sistema isolado não se pode transformar calor em tra-
balho e depois fazer algo mais, acabando como se tinha começado de forma a ficar todo o calor
inicial disponível para realizar ainda mais trabalho. Pode-se obter trabalho a partir de calor, e
depois transformar o trabalho de novo em calor. Acabar-se-á com uma quantidade de energia
sob a forma de calor igual à do início, mas esta já não estará tão disponível para conversão em
trabalho mecânico como estava no início. Os estados de equilíbrio não têm apenas característi-
cas mecânicas, como a pressão e o volume; têm também uma temperatura e uma entropia defi-
nidas (ou pelo menos uma entropia definida relativa à atribuição arbitrária de um valor ao nos-
so sistema). A entropia de um estado indica a disponibilidade da sua energia térmica interna
para ser convertida em trabalho. Uma entropia reduzida indica uma disponibilidade elevada.
As leis básicas da teoria são a da transitividade do equilíbrio (lei zero), a da conservação da
energia (primeira lei) e a lei da irreversibilidade (segunda lei). Acrescenta-se por vezes uma ter-
ceira lei, a da impossibilidade de se atingir o zero absoluto.

A teoria cinética do calor

Para alguns físicos, a teoria dos fenómenos térmicos que acabámos de esboçar era perfeita-
mente satisfatória enquanto teoria autónoma fundamental da física. Não viam qualquer razão
para reduzi-la de alguma maneira a uma teoria mais profunda, nem qualquer necessidade de
explicar por que motivo as suas proposições básicas seriam verdadeiras. Mas outros físicos pen-
savam que a teoria precisava de uma explicação mais profunda. Em última análise, o que era o
calor, essa entidade mutuamente convertível em energia mecânica? Qual era a característica dos
sistemas que os fazia terem uma temperatura específica? Por que razão existiam estados de
equilíbrio nos sistemas e, uma vez que existiam, por que motivo tinham a estrutura específica
observada? E (o mais importante de tudo) qual era a origem da estranha assimetria no tempo
do mundo, a assimetria revelada no facto de ao deixar entregues a si próprios os sistemas que
não estivessem em equilíbrio estes se encaminhavam uniformemente para a condição de equilí-
brio, sempre em direcção ao futuro, mantendo-se nessa condição depois de a terem atingido?
Embora Bacon, Bernoulli e outros especialistas tivessem especulado que talvez o calor fosse
uma espécie de energia do movimento de pequenas componentes do sistema macroscópico,
componentes tão pequenas que os seus movimentos individuais eram indetectáveis directamen-
te à escala macroscópica, foi só no século XIX que esta ideia se tornou dominante. Mesmo que o

83
calor fosse movimento, que tipo de movimento seria ele? Afinal, os sistemas podem ter uma es-
trutura microscópica subtil e muito complexa. Dois pensadores britânicos, Herepath e Waters-
ton, sugeriram que no caso dos gases a situação era muito simples. Afirmaram que estes eram
feitos de partículas minúsculas que passavam a maior parte do tempo em movimento livre, es-
tando em interacção apenas quando colidiam entre si e com as paredes do contentor. O conteú-
do térmico de um sistema era apenas a energia deste movimento das partes microscópicas. Mas
as suas sugestões foram ignoradas. Por fim, quando os físicos alemães Krönig e Clausius apre-
sentaram estas ideias, deram-lhes a merecida atenção.
Suponha-se que um gás numa caixa é composto por pequenas partículas maioritariamente
em movimento livre. Se admitirmos pressupostos simples acerca de o calor ser a energia total
deste movimento e acerca de este estar uniformemente distribuído pelas moléculas, podem fa-
cilmente derivar-se resultados como a lei do gás ideal, que dá a relação entre a pressão, o volu-
me e a temperatura do gás em equilíbrio. A pressão resulta de as partículas ressaltarem nas pa-
redes do contentor; e a temperatura é uma medida da sua energia cinética individual. Presu-
mindo que as moléculas colidem entre si, podemos resolver enigmas como o de saber por que
motivo é tão lenta a difusão do gás a partir de uma parte de uma sala até outra dado que as par-
tículas (isto é, as moléculas) estão num movimento tão rápido e quase livre.
O avanço importante que se seguiu consistiu no facto de Maxwell ter compreendido que o
pressuposto de que em equilíbrio cada molécula tinha a mesma velocidade não era plausível.
Ao usar um argumento engenhoso, ainda que não fosse totalmente persuasivo, Maxwell deri-
vou uma curva que dava a distribuição de velocidades para as moléculas no gás em equilíbrio.
Algumas mover-se-iam muito devagar, outras mais depressa, ficando um agregado delas pró-
ximo de um valor médio. Poder-se-ia dar a este resultado uma justificação melhor e mais con-
vincente? Boltzmann deu aqui a sua maior contribuição. Boltzmann perguntou como seria de
esperar que fosse a evolução de um gás que não estivesse em equilíbrio. A evolução ocorreria
em virtude de as moléculas se moverem; e especialmente em virtude de trocarem energia entre
si nas colisões. Será que poderíamos mostrar que, se o gás começasse com uma qualquer distri-
buição de velocidades diferente da de Maxwell, se aproximaria da distribuição de Maxwell
através deste processo de troca de energia, fixando-se depois aí?
Boltzmann foi capaz, partindo de pressupostos plausíveis (um dos quais veremos pormeno-
rizadamente daqui a pouco), de derivar uma equação para a evolução da função da distribuição
de velocidades. Mostrou que a distribuição de Maxwell era uma solução estacionária da equa-
ção; e que, depois de obtida, esta não se alteraria. Boltzmann foi capaz de definir uma função de
distribuição de velocidades e de mostrar que, desde que esta função não obtivesse o seu valor
mínimo (obtido para a distribuição de Maxwell), a distribuição de velocidades não seria estaci-
onária. Por isso, a distribuição de Maxwell era a única solução estacionária para a equação. Se
considerarmos tudo junto, isto parecia mostrar por que razão a evolução de um gás que não es-
tivesse em equilíbrio estaria no sentido do equilíbrio — e por que razão se manteria em equilí-
brio depois de ter atingido esse estado.

============================================
INSERIR A FIGURA DA PÁGINA 113 COM A SEGUINTE LEGENDA:

Figura 3.1 A recorrência de Poincaré. Trabalhamos no espaço de fase onde um ponto único representa o
estado microscópico exacto de um sistema num dado momento, digamos, a posição e a velocidade de to-
das as moléculas de um gás. Poincaré mostra que, relativamente a certos sistemas (um gás confinado nu-
ma caixa e energeticamente isolado do mundo exterior é um desses sistemas), se um sistema começar por
estar num certo estado microscópico, o, então (excepto no que diz respeito a um pequeno número de esta-
dos iniciais que tendem para zero) quando se segue a evolução do sistema ao longo de uma curva, p, des-
cobre-se que o sistema, dada qualquer região restrita de microestados em torno do microestado original, o,
«regressa» a um microestado nessa região restrita, E. Por isso, «quase todos» esses sistemas que começa-
ram por estar num certo estado acabarão por regressar a um estado microscópico «muito próximo» desse
estado inicial.
============================================

Mas aqui começaram os problemas. Primeiro, os críticos notaram que era de esperar que os
sistemas fossem compostos por moléculas que obedecessem à dinâmica clássica. Mas, desde
que qualquer um desses sistemas esteja confinado e desde que a energia seja conservada (e nes-

84
te caso isso acontece), confirma-se a descoberta de Poincaré: um sistema que parta de um certo
estado dinâmico regressará infinitas vezes a estados muito próximos do estado original. Mas,
sendo assim, como poderia Boltzmann ter razão ao defender que um sistema que partisse de
um estado de desequilíbrio evoluiria para o estado de equilíbrio, mantendo-se nesse estado?
Outro resultado da dinâmica clássica diz-nos que se um sistema evoluir de um estado S1 para
um estado S2, evoluirá do estado semelhante ao S2 (mas com as direcções do movimento todas
invertidas) para o estado «temporalmente invertido» do estado S1. Chame-se S1' e S2' aos esta-
dos temporalmente invertidos. Se S2', tal como S2, descrevesse um estado de equilíbrio, e S1',
tal como S1, descrevesse um estado de desequilíbrio, a evolução de S2' para S1' violaria a equa-
ção de Boltzmann, que descreve sempre a evolução em direcção ao equilíbrio. Sendo assim, co-
mo poderá a equação de Boltzmann ser consistente com a dinâmica clássica? (Vejam-se as figu-
ras 3.1 e 3.2.)

============================================
INSERIR A FIGURA DA PÁGINA 114 COM A SEGUINTE LEGENDA:

Figura 3.2 O argumento da «reversibilidade» de Loschmidt. Suponha-se que um sistema parte do micro-
estado a e evolui para o microestado b. Suponha-se que, tal como seria de esperar, a entropia do estado b,
S(b), é maior do que a do estado a, S(a). Então, dada a invariância da inversão temporal das leis dinâmicas
subjacentes que regem a evolução do sistema, tem de haver um microestado, b', que evolua para um mi-
croestado, a', de tal modo que a entropia de b' seja igual à de b e a entropia de a' seja igual à de a (tal como
Boltzmann define a entropia estatística). Assim, para cada evolução «termodinâmica» em que a entropia
aumente, terá de haver uma correspondente evolução «anti-termodinâmica» possível em que a entropia
diminua.
============================================

É neste ponto que as ideias probabilísticas começam a ter um papel a desempenhar em cer-
tas versões da teoria. Poderá dar-se o caso de a equação de Boltzmann descrever, não o modo
como todos os sistemas têm de se comportar, mas apenas o modo como os sistemas provavel-
mente se comportam? Assim, embora seja de esperar a evolução em direcção ao equilíbrio com
uma probabilidade esmagadora, é também de esperar casos raros em que um sistema que não
esteja em equilíbrio evolua ainda mais no sentido contrário ao do equilíbrio ou em que um sis-
tema em equilíbrio evolua para um estado de desequilíbrio. Mas aqui ainda temos de ter muito
cuidado. O teorema da recorrência de Poincaré diz-nos que podemos ter a certeza probabilística
de que os sistemas que começam por estar numa dada condição de desequilíbrio acabarão por
regressar a uma condição de desequilíbrio tão próxima quanto desejarmos da condição inicial.
Sendo assim, como poderá uma aproximação monotónica ao equilíbrio ser provável? E, para
todas as evoluções do desequilíbrio para o equilíbrio, há uma evolução inversa possível. Deste
modo, não deverão as evoluções em ambas as direcções ser igualmente prováveis?
A resposta de Boltzmann, clarificada pelos Ehrenfest, tem várias componentes importantes.
Antes de mais há a descoberta de Boltzmann de uma nova maneira de derivar a velocidade de
distribuição do equilíbrio. Pense-se em todas as formas possíveis de colocar moléculas em pe-
quenas «caixas» num espaço abstracto que corresponda a pequenas regiões de posição e de
quantidade de movimento. A quantidade de movimento é aqui crucial — se usarmos a veloci-
dade ou a energia obteremos resultados errados. Obtemos um novo arranjo movendo uma mo-
lécula de uma caixa para outra. No entanto, muitas das permutações das moléculas poderão
corresponder a um estado de «combinação», isto é, um estado caracterizado pelo número de
moléculas em cada caixa, independentemente de qual das moléculas está numa dada caixa. A
distribuição do equilíbrio é um estado de combinação que corresponde à combinação que se
pode obter com o número esmagadoramente maior de permutações das moléculas nas caixas.
De uma maneira geral, as combinações próximas do equilíbrio podem ser obtidas por meio de
um vasto número de permutações. As combinações que correspondem a estados macroscópicos
distantes do equilíbrio só podem ser obtidas por meio de muitíssimo menos permutações. Se
considerarmos que cada permutação é igualmente provável, usando depois uma espécie de
princípio de indiferença ou simetria, será que não poderemos conceber o equilíbrio como o es-
tado «esmagadoramente mais provável» do sistema?

85
Devemos conceber a situação do seguinte modo: um dado sistema, visto ao longo da totali-
dade do tempo e perpetuamente isolado, passará quase todo o seu tempo em equilíbrio ou per-
to dele. Ocorrerão desvios do equilíbrio, mas, quanto maior for o desvio, mais rara será a sua
ocorrência. A situação será temporalmente simétrica, ocorrendo transições do desequilíbrio pa-
ra o equilíbrio e do equilíbrio para o desequilíbrio com igual frequência. No entanto, verificar-
se-á ainda, tal como se descreve na equação de Boltzmann, que quase todos os estados distantes
do equilíbrio serão seguidos de estados muito mais próximos do equilíbrio. (Veja-se a figura
3.3.)

============================================
INSERIR A FIGURA DA PÁGINA 115 COM A SEGUINTE LEGENDA:

Figura 3.3 A imagem «temporalmente simétrica» de Boltzmann. Nesta imagem do mundo, propõe-se que
um sistema isolado cuja entropia seja Ssistema «ao longo de um período infinito de tempo» se manterá du-
rante quase todo o tempo no estado de equilíbrio, ou seja, em estados cuja entropia será próxima do valor
máximo, Smax. Haverá flutuações aleatórias no sistema que o afastarão do equilíbrio. Quanto maior for a
flutuação de um sistema em relação ao equilíbrio menos frequentemente ela ocorrerá. A imagem é tempo-
ralmente simétrica. Se encontrarmos um sistema afastado do equilíbrio, devemos prever que no futuro ele
se aproximará do equilíbrio. Mas devemos também inferir que no passado ele também esteve mais próxi-
mo do equilíbrio.
============================================

Não podemos pensar, contudo, que a equação de Boltzmann nos dá a evolução mais prová-
vel de um sistema ao longo de um período infinito de tempo, pois isso entraria em conflito com
a recorrência. Devemos ver antes a situação da seguinte maneira: considere-se uma grande co-
lecção de sistemas em que todos partem do desequilíbrio num dado instante. Olhe-se para eles
em intervalos de tempo discretos, registando em cada intervalo de tempo o estado do sistema
que é obtido pela maioria dominante dos sistemas. Trace-se uma curva ao longo desses estados
evoluídos «mais prováveis». Essa curva, a «curva de concentração» da evolução da colecção,
obedecerá à equação de Boltzmann. Quase todos os sistemas acabarão por se afastar do equilí-
brio, mas tais desvios serão incoerentes, verificando-se para sistemas diferentes em instantes di-
ferentes. Depois de um longo período de tempo, quase todos os sistemas estarão próximos do
equilíbrio em qualquer instante especificado, tal como exige a equação de Boltzmann interpre-
tada desta maneira. Sendo assim, esta interpretação probabilística da equação de Boltzmann é
consistente com os resultados da recorrência. (Veja-se a figura 3.4.)

============================================
INSERIR A FIGURA DA PÁGINA 116 COM A SEGUINTE LEGENDA:

Figura 3.4 A «curva de concentração» de uma colecção de sistemas. Considere-se uma colecção de siste-
mas em que cada membro tenha a entropia S1 no instante 1. Os sistemas evoluem de acordo com o seu mi-
croestado específico, a partir de um instante inicial. Em instantes posteriores, 2, 3, 4, 5, 6, …, reexamina-se
a colecção. Em cada instante, a esmagadora maioria dos sistemas apresenta entropias iguais ou próximas
dos valores S2, S3, S4, S5, S6, …, que estão representados na «curva de concentração». Esta curva pode
aproximar-se monotonicamente do valor de equilíbrio Smax mesmo que quase todos os sistemas, individu-
almente, se aproximem e afastem da condição de equilíbrio, tal como se representa na figura 3.3.
============================================

Mas precisamos de reflectir ainda mais. Se, como sugere esta nova interpretação, o equilíbrio
é a condição «esmagadoramente mais provável» de um sistema, por que motivo estará o mundo
em que vivemos imensamente distante do equilíbrio? Boltzmann oferece diversos argumentos
para contornar este facto. Em primeiro lugar, diz, o universo é muito grande no espaço e no
tempo. Podemos postular que a região acessível às nossas observações é muito pequena. Recor-
de-se que este trabalho estava a ser feito na década de 1890 e que a existência de galáxias para lá
da Via Láctea só seria estabelecida algum tempo depois. É de esperar que pequenas porções de
grandes sistemas estejam em estados afastados do equilíbrio durante curtos períodos de tempo.
Por isso, podemos entender o vasto desequilíbrio que observamos como uma «flutuação local»
afastada de uma vasta situação de equilíbrio.

86
Podemos perguntar a seguir por que razão nos encontramos numa tal porção invulgar do
universo e não na dominante região espácio-temporal em equilíbrio. A resposta a isto formula-
se em termos de um tipo de observação especialmente tendenciosa. Para que haja organismos
complexos persistentes (como nós próprios) que possam realizar observações, tem de haver flu-
xos de energia. Só estes podem contrariar o processo normal de equilíbrio e manter em opera-
ção um organismo activo altamente estruturado, como uma forma de vida. Mas tais fluxos de
energia pressupõem uma situação de desequilíbrio. Sendo assim, se há observadores, eles têm
de se encontrar nas pequenas porções desviantes do universo que estão em desequilíbrio.
Ora, é esmagadoramente provável que uma tal parte do universo que esteja em desequilíbrio
seja aquela que estiver ainda mais afastada do equilíbrio num sentido do tempo e mais próxima
na outra. Isto é muito mais comum do que os casos raros e extremos de porções do universo que
sejam pontos de viragem nos quais a região em causa esteja mais próxima do equilíbrio em am-
bos os sentidos do tempo — e ainda mais relativamente provável do que os casos extremamente
raros de um estado afastado do equilíbrio e rodeado, em ambos os sentidos do tempo, por esta-
dos ainda mais afastados do equilíbrio.
Mas por que razão devemos pensar que, na nossa porção do universo, os estados mais pró-
ximos do equilíbrio estão no sentido do futuro e não no sentido do passado? Não são estas duas
opções igualmente prováveis? Neste ponto, Boltzmann defende que «sentido futuro do tempo»
quer dizer o sentido do tempo em que a entropia local está a aumentar, isto é, o sentido do tempo
em que a porção local do universo se está a aproximar do equilíbrio. Boltzmann defende que o
sentido do tempo que conta como futuro será, possivelmente, oposta em regiões separadas do
universo onde o processo em direcção ao equilíbrio se faça em sentidos opostos do tempo. Isto é
exactamente como o «para baixo» de um nosso antípoda na Terra: está no sentido espacial opos-
to ao nosso «para baixo». E, diz Boltzmann, na vasta porção em equilíbrio do universo não ha-
verá distinção entre passado e futuro, embora ainda haja, como é evidente, dois sentidos opos-
tos do tempo. A analogia é com o espaço vazio, onde ainda existem todas as direcções espaciais,
mas onde nenhuma delas tem o sentido «para baixo» na ausência de um sentido local da força
gravitacional. Já a seguir, examinaremos criticamente estas brilhantes ideias de Boltzmann.

A abordagem ergódica da mecânica estatística

Maxwell e Boltzmann ofereceram ocasionalmente um tratamento um pouco diferente da si-


tuação de equilíbrio. A ideia é considerar uma colecção infinita de sistemas que sejam exacta-
mente como o sistema em cujos aspectos macroscópicos especificados estamos interessados.
Poderemos, por exemplo, considerar um gás com uma dada energia interna das suas moléculas
e que esteja confinado a um recipiente de tamanho estipulado. Imaginemos uma colecção em
que cada membro tenha a mesma energia interna que o gás em questão e que esteja confinado a
um recipiente do mesmo tamanho, mas em que cada membro tenha uma diferente condição mi-
croscópica dos seus microcomponentes. Assim, temos em consideração amostras do gás com
características macroscópicas constantes mas em que todas as posições e quantidades de movi-
mento possíveis das suas moléculas estão efectivadas.
Seguidamente, coloca-se sobre estas condições microscópicas uma certa distribuição natural
de probabilidades, de modo a que o estado microscópico do caso que se encontra num domínio
especificado desses estados tenha uma probabilidade definida. A distribuição escolhida é quase
inevitável. Ela deriva, uma vez mais, de uma aplicação de um princípio de indiferença ou sime-
tria. Mas, como notámos na secção sobre probabilidade, aplicar esse princípio implica a escolha
prévia de uma caracterização preferida do sistema que também tem de ser justificada. Podemos
demonstrar que a distribuição de probabilidade especificada não mudará ao longo do tempo.
Isto é, como cada gás da colecção tem a sua mudança de estado microscópico, o número total de
sistemas cujos estados estejam num domínio dado manter-se-ão constantes, apesar de alguns
sistemas permitirem que o seu estado abandone este domínio e de outros permitirem que o seu
estado entre no domínio. Sendo assim, esta probabilidade parece adequada para descrever o
equilíbrio, um estado macroscópico imutável.
A seguir identificamos os observáveis macroscópicos (como a pressão) com médias sobre
uma função dos microestados do sistema, onde as médias são computadas por meio do uso da

87
distribuição de probabilidades em questão. É fácil mostrar que, quando se faz isto, as quantida-
des calculadas estarão relacionadas entre si tal como as encontramos em sistemas em equilíbrio
no mundo.
Este método de calcular os valores de equilíbrio, identificando-os como «médias de fase» de
uma colecção (ou «agrupamento») de sistemas sujeitos a restrições macroscópicas idênticas, foi
formalizado e generalizado por J. Gibbs. Gibbs desenvolveu conjuntos (isto é, distribuições de
probabilidade de microestados de sistemas) apropriados não só para sistemas energeticamente
isolados, mas também para os casos importantes de sistemas mantidos em contacto energético
com um banho de calor de temperatura constante e para sistemas que podem trocar moléculas
com uma fonte exterior.
Note-se que há algumas diferenças subtis entre este método e a outra abordagem de Boltz-
mann. Anteriormente, concebíamos o estado de equilíbrio como o estado microscópico do sis-
tema «esmagadoramente mais provável». Mas agora concebemos as quantidades de equilíbrio
não como as que se verificam nos microestados esmagadoramente prováveis, mas como as mé-
dias das quantidade de todos os estados microscópicos possíveis, incluindo os menos prováveis.
Só se a distribuição de probabilidade de estados microscópicos tiver a característica de ser si-
multaneamente simétrica e com um pico acentuado sobre o estado mais provável é que as duas
quantidades serão (em geral) iguais. Pode-se mostrar relativamente às distribuições de probabi-
lidade usadas na mecânica estatística e às quantidades calculadas com elas que as duas manei-
ras de calcular os valores de equilíbrio concordarão entre si.
Embora a imagem apresentada por Boltzmann e pelos que esclareceram o seu trabalho tenha
alguma plausibilidade, e embora esta nova abordagem evite as contradições óbvias da dinâmica
subjacente presentes na compreensão inicial da teoria, continuam a existir muitos problemas.
Uma coisa é postular tal imagem do comportamento dos sistemas; outra coisa muito diferente é
justificar as afirmações de que os sistemas irão comportar-se como acabaram de ser descritos;
ainda outra coisa é explicar por que razão os sistemas se comportam desta maneira boltzmannia-
na — se é que eles se comportam assim.
Uma das primeiras tentativas de justificar parte dos procedimentos canónicos daquilo a que
podemos hoje chamar mecânica estatística foi uma sugestão inicial de Boltzmann. Caso funcio-
nasse, a sua sugestão justificaria a escolha da distribuição de probabilidade canónica usada no
agrupamento de equilíbrio no que respeita a um sistema energeticamente isolado e forneceria
parte da justificação para a imagem de Boltzmann segundo a qual, ao longo de um período in-
finito de tempo, um sistema está quase sempre próximo do equilíbrio. Suponha-se, diz Boltz-
mann, que o estado dinâmico microscópico de qualquer sistema individual acabará por passar
por todos os estados dinâmicos microscópicos possíveis que sejam compatíveis com as restri-
ções do sistema. Estes limites podem ser dados, por exemplo, pela energia total fixa do sistema
e pelo volume da caixa a que está confinado. Chamemos hipótese ergódica a este pressuposto.
(Veja-se a figura 3.5.)

============================================
INSERIR A FIGURA DA PÁGINA 119 COM A SEGUINTE LEGENDA:

Figura 3.5 A hipótese ergódica. Suponha-se que um sistema parte de um qualquer microestado, represen-
tado pelo ponto a no espaço de fase. Suponha-se que c representa qualquer outro microestado possível do
sistema. A hipótese ergódica postula que mais tarde ou mais cedo o sistema que começou no estado a aca-
bará por passar pelo estado c. Mas, na verdade, podemos demonstrar que o postulado é falso.
============================================

Se a hipótese ergódica fosse verdadeira, muitas coisas se seguiriam dela. A partir dela poder-
se-ia mostrar que a distribuição de probabilidade canónica não é apenas uma distribuição esta-
cionária sob evolução dinâmica, mas a única distribuição desse tipo. Poder-se-ia mostrar não só
que ao longo de um período infinito de tempo um sistema estará quase sempre em equilíbrio ou
próximo dele; poder-se-ia até mostrar que o tempo que o sistema passa com o seu microestado
numa região específica de microestados será exactamente aquela proporção do tempo que essa
região tem enquanto uma proporção do conjunto de todos os microestados disponíveis de
acordo com a medida de probabilidade canónica. Isto permitiria a identificação da «probabili-

88
dade» de um microestado (tal como é determinado pela distribuição de probabilidade canónica)
com um tipo mais físico de probabilidade, a saber, a proporção de tempo que o sistema gasta
enquanto o microestado tem uma característica especificada. Contudo, tudo isto será assim
apenas no limite do tempo infinito. Então, se usássemos o grande número de graus de liberdade
de um sistema (o seu vasto número de moléculas) e as naturezas especiais das funções usadas
para calcular características macroscópicas observáveis, ficaria disponível uma racionalização
bastante completa da identificação das médias calculadas através da medida de probabilidade
canónica com «valores esmagadoramente prováveis». Assim, se concebermos o equilíbrio como
o estado esmagadoramente provável, teremos disponível uma justificação para tomar médias
de agrupamento como representativas do equilíbrio.
Mas Boltzmann não pôde mostrar que a hipótese ergódica é verdadeira. De facto, ela é falsa
e isso pode ser demonstrado em termos topológicos (ou da teoria da medida) muito gerais. Mas,
como veremos, há uma modificação da ideia boltzmanniana que se revelou extremamente fe-
cunda.
Justificar as afirmações da teoria do desequilíbrio que descreve a aproximação ao equilíbrio
de sistemas que começam fora desse estado é ainda mais problemático. A nova imagem de
Boltzmann sugere o seguinte: se partirmos de uma colecção de todos os sistemas possíveis num
dado estado de desequilíbrio, se seguirmos a sua evolução ao longo do tempo e se acompa-
nharmos o estado dominante dos sistemas em cada instante, então a curva que passa por esses
estados dominantes será a curva gerada como a solução da equação de Boltzmann. Mas será
mesmo? E se for, por que razão será que isso acontece? O modo como os sistemas irão efectiva-
mente comportar-se dependerá de duas coisas: do estado dinâmico microscópico de que eles
partiram e das leis da dinâmica que determinam como os seus estados microscópicos evoluirão
a partir desse estado inicial.
Assim, uma teoria estatística do desequilíbrio eficaz deveria dizer-nos qual a probabilidade a
atribuir a uma classe de estados microscópicos iniciais de sistemas preparados numa dada con-
dição inicial de desequilíbrio. Deveria explicar-nos também por que motivo é razoável pensar
que esta distribuição dos microestados iniciais represente genuinamente, de uma maneira
apropriada, o modo como os estados iniciais de sistemas reais estarão distribuídos no mundo. A
seguir, a teoria deveria mostrar porque é que quando a colecção de sistemas evolui ao longo do
tempo — tendo cada sistema individual a sua mudança de microestado de acordo com as leis
da dinâmica dadas — a colecção de sistemas terá a sua distribuição de probabilidade, isto é, a
sua proporção de sistemas em regiões especificadas de microestados possíveis, a evoluir de tal
forma que as últimas colecções acabam por parecer-se cada vez mais com a distribuição de pro-
babilidade apropriada para o equilíbrio.
Compreendeu-se bastante cedo que, na derivação da sua famosa equação de evolução,
Boltzmann dependia de um pressuposto crucial. Ao descrever a evolução das moléculas de um
único gás, presumiu que as frequências das colisões das moléculas com uma dada velocidade
seriam proporcionais às fracções das moléculas no gás que tivessem essa velocidade. Esta é a
sua famosa Hipótese com respeito ao Número de Colisões. Ela presume que não há qualquer
correlação especial entre as moléculas antes da colisão. Na versão estatística da teoria, a evolu-
ção da colecção de gases em direcção à colecção de equilíbrio depende de um pressuposto se-
melhante, o postulado do caos molecular. Presume-se que um pressuposto do carácter «aleató-
rio» das colisões de moléculas é aplicável não só no início da evolução, mas também em cada
instante seguinte. Mas a evolução do conjunto é estabelecida pelo conjunto inicial e pela evolu-
ção dinâmica determinista de cada gás na colecção. Será, então, que postular este caos molecu-
lar é consistente com a colecção inicial apropriada e com estas leis? É certo que, se a evolução for
inteiramente determinada pelo estado inicial e pelas leis, temos de justificar a legitimidade de
fazer um tal pressuposto de re-aleatorização. Em breve exploraremos parcialmente este tema.
É importante notar que é exactamente tal pressuposto de re-aleatorização, aplicado às molé-
culas antes de colidirem, mas não depois de colidirem, que proporciona a fonte da assimetria
temporal na equação de Boltzmann e da sua solução, que descreve a aproximação temporal-
mente assimétrica ao equilíbrio no futuro, mas não no passado. Mas as leis da dinâmica não
mostram qualquer assimetria temporal. Fisicamente, de onde surgirá ela? Haverão assimetrias
escondidas nas leis da dinâmica? Será que a nossa idealização dos sistemas como algo que está

89
isolado do resto do mundo é enganadora? Ou será que a fonte da assimetria é algo acerca da na-
tureza física do mundo que faz um conjunto inicial apropriado — um conjunto que gera a assi-
metria temporal da descrição probabilística de conjunto do mundo e que depois capta na nossa
teoria a assimetria observada do mundo, tal como está resumida na segunda lei da termodinâ-
mica — ser o que devemos escolher? Tais questões, como veremos, continuam a assombrar as
fundações deste assunto.

O problema da irreversibilidade
e as tentativas para o solucionar

Nos anos que se seguiram a este trabalho inovador na mecânica estatística ocorreu um
enorme progresso. Um grande avanço foi a expansão do trabalho inicial no sentido de o aplicar
a sistemas mais gerais do que os gases rarefeitos dos primeiros estudos. A teoria dos sistemas
em equilíbrio foi generalizada de modo a abranger sistemas como gases densos e sistemas de
tipos radicalmente diferentes, como a radiação em interacção com a matéria. Houve menos su-
cesso na generalização da teoria do desequilíbrio a gases não densos porque os métodos de so-
lução aproximada, que funcionam bem no problema do equilíbrio, geralmente fracassam quan-
do se tenta generalizar as equações de desequilíbrio. Mas mesmo aqui realizaram-se alguns
progressos significativos.
Uma grande revisão na teoria ocorreu quando a dinâmica clássica, usada na teoria original
para descrever o comportamento dos constituintes microscópicos, foi substituída pela mecânica
quântica, uma nova teoria dinâmica fundamental. Como veremos no capítulo 4, a mecânica
quântica traz consigo a sua própria descrição probabilística da evolução dos sistemas ao longo
do tempo. Mas o ponto de vista canónico é o de que os elementos probabilísticos da mecânica
estatística continuam a ser insusceptíveis de serem eliminados. Eles descrevem um aspecto pro-
babilístico do mundo que não se reduz a nenhum aspecto probabilístico descrito ao nível da
mecânica quântica. Deste modo, o problema de reconciliar a teoria estatística, ou probabilística,
em que se baseia a termodinâmica com a teoria dinâmica subjacente continua em aberto, mesmo
quando a teoria dinâmica subjacente é a mecânica quântica. Na verdade, devido a certas razões
técnicas, alguns dos argumentos justificativos e explicativos que iremos discutir nesta secção,
argumentos esses que pressupõem que a dinâmica clássica é a teoria dinâmica subjacente, fra-
cassam no novo contexto dinâmico. Explicar os fundamentos dos postulados probabilísticos da
mecânica estatística torna-se um pouco mais difícil, e não mais fácil, no novo enquadramento
dinâmico.
Além da generalização da teoria e da sua reconstrução sobre a nova base dinâmica, traba-
lhou-se muito para fornecer a justificação dos fundamentos da teoria, cuja necessidade já discu-
timos antes. O programa geral é ver como se pode mostrar que muitos dos postulados probabi-
lísticos incorporados na teoria da mecânica estatística não são autónomos. Isto é, queremos des-
cobrir até que ponto se pode fornecer uma fundamentação explicativa em fontes não probabilís-
ticas para os pressupostos probabilísticos (e para o seu uso no cálculo de grandezas observá-
veis). Em particular, aquilo com que temos de trabalhar são os factos sobre a estrutura dos sis-
temas em questão (que o gás é feito de moléculas, por exemplo, e que está confinado a uma cai-
xa) e os factos sobre a teoria dinâmica subjacente (que as moléculas se movem de uma maneira
especificada pela dinâmica clássica, que as suas trocas de energia sob colisão também são des-
critas por essa teoria e assim por diante). Até que ponto podemos derivar os postulados da me-
cânica estatística de que precisamos a partir dos aspectos dinâmicos fundamentais do sistema?
Alguns dos elementos da mecânica estatística que gostaríamos de derivar são a distribuição de
probabilidade canónica usada na teoria do equilíbrio, a identificação de quantidades de equilí-
brio observáveis com médias derivadas a partir desta distribuição de probabilidade, o postula-
do do caos molecular utilizado na teoria do desequilíbrio, e assim por diante. E, caso alguns dos
pressupostos probabilísticos básicos da mecânica estatística não sejam deriváveis deste modo a
partir da estrutura do sistema e da sua dinâmica subjacente, que lugar poderemos dar-lhes no
mundo descrito pela física? Se são postulados autónomos, qual será a razão física que os torna
verdadeiros?

90
Como o resto desta secção sobre o problema da irreversibilidade é bastante denso, esbo-
cemos a sua estrutura. Primeiro, veremos alguns esforços para compreender o estado de equilí-
brio. Depois, discutiremos o problema geral da abordagem do equilíbrio. A seguir, mostrare-
mos a diferença entre algumas abordagens «não ortodoxas» ao problema do desequilíbrio rela-
tivamente às mais canónicas. De seguida, veremos algumas variações da abordagem canónica a
estas questões. Posto isto, veremos o problema de caracterizar a distribuição de probabilidade
inicial que tem de se pressupor. Por fim, veremos algumas tentativas de dar conta do problema
fundamental da irreversibilidade dos sistemas, tentativas essas que trazem à discussão factos
sobre a estrutura global do cosmos.

A caracterização do equilíbrio

Vejamos primeiro o caso da teoria do equilíbrio. Como já fizemos notar, o procedimento


usual para calcular os valores de equilíbrio de quantidades observáveis consistia em identificar
essas quantidades com médias de funções especificadas do estado microscópico do sistema.
Calcula-se a média usando a distribuição de probabilidade habitual. A «imagem» de Boltzmann
da razoabilidade deste procedimento era a de que o sistema isolado permaneceria quase todo o
tempo em equilíbrio ou próximo dele. Como se podia interpretar a medida de probabilidade
habitual como algo que dá a proporção de tempo que um sistema permanece com o seu micro-
estado num dado domínio de condições, e como, além disso, os estados esmagadoramente mais
prováveis dominavam completamente os outros de tal forma que se podiam identificar os valo-
res médios com os valores mais prováveis, a média de uma quantidade calculada através da
medida de probabilidade habitual seria igual ao seu valor esmagadoramente mais provável. Es-
te seria, então, o seu valor de equilíbrio. Como fizemos notar, conseguiu-se justificar estas afir-
mações por meio da Hipótese Ergódica — segundo a qual o microestado de cada sistema acaba-
ria por passar por todos os microestados possíveis. Mas podemos demonstrar que a hipótese
ergódica é falsa. Poder-se-ia encontrar algo que tomasse o seu lugar?
Demonstrou-se um teorema para mostrar que, se um sistema obedece a uma certa restrição
especificada (essencialmente, a ausência de quaisquer constantes «globais» de movimento além
das usadas para especificar o sistema), as médias de fase das quantidades calculadas usando a
medida canónica serão iguais às médias temporais dessas quantidades, pelo menos para quase
todos os sistemas. Isto é, excepto para um conjunto de sistemas cujo tamanho tenha probabili-
dade 0 na medida canónica, a média de tempo infinita de uma quantidade de um dado sistema
à medida que os sistemas evoluem irá igualar a média dessa quantidade considerando todos os
sistemas num certo instante, usando a medida de probabilidade usual para especificar quantos
sistemas têm o seu microestado num dado domínio de tais microestados. Se esta condição fosse
satisfeita, poder-se-ia demonstrar que, para «quase todos» os sistemas, o tempo em que o siste-
ma permanece numa dada região de microestados (a limite, à medida que o tempo tende para
infinito) seria igual à probabilidade dessa região de microestados na medida de probabilidade
canónica. Assim, poder-se-ia derivar uma espécie de «lei dos grandes números» — segundo a
qual, no limite de tempo infinito, as proporções de tempo seriam iguais às probabilidades —,
mesmo que neste caso não estejamos a lidar com ensaios probabilisticamente independentes,
mas com uma evolução determinista. E, se a condição fosse satisfeita, poder-se-ia demonstrar
que a própria medida canónica era a única medida de probabilidade que 1) era invariante no
tempo e que 2) dava a probabilidade zero para classes de microestados que tinham probabili-
dade zero na medida canónica. Estes resultados estão próximos daqueles que se podem obter
usando a falsa hipótese ergódica. (Veja-se a figura 3.6.)

============================================
INSERIR A FIGURA DA PÁGINA 124 COM A SEGUINTE LEGENDA:

Figura 3.6 O teorema ergódico. Suponha-se que um sistema parte de um certo microestado, a. Suponha-se
que R é qualquer região de microestados possível para o sistema dadas as suas restrições. Tais restrições
podem ser uma especificação, por exemplo, da energia total do gás. Suponha-se que R tem um tamanho
definido no espaço de fase diferente de zero. Sendo assim, quando um sistema é ergódico, será o caso que,
excepto possivelmente para um conjunto de microestados iniciais de tamanho 0, a trajectória que parte do
microestado inicial a acabará por passar pela região R.

91
============================================

Mas será que os sistemas interessantes satisfazem alguma vez a condição em questão? Pri-
meiro, encontra-se uma condição dinâmica para que algo seja um sistema conhecido por «sis-
tema ergódico» (isto é, para que satisfaça a condição do teorema esboçado). Esta é uma condi-
ção sobre a instabilidade dos percursos de evolução dos sistemas nas suas descrições de micro-
estados e, essencialmente, exige que para cada microestado haja microestados próximos, de tal
forma que a evolução dos sistemas a partir deles divirja da evolução do estado dado muito ra-
pidamente. Depois, mostra-se que certos modelos de sistemas satisfazem esta condição dinâmi-
ca e são, por isso, sistemas ergódicos. Em particular, o sistema que consiste em «esferas duras
numa caixa» é um desses sistemas ergódicos. As partículas só devem interagir instantaneamen-
te por meio de colisões entre si e com as paredes da caixa, e as colisões devem ser perfeitamente
elásticas. «Perfeitamente elástico» significa que nenhuma energia é absorvida ou emitida nas
colisões. Como este é um modelo canónico que adoptámos para o gás ideal, parece que encon-
trámos uma espécie de racionalização para a teoria do equilíbrio, usando apenas a estrutura do
sistema e as leis da dinâmica que regem os microcomponentes.
Estes resultados são impressionantes. Mas devemos ser prudentes. Primeiro, há o problema
do «conjunto de medida 0». Com o auxílio dos resultados ergódicos, podemos mostrar que, ex-
cepto para um conjunto inicial de condições com probabilidade 0 na medida usual de probabi-
lidade, todos os sistemas terão médias no tempo de quantidades iguais às suas médias calcula-
das usando a probabilidade canónica. Mas por que razão havemos de presumir que só porque
um conjunto tem probabilidade 0 na medida canónica será improvável que um sistema no
mundo venha a ter uma tal condição inicial? Uma vez mais, podemos mostrar que, de todas as
distribuições de probabilidade que atribuem probabilidade 0 àqueles conjuntos a que a distri-
buição canónica de probabilidade dá probabilidade 0, apenas a distribuição usual de probabili-
dade é constante no tempo. Mas por que motivo havemos de restringir a nossa atenção a essas
distribuições de probabilidade que «ignoram» os (isto é, dão probabilidade 0 aos) conjuntos que
têm probabilidade 0 na medida canónica? É como se tivéssemos substituído o nosso postulado
probabilístico original, segundo o qual a medida usual de probabilidade dá as probabilidades
correctas, por um pressuposto de probabilidade mais fraco, mas mesmo assim não trivial, isto é,
um pressuposto segundo o qual podemos ignorar os membros do conjunto de condições iniciais
que tem probabilidade 0 na medida canónica. Estamos a presumir que a sua não ocorrência po-
de ser prevista com «certeza probabilística».
Outro problema importante resulta do facto de que, embora se possa demonstrar que em sis-
temas idealizados (como o das esferas duras numa caixa) se verificam as condições necessárias
para que o teorema ergódico seja verdadeiro, provavelmente essas condições não se verificam
em sistemas mais realistas. As moléculas num gás não são esferas duras perfeitas que não têm
qualquer interacção entre si nem com as paredes do recipiente até que ocorram colisões. Ao in-
vés, há uma interacção suave e gradual entre as moléculas e entre as moléculas e as paredes,
uma interacção que varia com a separação das componentes em interacção. Na mecânica há ou-
tro teorema, o teorema Kolmogorov-Arnold-Moser (ou KAM), que nos diz que, em certos casos
especificados, haverá regiões no espaço de fase com medida não zero tais que o estado de todos
os sistemas cujas condições iniciais estejam nessa região permanecerão nela para sempre. Estes
sistemas têm uma estabilidade que os impede de vaguear por todas as regiões de microestado
possíveis, como exige a ergodicidade. Apesar de não podermos (em geral) demonstrar que os
sistemas realistas satisfazem a condição necessária para que o teorema KAM se aplique, parece
muito plausível que isso aconteça. Assim, as idealizações mais realistas de um sistema não satis-
fariam as condições para a ergodicidade. (Veja-se a figura 3.7.)

============================================
INSERIR A FIGURA DA PÁGINA 125 COM A SEGUINTE LEGENDA:

Figura 3.7 O teorema KAM. A curva fechada, S, representa um sistema que, a partir de um estado inicial,
passa por uma série de estados intermédios, voltando depois ao seu estado inicial exacto e repetindo o
processo, ad infinitum. Um exemplo pode ser um planeta que, se não for perturbado, repete para sempre
uma órbita fechada. O teorema KAM afirma que, nos sistemas que satisfazem as suas exigências, uma per-
turbação suficientemente pequena do sistema (a influência gravitacional de outro planeta, por exemplo)
92
resultará numa órbita que, apesar de não ser já fechada, estará confinada a uma região finita (indicada pelo
tubo T) que circunda (no espaço de fase) a curva inicial S. Assim, este sistema não pode ser ergódico e
«vaguear» no espaço de fase disponível.
============================================

O que gostaríamos de mostrar nestes casos seria algo mais modesto do que a ergodicidade.
Usaríamos o facto de os sistemas reais com que lidamos serem compostos por um vasto número
de microcomponentes, como moléculas. Isto não entra em jogo de forma alguma nos resultados
ergódicos. Depois, tentar-se-ia mostrar que, para tais sistemas, a região de trajectórias estáveis,
exigida pelo teorema KAM, se torna muito pequena na medida de probabilidade natural à me-
dida que o número de componentes de um sistema se torna vasto. De facto, os modelos de
computador parecem mostrar que isto é verdade. A restante região de instabilidade não seria
necessariamente tão caótica como a região instável do sistema ergódico. Mas mesmo que não se
pudesse demonstrar que a ergodicidade se aplica à região de fase como um todo, ou mesmo à
região de instabilidade dominante, talvez fosse possível mostrar que um certo tipo de instabili-
dade se verifica nesta região. Esta região consistiria na esmagadora maioria dos estados iniciais,
medidos da maneira natural. Isto seria suficiente para conseguir algo como os resultados
boltzmannianos. Isto é, seria suficiente para nos garantir que, para trajectórias que partem desta
região, o comportamento temporal a longo prazo poderia ser modelado pelas probabilidades
canónicas. Explorar possibilidades como esta é um projecto de investigação em curso sobre os
fundamentos da mecânica estatística. Contudo, mesmo que se obtivessem tais resultados, a sua
aplicação exigiria o pressuposto de que as regiões de estabilidade, que são pequenas na medida
de probabilidade natural, são realmente «pequenas» no mundo. Precisaríamos de mostrar que é
fisicamente improvável que encontremos um sistema com o seu microestado numa tal região de
estabilidade. Isto não seria derivável a partir da dinâmica subjacente.
Por fim, devemos indicar a estrutura das explicações estatísticas oferecidas por esta teoria do
equilíbrio. Como explica probabilisticamente esta teoria as características do sistema que dizem
respeito ao equilíbrio? Não mostra que elas são características de sistemas que podemos encon-
trar no mundo com uma probabilidade esmagadora. Na verdade, se mostrasse isso teríamos um
problema, uma vez que, como sabemos, é esmagadoramente mais provável que encontremos no
mundo sistemas que não estão em equilíbrio. A teoria nem sequer mostra de uma maneira qual-
quer que as características do equilíbrio são mais prováveis do que aquilo que teríamos previsto
de acordo com os dados de fundo. E a teoria não proporciona uma espécie de abordagem esta-
tístico-causal do equilíbrio. Ela não deriva o equilíbrio de algumas propensões tiquistas causais,
nem deriva a sua probabilidade de alguma distribuição probabilística sobre condições iniciais
causais. Esta abordagem probabilístico-causal, se é que pode ser feita, estará na origem da teoria
do desequilíbrio estatístico-mecânica e da abordagem ao equilíbrio. Em breve ocupar-nos-emos
deste assunto.
Em vez disto, a teoria torna compreensíveis as características dos sistemas que dizem respei-
to ao equilíbrio em virtude de demonstrar que, nas condições apropriadas, as características que
se verificam nos sistemas quando se observa que estes estão em equilíbrio são exactamente as
características que dominam o comportamento de um sistema no decorrer de um tempo infinito
idealizado. Uma vez mais, como já fizemos notar, conseguir que isto fique estabelecido requer
uma idealização substancial. A legitimidade da idealização é disputável. Mas o modelo de ex-
plicação é certamente interessante. Identifica-se uma característica macroscópica com uma mé-
dia da quantidade microscópica que lhe é apropriada, usando uma distribuição de probabilida-
de natural. Racionaliza-se a distribuição de probabilidade mostrando que ela é a única distri-
buição estacionária que atribui probabilidade 0 a regiões a que se atribui probabilidade 0 nessa
mesma medição natural. Mostra-se que o tempo decorrido em regiões de estados microscópicos
no limite infinito é igual ao tamanho da região, dada essa medida natural. E, quando se intro-
duz um grande número de componentes microscópicos, pode-se mostrar que os valores médios
de quantidades são iguais aos valores esmagadoramente mais prováveis, e que estes são iguais
aos valores de equilíbrio canónicos. Por fim, o que é da maior importância, temos o grau com
que se pode dar uma fundamentação firme à naturalidade da medida de probabilidade. Pode-
mos mostrar, relativamente a todas as qualificações que indicámos, que ela é a medida de pro-
babilidade «correcta». A demonstração usa apenas a estrutura do sistema e as leis da dinâmica.

93
Até certo ponto, pelo menos, reduziu-se a necessidade de postular que a medida de probabili-
dade natural é uma parte fundamental e autónoma da teoria. Como veremos, contudo, as coisas
não são tão simples quando é o desequilíbrio que está em questão.

A aproximação ao equilíbrio

Que tipo de teoria devemos procurar para obtermos uma descrição estatística geral da apro-
ximação ao equilíbrio e uma explicação dos fenómenos do desequilíbrio? É de esperar que a
nossa descrição envolva elementos probabilísticos, pois sabemos, a partir da estrutura da dinâ-
mica básica, que os sistemas individuais podem, de facto, comportar-se de uma maneira «con-
tra-termodinâmica». Eles podem não se mover uniformemente de um desequilíbrio inicial para
um estado de equilíbrio. Será no comportamento de uma colecção de sistemas, na qual cada sis-
tema parte da mesma condição de desequilíbrio, que encontraremos a nossa descrição da apro-
ximação ao equilíbrio. Representamos a aproximação ao equilíbrio por meio de algo que diz
respeito à evolução do agrupamento de sistemas, ou, mais rigorosamente, por meio de algo que
diz respeito à evolução de uma distribuição de probabilidade inicial sobre microestados possí-
veis de sistemas compatíveis com a condição de desequilíbrio original do sistema.
Há uma boa maneira de caracterizar o tipo de comportamento que estamos a procurar que
faria justiça às ideias de Boltzmann e dos Ehrenfest já discutidas. Foi Gibbs quem tornou isto
claro. Considere-se uma distribuição de probabilidade de desequilíbrio inicial. Siga-se a sua
evolução, tal como esta é determinada pelas leis da dinâmica que nos dizem como cada sistema
da colecção, caracterizado pela sua microcondição inicial específica, irá evoluir. Poderá esta
mesma distribuição de probabilidade aproximar-se temporalmente da distribuição de probabi-
lidade do equilíbrio para as restrições especificadas? Suponha-se, por exemplo, que temos numa
caixa um gás que parte do lado esquerdo e que o deixamos propagar-se até encher toda a caixa.
Inicialmente, toda a probabilidade está concentrada em estados que correspondem ao gás estar
no lado esquerdo da caixa. Irá esta distribuição de probabilidade inicial aproximar-se daquela
que corresponde à distribuição de equilíbrio para um gás que se propaga uniformemente por
toda a caixa?
Podemos demonstrar que a resposta é negativa. Um teorema fundamental diz-nos que a dis-
tribuição de probabilidade original não pode dispersar-se desta maneira. Mas pode «dispersar-
se». A distribuição de probabilidade inicialmente compacta e regularmente limitada pode trans-
formar-se numa distribuição desenfreadamente fibrilosa que ocupa toda a região de microesta-
dos possíveis de uma maneira «rude» («coarse grained»). À medida que o tempo passa, cada
microestado estará ocupado por um dos sistemas originais ou não. A fracção dos microestados
ocupados manter-se-á constante. Mas passar-se-á de uma situação em que todos os pontos ocu-
pados estão numa região compacta dos estados disponíveis para uma situação em que, com
respeito a qualquer região pequena de microestados possíveis, a mesma proporção dessa região
consistirá em estados ocupados. Gibbs faz uma analogia com a mistura de tinta insolúvel na
água. Embora cada parte do fluido seja sempre, se for vista suficientemente perto, ou tinta ou
água, a tinta, que começou por flutuar por cima da água, acaba por misturar-se uniformemente
por todo o volume permitido. Esta aproximação rude (coarse grained) ao equilíbrio da distri-
buição de probabilidade de desequilíbrio inicial corresponderá satisfatoriamente, enquanto no-
ção formal, às ideias da aproximação ao equilíbrio resumidas pelos Ehrenfests na sua solução
da equação de Boltzmann que representa a «curva de concentração» da distribuição de probabi-
lidade em evolução para a colecção. (Veja-se a figura 3.8.)

============================================
INSERIR A FIGURA DA PÁGINA 128 COM A SEGUINTE LEGENDA:

Figura 3.8 Propagação «rude» («coarse grained») de um agrupamento inicial. A região A representa a co-
lecção de pontos no espaço de fase que corresponde a uma colecção de sistemas, todos eles preparados
numa condição de desequilíbrio macroscopicamente idêntica mas que admite diversos estados iniciais mi-
croscópicos. À medida que os sistemas evoluem de acordo com a dinâmica que rege a mudança de estado
microscópico, A transforma-se em T(A). Segundo uma lei da dinâmica, o tamanho de T(A) tem de ser igual
ao de A, mas enquanto A é uma simples região confinada a uma pequena porção do espaço de fase dispo-
nível, T(A) é uma região complexa e fibrilosa que se propaga por todo o espaço de fase disponível «de

94
uma maneira rude» (coarse grained). Uma distribuição uniforme por todo o espaço de fase disponível é
aquilo que corresponde ao equilíbrio na teoria. T(A) não está realmente propagado uniformemente por
todo o espaço de fase, mas ainda assim podemos considerar que representa uma propagação do agrupa-
mento inicial que representa a aproximação ao equilíbrio.
============================================

Mas será que podemos mostrar que uma probabilidade inicial que corresponda à situação de
desequilíbrio evoluirá, de facto, para a distribuição de probabilidade associada ao equilíbrio de
uma maneira rude (coarse grained)? Podemos obter esse resultado se impusermos à teoria uma
versão geral do postulado do caos molecular. Isso pode tomar formas diferentes, dependendo
do modo como escolhermos modelar matematicamente a evolução da distribuição de probabi-
lidade. Mas em cada caso o postulado, que descende da hipótese de Boltzmann com respeito
aos números de colisão, tem de ser acrescentado às asserções subjacentes acerca da estrutura do
sistema e às leis da dinâmica subjacentes. Como poderemos ter qualquer garantia de que a evo-
lução assim determinada terá, de facto, o tipo de natureza permanentemente «re-aleatorizante»
que é utilizada para derivar a aproximação ao equilíbrio quando se postula o caos molecular?
Há aqui problemas profundos quanto à consistência do postulado com a dinâmica subjacente.

Algumas abordagens não canónicas do problema

Antes de enfrentarmos este problema, exploremos algumas das perspectivas sobre a origem
física da aproximação ao equilíbrio por parte dos sistemas. A teoria ortodoxa presume que os
sistemas em cuja evolução estamos interessados podem ser encarados como se estivessem ge-
nuinamente isolados do mundo exterior. Mas será que este pressuposto é legítimo? A teoria ca-
nónica presume a existência subjacente de leis dinâmicas da natureza que são «invariantes com
respeito à inversão temporal», e procura a assimetria do tempo da termodinâmica e da mecâni-
ca estatística numa outra fonte que não a assimetria subjacente das leis dinâmicas básicas. Será
que este pressuposto é correcto? A abordagem ortodoxa presume que a assimetria no tempo se
baseia numa questão de facto sobre o mundo que requer uma explicação semelhante às explica-
ções físicas oferecidas para outros fenómenos descobertos. Mas será isto correcto, ou será que
podemos encontrar a justificação dos pressupostos probabilísticos da teoria em características
gerais das inferências indutivas e probabilísticas, em vez de procurarmos a sua fundamentação
em factos acerca do mundo físico?
Os métodos canónicos da mecânica estatística tratam os sistemas como se estes pudessem ser
genuinamente isolados do mundo exterior em termos energéticos. Mas, como é óbvio, um tal
isolamento perfeito é impossível. Mesmo que não haja mais nada, há sempre a interacção gravi-
tacional entre o sistema e o meio exterior, uma interacção que nunca pode ser afastada. As for-
ças exercidas pela interacção podem, contudo, ser realmente muito pequenas. Considere-se um
gás que parte do lado esquerdo de uma caixa. Deixe-se este propagar-se por toda a caixa. O de-
fensor do ponto de vista do isolamento puro afirma que a informação acerca do estado original
do gás está implícita nas posições e ímpetos das moléculas no momento posterior. Mas, defende
o intervencionista, mesmo as mudanças infinitesimais do microestado provocadas pelas inte-
racções fracas com o mundo exterior modificarão o microestado do gás, de tal forma que o mi-
croestado real do momento posterior perderá quaisquer correlações que indiquem o estado ma-
croscópico inicial do gás. A inversão temporal deste microestado real, por oposição ao do mi-
croestado ideal, não será um microestado que regressaria à situação que corresponde ao gás es-
tar no lado esquerdo da caixa; será antes um de entre um número esmagadoramente grande de
microestados que correspondem à situação em que o gás se mantém disperso. Poder-se-ão eli-
minar desta forma os paradoxos da reversibilidade?
A maioria dos especialistas pensa que não. Há casos especiais em que o isolamento é sufici-
ente para se construir um tipo genuíno de reversão de um estado. Podemos construir um mi-
croestado que leve o sistema a mostrar um comportamento anti-termodinâmico. A experiência
de eco do spin é um destes casos. Núcleos com momentos magnéticos evoluem de um estado
macroscopicamente ordenado para um estado aparentemente desordenado de equilíbrio. Uma
vibração rádio pode fazer os núcleos «voltarem-se», de tal forma que o sistema parece regressar
espontaneamente à sua original condição ordenada de desequilíbrio. Neste caso, o isolamento é

95
suficiente para que o microestado posterior do sistema em equilíbrio retenha informação sobre
o estado de desequilíbrio original. A experiência pode mesmo ser conduzida quando os núcleos
interagem magneticamente entre si. Contudo, até ao momento em que os núcleos «se voltam», o
sistema parece mostrar a habitual aproximação macroscópica ao equilíbrio, indicando que de-
vemos dar conta de tal comportamento mesmo quando o isolamento é «perfeito». A maior parte
dos físicos estão ainda convencidos de que mesmo os sistemas perfeitamente isolados do ambi-
ente exterior mostrariam a assimetria temporal caracterizada pela segunda lei. (Veja-se a figura
3.9.)

============================================
INSERIR A FIGURA DA PÁGINA 131 COM A SEGUINTE LEGENDA:

Figura 3.9 A experiência do eco de spin. A fila superior da figura representa uma colecção de núcleos em
spin cujos spins estão todos alinhados na mesma direcção, num plano perpendicular a um campo magnéti-
co imposto no cristal cujos átomos têm os núcleos em questão. Na segunda fila já decorreu um certo perío-
do de tempo. As direcções dos spins sofreram uma precessão, a velocidades diferentes, em torno do campo
magnético imposto, de tal forma que embora neste ponto os spins continuem no mesmo plano, apontam
agora em todas as direcções «ao acaso». Na terceira fila, os spins foram «virados» por uma vibração de fre-
quência de rádio. Os spins que estavam «à frente de todos» na «precessão» estão agora «atrás de todos». A
fila inferior mostra o resultado. O tempo é agora o dobro do que decorreu da fila superior para a segunda
fila. Os spins «apanharam-se» agora uns aos outros, fazendo-os todos apontarem uma vez mais na mesma
direcção. Da terceira fila para a fila inferior parece que uma condição de equilíbrio (spins ao acaso) evoluiu
espontaneamente para uma condição de desequilíbrio (spins todos alinhados).
============================================

Os enigmas canónicos acerca da reversibilidade também presumem que as leis da dinâmica


subjacentes têm a propriedade da invariância da inversão temporal. Isto implicaria que o mi-
croestado inverso de um sistema que tenha evoluído a partir do desequilíbrio seria um microes-
tado que evoluiria para o inverso temporal do microestado em desequilíbrio original. Esta seria
uma evolução que regressaria a uma situação de desequilíbrio. Poderá este pressuposto da si-
metria temporal para as leis dinâmicas subjacentes estar errado, de tal modo que a este nível da
dinâmica fundamental a assimetria temporal seja realmente a fonte da assimetria termodinâmi-
ca? A maior parte dos especialistas pensa que não. As leis da dinâmica clássica e, como se de-
fende habitualmente, também as da dinâmica quântica, são temporalmente simétricas no senti-
do geralmente aceite. Na verdade, esta é uma questão que pode ser controversa no que diz res-
peito à mecânica quântica. Como veremos no capítulo 4, na visão do mundo da mecânica quân-
tica há um processo conhecido por «medição» que encerra em si um tipo especial de assimetria
temporal. A própria natureza e origem dessa assimetria é controversa. Há quem a atribua à as-
simetria termodinâmica, que tomam como a assimetria fundamental. Mas a opinião geral é a de
que as assimetrias comuns da termodinâmica não têm a sua origem em nenhuma dessas assi-
metrias de medição da mecânica quântica, e de que se tem de procurar a fonte da assimetria na
mecânica estatística ou em qualquer outro lugar.
É interessante constatar que há fenómenos na natureza que parecem requerer leis fundamen-
tais temporalmente assimétricas. Estes fenómenos tornam-se evidentes no estudo de certas inte-
racções no domínio da teoria do campo quântico. Parece que encontramos aqui processos que
são possíveis de acordo com as leis fundamentais, mas cujas inversões temporais naturais são
impossíveis. Mais exactamente, as probabilidades do processo não são invariantes sob a inver-
são temporal. Realizou-se algum trabalho que pretende mostrar que não poderia surgir desses
fenómenos qualquer explicação para as assimetrias comuns de que nos ocupamos aqui, mesmo
que esses fenómenos revelem que há no mundo uma não invariância da inversão temporal ge-
nuinamente legiforme.
Por fim, há a escola que procura justificar as aplicações da probabilidade à mecânica estatís-
tica não na descoberta de proporções efectivas no mundo ou em alguma característica especial
das leis e estruturas dos sistemas, como a ergodicidade, mas em princípios gerais do raciocínio
indutivo. Defende-se que, no caso do equilíbrio, a justificação para a medida de probabilidade
habitual é o princípio da indiferença. Este diz-nos que, na ausência de outros dados, devemos
tratar do mesmo modo, em termos de peso probabilístico, todos os casos simétricos admitidos
pelos dados de que dispomos. Mas, como já fizemos notar, o princípio da indiferença é vazio

96
até se oferecer uma maneira definitiva de caracterizar os sistemas. Onde poderão os «indutivis-
tas» encontrar isto se não nas características da dinâmica e da estrutura?
No caso do desequilíbrio, os indutivistas defendem que, enquanto a situação for «susceptível
de ser experimentalmente reproduzida» ao nível macroscópico, podemos justificar o ponto de
vista segundo o qual a entropia aumenta ao longo do tempo. A ideia é que só é de esperar que
sistemas identicamente preparados nas suas características macroscópicas evoluam em direcção
a sistemas parecidos nas suas características macroscópicas se houverem muitos mais microes-
tados a corresponder à situação macroscópica final do que a corresponder à situação macroscó-
pica original. Mas um tal aumento de microestados que correspondem a um macroestado evo-
luído é exactamente a noção da mecânica estatística de entropia estatística crescente. Bem, isso é
verdade, mas o que queríamos explicar era por que razão há uma reprodutibilidade experimental
dos sistemas quando estes são descritos macroscopicamente. Por que razão será que se podem
fazer descrições simples, em termos de um pequeno número de parâmetros que evoluem de
uma maneira legiforme, de sistemas compostos por um vasto número de componentes? E por
que razão será que a evolução dos sistemas, quando macroscopicamente descritos deste modo,
se processa sempre na mesma direcção do tempo quando se considera o movimento em direc-
ção ao equilíbrio? E, se quisermos, por que razão será que todas essas experiências são experi-
mentalmente susceptíveis de serem reproduzidas na mesma direcção do tempo, não havendo
pelo menos algumas experiências susceptíveis de serem reproduzidas na direcção inversa do
tempo? E por que razão será que esta direcção do tempo é aquela que concebemos como o futu-
ro?
Se virmos um sistema num estado de desequilíbrio, só somos capazes de inferir os seus es-
tados em instantes diferentes numa direcção do tempo. Sabemos que um sistema que está quen-
te numa extremidade e frio na outra ficará mais tarde totalmente morno, embora não sejamos
capazes de inferir a partir de uma barra morna o estado de desequilíbrio de onde ela veio, pois
muitas condições de desequilíbrio evoluem em direcção ao mesmo estado de equilíbrio. Mas por
que razão existirão tais caracterizações macroscópicas, assim como o seu comportamento legi-
forme? Por que razão evoluirão os sistemas paralelamente ao longo do tempo? Por que razão a
direcção da aproximação ao equilíbrio é a direcção do futuro? Estes são os factos que queríamos
ver explicados. A linha indutivista parece limitar-se a pressupor que os fenómenos em questão
existem, e depois indica as consequências da sua existência e o que a sua existência e natureza
pressupõem quanto à evolução microscópica dos sistemas. Mas o que antes de mais queríamos
ver explicado era por que razão será o fenómeno desta maneira.

Algumas abordagens canónicas do problema

Regressemos à escola de pensamento ortodoxa. Considere-se um sistema energeticamente


isolado do resto do mundo que esteja numa condição de desequilíbrio. Como deveremos repre-
sentar a sua aproximação ao equilíbrio na mecânica estatística? Bem, consideramos todas as
condições possíveis dos seus componentes microscópicos, compatíveis com o estado original,
em desequilíbrio, do sistema. Imaginamos uma vasta colecção (na verdade, infinita) de sistemas
que tenham todos os microestados iniciais possíveis, e impomos uma distribuição de probabili-
dade a esses microestados. Imaginamos agora cada sistema individual da colecção a evoluir de
acordo com a sua estrutura e com as leis dinâmicas que regem a dinâmica dos microcomponen-
tes. Queremos mostrar que, dada a distribuição de probabilidade original e dadas essas leis, tem
lugar uma evolução das distribuições de probabilidade que, num sentido ou noutro, avança em
direcção à distribuição de probabilidade do equilíbrio que corresponde às restrições impostas
ao sistema.
Uma primeira questão a colocar é a de saber como deverão ser as distribuições de probabili-
dade iniciais. Só um número limitado de casos está bem compreendido. Um dos casos é aquele
em que o sistema, embora não esteja em equilíbrio, começa por estar próximo do equilíbrio. Um
outro caso, mais geral, é aquele em que se pode considerar que o sistema, embora não esteja em
equilíbrio, tem regiões suficientemente pequenas que estão suficientemente próximas do equilí-
brio por períodos de tempo suficientemente pequenos. Assim, no último caso, embora não pos-
samos atribuir ao sistema uma densidade, pressão, temperatura ou entropia, podemos conside-

97
rar que ele parte com uma certa distribuição de densidade, pressão, densidade de entropia e
temperatura. O gás que parte do lado esquerdo da caixa tem uma densidade elevada uniforme
em metade do espaço físico permitido e uma densidade de zero na outra metade. A barra de
ferro que começa por estar quente numa extremidade e fria na outra não tem uma temperatura;
tem uma distribuição de temperatura ao longo do comprimento da barra. Nestes casos, as re-
gras que generalizam a forma pela qual o princípio da indiferença foi aplicado para se obter a
distribuição de probabilidade do equilíbrio podem ser plausivelmente aplicadas para se obte-
rem as distribuições de probabilidade de desequilíbrio iniciais. Nos casos em que nem sequer se
pode presumir o «equilíbrio temporário local», não é claro qual será a nossa distribuição de
probabilidade inicial. Mas, uma vez mais, nesse caso não há realmente uma teoria macroscópica
que descreva a aproximação ao equilíbrio a ser derivada e explicada.
Será que podemos mostrar, usando apenas a estrutura do sistema e a dinâmica dos micro-
constituintes, sem recorrer a um postulado de re-aleatorização perpétua do tipo do caos mole-
cular, que esta distribuição de probabilidade inicial se aproximará da distribuição do equilíbrio,
pelo menos da maneira rude (coarse grained) sugerida por Gibbs? Em alguns casos podemos —
ou quase. Nos casos para os quais se pode demonstrar a ergodicidade na teoria do equilíbrio,
como o caso das esferas duras numa caixa, também podem demonstrar-se por vezes resultados
mais fortes.
A ergodicidade não é suficiente para os nossos propósitos. Imagine-se uma vasta colecção de
sistemas em que todos estão preparados numa dada condição de desequilíbrio. Eles poderiam
ser todos ergódicos, evoluindo de tal maneira que, ao longo de um período infinito de tempo,
estariam geralmente em equilíbrio ou próximo dele. Contudo, como um todo, a colecção pode
não se aproximar do equilíbrio. Pode haver uma aproximação regular e uniforme a partir do
equilíbrio e na direcção do equilíbrio dos sistemas de uma maneira sincronizada, de tal for-
ma que a distribuição de probabilidade sobre todos os sistemas não exiba uma aproximação
uniforme ao equilíbrio nem mesmo da maneira rude (coarse grained). Isto é, podem haver
instantes no futuro em que a distribuição de probabilidade esteja a afastar-se da distribuição do
equilíbrio, apesar de cada um dos sistemas individuais passar a maior parte do seu tempo em
equilíbrio individual ou próximo dele.
No entanto, pode demonstrar-se um resultado mais forte do que a ergodicidade, a «mistu-
ra», para sistemas idealizados como o das esferas duras numa caixa. A mistura diz-nos, apro-
ximadamente, que se partirmos de uma distribuição de probabilidade inicial «não patológica»,
ela aproximar-se-á, pelo menos no limite em que o tempo tende para o infinito, da distribuição
de probabilidade do equilíbrio, no sentido rude (coarse grained). «Não patológica» significa,
essencialmente, que a distribuição de probabilidade inicial dará probabilidade zero a qualquer
região de microcondições que tenha probabilidade zero na medida canónica conhecida.
Na verdade, podem-se demonstrar resultados mais fortes do que a mistura para tais siste-
mas. Pode-se demonstrar que eles são sistemas K. Ser um sistema K é ter um tipo de «indeter-
minação probabilística» rude (coarse grained). Suponha-se que pensamos que os microestados
dos sistemas estão agrupados em pequenas colecções de microestados. Se um sistema for um
sistema K, não conseguiremos determinar com probabilidade 1 ou 0 em que subcolecção estará
o microestado de um sistema num certo instante, mesmo que saibamos em que subcolecção es-
tava o microestado do sistema em todos os instantes anteriores, discretamente separados, recu-
ando infinitamente para o passado. A única excepção seria se aquela em que fosse trivialmente
verdade que o sistema tem uma probabilidade de 1 ou 0 de ter o seu microestado na subcolec-
ção designada.
E, o que é ainda mais forte, pode-se demonstrar que certos sistemas são sistemas de Ber-
noulli. Isto significa que se podem construir conjuntos de subcolecções de microestados que são
tais que as descrições de tempo infinito da subcolecção em que está o microestado de um siste-
ma em todos os instantes de observação determinam inteiramente a evolução estatística da dis-
tribuição de probabilidade. Mas a informação sobre onde um sistema tem estado nas subcolec-
ções ao longo do passado não dá qualquer informação probabilística para determinar em que
subcolecção estará ele no instante seguinte de tempo. Quando se trata de saber em que subco-
lecção estará o microestado, o sistema, embora evolua de uma maneira determinista, comporta-
se exactamente como os resultados de séries de lançamentos de moedas probabilisticamente in-

98
dependentes. Por isso, o determinismo ao nível do microestado exacto é compatível com o
comportamento mais aleatório que se possa imaginar ao nível rude (coarse grained). (Veja-se a
figura 3.10.)

============================================
INSERIR A FIGURA DA PÁGINA 135 COM A SEGUINTE LEGENDA:

Figura 3.10 Um agrupamento de mistura.  é uma região do espaço de fase para o sistema em que o ponto
de fase para o sistema está localizado. A e B são duas regiões de pontos de tamanho não zero no espaço de
fase. B mantém-se constante. Acompanhamos a evolução de sistemas cujos microestados iniciais estão na
região A. O resultado é uma série de regiões T(A) à medida que o tempo avança. Um sistema de «mistura»
é aquele em que a região A evoluirá para a região T(A) no limite em que «o tempo tende para a eternida-
de». Esta região T(A) está uniformemente distribuída pelo espaço de fase no sentido rude (coarse grained).
Para que isto seja o caso, é forçoso que no limite de tempo infinito a proporção de qualquer região B ocu-
pada por pontos que evoluíram a partir da região A seja igual à proporção do espaço de fase originalmente
ocupada por pontos na região A.
============================================

Será que esses resultados resolvem, de uma vez por todas, todos os enigmas acerca da apro-
ximação ao equilíbrio? Certamente que não. Para começar, há o facto de que, quando aplicamos
a mistura para modelar a aproximação ao equilíbrio, temos que ignorar «conjuntos de medida
zero». Quando presumimos que podemos ignorar as distribuições de probabilidade iniciais pa-
tológicas em que a probabilidade não zero está concentrada em colecções de microestados que
têm probabilidade zero na medida canónica, estamos a presumir que tais colecções de microes-
tados podem ser ignoradas. Uma vez mais, este é um pressuposto probabilístico que não é deri-
vável da estrutura dos sistemas ou da dinâmica.
Depois, há o problema de a maior parte dos sistemas realistas não satisfazerem as condições
necessárias para que a mistura se verifique. Isto acontece porque eles estão (provavelmente)
dentro do domínio do teorema KAM. Uma vez mais, isto exige a existência de regiões de micro-
estados não zero que gerem trajectórias estáveis, trajectórias que não vagueiem por toda a regi-
ão de microestados disponível. Tal como isto tornou a ergodicidade impossível para os casos
mais realistas na teoria do equilíbrio, torna também impossível o resultado mais forte da mistu-
ra. Tal como antes, neste ponto será preciso recorrer, de alguma maneira, ao grande número de
constituintes do sistema e a algum argumento que mostre que as regiões de estabilidade serão
muito pequenas e que fora dessas regiões o movimento será suficientemente caótico para gerar,
se não a mistura em sentido puro, pelo menos algum substituto razoável dela.
Mas há uma dificuldade muito maior do que estas para quem queira fundar a aproximação
ao equilíbrio apenas nos resultados da mistura. Se o sistema é de mistura, então qualquer dis-
tribuição de probabilidade inicial não patológica sobre os seus microestados aproximar-se-á ru-
demente (coarsely) da distribuição de probabilidade do equilíbrio no limite de tempo infinito.
Mas que acontecerá a «curto prazo», isto é, nos intervalos de tempo que correspondem àqueles
em que estamos interessados, os períodos de tempo típicos que um sistema em desequilíbrio
demora a aproximar-se do equilíbrio?
A mistura é compatível com qualquer comportamento a curto prazo que se possa imaginar.
A distribuição de probabilidade do desequilíbrio pode aproximar-se rudemente (coarsely) da
distribuição do equilíbrio, afastar-se dela, permanecer uma distribuição em desequilíbrio ou se-
guir qualquer padrão de aproximações, recuos ou estagnações e continuar mesmo assim a ser a
distribuição de probabilidade para um sistema de mistura. Mas o que queremos modelar é a
aproximação ao equilíbrio uniforme e a curto prazo de sistemas em desequilíbrio reais. O que
será preciso acrescentar ao facto de um sistema ser de mistura para nos assegurar de que o nos-
so modelo terá essas características?
Pode-se também ver que por si mesma a mistura não é suficiente para responder a todas as
nossas questões fazendo notar que ela é uma noção temporalmente simétrica. Qualquer distri-
buição de probabilidade inicial não patológica para um sistema de mistura evoluirá também, à
medida que o tempo recua infinitamente para o passado, para uma distribuição de probabilida-
de que é rudemente (coarsely) semelhante à distribuição do equilíbrio. Não é surpreendente
que qualquer sistema que é de mistura para o futuro seja de mistura para o passado. Afinal, o
carácter de mistura de um sistema segue-se da sua estrutura e das leis dinâmicas subjacentes
99
temporalmente simétricas. Naturalmente, a assimetria temporal da termodinâmica, e a da me-
cânica estatística com que queremos sustentar a teoria macroscópica, não podem ser derivadas
apenas dos elementos da estrutura e da microdinâmica. Mais uma vez, tem de se acrescentar
mais alguma coisa.
Discutiremos por momentos o elemento adicional necessário, mas primeiro façamos notar
que a abordagem à mecânica estatística do desequilíbrio que acabámos de discutir não é a única
maneira de tentar racionalizar a teoria do desequilíbrio. Há uma abordagem importante e bas-
tante diferente; o seu contraste com a abordagem que acabámos de discutir é esclarecedor. Cer-
tos resultados dizem-nos que, se idealizarmos um sistema de uma maneira apropriada — em
particular, deixando que o número das moléculas do gás atinja o infinito, que a densidade do
gás atinja o valor zero e que o tamanho das moléculas do gás atinja zero por comparação com o
tamanho da caixa (o chamado «limite de Boltzmann-Grad») —, então poderemos mostrar que
para períodos de tempo suficientemente pequenos «quase todos» os sistemas (isto é, todos os
sistemas excepto um conjunto de probabilidade zero) evoluirão segundo a maneira descrita pe-
la equação de Boltzmann. Esta é a «derivação rigorosa da equação de Boltzmann».
Ora, pode demonstrar-se que estes resultados se verificam apenas para períodos de tempo
que são uma fracção do tempo previsto entre a colisão de uma molécula com outra e depois
com outra. Mas há alguma razão para pensar que estes resultados são verdadeiros, embora se-
jam indemonstráveis, para períodos de tempo mais longos. Este resultado, ao contrário do da
mistura, fornece uma justificação para considerar que a descrição estatística habitual se verifica
mesmo a curto prazo e para considerar que a evolução tem a natureza unidimensional prevista.
Mas os resultados aqui referidos são realmente enigmáticos. Suponha-se que consideramos
que o resultado se aplica para todo o tempo, mesmo quando o tempo avança para o infinito. Te-
remos, então, uma contradição com o teorema da recorrência. Este novo resultado diz-nos que
quase todos os sistemas evoluirão para o equilíbrio e aí permanecerão, mas o teorema da recor-
rência diz-nos que quase todos os sistemas regressarão infinitas vezes à sua condição de dese-
quilíbrio original. E o resultado também é incompatível com a mistura. Não há qualquer con-
tradição matemática, como é óbvio, dado que aqui só se demonstra que os resultados se verifi-
cam para períodos de tempo pequenos e finitos. E, o que é mais importante, eles apenas se veri-
ficam no limite indicado. Nesse limite já não podemos representar o comportamento do sistema
como um fluxo de trajectórias a partir dos microestados iniciais, de tal forma que as condições
necessárias para demonstrar a recorrência e a mistura já não são válidas.
Mas o mais interessante não é a ausência de contradição matemática. O mais importante é
que, de um ponto de vista conceptual, este modelo da aproximação ao equilíbrio, um modelo
que tenta mostrar que numa idealização apropriada é altamente provável que um sistema evo-
lua do desequilíbrio para o equilíbrio e que se mantenha depois em equilíbrio, está em desacor-
do considerável com a idealização mais conhecida desde a clarificação do programa de Boltz-
mann realizada pelos Ehrenfests. Nesta idealização mais conhecida, aceita-se a recorrência e a
mistura é a idealização que se procura para o comportamento de desequilíbrio. Espera-se que a
solução da equação de Boltzmann represente não o que quase todos os sistemas farão, mas «a
curva de concentração» da evolução da distribuição de probabilidade. Não é «a evolução mais
provável», mas «a evolução das condições mais prováveis», que representa a aproximação ao
equilíbrio.
A existência destas duas abordagens mostra que ainda não há um acordo real acerca de qual
é a idealização correcta a usar na tentativa de representar o comportamento termodinâmico em
termos de comportamento dinâmico microscópico e de probabilidades. Um conflito genuíno
sobre o modo como se deve construir a teoria da mecânica estatística final e sobre o modo como
se deve considerar que essa construção representa o mundo continua a dividir a comunidade
dos especialistas. Devemos fazer notar que os problemas que resultam da introdução da assime-
tria do tempo para a abordagem da mistura, à qual voltaremos em breve, surgem também nesta
alternativa da «derivação rigorosa da abordagem de Boltzmann». E devemos fazer notar quão
diferentes são os papéis da grande dimensão dos sistemas nas duas abordagens. Na abordagem
da mistura, o vasto número de microcomponentes surge apenas no final da discussão, no mo-
mento em que queremos passar de valores médios de quantidades para valores de quantidades
esmagadoramente mais prováveis. Na outra abordagem, contudo, o facto de o sistema ser bas-

100
tante diluído e de ter inúmeros componentes pequenos é crucial para a idealização desde o iní-
cio. Mesmo um sistema de duas esferas duras numa caixa é de mistura, mas o limite de Boltz-
mann-Grad é crucial para a derivação rigorosa da equação de Boltzmann.

O problema das distribuições de probabilidade iniciais

Por agora, trabalhemos no contexto da idealização que se baseia na mistura do agrupamento


inicial para representar a aproximação ao equilíbrio. Como já fizemos notar, mesmo que o sis-
tema seja de mistura, podem encontrar-se agrupamentos iniciais, isto é, distribuições de proba-
bilidade iniciais sobre os microestados compatíveis com a condição macroscópica de desequilí-
brio original, que mostrarão a aproximação apropriada rude (coarse grained), uniforme e a cur-
to prazo, a uma distribuição de probabilidade de equilíbrio. Mas podem também encontrar-se
agrupamentos iniciais que mostrarão qualquer outro tipo de comportamento a curto prazo.
Considere-se, por exemplo, a distribuição de probabilidade de microestados que emerge quan-
do uma distribuição ainda mais em desequilíbrio evolui da forma prevista para uma dada dis-
tribuição compatível com a condição do gás em desequilíbrio. O reverso temporal dessa última
distribuição de probabilidade será uma distribuição de probabilidade sobre microestados com-
patíveis com a condição de desequilíbrio do nosso sistema que evoluirá para uma condição de
ainda menos equilíbrio. (Veja-se a figura 3. 11.)

============================================
INSERIR A FIGURA DA PÁGINA 138 COM A SEGUINTE LEGENDA:

Figura 3.11 Reversibilidade ao nível do agrupamento. Suponha-se, como em (a), que A é uma região do
espaço de fase que evolui ao longo do tempo para uma região fibrilosa, T(A). Pode-se mostrar depois, co-
mo em (b), que tem de haver uma região fibrilosa de pontos de fase, T-1 (A’), que evolui para uma região
simples e compacta, como A’, à medida que o tempo avança para o futuro. Além disso, tanto A’ como a
região da qual ela veio serão iguais em tamanho a A e ao seu sucessor fibriloso.
============================================

Assim, para se conseguir a aproximação ao equilíbrio certa, a curto prazo, uniforme e rude
(coarse grained), precisamos de partir de uma distribuição de probabilidade inicial «apropria-
da». Essencialmente, queremos que a probabilidade seja distribuída uniformemente (relativa-
mente à medida canónica) sobre uma região de microestados que não seja demasiado pequena e
que tenha uma forma regular. A exigência de um tamanho suficiente destina-se a assegurar que
a distribuição inicial se espalhe rudemente (coarsely) com suficiente rapidez para representar o
«tempo de relaxação» efectivo que os sistemas reais levam a chegar ao equilíbrio. A exigência
de uma forma regular destina-se a excluir as regiões que podem ser construídas de forma a re-
presentar o comportamento anti-termodinâmico.
Mas por que razão deverão ser escolhidas tais distribuições de probabilidade iniciais? O que
há na natureza do mundo que as tornam os agrupamentos iniciais correctos a escolher de modo
a obter os resultados que representam o mundo tal como é? O físico Krylov ofereceu uma abor-
dagem para este problema. Krylov começa com uma crítica àqueles que ofereceriam como ex-
plicação da natureza especial dessas distribuições de probabilidade iniciais apenas a ideia de
que é dessa maneira que a probabilidade parece estar distribuída sobre estados iniciais no
mundo. Estes especialistas negariam que fosse possível qualquer explicação mais profunda. (Os
filósofos falam por vezes da natureza «meramente de facto» da segunda lei, querendo dizer com
isso que «acontece pura e simplesmente que os estados iniciais estão distribuídos desse modo».)
Krylov insiste que esta abordagem não fará justiça à natureza legiforme, ainda que apenas esta-
tisticamente legiforme, da segunda lei. Krylov defende também que não pode fazer justiça ao
facto de que, para sistemas intermédios no processo de evolução de um desequilíbrio inicial pa-
ra uma condição de equilíbrio, uma tal distribuição de probabilidade uniforme relativa à sua
descrição macroscópica intermédia não pode ser verdadeira relativamente a eles, pois sabemos
que eles vêm de um estado inicial especificado ainda mais afastado do equilíbrio. Mas tais sis-
temas obedecerão ainda à segunda lei.
Krylov, cuja teoria positiva nunca recebeu uma exposição adequada devido à sua morte
prematura, explica a natureza especial da distribuição de probabilidade inicial apoiando-se
101
num argumento retirado das tentativas iniciais para compreender a mecânica quântica. No ca-
pítulo 4 discutiremos o chamado «princípio de incerteza» da mecânica quântica. Este princípio
diz-nos que é impossível especificar simultaneamente a posição e a velocidade de uma partícula
dentro de graus de precisão arbitrários. Uma das primeiras interpretações deste princípio, que
já não é aceite pela maior parte daqueles que pensam acerca destes assuntos, foi a de que a ten-
tativa da nossa parte de medir uma das duas quantidades interferia fisicamente com o sistema,
de tal forma que «perturbava» o valor existente da outra quantidade. Era esta interacção física
do observador com o sistema observado que gerava a «incerteza». Krylov defende que a sensi-
bilidade de um sistema a uma pequena perturbação no seu estado inicial, de tal maneira que
uma ligeira variação na posição ou na velocidade de uma única molécula mudará amplamente
a microevolução futura do sistema, dá-nos um princípio de incerteza a um «nível mais elevado»
quando lidamos com sistemas da termodinâmica. É esta interferência com o sistema quando es-
te está preparado na sua condição de desequilíbrio que faz a distribuição de probabilidade so-
bre os microestados ter o seu tamanho grande e a sua regularidade apropriados.
Não é claro como isto poderia funcionar nos seus pormenores. Mas também há um proble-
ma mais profundo. O que constitui a «preparação» de um sistema? Suponha-se que olhamos
para um sistema que está em desequilíbrio quando é criado (isto é, separado energeticamente
do resto do universo). Olhamos também para ele quando é destruído (isto é, reintegrado no
mundo exterior). É apropriado presumir que, a partir da sua condição de desequilíbrio inicial,
este se aproximará do equilíbrio. Deste modo, a distribuição de probabilidade apropriada sobre
os microestados no instante inicial é a distribuição canónica. Mas, se fizermos a mesma suposi-
ção relativamente ao estado final do sistema, seremos levados a inferir, erradamente, que este
estado é uma flutuação espontânea de estados mais próximos do equilíbrio. O que será que tor-
na apropriado atribuir a distribuição de probabilidade canónica sobre microestados no início da
evolução de um sistema, mas não no fim?
Bem, o estado inicial é o modo como o sistema está «preparado». O estado final é o resultado
não da preparação, mas da evolução. Mas o que constituirá a preparação? E por que razão de-
verá ela, e apenas ela, ter a característica de exigir a distribuição de probabilidade termodinâmi-
ca correcta sobre os microestados associados aos macroestados obtidos por ela? Essencialmente,
está-se a construir a assimetria temporal da mecânica estatística com o pressuposto de que são
sempre os primeiros estados dos sistemas isolados que estão «preparados», e nunca os seus es-
tados finais. Intuitivamente, pensamos que isto é verdade, mas dar um sentido coerente ao que
a intuição capta, aparte a repetição da assimetria que antes de mais queríamos explicar, é uma
questão enigmática.
Prigogine apresentou uma solução distinta, e mais radical, para o enigma. A sua solução tem
diversos elementos. Para começar, adopta o ponto de vista muito radical segundo o qual os sis-
temas individuais não têm microestados exactos. Em vez disso, Prigogine sustenta que a insta-
bilidade radical da dinâmica significa que o microestado exacto de um sistema, tal como é pos-
tulado na mecânica subjacente habitual, é uma idealização falsa. Prigogine entende que se deve
considerar que a distribuição de probabilidade sobre microestados usada na mecânica estatísti-
ca caracteriza o sistema individual. Esta distribuição de probabilidade, defende, não caracteriza
um colectivo imaginado composto por muitos sistemas em que cada um deles tem um microes-
tado exacto. Uma vez mais, a mecânica quântica e a sua interpretação são aqui relevantes. Como
veremos, na teoria dos quanta demonstra-se que não há variáveis ocultas. Alega-se por vezes
que essas demonstrações mostram que se deve considerar que a «incerteza» dos sistemas na
mecânica quântica é irredutível. Defende-se que não há parâmetros subjacentes, nem mesmo
incognoscíveis, que determinem exactamente o curso futuro do sistema.
Mas tais demonstrações da inexistência de um microestado inteiramente determinista estão
certamente em falta no caso da mecânica estatística. Na verdade, a possibilidade de reversos de
comportamento exactos, como ilustram os resultados do eco de spin já referidos, torna a recusa
do microestado exacto uma tese bastante dúbia. Mas as restantes partes da concepção de Prigo-
gine não precisam realmente desta concepção ontológica radicalmente nova para se fundamen-
tarem.
Prigogine esboça métodos pelos quais a distribuição de probabilidade original, cuja evolução
segue as leis invariantes temporalmente reversíveis derivadas das leis temporalmente simétri-

102
cas da dinâmica subjacente, pode ser transformada numa nova «representação» cuja assimetria
temporal evolutiva é manifesta. Isto funciona em casos onde se verifica uma condição de «caos»
apropriadamente forte, tal como quando o sistema é um sistema K. O que se passa aqui não é
nada muito misterioso. Se um sistema tem as características de mistura apropriadas, então mos-
trará uma aproximação temporal ao equilíbrio rude (coarse grained), mesmo que a sua evolu-
ção seja reversível temporalmente ao micronível. As técnicas usadas para entrar na nova repre-
sentação mostram essencialmente como um novo modo de representar a estatística do agrupa-
mento, pode reflectir este comportamento rude (coarse grained) da distribuição de probabili-
dade original de forma a que a assimetria temporal representada apenas da maneira rude (coar-
se grained) na representação original seja agora construída dentro da nova maneira de caracte-
rizar a distribuição de probabilidade. Esta nova distribuição de probabilidade é univocamente
especificada dada a distribuição original e especifica-a univocamente. Gera os mesmos valores
médios para todas as quantidades geradas pela distribuição original de probabilidade e, logo, é
«estatisticamente equivalente» à representação original.
Será que a existência desta nova representação da probabilidade resolve o problema da as-
simetria do tempo? Não. Uma razão para esta resposta negativa é a de que há também uma no-
va representação da distribuição de probabilidade original manifestamente anti-termodinâmica.
Tal como a distribuição original se aproximava do equilíbrio de uma maneira rude (coarse
grained), avançando tanto para o tempo menos infinito assim como para o tempo mais infinito,
também há duas transformações suas para uma nova representação — uma torna manifesto um
comportamento termodinâmico e a outra um comportamento anti-termodinâmico.
Sendo assim, de onde surgirá a assimetria do tempo? Prigogine pensa que não podemos cap-
tá-la usando qualquer distribuição de probabilidade inicial não patológica, porque qualquer
uma dessas distribuições avançará para o equilíbrio de uma maneira rude (coarse grained) no
limite de tempo infinito tanto no futuro quanto no passado. Em vez disso, sugere Prigogine, de-
vemos olhar para certas distribuições iniciais «singulares», nomeadamente para aquelas que
concentram toda a probabilidade numa região de probabilidade zero na medida canónica. Mas
na representação original uma tal distribuição inicial singular não se poderia aproximar da dis-
tribuição do equilíbrio nem mesmo de uma maneira rude (coarse grained), pois evoluiria sem-
pre para uma nova distribuição cujo tamanho seria zero na medida canónica. Mas, indica Pri-
gogine, pode ser que embora a nova representação da distribuição original seja também singu-
lar e de tamanho zero, as novas representações das distribuições para as quais ela evolui pos-
sam não ser singulares. Na verdade, podem evoluir para a distribuição do equilíbrio. E isto é
exactamente aquilo que acontece se a distribuição inicial singular for apropriadamente escolhi-
da. Então, talvez a solução para a assimetria do tempo se encontre na regra segundo a qual os
sistemas físicos que partem do desequilíbrio são sempre representados apropriadamente na
mecânica estatística por estes tipos de distribuições de probabilidade iniciais singulares.
Será esta a resposta? Penso que não. Para começar, é importante fazer notar que haverão
também distribuições de probabilidade singulares iniciais que serão intrinsecamente anti-
termodinâmicas. Obviamente, elas não podem representar os sistemas reais. Mas não estáva-
mos nós à procura da razão física que faz um tipo de comportamento ser possível e outro não?
Não estávamos apenas a procurar mais uma maneira de «enxertar» uma característica assimé-
trica à nossa representação do mundo. Pior ainda, o uso de tais probabilidades iniciais singula-
res parece inapropriado para alguns casos físicos reais. Uma situação que se ajusta ao modelo
de Prigogine seria, por exemplo, um feixe de partículas perfeitamente paralelo. Este é um esta-
do inicial de «probabilidade zero». Obviamente, um tal feixe perderia a sua espantosa coerência
e ordem originais, sendo esta perda representada pela propagação da representação transfor-
mada da distribuição de probabilidade singular escolhida originalmente para representar o sis-
tema. Mas considere-se agora um gás confinado ao lado esquerdo de uma caixa. Remova-se a
divisória. A distribuição de probabilidade inicial apropriada para este caso não será uma distri-
buição de probabilidade confinada a uma região de tamanho zero ou mesmo uma aproximação
a uma tal distribuição singular. Em vez disso, a forma correcta de representar aqui a física seria
com uma propagação rude (coarse grained) para o equilíbrio de uma distribuição inicial que,
originalmente, não estava propagada de uma maneira rude (coarse grained) pela totalidade

103
disponível do microestado, mas que não estava também, originalmente, confinada à região de
tamanho zero.
A ideia é a de que os agrupamentos iniciais correctos mostrarão uma propagação em direc-
ção ao equilíbrio mesmo a curto prazo. Eles podem representar correctamente a física, mesmo
que no limite de tempo infinito se propaguem para o equilíbrio (no sentido rude (coarse grai-
ned)) em ambas as direcções do tempo. Os agrupamentos iniciais singulares de Prigogine pare-
cem ser desnecessários e, por vezes, representar erradamente as situações físicas reais interes-
santes.

Cosmologia e irreversibilidade

Sendo assim, qual será o fundamento físico da assimetria do tempo? Consideremos uma
abordagem popular. Esta baseia-se em factos da cosmologia. Como antes fizemos notar, Boltz-
mann tinha já invocado postulados especulativos acerca da estrutura global do universo de
forma a reconciliar os seus pontos de vista finais sobre o equilíbrio com os factos observáveis
sobre a dominância do desequilíbrio no mundo tal como o encontramos. Vejamos de novo a es-
trutura das posições de Boltzmann. Em primeiro lugar, o universo é grande no espaço e no
tempo. Está próximo do equilíbrio na maior parte das regiões do espaço e durante a maior parte
dos períodos do tempo. Mas há pequenas regiões que se afastam do equilíbrio por curtos perío-
dos de tempo. Em segundo lugar, podemos prever que nos encontrarmos numa tal região de
flutuação, pois só numa dessas regiões os observadores poderão evoluir e sobreviver. Em ter-
ceiro lugar, na nossa região a entropia aumenta na direcção futura do tempo, porque para nós a
direcção futura do tempo quer dizer a direcção do tempo em que os sistemas estão a ter o seu
aumento de entropia, isto é, em que se movem localmente em paralelo uns com os outros em
direcção ao equilíbrio.
Encontramo-nos de facto num universo afastado do equilíbrio. E descobrimos que os siste-
mas isolados temporalmente têm o seu aumento de entropia na mesma direcção de tempo, a di-
recção a que chamamos «futuro». Poderá isto ser explicado pelo que sabemos agora da estrutu-
ra cosmológica global do universo?
A imagem do cosmos apresentada pela cosmologia contemporânea é bastante diferente do
universo global quiescente de Boltzmann. O universo, ou pelo menos a sua parte acessível à
nossa inspecção observacional, parece ter estado concentrado num ponto singular de massa-
energia há cerca de dez biliões de anos atrás. Desde então, o universo tem estado em expansão.
Não se sabe se essa expansão vai continuar para sempre, ou se, em vez disso, o universo irá al-
guma vez contrair-se novamente e tornar-se uma singularidade. Isso depende da massa-energia
do universo. Como um todo, o universo parece obedecer à segunda lei, com a entropia a au-
mentar na direcção futura do tempo.
Este aumento de entropia requer uma explicação. Aqui, o estado termodinâmico da condição
singular original é crucial. Geralmente postula-se que a matéria estava originalmente numa
condição uniforme de equilíbrio, sendo o estado actual caracterizado por estrelas quentes a bri-
lharem no espaço frio, que é uma situação de desequilíbrio flagrante, uma evolução posterior.
Mas será que isto significa que a entropia decresceu ao longo do tempo? Não necessariamente.
Segundo a maior parte dos especialistas, o decréscimo de entropia na matéria foi «pago» por
um vasto aumento na entropia do campo gravitacional ou, se desejarmos, do próprio espaço-
tempo. O espaço-tempo, que era originalmente uniforme, desenvolveu «amontoados» à medida
que a matéria passava da sua condição original uniforme para a sua condição presente altamen-
te não uniforme. Por razões especiais que têm a ver com a natureza puramente atractiva da gra-
vidade, esta transformação que fez o espaço-tempo passar de liso a granular corresponde a um
aumento da sua entropia. Deste modo, podemos atribuir a culpa do aumento entrópico do cos-
mos à sua condição do espaço-tempo originalmente muito organizada e com entropia muito
baixa.
Por que razão deveria a condição original ter uma baixa entropia? Entre todas as condições
originais possíveis, esta é uma condição «altamente improvável». Aqui estamos a sondar os
próprios limites da explicação científica. Teremos apenas de aceitar como um facto que é assim
que as coisas são, embora já tenham sido sugeridas diversas «explicações» para este facto. É im-

104
portante fazer notar que por si só a expansão do universo não é responsável pelo aumento en-
trópico. De acordo com a concepção dominante, num universo em «re-contracção» a entropia
continuaria a aumentar, conduzindo a uma singularidade final intrinsecamente amontoada por
natureza. A reversão temporal de uma tal «re-contracção» seria compatível com todas as leis e
representaria um universo em expansão com decréscimo de entropia. É a natureza especial do
Big Bang e do Big Crunch, tendo o primeiro uma entropia baixa e o segundo uma entropia alta,
que distingue um universo em que a expansão seguida por contracção é acompanhada por uma
entropia crescente, e não decrescente.
Sendo assim, será que a segunda lei da termodinâmica, tal como se aplica a pequenos siste-
mas individuais, se baseia no estado original singular de baixa entropia do universo? Há pro-
blemas quando se tenta fazer funcionar este ponto de vista. A proposta habitual é a de trabalhar
com a noção de sistema ramificado. Um sistema ramificado é um sistema isolado individual que
estava originalmente em contacto energético com o mundo exterior, que mais tarde foi isolado
durante um certo período de tempo e que, por fim, foi colocado de novo em contacto com o
mundo exterior no final do seu tempo de vida finito.
Suponha-se que temos um sistema ramificado isolado numa condição afastada do equilíbrio.
Como o universo que nos rodeia está num estado de flagrante desequilíbrio, é muito mais razo-
ável supor que o desequilíbrio do sistema ramificado resulta de este ter sido «separado» do sis-
tema em desequilíbrio global do que supor que a condição de desequilíbrio do sistema ramifi-
cado resulta de uma das flutuações muito raras do equilíbrio que são de esperar mesmo de sis-
temas totalmente isolados.
Imagine-se agora um grande número de sistemas ramificados que estão todos no início da
sua vida e numa condição de desequilíbrio comum. Não podemos inferir que no passado os sis-
temas tiveram um certo comportamento, dado que eles não têm qualquer vida passada, pois só
começaram a existir enquanto sistemas ramificados. Se fizermos agora a suposição de que a dis-
tribuição de probabilidade sobre os microestados dos sistemas é canónica, poderemos inferir
que a curto prazo no futuro o ponto de concentração dos estados do sistema estará mais próxi-
mo do equilíbrio. Este é o conhecido modelo de Boltzmann. Este modelo baseia-se num pressu-
posto problemático acerca da distribuição de microestados compatíveis com uma dada condi-
ção macroscópica. Mas, alega-se, este pressuposto não é ele próprio temporalmente assimétrico.
Sendo assim, o paralelismo da evolução dos sistemas ramificados, o facto de que o aumento de
entropia de um será na mesma direcção do tempo (provavelmente) que o aumento de entropia
de qualquer outro, foi derivado simplesmente a partir dos factos cosmológicos, do facto de que
os sistemas são ramificados e de um pressuposto probabilístico sobre microcondições iniciais
que intrinsecamente não são temporalmente assimétricas.
Reichenbach apresenta uma versão formal deste argumento. Ele organizou os estados de
uma colecção de sistemas ramificados numa tabela, colocando os estados posteriores à direita
dos estados anteriores e os sistemas organizados numa lista vertical. Presumindo que a evolu-
ção de cada sistema é estatisticamente independente da evolução de todos os outros, e presu-
mindo que as mudanças em distribuições de microestados nas colunas verticais (isto é, as dis-
tribuições de microestados sobre os vários sistemas de um instante para outro) duplicam as
mudanças previstas num único sistema ao longo do tempo, Reichenbach é capaz de mostrar
que, se a coluna da esquerda de uma tal tabela corresponde ao desequilíbrio, no limite em que o
tempo avança para mais infinito, a coluna da direita representará o equilíbrio. Reichenbach
chama a essa tabela um «reticulado de mistura».
Será que esta técnica consegue realmente dar-nos a explicação do comportamento paralelo
da mudança de entropia dos sistemas ao longo do tempo sem simplesmente a postular? Penso
que não. Geralmente presume-se que a direcção do tempo em que os sistemas ramificados au-
mentam a sua entropia paralelamente entre si é a mesma direcção do tempo em que o universo
como um todo aumenta a sua entropia. Mas, curiosamente, a direcção da mudança de entropia
do universo nunca é usada no argumento. Tudo o que se usa é o facto de o universo estar afas-
tado do equilíbrio, e não a direcção da sua mudança entrópica. Isto sugere que o paralelismo
que os sistemas ramificados têm entre si pode também ter entrado no argumento «clandestina-
mente».

105
Na verdade, penso que isso aconteceu. Suponha-se que consideramos uma colecção de sis-
temas ramificados em que metade deles começa num estado de desequilíbrio e metade acaba no
mesmo estado de desequilíbrio. Organizemo-los agora num reticulado à maneira de Reichen-
bach, colocando o seu estado de desequilíbrio à esquerda. O mesmo tipo de postulados usados
anteriormente levar-nos-ia a esperar que os estados dos sistemas em equilíbrio ou próximos de-
le estivessem à direita. Mas isso corresponderia ao facto de os sistemas que partiram em dese-
quilíbrio se aproximarem do equilíbrio no futuro, e levar-nos-ia a inferir que os sistemas que
terminam em desequilíbrio estiveram próximos do equilíbrio no passado distante! Obviamente,
esta é a inferência errada. Deveríamos inferir que os sistemas que terminam em desequilíbrio
vêm de sistemas isolados que estavam ainda mais afastados do equilíbrio no passado.
O que se passou aqui é algo com que agora já estamos familiarizados. É razoável impor a
distribuição de probabilidade canónica sobre os microestados de um sistema em desequilíbrio
se o estado de desequilíbrio for um estado genuinamente inicial relativamente ao processo que
se está a inferir. É ilegítimo — dá os resultados errados — usar uma tal distribuição de probabi-
lidade para retroprever o comportamento de um sistema a partir da sua condição de desequilí-
brio se essa condição for uma condição final, e não inicial, relativamente ao processo que esta-
mos a tentar inferir. Isto é apenas repetir o facto de que os sistemas mostram de facto um com-
portamento termodinâmico (isto é, aproximação ao equilíbrio) numa direcção de tempo paralela
e, na verdade, na direcção de tempo a que chamamos futuro. Mas os argumentos que temos vis-
to até agora não nos dão uma explicação física para esse facto. Em vez disso, inserem-no uma
vez mais na sua descrição do mundo como um postulado. Por si só, a cosmologia, incluindo o
Big Bang, a sua baixa entropia, a expansão do universo e o aumento entrópico desse universo
na direcção do tempo na qual ele se está a expandir, não parece fornecer a explicação para o pa-
ralelismo no tempo do aumento entrópico dos sistemas ramificados. Na verdade, o comporta-
mento do cosmos em concordância legiforme com a segunda lei parece, desta perspectiva, ape-
nas mais um exemplo do comportamento legiforme estatístico geral dos sistemas, cosmológicos
ou ramificados.
Assim, a origem do comportamento paralelo dos sistemas ao longo do tempo no seu aumen-
to entrópico continua ainda a ser um pouco misteriosa. Sabemos como representar a assimetria
na mecânica estatística, impondo uma distribuição de probabilidade sobre os microestados de
sistemas em desequilíbrio apenas de forma temporalmente assimétrica. Devemos presumir que
o habitual pressuposto estatístico acerca de quão provável é um microestado se aplica apenas se
entendermos que o macroestado que estamos a considerar é inicial, e apenas se depois formos
usar o pressuposto estatístico para inferir o comportamento futuro, e não o passado, do sistema.
Mas por que razão se verifica o paralelismo temporal do aumento entrópico é ainda um enigma.
Mas suponhamos que o paralelismo se verifica. Poderemos perguntar por que razão aumen-
ta a entropia no sentido da direcção futura do tempo, e não no sentido do passado. Uma vez
mais, devemos considerar aqui a brilhante sugestão de Boltzmann segundo a qual o próprio
significado da distinção passado-futuro relativa às direcções do tempo se baseia no próprio au-
mento entrópico paralelo. Segundo Boltzmann e aqueles que o seguiram, por direcção «futura»
do tempo queremos dizer apenas a direcção do tempo em que a entropia aumenta com uma
esmagadora probabilidade. Será isto plausível? Voltaremos a esta questão na secção «O Pro-
blema da “Direcção do Tempo”».

Resumo

Como vimos, a estrutura das explicações probabilísticas na mecânica estatística é muito


complexa. Seria agradável anunciar que está disponível uma resolução simples para todas as
dificuldades que acabámos de considerar, mas isso não acontece. Embora estes problemas te-
nham sido explorados durante mais de um século, as questões que considerámos continuam a
ser muito controversas.
Vimos que se pode dar conta, de uma maneira interessante, das características do equilíbrio,
identificando-as com certos aspectos de um sistema que são exibidos no limite de tempo infini-
to. Mas o tipo de «explicação» dos fenómenos observados que obtemos não é de maneira ne-

106
nhuma como o tipo de explicação que envolve probabilidades que seríamos levados a esperar
pelas abordagens que os filósofos fazem das explicações estatísticas.
Quando avançamos para o caso do desequilíbrio, a estrutura explicativa assemelha-se mais
àquela que os filósofos apresentam. Mas subsistem muitos enigmas. Algumas abordagens à
aproximação ao equilíbrio invocam o não isolamento do sistema ou a possibilidade de leis da
natureza não simétricas no tempo. Outras explicações baseiam-se em alegadas regras de infe-
rência probabilística geral. As abordagens mais canónicas baseiam-se na instabilidade da dinâ-
mica microscópica de um sistema e no vasto número de microcomponentes que constituem o
sistema. Mas mesmo dentro destas abordagens canónicas, como vimos, há ideias em conflito
sobre o modelo apropriado a utilizar e sobre a noção apropriada de explicação estatística a in-
vocar.
Vimos também que, nas abordagens canónicas, o problema do agrupamento inicial correcto
ou da distribuição de probabilidade inicial é um problema crucial. O modo de escolher correc-
tamente uma tal distribuição de probabilidade inicial e, uma vez escolhida, o modo de explicar
por que razão se pode presumir legitimamente que ela se verifica no mundo, continuam a ser
questões em aberto. O problema fundamental da assimetria dos sistemas ao longo do tempo é
parte deste problema do agrupamento inicial.
Por fim, vimos que, ainda que invoquemos a assimetria global ao longo do tempo do univer-
so como um todo, o problema da assimetria ao longo do tempo dos sistemas individuais conti-
nua em aberto. O problema geral de enquadrar o comportamento termodinâmico dos sistemas
na concepção geral da dinâmica das suas partes microscópicas é ainda um problema que requer
mais ideias engenhosas, não só sobre a física dos sistemas, mas também sobre a própria estrutu-
ra daquilo que conta como explicação probabilística legítima na nossa concepção teórica do
mundo.
Vimos que a instabilidade das trajectórias dinâmicas do sistema contribui para o comporta-
mento estável e previsível do sistema ao nível macroscópico. Contudo, a instabilidade pode
também ser uma característica do comportamento macroscópico do sistema. Partindo do traba-
lho de Poincaré, os físicos descobriram que o comportamento dos sistemas é muitas vezes radi-
calmente irregular e imprevisível, mesmo ao nível das suas descrições macroscópicas. Muitos
sistemas podem ser descritos por um parâmetro que caracteriza um certo aspecto do sistema.
Para alguns valores deste parâmetro, o sistema exibirá um comportamento regular, mas para
outros valores o comportamento do sistema irá variar tão sensivelmente com o seu estado inici-
al que fica bloqueada qualquer esperança de prever o comportamento futuro do sistema. Tais
sistemas deterministas, mas irregulares, são conhecidos por «sistemas caóticos».
A descrição dos sistemas caóticos introduziu um novo domínio de comportamento na física,
um domínio em que os modos probabilísticos de pensamento se tornam instrumentos impor-
tantes. E com estes novos modos de descrição surgem novas questões filosóficas. De momento,
os filósofos estão a lidar com algumas dessas questões, tais como a da definição de um sistema
caótico, a dos modos de explicação usados para caracterizar o comportamento desses sistemas,
e das questões geradas pelo facto de os sistemas poderem ser inteiramente deterministas, mas
de o seu comportamento macroscópico ser radicalmente imprevisível. Embora não estejamos
em condições de considerar aqui essas questões, fornece-se alguma bibliografia introdutória so-
bre esta área nova e estimulante nas sugestões de leitura que complementam este capítulo.

O problema da «direcção do tempo»

As discussões da tese de Boltzmann são acompanhadas frequentemente de debates acerca da


questão de saber se a assimetria entrópica representa uma assimetria do «tempo em si» ou se é
apenas uma assimetria do comportamento dos sistemas físicos ao longo do tempo. Os defenso-
res da primeira tese apontam geralmente a natureza profunda e universal da assimetria. Os de-
fensores da segunda tese referem-se frequentemente a outros factos do mundo que são tempo-
ralmente assimétricos, mas em que a assimetria não é gerada por leis da natureza temporalmen-
te assimétricas subjacentes. Defendem que só assimetrias legiformes nos poderiam levar a infe-
rir uma assimetria do tempo em si.

107
Quem defende que a assimetria entrópica não reflecte uma assimetria na natureza do tempo
subjacente tem geralmente em mente a ideia de que devemos postular assimetrias do espaço-
-tempo apenas quando estas são necessárias para explicar assimetrias das leis da natureza. Um
exemplo, indicado no capítulo 2, seria o postular de uma diferença subjacente no espaço-tempo
para dar conta da distinção por natureza legiforme entre movimento inercial e não inercial. Sem
uma tal assimetria legiforme, defende-se, não é preciso postular qualquer assimetria do espaço-
tempo subjacente em si. Quem pensa que a assimetria entrópica exige que concebamos o tempo
em si como assimétrico nega que a assimetria entrópica, com o seu alcance universal e funda-
mental, possa reduzir-se a qualquer «mera» assimetria de sistemas. Ela exige, defende quem as-
sim pensa, uma explicação mais profunda da assimetria do tempo em si.
Como vimos no capítulo 2, a própria noção de uma estrutura de espaço-tempo que explique
algumas características estruturais entre as coisas do mundo é bastante problemática. Do ponto
de vista de muitos relacionistas, está longe de ser claro que faça algum sentido levantar a ques-
tão de saber se a assimetria do aumento de entropia é apenas uma assimetria estatística univer-
sal dos sistemas físicos ao longo do tempo, ou se, em vez disso, representa uma assimetria sub-
jacente do tempo em si.
Seja como for, para Boltzmann as questões cruciais não dependem da resposta a essas ques-
tões. Boltzmann quer defender que a nossa distinção intuitiva entre o passado e o futuro pode
«basear-se» na assimetria entrópica. Ele esforça-se por defender que, se há porções locais do
universo em que a entropia «anda para trás», isto é, na direcção do tempo oposta àquela em que
ela aumenta na nossa região do universo, as memórias das pessoas serão também de aconteci-
mentos daquela a que chamamos a direcção futura do tempo, e o mesmo acontecerá com os
seus registos. E essas pessoas conceberão a causalidade como algo que vai daquela direcção do
tempo que consideramos como futuro para aquela direcção do tempo que consideramos como
passado. Conceberão os acontecimentos na direcção do tempo a que chamamos «futuro» como
acontecimentos fixos e determinados, e os acontecimentos na direcção do tempo a que chama-
mos «passado» como acontecimentos em aberto. Mas, obviamente, segundo a tese de Boltz-
mann, essas pessoas, tal como nós, afirmarão lembrar-se do passado e ter registos dele, e conce-
berão a causalidade como algo que vai do passado para o futuro. Chamarão «direcção do pas-
sado do tempo» àquela direcção a que nós chamamos «direcção do futuro do tempo», e chama-
rão «futuro temporal» àquilo a que chamamos «direcção do passado do tempo».
Por vezes, defende-se a tese de Boltzmann afirmando que é apenas a partir dos factos entró-
picos que podemos determinar se um filme está a ser projectado na direcção apropriada ou se,
em vez disso, está a ser projectado ao contrário através de um projector. Outros criticam a tese
de Boltzmann afirmando que, para acontecimentos reais, dificilmente precisamos de verificar as
características entrópicas dos sistemas para determinar quais acontecimentos são posteriores a
quais. Ambos estes argumentos, contudo, falham o seu propósito, pois interpretam erradamen-
te a tese de Boltzmann.
Os filósofos defendem por vezes que um domínio conceptual se reduz a outro em virtude de
o próprio significado das asserções de um dos domínios ser dado pelas asserções do outro.
Aqui o argumento é geralmente o de que todos os nossos meios para determinar a verdade ou
falsidade das asserções do primeiro tipo se baseiam na confiança depositada nas asserções do
segundo tipo. Deste modo, o fenomenista defende que o discurso sobre objectos materiais se
reduz ao discurso sobre dados dos sentidos na mente, e o relacionista espácio-temporal defende
que todo o discurso acerca do espaço e do tempo se reduz ao discurso acerca das relações espá-
cio-temporais entre coisas e acontecimentos materiais. Mas não me parece razoável pensar que
Boltzmann esteja a defender que todo o conhecimento que temos da direcção do tempo que os
acontecimentos têm entre si se infere do conhecimento das relações entrópicas que os estados de
coisas têm entre si ao longo do tempo. Não é esse tipo de redução filosófica da assimetria do
tempo à assimetria entrópica que Boltzmann tem em mente.
A sua noção de redução está antes mais próxima daquilo que o cientista tem em mente
quando defende que a teoria da luz se reduz à teoria do electromagnetismo ou quando defende
que o discurso acerca de mesas se reduz ao discurso acerca de arranjos de átomos. Descobrimos
que as ondas de luz são ondas electromagnéticas e que as mesas são arranjos de átomos. É neste

108
sentido que Boltzmann quer defender que a assimetria do tempo futuro-passado é apenas a di-
recção do tempo estabelecida pelos factos do aumento de entropia. Mas que tipo de tese é esta?
Boltzmann convidar-nos-ia a reflectir na nossa noção da direcção espacial descendente. Para
Aristóteles, a noção de direcção descendente era primitiva. Aristóteles acreditava, provavel-
mente, que existia uma direcção descendente em todos os pontos do espaço, e que todos estes
«descendentes» estavam na mesma direcção espacial. Mas agora compreendemos que «descen-
dente» é apenas a direcção para a qual a força gravitacional local está a apontar. Compreende-
mos agora que há regiões do universo em que não há qualquer direcção descendente nem as-
cendente, e aceitamos sem dificuldade que a direcção ascendente para alguém que esteja na
Austrália não é paralela à de alguém que esteja em Nova Iorque. Boltzmann defende que se
passa o mesmo com a distinção futuro-passado. Onde não há qualquer assimetria entrópica lo-
cal, não há qualquer distinção futuro-passado, embora, como é óbvio, haja ainda duas direcções
opostas do tempo. E onde os aumentos de entropia estão direccionados em oposição no tempo,
o mesmo sucede com a distinção futuro-passado.
Que será preciso para justificar esta tese? Nem mesmo uma associação legiforme do aumen-
to de entropia com uma direcção intuitiva do tempo seria suficiente, por si mesma, para justifi-
car a tese de Boltzmann. Para vermos que isto é verdade, precisamos apenas de fazer notar que
parece agora claro que certos processos entre micropartículas de matéria não são simétricos en-
tre sistemas da direita e sistemas da esquerda. Há uma assimetria legiforme na natureza entre
direita e esquerda que se revela, por exemplo, no facto de certos processos de dissolução que
envolvem partículas giratórias serem possíveis, apesar de as imagens simétricas desses proces-
sos não serem possíveis. Mas estaria alguém inclinado a defender que a nossa própria distinção
entre uma luva da mão direita e uma luva da mão esquerda, por exemplo, depende em qual-
quer sentido de se verificar essa assimetria legiforme na natureza? Não por muito tempo, penso.
Além de não distinguirmos a esquerda da direita utilizando estes processos espacialmente as-
simétricos, nada acerca da existência ou inexistência desses processos parece ter algo a ver com
a explicação da razão pela qual há a distinção familiar entre esquerda e direita no nosso esque-
ma conceptual intuitivo. Mas com a gravidade e a noção de «descendente» as coisas são bem
diferentes. Estamos inclinados a dizer que, ainda que não existissem os processos assimétricos
descobertos pela física recente, a distinção esquerda-direita continuaria a existir. Mas, se não
houvesse qualquer força gravitacional, não haveria pura e simplesmente uma distinção ascen-
dente-descendente, tanto na natureza como no nosso esquema conceptual para lidar com a na-
tureza.
Penso que a diferença entre os dois casos é a seguinte. No caso da gravidade e da direcção
descendente, acreditamos que todos os factos relevantes acerca dessa direcção — que as pedras
caem para baixo e que os balões de hélio flutuam para cima, por exemplo — são explicados pe-
los factos sobre a gravidade. Mesmo o facto de podermos dizer, sem fazer inferências, qual é a
direcção descendente se explica pelos efeitos da gravidade no líquido dos nossos canais semi-
circulares do ouvido. Mas nada nas nossas distinções intuitivas entre objectos à direita e à es-
querda recebe uma abordagem explicativa em termos da chamada «conservação da paridade»
violar processos da física. Sendo assim, a questão crucial é a seguinte: será que a conexão entre a
distinção futuro-passado e a assimetria do aumento de entropia se assemelha mais à conexão
entre a distinção ascendente-descendente e a gravidade, como Boltzmann pensou, ou à conexão
entre a distinção esquerda-direita e os processos subatómicos que violam a simetria da orienta-
ção?
Para responder a esta questão, teríamos que caracterizar todos os aspectos fundamentais da
experiência que consideramos básicos na determinação da distinção intuitiva futuro-passado.
Depois teríamos que explorar a questão de saber se podemos explicar todos estes fenómenos
assimétricos usando a assimetria entrópica como único factor explicativo assimétrico. Já se ten-
tou fazer exactamente isto, mas, por enquanto, tais tentativas estão longe de serem convincen-
tes.
É certo que uma das distinções intuitivas mais importantes entre passado e futuro é a de que
há vestígios e registos do passado, mas não do futuro. Até a memória pode ser considerada, tal-
vez, como um sistema de registo do passado. Mas por que razão temos registos e memórias do
passado, mas não do futuro?

109
Uma resposta a esta questão, dada por Reichenbach, centra-se naquilo a que ele chamou ma-
croentropia. O que está aqui em questão não é a ordem e desordem dos microconstituintes da
matéria, mas tipos mais evidentes de ordem e desordem que distinguiriam, digamos, um arran-
jo organizado de objectos de tamanho médio de uma colecção caótica e desordenada desses
mesmos objectos. Reichenbach defende que quando encontramos um sistema com uma macro-
entropia mais baixa do que normalmente esperaríamos, temos de dar conta desse macroestado
improvável. Ele defende que um microssistema com uma baixa entropia provavelmente não é
uma flutuação espontânea de um sistema isolado a partir de um microestado com uma entropia
elevada; é muito mais provável que seja um sistema que esteve em interacção com o meio ambi-
ente exterior no passado. Defende ainda Reichenbach que para um sistema ter uma baixa ma-
croentropia também requer uma interacção exterior enquanto geradora dessa baixa macroen-
tropia. Deste modo, a baixa macroentropia permite-nos inferir também que houve interacção no
passado. E, defende Reichenbach, é esta inferência da interacção do passado que proporciona
aquilo que entendemos por registo ou vestígio.
O seu exemplo preferido é o da pegada na praia. É de esperar que encontremos uma praia
de alta macroentropia, isto é, uma praia lisa, com os grãos de areia distribuídos aleatoriamente.
Quando encontramos uma pegada, podemos inferir que houve uma interacção da praia com
outra coisa — o pé que fez a pegada. Assim, a pegada é um registo ou vestígio do acontecimen-
to do passado.
Mas esta abordagem tem muitos problemas. Por vezes, os registos e vestígios são estados de
elevada macroentropia. Quando prevemos ordem e encontramos desordem, também conside-
ramos isso como uma indicação de uma interacção no passado. Os escombros dispersos de uma
explosão são um registo de macroentropia. Por vezes, podemos inferir estados no futuro a par-
tir de estados de baixa macroentropia. Alguns estados de baixa macroentropia, não previstos de
outra forma, são prognosticadores de acontecimentos futuros. Estas situações são tais que, dado
que esses acontecimentos futuros ocorrerão, o acontecimento presente torna-se mais provável.
O sinal do ecrã do radar pode muito bem ser um bom indicador de uma interacção futura, por
exemplo, do míssil a atingir o alvo, mas não é um registo desse acontecimento futuro.
Uma verdadeira justificação da tese de Reichenbach seria uma razão para acreditar que há
um padrão geral de inferência para acontecimentos do passado que pode ser caracterizada em
termos macroentrópicos e que não tem correspondência num padrão de inferência semelhante
para o futuro. Talvez se possa fazer alguma coisa deste género. Afinal, o meu jornal de hoje,
com a sua letra ordenada, é um bom indicador daquilo que aconteceu antes, e não há nada pa-
recido com um jornal no que respeita ao futuro. Mas a razão de isto ser assim continua a ser
muito obscura. É especialmente obscuro o modo como o aumento de microentropia no futuro, a
irreversibilidade termodinâmica do mundo, vai ser usado para dar conta da clara assimetria
real que existe na forma como ganhamos conhecimento do passado e do futuro. A via da ma-
croentropia é especialmente enigmática por causa do problema de que aquilo que é a macroen-
tropia de um sistema depende do modo como classificamos os acontecimentos em tipos ou gé-
neros de macroacontecimentos. Consideraríamos que algumas formas de fazer isso seriam «na-
turais», e outras seriam «não naturais» ou de alguma maneira perversas. Qualquer teoria que
tente explicar por que razão alguns estados correntes devem ser vistos como registos do passa-
do, mas por que razão nenhum estado corrente deve ser visto como um registo do futuro apesar
da capacidade de inferirmos por vezes o futuro a partir deles, e que tente fazê-lo invocando a
noção de macroentropia, tem de fazer inteira justiça a estas questões da oposição entre tipos na-
turais versus tipos não naturais de acontecimentos. Escusado será dizer que o caminho que vai
do aumento da entropia termodinâmica até a uma explicação do facto de termos memórias do
passado, mas não do futuro, é ainda mais misterioso, dado o pouco que sabemos acerca do que
é exactamente a base física da memória.
Algumas abordagens que visam apoiar a tese de Boltzmann tomam como fundamental a as-
simetria do conhecimento, o facto de termos registos do passado, mas não do futuro. Podem en-
tão procurar derivar outras assimetrias a partir da assimetria do conhecimento, como, por
exemplo, a nossa crença de que a causalidade se processa do passado para o futuro. Outras
abordagens podem procurar primeiro uma derivação da assimetria causal a partir da entrópica,

110
considerando os registos como efeitos dos acontecimentos de que eles são registos, sendo os
acontecimentos que estão registados, por definição, a causa do seu registo.
David Lewis ofereceu um ataque particularmente engenhoso à assimetria causal em que
procura explicá-la através de fenómenos que podem estar conectados com a assimetria entrópi-
ca. Lewis associa a causalidade às chamadas «condicionais contrafactuais». A ideia é antiga. A
causa de um acontecimento é aquele acontecimento que, se não tivesse ocorrido, o acontecimen-
to considerado como efeito não teria ocorrido. (O tratamento completo é mais complicado do
que isto, mas a versão simples será suficiente para os nossos propósitos.) Mas como determi-
namos que condicionais contrafactuais são verdadeiras? Lewis defende que as nossas intuições
são do seguinte modo: quando perguntamos o que teria ocorrido se um acontecimento efectivo
não tivesse ocorrido, ou se tivesse ocorrido de maneira diferente, confiamos no pensamento
acerca dos tipos de mudanças que seríamos forçados a fazer no mundo caso o acontecimento
tivesse sido diferente do que foi. Para determinar aquilo que teria acontecido, escolhemos aqui-
lo que acontece no mundo que está, em algum sentido, tão próximo do nosso mundo quanto
possível, dada a mudança necessária postulada para que o acontecimento tenha sido diferente
daquilo que foi efectivamente. Os nossos padrões para fazer tais juízos sobre a «proximidade de
mundos» irão tolerar pequenas violações das leis da natureza, mas não grandes violações nem
muitas violações. Procurarão grandes regiões de espaço e tempo em que as coisas são exacta-
mente como neste mundo, mas tolerarão grandes mudanças em questões de facto particulares,
mesmo se estas questões de facto forem importantes para nós. Os padrões de proximidade são
inventados de forma a fazer os nossos juízos acerca «daquilo que seria o caso» tão correctos
quanto possível.
Um resultado desta análise é o de fazer as «contrafactuais retrorrastreadoras» revelarem-se
falsas. Estas contrafactuais dizem-nos que, caso um acontecimento se tivesse dado de outra ma-
neira, o seu passado também teria sido diferente. Pelo menos em alguns casos estas condicio-
nais revelam-se falsas. É o caso da pedra lançada à água que gera uma ondulação em constante
propagação no lago na direcção do futuro do impacto da pedra na água. A ideia é a de que, em-
bora o facto de a pedra não ser lançada requeira apenas um milagre menor no passado (requer
apenas que o meu neurónio não tenha disparado e não me tenha dado a vontade de lançar a
pedra), o impacto da pedra na água está associado a um vasto leque de factos espácio-
temporalmente dispersos no futuro do impacto. Estes incluem todas as partes da ondulação que
aparecem, todas as ondas de luz que são emitidas por elas e assim por diante. Deste modo, na
análise de Lewis conclui-se que, caso um acontecimento se tivesse dado de maneira diferente, o
futuro desse acontecimento teria sido também diferente, mas o passado teria sido o mesmo,
pois um dado acontecimento é «sobredeterminado» por acontecimentos futuros relativamente a
si. Há muitos acontecimentos no futuro de um dado acontecimento, mas poucos no seu passa-
do, que requerem a sua existência. E a causalidade processa-se também sempre, então, do pas-
sado para o futuro.
Uma vez mais há muitos enigmas. Para começar, concebemos a causalidade como algo que
se processa do passado para o futuro, e não no outro sentido, mesmo nos casos que não envol-
vem qualquer «dispersão de ordem no futuro». Neste caso, podemos tentar uma abordagem
que parte de Reichenbach, defendendo que a nossa ideia básica de causalidade assimétrica se
forma a partir de casos em que existe dispersão macroentrópica. O conceito é então «projecta-
do» através de uma espécie de analogia para os casos em que essa dispersão não existe. (Mas
será que isto parece realmente plausível?) Uma vez mais, temos o problema de todos estes fac-
tos sobre a dispersão da macroordem no futuro estarem profundamente dependentes do modo
como caracterizamos os acontecimentos. Tal como antes, subsiste a possibilidade de caracteri-
zarmos os macroacontecimentos de uma maneira tão perversa que observaremos a dispersão de
ordem na direcção temporal errada. Por fim, como o próprio Lewis declara, não é de maneira
nenhuma claro como conectar a explicação da assimetria da causalidade aqui esboçada com o
aumento de microentropia da termodinâmica. Podem-se fazer sugestões acerca de como isto
poderá funcionar, tal como há abordagens que tentam caracterizar fenómenos como a dispersão
da correlação em fenómenos ondulatórios com as características termodinâmicas dos emissores
e receptores de ondas. Einstein tentou explicar a assimetria da dispersão das ondas electromag-
néticas desta forma. Mas ainda há aqui muita coisa que não está bem compreendida.

111
Provavelmente, a única avaliação justa da situação no momento presente é a de que a tese de
Boltzmann não é manifestamente absurda ou incoerente. É também uma tese que se baseia num
forte argumento de plausibilidade. Afinal, se a assimetria termodinâmica dos sistemas ao longo
do tempo é a única forma pela qual a assimetria temporal radical se revela no comportamento
dos sistemas físicos, não será isso uma razão para aceitar que esta grande assimetria física é de
alguma maneira responsável por todas as nossas assimetrias intuitivas no tempo? Uma coisa é
certa: as tentativas de considerar o tempo como fundamentalmente assimétrico de alguma outra
maneira, que se baseiam, por exemplo, numa análise metafísica profunda da natureza do «tem-
po em si», parecem inevitavelmente não conseguir dar conta da assimetria entrópica. Nem se-
quer é claro como podem tais tentativas dar realmente conta das assimetrias do conhecimento e
da causalidade. Contudo, deve admitir-se que ninguém mostrou realmente que a tese final de
Boltzmann pode ser complementada da forma pormenorizada que é essencial para a tornar
convincente.
Suponha-se que éramos capazes de apresentar argumentos convincentes para mostrar que
todas as nossas assimetrias intuitivas do tempo têm uma base explicativa na assimetria entrópi-
ca. Tome-se 1) a relação que um acontecimento tem com outro quando o primeiro é posterior ao
segundo no tempo, e 2) a relação que um acontecimento tem com outro quando o primeiro
acontecimento está separado do segundo no tempo e também quando a direcção do tempo do
primeiro acontecimento para o segundo é aquela direcção do tempo em que a entropia dos sis-
temas isolados aumenta quase sempre. Nesse caso, qual seria a conexão entre as relações 1 e 2?
Uma sugestão que se faz frequentemente é a de que ao completarmos satisfatoriamente o ar-
gumento explicativo devemos ser levados a defender que as duas relações são idênticas.
Aqui traça-se frequentemente a analogia com outras «identidades descobertas» na ciência.
Descobrimos que os cristais de sal são — isto é, são idênticos a — colecções articuladas de iões
de sódio e cloro. Descobrimos também que as ondas de luz são (isto é, não são mais do que) um
certo tipo de onda electromagnética. Não será também razoável dizer que descobrimos que a
direcção espacial «descendente» em qualquer lugar é apenas aquela direcção (isto é, que é idên-
tica à direcção) do espaço para a qual a força gravitacional está dirigida nesse lugar? Deste mo-
do, não será também plausível que, se o programa explicativo de Boltzmann pudesse ser intei-
ramente desenvolvido, devêssemos defender simplesmente uma identidade entre a assimetria
futuro-passado no tempo e a assimetria gerada pelo aumento de entropia?
No entanto, têm-se levantado algumas dúvidas quanto à possibilidade de ir tão longe, mes-
mo que se dê por certo o sucesso do programa explicativo. Estas dúvidas estão relacionadas
com as dúvidas que foram expressas no contexto do problema filosófico mente-corpo acerca da
tese que identifica os processos mentais (como sentir uma dor ou ter uma certa sensação visual)
com ter um certo processo a decorrer no cérebro. Quem levanta estas dúvidas não duvida, no
contexto deste argumento, que pode ser verdade que, para todos estes qualia de que temos ex-
periência na vida mental, certos processos cerebrais são condições necessárias e suficientes.
Quem levanta estas dúvidas pode mesmo concordar que os processos mentais sejam «sobreve-
nientes» relativamente aos processos físicos, o que significa que quaisquer duas pessoas com
processos cerebrais idênticos em curso têm de ter processos mentais idênticos em curso. O que
se nega é que os processos físicos e mentais possam ser razoavelmente concebidos como um e o
mesmo processo.
Por vezes, estas dúvidas são expressas num formato modal que faz lembrar Descartes. Diz-
se que podemos imaginar um processo mental do tipo apropriado sem o processo cerebral asso-
ciado, ou o segundo sem o primeiro. Assim, os processos não são necessariamente idênticos.
Mas todas as identidades genuínas são identidades necessárias, o que não quer dizer que a sua
descoberta não possa ser uma questão empírica. Deste modo, a contingência da conexão entre
os processos dos qualia e os processos cerebrais mostra que a relação entre ambos os processos
não é uma relação de identidade. No entanto, o argumento tem de ir mais longe, pois pensamos
que podemos também imaginar água que não seja H2O, mas a água é certamente idêntica a
H2O. Neste ponto, oferece-se um argumento para nos explicar por que razão não podemos re-
almente imaginar água que não seja H2O, mas apenas substâncias que têm muitas das caracte-
rísticas próprias da água mas que não são água. Defende-se, no entanto, que o carácter imediato
do nosso acesso aos qualia mentais torna as duas situações radicalmente diferentes.

112
Eddington apresentou um argumento semelhante para mostrar que, seja qual for a relação
entre um acontecimento ser posterior a outro e um acontecimento estar na direcção do tempo
em que a entropia aumenta relativamente a outro, ela não pode ser uma relação de identidade.
Nós sabemos, defendeu Eddington, o que é a «posterioridade». E sabemos também o que é a
noção entrópica de um estado estar mais «desordenado» do que outro. E sabemos, defendeu,
que as duas relações não são pura e simplesmente a mesma relação. Sabemos isto tal como sa-
bemos que, seja qual for a relação das experiências mentais com os processos cerebrais, essa re-
lação não é uma identidade.
Neste caso, como Eddington sublinhou, o papel especial do tempo no mundo é importante.
Fazemos frequentemente as identificações funcionar por meio de um processo em que se remo-
vem do mundo físico algumas características do objecto identificado, colocando-se essas carac-
terísticas no mundo mental. Assim, quando dizemos que uma onda de luz vermelha é idêntica a
uma onda electromagnética, não precisamos de nos preocupar com o facto de não podermos
conceber as ondas electromagnéticas como vermelhas. Pressupusemos já que o vermelho da
onda de luz de que temos experiência não é uma característica da onda de luz física, mas apenas
uma «qualidade secundária» na mente, gerada causalmente pelo facto de a luz de um certo tipo
incidir nas nossas retinas. Mas as relações temporais entre acontecimentos do mundo, defende-
ria Eddington, são características genuínas desses acontecimentos. E esse tipo de temporalida-
de, defende ele, tem de ser exactamente o mesmo tipo de temporalidade que relaciona os acon-
tecimentos da experiência imediata entre si. Por estas razões, razões que são bastante difíceis de
esclarecer filosoficamente mas que ainda assim são persuasivas, Eddington pensa que é implau-
sível uma tese que identifique as relações temporais tal como existem no mundo (e tal como te-
mos delas uma experiência imediata) com relações como as que ocorrem entre graus de ordem
diferentes, como a diferença de entropia. A teoria entrópica da assimetria do tempo tem aspec-
tos importantes e filosoficamente enigmáticos mesmo que possamos tornar o programa explica-
tivo de Boltzmann completamente plausível.

Leituras complementares

Reichenbach (1956) é uma discussão fecunda das questões deste capítulo. Uma discussão
contemporânea é Horwich (1987). Davies (1974) é uma excelente introdução aos vários aspectos
da física. Sklar (1995) é uma discussão sistemática da física estatística a partir de uma perspecti-
va filosófica.
Uma boa introdução à teoria da probabilidade é Cramer (1955). Feller (1950) fornece mais
pormenores e é mais avançado. Kolmogorov (1950) é um resumo vivo da base axiomática feito
pelo seu inventor. Em Kyburg (1970) ou, mais resumidamente, no capítulo 3 de Sklar (1995),
pode encontrar-se um levantamento das teorias filosóficas da probabilidade. Para uma introdu-
ção à aleatoriedade objectiva veja-se Earman (1986), capítulo 8.
Em Salmon (1984) e Humphreys (1989) podem-se encontrar levantamentos sobre o que os
filósofos dizem acerca das explicações estatísticas. Uma vez mais, um breve resumo encontra-se
no capítulo 8 de Sklar (1995).
Os artigos mais importantes na história da mecânica estatística estão traduzidos em Brush
(1965). Brush (1976) contém informação abundante sobre a história do tema. Ehrenfest e Ehren-
fest (1959) é uma das primeiras exposições críticas do assunto, também muito útil para uma
compreensão histórica.
Buchdahl (1966) e Pippard (1961) são boas introduções aos conceitos da termodinâmica. O
trabalho original de Gibbs (1960) é uma boa introdução aos aspectos essenciais da mecânica es-
tatística. Tolman (1938) é um tratamento subtil e discursivo que enfatiza aspectos fundamentais.
Jancel (1963) abrange muitos dos pormenores das abordagens fundamentais da teoria.
Pode-se encontrar em Farquhar (1964) a abordagem inicial à teoria ergódica. A abordagem
mais moderna está resumida de uma maneira brilhante (a um nível matemático bastante sofisti-
cado) em Arnold e Avez (1968). Sinai (1976) é também breve e profundo (mas difícil). Para uma
discussão filosófica das abordagens alternativas da teoria do desequilíbrio, veja-se Sklar (1995),
capítulo 7.

113
Em Jaynes (1983), Katz (1967) e Hobson (1971) pode encontrar-se a abordagem «subjectivis-
ta» (ou melhor, indutivista) à mecânica estatística. As ideias fundamentais de Krylov estão em
Krylov (1979). Veja-se também, Batterman (1990) e Sklar (1995), capítulo 7. Para a abordagem de
Prigogine, veja-se Prigogine (1980 e 1984). Veja-se também Sklar (1995), capítulo 7, e Batterman
(1991).
Uma introdução não técnica ao estudo dos sistemas caóticos é Gleick (1987). Devaney (1986)
é uma introdução aos aspectos matemáticos da teoria. Schroeder (1991) explica a estrutura de
muitos aspectos da teoria do caos e discute também outras áreas em que o raciocínio probabilís-
tico se tornou central para a explicação científica.
Um trabalho clássico sobre a relação da cosmologia com a entropia é Tolman (1934). Davies
(1974) é acessível e abrange muitos tópicos importantes. Penrose (1979) é um tratamento subtil
do aumento de entropia e dos factos cosmológicos. Sklar (1995), capítulo 8, é um breve levan-
tamento a partir de uma perspectiva filosófica.
A origem da discussão sobre os sistemas ramificados está em Reichenbach (1956), especial-
mente na secção 3. Davies (1974), capítulo 3, apresenta os sistemas ramificados. Sklar (1995), ca-
pítulo 8, resume o cepticismo quanto à conexão do aumento de entropia cósmica com o aumen-
to de entropia paralela dos sistemas ramificados.
Sobre a questão da direcção do tempo, Reichenbach (1956), secção 4, é fecundo. As concep-
ções de tipo reichenbachiano são defendidas em Grünbaum (1973), capítulo 8. Mehlberg (1980),
especialmente os capítulos 5 e 8, oferece uma crítica. Uma discussão penetrante das teses rei-
chenbachianas está em Earman (1974). Horwich (1987) oferece uma abordagem sobre a origem
cósmica da assimetria dos sistemas ramificados, assim como uma tentativa de basear a assime-
tria intuitiva do tempo na assimetria dos sistemas ramificados. Sklar (1995), capítulo 10, e Sklar
(1985), capítulo 12, investigam como será a estrutura de uma abordagem reducionista à ordem
temporal.

114
4
A imagem quântica do mundo

A base experimental da teoria dos quanta

A teoria dos quanta confrontou cientistas e filósofos com uma série de questões geradoras de
perplexidades. Muitos deles estão convencidos que qualquer tentativa de compreender um
mundo descrito pela teoria dos quanta exigirá uma muito mais radical revisão da nossa com-
preensão da natureza das coisas do que a revisão da nossa compreensão da natureza do espaço
e do tempo exigida pelas teorias da relatividade. Tem-se afirmado que para compreender a teo-
ria dos quanta temos de rever a própria compreensão que temos de matérias como a natureza
objectiva da realidade e a sua independência em relação à percepção que temos dela, a natureza
de um sistema complexo e a sua relação com as suas componentes, e a natureza das determina-
ções de tipo causal e outras existentes no mundo. Que se passa com esta teoria que nos parece
impor uma revisão assim tão radical das nossas categorias básicas da natureza?
Será vantajoso explorar muito brevemente alguns dos momentos mais importantes no de-
senvolvimento histórico da teoria. Em primeiro lugar, temos de recuar até à história das teorias
sobre a natureza da luz. No século XVII, propuseram-se dois modelos da natureza da luz. Um
deles, adoptado a título hipotético por Newton, era o de que a luz era uma torrente de partícu-
las emitidas a partir de uma fonte e reflectidas por objectos luminosos. O outro, proposto por
Huyghens, entre outros, era o de que a luz era uma forma de movimento ondulatório que ocor-
reria num meio de transmissão, tal como o som é uma onda gerada por uma fonte, transmitida,
através do ar, como movimento periódico.
A teoria ondulatória tinha de ultrapassar certas dificuldades. Como poderia uma onde ser
transmitida do Sol para a Terra, dada a existência de um vácuo sem qualquer matéria entre os
dois corpos celestes? Seria necessário postular um meio qualquer de transmissão, o éter, para
sustentar as ondas que chegam à Terra a partir do Sol. Factos posteriores sobre a polarização da
luz indicaram que se a luz fosse uma onda, teria de ser tal que o movimento ondulatório fosse
perpendicular à direcção de propagação da onda. Isso tornava a constituição deste meio etéreo
muito problemática, pois pensava-se que tais ondas só eram transmissíveis num corpo rígido.
No caso do movimento ondulatório, são também de esperar fenómenos de difracção. Podemos
ouvir um som gerado por detrás de uma parede que tenha apenas uma pequena abertura, pois
mal o som entra pela abertura, dispersa-se — até mesmo pela parte de trás da barreira. Mas não
produz a luz sombras bem delimitadas, nunca exibindo tais efeitos de dispersão quando é inter-
rompida por uma barreira? Isso é o que a teoria corpuscular nos levaria a esperar.
Mas nos séculos XVIII e XIX a teoria ondulatória alcançou o que pareceu uma vitória clara. As
medições efectuadas indicavam que, de acordo com a expectativa da teoria ondulatória, e em
conflito com a previsão da teoria corpuscular, a luz viajava mais devagar em meios com maio-
res índices de refracção do que em meios com índices menores. A observação cuidada mostrou,
além disso, que os efeitos de difracção que seriam de esperar de uma onda podiam observar-se
na luz. Estes efeitos tinham previamente passado despercebidos porque o comprimento de on-
da da luz, ao contrário do do som, é muito curto, em comparação com o tamanho dos objectos
macroscópicos. Isto torna os efeitos de dispersão associados à difracção difíceis de discriminar.
O mais convincente de tudo a favor da teoria ondulatória foi a descoberta de efeitos de inter-
ferência. Uma onda é um fenómeno periódico tanto no espaço como no tempo. Tem uma ampli-
tude que aumenta e diminui periodicamente em qualquer lugar que se escolha, aumentando e
diminuindo também de lugar para lugar num mesmo momento. Podemos sobrepor duas on-
das. Se sobrepusermos os cumes de duas ondas, a amplitude da onda resultante aumenta. Se
sobrepusermos o cume de uma onda com o ventre de outra, a onda composta resultante terá

115
uma amplitude nula nesse local e nesse momento. Se uma onda for dividida em partes que de-
pois sobrepomos entre si (por exemplo, fazendo a onda passar por duas fendas numa barreira,
sobrepondo depois os feixes daí resultantes e deixando-os incidir num ecrã), forma-se um «pa-
drão de interferência» que resulta de uma alternância sistemática de sobreposições «construti-
vas» e «destrutivas». Tal padrão, que podemos obter com a luz, é tomado como uma indicação
clara de um fenómeno ondulatório. Se a luz consistisse em partículas em vez de ondas, seria de
esperar que se encontrasse o padrão, muito mais simples, de duas dispersões sobrepostas de
amplitude, uma por cada fenda, e não o sistema periódico de amplitudes maiores e menores
que são de esperar de uma onda.
Já perto do fim do século XIX Maxwell convenceu a comunidade científica de que a luz era
uma forma de onda electromagnética. Mais tarde, a ideia do éter como um meio de transmissão
da onda foi gradualmente abandonada. Encarava-se o próprio campo electromagnético como
uma espécie de entidade substantiva que poderia ser transmitida através de um vácuo genuíno,
explicando-se assim a transmissão da luz do Sol, por exemplo, para a Terra.
Os primeiros sinais de que a teoria ondulatória canónica iria encontrar dificuldades surgi-
ram das tentativas para compreender a interacção entre a matéria e a radiação. Um corpo mate-
rial emite e absorve radiação. Se for mantido a uma temperatura fixa, esse corpo irradia e ab-
sorve radiação. O corpo estará em equilíbrio em relação à radiação, cuja energia estará distribu-
ída pelas várias frequências possíveis associadas a cada onda, de acordo com uma lei de distri-
buição fixa. Esta lei pode ser determinada experimentalmente. Todos estamos familiarizados
com a mudança na distribuição das frequências que ocorre com a diferença de temperatura: po-
demos observar uma barra de metal aquecida a mudar de cor à medida que se torna cada vez
mais quente.
Fizeram-se várias tentativas para compreender esta importante função de distribuição espec-
tral. Uma das abordagens, que partiu da lei da distribuição de Maxwell-Boltzman para as molé-
culas do corpo aquecido, deu origem à lei de Wien. Esta lei aproximava-se satisfatoriamente da
distribuição de frequências observada nas altas frequências, mas falhava nas frequências mais
baixas. Uma outra abordagem partia também dos postulados da teoria da mecânica estatística
discutida no capítulo 3, mas aplicava o raciocínio estatístico à própria radiação, o que teve como
resultado a lei de Rayleigh-Jeans. Esta teoria funcionava bem nas baixas frequências mas dava
origem a resultados impossíveis — divergentes — nas altas frequências.
Max Planck procurou e encontrou uma lei que fosse um compromisso entre as outras duas e
que se adaptasse melhor aos factos experimentais. Mas a reflexão sobre o seu significado físico
pareceu conduzir a uma interpretação quase inevitável. A lei de Planck podia ser compreendi-
da, com base no raciocínio teórico canónico, se admitíssemos que só se trocava energia entre a
matéria e a luz em «pacotes» discretos, sendo a energia de cada pacote igual a uma constante
fixa multiplicada pela frequência da luz emitida ou absorvida. Isto contradizia frontalmente os
pressupostos habituais da teoria ondulatória, nomeadamente o de que entre a matéria e a luz
podia haver trocas de qualquer quantidade de energia e em qualquer frequência. Qual era a
origem deste carácter discreto da troca de energia?
Einstein sublinhou mais tarde que um outro tipo de interacção entre radiação e matéria (a
libertação de electrões de um metal quando uma radiação de alta energia o ilumina, o chamado
«efeito fotoeléctrico») parecia também sugerir que a energia só existia na radiação sob a forma
de pacotes discretos. Os resultados experimentais indicaram uma vez mais que a energia de ca-
da pacote era proporcional à frequência da radiação que ele representava. A energia dos elec-
trões libertados do metal dependiam da frequência da radiação usada e não da sua intensidade.
Só o número de electrões libertados dependia da intensidade da radiação. Era como se cada
electrão se libertasse ao interagir com um único pacote de energia luminosa (um «fotão») e co-
mo se a intensidade da radiação indicasse quantos fotões estavam presentes numa dada fre-
quência. A radiação parecia, uma vez mais, ter um aspecto corpuscular.
Inspirado pelos aspectos da luz análogos às partículas, um conhecido fenómeno ondulatório,
de Broglie sugeriu que alguns fenómenos familiares das partículas poderiam também ter um
aspecto ondulatório. As partículas componentes que constituem o átomo, como o electrão, exi-
biriam, pois, sob condições experimentais apropriadas, alguns aspectos próprios de um fenó-
meno ondulatório, tais como a difracção ou a interferência. Um argumento engenhoso baseado

116
na relatividade permitiu a de Broglie associar a uma partícula não apenas uma frequência (tida
como proporcional à energia, como acontecia com os pacotes de energia luminosa), mas tam-
bém um comprimento de onda. Pensava-se que este comprimento de onda era inversamente
proporcional à quantidade de movimento da partícula.
Curiosamente, a confirmação experimental da ousada conjectura de de Broglie já tinha sido
obtida, apesar de a importância dos dados recolhidos não ter sido reconhecida até à sua tese se
ter tornado conhecida. Podemos obter fenómenos de interferências não apenas usando um dis-
positivo de múltiplas fendas, mas também dispersando uma onda através de um padrão regu-
lar constituído por um conjunto de linhas talhadas numa placa reflectora, a chamada «rede de
difracção». A onda dispersa-se em cada linha e as ondas dispersas combinam-se, interferindo
umas com as outras e produzindo um dos conhecidos padrões periódicos de interferência, típi-
cos da interacção de uma multiplicidade de ondas coerentes. Para o electrão, com o seu peque-
níssimo comprimento de onda, os átomos de um cristal fornecem um tal reticulado de difrac-
ção. De facto, se um feixe de electrões se dispersar na superfície de um cristal, os electrões re-
flectidos distribuem-se segundo um padrão cuja distribuição angular é precisamente o que seria
de esperar do padrão de interferência gerado por uma onda com o comprimento associado de
de Broglie dispersado por um reticulado de difracção com o espaçamento apropriado aos áto-
mos num reticulado de cristal. Se a luz (uma onda) tiver um aspecto corpuscular, os feixes de
electrões (feixes de partículas) exibirão um aspecto ondulatório. (Veja-se a figura 4.1)

===========================================
INSERIR A FIGURA DA PÁGINA 161 COM A SEGUINTE LEGENDA:

Figura 4.1 O aspecto ondulatório dos electrões tal como revelado pela difracção de um cristal. Dispara-
se, a partir de um certo ângulo, um feixe de electrões para a superfície de um cristal. O feixe reflectido é
detectado por D, que se encontra posicionado num ângulo diferente do da origem do feixe. A curva C in-
dica esquematicamente a variação na intensidade do feixe reflectido à medida que muda o ângulo de D
relativamente ao cristal e ao feixe, e, que sobre ele incide. C apresenta a forma que seria de esperar se o fei-
xe de electrões fosse uma onda que produzisse excitações geradoras de novas ondas que se dispersassem a
partir de cada átomo do reticulado de cristal, ondas que depois «interferissem» entre si.
===========================================

Posteriormente, Erwin Schrödinger encontrou a equação apropriada, cujas soluções repre-


sentariam não apenas a onda associada a um electrão livre, mas também as ondas associadas a
electrões ligados em vários campos de forças. A aplicação da equação a um electrão em órbita
em torno do núcleo de um átomo indicava que só um número discreto de energias do electrão
correspondia a ondas que pudessem existir numa tal situação de partículas ligadas. De facto, as
energias correspondiam àquelas energias permitidas dos electrões num átomo já postuladas por
uma teoria atómica prévia.
Esta teoria anterior dos electrões e do seu comportamento no átomo, o modelo de átomo de
Bohr, conduziu, curiosamente, a uma descoberta da teoria dos quanta que enveredou por um
caminho bastante diferente do que o que conduzira de Planck a de Broglie e deste a Schrödin-
ger. O movimento dos electrões num átomo tem como resultado a radiação emitida pelo átomo.
Mas o padrão da frequência da radiação emitida, o chamado «espectro do átomo», é bastante
diferente daquele que seria de esperar em termos clássicos. Em termos clássicos, seria de espe-
rar que as frequências surgissem em famílias de uma frequência básica e de múltiplos inteiros
desta. Isto segue-se de alguns teoremas clássicos fundamentais sobre o modo como o movimen-
to de uma partícula carregada pode ser decomposto em elementos básicos e simples, e da asso-
ciação clássica de um tipo de movimento de uma carga com o tipo de radiação irradiada a partir
dessa carga. Mas o que se descobriu em vez disto foi que se podiam organizar as frequências
emitidas em famílias caracterizadas por diferenças de inteiros, e não por múltiplos simples de
uma frequência fundamental.
Bohr apresentou uma imagem do átomo que gerava este resultado, apesar de o modelo se
distanciar imenso do que deveria ser possível de acordo com a teoria canónica de então. Segun-
do Bohr, os electrões podiam existir no átomo em estados de energia discretos e definidos, ao
contrário da perspectiva clássica que permitia qualquer um de um contínuo de estados. Na no-
va imagem, os electrões «saltam» de um estado energético para outro. Cada salto emitiria ou

117
absorveria energia numa quantidade igual à diferença de energia entre os dois estados. Associ-
ada à alteração de energia no átomo estaria a emissão ou absorção de radiação de uma frequên-
cia associada a essa energia pela regra de Planck. Isto contrasta fortemente com a perspectiva
clássica — na qual os electrões emitiriam ou absorveriam energia continuamente. O modelo de
Bohr era capaz de gerar os estados de energia para os átomos mais simples por meio de um
grupo de regras simples, apesar de algo fortuitas. Mas este modelo revelou-se incapaz de forne-
cer um método geral para determinar estados de energia em casos mais complexos, assim como
para fornecer um modo sistemático de determinar a intensidade e a frequência da luz associa-
das à emissão e absorção atómicas.
Heisenberg propôs-se resolver estes problemas procurando uma forma sistemática de tratar
o problema da interacção entre os átomos e a radiação. Dada a incompatibilidade do modelo de
Bohr com a teoria existente do movimento dos electrões, Heisenberg procurou um esquema que
pudesse evitar que se desse de todo em todo uma imagem dinâmica do electrão do átomo. O
esquema procuraria, ao invés, calcular directamente as quantidades observáveis desejadas. Cu-
riosamente, a teoria acabou, em vez disso, por fornecer uma nova base para a dinâmica como
um todo. O modo de proceder de Heisenberg consistia em apoiar-se no método clássico de re-
duzir o movimento complexo ao simples e em associar a radiação emitida com a quantidade de
cada componente de movimento presente. Mas agora ele precisava de uma espécie de decom-
posição dupla para corresponder ao facto de as frequências observadas se caracterizarem por
dois números, que correspondem a diferenças entre estados de energia, e não por um número,
correspondentes ao múltiplo do movimento fundamental, tal como na física clássica.
No seu novo formalismo, Heisenberg duplicou por analogia a estrutura formal das regras
mais antigas para calcular energias, frequências e intensidades. Heisenberg chegou assim a um
processo sistemático para determinar as energias que se permite que o electrão tenha em qual-
quer átomo, as correspondentes frequências de radiação emitida e as intensidades observadas
de radiação.
À medida que Heisenberg, Born e Jordan trabalhavam na teoria, aproximavam-se de uma
teoria dinâmica inteiramente nova. Apesar de a matemática ser clara, a interpretação física da
teoria não era óbvia. As quantidades dinâmicas básicas da posição e da quantidade de movi-
mento tinham previamente sido matematicamente representadas por funções que atribuíam
números à partícula em função do tempo. Estes eram a posição e a quantidade de movimento
de uma partícula em cada instante. Agora, contudo, as quantidades dinâmicas eram represen-
tadas por objectos matemáticos a que se chamam operadores. Estes operadores aplicavam uma
entidade matemática abstracta, o estado do sistema, de um estado noutro. Construíram-se re-
gras para determinar os valores observados possíveis de cada grandeza, dado o estado de um
sistema e dado o operador correspondente à grandeza cujos valores nos interessavam. Podia-se
assim calcular, por exemplo, os valores energéticos possíveis que um electrão poderia ter num
átomo de um dado tipo. Outras regras permitiam o cálculo de «amplitudes de transição» do es-
tado correspondente a um valor de uma quantidade para outro estado numa situação física da-
da. Assim, poderia calcular-se a taxa de variação dos electrões de um estado de energia para ou-
tro, mesmo quando o átomo interagia com o exterior, o que dava as intensidades da luz emitida
de uma frequência especificada.
Mas que tipo de mundo físico correspondia a esta matemática inovadora? Ocorrera algo de
completamente novo na física. Ao passo que anteriormente um modelo físico tinha de conduzir
a uma descrição matemática, neste caso tínhamos uma estrutura matemática que funcionava
mas cuja interpretação física parecia bastante problemática.
Cedo se propôs uma resposta a estas questões sobre o significado físico da teoria de Heisen-
berg. Quando se calculavam os estados de energia possíveis de um electrão de um átomo pelo
método de Schrödinger, presumindo que os estados de energia são os valores de energia possí-
veis para ondas «estacionárias» de electrão no potencial eléctrico do núcleo do átomo (qualquer
coisa como as ondas sonoras estacionárias possíveis num tubo de órgão com um comprimento
especificado), os valores previstos resultantes eram idênticos aos obtidos pelas enigmáticas re-
gras de Heisenberg, usando o operador apropriado à energia para o átomo em questão. Quando
se calculam taxas de transição entre estados pelo método de Schrödinger, usando um raciocínio
análogo ao que nos diz como um diapasão em vibração pode fazer oscilar outro por ressonân-

118
cia, obtêm-se os mesmos valores do que os obtidos por Heisenberg ao calcular transições de
amplitudes por meio do seu misterioso cálculo de operadores. Por fim, Schrödinger pôde de-
monstrar a relação matemática entre as duas teorias que garantia que elas iriam sempre prever
os mesmos resultados observáveis. Matematicamente, os dois métodos eram «equivalentes» en-
tre si, resultando as diferenças aparentes do facto de Schrödinger integrar a evolução temporal
do sistema na evolução da sua função de onda, ao passo que Heisenberg usava um estado do
sistema independente do tempo e integrava a dinâmica da evolução temporal na variação ao
longo do tempo dos operadores atribuídos a um dado observável físico.
Parecia que, com a teoria de Schrödinger, se tinha alcançado pelo menos o princípio de um
modelo físico do electrão como onda. Não poderia a teoria de Heisenberg ser apenas encarada
como um meio matemático de lidar com os electrões e as outras partículas como ondas físicas
genuínas?
Essa foi a proposta de Schrödinger. Mas cedo se tornou difícil aceitar esta solução simples
das dificuldades. A função de onda «dispersa» que descrevia o electrão só assumia, na verdade,
a forma de uma onda no tempo e espaço físicos no caso de uma única partícula. Quando se con-
siderava um complexo de partículas, a função de onda só tinha a aparência de uma onda num
espaço abstracto coordenado de dimensão superior que representasse simultaneamente as posi-
ções de todas as partículas como um único ponto. Muito pior era a aparente incompatibilidade
entre a interpretação da «verdadeira» onda dispersa do electrão e os seus aspectos manifestos
de partícula pontual. Quando aplicamos os dispositivos experimentais usados para detectar a
presença de um electrão, descobrimos que todas as suas manifestações, tais como a massa e a
carga, se podem encontrar concentradas numa região física muito pequena. Se não forem partí-
culas «pontuais», os electrões terão, pelo menos, uma extensão bastante diminuta. Mas a onda
que descreve a presença de um electrão apresenta-se dispersa num grande volume físico — na
verdade, muitas vezes apresenta-se dispersa até ao «infinito», pelo menos num pequeno grau.
Portanto, como se pode identificar a partícula localizada com uma onda dispersa fisicamente
real?
O facto de os fenómenos ondulatórios poderem muitas vezes exibir uma concentração está-
vel da energia da onda num pequeno volume oferece alguma esperança de reconciliação dos
aspectos corpusculares de um electrão com a sua alegada natureza de onda física. Sabia-se, pela
teoria ondulatória clássica, que em alguns casos existiam «pacotes de ondas», nos quais a quase
totalidade da energia do campo está concentrada num muito diminuto volume de espaço. Num
caso excepcional, o do oscilador harmónico simples, podia mostrar-se que um pacote concen-
trado de electrões exibe estabilidade ao longo do tempo. Mas, infelizmente, no caso geral, podia
mostrar-se que um pacote de ondas concentrado que represente um electrão dispersa-se muito
rapidamente, conduzindo a uma onda dispersa no espaço. O problema da reconciliação da on-
da dispersa com a partícula localizada permanecia.
Estamos, pois, perante um enigma. Mostrava-se que a luz — que já há algum tempo se sabia
que exibia distintamente aspectos ondulatórios de difracção, interferência, amplitude de onda e
frequência — tinha também um aspecto corpuscular. Qualquer detecção de luz por meio de um
dispositivo material, como um pedaço de filme fotográfico, revelava que a luz interagia com a
matéria de um modo muito análogo ao das partículas. A energia da luz parecia estar contida em
pacotes discretos que só podiam interagir com a matéria «um de cada vez». Percebia-se que a
matéria, na forma de partículas elementares, que se sabia serem corpusculares, exibindo massa
e carga concentradas num pequeno volume físico, tinha também um aspecto ondulatório. Os
feixes de electrões, ao atravessarem pequenas fendas em barreiras, eram difractados, tal como
acontecia com feixes de luz enviados através de pequeníssimas fendas. Os electrões dispersos
em torno do reticulado de um cristal exibiam um padrão de interferência, exactamente análogo
ao exibido pela luz dispersa em torno de um reticulado de difracção tradicional.
Mas como poderia compreender-se tal coisa? Como poderiam termos como «amplitude de
onda» e «frequência» aplicar-se a partículas localizadas? Como poderiam os constituintes físicos
descritos por uma função de onda dispersa encontrar-se sempre, quando eram detectados, loca-
lizados num pequeno volume, como é próprio das partículas discretas não dispersas?

119
Primeiras tentativas de interpretação
da teoria: o princípio da incerteza

A interpretação do formalismo: probabilidade, interferência e medição

A interpretação de Born da intensidade da função de onda, segundo a qual esta fornece uma
probabilidade, foi um elemento crucial para a compreensão da teoria. Toda a onda tem uma
amplitude, a «altura» da onda. A intensidade de uma onda, aproximadamente proporcional ao
quadrado dessa amplitude, é o que normalmente registamos, no caso da luz, como o brilho da
luz; é uma medida da energia contida na onda. As amplitudes das ondas na mecânica quântica
foram expressas em termos de números complexos, mas os seus «quadrados» eram números
reais que representavam uma quantidade física directamente interpretável. A ideia de Born foi
que estas intensidades poderiam ser tomadas como representativas da probabilidade com que
um observável físico teria um dado valor de entre vários possíveis, se a medição adequada fosse
feita. A função de onda podia ser representada como uma função de diferentes variáveis; por
exemplo, tanto podia ser representada como uma função da posição quer como uma função da
quantidade de movimento da partícula à qual a onda está associada. Dependendo da represen-
tação escolhida, podia calcular-se, a partir da intensidade apropriada numa região da «onda de
probabilidade» quântica, como alguns especialistas lhe começaram a chamar, as probabilidades
de, por exemplo, encontrar a partícula numa região, caso se tenha efectuado uma medição da
posição, ou num dado domínio de quantidades de movimento caso, em vez da posição, se tenha
medido a quantidade de movimento. As probabilidades de transição de uma partícula de um
estado para outro podiam também ser determinadas a partir das funções de onda e das suas in-
ter-relações, tal como as amplitudes de transição associadas às intensidades da luz espectral
emitida originalmente calculadas pelo método de Heisenberg.
A perspicaz ideia de Born fornece claramente a primeira pista para reconciliar o carácter
disperso da função de onda com a natureza localizada das quantidades medidas. A onda não
representava uma partícula realmente dispersa, mas apenas uma probabilidade de encontrar o
valor localizado da partícula algures numa região definida de valores.
Mas uma simples identificação da intensidade da função de onda com probabilidades tal
como habitualmente as entendemos está repleta de dificuldades. Onde as dificuldades se vêem
melhor é no fenómeno da interferência. Suponha-se que se pode obter um resultado com um
certo grau de probabilidade de uma de duas maneiras, sendo as duas maneiras causalmente in-
dependentes uma da outra. Representem-se as probabilidades dos resultados por P(O/A) e
P(O/B), sendo O o resultado e A e B os dois modos segundo os quais se pode obter o resultado.
Normalmente, seria de esperar que, dada a independência de A e B, a probabilidade de se obter
O quer pela via A quer pela via B seria a soma das duas probabilidades referidas. Mas, em geral,
isto não é verdade na situação quântica. Por exemplo, a probabilidade de um fotão ser recebido
num certo ponto de um ecrã iluminado através de duas fendas não é a soma da probabilidade
que o fotão tem de chegar a esse ponto caso apenas a fenda 1 esteja aberta mais a probabilidade
de chegar a esse ponto caso apenas a fenda 2 esteja aberta. Na verdade, se ambas as fendas esti-
verem abertas, a probabilidade que o fotão tem de chegar a um ponto dado pode ser menor do
que a que teria caso apenas uma das fendas estivesse aberta. Em termos de onda, isto acontece
porque a onda da fenda 1 e a da fenda 2 «interferem destrutivamente» entre si, do que resulta a
redução da probabilidade em questão. Mas se a função de onda é apenas uma representação da
probabilidade e não uma onda física no mundo, como pode tal interferência ocorrer? As proba-
bilidades normais não «interferem», pura e simplesmente, entre si.
Bastam algumas simples experiências idealizadas para mostrar quão curioso é realmente o
mundo quântico. Considere-se primeiro a experiência das duas fendas. Neste caso, só deixamos
um único feixe de luz passar por uma barreira que tem duas fendas que podemos abrir ou fe-
char, deixando-se que o feixe incida num ecrã. Se abrirmos apenas uma das fendas, obtém-se
uma distribuição característica da luz no ecrã centrado próximo da localização da fenda aberta.
Contudo, se ambas as fendas estiverem abertas, como notámos anteriormente, o padrão do ecrã
não será a soma dos padrões obtidos com uma fenda apenas, mas antes o famoso padrão de in-
terferência. É importante notar que isto é o que se obtém ainda que o feixe seja de intensidade

120
tão fraca que, em média, só passe um pacote de energia (um fotão) de cada vez pelas fendas em
direcção ao ecrã. Isto indica que o padrão obtido não pode ser explicado por qualquer interac-
ção causal entre os fotões. É antes como se cada fotão passasse por ambas as fendas como uma
onda, mas fosse absorvido pelo ecrã como uma partícula localizada. (Veja-se a figura 4.2.)

===========================================
INSERIR A FIGURA DA PÁGINA 167 COM A SEGUINTE LEGENDA:

Figura 4.2 A experiência das duas fendas. Se dirigirmos um feixe de partículas e contra uma parede com
duas fendas e as partículas forem detectadas num ecrã do outro lado da parede, é de esperar que a distri-
buição das partículas na parede apresente o padrão indicado em (a). Dois feixes de partículas, cada um dos
quais centrado em torno de uma das fendas, adicionam-se meramente um ao outro. Mas se apontarmos
uma onda para a fenda, é de esperar o padrão de interferência apresentado em (b). Isto acontece porque as
ondas emitidas através das duas fendas tanto podem adicionar-se como cancelar-se mutuamente, depen-
dendo das distâncias relativas entre um ponto do ecrã e as duas fendas. Se dirigirmos um feixe e de elec-
trões contra um dispositivo com duas fendas, detecta-se no ecrã o padrão indicado em (b), apesar da natu-
reza de tipo corpuscular dos electrões revelada noutras experiências.
===========================================

Se modificarmos a experiência colocando, junto a cada fenda, um detector que indique se


um fotão acabou ou não de passar pela fenda, o padrão de interferência desaparece e o ecrã
mostra, em vez disso, o tipo de padrão que obteríamos se nos limitássemos a adicionar os pa-
drões de duas experiências com uma fenda. O mesmo padrão se obtém caso cada fenda seja
iluminada por duas fontes distintas de luz, ao invés de uma única fonte de luz incidir nas fen-
das. Vemos aqui a maior parte das peculiaridades típicas do mundo que exigem o formalismo
quântico.
Outra experiência idealizada, chamemos-lhe «experiência das duas trajectórias», toma um
único feixe de partículas de luz e divide-o em dois feixes, cada um dos quais descreve uma tra-
jectória diferente, acabando depois por serem ambos reconduzidos a um mesmo ponto. A divi-
são de um feixe de luz pode ser obtida usando um vidro meio espelhado que reflicta metade da
luz que sobre ele incida, deixando a outra metade passar através dele.
No ponto em que os dois feixes se voltam a reunir podemos escolher o tipo de experiência
de detecção a executar. Numa dessas experiências colocam-se detectores de maneira a que só
disparem se a «partícula» detectada (o fotão) tiver percorrido uma das trajectórias e não a outra.
Se a intensidade do feixe for dividida equitativamente, esta experiência registará resultados
compatíveis com a hipótese de que é como se o separador de feixes original dividisse um feixe
de partículas em duas metades, consistindo um feixe em partículas que só percorrem a trajectó-
ria A e o outro em partículas que só percorrem a trajectória B. Mas se, ao invés, os dois feixes
forem recombinados no novo ponto de coincidência, pode obter-se interferência entre os dois
feixes. Na verdade, um detector de interferência deste tipo, ou interferómetro, é um dispositivo
óptico clássico. Estes efeitos de interferência revelam dados em conformidade com a hipótese de
que é como se o vidro meio espelhado original, ou outro dispositivo de divisão, dividisse real-
mente uma onda em duas componentes, uma das quais percorresse a trajectória A e a outra a B
continuando, no entanto, em fase uma com a outra, permitindo que as componentes exibam, ao
recombinar-se, o fenómeno de coordenação característico conhecido por «interferências». É co-
mo se cada partícula, caso os feixes sejam concebidos como feixes de partículas, percorresse am-
bas as trajectórias simultaneamente! (Veja-se a figura 4.3.)

===========================================
INSERIR A FIGURA DA PÁGINA 168 COM A SEGUINTE LEGENDA:

Figura 4.3 A experiência das duas trajectórias. Pode dividir-se um feixe de electrões, e, de maneira a se-
guir uma das duas trajectórias indicadas na figura por a e b. No canto mais afastado, onde as trajectórias
voltam a unir-se, tanto se pode colocar um dispositivo R na trajectória para voltar a combinar os feixes e
para detectar padrões de interferência por meio do detector D1 (mostrando assim a natureza ondulatória
dos electrões), como se pode remover o recombinador de feixes R e detectar, por meio dos detectores D2a e
D2b, os electrões como partículas que percorreram não as duas trajectórias mas apenas uma delas. Pode op-
tar-se por efectuar a experiência num momento posterior, depois de o electrão já ter decididamente come-
çado o seu percurso (percorrendo ambas as trajectórias como onda, ou apenas uma delas como partícula).
Esta é a experiência da «escolha diferida».

121
===========================================

Como Wheeler fez notar, é importante reparar que se pode escolher qual das experiências se
efectuará na altura da coincidência final muito depois de se ter dividido e enviado o feixe. Isto
indica que não se podem explicar estes efeitos apelando para a escolha das experiências, como
se estas de algum modo determinassem, ao dividir-se o feixe, qual dos dois aspectos da experi-
ência — o corpuscular ou o ondulatório — traduz a verdadeira descrição do mundo. É como se
ao dividir o feixe tivéssemos de pensar em algo que tanto possui as características de um feixe
de partículas que se divide em dois feixes de partículas distintos, como as características de uma
onda que se decompõe em duas ondas componentes correlacionadas.
Outro tipo de experiência, a experiência de Stern-Gerlach, ajuda-nos a ver o verdadeiro al-
cance dos fenómenos quânticos. Uma partícula elementar pode possuir uma quantidade conhe-
cida como spin (rotação) e uma quantidade relacionada de momento magnético do spin. Isto re-
laciona-se com a magnetização clássica de uma partícula carregada em movimento rotativo
mas, como a maior parte dos fenómenos quânticos, a relação é uma mera analogia. Para um
electrão, este momento magnético de spin manifesta-se como uma propriedade interna que ad-
mite dois valores. Se o electrão for enviado ao longo de um campo magnético que seja uniforme
em todas as direcções na perpendicular ao seu movimento, será deflectido da sua trajectória,
para cima ou para baixo, na direcção da inomogeneidade magnética. Se escolhermos então um
eixo vertical com a direcção em que o campo é não uniforme, o feixe de partículas dividir-se-á
num feixe de partículas com spin «para cima» e noutro com spin «para baixo».
Considere-se um feixe de partículas que passe por um dispositivo que absorva todas as par-
tículas com spin para baixo. Envie-se o feixe «para cima puro» assim obtido em direcção a um
dispositivo cuja inomogeneidade magnética faça ângulo recto com o dispositivo de alinhamento
vertical. Chame-se-lhe «dispositivo de alinhamento horizontal». Descobre-se que à saída dos
dispositivo de alinhamento horizontal metade das partículas do feixe apresentam spin para a
esquerda e a outra metade com spin para a direita.
Surgem agora os efeitos de interferência quântica característicos. Se bloquearmos o feixe de
partículas com spin para a direita e enviarmos o feixe de partículas com spin para a esquerda em
direcção a um dispositivo de alinhamento vertical, metade das partículas sairão deste dispositi-
vo com spin para cima e metade para baixo. A mesma coisa aconteceria se bloqueássemos o fei-
xe de partículas com spin para a esquerda, deixando entrar apenas o feixe de partículas com spin
para a direita no dispositivo de alinhamento vertical. Metade dos electrões sairia com spin para
cima e a outra metade para baixo. Mas se recombinássemos os feixes de partículas com spin pa-
ra a esquerda e para a direita que saem do dispositivo de alinhamento horizontal e enviássemos
o feixe recombinado para o segundo dispositivo de alinhamento vertical, todos os electrões do
feixe sairiam com spin para cima! Os feixes de partículas com spin para a esquerda e para a di-
reita que saem do dispositivo de alinhamento horizontal estão em correlação mútua de uma
forma que «recorda» as características de spin para cima puro do feixe de entrada. Quando os
feixes se recombinam, «interferem» entre si não para gerar uma «mistura» de partículas com
spin para a esquerda e para a direita mas um feixe em que todas as partículas têm spin definiti-
vamente para cima. Contudo, tal como no caso das duas fendas, se tivéssemos colocado detec-
tores nas trajectórias dos feixes de partículas com spin para a esquerda e para a direita para re-
gistar, relativamente a cada electrão, se ele tinha saído do dispositivo de alinhamento horizontal
como uma partícula com spin para a esquerda ou para a direita, recombinando depois os feixes
e enviando-os para o dispositivo de alinhamento vertical, metade dos electrões sairiam dessa
dispositivo com spin para cima e metade com spin para baixo. Medir os spins de saída do dispo-
sitivo de alinhamento horizontal obriga cada um dos electrões a ter definitivamente spin para a
esquerda ou para a direita, destruindo a coerência dos dois feixes e tornando impossível a vol-
tar a obter o feixe de partículas com spin para cima por meio da sua recombinação. Isto indica
que os efeitos de interferência são relevantes não apenas para a distribuição espacial das partí-
culas, mas também para qualquer característica observável que possam ter. (Veja-se a figura
4.4.)

===========================================

122
INSERIR A FIGURA DA PÁGINA 170, com as seguintes substituições:

up-down = cima-baixo
U=C
D=B

left-right = esquerda-direita
L=E
R=D

TRADUÇÃO DA LEGENDA:

Figura 4.4 A experiência de Stern-Gerlach. A mecânica quântica permite que um electrão tenha apenas
um de dois valores de spin em relação a qualquer eixo escolhido. O dispositivo de Stern-Gerlach consegue
dividir um feixe de electrões em dois, tendo todos os electrões que estiverem num dado feixe de saída o
mesmo valor de spin. Em (a) um feixe «aleatório» de electrões, e, é enviado para um dispositivo de Stern-
Gerlach de eixo vertical. Metade dos electrões saem com spin para cima e a outra metade com spin para
baixo. Em (b) o feixe de saída com spin para cima puro é enviado para outro dispositivo com a mesma ori-
entação. Todos os electrões que entram no segundo dispositivo saem com spin para cima. Em (c) um feixe
com spin para cima puro que passa por um primeiro dispositivo é enviado para um segundo cujo eixo de
orientação faz em 90 relativamente ao primeiro. Um feixe com spin para cima puro enviado para um dis-
positivo de alinhamento horizontal vê metade dos electrões emergirem com spin para a direita e a outra
metade com spin para a esquerda. Em (d) regista-se o feixe de saída de (c) por meio de detectores coloca-
dos à direita do dispositivo de alinhamento horizontal. Os feixes registados são recombinados e enviados
para um segundo dispositivo de alinhamento vertical. Metade das partículas saem com spin para cima e
metade com spin para baixo. Este é o resultado que seria de esperar se metade dos electrões do feixe de en-
trada do último dispositivo tivessem spin para a direita e a outra metade para a esquerda. Em (e) revela-se
a interferência de spin dos electrões. Desta vez recombinam-se os feixes de saída do dispositivo de alinha-
mento horizontal sem que os perturbemos (com contadores, por exemplo). O feixe recombinado é enviado
para um dispositivo de alinhamento vertical. Agora todos os electrões emergem do último dispositivo com
spin para cima. Apesar da passagem pelo dispositivo de alinhamento horizontal, o facto de o feixe que
atravessou o dispositivo de alinhamento horizontal ter spin para «cima puro» é «recordado» pela interfe-
rência, revelando-se na maneira como o feixe de saída final de (e) difere do de (d).
===========================================

Os feixes recombinados de partículas com spin para a esquerda e para a direita que geram
um feixe com spin para cima puro exibem uma coerência de spin para esquerda e para a direita
que está ausente num feixe que seja composto, em partes iguais, pelos feixes de partículas que
saem de um dispositivo de alinhamento para a esquerda e de um dispositivo de alinhamento
para a direita não relacionado com o primeiro. Diz-se que este último feixe é uma «mistura» de
partículas com spin para a esquerda e para a direita. Diz-se que o primeiro é uma «sobreposi-
ção» de partículas com spin para a esquerda e para a direita. Um tal estado de sobreposição con-
tém informação ausente num estado de mistura. No caso em questão, a informação é a de que o
feixe que sai de um dispositivo de alinhamento horizontal é alimentado por um feixe com spin
para cima puro.
Os fenómenos de interferência tornam problemática a interpretação simples e tradicional da
função de onda como uma medida da probabilidade. Poderíamos tentar conceber a probabili-
dade como uma medida do nosso conhecimento dos valores de um sistema. Procuraríamos en-
tão pensar que atribuir a probabilidade de 1 2 tanto à hipótese de as partículas de um feixe te-
rem spin para a esquerda como à hipótese de terem o spin para a direita seria afirmar que cada
partícula ou tem um spin definitivamente para a esquerda ou para a direita e que será razoável
apostar que há 50% de hipóteses para cada caso. Ou poderíamos tentar pensar que a função de
onda nos diz que a fracção das partículas do feixe que têm spin para a esquerda é de 1 2 e que as
restantes o têm para a direita. Mas, como vimos, tal forma de compreender o fenómeno não
serve, por si só. Pois cada partícula do feixe recombinado tem spin para cima, o que distingue o
feixe de outro muito diferente composto por metade de partículas que tenham spin para a es-
querda e metade de partículas que tenham spin para a direita. A sobreposição de spin para a es-
querda e para a direita não é a mistura de spin para a esquerda e para a direita, apesar de ser
correcto afirmar a respeito dos dois feixes que uma medição de spin segundo o eixo horizontal
indicaria que metade das partículas teria spin para a esquerda e a outra metade para a direita.
Ao reflectir sobre a inter-relação formal entre a teoria ondulatória de Schrödinger e a dinâ-
mica de Heisenberg, von Neumann e Dirac desenvolveram formalismos que tentavam a partir

123
de ambas as abordagens captar a essência da teoria dos quanta. Em cada abordagem, há repre-
sentantes matemáticos de estados do mundo e de observáveis físicos. Suponha-se que um sis-
tema tem um estado definido. A evolução desse estado ao longo do tempo quando submetido a
uma influência causal exterior é o objecto da dinâmica. Dado o estado num instante de tempo e
uma especificação do observável a medir, os representantes matemáticos do observável especi-
ficam em que poderão consistir os resultados possíveis da medição, e este representante do ob-
servável, combinado com o estado do sistema, determina as probabilidades que um dos resul-
tados possíveis tem de se efectivar.
Se soubermos o estado de um sistema num instante de tempo e as influências causais em ins-
tantes posteriores, podemos determinar o seu estado à medida que o sistema evolui. Mas como
determinamos o estado inicial de um sistema? Fazemo-lo preparando o sistema, um processo
que constitui, ao mesmo tempo, um tipo de medição dos valores do sistema. Podemos determi-
nar, por exemplo, que o estado de spin inicial de uma partícula é para cima no instante t = 0, sa-
bendo que a partícula fora emitida a partir do canal de cima de um dispositivo de alinhamento
vertical em t = 0. Podemos então saber o estado de spin da partícula em instantes posteriores sa-
bendo as influências causais (campos eléctricos e magnéticos, neste caso) a que esteve sujeita
desde o instante em que foi emitida através do canal de cima do dispositivo de alinhamento
vertical. Se escolhermos então medir novamente o sistema quanto ao spin, poderemos determi-
nar — a partir do operador apropriado à direcção do spin que escolhermos medir — que valores
poderão obter-se (no caso do electrão, apenas dois, para cima ou para baixo, na direcção esco-
lhida) e a partir desse operador e do estado da partícula no instante da medição poderemos de-
terminar a probabilidade de se obter um dado valor de spin.
A atribuição do estado apropriado à partícula imediatamente após a preparação apoia-se no
famoso postulado da projecção de von Neumann. Este postulado declara que se uma medição que
acabou de ser feita revelar um dado valor para um observável, o estado do sistema imediata-
mente após essa medição é o apropriado para que o sistema tenha exactamente esse valor no
que respeita à quantidade medida. (Na verdade, este postulado tem de ser corrigido para aco-
modar o facto de uma medição destruir por vezes um sistema, assim como o facto de uma me-
dição não determinar habitualmente todas as quantidades compatíveis de um sistema; mas para
os nossos propósitos serve.) Um importante argumento de von Neumann é o de que só tal atri-
buição de um estado nos garantirá que se a medição for imediatamente repetida, iremos obter
sem dúvida o mesmo valor do que o obtido na primeira medição. A teoria formalizada apresen-
tada por von Neumann e tomada como a versão ortodoxa da teoria dos quanta é, pois, curiosa
ao apresentar duas regras diferentes para determinar a mudança de estado de um sistema ao
longo do tempo. Uma das regras, a dinâmica, diz-nos como a própria passagem do tempo e as
influências exteriores, tais como a interacção do sistema com outro sistema, conduzirão a uma
evolução dinâmica do estado do sistema. A outra regra diz-nos que seja qual for o estado de um
sistema antes de uma medição, após esta ter tido lugar, o estado do sistema corresponderá à
posse por parte do sistema do valor do observável acabado de medir. O estado do sistema, após
uma medição, é «projectado» para o chamado «estado característico» correspondente ao valor
observado obtido na sequência da medição. Quando a medição tem lugar, as regras dinâmicas
da evolução do estado são postas de lado. Como veremos, a noção de medição como um pro-
cesso especial fora da dinâmica comum torna-se uma das grandes áreas de problemas da teoria
dos quanta.

A interpretação de Copenhaga

O grande físico Niels Bohr tentou formar uma imagem geral do mundo que fizesse justiça
aos novos e estranhos fenómenos quânticos e procurou conceber a estrutura teórica apropriada.
A sua chamada «interpretação de Copenhaga» não é fácil de resumir bem. Houve quem a visse
como uma nova filosofia do ser e do conhecimento cuja importância ultrapassaria uma clarifica-
ção dos aspectos quânticos do mundo. Outros especialistas mostraram-se mais cépticos. Eins-
tein chamou-lhe uma vez «a tranquilizadora filosofia (ou religião?) de Heisenberg-Bohr» e afir-
mou que ela «fornece uma almofada macia para o verdadeiro crente, da qual não é fácil apartá-

124
lo», isto é, que ela «encobre» os aspectos problemáticos da imagem quântica em vez de oferecer
um tratamento coerente e inteligível dos fenómenos quânticos.
Bohr entende que o propósito da ciência é determinar as inter-relações entre as quantidades
observáveis do mundo. Para o propósito de compreender a teoria dos quanta, entende-se que
«os dados dos sentidos directamente percepcionáveis pela mente» não constituem o observável,
tal como na filosofia positivista tradicional; ao invés, são os resultados de observações realiza-
das com instrumentos de medida típicos que constituem o observável. No entanto, a filosofia de
Bohr partilha alguns aspectos com o positivismo tradicional, com a sua ênfase numa classe de-
finida de «observáveis» e na teoria como um mero instrumento para captar correctamente as
correlações entre observáveis. Bohr afirmou que na nossa descrição destes resultados de medi-
ção observáveis ficaremos sempre confinados aos meios «clássicos» típicos de descrição do
mundo, meios desenvolvidos pela física pré-quântica. Assim, grandezas como a posição de uma
partícula, a sua quantidade de movimento, carga e momento angular, etc., são as quantidades
que lemos no nosso dispositivo de medida. Um dispositivo de medida é algo, uma vez mais, ca-
racterizável em termos clássicos. Tem estados de «saída» definidos que estão correlacionados
com as quantidades medidas dos micro-sistemas. Uma marca de depósito de prata metálica irá
indicar, por exemplo, que um fotão foi absorvido numa certa região limitada de um filme foto-
gráfico; um piscar definido de um tubo de detecção pode indicar a passagem por uma região de
uma partícula carregada; e assim por diante. Ao registarmos os resultados das medidas não ha-
verá lugar para estados quânticos de «sobreposição», mas apenas para estados descritos em
termos clássicos.
O propósito dos estados quânticos é permitir-nos fazer previsões probabilísticas sobre os re-
sultados do processo de medida. Uma leitura clássica diz-nos que um sistema foi disposto num
dado estado quântico. As regras dinâmicas permitem-nos seguir a evolução ao longo do tempo
do estado quântico atribuído ao sistema. Posteriormente, poderemos usar esse estado quântico
para fazer previsões probabilísticas sobre os valores, descritos em termos clássicos, que seriam
obtidos com base em qualquer medida que escolhêssemos fazer. Mas, nesta perspectiva, é um
erro conceber os sistemas entre medidas como se possuíssem, de todo em todo, estados clássi-
cos. Se podemos inferir do estado quântico que um resultado específico de uma medida particu-
lar ocorrerá com toda a certeza, talvez possamos atribuir esse valor clássico ao sistema mesmo
quando este não está a ser medido. Mas, em geral, onde só podemos atribuir probabilidades
menores do que a certeza relativamente a vários valores possíveis do resultado de uma medida,
é um erro, nesta perspectiva, pensar que o sistema que não foi medido tem qualquer um dos va-
lores possíveis. Isto difere muito da situação clássica de probabilidades, na qual julgamos que o
sistema tem um valor definido mas desconhecido, sendo a probabilidade apenas uma medida
da nossa ignorância do verdadeiro estado.
Esta perspectiva da natureza da medida e da limitada legitimidade para atribuir estados físi-
cos clássicos aos sistemas foi combinada por Bohr com o que ele chamou a ideia de «comple-
mentaridade» para resolver alguns dos paradoxos da teoria dos quanta. A complementaridade
é uma noção difícil de explicar claramente. O próprio Bohr alarga por vezes a noção de manei-
ras bastante dramáticas, referindo, por exemplo, as descrições mentais e físicas da mente e do
cérebro como complementares. Mas, mesmo na situação teórica dos quanta, o termo é usado de
forma bastante genérica. Diz-se que os aspectos ondulatórios e corpusculares de um sistema são
complementares entre si. Por vezes, dois aspectos da descrição dinâmica de um sistema —
como a posição e a quantidade de movimento — são o que é tomado como complementar. A
ideia geral é a de que um sistema pode ser descrito em termos clássicos de mais de uma manei-
ra. Na física clássica, um sistema ou é uma onda ou uma partícula e tem simultaneamente uma
posição e uma quantidade de movimento definidas. Contudo, na teoria dos quanta, estes pares
de características apresentam-se curiosamente ligados. Ambos os aspectos complementares do
sistema são necessários para a sua completa caracterização. Mas é impossível descrever o siste-
ma simultaneamente em termos de ambas as características complementares. Podemos caracte-
rizar os aspectos ondulatórios de um sistema, ou podemos caracterizar os seus aspectos corpus-
culares. Mas não podemos conceber um sistema que seja simultaneamente ondulatório e cor-
puscular. Podemos conceber que um sistema tenha uma posição definida ou uma quantidade

125
de movimento definida, mas, de acordo com Bohr, é impossível atribuir à partícula uma posição
e uma quantidade de movimento definida e simultânea.
A «exaustão conjunta mas mútua exclusão» das características complementares revela-se fi-
sicamente quando pensamos em maneiras possíveis de usar medições para atribuir uma carac-
terística a um sistema. Podemos preparar um dispositivo de interferência para encontrar os as-
pectos ondulatórios de um sistema, a sua amplitude e frequência, por exemplo. Ou podemos
usar detectores de partículas para determinar os seus aspectos corpusculares, notando de que
fenda vem realmente a partícula. Mas preparar um destes dispositivos experimentais impossibi-
lita a construção do outro. É fisicamente impossível construir um dispositivo de medida que de-
termine simultaneamente ambas as características complementares que descrevem o sistema. É,
pois, legítimo conceber um sistema como ondulatório, querendo dizer que se fosse realizada
uma experiência que detectasse ondas, o sistema revelaria os seus aspectos ondulatórios. E é le-
gítimo conceber o sistema como corpuscular por razões paralelas. Mas não somos obrigados a
aceitar o fardo de atribuir aspectos contraditórios ao sistema porque nenhuma medida irá reve-
lar simultaneamente os aspectos contraditórios.
Bohr mantém ainda que não é legítimo pensar sequer que entre medidas o sistema quântico
tenha a característica que queremos atribuir-lhe num qualquer sentido absoluto, não relativiza-
do. Apoiando-se na analogia com a demonstração relativista de Einstein de que o comprimento
e o intervalo de tempo só eram atribuíveis às coisas relativamente à escolha de um sistema de
referência, Bohr argumentou que a atribuição de estados a sistemas — no sentido de lhes atri-
buir características ondulatórias ou corpusculares — dependia da escolha do dispositivo de
medição. Relativamente a um dispositivo de interferência, a luz era ondulatória; relativamente a
um dispositivo de detecção corpuscular de fotões, era corpuscular; sem ser relativamente à es-
colha de um dispositivo experimental especificado, não era coisa alguma. (Naturalmente, Eins-
tein não gostou da analogia com a relatividade, afirmando que até uma boa piada podia ser ex-
cessivamente repetida!)
Bohr defendeu então que em qualquer situação experimental era essencial distinguir entre o
sistema a medir — que deveria ser descrito, até ao momento em que a medição fosse realizada,
apenas em termos de estados quânticos que expressavam potencialidades de valores observá-
veis obtidos sob a forma de probabilidades — e o dispositivo de medida. O dispositivo de me-
dida era, de acordo com Bohr, correctamente caracterizado em termos clássicos quer quanto à
sua construção e propósito anterior à medição quer quanto ao seu estado final que revelava o
valor medido correcto a atribuir ao sistema. Ao passo que a teoria dos quanta era universal, no
sentido de que qualquer sistema físico do mundo obedecia às suas leis básicas, em qualquer si-
tuação de medição ter-se-ia de «dividir» o mundo em duas componentes: o sistema medido e o
dispositivo de medida. O primeiro era correctamente caracterizável em termos quânticos, mas
no que respeita às restantes medidas, a descrição correcta era formulada nos conceitos tradicio-
nais clássicos da física. Além disso, a medida não podia ser assimilada à interacção física co-
mum, pois apesar de as leis dinâmicas da mecânica quântica regerem o sistema medido, o pro-
cesso de medida obedecia à regra distinta do postulado da projecção.
Mas onde se poderia traçar a linha de demarcação entre um sistema quântico medido e um
dispositivo clássico de medida? A resposta é que tal linha poderia ser traçada a qualquer nível.
Para alguns propósitos, era útil conceber unicamente a partícula elementar como o sistema
quântico e todo o restante mundo físico como o dispositivo de medida. Mas podíamos também,
de modo consistente, tratar qualquer parte do dispositivo de medida como um sistema físico em
interacção com a partícula elementar, caracterizando-se todo o sistema constituído pela partícu-
la e pela tal fracção do dispositivo como um sistema quântico. Se fizéssemos isto, estaríamos a
restringir o dispositivo classicamente descrito ao que sobrasse depois de a parte inicialmente em
reacção com a partícula ter sido colocada no domínio quântico. Nada na física traça uma linha
clara entre a natureza quântica e o dispositivo clássico de medida. A divisão pode ser traçada a
qualquer nível. Mas a própria inteligibilidade da imagem quântica exige que tal linha seja tra-
çada algures. Seria incoerente conceber todo o universo como um sistema quântico puro, pois a
própria inteligibilidade da atribuição de um estado quântico a um sistema exigia conceber que o
sistema era medido por um dispositivo classicamente descrito no exterior do próprio sistema
quântico.

126
A interpretação de Copenhaga é uma tentativa extraordinariamente engenhosa de fazer jus-
tiça a todos os aspectos peculiares da nova teoria dos quanta. Abrange tudo, desde a necessida-
de de descrições aparentemente incompatíveis de um mesmo sistema em termos ondulatórios e
corpusculares, até ao papel especial desempenhado pela medição e pelo postulado da projecção
no formalismo da teoria. Mas não é certamente uma visão do mundo fácil de compreender.
Mais suspeito que tudo é o papel especial reservado aos dispositivos de medida descritos em
termos clássicos, essencial para interpretar a teoria. Como pode tal acontecer se, como a teoria
defende, tudo é na realidade um sistema quântico? E qual é o papel especial reservado aos pro-
cessos de medida? Não são eles apenas interacções de um sistema com outro sistema físico?
Não são tais interacções susceptíveis de serem descritas pelas regras canónicas da teoria dos
quanta? Por que razão deverá haver de todo em todo uma regra especial para processos de me-
dida, se as medições não são senão um tipo de interacção física? E será a perspectiva de Cope-
nhaga, com a sua dependência radical dos estados físicos dos sistemas das escolhas dos disposi-
tivos de medida, capaz de nos fornecer uma caracterização «realista» de como é realmente o
mundo na sua «natureza íntima»? Regressaremos em breve a estes temas.

O princípio da incerteza

Cedo se compreendeu que a teoria dos quanta, em cada uma das suas manifestações for-
mais, conduzia a várias relações entre as características de um sistema, resumidas sob a deno-
minação de «relações de incerteza». Pode encontrar-se uma ilustração simples destes resultados
na imagem ondulatória da versão de Schrödinger da mecânica quântica. Perguntamos qual a
probabilidade de encontrar uma partícula localizada numa região espacial especificada, calcu-
lando as probabilidades pelo grau com que a função de onda está confinada a essa região. Al-
ternativamente, podemos reescrever a função de onda como uma função da quantidade de mo-
vimento da partícula, encontrando assim uma nova função que pode ser usada para determinar
a probabilidade de descobrir o valor da quantidade de movimento da partícula num certo do-
mínio de valores. Percebeu-se, a partir da física ondulatória clássica, que havia uma relação en-
tre o grau com que uma função de onda tinha dispersão espacial e o grau com que ela se disper-
saria no «espaço de frequência» quando se exprimia a onda em termos das várias componentes
de frequência pura. Traduzida em termos quânticos, esta relação resulta na observação de que
quanto menos dispersa for a distribuição de probabilidade da posição de uma partícula, calcu-
lada a partir do seu estado quântico, mais dispersa será a distribuição de probabilidade da sua
quantidade de movimento. Nenhum estado quântico pode conduzir a probabilidades extrema-
mente concentradas simultaneamente sobre um único ponto no espaço e sobre um único valor
da quantidade de movimento. (Veja-se a figura 4.5.)

==========================================
INSERIR A FIGURA DA PÁGINA 176 COM A SEGUINTE LEGENDA:

Figura 4.5 As relações de incerteza. Em qualquer estado quântico de uma partícula há uma certa probabi-
lidade de encontrar essa partícula numa região especificada do espaço e uma certa probabilidade de se
descobrir que o valor da sua quantidade de movimento está compreendido num intervalo especificado de
valores. Em (a) representa-se um estado no qual a posição da partícula é descrita por uma distribuição de
probabilidades com um pico acentuado (gráfico q1). A distribuição de probabilidades correspondente à
quantidade de movimento (gráfico p1) exibe uma distribuição de probabilidades muito «dispersa». Em (b)
representa-se um estado no qual a distribuição de probabilidades para a quantidade de movimento (gráfi-
co p2) apresenta um pico pronunciado. Agora, a distribuição de probabilidades para a posição (gráfico q2)
exibe uma probabilidade largamente «dispersa», de acordo com as relações de incerteza.
==========================================

Do ponto de vista de Heisenberg, este tipo de relação inversa traduz-se pela «não comutati-
vidade» das grandezas conjugadas observadas expressas em termos de operadores do forma-
lismo matemático. Isto significa que o produto de dois deles tomados numa certa ordem não é,
em geral, igual ao seu produto tomado na ordem inversa. Esta relação existe igualmente entre
outras quantidades conjugadas e não apenas entre a posição e a quantidade de movimento.
Quando se passava para a representação abstracta da teoria dos quanta de von Neumann e de

127
Dirac, era possível encontrar algumas relações matemáticas muito gerais que resumiam o prin-
cípio da incerteza.
O grau de incerteza é tomado como o produto de uma medida da dispersão de probabilida-
de de duas quantidades, quando estas distribuições de probabilidade são calculadas a partir do
estado quântico. Por vezes, a incerteza varia de estado físico para estado físico. Noutros casos,
como, por exemplo, o da posição e quantidade de movimento, existe uma incerteza mínima fixa
que se verifica universalmente. Mas que significa, fisicamente, esta «incerteza que é impossível
eliminar»?
Ao explorar este problema, Heisenberg ofereceu uma explicação imaginativa da incerteza,
tomando-a como uma indicação da limitação última da nossa capacidade para fixar todas as
propriedades de um sistema com um grau de exactidão arbitrário por qualquer técnica experi-
mental. A ideia básica era a de que qualquer medição efectuada num sistema tem, inevitavel-
mente, de perturbar fisicamente o sistema medido. Fixar uma quantidade com um grau de pre-
cisão especificado iria, pois, perturbar de tal modo o sistema que reduziria o nosso conhecimen-
to do valor de uma quantidade conjugada ao permitir que ela tivesse, depois de medida, qual-
quer um de um vasto domínio de valores.
Uma famosa experiência mental heisenbergiana para ilustrar a sua interpretação do princí-
pio da incerteza recorre a uma espécie de microscópio concebido para determinar com um ele-
vado grau de precisão a posição de uma partícula num instante especificado. Como poderia fa-
zer-se tal determinação da posição? Só, defendeu Heisenberg, causando a interacção entre um
sinal detector e a partícula em questão. Poderia, por exemplo, iluminar-se a partícula com luz e
procurar a luz dispersada pela partícula. Ver como a luz era dispersada pela partícula fornece-
ria informação relativamente à localização desta última.
Mas o tratamento clássico do comportamento da luz na microscopia relaciona a capacidade
da luz em evidenciar pequenas diferenças espaciais com o comprimento de onda da luz. A luz
com um comprimento de onda mais curto pode pôr em destaque menores diferenças espaciais
do que a luz com um grande comprimento de onda. Mas na teoria dos quanta o comprimento
de onda mais curto está associado a uma frequência mais elevada e, portanto, a uma energia
mais elevada da unidade mínima de energia da luz, o fotão. Para observar a partícula, pelo me-
nos um fotão tem de ser disperso por ela. Quanto maior for a energia desse fotão, maior será o
domínio de valores do «empurrão» que poderá dar à partícula, mudando a sua quantidade de
movimento inicial. Ao avançar em direcção aos pormenores, ficamos com uma imagem na qual
um esforço microscópico para colocar a posição da partícula num pequeno intervalo de valores
é acompanhado por uma interferência causal inevitável na vida da partícula que diminui a pre-
cisão com que somos capazes de determinar a quantidade de movimento que a partícula tem
depois da medida da sua posição.
Mesmo na física pré-quântica é verdade que, teoricamente, qualquer medida de um sistema
interfere, por pouco que seja, com o estado do sistema. Mas na imagem clássica tal interferência
pode ser tão reduzida quanto se quiser. Para Heisenberg, pelo menos nesta interpretação da in-
certeza, o elemento essencial da teoria dos quanta era agora a inevitável interferência mínima
com o sistema, a perturbação do seu estado impossível de ser reduzida — uma perturbação que
não poderia ser reduzida por quaisquer meios físicos e que teria de acompanhar qualquer tenta-
tiva de restringir o valor de uma dada propriedade do sistema a um pequeno domínio de valo-
res.
Deste ponto de vista, a incerteza é concebida como uma limitação da nossa capacidade de
discernir os valores simultâneos precisos de duas propriedades conjugadas de um sistema. Isto
é, concebemos que o sistema possui, por exemplo, valores simultâneos precisos tanto da posição
como da quantidade de movimento, mas que nós somos incapazes, por causa da interferência
inevitável do processo de medida com o sistema, de determinar com exactidão esses valores
conjuntos e precisos.
Bohr nunca se satisfez com uma tal interpretação da incerteza. Insistiu desde o princípio que
a especificação de um estado quântico de um sistema constituía uma descrição completa de ca-
da sistema individual. Era um erro, defendia Bohr, conceber o estado quântico como uma colec-
ção de partículas, podendo ser atribuído a cada partícula um estado completo, apesar de não
completamente conhecido, do tipo clássico. Ao invés, defendia Bohr, o estado quântico, com a

128
sua «dispersibilidade» intrínseca de valores de quantidades clássicas, representada pela disper-
sibilidade das distribuições de probabilidade associadas a esses valores, era uma descrição total
do estado real da partícula. Para qualquer um desses estados quânticos, como notámos, haveria
conexões entre os graus de dispersão das distribuições de probabilidade de grandezas conjuga-
das. Cada estado quântico que tornasse a dispersão da posição muito pequena geraria automa-
ticamente um estado quântico cuja distribuição de probabilidade da quantidade de movimento
conduziria a uma dispersão grande. Mas, defendia Bohr, era uma atitude muito conservadora
interpretar esta relação inversa simplesmente como uma limitação da nossa capacidade para fi-
xar em termos precisos valores conjugados simultaneamente. Ao invés, era necessário pensar
que cada partícula individual podia ter — na melhor das hipóteses — valores diferentes de uma
quantidade clássica, caso se insistisse em atribuir a uma partícula, de todo em todo, proprieda-
des clássicas entre medidas.
Heisenberg foi convencido a aceitar a leitura «ontológica» mais radical que Bohr fazia da in-
certeza. Isto é, Heisenberg aceitou a perspectiva de que a incerteza reflecte uma dispersibilidade
intrínseca das características dos sistemas, e não apenas uma limitação do nosso conhecimento
de propriedades conjuntas com graus de precisão arbitrária. Veremos mais tarde algumas das
razões da sua adopção desta postura mais radical. Einstein, contudo, ficou consternado com a
teoria radical de Bohr e durante algum tempo procurou encontrar boas razões físicas para a re-
jeitar.
Seguiu-se uma série de debates fascinantes entre Einstein e Bohr. Einstein entregou-se ao
projecto de tentar encontrar uma situação experimental na qual pudessem violar-se as limita-
ções da especificação precisa de quantidades conjugadas impostas pelas relações de incerteza.
Concebeu experiências mentais engenhosas para tentar mostrar que se poderiam determinar
duas quantidades conjugadas com um grau de precisão que a relação de incerteza considerava
impossível. Para cada uma das sugestões de Einstein, contudo, Bohr argumentava que o proces-
so experimental em questão exigia, em última análise, a determinação de duas quantidades bá-
sicas por um dos processos que, usando argumentos heisenbergianos, se podia mostrar que li-
mitavam o nosso conhecimento das quantidades conjuntas necessárias de acordo com as habi-
tuais limitações de incerteza. Caso se aceitasse os contra-argumentos de Bohr, pareceria impos-
sível contornar as relações de incerteza ultrapassando epxerimentalmente os limites por elas
impostos. Isto deixa em aberto, contudo, ainda que o princípio da incerteza seja verdadeiro, a
questão de saber como haveremos exactamente de entender as relações. Deverão ser entendidas
no sentido heisenbergiano, mais antigo e modesto, como uma limitação sobre o que podemos
determinar, ou no sentido mais radical de Bohr, que nega a própria existência de valores preci-
sos de duas quantidades conjugadas?

O que é a medida na teoria dos quanta?

O problema da medida

O formalismo básico da teoria dos quanta é claro e a sua aplicação ao mundo da observação
e da experimentação não é, na prática, mais controverso do que o de qualquer outra teoria física
formal. Mas a teoria apresenta-nos uma quantidade de problemas interpretativos enigmáticos.
Membros da comunidade científica que concordam sem hesitação com os resultados da teoria
dos quanta aplicada ao mundo físico verificam estar em desacordo entre si quando tentam ex-
plicar exactamente como «entendem» o que a teoria nos diz sobre a estrutura fundamental do
mundo.
Descrevem-se os sistemas entre medições, na teoria dos quanta, dizendo que estes possuem
um estado quântico. Presumivelmente, pois, este estado «representa» de uma forma ou de outra
o estado da natureza do sistema. Mas o que é esse estado físico do sistema, e como é ele repre-
sentado pelo estado quântico? Deve o estado quântico ser concebido como uma descrição de
sistemas individuais, digamos, do fotão único da experiência das duas fendas? Afinal, o facto de
os resultados de interferência se verificarem mesmo que as partículas sejam enviadas, uma de
cada vez, através das fendas sugere que, de uma maneira ou de outra, tem de se conceber que

129
cada fotão «está ciente» da existência das duas fendas da maneira descrita pelo estado quântico.
Mas como pode tal partícula localizada ser descrita correctamente por meio de uma função de
onda dispersa?
O uso probabilístico da função de onda proposto pela primeira vez por Born sugere uma in-
terpretação em que a função de onda descreve, ao invés, uma colecção ou «grupo» de sistemas,
de uma maneira que faz lembrar o papel desempenhado, nos sistemas da mecânica estatística
descritos no capítulo 3, pelas distribuições de probabilidade dos microestados possíveis. Esta
interpretação é também sugerida pela leitura mais óbvia do postulado da projecção. Se a função
de onda for uma descrição probabilística de uma colecção de sistemas ou, numa interpretação
afim, uma representação do nosso conhecimento parcial do estado total de um sistema indivi-
dual, então parece haver uma razão clara para abandonar uma função de onda a favor daquela
que corresponda a um sistema cujo valor preciso para um dado observável seja conhecido mal
se tenha medido esse valor do observável. Se uma medição aumenta o nosso conhecimento es-
pecífico de um sistema particular e se a função de onda é relativa a esse conhecimento, não é de
admirar que ocorra uma espécie de «colapso» não dinâmico da função de onda aquando da
medição.
Mas também esta interpretação está cheia de dificuldades. Como explicaremos os famosos
efeitos de interferência, tão paradigmáticos da situação quântica? O conhecimento parcial da
questão de saber se o fotão atravessou a fenda 1 não devia «interferir» com o conhecimento par-
cial de que ele atravessou a fenda 2. Os fenómenos de interferência são antes característicos de
ondas físicas reais e dispersas. Há igualmente outras dificuldades com a interpretação de grupo
simples ou de conhecimento parcial da função de onda quântica. O suplemento normal para
conceber uma representação como «parcial», à maneira de uma descrição estatística de grupo
de um sistema, é considerar a noção de que é possível uma descrição complementar; esta des-
crição irá localizar o sistema específico como um membro de uma colecção mais restrita de sis-
temas. Na verdade, é natural esperar que haja uma descrição de um sistema que o identifique
como o membro único da «classe unidade» de um, e de apenas um, sistema físico. Assim, por
exemplo, se na mecânica estatística for possível descrever um sistema como membro de uma
colecção de sistemas caracterizados pela sua temperatura comum, pensamos que são possíveis
descrições mais completas dos sistemas, sendo a descrição última aquela que especifique exac-
tamente todos os microestados do sistema em qualquer instante.
Mas para Bohr o estado quântico de um sistema específico fornecia uma descrição completa
desse sistema. Apesar de tal descrição só especificar probabilidades relativas aos resultados das
várias observações que poderiam ser executadas no sistema, era a descrição «mais completa»
possível do sistema. Se isto for verdade, é enganador pensar que a função de onda caracteriza
uma colecção ou que caracteriza o conhecimento parcial no sentido das interpretações tradicio-
nais da probabilidade. A questão de saber se Bohr tinha razão continua a ser controversa. No
entanto, como veremos, muitos resultados mostraram que se Bohr não tiver razão, não será fácil
tentar explicar de que maneira exactamente se poderia completar uma descrição quântica de
modo a fornecer uma descrição mais completa do estado de um sistema individual. Algumas
questões que se levantam aqui envolvem a possibilidade de existir uma descrição complemen-
tar do estado de um sistema nos termos clássicos tradicionais. Será possível, por exemplo, con-
ceber que uma partícula num estado quântico que seja uma sobreposição de dois estados de
spin tenha efectivamente um dos spins componentes, apesar de desconhecermos qual deles? Ou-
tros debates dizem respeito à possibilidade de completar a descrição quântica de um sistema
com uma caracterização mais pormenorizada deste que seja suficiente para o estabelecer de um
modo não estatístico, até mesmo de um modo que evite os termos descritivos clássicos. Para já,
basta dizer que nem uma interpretação do estado quântico de um sistema que o encara como
um estado tradicional fisicamente disperso à maneira de uma onda clássica, nem uma interpre-
tação que o conceba como uma medida de probabilidade tradicional de uma colecção especifi-
cada unicamente por um conhecimento parcial do estado de um sistema, parece fazer justiça ao
papel desempenhado pelo estado quântico na teoria.
A teoria dos quanta usa não apenas os estados quânticos introduzidos recentemente mas
também os velhos estados clássicos. Bohr interpreta a função de onda como uma especificação
das probabilidades de resultados dadas as medições de várias quantidades. Mas, como Bohr fez

130
notar, estes resultados são especificados nos velhos termos clássicos. Ou uma partícula emerge
do dispositivo Stern-Gerlach usado para determinar a sua componente de spin «no feixe com
spin para cima» ou «no feixe com spin para baixo». Um fotão que tenha atravessado o dispositi-
vo de duas fendas é por fim localizado numa ou noutra região definida do ecrã fotográfico con-
tra a qual tenha chocado. Alternativamente, se tiverem sido colocados detectores nas fendas, de-
tecta-se que o fotão «passou pela fenda 1, despoletando o detector 1» ou «passou pela fenda 2,
despoletando o detector 2».
Mas se todos os estados físicos se descrevem apropriadamente de acordo com as leis da me-
cânica quântica — e a teoria reivindica realmente esta universalidade — como pode então haver
lugar no universo para instrumentos de medida cujos estados de detecção se caracterizem nos
velhos termos clássicos? Existirão realmente no mundo dois tipos diferentes de sistemas, siste-
mas quânticos e sistemas clássicos, devendo os primeiros ser descritos em termos de funções de
onda e os últimos em termos clássicos? Ou será a prática de caracterizar os resultados de medi-
ções em termos clássicos algo a ser «afastado» no contexto da teoria quântica por ser, talvez, um
tipo de «descrição aproximada» legítima mas enganadora do estado efectivo do dispositivo de
medida? Caso se considere que as descrições clássicas dos dispositivos de medida não constitu-
em uma falsa descrição destes últimos, mas, ao invés, a caracterização efectiva do seu verdadei-
ro estado físico, levanta-se a questão de saber se não seria legítimo conceber que os sistemas
quânticos medidos manifestassem tais estados clássicos.
Por último, há a questão da natureza do processo de medida. Como notámos, a teoria formal
faz uma demarcação estrita entre o processo da evolução dinâmica e o da medida. Suponha-se
que se conhece o estado quântico de um sistema num dado instante. Como havemos de deter-
minar o seu estado quântico num instante posterior? Se o sistema não for observado entre os
dois instantes, devemos, de acordo com a teoria, seguir a evolução da função de onda que des-
creve o estado quântico do sistema usando a famosa equação de Schrödinger. Esta equação é o
paralelo, na teoria dos quanta, das equações da dinâmica clássica que nos diziam como o estado
dinâmico clássico de um sistema evoluiria ao longo do tempo, sabendo que o sistema estava su-
jeito a certas forças e tinha uma construção interna especificada. Tal como na física clássica, há,
pois, uma espécie de «determinismo» da evolução do estado quântico. Um sistema de uma da-
da natureza e sujeito a forças especificadas que possua um estado quântico definido num certo
instante terá mais tarde um estado quântico definido e relacionado com o primeiro pelas leis da
dinâmica.
Mas isto não acontece se o sistema for sujeito a uma medida nesse intervalo de tempo! Pois
quando a medida tem lugar, afirma a teoria, a evolução dinâmica deve ser ignorada, devendo
aplicar-se, em seu lugar, o postulado da projecção. A função de onda que descreve o sistema an-
tes da medição deve ser abandonada, introduzindo-se em seu lugar uma função de onda que
corresponde ao valor da quantidade observada na medição. (Se a medição não determinar os
valores de todas as quantidades observáveis que poderiam ser determinadas para o sistema,
usa-se no lugar da função de onda uma versão modificada do postulado da projecção, a regra
de Lüder. No entanto, tal como o postulado da projecção, é evidente que não se trata de um me-
ro caso de evolução dinâmica comum.)
Ora, se conseguíssemos manter a interpretação da função de onda que, tal como algumas
distribuições clássicas de probabilidade, faz dela uma representação do nosso conhecimento
parcial de um sistema, poderíamos compreender tanto a medição como o postulado da projec-
ção de uma forma bastante simples. A medição seria qualquer processo que acrescentasse algo
ao nosso conhecimento do estado do sistema. Não seria pois de admirar que, ao efectuar uma
medida, a função que descreveria o nosso conhecimento parcial do sistema «saltasse» de modo
descontínuo, determinado pelo postulado da projecção. Mas, como vimos, uma tal interpretação
da função de onda não consegue fazer justiça aos seus outros aspectos análogos a estados físi-
cos, tais como a interferência. Se concebermos a função de onda como um tipo de estado físico
do sistema, torna-se muito mais difícil compreender o lugar que tem no formalismo o processo
de medida, assim como a mudança dinâmica da função de onda em processos de medida.
O que diferencia, deste último ponto de vista, um processo de medida de qualquer outra in-
teracção dinâmica comum? Como pode o sistema relacionado com um dispositivo de medida
ser diferente do sistema que interage meramente em termos físicos com outro sistema físico? A

131
teoria oferece uma descrição perfeitamente clara dessa interacção. Trata-se de um aspecto da
dinâmica de sistemas, neste caso da dinâmica que descreve dois sistemas de início mutuamente
independentes que depois interagem fisicamente. Mas a evolução do novo sistema conjunto (o
sistema original combinado com o sistema físico com o qual interagiu), de acordo com o forma-
lismo da teoria, não é de todo em todo como o processo que o postulado da projecção descreve.
Sobretudo, na interacção dinâmica comum, os efeitos de «interferência» do sistema que está
originalmente numa sobreposição de estados são preservados quando o sistema interage com
um novo sistema físico. As correlações que caracterizam o processo de interferência são pura e
simplesmente transferidas para o novo sistema conjunto.
Mas num processo de medida, tal como o postulado da projecção o descreve, a interferência
é destruída. No «colapso do pacote de ondas» descrito pelo postulado da projecção os termos
de interferência desaparecem pura e simplesmente. Um electrão que seja descrito por uma fun-
ção de onda que se estenda por todo o espaço passa a ser descrito, depois de o electrão ser me-
dido e de se descobrir estar numa região espacial limitada, por uma função de onda confinada a
essa região. Um fotão que seja descrito como estando numa sobreposição de estados correspon-
dentes a atravessar as fendas 1 e 2 será, depois de o detector em frente à fenda 1 disparar, des-
crito por uma função de onda de «pura» fenda 1. Por que razão são as medições diferentes das
interacções físicas comuns?

A solução de Bohr e as suas críticas

Notámos anteriormente a excitante e subtil tentativa, por parte de Bohr, de fazer justiça à na-
tureza paradoxal do mundo quântico. Na interpretação de Copenhaga a medição é tomada co-
mo uma noção «primitiva». Um sistema em interacção com o mundo exterior pode ser medido
e não entrar, pura e simplesmente, em interacção dinâmica. Tomam-se os resultados dos pro-
cessos de medida como algo que constitui os verdadeiros factos brutos sobre o mundo, toman-
do-se a teoria como um dispositivo cujo único papel é fornecer correlações entre o valor basea-
do num processo de medida que disponha um sistema num dado estado quântico e o valor de
uma quantidade observável numa medição posterior. Entre as medições não se deve pensar que
o sistema tem, de todo em todo, valores clássicos reais mas desconhecidos. Ao invés, tem me-
ramente «potencialidades» para revelar valores observáveis com probabilidades especificáveis
relativas a um dispositivo de medida escolhido. Porque algumas quantidades — as conjuga-
das — não podem ser medidas em simultâneo, é inútil perguntar quais são as probabilidades de
o sistema ter tais valores conjuntos e incompatíveis para observáveis conjugadas.
Mas será a interpretação de Copenhaga aceitável? Uma objecção a esta interpretação é da au-
toria de Schrödinger e Einstein. Tal como Einstein, Schrödinger foi um dos grandes criadores da
teoria quântica e ao mesmo tempo um dos mais severos críticos dos seus intérpretes «ortodo-
xos».
Em primeiro lugar, recorde-se que para Bohr é incorrecto pensar que um sistema não sujeito
a uma medida se possa encontrar num estado clássico, excepto talvez na situação rara em que o
sistema exiba com toda a certeza um valor determinado quando for medido. Seguidamente, re-
corde-se que para Bohr qualquer medição consiste num sistema quântico ser medido com um
dispositivo de medida que tem de ser descrito em termos clássicos. E recorde-se, por último,
que no tratamento da medida de Bohr, a linha de demarcação entre sistema (descrito por um
estado quântico) e dispositivo (descrito por estados clássicos) pode ser traçada a qualquer nível.
Apesar de ter de haver algures uma demarcação entre o sistema quântico medido e o dispositi-
vo de medida clássico, a linha de separação entre ambos não é algo que a física da situação fixe,
podendo antes pensar-se que está localizada em qualquer ponto da cadeia que começa no sis-
tema microscópico e acaba no valor finalmente observado. Na verdade, vários resultados da te-
oria dos quanta mostram que se inferem as mesmas probabilidades para os vários resultados
quer tomemos um sistema A tal como este é medido por um dispositivo complexo B + C, quer,
ao invés, consideremos que o dispositivo C mede o sistema complexo A + B.
Considere-se então uma caixa que contenha um espelho de divisão de feixes e uma fonte fra-
ca de fotões. Coloquem-se detectores nos percursos do dispositivo e liguem-se de forma a que
se o detector 1 disparar primeiro, despolete uma explosão por meio de um sinal amplificado

132
que mate um gato que esteja dentro da caixa. Além disso, disponham-se as coisas de maneira a
que se o detector 2 disparar primeiro, se desligue o dispositivo explosivo. Schrödinger convida-
nos a considerar o seguinte: até se determinar através de uma medida que o fotão passou por
um dos dois trajectos, temos de pensar que ele está numa sobreposição de estados correspon-
dentes a ter estado em cada um dos dois percursos, a cada um dos quais associamos uma pro-
babilidade 1 2 . Ora, podemos pensar que a medida ocorreu assim que um dos detectores dispa-
rou. Nesse momento, pois, o fotão passou definitivamente pelo percurso 1 ou pelo 2. A sobre-
posição de estados irá transformar-se num único estado puro. (Veja-se a figura 4.6.)

===========================================
INSERIR A FIGURA DA PÁGINA 184, COM A SEGUINTE LEGENDA:

Figura 4.6 O gato de Schrödinger. Numa caixa selada instala-se um dispositivo no qual se divide em dois
um feixe de partículas, e, sendo igual a probabilidade de uma partícula pertencer a um ou a outro feixe. Se
a primeira partícula seguir a trajectória que passa por D1, faz-se detonar um barril de explosivos, destruin-
do um pobre gato que está em cima deste. Se a primeira partícula for por D2, o comutador S desliga-se,
salvando-se o gato da possibilidade de ser destruído pela explosão. Como deverá um observador no exte-
rior da caixa que seja incapaz de saber o que aconteceu no seu interior descrever o gato depois de um perí-
odo de tempo findo o qual se tem a certeza de que pelo menos uma partícula foi para D1 ou para D2? De
acordo com a interpretação de Copenhaga, o observador não deve pensar que o gato está vivo nem morto
mas antes «numa sobreposição de estados vivos e mortos», tal como tem de se pensar que um electrão não
detectado que saia de um dispositivo de alinhamento horizontal de Stern-Gerlach está «numa sobreposi-
ção de estados de spin para a direita e para a esquerda» até ser detectado. Mas será sustentável uma tal
descrição do gato (ou de qualquer objecto macroscópico)? Se não o for, em que momento, anterior ao ins-
tante em que o observador do exterior observar o que restar no interior da caixa, deverá esse observador
considerar o gato «definitivamente vivo» ou «definitivamente morto»?
==========================================

Mas também podemos pensar que a medida só ocorre quando olharmos para o interior da
caixa para ver o que aconteceu. Isto é, a linha de separação entre o mundo quântico e o disposi-
tivo clássico poderia ser correctamente traçada de modo a que nós fôssemos um dispositivo de
medida, constituindo tudo o que está na caixa — incluindo a fonte de fotões, o divisor de feixe,
os detectores, amplificadores, dispositivos de explosão, comutadores de circuito e o gato —
componentes de um único sistema quântico complexo. Se traçarmos a linha de separação desta
maneira, a perspectiva de Bohr obriga-nos a acreditar que até ao momento em que olharmos
para o interior da caixa o fotão se mantém numa sobreposição de estados de percursos 1 e 2.
Mas também o resto do sistema associado ao fotão e aos seus detectores se mantém numa so-
breposição. Por outras palavras, até olharmos para o interior da caixa, tanto é incorrecto afirmar
que o gato está vivo, como morto. Ao invés, temos de dizer que o gato está «numa sobreposição
de estados vivo e morto». Contudo, como Schrödinger sugere, uma tal imagem de algo macros-
cópico e animado é um absurdo. Pode ser possível (ainda que difícil) conceber que um fotão es-
teja numa sobreposição de estados de percurso ou que um electrão esteja numa sobreposição de
estados de spin, mas não será manifestamente absurdo conceber que o gato não está vivo nem
morto, mas «numa combinação de ambos os estados, com igual probabilidade»? Recorde-se que
não se pode interpretar uma sobreposição, de acordo com Bohr, como se o sistema estivesse
num ou noutro estado definido, ignorando nós em qual deles estaria. Trata-se de uma «combi-
nação» real dos dois estados.
Repare-se que, como é óbvio, Schrödinger não mostra de maneira alguma que a perspectiva
de Bohr conduz a observações falsificadas. Como é evidente, no momento em que olhamos para
o gato o pacote de ondas entra em colapso e encontramos o gato vivo ou morto. Na verdade,
Bohr não se importaria sem dúvida de arcar com as consequências da sua teoria. Todos os ob-
jectos do mundo obedecem à mecânica quântica, do mais pequeno ao maior. E assim, todos os
objectos estão sujeitos ao tipo de efeitos de interferência que nos força a pensar que os sistemas
estão em estados de sobreposição. Uma vez mais, para Bohr estes estados são apenas potencia-
lidades de resultados que têm certas probabilidades ao serem medidos. O gato existe, tal como
o fotão antes de ser medido, num estado potencial que exige a referência à sobreposição. Pois,
em princípio, poderíamos fazer experiências que revelassem a interferência subjacente ao esta-
do do gato, tal como poderíamos remover os detectores, substituindo-os por um ecrã que reve-

133
lasse a interferência subjacente à sobreposição de estados de percurso que constitui a condição
quântica do fotão.

Soluções idealistas

Para outros especialistas, no entanto, parece absurdo pensar que o gato se encontra numa
sobreposição de estados vivo e morto. Wigner, levando mais longe a sugestão de Schrödinger,
apresenta «o amigo de Wigner». Substitua-se o gato na caixa por um cientista. De acordo com
Bohr, até ao momento em que olharmos para o interior da caixa, devemos pensar que o cientista
se encontra numa sobreposição de estados vivo e morto, apesar de o cientista poder, claro —
num momento em que pensamos que ele se encontra numa tal sobreposição — encarar-se a si
próprio como determinadamente vítima da explosão ou não. Mas, afirma Wigner, isto é absur-
do. Esta situação conduz Wigner a uma perspectiva da medida e do mundo que, vinda de um
físico, é muitíssimo surpreendente, apesar de quase inevitável enquanto forma opcional de con-
ceber as perplexidades quânticas.
O que há de especial, pergunta Wigner, no que respeita à medida, ao contrário de uma inte-
racção física comum de dois sistemas físicos? Numa medida real, um medidor tem de ter «cons-
ciência» do valor determinado pelo processo de medida. A perspectiva de Wigner faz lembrar a
dos filósofos dualistas, que concebiam um ser humano (e, talvez, os outros seres sencientes)
como uma criatura combinada, composta por um corpo físico e por uma mente — uma espécie
de entidade não física «acoplada» ao corpo, porventura por causalidade mútua através do cére-
bro. Assim, Wigner pensa que uma medição tem lugar quando, e só quando, o sistema medido
afecta uma mente. O efeito sobre a mente pode ser muito indirecto, acontecendo por meio de
muitos dispositivos físicos intermédios (incluindo os órgãos dos sentidos, os nervos e o cérebro
do corpo).
Mas não podemos conceber a medição meramente como um caso em que um agente ganha
informação, modificando assim a sua «função de conhecimento parcial». Como fizemos notar, a
perspectiva da função de onda como um sumário do nosso conhecimento de um sistema, ou do
colapso do sistema ao ser medido, como a mudança descontínua habitual de uma função de co-
nhecimento quando se adquire novo conhecimento, não faz justiça às outras características da
função de onda. Refiro-me às características de interferência que fazem a função de onda pare-
cer muito mais uma representação independente do conhecimento de um estado de um sistema
natural. Para Wigner, ao invés, a medição é uma interacção nos dois sentidos entre a mente e o
mundo físico. O mundo afecta causalmente a mente, dizendo-lhe qual é o valor medido e de-
terminado do sistema; o mundo faz isto indicando à mente em que estado possível ficou o dis-
positivo físico de medição. Mas a mente actua igualmente sobre o mundo. Pois o próprio facto
de o sistema físico estar num estado clássico definido e não mais numa sobreposição é um efeito
da interacção entre a mente e a matéria.
Assim, para Wigner a medição tem claramente lugar mal o cientista do interior da caixa sai-
ba se vai ou não ser vítima da explosão. Possivelmente, se os gatos tiverem mentes, o mesmo se
pode dizer do gato de Schrödinger. Rejeita-se a perspectiva bohriana, que permite que mesmo
os cientistas e os gatos façam parte de um sistema quântico relativamente a um medidor exter-
no — como o cientista no exterior da caixa.
A explicação do mundo de Wigner, com a sua metafísica dualista do mundo físico e das
mentes observadoras, não é atraente para muitos especialistas, o que não é surpreendente. Além
de tolerar o que muita gente consideraria uma metafísica bastante extravagante, a própria expli-
cação oferecida da medição é problemática. O colapso da função de onda causado pela acção da
mente no mundo físico é algo que fica por explicar e que ultrapassa a competência explicativa
da física. Juntamente com os processos da natureza regidos pelas leis da física e, em particular,
pela lei dinâmica da evolução dada pela equação de Schrödinger, temos agora um processo «ex-
tra-físico» no qual algo de «exterior», a mente do observador, interfere com o funcionamento
legiforme da natureza física. Será que não poderemos encontrar uma explicação da medição que
evite ir tão longe quanto estas explicações idealistas, mas que também evite quer a introdução
de noções primitivas de medição à maneira de Bohr, quer a separação, não eliminável, entre sis-
tema quântico e dispositivo clássico de medida?

134
A medida como uma interacção física

Há um grupo de abordagens que procura caracterizar um processo de medida, por oposição


às interacções físicas comuns, tornando-o não um tipo distintivo de processo nos termos metafí-
sicos da abordagem de Bohr ou da abordagem idealista, mas tentando caracterizar uma medida
como uma subclasse específica de interacções físicas comuns. Para esta escola de pensamento,
um dos grupos de abordagens considera que num processo de medida o sistema quântico inte-
rage com um instrumento de medida «macroscópico», correlacionando-se, no processo de me-
dida, uma microcaracterística do sistema que está a ser medido com uma macrocaracterística do
dispositivo de medida, de um modo que revela o valor da quantidade microscópica.
Numa operação que identifique a fenda por que uma partícula passou, a partícula pode ser
detectada ao sair da fenda por um qualquer dispositivo electrónico de descarga (como um con-
tador Geiger) que amplifique a passagem da partícula pelo detector. Isto pode funcionar indu-
zindo a partir da passagem da partícula uma cascata de um grande número de partículas carre-
gadas, revelando depois, por fim, a presença da partícula microscópica por meio de uma grande
descarga macroscópica de voltagem que envolva um elevado número de partículas agindo con-
certadamente. Num dispositivo de Stern-Gerlach, as partículas que tenham componentes de
spin que difiram na direcção sob medição são primeiro separadas umas das outras espacialmen-
te, em termos de distâncias macroscópicas, pelo campo magnético inomogéneo do dispositivo;
depois são detectadas ou no feixe com spin para cima ou no feixe com spin para baixo por um
dispositivo análogo ao anteriormente descrito. No caso do gato de Schrödinger o dispositivo
revela a trajectória descrita pela partícula ao amplificar a escolha quântica em estados macros-
copicamente distintos de gato vivo e de gato morto e vítima da explosão.
Há, pois, duas características importantes que temos de registar no que respeita à medição.
A primeira é que o estado final do dispositivo de medida envolve um grande número de partí-
culas e é identificável ao nível macroscópico. A outra é que os estados finais do dispositivo são
macroscopicamente susceptíveis de se distinguirem entre si (são estados «puros» e não de so-
breposição) e estão perfeitamente correlacionados com os estados microscópicos do sistema
quântico que está a ser medido.
Esta escola de pensamento defende seguidamente que temos de perceber que, na verdade, o
dispositivo macroscópico é, tal como o sistema quântico original, um sistema físico comum si-
tuado no mundo. Deste ponto de vista, o sistema macroscópico tem de poder ser descrito pela
teoria dos quanta e a sua interacção com o sistema quântico que está a ser medido tem de ser
determinada pelas leis quânticas comuns que regulam a interacção de dois sistemas físicos. Mas
neste ponto a interpretação enfrenta uma dificuldade. A teoria dos quanta diz-nos que se um
sistema interagir com outro e se o primeiro sistema se encontrar num estado de sobreposição
antes de a interacção ter tido lugar, depois da interacção ter ocorrido o primeiro e segundo sis-
temas combinados têm de se encontrar num estado de sobreposição. Isto é verdade ainda que o
segundo sistema esteja originalmente num estado puro ou num dos estados mistos que corres-
pondem à situação em que o sistema se encontra, com diferentes probabilidades, num ou nou-
tro estado puro, no sentido mais antigo. Se uma partícula com spin para a esquerda interage
com um dispositivo de detecção de spin vertical, a partícula entra na interacção numa sobrepo-
sição de estados de spin para cima e para baixo. O estado último do sistema «partícula mais dis-
positivo de medida» tem de ser, então, um estado de sobreposição; é a sobreposição dos dois
estados puros — «a partícula tem spin para cima e o dispositivo diz que ela tem spin para cima»
e «a partícula tem spin para baixo e o dispositivo diz que ela tem spin para baixo». Mas se isto
for verdade, como pode a interacção representar uma medida na qual o resultado deverá ser
um estado definido no qual ou «a partícula tem spin para cima e o dispositivo diz que ela tem
spin para cima» ou «a partícula tem spin para baixo e dispositivo diz que ela tem spin para bai-
xo»?
Neste ponto, uma tentativa de resolver a questão anterior é encarar uma interacção de me-
dida, com vários fins, como se a sobreposição não existisse de todo em todo, apesar de, na ver-
dade, a interacção de medida resultar realmente num estado de sobreposição. Ao invés, o esta-
do final de sobreposição pode ser substituído por um estado de mistura com ele relacionado. A
ideia fundamental é a de que apesar de a interacção entre o sistema e o dispositivo de medida

135
ter de reter, de acordo com as leis da mecânica quântica, aquelas correlações de tipo interferen-
cial que distinguem uma sobreposição de estados de uma mistura dos dois estados, esta interfe-
rência, assim como os seus efeitos, pode na prática ser irrecuperável depois de a interacção ter
tido lugar.
O que nos diz que o estado de uma partícula com spin para a esquerda enviada para um dis-
positivo de alinhamento vertical que não seja detectada tem mais tarde de ser descrita como es-
tando numa sobreposição de estados de spin para cima e para baixo e não numa mistura dos
dois? Caso se examinasse a saída do dispositivo de alinhamento vertical em busca de spin verti-
cal, descobrir-se-ia que metade das partículas teria spin para cima e a outra metade para baixo.
Esta é a previsão obtida ao descrever a partícula como estando ou numa sobreposição ou numa
mistura de estados de spin para cima e para baixo com idênticas probabilidades. Mas caso se
envie este feixe de saída para um detector horizontal, todas as partículas sairão no feixe de spin
para a esquerda. Isto é o que a descrição em termos de sobreposição prevê, mas não o que a
descrição em termos de mistura prevê. Isto revela a interferência remanescente.
Mas se a partícula que sair do dispositivo de alinhamento vertical for detectada quando sair,
será impossível, na prática, exibir qualquer diferença entre a mistura de estados «a partícula
tem spin para cima, o dispositivo diz que ela tem spin para cima» e «a partícula tem spin para
baixo, o dispositivo diz que ela tem spin para baixo», e a sua sobreposição. Fazê-lo exigiria um
processo que seguisse todos os microestados de todas as partículas da cadeia causal que teve
início com a interacção entre o sistema de partículas e o detector. Uma tal capacidade para reve-
lar a restante correlação de interferência ultrapassa qualquer possibilidade real. Logo, para pro-
pósitos de previsão sobre as probabilidades de resultados de experiências complementares que
envolvam a partícula ou o dispositivo, a descrição em termos de mistura será suficiente como
uma aproximação à verdadeira descrição em termos de sobreposição. A correlação de interfe-
rência dissipou-se no vasto número de graus de liberdade das inúmeras partículas que consti-
tuem o dispositivo macroscópico. Esta dissipação ocorre no processo de amplificação que revela
o microestado da partícula a medir. Logo, apesar de a sobreposição estar na verdade presente,
pode ser tratada como se desaparecesse quando a medição tem lugar.
Esta maneira de encarar o processo de medida tem muitas virtudes. Não precisamos de in-
troduzir mentes que interajam com o mundo físico enquanto ficamos apartados dele e da capa-
cidade de uma física abrangente que o descreva. Nem precisamos da curiosa bifurcação flexível
do mundo em sistema e dispositivo de medida que a interpretação de Copenhaga exige. Ao in-
vés, só há um mundo físico, com interacções físicas comuns. Algumas delas têm as característi-
cas necessárias para que a verdadeira descrição quântica possa ser substituída por uma aproxi-
mação falsa mas adequada. Estas características são o carácter macroscópico e complexo do dis-
positivo de medida e a apropriada correlação perfeita entre os seus estados indicadores e os es-
tados microscópicos do sistema a medir. A medida é apenas, nesta perspectiva, um tipo especial
de interacção física e, quando descrita em termos precisos, cai no domínio das leis da dinâmica
quântica e não fora dele, como nas perspectivas interpretativas idealista e de Copenhaga.
Mas este modo de olhar para a medição tem problemas próprios. Os argumentos são conce-
bidos para mostrar que podemos substituir uma função de onda de sobreposição por uma fun-
ção de onda de mistura para propósitos de previsão, quando um sistema quântico medido inte-
rage com um dispositivo de medida suficientemente grande e complexo. Mas a medição de um
sistema quântico individual tem como resultado que um sistema determinado tenha não a fun-
ção de onda de mistura, mas a função de onda pura de uma das suas componentes. Se medir-
mos o spin na direcção vertical de uma partícula originalmente num estado que seja uma sobre-
posição de estados de spin para cima e para baixo, descobriremos ao fazer a medida que essa
partícula terá spin definitivamente para cima ou definitivamente para baixo. Isto é o «colapso do
pacote de ondas». Defender que a sobreposição original de estados de spin para cima e para
baixo, agora convertida numa sobreposição de estados combinados de sistema e dispositivo,
pode ser substituída por um estado de mistura parece implicitamente adoptar a ideia de que a
função de onda devia ser concebida como uma descrição não de uma única partícula, mas de
uma colecção de partículas — pois é a uma colecção de partículas medidas, algumas delas agora
definitivamente com spin para cima e algumas definitivamente com spin para baixo, que o esta-
do de mistura é apropriadamente atribuído.

136
Mas como poderá reconciliar-se esta visão de conjunto da função de onda com os factos que
pareciam indicar que cada partícula individual tinha a qualidade de uma função de onda de so-
breposição? Poderá responder-se, claro, que estas curiosas correlações de tipo interferencial de
uma partícula, que nos inclinam a dizer que cada fotão individual «atravessa ambas as fendas»,
são uma característica própria do mundo quântico. O que se está a defender aqui, afirmar-se-á,
é que podemos compreender por que razão formulamos a nossa teoria, num processo de medi-
da, de maneira a falarmos como se a interferência desaparecesse, quando sabemos que na reali-
dade não desaparece. O argumento é que, uma vez mais, o tamanho e a complexidade do dis-
positivo de medição nos assegura que os potenciais remanescentes realmente existentes nunca
poderão ser produzidos em termos observáveis por qualquer experiência praticável.
Há, talvez, uma objecção mais profunda, mas que tem, pelo menos, uma resposta potencial.
Born, perplexo com o significado da função de onda, ofereceu a famosa e perspicaz ideia se-
gundo a qual a sua intensidade devia ser tomada como a probabilidade de se obter um valor
para o sistema. Confrontado com as questões de saber como diferiam as probabilidades quânti-
cas tão radicalmente das clássicas, Bohr ofereceu a sua subtil correcção da ideia de Born e falou
de probabilidades relativas a uma escolha de um ou outro de um conjunto de processos de me-
dida complementares. Mas estas interpretações, tal como as idealistas, pressupõem que os re-
sultados das medições são, até certo ponto, verdadeiramente caracterizáveis em termos clássi-
cos; pois só poderemos interpretar o estado quântico como «uma potencialidade» para que o
sistema revele aspectos clássicos se retivermos os conceitos clássicos para descrever os resulta-
dos das medições.
A interpretação de que nos ocupamos agora, contudo, tem de lidar com o papel dos concei-
tos clássicos na interpretação da teoria de modo mais complexo. Isto acontece porque, de acordo
com esta interpretação, não há realmente estados do mundo físico susceptíveis de serem correc-
tamente descritos em termos clássicos. Para que o estado completo do mundo — tanto o sistema
como o dispositivo de medida — seja caracterizado da forma mais correcta deverá sê-lo em
termos de uma função de onda quântica. Mas se a própria função de onda deve ser compreen-
dida em termos de probabilidades de estados classicamente descritos, como poderá resolver-se
este dilema?
Pode contar-se uma história que talvez explique como podemos acabar por compreender o
significado da função de estado quântico por uma via que envolve, «de passagem», conceitos
clássicos, ainda que, na nossa compreensão final, estes conceitos clássicos não desempenhem
qualquer papel legítimo na caracterização de quaisquer estados do mundo físico. A história terá
de dizer que a nossa compreensão inicial e pré-quântica do mundo é falsa, mas que a sua pró-
pria adequação, relativamente a muitos fins, para caracterizar os estados do mundo se pode ex-
plicar, em última análise, pela relação entre esta falsa imagem e a verdadeira imagem quântica.
Esta relação deverá fundar-se na teoria do processo de medida já mencionada, onde a caracteri-
zação clássica do dispositivo de medida se explica dizendo que é uma «maneira de falar falsa
mas adequada». A história mostrará que, baseados num dispositivo conceptual que faz parte de
uma imagem falsa do mundo, e que dela depende, construímos a teoria quântica correcta, com-
preendendo inicialmente os seus conceitos ao integrá-los no anterior quadro de referência clás-
sico. De seguida, de posse do dispositivo quântico, reinterpretamos o anterior quadro de refe-
rência clássico como a imagem do mundo falsa mas útil que realmente é. Tendo usado o quadro
de referência clássico como uma escada, abandonamo-lo quando alcançamos o nosso objectivo.
Talvez. Mas levantam-se aqui muitas questões. Acreditaremos nós realmente que os objectos
estão mesmo sempre em estados de sobreposição? Acreditaremos nós que é uma ilusão pensar
que o gato está na realidade totalmente vivo ou totalmente morto e que, ao invés, ele está sem-
pre numa sobreposição de estados? Como devemos entender verdadeiramente tal afirmação?
Haverá um recuo último em direcção à ideia de que os conceitos clássicos são ainda assim ade-
quados para caracterizar aquilo de que temos experiência directa, como uma espécie de caracte-
rística da nossa consciência imediata, ainda que não seja uma característica de qualquer objecto
físico real? Isto faria dos estados clássicos qualquer coisa como as «qualidades secundárias» da
metafísica tradicional lockeana, isto é, características que só são verdadeiramente susceptíveis
de serem atribuídas à consciência directa e não aos objectos físicos «tal como são em si».

137
A interpretação de Kochen e as interpretações estocásticas

Deve ter-se em atenção que há outras interpretações do processo de medida que partilham
com a que acabámos de discutir a sua tese básica de que a medição deve ser concebida como
uma espécie de interacção física em geral e não, como na perspectiva de Bohr ou na idealista,
como um processo distinto da evolução dinâmica comum dos sistemas. Mas nem todas as pers-
pectivas do processo de medida irão explicar a adequação do postulado da projecção, isto é, a
utilidade de pensar que a função de onda entra em colapso e perde todos os seus termos de in-
terferência, em resultado da grandeza e complexidade do dispositivo de medida e da conse-
quente dissipação da interferência para níveis irrecuperáveis.
Kochen, por exemplo, ofereceu outra perspectiva sobre o lugar da medida na dinâmica. Uma
vez mais, é na natureza da interacção entre o sistema a medir e o dispositivo de medida, tal co-
mo é descrita pela dinâmica quântica, que se encontra a base para justificar racionalmente o lu-
gar ocupado pelo postulado da projecção na teoria. Não se reserva qualquer papel para um dis-
positivo de medida descrito em termos clássicos, como na teoria de Bohr, nem se invoca um
qualquer domínio especial do ser exterior à física e, assim, exterior à mecânica quântica, como
nas interpretações idealistas. Mas a grandeza e a complexidade macroscópica do dispositivo de
medida também não desempenham um papel crucial. A natureza da interacção que estabelece
correlações entre os estados puros do sistema medido e do dispositivo de medida é ainda, con-
tudo, importante.
A interpretação de Kochen baseia-se num importante teorema da mecânica quântica. Consi-
derem-se dois sistemas em interacção. Haverá, então, propriedades de cada um dos dois siste-
mas componentes que terão uma natureza especial. Se a função de onda para o sistema combi-
nado for desenvolvida em termos de estados puros dos sistemas individuais que se baseiam
nessas propriedades especiais, então os termos de interferência da função de onda desaparece-
rão. Assim, em termos destas propriedades, a função de onda para o sistema combinado será
como uma função de onda que caracterize uma «mistura». As propriedades especiais são de-
terminadas pela natureza dos sistemas componentes e pela natureza da sua interacção. Em mui-
tos casos haverá apenas uma dessas famílias de propriedades especiais. Apesar de a tradição na
teoria dos quanta ter consistido em exprimir a função de onda do sistema em interacção unica-
mente em termos dos estados puros relevantes para o sistema isolado e para o dispositivo, esta
nova expressão escolhe, em função da natureza da interacção, uma «base» para representar o
estado. (A matemática neste caso faz lembrar a capacidade, na física clássica, para representar
sistemas dinâmicos agregados em «coordenadas normais». Se dois pêndulos estiverem agrega-
dos por uma mola fraca, por exemplo, a energia passa de um pêndulo para outro, conduzindo a
estados de variação temporal dos sistemas individuais. Mas há novas coordenadas nas quais se
pode exprimir o movimento, coordenadas essas que dependem da interacção. O estado de todo
o sistema agregado é estacionário quando observado nesta nova e mais complexa representação
coordenada.)
A ideia desta nova interpretação é a de que o sistema e o dispositivo, quando estão em inte-
racção, podem ser vistos, relativamente um ao outro, como tendo um ou outro dos valores defi-
nitivos das propriedades que constituem a base desta forma especial de representar a função de
onda. Assim, pode dizer-se que uma partícula com spin que esteja em interacção com o disposi-
tivo Stern-Gerlach de medida vertical tem um spin definitivamente para cima ou definitivamen-
te para baixo relativamente ao dispositivo de medida com o qual está em interacção. Analoga-
mente, pode dizer-se que o dispositivo está definitivamente num estado de «indicar para cima»
ou definitivamente num estado de «indicar para baixo» relativamente à partícula cujo spin está
a medir. É a dinâmica da interacção que determina, em qualquer interacção de medida, que ca-
racterísticas do sistema e do dispositivo se podem tomar como definitivas.
Mas mesmo este carácter definitivo só o é, no que respeita ao sistema, relativamente ao dispo-
sitivo e, no que respeita ao dispositivo, relativamente ao sistema. A partícula tem um spin defini-
tivamente para cima ou para baixo tal como o dispositivo de medida o «testemunha» e o dispo-
sitivo indica-nos que ela tem um spin definitivamente para cima ou para baixo tal como o siste-
ma medido o testemunha. Nesta nova interpretação não há qualquer «colapso do pacote de on-
das» no sentido que se tem em vista na interpretação bohriana ou na idealista. Neste aspecto, é

138
análoga à interpretação anteriormente discutida que se baseia na grandeza e complexidade do
dispositivo de medida. A mecânica quântica reina em todo o lado e continuam válidos os teo-
remas que nos dizem que em interacção a sobreposição nunca desaparece realmente. Pode ver-
se que isto é verdade caso se considere o estado do sistema medido e do dispositivo de medida
combinados relativamente a todo o meio exterior, isto é, relativamente a todo o universo, exclu-
indo a partícula em interacção e o dispositivo de medida sob consideração. Tal como testemu-
nhado pelo mundo exterior, a partícula e o dispositivo combinados estão no estado quântico to-
tal de um sistema em interacção, com todas as características correlacionais de interferência que
isso implica.
Kochen chama «testemunho passivo» ao testemunho por parte do mundo exterior do «sis-
tema + dispositivo» combinados, pois não há agregação dinâmica entre o «sistema + dispositi-
vo» e o mundo exterior. Ao testemunho do sistema por parte do dispositivo e do dispositivo
por parte do sistema chama ele «testemunho activo», pois há uma agregação dinâmica entre o
sistema e o dispositivo. Pode ser verdade, pois, que uma partícula com spin para a esquerda,
depois de estar em interacção com um dispositivo de medida vertical, tenha definitivamente,
em relação ao dispositivo de medida, ou um spin para cima, ou um spin para baixo. E o disposi-
tivo fará uma leitura do estado de spin da partícula definitivamente para cima ou para baixo.
No entanto, mantém-se a informação de que a partícula tinha originalmente spin para a esquer-
da, tal como se mantém a interferência dos estados básicos no que respeita ao sistema combina-
do (para cima no que respeita à partícula e de indicar para cima no que respeita ao dispositivo,
para baixo no que respeita à partícula e de indicar para baixo no que respeita ao dispositivo),
interferência esta que contém a informação de que a partícula tinha originalmente um spin para
a esquerda, em princípio susceptível de ser revelado por uma observação suficientemente sub-
til.
Assim, esta interpretação procura fazer justiça à nossa intuição de que depois da medição a
partícula e o dispositivo têm estados definidos. E tanto uma como outro tê-los-ão se os estados
forem os apropriados à dinâmica da interacção e se pensarmos que a partícula e o dispositivo
têm estes estados puros tal como eles são testemunhados entre si. Esta interpretação procura
também fazer justiça à afirmação da mecânica quântica de que a sobreposição nunca é destruí-
da. Isto acontece porque a sobreposição subsiste no estado do sistema e dispositivo de medida
combinados tal como estes são testemunhados pelo mundo exterior. Claro que há muito mais a
dizer para tentar mostrar que esta interpretação fará justiça a todos os factos da observação sem
invocar a dicotomia radical entre medição e interacção dinâmica do ponto de vista bohriano.
Outras interpretações recentes postulam um domínio de processos físicos que operam a um
nível inferior ao do estado quântico. A este nível mais profundo, propõe-se a ocorrência de um
tipo de actividade aleatória, ou estocástica. Com uma formulação apropriadamente inteligente
de uma tal física que descreva novos processos físicos, podemos ter a esperança de alcançar
uma teoria na qual, em certas circunstâncias, os processos físicos subjacentes de tipo aleatório
possam «conduzir» um sistema que esteja originalmente num estado quântico de sobreposição
a um estado quântico «quase» puro que corresponda a um único valor relativamente à quanti-
dade medida. Espera-se, naturalmente, que estas circunstâncias físicas sejam as que correspon-
dem ao que tomamos como um processo de medida do ponto de vista ortodoxo. Em todas estas
teorias, contudo, o novo estado não é realmente o estado de onda em colapso que a mecânica
quântica prevê depois de uma medição ter tido lugar. Tal teoria tem também, pois, de conter
elementos que nos digam por que razão é legítimo adoptar o postulado da projecção e presumir
que o estado depois da medição é puro, quando na realidade o não é. Defende-se habitualmente
que, para todos os efeitos práticos, as previsões efectuadas com base no estado real e com base
no estado puro aproximado serão iguais.

Interpretações de «múltiplos mundos»

Uma outra interpretação, apresentada originalmente por Everett e Wheeler, procura fazer
justiça às enigmáticas características da medição advogando uma nova metafísica para o mun-
do. Ao invés do revisionismo metafísico radical de Bohr — que em certo sentido nega que o
mundo físico tenha, de todo em todo, uma realidade objectiva, retendo uma realidade mera-

139
mente relativa à escolha de dispositivo de medida —, a nova metafísica é objectivista. Mas o
mundo real por ela postulado parece intuitivamente bastante estranho.
No tratamento bohriano do processo de medida «deita-se fora» parte de uma função de on-
da sempre que se efectua uma medição. A partícula, com spin para a esquerda, entra no disposi-
tivo de medição vertical com uma sobreposição de estados de spin para cima e para baixo. Mas
quando a medição tem lugar a partícula tem um spin definitivamente para cima (e o dispositivo
de medida indica que ela tem um spin definitivamente para cima) ou definitivamente para bai-
xo (e o dispositivo indica «definitivamente para baixo»). Mas, de acordo com a dinâmica quân-
tica, imediatamente antes do «colapso da função de onda» o complexo partícula/dispositivo es-
tava numa sobreposição de estados combinados «para cima e o dispositivo indica para cima» e
«para baixo e o dispositivo indica para baixo». Suponha-se que a medição indica o valor «para
cima» para a partícula. O que aconteceu à componente «para baixo e o dispositivo indica para
baixo» da função de onda? Desapareceu, pura e simplesmente, do mundo. E, com ela, desapare-
ceram também as possibilidades, geradas por meio da interferência, latentes na sua presença
conjunta com a outra componente da função de onda.
Mas Everett e Wheeler pensam que ambas as componentes da função de onda continuam a
existir depois de a medição ter tido lugar. Como pode isto acontecer? Quando uma partícula é
detectada após sair de um dispositivo de medida de spin de alinhamento vertical, tem um spin
definitivamente para cima ou definitivamente para baixo? Como poderia ter ambos? A resposta
dada por esta interpretação é a de que em cada medição o universo divide-se numa multiplici-
dade de mundos, um para cada resultado possível do processo de medida. Há um mundo no
qual a partícula sai do dispositivo no estado de spin para cima. Nesse mundo, o dispositivo in-
dica também a leitura de spin para cima, pois é de esperar que os estados de detecção do dispo-
sitivo estejam exactamente correlacionados com o valor da quantidade medida em questão.
Mas, juntamente com o mundo que tem uma partícula com spin para cima e um dispositivo de
medida que indica para cima, há também um mundo com uma partícula com spin para baixo e
um dispositivo que indica para baixo. A função de onda da partícula com spin para a esquerda
que entra no dispositivo e interage com ela poderia formular-se como uma sobreposição de es-
tados «spin para cima e o dispositivo indica para cima» e «spin para baixo e o dispositivo indica
para baixo». Na interpretação dos «múltiplos mundos» que estamos agora a apresentar cada
componente desta sobreposição representa o que acontece num dos muitos mundos reais que se
«separam» de um universo de cada vez que tem lugar uma medição.
Esta interpretação precisa de lidar com a probabilidade dos resultados. Precisa também de
convencer-nos de que a imagem da medição que oferece terá resultados ao nível da observação
consistentes com os resultados conhecidos resumidos no formalismo da mecânica quântica.
Além disso, como é natural, a interpretação tem os seus críticos. Para começar, muita gente con-
sidera a imagem metafísica grotesca e extravagante, o que não é de admirar. Afinal, só obser-
vamos um dos possíveis estados decorrentes de uma medição, e não uma multiplicidade de re-
sultados possíveis. É precisamente por isso que falamos do «colapso do pacote de ondas». Que
outra razão, excepto uma preferência pela simetria em detrimento da experiência, teremos re-
almente para supor que ocorreram igualmente todos os outros resultados, escondidos de nós
por serem observados por outros «ramos» de nós que existem noutros ramos do universo? A
teoria tem também os seus problemas internos quanto à determinação do momento em que a
separação tem lugar. Ocorrerá esta em todas as interacções? Ou só nas interacções de medida?
No segundo caso, o que as distingue de evoluções dinâmicas comuns de modo a poder justificar
a metafísica da divisão dos universos? E em que dimensões tem esta lugar? Uma função de on-
da pode ser decomposta em diferentes componentes. Representam todas estas decomposições
outras tantas separações? Como? Ou há uma decomposição preferida que rege a maneira como
o universo se divide, determinada, digamos, da forma como a interpretação kocheana da inte-
racção determina a propriedade medida especial e a propriedade de medição?
Nos últimos anos, alguns especialistas combinaram a perspectiva da medida de «múltiplos
mundos» com a idealista, obtendo uma interpretação de «múltiplas mentes» (Albert e Loewer).
Neste caso há apenas um mundo físico, sempre descrito pela função de onda em desenvolvi-
mento que segue a evolução ditada pela equação de Schrödinger e na qual nunca se dá o colap-
so. Mas qualquer mente que compreenda o valor de uma quantidade medida divide-se numa

140
quantidade de mentes, cada uma das quais só observa um de todos os resultados possíveis do
processo de medida. Uma vez mais se oferecem demonstrações de consistência para tentar con-
vencer-nos que iremos obter os habituais resultados probabilísticos previstos pela teoria dos
quanta em matérias como a comunicação dos nossos resultados de medições aos outros e a re-
cepção das suas comunicações (mediadas pelo mundo físico) ou a repetição de medições.

Lógicas quânticas

Temos explorado abordagens concebidas para explicar as curiosas características do mundo


que a mecânica quântica implica; estas abordagens baseiam-se em programas que explicam os
fenómenos procurando características metafísicas do mundo. Quer esses programas postulem
uma dualidade flexível entre sistema quântico e dispositivo de medida clássico, como faz a teo-
ria de Bohr; um papel remanescente a ser desempenhado pelos conceitos clássicos no domínio
da mente fora da realidade física, como fazem as abordagens idealistas; uma perspectiva do
mundo em que a dinâmica quântica tem validade universal, como fazem as abordagens que se
apoiam na grandeza e complexidade do dispositivo de medida ou a interpretação de interacção
de Kochen; ou uma expansão radical da nossa ontologia para explicar os fenómenos, como fa-
zem as abordagens do tipo das que postulam múltiplos mundos; todos eles procuram uma so-
lução modificando as nossas ideias tradicionais sobre a natureza dos sistemas físicos do mundo.
Uma abordagem algo diferente procura resolver os problemas modificando o nosso pensa-
mento tradicional no que respeita a alguns dos nossos modos mais arreigados e gerais de des-
crever o mundo. Defende-se que talvez seja necessária uma reinterpretação radical dos nossos
esquemas mais gerais de assimilação de fenómenos do mundo, para dar sentido às misteriosas
características quânticas que assinalámos.
Uma dessas abordagens sublinha o importante papel desempenhado pela probabilidade na
teoria. Algumas das enigmáticas características quânticas podem ser resumidas assinalando a
diferença radical que apresentam no seu funcionamento em relação às probabilidades mais co-
nhecidas da física clássica. Tome-se, por exemplo, a experiência das duas fendas. Concebemos a
luz como algo composto por fotões localizáveis porque os detectores colocados nas fendas de-
terminam que toda a energia luminosa atravessa ou uma ou outra fenda, fotão a fotão, e nunca
as duas. Não deveríamos, pois, conceber a probabilidade de um fotão chegar ao ecrã como o re-
sultado de dois processos «independentes», o de o fotão chegar a x após atravessar a fenda 1 e o
de ele chegar a x após atravessar a fenda 2? Mas então as regras clássicas da probabilidade le-
vam-nos a prever que a probabilidade de um fotão chegar a x, se atravessar a fenda 1 ou a 2, se-
ja a soma das duas probabilidades separadas. Mas é claro que não é, pois temos os já familiares
efeitos de interferência. Assim, talvez devamos rejeitar as nossas regras tradicionais de combi-
nação de probabilidades que dependem de causas independentes.
Outra característica peculiar da probabilidade na teoria quântica ocorre nas chamadas «dis-
tribuições conjuntas». Suponha-se que temos uma população de seres humanos cujas alturas es-
tão distribuídas de acordo com uma certa distribuição de probabilidade. E suponha-se também
que há uma distribuição de cores dos olhos, uma vez mais caracterizável por uma certa distri-
buição de probabilidades. Nesse caso, faz sentido perguntar qual é a distribuição conjunta das
alturas e cor dos olhos. Se há uma certa probabilidade de um ser humano ter mais de 1,80 m e
uma certa probabilidade de um ser humano ter olhos azuis, então há uma probabilidade con-
junta de uma pessoa com olhos azuis ter mais de 1,80 m.
Mas, como sabemos, tais distribuições de probabilidades conjuntas nem sempre são possí-
veis na mecânica quântica. Pode haver uma certa probabilidade de encontrar uma partícula
numa região particular do espaço e também uma distribuição de probabilidade que determine
que a quantidade de movimento da partícula se encontrará num domínio especificado de valo-
res. Mas não haverá uma probabilidade conjunta de a partícula se encontrar simultaneamente
num domínio do espaço determinado com uma quantidade de movimento num determinado
intervalo de valores. Bohr chama a atenção para a impossibilidade física de medir simultanea-
mente a posição e a quantidade de movimento. A posição e a quantidade de movimento são,
para usar os seus termos, mutuamente complementares. E, relativamente a observáveis com-
plementares, não podemos esperar que a mecânica quântica nos dê funções bem definidas de

141
distribuição de probabilidade conjunta. Ora, sugere-se que talvez esta ausência de funções de
probabilidades conjuntas se possa fundar numa nova teoria não canónica das probabilidades.
Um diagnóstico ainda mais profundo dos problemas conceptuais da mecânica quântica pro-
cura atingir o coração dos temas, explorando questões sobre a natureza da própria lógica. A ló-
gica dá-nos as regras básicas que regem as relações de implicação que as nossas proposições so-
bre o mundo mantêm entre si. A lógica usual diz-nos, por exemplo, que uma proposição e a sua
negação não podem ambas ser verdadeiras, que ou uma ou outra têm de ser verdadeiras, que se
duas proposições são verdadeiras a sua conjunção também é verdadeira, e assim por diante.
Poderá uma revisão da própria lógica ajudar-nos a dar sentido aos fenómenos quânticos? Te-
mos concebido a lógica como algo imutável e independente do nosso conhecimento experimen-
tal do mundo. Mas, afinal de contas, também concebíamos a geometria assim até aos últimos
dois séculos. Talvez a lógica seja tanto uma questão empírica como a química ou como agora se
pensa ser a geometria.
Uma sugestão neste sentido foi feita por Reichenbach, que pensava que, ao permitir a exis-
tência de proposições que não fossem verdadeiras nem falsas, algumas das características dos
sistemas quânticos poderiam ser bem representadas. Uma afirmação sobre a posição de uma
partícula seria verdadeira ou falsa depois daquela ser medida. Mas não poderemos dizer, rela-
tivamente a uma partícula num estado quântico entre medições no qual a posição não tenha um
valor definido com probabilidade 1, que as afirmações sobre a posição têm um valor de verdade
«indeterminado», não sendo verdadeiras nem falsas?
Uma sugestão de revisão da lógica muito mais frutuosa ao nível da mecânica quântica tem a
sua origem no trabalho de Birkhoff e von Neumann, que tem um aspecto incontroverso e um
controverso. O incontroverso surge do projecto geral de tentar discernir, na teoria dos quanta,
as características mais básicas que conduzem aos enigmáticos fenómenos quânticos. Já assina-
lámos o facto de a teoria ter sido originalmente desenvolvida em dois formalismos que à pri-
meira vista pouco pareciam relacionar-se entre si: a mecânica de matrizes de Heisenberg e a
mecânica ondulatória de Schrödinger. Este último demonstrou a equivalência formal das duas
teorias, e Dirac e von Neumann apresentaram a teoria de modo mais abstracto, colhendo das
duas abordagens o núcleo comum.
Mas mesmo estas formulações da teoria dos quanta poderiam conter, juntamente com os
elementos essenciais, elementos inessenciais — meros artefactos de uma maneira específica de
apresentar a teoria. Será que podemos descobrir uma maneira de formular claramente os ele-
mentos mais essenciais da teoria, aqueles que teriam de surgir em qualquer «representação» dos
factos físicos?
Birkhoff e von Neumann mostraram que uma maneira de o fazer era concentrar a atenção
nas relações entre estados de sistemas, relações que poderiam ser consideradas uma espécie de
«lógica» das proposições sobre o sistema. Suponha-se que uma partícula irá definitivamente,
isto é, com probabilidade 1, ao encontro de um filtro que só deixa passar partículas com spin pa-
ra cima. Nesse caso, podemos dizer que «spin para cima» se aplica à partícula. Se uma partícula
for definitivamente ao encontro de um filtro que tanto deixa passar partículas com spin para ci-
ma como para baixo, diremos que «spin para cima qou para baixo» se aplica à partícula *. Se uma
partícula atravessar definitivamente um filtro p e um s, diremos que «p qe s» se aplica à partícu-
la.
Considere-se agora a «lei distributiva» da lógica tradicional, a lei que afirma que se p é ver-
dadeira e se r ou s são verdadeiras, então ou p e r são verdadeiras ou p e s o são. Se um homem é
alto e tem olhos azuis ou castanhos, então é alto e tem olhos azuis ou é alto e tem olhos casta-
nhos. Será que o «qe» distribui sobre o «qou» do modo como o «e» distribui sobre o «ou»? Não.
Considere-se uma partícula com «spin para a esquerda qe (spin para cima qou para baixo)». À
medida que as partículas relevantes passam pelo dispositivo (de cima qou de baixo), «para cima
qou para baixo» aplica-se a todas as partículas. As partículas que têm «spin para a esquerda qe


*Por «qou» entende-se a disjunção quântica («ou» quântico) e por «qe» a conjunção quântica («e» quânti-
co), que, segundo alguns especialistas, seriam diferentes da disjunção e conjunção usuais («e» e «ou»). (N.
do T.)

142
(spin para cima qou para baixo)» são, pois, apenas as partículas definitivamente com spin para a
esquerda. Mas nenhuma partícula terá probabilidade 1 de atravessar um dispositivo de alinha-
mento para a esquerda e probabilidade 1 de atravessar um dispositivo de alinhamento para ci-
ma, pois as propriedades de ter spin para a esquerda e para cima são complementares, não po-
dendo nenhum sistema ter definitivamente ambas estas propriedades ao mesmo tempo. O
mesmo se pode dizer do spin para a esquerda e para baixo. Logo, nada tem «spin para a esquer-
da qe para cima» nem «spin para a esquerda qe para baixo» e assim nada tem «(spin para a es-
querda qe para cima) qou (spin para a esquerda qe para baixo)». Apesar de muitas partículas
terem «spin para a esquerda qe (spin para cima qou para baixo)», isto é, todas as que têm spin
para a esquerda, nenhumas partículas têm «(spin para a esquerda qe para cima) qou (spin para a
esquerda qe para baixo)». Logo, o «qe» não distribui sobre o «qou» da maneira como o «e» dis-
tribui sobre o «ou».
Podemos formular uma lógica proposicional do tipo comum usando o «não», «e» e «ou»
comuns. Uma tal lógica tem a propriedade distributiva já assinalada e chama-se «álgebra de
Boole». Podemos formular uma estrutura formal do tipo apropriado a «qe» e «qou» (juntamente
com uma negação quântica apropriada). Chama-se «reticulado modular ortocomplementado».
(Na verdade, a estrutura necessária para a mecânica quântica é, por razões que não nos interes-
sam aqui, um pouco mais fraca, um reticulado modular «fraco».) O uso incontroverso dessa no-
va «lógica» é o seguinte: podemos captar os elementos essenciais da estrutura de sobreposição
característica dos sistemas quânticos representando a estrutura de proposições sobre sistemas
quânticos como um reticulado modular. Podemos então explicar por que razão a formulação
canónica da mecânica quântica funciona tão bem, mostrando que ela «representa» o reticulado
das proposições. (Podemos, de modo análogo, justificar a introdução do espaço de fase clássico
na mecânica quântica como uma representação da álgebra de Boole de proposições sobre siste-
mas clássicos.)
As questões tornaram-se mais controversas (na verdade, muito controversas) quando se
propôs (a certa altura por Putnam, por exemplo) dever a «lógica» quântica ser interpretada co-
mo lógica em sentido pleno. A ideia neste caso é a de que tal como a relatividade geral nos mos-
trou que a geometria euclidiana, que se pensava aplicar-se ao mundo, era efectivamente falsa e
tinha de ser substituída, por motivos empíricos, pela geometria não euclidiana do espaço-
tempo, também a mecânica quântica nos diz que a lógica de Boole a que estamos habituados é
incorrecta enquanto lógica do mundo. Os factos empíricos levam-nos a apercebermo-nos de que
a verdadeira lógica do mundo é a que se caracteriza pela lógica não distributiva da mecânica
quântica e não a lógica distributiva que pensávamos descrever correctamente as relações entre
proposições sobre o mundo. Deste ponto de vista, «qe» é na verdade «e» e «qou» é «ou». Acon-
tece apenas que algumas coisas que pensávamos que eram verdadeiras sobre «e» e «ou» são fal-
sas, tomando outras verdades o seu lugar.
É fácil de ver por que razão tal perspectiva seria atraente. Considere-se um feixe de partícu-
las, tendo todas elas sido dispostas de modo a estar no estado de spin para a esquerda. O feixe é
então enviado para um dispositivo de medida de spin vertical que tenha ambos os canais (para
cima e para baixo) abertos. Recombinam-se então os feixes emergentes. Gostaríamos de dizer
que este feixe tem um spin definitivamente para a esquerda. Gostaríamos também de dizer que
as partículas do feixe ou têm spin para cima ou para baixo. Mas não queremos dizer, relativa-
mente a nenhuma partícula do feixe, que tem «spin para a esquerda e para cima» ou «spin para a
esquerda e para baixo», pois o spin para a esquerda e para cima são propriedades complementa-
res, tal como o spin para a esquerda e para baixo. Logo, nenhuma partícula pode ter spin para a
esquerda e spin para cima, e nenhuma partícula pode ter spin definitivamente para a esquerda e
spin para baixo.
Mas na lógica quântica podemos afirmar que as partículas no feixe têm todas spin para a es-
querda e que cada partícula no feixe «tem spin para cima ou para baixo», desde que interprete-
mos o «e» como «qe» e o «ou» como «qou». Evita-se o paradoxo porque, dada a não distributi-
vidade do «qe» sobre o «qou», dizer que cada partícula tem «spin para a esquerda e (spin para
cima ou para baixo)», na nova interpretação dos conectivos, não implica que tenhamos de acei-
tar que qualquer partícula no feixe tem «spin para a esquerda e para cima» ou «spin para a es-
querda e para baixo».

143
Mas será que a mecânica quântica mostra realmente que devíamos substituir a nossa lógica
por uma nova lógica? E será que fazer tal elimina realmente os aspectos paradoxais do mundo
quântico? Uma objecção é a de que apesar de o «qe» e o «qou» desempenharem um papel útil,
seria extremamente enganador pensar que tais expressões substituem o «e» e o «ou». Um dos
problemas é que o «e» e o «ou», com os seus significados tradicionais, têm ainda um papel a de-
sempenhar na descrição quântica do mundo. Podemos descrever correctamente as partículas de
um feixe de mistura que venha do dispositivo de alinhamento vertical (tendo elas sido detecta-
das à medida que emergiam dos canais apropriados do dispositivo de alinhamento vertical an-
tes de os feixes serem recombinados) dizendo que têm «spin para cima ou para baixo», receben-
do o «ou» o seu significado clássico. Só o feixe de sobreposição das partículas que percorreram
os canais sem serem detectadas e que se juntaram então no feixe recombinado se descreve cor-
rectamente dizendo que tem «spin para cima qou para baixo». Assim, é enganador pensar que,
ao fornecer uma imagem quântica do mundo, o «qe» e o «qou» substituem, em vez de comple-
mentarem, o «e» e o «ou». Outra objecção corrente à tese da substituição é a de que a argumen-
tação usada na própria discussão usa as regras da lógica habitual.
Mesmo internamente, na sua tentativa de reconstruir a descrição quântica do mundo, a
abordagem do revisionismo lógico tem as suas dificuldades. É verdade que na lógica quântica
«p qe (r qou s)» não é equivalente a «(p qe r) qou (p qe s)». Mas mesmo na lógica quântica a se-
gunda implica a primeira, isto é, se a segunda for verdadeira, a primeira também terá de o ser. A
implicação só não se verifica num sentido: da primeira para a segunda. Suponha-se agora que
aplicamos a teoria usual das probabilidades à nossa nova lógica. Um resultado básico da teoria
de probabilidades é o de que se t implica w, a probabilidade de w é pelo menos tão elevada
quanto a de t. Afinal, se a verdade de t garante a verdade de w, certamente que é pelo menos
tão provável que w ocorra como é provável que t seja o caso.
No caso das duas fendas, na teoria quântica, esta conexão entre implicação e probabilidade
pareceria sugerir, dadas a lógica quântica e a teoria das probabilidades, que a probabilidade de
uma partícula atingir um ponto x no ecrã caso as duas fendas estejam abertas deveria ser pelo
menos tão elevada quanto a probabilidade de atingir o mesmo ponto x no caso de só uma das
fendas estar aberta, mas não ambas. A primeira é a probabilidade atribuída à asserção «atinge x
e atravessou a fenda 1 ou a 2». A segunda probabilidade é a de «ou atinge x e atravessou a fen-
da 1 ou então atinge x e atravessou a fenda 2». E, uma vez mais, este último fenómeno, implica
o primeiro. Mas o fenómeno da interferência permite que a probabilidade de uma partícula
atingir x quando ambas as fendas estão abertas seja menor do que a probabilidade de atingir x
caso uma das fendas esteja aberta, e muito menor do que a soma das probabilidades que resul-
tam de ambas as fendas estarem individualmente abertas. Isto parece pelo menos indicar que a
lógica quântica, só por si, não conseguirá resolver todos os nossos dilemas sobre os paradoxos
quânticos.

Resumo

Passámos já em revista, muito rápida e superficialmente, várias tentativas de «dar sentido» à


natureza peculiar do mundo revelado pela teoria dos quanta. O leitor deve perceber que cada
uma das interpretações aqui mencionadas é uma tentativa hábil e por vezes bastante complexa
de fazer justiça à quantidade de factos que a teoria dos quanta nos revela. Cada interpretação
exige um exame cuidado das suas virtudes e dos seus pontos fracos antes de podermos ajuizar
da sua adequação ou inadequação.
A própria amplitude de questões que ficam sem respostas definitivas é intimidadora. Qual é
exactamente o papel dos conceitos clássicos na descrição quântica do mundo? Constituirão eles
conceitos primitivos e não elimináveis, necessários para descrever aquela parte do mundo, situ-
ada do lado da medição, que resulta de um «corte» flexível entre o sistema quântico e o disposi-
tivo de medida clássico? Constituirão eles os termos não elimináveis, por meio dos quais se des-
creve a experiência das mentes fora do domínio físico? Ou serão esses conceitos clássicos as
maneiras falsas, mas proveitosamente fictícias, que legitimamente se aplicam para descrever es-
tados verdadeiramente quânticos em circunstâncias especiais — servindo os conceitos para ca-
racterizar em termos «aproximados» estados de sistemas? Além disso, até que ponto se podem

144
aplicar a sistemas entre medições? Serão totalmente inaplicáveis a esses sistemas, ou haverá al-
guma maneira de legitimamente pensarmos que os sistemas em evolução se caracterizam por
valores clássicos, ainda que estes nos sejam desconhecidos?
E qual é a natureza do estado quântico representado pela função de onda? Será uma caracte-
rização de sistemas individuais ou apenas de uma colecção de sistemas? Será a caracterização
de um aspecto físico e real do mundo, ou devemos antes concebê-la como uma espécie de dis-
positivo de cálculo intermédio, sem que represente uma realidade física? Dado o papel dessa
função de onda no cálculo das probabilidades de resultados de medições, poderá ela ser conce-
bida como algo muito semelhante a uma probabilidade pré-quântica — uma medida da fracção
de uma colecção ou grau de crença racional, digamos? Ou será, ao invés, que os fenómenos de
interferência tornam claro que se trata de algo mais parecido com uma função de onda física?
Além disso, será o estado quântico de um sistema relativo a um sistema de medida particular,
como Bohr insiste em afirmar?
E quanto ao peculiar processo de medida? Terá de ser concebido como uma componente não
eliminável da teoria, de nenhuma maneira assimilável a evoluções dinâmicas comuns nem a in-
teracções de sistemas? É o «colapso do pacote de ondas» uma descrição de um fenómeno físico
real, ou a mudança numa distribuição de probabilidades clássica quando a base de conhecimen-
to do agente muda? O que caracteriza exactamente aquelas situações que constituem medições,
ao contrário daquelas que são interacções físicas comuns? Estará a chave do problema na distin-
ção bohriana entre sistema e dispositivo clássico? Será que a presença de uma «mente» agindo
no mundo é essencial? Ou será o processo de medida apenas um exemplo especial de uma inte-
racção quântica canónica caracterizada pela grandeza e complexidade de um dos sistemas em
interacção ou pela natureza especial da interacção relativamente a uma propriedade preferida
do sistema e dispositivo? Teremos de postular uma ontologia radicalmente nova que multipli-
que universos para fazer justiça aos factos da medição?
Há aqui, claramente, um complexo de questões relacionadas entre si. O desenvolvimento
minucioso das próprias questões lançou bastante luz sobre a medida exacta das peculiaridades
da imagem quântica do mundo. A compreensão de algumas das interpretações da medição exi-
ge mergulhar profundamente tanto nos factos da observação do mundo quântico como no for-
malismo da teoria que procura fazer justiça a estes factos. O leitor que procurar penetrar na bi-
bliografia mais pormenorizada dedicada a estes temas, que por vezes é formalmente bastante
sofisticada, não deve esquecer certos factos básicos. É uma boa ideia recordar constantemente as
peculiaridades fundamentais das experiências básicas. Ao atravessar um ecrã com duas fendas
a luz exibe um padrão de interferência que seria facilmente explicável se a luz fosse uma onda
dispersa que transferisse a sua energia através de ambas as fendas. As partes individuais da
onda recombinam-se então na parte mais afastada do ecrã com fendas. No entanto, todas as ex-
periências concebidas para detectar a energia da luz obtêm-se sob uma forma localizada. Detec-
tores colocados nas fendas mostram os fotões a passar através de uma fenda ou de outra e nun-
ca pelas duas simultaneamente. A luz absorvida pelo filme fotográfico revela sempre constituir
uma interacção de um fotão com uma molécula de iodeto de prata e nunca uma onda dispersa
de energia. Também os electrões, quando são detectados, revelam ser partículas localizadas. No
entanto, quando os electrões são difractados pelo reticulado de um cristal, mesmo que só um de
cada vez, o feixe difractado recebido nos detectores revela o padrão de interferência típico que é
de esperar de uma onda que interaja com uma rede de difracção. Como pode cada electrão in-
dividual, se for apenas uma partícula pontual, «saber», ao encontrar o cristal, que está a intera-
gir com uma colecção regular e espacialmente distribuída de átomos espalhados no reticulado
do cristal?
São factos como estes e como os seus análogos no que diz respeito a outras características,
tais como os efeitos de interferência observados em experiências de medida de spin, que exigem
a revisão radical do nosso formalismo físico, forçando-nos a passar do formalismo da física clás-
sica para o da mecânica quântica. Não é de espantar que tais factos peculiares exijam não ape-
nas uma revisão de pormenores — como a modificação de algumas das leis de forças que regem
os sistemas — mas um repensar radical: o que é um sistema? Em que consiste atribuir-se a esse
sistema um determinado valor? E o que significa que esse valor seja revelado por um processo

145
de medida? Como veremos no resto do capítulo, não ficam por aqui os mistérios que a teoria
dos quanta nos representa.

O problema das variáveis ocultas e do determinismo

Determinismo e indeterminismo

A influência da imagem newtoniana do mundo, mecanicista e dinâmica, provocou uma no-


va ênfase numa velha doutrina, o determinismo. Não se pode dizer que a ideia do determinis-
mo — o estado do mundo num dado momento, juntamente com as leis da natureza, fixam
completamente o estado do mundo em todos os momentos posteriores — seja nova. Ideias des-
tas fizeram parte da especulação dos gregos antigos. Mas o modelo de um sistema de partículas
interagindo em função de certas forças e de um modo tal que uma dada condição inicial do sis-
tema gera a sua condição posterior em todos os momentos futuros, modelo que se segue das
famosas leis de Newton do movimento, forneceu um ímpeto renovado a esta perspectiva de-
terminista do mundo. A famosa afirmação do físico Laplace (conhecesse ele o estado do mundo
num certo momento, poderia inferir o seu estado em todos os momentos posteriores) representa
esta perspectiva.
Como é natural, tal doutrina tem também consequências perturbadoras. Se, como T. S. Eliot
colocou a questão, «o passado e o futuro estão no presente, e o presente no passado», se tudo o
que vier a ser estiver desde logo fixado pelo que já foi, como poderá a «escolha livre» desempe-
nhar qualquer papel no universo? Como podem as nossas decisões, que determinam (pelo me-
nos num certo grau) o nosso futuro, ser concebidas senão como o funcionamento do estado do
mundo, anterior inclusivamente ao nosso nascimento — algo que certamente escapa ao nosso
domínio? Nada mais terei a dizer sobre estes muito debatidos temas filosóficos.
Vejamos o determinismo mais de perto. Mesmo na física clássica, está longe de ser claro que
se possa dizer com alguma segurança que um determinismo simplista se aplica ao mundo. No
caso da mecânica newtoniana de partículas, há a possibilidade de ocorrerem colisões multipar-
tículas. Se as partículas forem concebidas como pontos, sujeitos às habituais leis de forças, não
podemos, em geral, projectar o estado do mundo posterior à colisão a partir do estado anterior a
ela. Há também a possibilidade, a qualquer momento, de surgirem partículas «provenientes do
infinito» de maneira a que o estado num momento posterior não seja determinável a partir de
um estado suficientemente anterior. Em contextos relativistas gerais, as questões relacionadas
com a complexidade da topologia do espaço-tempo podem até tornar dúbia a noção de «estado
do mundo na sua totalidade» num instante determinado. O estudo da possibilidade de «super-
fícies de Cauchy», isto é, de estados do mundo «num instante determinado» suficientes para de-
terminar os estados do mundo de todos os momentos posteriores, é uma questão teórica intrin-
cada. Uma vez mais, como vimos no capítulo 3, há a questão da instabilidade radical do movi-
mento, mesmo do ponto de vista newtoniano. Um sistema pode ser de tal modo constituído que
existirão estados tão próximos quanto quisermos de qualquer das suas condições iniciais; mas
estes estados podem conduzir a estados futuros do sistema radicalmente divergentes daqueles a
que as condições iniciais conduzem. Por mais precisos que sejam os nossos dispositivos de me-
dida, podemos ser incapazes de determinar o estado inicial de um sistema com um grau de
exactidão que seja realmente útil para prever o seu estado futuro, mesmo após pequeníssimos
intervalos de tempo. Na verdade, há quem defenda que uma tal instabilidade radical tem como
resultado que não seja razoável pensar que o sistema tem uma condição inicial exacta que de-
termine completamente a sua evolução futura, apesar de esta perspectiva ser, sem dúvida, mi-
noritária.
Apesar destes escrúpulos, há claramente aspectos da mecânica newtoniana, e de outras teo-
rias físicas clássicas como a teoria do electromagnetismo, que nos levam a pensar que o mundo
por elas descrito é genuinamente determinista. E estes resultados da física influenciam as pers-
pectivas filosóficas que tentam descrever o mundo como algo em que tudo o que acontece é de-
terminado por um acontecimento anterior e pelas leis que relacionam os estados do mundo em
vários instantes.

146
A ideia de que todo o acontecimento tem uma causa — a ideia de que, relativamente a cada
ocorrência, se pode descobrir em acontecimentos anteriores uma «razão suficiente» para essa
ocorrência — era tomada por Leibniz como um postulado metafísico fundamental. Kant defen-
deu que o princípio da «causalidade universal» era uma regra de funcionamento do entendi-
mento humano. Kant reagia em parte ao cepticismo de Hume segundo o qual nada se conseguia
encontrar no mundo que correspondesse à noção metafísica de «conexão necessária» entre
acontecimentos (isto é, nada que fosse mais do que as efectivas regularidades de acontecimen-
tos, regularidades que constituíam questões de facto, e as expectativas psicológicas por elas ge-
radas). Segundo Kant, podíamos saber a priori que o mundo da nossa experiência estava sujeito
aos princípios de causa e efeito. (Na verdade, está longe de ser óbvio se as dúvidas sobre o de-
terminismo que resultam da teoria dos quanta que iremos explorar desanimariam realmente
Kant, dado o papel por ele reservado ao princípio de que «todo o acontecimento tem uma cau-
sa».)
Para um grupo de filósofos o princípio de que todo o acontecimento tem uma causa é uni-
versalmente verdadeiro, mas não enquanto verdade metafísica à maneira de Leibniz, nem como
verdade «transcendental» à maneira de Kant. Para esse grupo o princípio de que todo o aconte-
cimento tinha uma natureza tal que descobrir um acontecimento anterior era suficiente para ga-
rantir a ocorrência do primeiro constituía um «postulado metodológico». Nunca desistir de pro-
curar um acontecimento explicativo anterior era uma decisão aceite. Se ocorresse algum aconte-
cimento para o qual não encontrássemos um outro que lhe fosse anterior e causalmente explica-
tivo, não poderíamos sempre defender-nos dizendo que não tínhamos, pura e simplesmente,
procurado suficientemente bem ou durante o tempo suficiente? Afinal, o que poderia assegurar-
nos que esse acontecimento explicativo não existia? A mera incapacidade para o encontrarmos
poderia ser sempre entendida, alegavam eles, como uma indicação não da inexistência de um
acontecimento explicativo causalmente adequado, mas apenas da nossa incapacidade para o
apreender.
Talvez o impacte mais interessante da teoria dos quanta sobre estes temas seja a afirmação,
sustentada por muitas pessoas, de termos pela primeira vez uma teoria do mundo que nos
permite negar, relativamente a um dado acontecimento, que possamos encontrar qualquer acon-
tecimento anterior causalmente adequado para explicar por que motivo ocorreu o acontecimen-
to em causa e não uma das alternativas especificáveis. Neste caso, afirma-se, há razões para ne-
gar a existência da causa em falta e não apenas para pensar que tal causa escapou meramente à
nossa apreensão. Passamos de seguida a explorar os tipos de argumentos oferecidos para sus-
tentar tal afirmação. O leitor deve ter consciência, contudo, de que há um pano de fundo onde
se ocultam todo o tipo de enigmáticas questões filosóficas que não iremos explorar. Por exem-
plo, a própria noção de determinismo pressupõe a noção de lei científica — uma generalização
que ligue acontecimentos ocorridos num dado momento com outros ocorridos noutro momen-
to. Mas, como Russell sublinhou, se admitirmos qualquer descrição de acontecimentos como le-
gítima e qualquer generalização que use tais descrições, é trivial admitir que qualquer aconte-
cimento está relacionado com um acontecimento anterior através de leis. Assim, restam-nos
ainda muitas questões importantes e puramente filosóficas se quisermos clarificar o que quer
realmente dizer a afirmação de que o mundo é determinista.

Argumentos contra as variáveis ocultas

Regressemos, contudo, ao nosso tema central. O que poderia levar alguém a afirmar que a
mecânica quântica mostra que o mundo é indeterminista? Suponha que se dispõe um sistema
num dado estado quântico num certo momento. Suponha agora que esse sistema se mantém
isolado em relação a qualquer interacção com o mundo exterior durante um dado intervalo de
tempo. Será o estado quântico desse sistema no fim do intervalo de tempo completamente «de-
terminado» pelo seu estado quântico no princípio do intervalo? A resposta é «Sim». A evolução
dinâmica do estado quântico rege-se pela equação de Schrödinger. E esta equação determina
completamente o estado quântico num momento posterior a partir da sua forma no princípio
do intervalo. Logo, na evolução dos próprios estados quânticos nada sugere qualquer novo in-
determinismo devido à teoria dos quanta.

147
Ao invés, é ao determinar os valores dos resultados de uma medição que o indeterminismo
pode surgir. Dada a quantidade observável que queremos determinar pela medição, fixa-se
uma classe de resultados possíveis para esse processo de medida. Mas o estado quântico atribu-
ído ao sistema só nos permite inferir que um destes resultados ocorrerá com uma certa probabi-
lidade. Só em casos muito excepcionais irá o estado quântico atribuir a probabilidade 1 a um re-
sultado possível e a probabilidade 0 a cada um dos restantes resultados possíveis. Logo, saber
que o sistema foi disposto de certa maneira num certo momento, e saber até que o sistema não
sofreu interferências num dado intervalo de tempo, não nos permitirá em geral prever que só se
irá obter um e apenas um valor de um observável se este for medido no fim do intervalo de
tempo.
Mas, como é claro, isto é ainda compatível com um mundo determinista. Pois apesar de o
estado quântico não determinar completamente qual dos resultados se irá obter, tal poderá ser
sempre determinado por algum factor que o estado quântico não tenha levado em linha de con-
ta. Há argumentos que visam convencer-nos de que a quantidade obtida numa medição não
pode ser concebida, em geral, como uma quantidade que o sistema possuía antes da medição.
Considere-se uma partícula que se sabe estar num estado de spin para a esquerda, por exemplo.
Se essa partícula for medida com um dispositivo de alinhamento horizontal, sabemos que a par-
tícula revelará com toda a certeza ter spin para a esquerda. Se medida com um dispositivo de
alinhamento vertical, metade das partículas revelarão spin para cima e metade para baixo. Mas
nenhuma partícula tem spin «definitivamente para a esquerda e definitivamente para cima»
nem «definitivamente para a esquerda e definitivamente para baixo». Seria pois enganador con-
ceber a colecção de partículas, antes da medição, como uma colecção em que 100% teriam spin
para a esquerda, 50% para cima e 50% para baixo. Considerações como esta levaram muitos es-
pecialistas a sugerir que o processo de medida não «determina um valor preexistente relativo a
uma quantidade», mas antes que «faz a quantidade passar a existir». Como veremos, mesmo
esta maneira de conceber a medição — pelo menos a concepção que faz dela uma espécie qual-
quer de processo causal que, quando actua sobre o sistema, faz o seu estado medido passar a
existir — tem dificuldades próprias.
No entanto, será que não podemos pensar que a partícula, antes de ser medida, está associa-
da a uma «variável oculta» que determina completamente o valor que constitui o resultado da
medição? Pensemos na partícula que tem spin para a esquerda. Não poderia haver outro factor
que fixasse a natureza da partícula de tal maneira que ao efectuar uma medição com um dispo-
sitivo de alinhamento vertical a encontrássemos no estado de spin para cima ou, alternativa-
mente, no estado de spin para baixo? Este factor não é tido em conta no estado quântico do sis-
tema, no facto de o sistema ter definitivamente spin para a esquerda. Se for efectuada uma me-
dição com um dispositivo de alinhamento vertical, o estado quântico de ter spin para a esquerda
gera as probabilidades apropriadas à descoberta de a partícula ter spin para cima ou para baixo.
Mas isso, só por si, não quer dizer que não exista um factor oculto, que tenha sido ignorado pelo
formalismo quântico. Bohr negou explicitamente que tal factor pudesse existir, insistindo em
que o estado quântico era uma descrição completa do sistema quântico. Mas a insistência dog-
mática, só por si, mesmo por parte de alguém tão conhecedor como Bohr, não é um argumento.
Einstein, como é sobejamente sabido, era inflexível na sua insistência em que o indeterminismo
do formalismo quântico indicava que a teoria estava incompleta. Einstein não podia acreditar,
afirmava, que Deus «jogasse aos dados» com o universo. Poderiam os estados quânticos, à se-
melhança dos estados estatísticos clássicos, ter subjacente a eles uma descrição mais minuciosa
que reintroduzisse o determinismo completo na descrição do mundo?
Para ver por que motivo muitos especialistas negaram a própria possibilidade de variáveis
ocultas que reintroduzissem o determinismo precisamos de seguir um extenso argumento que
foi desenvolvido ao longo de muitos anos. Precisamos primeiro da noção do valor expectável de
uma quantidade num dado estado quântico. Num estado quântico específico, um dado obser-
vável poderá ter muitos valores possíveis ao ser medido. Cada valor possível terá a sua proba-
bilidade de ocorrer. Multiplique-se cada valor pela sua probabilidade e somem-se os produtos
para cada um dos valores possíveis. O resultado é a média ou valor médio da quantidade me-
dida relativamente a um sistema no estado quântico dado, a que se chama o valor expectável
dessa quantidade nesse estado quântico.

148
Ora, algumas quantidades podem escrever-se como funções de outras quantidades. No caso
mais simples, por exemplo, o quadrado da quantidade de movimento de uma partícula é uma
função simples da sua quantidade de movimento. Algumas quantidades são funções de várias
quantidades distintas. Por exemplo, a energia total de uma partícula é a soma das suas energias
potencial e cinética. Ora, se o observável C for uma função dos observáveis A e B, por exemplo,
como se relacionará o valor expectável de C num dado estado com os valores de A e B? Se A, B e
C são susceptíveis de ser medidos simultaneamente, o valor expectável de C tem de ser certa-
mente a mesma função dos valores expectáveis de A e de B que a função que relaciona o obser-
vável C com os observáveis A e B. Pois poderíamos medir simultaneamente os valores de A, B e
C relativamente a um sistema e obter o valor C de duas maneiras diferentes: uma directamente
e outra calculando-o a partir dos valores obtidos de A e de B. Os resultados têm de ser consis-
tentes no que toca a quantidades susceptíveis de serem medidas simultaneamente.
Mas agora suponha-se que A, B e C não são susceptíveis de ser medidos simultaneamente.
No caso anteriormente referido, por exemplo, a energia total, a cinética e a potencial não são ge-
ralmente susceptíveis de ser medidas simultaneamente. A energia potencial é uma função da
posição e a cinética da quantidade de movimento, constituindo ambas exemplos típicos de
quantidades bohrianas complementares. Podemos dispor um sistema num dado estado quânti-
co. Terá então valores expectáveis relativos às energias potencial, cinética e total. Ainda que es-
tes não sejam susceptíveis de ser medidos simultaneamente, será o valor expectável da energia
total de sistemas que estejam nesse estado quântico, igual à soma do valor expectável da ener-
gia potencial desse estado quântico com o valor de expectativa da energia cinética do mesmo
estado quântico, uma vez que a energia total se exprime pela soma das energias potencial e ci-
nética? A resposta é «Sim», ainda que as quantidades não sejam susceptíveis de ser medidas
simultaneamente. É um teorema simples da teoria dos quanta: os valores expectáveis irão com-
portar-se deste modo no que respeita a todos os observáveis em qualquer estado quântico.
Mas agora estamos tão interessados em estados quânticos quanto em alegados estados sub-
jacentes mais «profundos», onde todas as variáveis ocultas que não são tidas em conta pelo es-
tado quântico tenham valores definidos. Para cada um destes estados, o resultado de qualquer
observação relativa à especificação do estado mais profundo é o de que um valor das quantida-
des observadas tem probabilidade 1 e todos os outros probabilidade 0. Poderão existir tais esta-
dos? Von Neumann concebeu um argumento para mostrar que não: partiu do princípio de que,
relativamente a tais estados de variável oculta, se verifica a mesma relação entre valores expec-
táveis do que a que se verifica entre estados quânticos — isto é, que o valor expectável de uma
quantidade C será a mesma função dos valores expectáveis das quantidades A e B que a função
que relaciona o observável C com os observáveis A e B. Este é o chamado «pressuposto da linea-
ridade». Dado este pressuposto, von Neumann foi capaz de demonstrar que a existência de tais
estados de variável oculta teria como resultado a violação das inter-relações das probabilidades
no que respeita a resultados previstos pela mecânica quântica. Postular variáveis ocultas seria,
pois, incompatível com as previsões feitas pela mecânica quântica. Este é um argumento a favor
da ideia de que as variáveis ocultas não existem. Defende que não se trata apenas de a teoria
quântica não fazer previsões deterministas sobre os sistemas. O que se defende é que se houves-
se tal nível subjacente de valores de parâmetros completamente determinantes, ainda que nós
não os conhecêssemos, a sua própria existência asseguraria que as previsões estatísticas real-
mente feitas pela mecânica quântica teriam de estar erradas.
Durante muitos anos o argumento de von Neumann foi encarado por muitos especialistas
como uma refutação decisiva da compatibilidade entre o determinismo e a mecânica quântica.
Defendia-se que von Neumann nos tinha mostrado que se o determinismo fosse verdadeiro, a
mecânica quântica teria de estar errada. A mecânica quântica não podia, pois, ser encarada co-
mo uma teoria estatística que se baseava numa concepção determinista do mundo que lhe esti-
vesse subjacente, do mesmo modo que se pensa que a mecânica estatística clássica se baseia
numa dinâmica determinista subjacente dos microestados dos sistemas que descreve.
Mais tarde, contudo, levantaram-se dúvidas sobre a legitimidade da demonstração de von
Neumann da inexistência de variáveis ocultas — não quanto ao seu raciocínio matemático, cla-
ro, mas quanto à legitimidade de uma suposição básica da qual aquele depende. Trata-se da su-
posição da linearidade, quando esta é alargada dos estados quânticos para os estados de variá-

149
vel oculta — em particular, quando é aplicada a observáveis que não podem ser medidos simul-
taneamente. Será assim tão óbvio que tenha de ser verdade que, mesmo relativamente a obser-
váveis que não podem ser medidos em simultâneo, o valor expectável de C num dado estado de
variável oculta tenha de ser a soma dos valores expectáveis de A e B, desde que o observável C
seja a soma dos observáveis A e B? Será que não podemos imaginar que as coisas são de outra
forma? Por exemplo: dado um estado de variável oculta, todo o sistema que se encontre no
mesmo estado de variável oculta, apresentará o mesmo valor, determinado, quando a energia
total for medida. Apresentará também o mesmo valor, determinado, quando a energia potencial
for medida. E o mesmo valor, determinado, quando a energia cinética for medida. Mas a ener-
gia total dos sistemas nesse estado não será a soma das energias potencial e cinética. Se pudés-
semos determinar simultaneamente todos estes valores relativamente a um único sistema, isto
pareceria absurdo mas, como Bohr sempre insistiu, não podemos efectuar as três medições num
e num só momento em nenhum sistema.
A ideia de que a suposição de von Neumann era excessivamente forte recebeu uma confir-
mação complementar. O seu próprio resultado mostrava que as variáveis ocultas nunca seriam
possíveis, nem mesmo no caso das mais simples quantidades observáveis possíveis. No entanto,
para os casos mais simples, podem, na verdade, construir-se teorias do tipo variável oculta. Con-
sidere-se, uma vez mais, a partícula que só pode ter dois estados de componentes de spin numa
dada direcção, como o electrão que tem de apresentar um valor de componente de spin que seja
para cima ou para baixo em qualquer direcção que escolhamos medir. Considere-se um feixe
composto por electrões que tenham spin definitivamente para a esquerda. Se os fizermos passar
por um dispositivo de medida de alinhamento de orientação vertical, medindo a sua compo-
nente de spin em ângulos rectos em relação à direcção conhecida do seu spin — para a esquer-
da —, metade deles apresentarão spin para cima e a outra metade para baixo. A direcção verti-
cal é perpendicular à horizontal. Escolha-se qualquer outra direcção diferente das horizontal e
vertical. A teoria quântica atribuirá probabilidades definidas à componente de spin dos electrões
vindos de uma das duas direcções possíveis ao longo do novo eixo escolhido.
Acontece que se pode oferecer uma teoria de variável oculta muito simples para acomodar
as relações probabilísticas entre estas componentes de spin no caso de uma única partícula cuja
componente de spin numa direcção dada só possa ter um de dois valores (para cima ou para
baixo nessa direcção), como é o caso do electrão. Suponha que a partícula tem spin definitiva-
mente para a esquerda. Podemos então imaginar outro parâmetro que descreva a partícula; o
valor do parâmetro pode variar num dado domínio. Escolha agora qualquer direcção a usar pa-
ra medir a componente de spin. Suponha que se o parâmetro oculto se situar num certo subcon-
junto do seu domínio, se descobrirá que a partícula terá spin para cima na direcção em causa.
Podemos construir um modelo com as seguintes características: para cada direcção na qual se
meça o spin e para cada resultado possível dessa medição, para cima ou para baixo nessa direc-
ção, atribui-se um conjunto de valores do parâmetro oculto. Quando a partícula tem um spin de-
finido numa direcção, determina-se uma distribuição de probabilidades dos valores do parâme-
tro oculto. A probabilidade de se descobrir que uma partícula tem spin para cima, digamos,
numa dada direcção, será então a probabilidade, de acordo com esta distribuição, de o valor do
parâmetro se situar na sub-região dos valores do parâmetro que correspondem a este resultado
nesta direcção. Uma e uma só distribuição de probabilidade para o parâmetro oculto dará a
probabilidade correcta para cada resultado em cada direcção possível, tal como a mecânica
quântica prevê. Por outras palavras, para o caso especial de uma única partícula que só tenha
dois estados possíveis de componente de spin em qualquer direcção, todas as previsões probabi-
lísticas da mecânica quântica podem, na verdade, ser duplicadas por um modelo simples de va-
riável oculta no qual cada resultado é determinado pelo valor que a variável oculta tem num
caso particular. Assim, as probabilidades de obter um dado resultado no que respeita a um sis-
tema num determinado estado quântico serão simplesmente fixadas pela probabilidade de o va-
lor da variável oculta subjacente se situar no subdomínio apropriado de valores de variável
oculta possíveis.
Ora, neste argumento nada pretende mostrar que os resultados da mecânica quântica relati-
vos a este caso especial se explicam, de facto, por uma qualquer variável oculta física e real. Ao
invés, o argumento pretende mostrar que é consistente postular, neste caso especial, um modelo

150
determinista e de variável oculta para os fenómenos e para as previsões probabilísticas da me-
cânica quântica. Mas se entendêssemos o argumento de von Neumann como conclusivo, se ti-
véssemos de admitir o seu fortíssimo postulado, as variáveis ocultas não seriam consistentes
com os resultados da mecânica quântica — mesmo neste caso simples de uma única partícula
com apenas dois valores possíveis de componente de spin em qualquer direcção. Logo, o argu-
mento parece mostrar que a suposição de von Neumann é demasiado forte para ser legítima.
Mas isto não é certamente o fim da história. Se von Neumann postula demasiado na sua de-
monstração da «impossibilidade das variáveis ocultas», talvez um argumento que postule me-
nos — na verdade, um argumento que só admita postulados que pareçam intuitivamente neces-
sários para qualquer genuína teoria de variáveis ocultas — sirva para fundamentar a demons-
tração da sua impossibilidade de forma mais sólida. Já se construíram, de facto, tais argumen-
tos. Suponha que as variáveis ocultas existem. Então, em qualquer estado que especifique com-
pletamente os valores de todas as variáveis ocultas, deveremos obter a completa especificação
de todos os resultados de um conjunto de observações — que possam ser todas realizadas simul-
taneamente. Isto é, se há um conjunto máximo de medições simultâneas possíveis (ou grupo de
conjuntos), para cada um desses conjuntos de medições possíveis o valor das variáveis ocultas
devia determinar a ocorrência de um e apenas um resultado de cada medição. Estes resultados
têm de ser compatíveis com as previsões da mecânica quântica, se quisermos que a teoria das
variáveis ocultas subjaza à mecânica quântica e não que a substitua, rejeitando-a como falsa.
Poderá existir uma teoria de variáveis ocultas com estas características? Repare-se que não es-
tamos a postular a ideia de von Neumann de que, mesmo nos estados de variáveis ocultas e no
que respeita a observáveis incompatíveis, se verificará a relação de linearidade entre valores ex-
pectáveis. Tudo o que postulamos é que se verificarão as relações da mecânica quântica entre os
resultados de qualquer conjunto de medições que sejam simultaneamente realizáveis. E este
postulado aplica-se a cada um desses conjuntos de observações simultaneamente realizáveis.
Um teorema de Gleason e, de forma mais directa, o trabalho de Kochen e Specker, mostram
que nenhuma teoria de variáveis ocultas respeita nem mesmo esta exigência mais modesta. O
trabalho destes autores mostra que nenhuma teoria de variáveis ocultas conseguirá reproduzir
os resultados da mecânica quântica relativamente a qualquer sistema para além do sistema já
discutido: a partícula única com dois resultados possíveis relativamente a uma observação. Para
esse caso mais simples sabemos que um modelo de variáveis ocultas é consistente com a mecâ-
nica quântica. Mas mesmo para o caso mais simples seguinte não descobriremos nenhuma teo-
ria de variáveis ocultas que respeite a exigência referida.
Uma ilustração do teorema, devida a Kochen e Specker, dará ao leitor uma ideia básica de
como a demonstração funciona, apesar de os pormenores da demonstração não serem aqui
apresentados. Seja um sistema que tem as seguintes características: a medição da componente
de spin do sistema elevada ao quadrado apresentará em qualquer direcção ou o valor 1 ou o va-
lor 0. Para qualquer conjunto de três direcções, estando cada uma delas em ângulo recto relati-
vamente às outras duas, o sistema terá, ao ser medido, um valor de spin elevado ao quadrado
igual a 1 em duas das direcções e igual a 0 na direcção restante. E para qualquer um destes con-
juntos de três direcções perpendiculares entre si, as três medições são, de acordo com a teoria
dos quanta, simultaneamente executáveis. Será que podem existir variáveis ocultas que caracte-
rizem mais completamente o sistema, indo além da caracterização quântica que nos fornece as
relações entre valores apresentadas acima, mas que só conduza a atribuir a probabilidade de 1
ou 0 numa dada direcção? Para uma dada distribuição de variáveis ocultas a questão de saber
se uma dada direcção tem o valor 1 ou 0 tem de estar completamente determinada, e esta carac-
terização mais completa do sistema tem de obedecer às relações quânticas entre valores apre-
sentadas acima.
Não é possível uma tal teoria de variáveis ocultas. O argumento que sustenta esta afirmação
só usa resultados da geometria elementar. Podemos mostrar que é pura e simplesmente impos-
sível atribuir às direcções os valores 1 e 0 (ou qualquer outro par de valores diferentes) a partir
de um ponto dado de modo a que, para qualquer conjunto de três de direcções perpendiculares
entre si, se atribua a duas delas o valor 1 e à outra 0. Logo, nenhuma teoria de variáveis ocultas
poderia determinar completamente o valor correcto do valor de spin elevado ao quadrado para
todos os conjuntos de três direcções mutuamente perpendiculares. E nenhuma teoria de variá-

151
veis ocultas pode ser tal que as relações da mecânica quântica se verifiquem entre os resultados
de todos os conjuntos de medições simultâneas que pudéssemos fazer sobre o sistema.
No entanto, o proponente da perspectiva de que a mecânica quântica é uma teoria estatística
incompleta que exige uma teoria determinista subjacente e completa não irá desistir assim tão
facilmente. Se examinarmos como funciona a demonstração anterior da inexistência de variá-
veis ocultas, descobriremos que o passo fundamental consiste em notar que, a partir de um pon-
to, qualquer direcção pode ser considerada um membro de inúmeros conjuntos de três direc-
ções perpendiculares. Logo, o valor da quantidade medida numa direcção tem de ser consisten-
te, de acordo com as previsões da mecânica quântica, com os valores em duas outras direcções
perpendiculares à primeira, relativamente a muitos conjuntos de três direcções. É por causa dis-
to que a demonstração pode evidenciar a inconsistência das variáveis ocultas com a mecânica
quântica. Se começarmos com uma atribuição de 1, 1 e 0 a três direcções perpendiculares, po-
demos encontrar vários conjuntos de três de direcções que contêm uma ou mais das direcções
do conjunto original. Seguidamente, continuamos este processo até sermos forçados a atribuir o
valor 0 a uma direcção a que originalmente atribuímos 1. (Veja-se a figura 4.7.)

============================================
INSERIR A FIGURA DA PÁGINA 212 COM A SEGUINTE LEGENDA:

Figura 4.7 Um sistema usado num argumento contra as variáveis ocultas. Há um sistema quântico em
que uma certa quantidade, relativamente a quaisquer três direcções mutuamente perpendiculares, tem de
ter valor 0 numa das direcções e 1 nas outras duas. Poderá um único conjunto de variáveis ocultas deter-
minar todos esses valores? O argumento que defende que sim apoia-se no facto de qualquer direcção dada
pertencer a inúmeros conjuntos de três de direcções perpendiculares entre si. Por exemplo, z, na figura,
pertence ao triplo (z, x, y) mas também ao triplo (z, x', y'). Podemos mostrar que é impossível atribuir zeros
e uns a todas as direcções a partir de um ponto de maneira a que, para cada conjunto de três de direcções
perpendiculares entre si, uma direcção receba o valor 0 e as outras duas 1. Mas ao passo que os valores ao
longo de quaisquer três direcções perpendiculares são «susceptíveis de ser medidos simultaneamente» (ao
longo de z, x e y, digamos), os valores não serão em geral susceptíveis de ser medidos simultaneamente ao
longo de, digamos, x e x'. Isto conduz a uma perspectiva das variáveis ocultas na qual os valores determi-
nados podem variar em função do conjunto escolhido de medições simultaneamente possíveis.
===========================================

E se declararmos que o valor da quantidade medida numa dada direcção, valor relativo a
uma escolha das duas direcções perpendiculares, não é, pura e simplesmente, a mesma quanti-
dade física do que o valor relativo a outra escolha de duas direcções perpendiculares? Nesse ca-
so, ter esse valor 1 para cada uma de tais quantidades físicas «relativas» e 0 para a outra não se-
rá uma contradição óbvia. Mas como poderíamos, de um ponto de vista físico, defender que tal
relativização da quantidade em questão é razoável? A resposta reside no seguinte: apesar de os
valores da quantidade nas três direcções perpendiculares serem todos susceptíveis de ser medi-
dos simultaneamente, os valores dessa quantidade noutras direcções não são necessariamente
susceptíveis de ser medidos simultaneamente com as três quantidades em conjunto. Assim,
apesar de podermos determinar três valores em três direcções perpendiculares numa medição,
não poderíamos determinar simultaneamente todos os valores de todas as direcções. Logo, a
mudança de um dispositivo de medida (que tenha medido o valor numa direcção, A, ao mesmo
tempo que determinava o valor dessa quantidade noutras duas direcções, B e C) para outro dis-
positivo diferente (necessário para medir o valor na direcção A e em duas direcções perpendicu-
lares em relação a A mas diferentes de B e C, chamemos-lhes D e E) deve afectar causalmente o
sistema. O resultado seria então que o valor da quantidade na direcção A relativa à medição de
B e C seria determinado pelas variáveis ocultas subjacentes de forma diferente da maneira pela
qual a quantidade na direcção A é determinada por essas variáveis ocultas quando os valores na
direcção D e E estão também a ser medidos. Não poderemos imaginar que a própria mudança
de dispositivo de medida, que actua sobre o próprio dispositivo, interage causalmente com as
variáveis ocultas do sistema, provocando assim a diferença? Afinal, o resultado da medição do
valor na direcção A é o resultado causal conjunto das variáveis ocultas tanto do sistema como
do dispositivo de medida. Logo, medir A em conjunção com uma medição de B e C pode muito
bem dar um valor na direcção A diferente do obtido por meio da medição do valor na direcção

152
A em conjunção com uma medição na direcção D e E. Mesmo assim, em ambos os casos, os va-
lores das variáveis ocultas subjacentes determinariam completamente todos os valores medidos.
Se adoptarmos tal perspectiva «contextual» da natureza de uma quantidade medida, a de-
monstração resumida acima — a demonstração de que as inter-relações entre valores medidos
previstos pela teoria dos quanta são incompatíveis com qualquer possibilidade de esses valores
serem completamente determinados por valores subjacentes de parâmetros ocultos — não co-
lhe. Poderemos encontrar outro tipo de demonstração da inexistência de variáveis ocultas que
seja imune ao tipo de raciocínio usado acima para fazer o contextualismo não parecer muito
implausível de um ponto de vista determinista e causal? A resposta é «Sim» e é para esses ar-
gumentos que nos voltamos agora.

A inseparabilidade dos sistemas

O argumento de Einstein, Podolsky e Rosen

Bohr e Einstein representaram, separadamente, os mais eminentes porta-vozes de duas


perspectivas opostas sobre a teoria dos quanta. Para Bohr, esta teoria fornecia uma descrição úl-
tima do mundo. Sem dúvida que qualquer perspectiva quântica do mundo precisava de ser
complementada com as teorias que nos dizem que tipos de forças actuam entre as partículas
elementares — os constituintes básicos do mundo — mas, quanto à descrição subjacente dos es-
tados básicos da natureza e da sua evolução dinâmica, a descrição quântica era o nível mais
fundamental possível. Se preparássemos um sistema de modo a ficar num dado estado quântico
— por meio de um daqueles tipos de medições que determinam, relativamente ao sistema em
causa, após a medição, os valores de alguns elementos de um conjunto de observáveis compatí-
veis e susceptíveis de serem medidos simultaneamente —, esse estado quântico constituiria
uma descrição completa do estado do sistema após o processo de preparação. Quaisquer infe-
rências a retirar quanto aos resultados possíveis de uma futura medição do sistema, ou quanto à
probabilidade de ocorrência desses resultados, teriam de se basear no nosso conhecimento do
estado quântico do sistema. Se estas inferências respeitantes a resultados posteriormente medi-
dos forem, na melhor das hipóteses, probabilísticas, como geralmente acontece na mecânica
quântica, que o sejam. A mecânica quântica mostrou-nos que o mundo era, ao mais profundo
nível, genuinamente indeterminista. Contrariamente ao ideal determinista — apoiado pelo me-
nos em parte, como vimos, pelos resultados da física clássica — a natureza do mundo era irre-
dutivelmente «tiquista» ou aleatória.
Einstein, pelo contrário, mostrou-se inflexível na sua perspectiva de que a mecânica quântica
não poderia ser uma teoria completa do mundo. Deveria entender-se a mecânica quântica, en-
quanto teoria estatística, que faz, na melhor das hipóteses, previsões probabilísticas sobre o
mundo, como exigindo uma teoria determinista dos sistemas que se apoie numa descrição a um
nível mais profundo do que o fornecido pela descrição quântica. Um sistema num estado quân-
tico tinha pois de depender de outros factores, ainda que não soubéssemos quais nem quais os
valores específicos das características ocultas que o sistema em causa possuía. Estes factores
subjacentes determinariam com toda a certeza o resultado de qualquer medição aplicada ao sis-
tema; e as previsões meramente probabilísticas feitas a partir do estado quântico do sistema te-
riam de ser encaradas como um reflexo do facto de o estado quântico só fornecer uma descrição
parcial, e não completa, do estado do sistema.
Para Bohr, um processo de medida fazia o valor da quantidade medida «passar a existir».
Antes da medição, o sistema não tinha o valor da quantidade medida — a não ser que estivesse
num estado quântico muito especial, no qual esse valor se apresentasse à partida com grau de
completa certeza ao ser medido. E antes da medição o sistema não era caracterizável por quais-
quer outros parâmetros ocultos que determinassem completamente que o resultado obtido de
facto era o que seria obtido quando o sistema interagisse com o dispositivo de medida apropri-
ado. Para Einstein isto era inaceitável. Se o sistema revelasse ter um valor específico aquando da
medição, teria de haver algo no mundo — algo que caracterizasse o estado anterior do sistema

153
(e, porventura, o dispositivo de medida) — que explicasse por que razão o resultado era aquele
e não outro qualquer dos resultados possíveis.
Em 1935 Einstein, em colaboração com Podolsky e Rosen, publicou um influente artigo que
procurava lançar dúvidas sobre a maneira bohriana de ver as coisas. Este artigo inspirou uma
longa discussão do género de «experiência mental» proposta por Einstein. Em última análise,
estes estudos conduziram a uma série de resultados que parecem levantar as mais graves difi-
culdades a uma compreensão da mecânica quântica do ponto de vista einsteiniano.
A ideia de Einstein é considerar um sistema com duas componentes, que podem ser, por
exemplo, duas partículas nucleares num núcleo. Podemos construir sistemas de modo a que o
valor de uma grandeza de uma das partículas no sistema combinado esteja exactamente corre-
lacionado com o valor dessa grandeza no caso da outra componente. Na verdade, o sistema po-
de ser tal que, para toda uma família de propriedades, se a partícula 1 tiver um dado valor no
que respeita a uma das propriedades da família, a 2 terá de ter um e apenas um valor correlaci-
onado com esse no que respeita à mesma propriedade. Einstein usou originalmente as caracte-
rísticas da posição e da quantidade de movimento para o seu modelo, mas nós usaremos, em
vez disso, o modelo de duas partículas com spins correlacionados. Este é o sistema habitualmen-
te usado para explicar a experiência mental e as suas consequências. As partículas podem ser,
por exemplo, electrões que possuam as habituais propriedades de spin mencionadas nas secções
anteriores. Para qualquer direcção dada, a componente de spin para cada partícula terá um de
dois valores, ou «para cima» nessa direcção ou «para baixo» nessa mesma direcção. Os sistemas
combinados que nos vão interessar são os que estão num estado «singleto». Neste estado, as
partículas estão correlacionadas de tal modo que se o spin de uma é para cima numa dada di-
recção, o spin da outra tem de ser para baixo na mesma direcção. (O nome «singleto» tem ori-
gem na espectroscopia, na qual os estados singletos correspondem a linhas de espectro que se
mantêm juntas quando o sistema é colocado num campo magnético exterior. Outros sistemas
combinados podem estar, por exemplo, num estado «tripleto», no qual a linha de espectro se
divide em três quando o sistema é colocado num campo magnético.)
Seguidamente, devemos imaginar que o sistema combinado se divide nas suas duas compo-
nentes, cada uma das quais se desloca no espaço até as partículas originalmente componentes
passarem a constituir duas partículas completamente separadas no espaço. Ao mesmo tempo, a
cisão deve ser feita por um método que não perturbe as correlações de spin que as partículas
têm entre si, através de uma intervenção física apropriada. Nestas circunstâncias, qual será a
descrição correcta das partículas, de acordo com a mecânica quântica, depois de estas terem si-
do cindidas? A resposta é esta: têm de ser ainda conjuntamente consideradas um sistema com-
binado num estado de spin singleto. Propriamente falando, não há qualquer estado quântico pa-
ra uma partícula que negligencie a outra, apesar de se poder construir, para alguns fins, uma
espécie de estado «reduzido» para uma sem a outra. (Veja-se a figura 4.8.)

===========================================
INSERIR A FIGURA DA PÁGINA 215 COM A SEGUINTE LEGENDA:

Figura 4.8 A inseparabilidade dos sistemas quânticos. Em (a) exibe-se um sistema composto por duas
partículas (P1 e P2). O sistema tem uma natureza tal que os valores de spin das partículas, em qualquer di-
recção, irão revelar, se forem medidos, direcções opostas entre si, seja qual for o eixo escolhido para fazer a
medição. Em (b) cindem-se as partículas e enviam-se em direcções opostas. A cisão é feita de modo a que
as partículas mantenham a «anticorrelação» de spin entre elas. Podemos escolher medir o spin da partícula
P1 em qualquer direcção, usando o detector D1, e medir o spin da partícula P2 também em qualquer direc-
ção usando o detector D2. Os valores obtidos exibem entre si relações definidas de correlação probabilística
na mecânica quântica. Podemos mostrar que nenhum postulado de qualquer conjunto de variáveis ocultas
que determine os resultados das medições em D1 e D2, seja qual for a medição escolhida em cada caso,
produzirá as previsões certas para as probabilidades de todas as correlações previstas pela mecânica quân-
tica. Além disso, é agora difícil de conceber que a escolha da medição relativa a uma das partículas afecte a
variável oculta que determina o resultado da medição da outra partícula, pois as duas medições são reali-
zadas a uma distância tão grande no espaço e a uma tão grande proximidade no tempo que tornam a inte-
racção causal entre elas impossível.
============================================

Quais são as previsões que podemos fazer sobre medições de spin das partículas, dado o seu
estado quântico correlacionado? Bem, em relação a qualquer direcção podemos prever a proba-

154
bilidade de uma das partículas ter spin para cima ou para baixo, se o seu spin for medido nessa
direcção. Neste caso, cada uma dessas probabilidades é de 1 2 . Estas probabilidades deduzem-se
do estado quântico total do sistema combinado e dos estados que podemos atribuir a cada par-
tícula individualmente. Mas a natureza do estado correlacionado revela-nos algo mais: a corre-
lação perfeita das partículas. Independentemente da distância entre as partículas —
presumindo que não ocorre nenhuma interacção, a partir do exterior, entre a cisão do sistema
original e as medições efectuadas — podemos sempre inferir que se uma medição indicar que
uma partícula tem spin para cima numa dada direcção, teremos a certeza de que a outra partícu-
la terá spin para baixo (se for medido na mesma direcção). Além disso, se medirmos o spin uma
partícula numa dada direcção e anotarmos o resultado, encontraremos, em qualquer outra di-
recção escolhida, probabilidades definidas para o resultado de uma medição do spin da outra
partícula. Estas probabilidades condicionais do resultado de uma medição da segunda partícu-
la, dado o resultado de uma medição do spin da primeira, deduzem-se do estado quântico do
sistema combinado; e são eliminadas nas descrições reduzidas susceptíveis de serem construí-
das para as partículas tomadas uma de cada vez — razão pela qual essas descrições reduzidas
não conseguem especificar o estado quântico completo do mundo.
Ora, Einstein convida-nos a olhar, do ponto de vista bohriano, para o estado da segunda par-
tícula antes e depois de o estado da primeira ser determinado por uma medição. De acordo com
Bohr, antes de uma medição ter tido lugar, nenhuma das partículas tem um spin definido. Nem
têm, ainda de acordo com ele, qualquer propriedade que pudesse determinar que viriam a ter
um valor específico de spin numa direcção determinada, caso fossem medidas. Ao invés, antes
da medição, as partículas podem vir a exibir um dado valor de spin numa certa direcção com a
probabilidade 1 2 , juntamente com a possibilidade de ter, caso ambas as partículas sejam medi-
das, valores de spin correlacionados do modo descrito por uma função de onda de estado sin-
gleto. Mas suponha-se que medimos o spin da primeira partícula numa dada direcção, digamos,
A. Suponha-se que obtemos o valor «para cima». Nesse preciso instante, de acordo com Bohr, a
segunda partícula, ainda que esteja a anos-luz de distância, «salta» instantaneamente para o es-
tado quântico apropriado de modo a ter o seu spin «para baixo» na direcção A. Isto é verdade
porque mal se tenha determinado que a primeira partícula tem spin para cima na direcção A, é
certo que a segunda terá spin para baixo nessa direcção; e a única função de onda que atribui
essa probabilidade à segunda partícula será uma função de onda «pura para baixo na direcção
A». Esta função de onda para a segunda partícula é muito diferente de lhe atribuir uma função
de onda prévia apropriada que tome em consideração que esta é parte de um sistema combina-
do num estado singleto.
Ora, afirma Einstein, se concebermos a função de onda como uma caracterização física com-
pleta da partícula, este tipo de mudança é absurdo. Bohr concebe a medição como algo que faz
um valor determinado de uma grandeza do sistema «passar a existir» — valor esse que não
existia antes da medição ter tido lugar — e não como algo que revela um valor preexistente (ou
pelo menos pré-determinado) para essa quantidade. Isto pode ser plausível se interagirmos fisi-
camente com o sistema quando o medimos, mas parece absurdo se deixarmos o sistema ficar
completamente entregue a si mesmo ao fazermos a medição. E é isso que acontece no caso do
sistema composto sob consideração. Medimos o valor do spin da segunda partícula fazendo o
nosso dispositivo de medição interagir com a primeira partícula. A medição que efectuamos de-
termina o valor do spin na direcção A da primeira partícula. Isso diz-nos imediatamente qual é o
valor do spin da segunda, isto é, que valor de spin na direcção A apresentaria agora uma medi-
ção da segunda partícula. Mas uma vez que no processo de medição não fizemos absolutamente
nada, em termos físicos, à segunda partícula, seja o que for que determine que ela terá um valor
do spin definido na direcção A (caso seja medida) terá de ser uma verdade relativamente à segunda
partícula antes de medirmos a primeira. Mas, antes de medirmos a primeira partícula, a função de
onda que as descrevia a ambas não atribuía à segunda partícula um valor de spin definido na
direcção A. E, repito, a segunda partícula tinha de ter um valor de spin determinado na direcção
A mesmo antes da nossa medição da primeira. Logo, concluem Einstein e os seus colaboradores,
o estado quântico do sistema correlacionado anterior à medição não continha uma descrição
completa do estado efectivo do mundo. Não atribuía à segunda partícula, por exemplo, a possi-

155
bilidade de exibir um e apenas um valor de spin na direcção A — uma possibilidade que ela de-
via possuir «desde o princípio», de acordo com o argumento acabado de apresentar.
Einstein e os seus colaboradores concluem, pois, que a mecânica quântica é uma teoria in-
completa. A função de onda, defendem eles, tem de ser encarada como algo que representa não
todo o estado físico de um sistema mas apenas o nosso conhecimento parcial desse estado. A
mudança instantânea da função de onda aquando da medição deixa de ser misteriosa. Suponha
que sabemos que uma moeda ou está dentro de uma caixa de fósforos aqui na Terra ou está
numa caixa de fósforos num planeta do sistema de Alfa Centauro. Podemos representar esta si-
tuação por uma função de probabilidade que atribua, digamos, a probabilidade 1 2 a cada pos-
sibilidade. Ao olharmos seguidamente para o interior da caixa de fósforos aqui da Terra vemos
a moeda. Claro que a probabilidade de a moeda estar na outra caixa de fósforos cai imediata-
mente para 0. Mas isto não é uma misteriosa mudança física da caixa de fósforos desse planeta
distante; é apenas uma mudança do que sabemos sobre ela. Ora, se a caixa de fósforos distante
se revela vazia, terá de ter já estado vazia ainda antes de olharmos para o interior da caixa de
fósforos da Terra.
Bohr não aceita este argumento. É verdade, responde ele, que a função de onda atribuída a
um sistema é relativa a uma medição. Antes de se ter medido a primeira partícula, a função de
onda apropriada para caracterizar a segunda é aquela que a caracterizar como uma componente
do sistema original correlacionado de estado singleto. Relativamente à medição original, esta é a
função de onda correcta para descrever o mundo. Depois de a primeira partícula ter sido medi-
da e de se ter descoberto ter um valor definido de spin na direcção A, a função de onda correcta
para descrever o mundo é a que atribui a cada partícula um spin definido na direcção A; atribui
à primeira o valor de spin determinado pela medição e à segunda o valor de spin que tem de ter
por causa da correlação perfeita dos spins das duas partículas. Logo, a medição da primeira par-
tícula altera realmente a função de onda atribuída à segunda. Mas isto não implica que a função
de onda seja meramente um sumário do nosso conhecimento e não uma completa especificação
do estado físico, nem que a medição da primeira partícula exerça um efeito «causal» na segun-
da. Ao invés, trata-se de uma característica da dependência da função de onda do processo de
medida. É a este aspecto relacional da mecânica quântica — o de os estados só existirem relati-
vamente a medições — que Bohr lança mão na sua explicação da situação, argumentando que a
dependência da função de onda face à medição efectuada é algo análogo à dependência do
comprimento de uma barra relativamente ao estado de movimento de um observador (na teoria
da relatividade). A mudança do nosso estado de movimento relativamente à barra muda o
comprimento da barra relativamente a nós enquanto observadores. Mas este fenómeno não é
uma mudança causal na barra, como a teoria do éter diria. Nem é verdade que o comprimento
seja uma característica subjectiva da barra. O comprimento é relativo ao sistema de referência.
Analogamente, defende Bohr, a função de onda é física mas relativa.

O teorema de Bell

Poderá algum argumento ajudar a determinar qual destas atitudes em relação à função de
onda é a correcta? Podemos pelo menos ter a esperança de fazer o seguinte: talvez sejamos ca-
pazes de determinar se o postulado das variáveis ocultas que fixam individualmente os estados
dos dois sistemas separados, tal como o estado da partícula distante independentemente da
medição que resolvermos fazer à partícula mais próxima, será consistente com todas as previ-
sões probabilísticas feitas pela mecânica quântica. Voltamo-nos agora para a tese de que tal pos-
tulado — que está em harmonia com a perspectiva de Einstein sobre a função de onda, segundo
a qual esta é uma descrição incompleta do mundo à qual subjaz um nível de descrição mais
completo e determinista, quer tenhamos conhecimento dele quer não — não é, de facto, consis-
tente com a mecânica quântica. O teorema de Bell e algumas das suas extensões foram concebi-
dos para mostrar que a perspectiva que Einstein sugere ser a forma correcta de compreender a
função de onda atribuída a sistemas correlacionados não pode, na verdade, estar correcta.
Como funciona a demonstração? Para começar, partamos do princípio que Einstein tem ra-
zão. No caso das duas partículas correlacionadas com os valores de spin possíveis tal como já os
descrevemos, suponhamos que mal as partículas se separam uma da outra, cada uma delas

156
transporta consigo o valor de um parâmetro oculto. O valor do parâmetro oculto associado a
uma partícula irá determinar completamente, em relação a essa partícula, se ela vai revelar um
spin para cima ou para baixo, relativamente a qualquer medição que sobre ela incida e em qual-
quer direcção que escolhamos. Admitamos também que os acontecimentos muito distantes no
espaço e muito próximos no tempo — de modo a que, pela teoria da relatividade nenhum sinal
causal possa ser enviado de um para outro — não podem afectar-se mutuamente. Uma conse-
quência disto é a seguinte: suponha que medimos a segunda partícula na direcção B. O resulta-
do desta medição não pode depender de qualquer escolha da nossa parte relativa à direcção em
que escolhemos medir o spin da primeira partícula. Afinal, poderíamos preparar as duas medi-
ções depois de as partículas estarem separadas por uma certa distância, de modo a que uma
medição não pudesse afectar causalmente a outra. Logo, a escolha da direcção na qual iremos
medir o spin da primeira partícula não devia ter absolutamente nenhum efeito sobre o resultado
de uma medição do spin da segunda na direcção escolhida para esta medição.
Suponha agora que escolhemos fazer este tipo de pares de medições numa grande classe de
partículas, todas dispostas da mesma maneira, com as mesmas correlações de spin previstas pe-
la mecânica quântica. Cada resultado será completamente determinado pelo valor do parâme-
tro oculto transportado por cada uma das partículas em cada uma das experiências. As probabi-
lidades dos resultados das medições de uma das partículas serão independentes da medição de
spin efectuada na outra. A probabilidade de se obter um dado valor numa medição do spin de
uma partícula dada numa dada direcção deveria, pois, depender apenas da probabilidade de
distribuição, para cada partícula, dos vários valores possíveis dos parâmetros ocultos.
Introduza-se agora a seguinte notação: ( , , ; , , ) é um símbolo com seis lugares vazios. Os
três lugares antes do ponto e vírgula correspondem à primeira partícula, os outros à segunda.
Cada um dos três lugares de cada um dos lados do ponto e vírgula corresponde a uma direcção,
A, B e C. Iremos considerar medições da componente de spin de cada partícula em cada uma
destas direcções. Um símbolo + num lugar significa que os parâmetros ocultos obrigam essa
partícula a ter um valor de spin para cima nessa direcção. Um – significa que terá um spin para
baixo. (Qual das duas direcções conta como para cima ou para baixo em relação a cada uma das
direcções A, B e C é arbitrário.) Um 0 num lugar significa que o parâmetro oculto tem um valor
que determina que o spin nessa direcção será para cima ou para baixo, isto é, qualquer valor
consistente com os + e – atribuídos aos outros lugares. Não se esqueça que as partículas têm
uma correlação perfeita, de forma que se surgir um +, digamos, no primeiro lugar à esquerda
do ponto e vírgula, isso irá forçar o primeiro lugar à direita do ponto e vírgula a ter o valor –.
Por exemplo, o símbolo (+,0,0;0,0,+) representa a probabilidade de uma medição sobre a primei-
ra partícula na direcção A conduzir a um valor do spin para cima nessa direcção, e de uma me-
dição da segunda partícula na direcção C conduzir a um valor do spin para cima nessa direcção.
Considere-se a seguinte equação:

Eq. A-C: (+,0,0;0,0,+) = (+,+,–;–,–,+) + (+,–,–;–,+,+)

Apoiamo-nos aqui nos seguintes dois argumentos: 1) se o valor de uma partícula numa dada
direcção for +, o valor da outra partícula na mesma direcção terá de ser –; 2) dados os valores
determinados dos spins da primeira e segunda partículas nas direcções A e C, só restam duas
possibilidades no que respeita ao valor desses spins na direcção indeterminada B. Porque todas
estas probabilidades estão bem definidas e são independentes da medição que escolhermos fa-
zer em qualquer das partículas, é evidente (com base em postulados elementares da teoria de
probabilidades) que a probabilidade total de a primeira partícula ter spin + na direcção A e a se-
gunda ter também spin + na direcção C é igual à soma da probabilidade de isso acontecer e de
também a primeira partícula ter spin + na direcção B (tendo a segunda – nessa direcção) com a
probabilidade de acontecer o resultado especificado e de a primeira partícula ter spin – na direc-
ção B (tendo a segunda +). Isto acontece porque, dado o resultado especificado, as outras duas
possibilidades relativas ao resultado na direcção B são mutuamente exclusivas e esgotam todas
as possibilidades do que pode ocorrer.
Precisamente pelo mesmo raciocínio há uma segunda equação

157
Eq. B-C: (0,+,0;0,0,+) = (+,+,–;–,–,+) + (–,+,–;+,–,+)

e uma terceira:

Eq. A-B: (+,0,0;0,+,0) = (+,–,+;–,+,–) + (+,–,–;–,+,+)

Chegamos agora à observação que torna dúbio o postulado das chamadas «variáveis ocultas
locais» subjacentes às probabilidades da mecânica quântica. Se olharmos para o lado direito da
equação A-C, verificamos que o seu primeiro termo, (+,+,–;–,–,+), surge no lado direito da equa-
ção B-C e que o seu segundo termo, (+,–,–;–,+,+), surge no lado direito da equação A-B. Ora, os
restantes termos do lado direito de cada uma destas últimas duas equações têm de ser maiores
ou iguais a 0, pois representam probabilidades — e as probabilidades nunca são números nega-
tivos. Logo, se somarmos o lado esquerdo da equação B-C com o lado esquerdo da equação A-
B, teremos de obter um número que tenha pelo menos o mesmo valor do que o lado esquerdo
da equação A-C. Resumindo: «A soma da probabilidade de a primeira partícula ter spin para
cima na direcção B e de a segunda ter spin para cima na direcção C com a probabilidade de a
primeira partícula ter spin para cima na direcção A e de a segunda ter spin para cima na direcção
B não pode ser inferior à probabilidade de a primeira ter spin para cima na direcção A e de a se-
gunda ter spin para cima na direcção C. Isto tem de ser verdade no que respeita a todas as direc-
ções, A, B e C.»
Mas acontece que há direcções de A, B e C em que esta inequação é violada pelas probabili-
dades previstas pela mecânica quântica! Em mecânica quântica a correlação probabilística da
direcção A com a C pode ser maior do que a soma da correlação da direcção A com outra direc-
ção, B, e com a correlação dessa outra direcção, B, com a C. Parece que postular que todas as
probabilidades acima estão bem definidas é incompatível com as previsões da mecânica quânti-
ca no que respeita às probabilidades de resultados conjuntos. E os postulados por detrás da
existência destas probabilidades parecem, pois, incompatíveis com as previsões probabilísticas
da mecânica quântica. Estes postulados são, em primeiro lugar, o de que há valores de variáveis
escondidas que determinam os resultados de todas as experiências de spin possíveis relativas às
partículas separadas e, em segundo, o de que o resultado de uma medição do spin da segunda
partícula é independente da escolha de medição de spin que fizemos para medir o spin da pri-
meira partícula (e vice-versa). É como se fôssemos obrigados a pensar que fazer uma medição
específica da primeira partícula tem um efeito determinante sobre a distribuição de probabili-
dades relativa ao resultado das medições da segunda. Este efeito não pode ser assimilado ao ca-
so clássico de haver uma probabilidade previamente determinada para cada resultado relativo à
segunda partícula — uma probabilidade independente da experiência que fizemos com a pri-
meira, experiência esta que serviria apenas para nos permitir fazer melhores inferências relati-
vamente à segunda partícula (por meio de uma espécie de condicionalização probabilística).
Suponha que presumimos que os parâmetros ocultos transportados por cada uma das partí-
culas não determinam com toda a certeza o resultado de cada medição possível susceptível de
ser feita sobre as partículas; tais parâmetros só fixariam o resultado de modo indeterminista e
probabilista. Neste caso, então, as variáveis ocultas não restituiriam o determinismo à física.
Mas não poderiam elas restituir pelo menos a «localidade»? Não poderíamos pensar que cada
partícula, depois da cisão, transportava a sua própria probabilidade de ter um resultado especí-
fico perante qualquer medição de que fosse objecto, ainda que a partícula não transportasse um
resultado completamente determinado para cada medição possível? Desgraçadamente, se admi-
tirmos um postulado adicional e natural de «localidade», esta versão de «variáveis estocásticas
locais ocultas» não será também consistente com a mecânica quântica. O postulado adicional é o
de que a probabilidade dos resultados de todas as medições possíveis na segunda partícula,
probabilidade essa determinada pela sua variável oculta e estocástica, é independente do resul-
tado de qualquer medição que executemos sobre a primeira partícula. No caso de variáveis de-
terministas ocultas, postulámos que o resultado da segunda partícula era independente da esco-
lha da experiência a realizar sobre a primeira. Agora postulamos também que a probabilidade
de um resultado relativo à segunda partícula é independente do resultado que poderíamos ob-
ter relativo a uma observação da primeira. Este será um postulado razoável, sem dúvida, uma

158
vez que estamos a tentar construir uma teoria que obedeça ao desiderato de Einstein de que o
estado da segunda partícula, uma vez separada da primeira em termos de qualquer forma cau-
sal comum, seja independente do que acontecer à primeira.
Mesmo no caso de uma teoria probabilística de variáveis ocultas, o postulado da localidade
relativamente às variáveis ocultas, interpretado em termos naturais, entra em conflito com as
previsões quânticas. Há uma espécie de «ligação» entre os sistemas que estavam previamente
juntos e que depois foram separados — ligação que não pode ser reduzida ao mero facto, inteli-
gível em termos clássicos, de que todos os sistemas, independentemente uns dos outros, trans-
portam um registo da sua existência anterior como componentes de um sistema correlacionado
com propriedades especificadas. É verdade que os sistemas transportam, juntos, um registo
desse estado prévio, mas parece que este registo não pode ser dividido em características inde-
pendentes das duas partículas tomadas como sistemas físicos distintos e independentes.
A ideia de que fazer uma experiência num sítio parece, de acordo com a mecânica quântica,
produzir um efeito sobre as probabilidades dos resultados de outra experiência distante invoca
a possibilidade de uma comunicação que excede os limites impostos à transmissão da energia
pela famosa tese relativista, segundo a qual a luz é o mais rápido sinal possível para a transmis-
são de um sinal causal. Mas um exame cuidado da situação mostra que quem realiza a experi-
ência nada pode fazer, no local da primeira partícula, para modificar quaisquer resultados que
sejam obtidos por quem fizer uma experiência no local da segunda partícula — e que possa ser
usado para informar a segunda pessoa de que, por exemplo, a primeira tinha na verdade esco-
lhido medir o spin da primeira partícula numa direcção particular ou de que tinha obtido certos
resultados ao fazê-lo. As correlações entre os spins das partículas que seriam obtidas caso se fi-
zessem duas medições particulares de duas partículas correlacionadas específicas com origem
no mesmo sistema de estado singleto conjunto original — as correlações previstas pela mecâni-
ca quântica — não são reprodutíveis por variáveis ocultas locais, quer sejam do género deter-
minista quer do estocástico. Mas nenhum destes factos sobre a correlação poderia ser usado pa-
ra violar os limites relativistas impostos à velocidade de transmissão de um sinal causal.
Parece, pois, falso que as probabilidades das componentes separadas de um sistema anteri-
ormente unido possam ser fixadas — quer em termos deterministas quer em termos meramente
probabilísticos — por características locais do sistema posteriormente isolado de modo a que as
probabilidades dos resultados das medições dos sistemas individuais obedeçam a todos os va-
lores correlacionados relativos aos resultados que as leis da mecânica quântica impõem. E é fal-
so que possam ser fixadas caso admitamos os postulados fundamentais que estes argumentos
da «inexistência de variáveis ocultas locais» pressupõem. Há tentativas de contornar estes ar-
gumentos — apoiando-se, por exemplo, em teorias da probabilidade não canónicas. Mas o es-
tranho mundo que estas teorias implicam é pelo menos tão extremo como o carácter aparente-
mente não local dos sistemas — carácter que habitualmente se pensa ser a consequência dos ar-
gumentos.
Mas poderá a mecânica quântica estar errada quanto às suas previsões acerca das correla-
ções de estados de sistemas separados? Não parece provável. Fez-se, nesse sentido, algum tra-
balho experimental (não com o tipo de partículas que usámos no nosso exemplo, mas com fo-
tões polarizados de luz, a respeito dos quais se pode demonstrar a inexistência de variáveis
ocultas). Esse trabalho parece mostrar, o que não é nada surpreendente, que as correlações entre
os estados das partículas que já estiveram unidas são precisamente como a mecânica quântica
prevê.
Assim, seguir até ao fim a inteligente ideia de Einstein de invocar sistemas que tenham inte-
ragido causalmente no passado mas que, no momento em que as medições foram feitas, consti-
tuíam sistemas completamente separados (e que não se podia pensar que estivessem em contac-
to causal entre si) teve um efeito completamente oposto ao que Einstein queria. Einstein achava
absurdo que uma medição feita num certo lugar e num certo momento pudesse originar uma
mudança real noutro lugar e noutro momento que não estivessem causalmente conectados com
os primeiros — e achava que isto mostrava que o estado quântico devia ser entendido como
uma representação do nosso conhecimento parcial do estado do mundo e não como uma des-
crição completa desse estado. Mas os resultados do teorema de Bell parecem indicar, ao invés,
que não é plausível qualquer compreensão da mecânica quântica enquanto teoria estatística jus-

159
taposta sobre uma teoria subjacente de variáveis ocultas locais — ultrapassando os resultados
discutidos em «Argumentos Contra as Variáveis Ocultas» na medida em que, nos casos que es-
tamos agora a considerar, a maneira que o defensor das variáveis ocultas tem de escapar ao di-
lema (tomando primeiro os observáveis como contextuais e relativos a outras quantidades ob-
servadas e pensando depois que as outras medições efectuadas em simultâneo actuam causal-
mente sobre as variáveis ocultas que determinam o resultado da medição em questão) não pa-
rece possível. Se admitirmos que a escolha da medição a fazer numa partícula num dado mo-
mento e o resultado obtido para essa medição não podem afectar causalmente os valores da va-
riável oculta relativos à partícula situada a uma grande distância e cuja medição esteja próxima
no tempo da primeira medição, esta forma de contornar os resultados da inexistência de variá-
veis ocultas fica agora bloqueada.

Resumo

Os resultados esboçados em «O Argumento de Einstein, Podolsky e Rosen» e em «O Teore-


ma de Bell» não podem, por si mesmos, determinar qual das possíveis interpretações metafísi-
cas da mecânica quântica e do processo de medição é a correcta. Parecem, contudo, fazer pen-
der a balança a favor daquelas interpretações que propõem revisões mais radicais da nossa
compreensão da natureza do mundo e contra as que afirmam que para compreender a nova te-
oria bastam revisões razoavelmente pequenas nos nossos conceitos sobre a natureza do mundo.
Apresentámos, por exemplo, aquelas interpretações do princípio da incerteza que o encaravam
como uma mera limitação do nosso conhecimento possível do estado de um sistema. Não podí-
amos saber, argumentavam estas interpretações, os valores exactos e simultâneos da posição e
quantidade de movimento de uma partícula. Mas podíamos partir do princípio, prosseguia o
argumento, que tais valores existiam. No entanto, o facto de nenhuma variável oculta não con-
textual poder gerar os resultados probabilísticos correctos em relação a todas as medições pos-
síveis de um sistema pareceria militar contra esta perspectiva — e constituir um argumento, ao
invés, a favor da linha mais radical de Bohr, segundo a qual as características atribuídas a um
sistema quando este era medido e se verificava ter certos valores de uma quantidade observável
«passavam a existir» por força da medição, não estando previamente presentes no sistema.
Os resultados ainda mais surpreendentes na secção «O Teorema de Bell» parecem permitir-
nos avançar um pouco mais. Uma coisa é conceber que a medição, por meio de um processo
causal qualquer, faz o estado observado do sistema «passar a existir» — processo esse que é o
resultado da interacção causal entre o dispositivo de medida e o sistema medido. Afinal, temos
consciência de que mesmo na física pré-quântica um acto de medir uma quantidade de um sis-
tema pode mudar o estado do sistema. Mergulhar um termómetro num líquido para medir a
temperatura irá alterar a sua temperatura. Não poderia o «efeito da medição no sistema medi-
do» ser concebido nestes moldes? A diferença entre os casos clássico e quântico residiria no fac-
to de, no caso pré-quântico, ser em princípio possível tornar o distúrbio provocado no sistema
pelo dispositivo de medida tão pequeno quanto quiséssemos, ao passo que na mecânica quânti-
ca o limite irredutível da quantidade mínima de energia transferida num processo de medição
(devido à natureza quântica da transferência de energia de um sistema para outro) poderia tor-
nar impossível reduzir tais distúrbios a «quase 0». Este modo de encarar a incerteza teve os seus
proponentes, especialmente aquando das primeiras interpretações do princípio da incerteza.
No entanto, como vimos, a mecânica quântica parece exigir que uma medição afecte um sis-
tema ainda que o dispositivo de medida e o sistema não tenham qualquer contacto causal. Em
sistemas que tenham previamente estado combinados e que posteriormente tenham sido sepa-
rados, medir o spin da primeira partícula muda o estado quântico da segunda. Como vimos, es-
ta mudança não pode ser reduzida à simples modificação probabilística que resulta de um in-
cremento do nosso conhecimento do mundo, caso em que um modelo clássico seria suficiente.
A inexistência de variáveis ocultas locais parece conduzir a esta conclusão. Logo, Bohr parece
ter razão quando sustenta que os estados do mundo — estados quânticos de sistemas —, apre-
sentam uma espécie de relatividade da escolha da medição e do resultado da medição que não é
assimilável nem a uma modificação causal do sistema provocada pela medição nem a uma con-
cepção do estado quântico unicamente como uma descrição parcial do sistema — um compên-

160
dio do nosso conhecimento sobre o sistema em causa cuja mudança aquando da medição seja
susceptível de ser compreendida em termos clássicos. Os resultados dos teoremas da «inexis-
tência de variáveis ocultas» fazem pender a balança a favor da tese de que a mecânica quântica
nos obriga a uma nova compreensão radical da natureza do mundo, quando tivermos, de todo
em todo, uma compreensão coerente daquele.
Em que consistiria essa nova compreensão está longe de ser claro. No mínimo, parece que a
mecânica quântica lança uma luz muito diferente sobre a velha questão de saber se Leibniz ti-
nha razão ao pensar que todo o acontecimento que ocorra terá uma «razão suficiente». Se a
maior parte dos intérpretes da mecânica quântica tiver razão, não há pura e simplesmente razão
alguma para que o núcleo de um elemento radioactivo tenha decaído num dado intervalo de
tempo ao passo que um núcleo idêntico do mesmo tipo não o fez. Pior ainda: como vimos, as
causas estocásticas ou probabilísticas parecem ficar excluídas se a causalidade — ainda que seja
indeterminista — for uma relação puramente lógica, na qual os estados de coisas sejam deter-
minados unicamente pelo que acontece nas proximidades do seu espaço-tempo. A nossa noção
do que é explicar a razão pela qual os fenómenos ocorrem desaparece, juntamente com a noção
de cadeia causal de ocorrências no mundo. Podemos explicar as correlações observadas nas
medições de spin das partículas distantes por referência à sua origem enquanto componentes de
um sistema composto de estado singleto. Mas ao contrário da explicação clássica habitual de
tais correlações, esta correlação não pode ser explicada mostrando como a origem histórica das
partículas fornece, para cada uma delas e independentemente uma da outra, uma probabilidade
definida de ocorrência (sendo a correlação a consequente distribuição de probabilidades conjun-
tas relativa a um par de resultados, recebendo cada qual um tratamento probabilístico). Ao in-
vés, a correlação é um facto que não pode ser eliminado, e a sua explicação é directa e não re-
corre ao tipo referido de probabilidades independentes, pois sabemos que qualquer atribuição
de tais probabilidades seria incompatível com as correlações que efectivamente ocorrem.
Por último, os resultados da inexistência de variáveis ocultas fazem pender a balança, apesar
de mais indirectamente, a favor das teses de que uma completa compreensão do mundo descri-
to pela mecânica quântica exigirá um repensar radical da nossa imagem metafísica do mundo.
Para alguns especialistas isto significa uma mudança do pressuposto, presente na imagem me-
canicista clássica, de um mundo único e material para um mundo no qual postulados idealistas
bastante fora de moda quanto à existência de estados mentais ontologicamente independentes
das suas bases físicas têm um papel a desempenhar. Para outros, significa a recusa bastante
mais radical de um mundo físico unitário e a sua substituição por uma ou outra versão de uma
ontologia de «múltiplos mundos», na qual a todo o momento cada um dos muitos resultados
possíveis de um processo é efectivado em diferentes «universos ramificados». Para outros espe-
cialistas, a mudança ainda mais radical seria a negação de toda e qualquer noção de um mundo
objectivo que exista independentemente das nossas tentativas de o conhecer — substituindo-se
esta perspectiva objectivista tradicional por uma espécie de versão de uma imagem bohriana, na
qual o mundo seja descrito por meio de estados quânticos, sendo estes mesmos estados relati-
vos à escolha da medição a levar a cabo.
Uma vez mais, o leitor deve reflectir sobre os fenómenos físicos que conduziram a estas es-
tranhas especulações. É importante recordar fenómenos como a natureza dualista da luz que,
como onda, exibe fenómenos de interferência e, como partícula, exibe transferências de energia
de forma altamente localizada; a presença de fenómenos de interferência associados às partícu-
las fundamentais do mundo, tal como são patenteados, por exemplo, por um electrão que se
dispersa ao encontrar um cristal; o aparecimento de interferência associados a aspectos do
mundo que não o espacial, como nas experiências de spin que exibem a retenção de memória do
spin original de uma partícula numa dada direcção, mesmo depois de o feixe de partículas ter
sido dividido em feixes puros de partículas com spins para cima e para baixo noutra direcção; os
resultados correlacionados de medições simultâneas possíveis de um sistema, incompatíveis
com a hipótese de aquelas serem determinadas por qualquer variável oculta não contextual do
sistema, por razões geométricas bastante elementares; e a existência de correlações distantes cu-
ja explicação se baseia realmente numa interacção local anterior dos sistemas separados mas
que não pode ser reconstruída de modo a poder ser explicada por parâmetros locais transpor-
tados individualmente por cada um dos sistemas separados. Estas características experimen-

161
talmente demonstráveis do mundo não fazem parte de um formalismo esotérico; são caracterís-
ticas bastante distintivas que podem ser reproduzidas no laboratório. Quanto mais reflectimos
sobre elas, mais difícil é descobrir uma explicação unitária plausível que não implique um re-
pensar bastante radical da natureza do mundo.

Leituras complementares

Três introduções básicas à filosofia da mecânica quântica facialmente acessíveis são as de


Pagels (1982), Squires (1986) e Rae (1986). Gibbins (1987) faz também com alguma sofisticação
filosófica um levantamento do material básico. Heisenberg (1930) continua a ser um clássico da
exposição elementar brilhante. Hughes (1989) contém uma exposição do formalismo da teoria,
com uma cuidada explicação da razão pela qual desempenha ela o papel que desempenha.
D’Espagnat (1971) apresenta um tratamento sofisticado de muitos dos grandes problemas e usa
mais aparato formal do que as obras mais fáceis. Jammer (1974) tem um âmbito enciclopédico,
fazendo um levantamento da maior parte das mais importantes correntes interpretativas ao
longo da história do tema.
Jammer (1996) é uma abrangente história das origens da teoria quântica, sublinhando o de-
senvolvimento dos conceitos mais importantes. Ludwig (1986) contém traduções dos artigos
originais no campo da teoria quântica. Bohm (1951) tem também capítulos expositivos claros
sobre a base experimental da teoria e sobre o seu desenvolvimento inicial.
Há vários textos introdutórios sobre teoria quântica. Bohm (1968), Dicke e Wittke (1960) e
Gottfried (1960) são todos excelentes. Dirac (1930) e von Neumann (1955) constituem apresenta-
ções formais clássicas da teoria. Podem encontrar-se introduções à matemática necessária para
formular a teoria em Hughes (1989) e Jordan (1969). Em Jauch (1968) faz-se um levantamento de
materiais mais avançados.
No que respeita às primeiras interpretações da teoria, a obra de Jammer (1974), dos capítulos
2 a 6, é abrangente. Heisenberg (1930) é também uma leitura essencial. Wheeler e Zurek (1983)
contém uma introdução ao debate, juntamente com muitos dos artigos importantes originais.
Sobre a medição são vitais os textos dos capítulos 2 e 4-6 de Wheeler e Zurek (1983).
D’Espagnet (1971), parte 4, é exaustivo e claro. Jammer (1974), capítulo 11, abrange as teorias
mais importantes.
A formulação de Kochen da teoria de «estado relativo» encontra-se em Kochen (1985). Uma
exposição e discussão exaustivas desta abordagem encontra-se em Healy (1989). Uma interpre-
tação relacionada com esta encontra-se em van Fraasen (1991). No capítulo 5 de Wheeler e
Zurek (1983) encontram-se propostas que relacionam a medição quântica com o tipo de irrever-
sibilidade discutida no capítulo 3 do nosso livro. Em Ghirardi, Rimini e Weber (1986) pode en-
contrar-se a perspectiva segundo a qual a medição é o resultado de «pontapés aleatórios» no
sistema com origem num nível físico «mais profundo». Uma crítica desta perspectiva e da de
Kochen encontra-se em Albert e Loewer (1990). A interpretação de «múltiplos mundos» da teo-
ria dos quanta é discutida nas secções 11.6 de Jammer (1974) e 2.3 de Wheeler e Zurek (1993),
assim como no capítulo 20 de d’Espagnat (1971).
A versão de Reichenbach da «lógica quântica» está em Reichenbach (1994). No capítulo 8 de
Jammer (1974) encontra-se um levantamento dos temas principais da lógica quântica. Os capítu-
los 9 e 10 de Gibbins (1987) expõem a natureza das alegadas lógicas quânticas e oferecem uma
crítica das posições filosóficas que encaram a «lógica» quântica como uma revisão da lógica
propriamente dita. Hughes (1989) é também uma boa fonte sobre este tópico.
Relativamente às várias teorias de variáveis ocultas, veja-se Jammer (1974), capítulo 7 e Beli-
fante (1973). No que respeita à inseparabilidade dos sistemas, d’Espagnat (1971), parte 3, é exce-
lente. Em Bell (1987) encontram-se artigos originais importantes de Bell.

162
5
Reflexões sobre a interdependência
entre a filosofia e a ciência

Explorámos até agora variadíssimos tópicos sobre os quais tanto os recursos da física con-
temporânea como os da filosofia da ciência podem ser chamados a intervir. A riqueza de exem-
plos e o modo como a física e a filosofia desempenham um papel intrincadamente entrelaçado
ao tentar chegar ao fundo das questões levantadas devia convencer o leitor de que a física e a
filosofia são duas formas profundamente interdependentes de procurar compreender o mundo
e o nosso lugar como agentes de conhecimento do mundo.
Tradicionalmente, a filosofia tentou descrever a natureza do mundo nos termos mais gerais.
Renunciando à descrição e classificação minuciosas dos múltiplos fenómenos da natureza, dei-
xando isso como tarefa para as ciências particulares, a filosofia preocupou-se com a natureza do
ser nos níveis mais abstractos. Será que só existem particulares, ou teremos de postular que os
universais, as propriedades, têm existência própria? Será que a substância do mundo se esgota
no ser material, ou teremos de tolerar também um qualquer domínio de existência não-material
para acomodar os fenómenos da mente? Estes são os tipos de perguntas que se espera que os
filósofos respondam.
A filosofia tomou também como seu o domínio do exame crítico das ciências específicas.
Apesar de a ciência inferir o inobservado e a natureza do futuro a partir dos limitados dados
disponibilizados pelas nossas observações até ao presente, a filosofia preocupa-se com a justifi-
cação do raciocínio indutivo que permite tal projecção do alegado conhecimento para lá do do-
mínio do observado. A ciência colecciona os resultados das observações, resultados formulados
nos termos derivados, em última análise, da linguagem da experiência quotidiana. Explica de-
pois estes resultados por referência a um domínio de entidades teóricas inobservadas e suas
propriedades. A filosofia, ao invés, questiona a legitimidade de tal extrapolação do domínio do
observável para o do inobservável. Como poderemos justificar ou dar uma base racional a tais
inferências? Mais profundamente ainda: como podem conceitos que propõem referir-se ao
inobservável chegar mesmo a ter sentido para nós, dado o papel que a associação entre o con-
ceito e a experiência alegadamente desempenha na fundamentação do significado?
A filosofia da ciência é muitas vezes caracterizada dizendo que reserva para si temas do do-
mínio da metodologia. Ao passo que a acumulação efectiva de resultados da observação e a sua
assimilação por parte de teorias explicativas gerais constituem as tarefas do cientista na sua dis-
ciplina particular, é ao filósofo da ciência que compete explorar os métodos que a ciência em-
prega para cumprir a sua tarefa. Como se formulam, testam, aceitam e rejeitam as teorias em
ciência? Qual é o papel desempenhado pela confrontação com os dados? Que papel desempe-
nham elementos como a simplicidade ontológica ou a elegância formal no processo contínuo de
construção e selecção de teorias? Quais são os meios que o cientista usa para oferecer uma com-
preensão do mundo com base em observações e teorizações? Como formula o cientista as expli-
cações? Quais são os recursos por detrás dos esquemas explicativos e de que modo a existência
de uma explicação científica nos dá uma compreensão complementar da natureza do mundo?
Mas, como vimos, a necessidade de teorias revolucionárias na física que lidem com os fenóme-
nos da natureza aos mais altos níveis de generalidade e profundidade forçou os próprios cien-
tistas a confrontarem-se com questões precisamente do tipo das que tradicionalmente têm esta-
do reservadas aos filósofos.
Quando lidamos com as questões mais fundamentais a respeito do espaço e do tempo e ao
seu lugar na natureza, vêm a lume questões sobre o tipo de ser que pode existir e que pode ser
invocado nas nossas explicações. Isto já era óbvio no século XVII quando, como vimos, pensado-
res do calibre de Newton e Leibniz lutaram com as questões metafísicas que pareciam insepará-
163
veis das suas perspectivas sobre a natureza do espaço e do tempo. Agora que as revoluções nas
nossas perspectivas do espaço e do tempo nos são impostas pelas teorias da relatividade restrita
e geral, reaparecem estes velhos temas sobre o carácter substancial do espaço e do tempo. Mais
profundamente ainda, como vimos, pensadores como Bohr, debatendo-se com os estranhos fe-
nómenos a que a mecânica quântica tem de fazer justiça, perceberam ser necessário lidar com
questões relativas à própria objectividade do mundo enquanto entidade alegadamente inde-
pendente das acções empreendidas por quem procura conhecer a sua natureza. Os velhos temas
filosóficos da autonomia do mundo relativamente à apreensão sensível e intelectual que dele
temos — questões sobre as quais Kant, por exemplo, meditou profundamente — tornam-se par-
te de uma tentativa para compreender o formalismo da teoria concebida para dar conta dos es-
tranhos factos relativos à interacção entre matéria e radiação com os quais a mecânica quântica
tem de lidar.
Vimos também que a abordagem crítica e epistemológica da filosofia teve um papel a de-
sempenhar nos fundamentos de algumas destas teorias da física contemporânea. Apesar de o
espaço-tempo revolucionário das teorias da relatividade restrita e geral ter nascido em parte da
necessidade de novas perspectivas do espaço e do tempo que fizessem justiça aos factos expe-
rimentais recentemente descobertos sobre o comportamento da luz, o movimento das partículas
e os resultados de medições relacionadas com réguas e relógios, o exame crítico de conceitos do
ponto de vista epistémico desempenhou igualmente um papel importante na formulação destas
teorias. Este programa crítico é sobretudo evidente no trabalho de Einstein, que repetidamente
faz avançar a discussão teórica pedindo-nos para reflectir sobre o significado dos nossos termos
básicos relacionados com o espaço e o tempo. Einstein convida-nos a considerar o modo como
estes termos funcionam nas nossas teorias, sublinhando sobretudo a medida em que as teorias
por nós postuladas se fundamentam em factos do mundo que nos sejam genuinamente acessí-
veis do ponto de vista epistémico. Usando um exame crítico de termos e hipóteses que depende
de uma exploração dos limites da nossa consciência epistémica do mundo, Einstein dá nova
energia às teorias da física disponíveis para lidar com a estrutura espacial e temporal do mun-
do. Numa tentativa para resolver as características aparentemente paradoxais do mundo que a
mecânica quântica nos descreve, encontramos uma vez mais pensadores como Bohr e Heisen-
berg tentando convencer-nos de que uma compreensão correcta da teoria, assim como do mun-
do que ela descreve, exige que recuemos e reflictamos sobre a nossa capacidade de conhecer o
mundo. Esta é uma reflexão do ponto de vista crítico-epistemológico.
Podemos considerar a forma como a mecânica estatística indica a existência de modos de
explicar os fenómenos que parecem exigir modelos de explicação estatística de uma originali-
dade surpreendente como um exemplo de como os resultados da física exigem que repensemos
questões metodológicas. O papel desempenhado pelas probabilidades na mecânica estatística; o
fundamento para as atribuir a microestados de tipos particulares de sistemas; o papel por elas
desempenhado para dar conta dos fenómenos macroscópicos com que a termodinâmica lida; e a
relação entre estas probabilidades e as consequências de tipo estatístico derivadas das leis da
dinâmica subjacentes — tudo isto indica que um repensar destas matérias está na ordem do dia.
Temos de pensar profundamente na relação entre as condições iniciais e as leis, assim como no
papel desempenhado por ambas na explicação da razão pela qual acontece o que acontece no
mundo. Vimos também como as consequências da mecânica quântica — como as demonstra-
ções de impossibilidade da existência de variáveis ocultas locais — sugerem que a ciência nos
obrigou a adoptar uma nova atitude em relação ao que constitui uma explicação completa das
correlações descobertas entre fenómenos quando estes não estão em interacção causal no mo-
mento em que ocorrem. Efectivamente, a própria natureza da causalidade e de como a devemos
procurar e invocar na ciência surgem de maneira diferente no contexto quântico.
Não podemos pois ter a esperança de fazer filosofia independentemente dos resultados da
física. Que isto é verdade no caso da metafísica — a investigação da natureza do mundo ao ní-
vel da maior generalidade — parece óbvio. É evidente que a nossa compreensão dos tipos fun-
damentais de coisas e propriedades que temos de postular para percebermos a natureza do
mundo tem de ter em linha de conta aquilo que a ciência nos diz sobre o mundo. Vezes e vezes
sem conta a filosofia que procura raciocinar a priori, sem confiar nos dados da observação e da
experiência, e chegar a conclusões sobre como o mundo tem de ser se viu em situações embara-

164
çosas provocadas pelas revelações da ciência. Isto mostrou-nos que os filósofos aprioristas tive-
ram uma imaginação muito limitada quando tentaram delimitar o domínio de possibilidades no
que respeita à natureza do mundo. Sem os resultados da física, que filósofo teria considerado as
inúmeras possibilidades no que respeita à natureza do espaço e do tempo, da causalidade e dos
tipos de objectividade e da sua ausência que as novas teorias radicais da física postularam como
possibilidades a ter em consideração?
Mas não é só a metafísica que tem de prestar atenção aos resultados da ciência. Muitos filó-
sofos da teoria do conhecimento têm vindo a defender ultimamente que a esperança de alcançar
uma teoria racionalmente justificada e formulada em termos apriorísticos sobre a inferência que
conduz à verdade é também uma proposta duvidosa. Ao decidir que regras é razoável usar pa-
ra procurar a verdade, defenderam esses filósofos, temos de nos apoiar nas nossas melhores e
mais perspicazes ideias sobre a natureza do mundo, cujas verdades estamos a tentar descobrir
por meio da investigação persistente. Mas, sendo assim, temos certamente de ter em considera-
ção aquelas teorias das ciências — quer se trate da física fundamental ou da neuropsicologia e
das ciências cognitivas da percepção e do pensamento — que nos dizem o que sabemos acerca
da natureza do mundo que estamos a tentar descobrir e acerca da relação que temos com o
mundo como agentes de percepção e criadores de teorias. Como vimos, é precisamente a ideia
que temos do que é compreender esse mundo, compreender o seu funcionamento e fornecer
explicações do que nele acontece, que dependerá, em si mesma, da própria natureza desse
mundo. Logo, tanto nas suas tarefas epistemológicas como nas metodológicas a filosofia terá de
recorrer continuamente ao que as ciências avançadas, incluindo a física fundamental, nos dizem
acerca do mundo.
É importante notar que a filosofia não se limita a depender das ciências unicamente como
fontes de dados brutos. Sem dúvida que os resultados da observação que empurram a física pa-
ra a invenção das teorias novas e radicais que temos estado a avaliar têm um impacto crucial
sobre a filosofia. Mas o que fornece à filosofia um espectro ainda mais rico de novas formas
conceptuais de lidar com o mundo é também a capacidade, por parte dos que fazem aquelas ci-
ências, para imaginar novos esquemas conceptuais que dão conta dos novos dados. É a imagi-
nação de cientistas como Boltzmann, Einstein e Bohr que é a fonte de formas completamente
novas de pensar acerca da natureza da realidade, do conhecimento que temos dela e da nossa
capacidade para dar uma explicação dela. É essa imaginação que fornece uma fonte sempre fér-
til de enriquecimento para o filósofo que procura novas maneiras de lidar com problemas, tanto
novos como velhos, apresentados pelo mundo da experiência.
Mas se a filosofia tem de prestar muita atenção aos resultados da física fundamental, é claro
que esta última também depende da filosofia. À medida que explorámos as raízes das teorias
fundamentais que constituem o núcleo da física moderna observámos, vezes e vezes sem conta,
que a formulação destas teorias não é uma extrapolação trivial por meio de raciocínios óbvios a
partir dos dados da observação. Ao invés, a formulação de uma teoria apropriada e a justifica-
ção racional fornecida para essa escolha, quando se adopta e defende uma determinada postura
teórica contra as suas críticas, dependem dos tipos de raciocínio que os filósofos exploraram e
em que meditaram profundamente. Isto pode ver-se claramente, por exemplo, nas justificações
racionais por detrás das teorias da relatividade restrita e geral oferecidas por Einstein e nas ten-
tativas levadas a cabo por Bohr para fornecer uma compreensão coerente do formalismo da me-
cânica quântica. Nestes casos, questões filosóficas como a distinção entre as consequências de
uma teoria susceptíveis de serem testadas por meio da observação e as que são imunes a tal
confrontação; o papel do exame crítico dos significados dos conceitos não observacionais das
teorias; a justificação dos princípios que presidem à escolha de teorias, como o da simplicidade
ontológica; a questão de saber se as generalizações são adequadas para fornecer explicações ge-
nuínas dos fenómenos; e a questão de saber quando podemos considerar que estamos perante
uma explicação última — todas estas questões desempenham um papel crucial no interior da
dialéctica científica que conduz à formulação e aceitação de teorias. É como se as questões tradi-
cionalmente encaradas como filosóficas tivessem de se tornar parte do próprio pensamento ci-
entífico quando as teorias científicas em questão tiverem uma generalidade e um carácter fun-
damental tão acentuados quanto as que discutimos nos capítulos anteriores.

165
Já houve uma altura em que os físicos teóricos recebiam habitualmente alguma formação em
filosofia e na sua história. Nessa altura podíamos encontrar, nas obras de alguns dos maiores
cientistas, referências explícitas ao tipo de raciocínio filosófico em que se apoia o raciocínio cien-
tífico. Einstein e Bohr constituem dois exemplos dignos de nota. Apesar de a especialização da
formação académica nas últimas décadas ter tornado tal familiaridade com a filosofia tradicio-
nal menos comum entre os cientistas — mesmo entre os mais teóricos —, tornou-se agora claro
que é necessário o tipo de pensamento filosófico, enquanto parte do pensamento científico, que
discutimos. Isto é verdade quer o cientista queira enfrentar este facto quer não. Pode ver-se uma
prova a favor disto no tipo de pensamento parafilosófico que se tornou parte da especulação e
teorização cosmológicas sobre o Big Bang na cosmologia científica.
O facto de as próprias teorias científicas se basearem num pensamento de tipo filosófico —
quer isto seja explícito na história da ciência quer seja apenas implícito e esteja à espera que o
historiador e o filósofo o tragam à luz — significa também que temos de ter cuidado com tenta-
tivas demasiado ingénuas para resolver questões filosóficas tradicionais por meio dos resulta-
dos da ciência. Os argumentos que visam estabelecer que um dado resultado da ciência resolve
conclusivamente uma questão filosófica tradicional numa ou noutra direcção perdem de vista
muito frequentemente o modo como os pressupostos filosóficos implícitos foram integrados na
teoria que está a ser usada para resolver o debate. Caso se tivessem feito outras escolhas filosó-
ficas na própria ciência, as implicações que a ciência teria na filosofia poderiam parecer muitís-
simo diferentes.
Em qualquer caso, é muito claro que, ao nível da sua maior generalidade e das suas tentati-
vas para lidar com a natureza ao nível mais fundamental, a ciência não é uma disciplina cuja na-
tureza se possa distinguir radicalmente da filosofia. E a melhor maneira de fazer filosofia é usar
um método cuja teorização, como na ciência, se confronte sempre com a natureza das coisas tal
como esta nos é revelada por essa experiência subtil a que chamamos «observação e experimen-
tação científicas».

166
Referências

Albert, D., e B. Loewer (1990) «Wanted Dead of Alive: Two Attempts to Solve Schrödinger’s
Paradox.» In A. Fine, M. Forbes e L. Wessels, orgs., PSA-1990, vol. 1. East Lansing, MI: Phi-
losophy of Science Association.
Alexander, H., org. (1956) The Leibniz-Clarke Correspondence. Manchester: Manchester University
Press.
Anderson, J. (1967) Principles of Relativity Physics. Nova Iorque: Academic Press. (*)
Arnold, V. e A. Avez (1968) Ergodic Problems of Classical Mechanics. Nova Iorque: Benjamin. (**)
Barbour, J. (1989) Absolute or Relative Motion? vol. 1, The Discovery of Dynamics. Cambridge:
Cambridge University Press.
Batterman, R. (1990) «Irreversibility and Statistical Mechanics: A New Approach?» Philosophy of
Science 57: 395-419.
—— (1991) «Randomness and Probability in Dynamical Theories: On the Proposal of the Prigo-
gine School.» Philosophy of Science 57: 241-263.
Belinfante, F. (1973) A Survey of Hidden Variable Theories. Nova Iorque: Pergamon. (*)
Bell, J. (1987) Speakable and Unspeakable in Quantum Mechanics. Cambridge: Cambridge Universi-
ty Press.
Bohm, D. (1951) Quantum Theory. Englewood Cliffs NJ: Prentice-Hall. (*)
—— (1989) The Special Theory of Relativity. Reading, MA: Addison-Wesley.
Brush, S. (1965) Kinetic Theory. Oxford: Pergamon Press.
—— (1976) The Kind of Motion That We Call Heat. Amesterdão: North-Holland.
Buchdahl, H. (1996) The Concepts of Classical Thermodynamics. Cambridge, Cambridge University
Press. (*)
Cramér, H. (1955) The Elements of Probability Theory and Some of Its Applications. Nova Iorque:
John Wiley.
Davies, P. (1974) The Physics of Time Asymmetry. Berkeley: University of California Press.
d’Espagnat, B. (1971) Conceptual Foundations of Quantum Mechanics. Menlo Park, CA: Benjamin.
(**)
Devaney, R. (1986) An Introduction to Chaotic Dynamical Systems. Menlo Park, CA: Benjamin-
Cummings. (**)
Dicke, R. e J. Wittke (1960) Introduction to Quantum Mechanics. Reading, MA: Addison-Wesley.
(*)
Dirac, P. (1930) The Principles of Quantum Mechanics. Oxford: Oxford University Press. (*)
Earman, J. (1974) «An Attempt to Add a Little Direction to “The Problem of the Direction of
Time.”» Philosophy of Science 41: 15-47.
—— (1986) A Primer for Determinism. Dordrecht: D. Reidel.
—— (1989) World-Enough and Space-Time. Cambridge, MA: MIT Press.
Eddington, A. (1920) Space, Time and Gravitation. Cambridge: Cambridge University Press.
Ehrenfest, P. e T. Ehrenfest (1959) The Conceptual Foundations of the Statistical Approach in Mechan-
ics. Ithaca, NY: Cornell University Press. (*)
Einstein, A., et al. (1923) The Principle of Relativity. Nova Iorque: Dover.
Farquhar, I. (1964) Ergodic Theory in Statistical Mechanics. Nova Iorque: John Wiley (*).
Feller, W. (1950) An Introduction to Probability Theory and Its Applications. Nova Iorque: John
Wiley (*).
Friedman, M. (1983) Foundations of Space-Time Theories. Princeton: Princeton University Press. (*)
Geroch, R. (1978) General Relativity from A to B. Chicago: University of Chicago Press.
Ghirardi, G., A. Rimini e M. Weber (1986) «Unified Dynamics for Microscopic and Macroscopic
Systems.» Physical Review D 34: 470-479. (*)
Gibbins, P. (1987) Particles and Paradoxes. Cambridge: Cambridge University Press.
167
Gibbs, J. (1960) Elementary Principles in Statistical Mechanics. Nova Iorque: Dover. (*)
Gleick, J. (1987) Caos: a Construção de uma Nova Ciência. Lisboa: Gradiva, 1994.
Gottfried, K. (1960) Quantum Mechanics. Nova Iorque: Benjamin. (*)
Graves, J. (1971) The Conceptual Foundations of General Relativity Theory. Cambridge, MA: MIT
Press.
Grünbaum, A. (1973) Philosophical Problems of Space and Time, 2.a ed. Dordrecht: Reidel.
Hawking, S. e G. Ellis (1973) The Large Scale Structure of Space-Time. Cambridge: Cambridge
University Press. (**)
Healy, R. (1989) The Philosophy of Quantum Mechanics. Cambridge: Cambridge University Press.
Heisenberg, W. (1930) The Physical Principles of the Quantum Theory. Nova Iorque: Dover.
Hobson, A. (1971) Concepts in Statistical Mechanics. Nova Iorque: Gordon and Breach.
Horwich, P. (1987) Asymmetries in Time. Cambridge, MA: MIT Press.
Hughes, R. (1989) The Structure and Interpretation of Quantum Mechanics. Cambridge, MA: Har-
vard University Press.
Humphreys, P. (1989) The Chances of Explanation. Princeton: Princeton University Press.
Jammer, M. (1954) Concepts of Space. Cambridge: Cambridge University Press.
—— (1966) The Conceptual Development of Quantum Mechanics. Nova Iorque: McGraw-Hill.
Jancel, R. (1963) Foundations of Classical and Quantum Statistical Mechanics. Oxford: Pergamon
Press. (*)
Jauch, J. (1968) Foundations of Quantum Mechanics. Reading, MA: Addison-Wesley. (**)
Jaynes, E. (1983) Papers on Probability, Statistics and Statistical Physics. Dordrecht: Reidel.
Jordan, T. (1969) Linear Operators for Quantum Mechanics. Nova Iorque: John Wiley. (*)
Kant, I. (1787) Crítica da Razão Pura, trad. de Manuela Pinto dos Santos e Alexandre Fradique
Morujão. Fundação Calouste Gulbenkian, Lisboa, 1985.
—— (1783) Prolegómenos a toda a Metafísica Futura, trad. de Artur Morão. Edições 70, Lisboa,
1982.
Kochen, S. (1985) «A New Interpretation of Quantum Mechanics» in P. Lathi e P. Mittelstaedt,
orgs., Symposium on the Foundations of Modern Physics. Teaneck, NJ: World Scientific Publish-
ing. (*)
Kolmogorov, A. (1950) Foundations of the Theory of Probability. Nova Iorque: Chelsea. (*)
Krylov, N. (1979) Works on the Foundations of Statistical Physics. Princeton: Princeton University
Press.
Kyburg, H. (1970) Probability and Inductive Logic. Londres: Macmillan.
Lucas, J. e P. Hodgson (1990) Spacetime and Electromagnetism. Oxford: Oxford University Press.
Ludwig, G. (1968) Wave Mechanics. Oxford: Pergamon Press.
Mehlberg, H. (1980) Time, Causality and the Quantum Theory. Dordrecht: D. Reidel.
Mellor, D. (1981) Real Time. Cambridge: Cambridge University Press.
Misner, C., K. Thorne e J. Wheeler (1973) Gravitation. São Francisco: Freeman. (**)
Møller, C. (1952) The Theory of Relativity. Oxford: Oxford University Press. (*)
Nerlich, G. (1976) The Shape of Space. Cambridge: Cambridge University Press.
Newton-Smith, W. (1980) The Structure of Time. Londres: Routledge and Kegan-Paul.
Pagels, H. (1982) O Código Cósmico: a Física Quântica como Linguagem da Natureza, trad. de Jorge
C. Buescu. Lisboa: Gradiva, 1990.
Penrose, R. (1979) «Singularities and Time Asymmetry.» In S. Hawking e W. Israel, orgs., Gen-
eral Relativity: An Einstein Centenary Survey. Cambridge: Cambridge University Press.
Pippard, A. (1961) The Elements of Classical Thermodynamics. Cambridge: Cambridge University
Press.
Poincaré, H. (1952) Science and Hypothesis. Nova Iorque: Dover.
Prigogine, I. (1980) From Being to Becoming. São Francisco: Freeman.
—— (1984) Order Out of Chaos. Nova Iorque: Bantam Books.
Putnam, H. (1967) «Time and Physical Geometry.» Journal of Philosophy 64: 240-247.
Rae, A. (1986) Quantum Physics: Illusion or Reality? Cambridge: Cambridge University Press.
Reichenbach, H. (1944) Philosophical Foundations of Quantum Mechanics. Berkeley: University of
California Press.
—— (1956) The Direction of Time. Berkeley: University of California Press.

168
—— (1958) The Philosophy of Space and Time. Nova Iorque: Dover.
Rietdijk, C. (1966) «A Rigorous Proof of Determinism from the Special Theory of Relativity.»
Philosophy of Science 33: 341-344.
Rindler, W. (1977) Essential Relativity. Nova Iorque: Springer-Verlag. (*)
Salmon, W. (1984) Scientific Explanation and the Causal Structure of the World. Princeton: Princeton
University Press.
Schroeder, M. (1991) Fractals, Chaos, Power Laws. Nova Iorque: Freeman. (*)
Sinay, Y. (1976) Introduction to Ergodic Theory. Princeton: Princeton University Press.
Sklar, L. (1974) Space, Time, and Spacetime. Berkeley: University of California Press.
—— (1985) Philosophy and Spacetime Physics. Berkeley: University of California Press.
—— (1995) Physics and Chance: Philosophical Issues in the Foundations of Statistical Mechanics.
Cambridge: Cambridge University Press.
Smart, J., org. (1964) Problems of Space and Time. Nova Iorque: Macmillan.
Squires, E. (1986) The Mystery of the Quantum World. Bristol: Adam Hilger.
Stein, H. (1991) «On Relativity Theory and Openness of the Future.» Philosophy of Science 58:
147-167.
Synge, J. (1956) Relativity: the Special Theory. Amesterdão: North-Holland. (*)
Taylor, E. e J. Wheeler (1963) Spacetime Physics. São Francisco: Freeman.
Tolman, R. (1934) Relativity, Thermodynamics and Cosmology. Oxford: Oxford University Press.
—— (1938) The Principles of Statistical Mechanics. Oxford: Oxford University Press. (*)
Toretti, R. (1978) The Philosophy of Geometry from Riemann to Poincaré. Dordrecht: Reidel.
—— (1983) Relativity and Geometry. Oxford: Pergamon Press. (*)
van Fraassen, B. (1970) An Introduction to the Philosophy of Time and Space. Nova Iorque: Random
House.
—— (1991) Quantum Mechanics: An Empiricist View. Oxford: Oxford University Press. (*)
von Neumann, J. (1955) Mathematical Foundations of Quantum Mechanics. Princeton: Princeton
University Press. (**)
Wald, R. (1984) General Relativity. Chicago: University of Chicago Press. (*)
Wheeler, J. e W. Zurek, orgs. (1983) Quantum Theory and Measurement. Princeton: Princeton Uni-
versity Press. (*)
Winnie, J. (1977) «The Causal Theory of Space-Time.» em J. Earman, C. Glymour, e J. Stachel,
orgs., Foundations of Space-Time Theories, Minnesota Studies in the Philosophy of Science, vol. 8.
Minneapolis: University of Minnesota Press.

169
170

Você também pode gostar