Teoria Classica de Campos

Notas em Teoria Clássica de Campos
Mario C. Bertin
Instituto de Física
Universidade Federal da Bahia
2
Sumário
1 Transformações de Lorentz 5
1.1 Introdução: as transformações de Galilei . . . . . . . . . . . . . . . . . . . . . . . . 5
1.2 Postulados fundamentais da relatividade restrita . . . . . . . . . . . . . . . . . . . 7
1.3 Transformações de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.4 Composição de velocidades . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 11
1.5 Contração de Lorentz e dilatação do tempo . . . . . . . . . . . . . . . . . . . . . . . 12
1.6 O espaço-tempo de Minkowski . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7 O cone de luz e o critério de causalidade . . . . . . . . . . . . . . . . . . . . . . . . . 15
1.8 Curvas em M4 e observáveis cinemáticos . . . . . . . . . . . . . . . . . . . . . . . . 17
1.9 Dinâmica relativística de partículas . . . . . . . . . . . . . . . . . . . . . . . . . . . 20
1.10 Momento linear e Energia . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.11 4-momento linear e o invariante de Lorentz p2 . . . . . . . . . . . . . . . . . . . . . 27
2 Os Grupos de Lorentz e Poincaré 31

2.1 Transformações infinitesimais em Rn . . . . . . . . . . . . . . . . . . . . . . . . . . 31
2.2 Evolução temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
2.3 Translações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.4 Rotações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34
2.5 Os grupos de Lorentz e Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
2.6 Vetores e covetores de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 40
2.7 Tensores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 42
2.8 Álgebra de Lorentz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 43
2.9 A representação adjunta . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44
2.10 Invariantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
2.11 A álgebra de Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
3 O formalismo lagrangeano para campos 49

3.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 49
3.2 Variações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.3 A primeira variação da ação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.4 Os termos de fronteira . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 56
3.5 Os princípios de Hamilton e Weiss e as equações de campo . . . . . . . . . . . . . . 56
3.6 Simetrias da ação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 59
3.7 A equação de Lie . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.8 O primeiro teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
3.9 Cargas conservadas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 63
3.10 Translações e a conservação de energia e momento . . . . . . . . . . . . . . . . . . . 64
3.11 Rotações, momento angular e spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
3.12 O segundo teorema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
3.13 Revisitando invariantes da álgebra de Poincaré . . . . . . . . . . . . . . . . . . . . . 75
3
4 Campos Bosônicos 79
4.1 O campo escalar real . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 79
4.2 O campo escalar complexo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
4.3 Simetrias internas do campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . 82
4.4 Simetrias de gauge locais e interação . . . . . . . . . . . . . . . . . . . . . . . . . . . 83
4.5 O campo vetorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 85
4.6 O campo eletromagnético . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 88
4.7 Liberdade de gauge . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5 Campos Espinoriais 97
5.1 A álgebra de Clifford relativística . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.2 Rotações: a representação espinorial das transformações de Lorentz . . . . . . . . 102
5.3 Representações de spin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 105
5.4 Espinores de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
5.5 A ação de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
5.6 Aplicando o princípio de Weiss . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 112
5.7 Soluções de ondas planas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 115
6 Campos de Gauge 117

6.1 Revisitando o campo escalar . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.2 Simetria de Gauge U (1) no campo espinorial . . . . . . . . . . . . . . . . . . . . . . 118
6.3 Transformações de gauge globais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
6.4 Transformações de gauge locais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.5 O termo de interação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6.6 A lagrangeana completa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
7 O Campo Gravitacional 131

7.1 O princípio da Covariância Geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
7.2 O princípio de Equivalência de Einstein . . . . . . . . . . . . . . . . . . . . . . . . . 131
7.3 A simetria de Lorentz local . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 131
7.4 A derivada de Lorentz e a conexão de spin . . . . . . . . . . . . . . . . . . . . . . . . 132
7.5 A derivada covariante em M e a conexão de Levi-Civita . . . . . . . . . . . . . . . . 134
7.6 Curvatura e Torção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.7 Ações para o campo gravitacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
7.8 Termos de Chern-Simons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
Referências Bibliográficas 137
4
Capítulo 1
Transformações de Lorentz
1.1 Introdução: as transformações de Galilei

Na mecânica clássica, a trajetória de uma partícula é descrita com a segunda lei de Newton
dp
F= , (1.1)
dt
em que p = mv é o momento linear, sendo m a massa e v = ẋ = dx/dt a velocidade da partícula,
definida a partir da escolha de um sistema de coordenadas no espaço euclidiano R3 . A posição
da partícula é representada por um vetor posição x = (x, y, z), em que x, y e z são número reais
relacionados a três eixos cartesianos ex , ey e ez . A escolha de um sistema de coordenadas que
descreve o movimento de uma partícula em R3 é o equivalente físico à escolha de um sistema
de referência a partir do qual qualquer medida sobre o sistema pode ser tomada. Segundo a
primeira lei de Newton, se a força resultante que age sobre uma partícula é nula, existe sempre
um sistema referencial para o qual a velocidade da partícula é constante em sentido, direção e
módulo. Um referencial que obedece a essa propriedade é chamado referencial inercial. Uma das
propriedades mais importantes da dinâmica de um sistema clássico é que (1.1) continua válida
ou, dito de outra forma, é covariante em quaisquer desses referenciais. Dizemos, assim, que o
sistema físico é invariante sob a escolha entre referenciais inerciais.
Esta invariância retira do espaço o caráter absoluto que lhe havia atribuído a mecânica de
Aristoteles. Por outro lado, outra suposição fundamental da mecânica newtoniana é sobre a
natureza imutável do tempo. Para qualquer referencial inercial, a passagem do tempo deve ser
a mesma, o que implica que se dois referenciais inerciais são usados para descrever um mesmo
sistema, intervalos de tempo medidos por ambos possuem o mesmo valor absoluto.
Vamos supor uma partícula de massa m de força resultante nula, que se move com velocidade
v com relação a um determinado referencial inercial O, cujo sistema de coordenadas seja dado
por x = (x, y, z). Agora vamos supor um segundo referencial inercial O0 . Por simplicidade vamos
escolher este segundo referencial de modo que seus eixos cartesianos sejam paralelos aos eixos
cartesianos de O e que, em t = 0, a origem dos dois sistemas coincida. O sistema de coordenadas
de O0 é dado por x0 = (x0 , y 0 , z 0 ) e sua origem move-se com velocidade u, constante, com relação a
O. Ambos os sistemas de coordenadas estão relacionados por
x0 = x − ut. (1.2)
A configuração de dois referenciais inerciais dispostos dessa maneira é denominada configuração

padrão
Lembremos que, segundo o caráter absoluto do tempo, t0 = t. Se x (t) representa a trajetória
da partícula sob o ponto de vista de O, (1.2) também resulta na trajetória da partícula x0 (t)
5
y0
m
y
v v0
u O0 x0
O x
Figura 1.1: A configuração padrão de dois referenciais inerciais O e O0 .
medida pelo referencial O0 . Neste caso, a velocidade da partícula medida por O0 é dada por
dx0 dx0 d dx
v0 = = = (x − ut) = − u = v − u. (1.3)
dt0 dt dt dt
Esta é a lei de composição de velocidades na mecânica newtoniana. Note que
dp0 dv0 dv dp
p0 = mv0 =⇒ =m =m = , (1.4)
dt dt dt dt
desde que a massa seja constante. Este resultado implica que a aceleração de um sistema é
invariante sob a escolha de referenciais inerciais. Para que a segunda lei (1.1) seja covariante,
uma força F que age sobre a partícula também não pode depender da escolha do referencial
inercial.
Outro invariante sob a transformação (1.2) vem a ser a quantidade
ds2 = dx2 + dy 2 + dz 2 = dx · dx, (1.5)
que é a métrica euclidiana do espaço cartesiano R3 . Tomando-se (1.2), temos

2
(ds0 ) = dx0 · dx0 = dx · dx = ds2 . (1.6)
Dada a invariância da métrica, é imediato notar que a norma dos vetores em R3 também é
preservada, o que implica que distâncias medidas por O devem ser as mesmas medidas por O0 .
Portanto, os sistemas físicos descritos pela mecânica clássica são invariantes pelas transfor-
mações
x0 = x − ut, (1.7a)
0
t = t, (1.7b)
que são chamadas transformações de Galilei.
6
1.2 Postulados fundamentais da relatividade restrita
Até o século XIX, a relatividade de Galilei era considerada uma propriedade dos sistemas físi-
cos, em razão do grande sucesso da mecânica clássica. Contudo, na segunda metade do século
XIX as bases matemáticas do eletromagnetismo clássico foram reunidas em forma final, através
das equações de Maxwell. Foi uma grande surpresa quando os estudos de Lorentz e Poincaré
revelaram que tais equações não eram covariantes sob as transformações (1.7), ou seja, o ele-
tromagnetismo não obedecia à relatividade galileana. Este fato tornou-se um problema teórico
fundamental, visto que a lei de força de Lorentz é baseada na mecânica newtoniana e, portanto,
uma incompatibilidade entre a teoria de Maxwell e a mecânica surgiu em nível formal.
Esta incompatibilidade não foi, contudo, observada imediatamente nas experiências em ele-
trodinâmica clássica. As trajetórias de partículas carregadas que se movem em campos ele-
tromagnéticos, por exemplo, são bem descritas desde que as velocidades das partículas sejam
tipicamente pequenas. Contudo, experimentos como o de Michelson e Morley (1989) mostraram
que a velocidade da luz no vácuo independe do movimento relativo entre a fonte e o observador,
em clara violação da relatividade de Galilei.
Einstein observou que a incompatibilidade entre o eletromagnetismo e a mecânica newtoni-
ana deveria ser corrigida modificando-se a mecânica, de modo que os sistemas físicos obedeces-
sem a dois postulados fundamentais:
Proposição 1. Princípios da Relatividade Restrita
1. Todo sistema físico é invariante pela escolha de referencial inercial;
2. A velocidade da luz é uma constante independente do movimento relativo entre

fonte e observador.
Vamos supor que uma fonte de luz seja ligada na origem de um dado referencial inercial O,
que é munido de um sistema de coordenadas x = (x, y, z) e, também, de um relógio cujo instante
t = 0 marca o instante em que a fonte de luz é ligada. A frente de onda se move à velocidade da
luz, que denominaremos como c (tem o valor de exatamente 299.792.458 metros por segundo no
vácuo), e é descrita pela equação
x2 + y 2 + z 2 = c2 t2 ,
neste referencial.
Agora, consideremos um segundo referencial inercial O0 , em configuração padrão com relação
a O. O sistema de coordenadas x0 = (x0 , y 0 , z 0 ) relativo a O0 tem origem coincidente com a origem
de O no instante em que a fonte é ligada, ou seja, quando t = 0 em O. Contudo, consideraremos
que O0 possui seu próprio relógio e que, neste, o intervalo de tempo medido não coincide necessa-
riamente com o relógio carregado por O. Ou seja, ∆t0 6= ∆t. Mas podemos definir o tempo em O0
de modo que t0 = 0 quando t = 0. Isto é possível visto que as coordenadas da fonte são as mesmas
em ambos os referenciais quando esta é ligada, ou seja, o evento que deu origem ao pulso de luz
é simultâneo em ambos os referenciais.
Se a velocidade da frente de onda é a mesma para ambos os referenciais, temos
x02 + y 02 + z 02 = c2 t02 ,
ou seja,
c2 t02 − r02 = c2 t2 − r2 , (1.8)
em que r2 = x2 + y 2 + z 2 , o mesmo para r0 . Na configuração padrão, O0 move-se com velocidade
7
z
ct
x x 2 + y 2 + z 2 = c 2 t2
Figura 1.2: A frente de onda como vista por qualquer referencial inercial, quando ligada em
t = 0, quando as origens coincidem.
constante u = uex com relação a O, com u constante, real e positivo. Assim,
c2 t02 − x02 = c2 t2 − x2 . (1.9)
Portanto, a forma bilinear c2 t2 − x2 deve ser invariante pela escolha entre referenciais inerciais.
1.3 Transformações de Lorentz
Para que o postulado 1 seja válido, a transformação (t, x) → (t0 , x0 ) deve ser linear. Portanto
vamos considerar
x0 = Ax + cBt,
ct0 = Cx + cDt.
Em (1.9), temos
2 2
c2 t2 − x2 = (Cx + cDt) − (Ax + cBt)
= C 2 x2 + c2 D2 t2 + 2cCDxt − A2 x2 − c2 B 2 t2 − 2cABxt
= C 2 − A2 x2 + D2 − B 2 c2 t2 + 2c (CD − AB) xt.

Ao igualar os coeficientes,
C 2 − A2 = −1,
D2 − B 2 = 1,
CD = AB.
8
Vamos supor a seguinte solução:
A = D = cosh φ,
B = C = − sinh φ,
em que o ângulo φ é chamado rapidez. Esta solução não é única, mas é escolhida por requeri-
mentos físicos. Em primeiro lugar, a configuração padrão implica que x0 e t0 crescem com x e t,
por isso a escolha do sinal negativo em B e C. Em segundo lugar, as transformações resultantes
devem levar às transformações de Galilei para |u| c. Levando em conta esses critérios, temos
x0 = x cosh φ − ct sinh φ,
ct0 = −x sinh φ + ct cosh φ,
ou em forma matricial,
ct0

cosh φ − sinh φ ct
= . (1.10)
x0 − sinh φ cosh φ x
Podemos, também, colocar o sistema na forma
x0 = cosh φ (x − tanh φct) ,

ct0 = cosh φ (ct − tanh φx) .
Para interpretar o significado físico de φ, vamos observar a origem de O0 , ou seja, x0 = 0. Isto

implica em
x
x − tanh φct = 0 =⇒ tanh φ = .
ct
Contudo, u = x/t, portanto
u
tanh φ = ≡ β. (1.11)
c
Vamos definir, também,
γ ≡ cosh φ. (1.12)
Assim, temos
sinh φ
tanh φ = β =⇒ γ = ,
β
enquanto
cosh2 φ − sinh2 φ = 1 =⇒ sinh2 φ = γ 2 − 1.
Comparando-se as duas equações, temos
γ2 − 1
r
1
γ2 = =⇒ γ 2 1 − β 2 = 1 =⇒ γ =

.
β 1 − β2
Portanto, a transformação pode ser colocada também nas formas mais conhecidas
x0 = γ (x − βct) ,

β
t0 = γ t − x ,
c
9
ou
x − ut
x0 = p , (1.13a)
1 − u2 /c2
t − u/c2 x

0
t = p . (1.13b)
1 − u2 /c2
Nesta configuração, as direções y e z ficam inalteradas e a forma completa é dada por
x − ut
x0 = p , (1.14a)
1 − u2 /c2
y 0 = y, (1.14b)
0
z = z, (1.14c)
2

t − u/c x
t0 = p , (1.14d)
1 − u2 /c2
ou nas duas formas de notação matricial,

 0 
ct cosh φ − sinh φ 0 0 ct
  
 x 0  − sinh φ cosh φ 0 0   x 
 y0  = 
    , (1.15a)
0 0 1 0  y 
z0 0 0 0 1 z
 0 
ct γ −γβ 0 0 ct
  
 x0   −γβ γ 0 0   x ,
 
 y0  =  0 (1.15b)
  
0 1 0   y 
0
z 0 0 0 1 z
As transformações (1.14), ou mesmo na forma (1.15), são denominadas transformações de Lo-

rentz, ou simplesmente boosts de Lorentz. É imediato observar que as transformações de Lo-
rentz inversas são dadas substituindo-se u por −u, β por −β ou φ por −φ nessas transformações.
As transformações de Lorentz são precisamente as transformações que deixam a teoria eletro-
magnética de Maxwell invariante.
A forma mais geral das transformações de Lorentz, usadas quando os referenciais O e O0
movem-se com uma velocidade u = ux ex + uy ey + uz ez , mas ainda mantêm a mesma orientação,
é dada por
ct0 −γBT

γ ct
= , (1.16)
r0 −γB (γ − 1) BBT /β 2 r
em que B é o vetor coluna
βx ux
   
1 u
B ≡  βy  =  uy  = , (1.17)
c c
βz uz
e BT é o vetor linha
1 uT
BT ≡

βx βy βz = ux uy uz = . (1.18)
c c
O produto BBT é dado por
βx2 βx βy βx βz
 
BBT =  βy βx βy2 βy βz  , (1.19)

βz βx βz βy βz2
10
2
e β 2 = BT B = |u| /c2 .
Observando-se a forma (1.15a), é imediato calcular o limite não relativístico, ou seja, a baixas
velocidades, das transformações de Lorentz. Observemos que este limite é dado por
u c =⇒ β 1 =⇒ φ 1.
Neste caso, temos
sinh φ → φ,
cosh φ → 1,
tanh φ → φ = β = u/c.
Então,
ct0 1 −β 0 0 ct
    
 x0   −β 1 0 0   x 
 y0  =  0
    ,
0 1 0  y 
z0 0 0 0 1 z
ou seja,
x0 = x − βct = x − ut,
β u
t0 = t − x = t − 2 x ≈ t,
c c
que são as transformações de Galilei na configuração padrão.
1.4 Composição de velocidades

Vamos verificar como um objeto, que se move a uma velocidade v com relação a O, move-se com
relação ao referencial O0 . Por simplicidade vamos utilizar a configuração padrão, neste caso,
dx
vx = . (1.20)
dt
Vamos utilizar a transformação de Lorentz inversa dada por
x = γ (x0 + βct0 ) . (1.21)
Temos, considerando-se γ e β constantes,

0
dt0
0
dt0

dx dx dx
vx = =γ + βc =γ + βc
dt dt dt dt dt
0 0
dx dt
= γ + βc . (1.22)
dt0 dt
Agora, temos a transformação
dt0

0 β βvx
t = γ t − x =⇒ =γ 1− . (1.23)
c dt c
Portanto,
1 − βvx /c 0

βvx
vx = γ 2
1− (vx0 + βc) = (vx + βc) .
c 1 − β2
11
vx 1 − β 2 − βc (1 − βvx /c)

vx − vx β 2 − βc + β 2 vx vx − βc
vx0 = = = ,
1 − βvx /c 1 − βvx /c 1 − βvx /c
ou seja,
vx − u
vx0 = . (1.24)
1 − uvx /c2
Para as demais componentes, temos
dy 0 dy 0 dt0 dt0

dy βvx
vy = = = 0 = vy0 = γvy0 1 − ,
dt dt dt dt dt c
ou
vy
vy0 = . (1.25)
γ (1 − uvx /c2 )
Ainda,
vz
vz0 = . (1.26)
γ (1 − uvx /c2 )
Essas são as equações para composição de velocidades na relatividade restrita. Através essas,
podemos mostrar que a velocidade da luz é a mesma para ambos os referenciais. Um raio de luz
disparado em (x = 0, t = 0) no referencial O tem velocidade vx = c. Portanto, temos
c−u c−u 1 − u/c

0
vx = = =c = c,
1 − uc/c2 1 − u/c 1 − u/c
em concordância com o segundo postulado.
1.5 Contração de Lorentz e dilatação do tempo

Vamos supor uma régua de comprimento l com relação a um sistema referencial em repouso O.
Neste caso, temos
l = x2 − x1 , (1.27)
em que x2 é a posição de uma das extremidades da régua, enquanto x1 < x2 é a posição da outra
extremidade, ambas com relação a O. Supondo um segundo referencial O0 que se move com
velocidade u = uex com relação a O, em uma configuração padrão, temos

x(2,1) = γ x0(2,1) + ut0(2,1) , (1.28)
em que t0(2,1) são os instantes de tempo medidos por O0 em que as medidas de posição da régua
são tomadas.
Para que O0 tome uma medida do comprimento da régua, as medidas de x01 e x02 devem ser
sincronizadas, ou seja, tomadas considerando-se ∆t0 = t02 − t01 = 0. Neste caso,
l = γ [x02 − x01 + u (t02 − t01 )] = γ [l0 + u∆t0 ] = γl0 ,
ou seja,
1
l0 =
p
l = l 1 − u2 /c2 . (1.29)
γ
Como γ é sempre maior que 1, toda medida de comprimento na direção do movimento do obser-
12
vador é sempre menor que a mesma medida feita por um observador em repouso com relação ao
objeto. Este fenômeno é conhecido como contração de Lorentz. Neste caso, a medida de compri-
mento feita a partir de um referencial em repouso é máxima, denominado comprimento próprio
do objeto.
Agora, vamos supor um relógio em repouso com relação a um referencial O. Vamos ver como
um intervalo de tempo, digamos ∆t0 = t02 − t01 é medido por um referencial O0 com velocidade
u = uex com relação ao relógio, em uma configuração padrão. A transformação de Lorentz
relevante é dada por
t0 = γ t − u/c2 x ,

(1.30)
portanto,
∆t0 = γ t2 − t1 − u/c2 (x2 − x1 ) = γ ∆t − u/c2 ∆x .

Contudo, como o relógio está em repouso com relação a O, temos que ∆x = 0, então,
∆t
∆t0 = γ∆t = p . (1.31)
1 − u2 /c2
Como γ é sempre maior que 1, qualquer observador mede intervalos de tempos dilatados com
relação a um observador em repouso com relação ao relógio. Este fenômeno é conhecido como
dilatação do tempo.
Na mecânica clássica, o tempo é um parâmetro de evolução que marca a configuração de um
sistema físico em diferentes pontos do espaço euclidiano. Por exemplo, a solução para o movi-
mento de uma partícula sujeita a uma força é dada por uma curva γ ⊂ R3 parametrizada pelas
equações x = x (t). O tempo marca a posição da partícula sobre a curva. Na mecânica relativís-
tica, vale o mesmo conceito: a solução para o movimento de uma partícula é uma curva γ ∈ M4 ,
tal que as equações paramétricas são dadas por xµ = xµ (τ ) para determinado parâmetro τ , que
se refere a uma medida de tempo. A diferença entre as abordagens não está apenas na dimen-
são a mais do sistema relativístico. Embora na mecânica clássica o tempo possa ser redefinido
por um processo de reparametrização, uma vez que dois referenciais inerciais tenham relógios
sincronizados, ambos os relógios marcam sempre os mesmos intervalos de tempo, independente-
mente do movimento relativo entre eles.
Em um sistema relativístico, dois referenciais quaisquer podem medir intervalos de tempo
distintos para dois eventos determinados. Se ∆t é o intervalo de tempo medido por um relógio
em repouso com relação a um referencial inercial, qualquer outro relógio que se movimente com
relação a este referencial mede um tempo dilatado, sendo a equação ∆t0 = γ∆t válida quando a
velocidade deste relógio é constante. No entanto, todo referencial inercial pode escolher o tempo
de modo que ∆t seja mínimo com relação a qualquer outro relógio em movimento. Este é o
denominado tempo próprio.
Vamos considerar o intervalo infinitesimal medido por um observador em repouso em deter-
minado sistema de coordenadas retangular {x}. A trajetória, ou linha de mundo deste observa-
dor, é uma linha reta que mantém posição constante na seção espacial de M4 . Portanto, dx = 0
para este observador e o intervalo medido por este é ds2 = c2 dt2 . Este intervalo é uma medida
de tempo, já que dt é o intervalo de tempo medido por um relógio em repouso com relação ao
observador, seu tempo próprio. Vamos denominar o tempo próprio de um observador pela letra
grega τ .
Como o intervalo é invariante, um relógio em movimento com velocidade instantânea v com
relação ao referencial em repouso obedece à equação
" 2 #
2 2 2 2 2 2 2 1 dx
c dτ = c dt − dx = c dt 1 − 2 ,
c dt
13
ou seja,
r
v2
dτ = dt 1 − .
c2
Um intervalo de tempo medido pelo relógio em repouso e, portanto, o tempo próprio, é dado por
ˆ t1 r
v2
τ − τ0 = dt 1 − 2 . (1.32)
t0 c
Caso o relógio em movimento tenha velocidade constante, a expressão (1.32) reduz-se a ∆τ =

(1/γ) ∆t.
1.6 O espaço-tempo de Minkowski
De forma análoga à relatividade de Galilei, existe uma medida invariante às transformações de

Lorentz. Ela é definida pela métrica de Minkowski
2 2 2 2
ds2 = dx0 − dx1 − dx2 − dx3 , (1.33)
em que renomeamos as coordenadas xi = x1 = x, x2 = y, x3 = z , e definimos uma quarta co-

ordenada x0 = ct. A métrica de Minkowski é uma métrica para o espaço-tempo de Minkowski

M4 , que é o espaço plano pseudo-riemanniano de quatro dimensões. A métrica (1.33) também é
denominada intervalo relativístico.
Um ponto no espaço de Minkowski é representado por uma letra latina, por exemplo x, tal que
x ∈ M4 , e é também denominado evento relativístico. Um determinado evento x é localizado em
M4 com a escolha de um sistema de coordenadas (xµ ) = x0 , x1 , x2 , x3 . O espaço de Minkowski

é plano, então é sempre possível escolher um sistema de coordenadas cartesiano ortogonal uni-
versal, e é neste sistema que a expressão (1.33) está escrita. Contudo, M4 não é euclidiano, pois
sua métrica não é estritamente positiva, devido aos sinais negativos nas componentes espaciais
de (1.33). Como veremos adiante, a diferença de sinal entre as componentes espaciais e temporal
é determinante e necessária na definição relativística de causalidade.
Observação 1. A escolha de sinais em (1.33) é convencional. Uma métrica descrita pela

forma bilinear
2 2 2 2
ds2 = − dx0 + dx1 + dx2 + dx3 (1.34)
também é invariante por transformações de Lorentz, e representa estritamente a

mesma métrica de Minkowski. A diferença está na denominada assinatura da métrica,
que é o número de sinais positivos, menos os sinais negativos. A assinatura de (1.33)
é −2, enquanto a de (1.34) é igual a 2. Mantendo-se a condição de que o sinal da parte
temporal seja sempre diferente dos sinais das partes espaciais, e que os sinais espaci-
ais sejam sempre iguais entre si, um espaço-tempo de Minkowski de 4 dimensões terá
sempre o módulo de assinatura 2, sendo o sinal da assinatura facultado. Uma vez esco-
lhido o sinal da assinatura, no entanto, devemos manter esta convenção. Nessas notas,
usaremos sempre a assinatura −2, que é a escolha padrão em teorias de campos. Um
espaço euclidiano de quatro dimensões terá sempre assinatura de módulo 4. Em razão
dessa diferença, espaços de Minkowski também são denominados pseudo-euclidianos.
14
Observe, agora, que (1.33) pode ser escrita em forma matricial
1 0 0 0 dx0
  
 0 −1 0 0   dx1
ds2 =
  
dx0 dx1 dx2 dx3 

,
 0 0 −1 0   dx2 
0 0 0 −1 dx3
ou, em forma tensorial:

3
X
ds2 = ηµν dxµ dxν , µ, ν = 0, 1, 2, 3, (1.35)
µ,ν=0
com
1 0 0 0
 
 0 −1 0 0 
ηµν = . (1.36)
 0 0 −1 0 
0 0 0 −1
A notação tensorial é de grande vantagem operacional, além de explicitar, como veremos, a

natureza geométrica dos objetos em expressões matemáticas. Nesta notação, existem dois tipos
de índices: os superiores, denominados contravariantes, e os inferiores, denominados covarian-
tes. A partir de agora, usaremos também a notação de Einstein, para a qual a repetição de
dois índices, um covariante e outro contravariante, implica em soma sobre todos os valores deste
índice, ou seja, escreveremos (1.35) simplesmente por
ds2 = ηµν dxµ dxν . (1.37)
Podemos, também, escrever uma transformação de Lorentz com esta notação. Ela é dada por
x0µ = Λµν xν . (1.38)
Na configuração padrão, temos em representação matricial
γ −γβ 0 0 cosh φ − sinh φ 0 0

   
 −γβ γ 0 0   − sinh φ cosh φ 0 0 
Λµν =
 0
= . (1.39)
0 1 0   0 0 1 0 
0 0 0 1 0 0 0 1
1.7 O cone de luz e o critério de causalidade

A métrica de Minkowski não é um métrica propriamente dita. A razão é a presença dos sinais
negativos em (1.33) e (1.36), que implicam no fato de que dois eventos distintos em M4 podem
ter distância nula, positiva ou negativa. Em geometria, uma das propriedades de uma métrica
é a estrita positividade, ou seja, dois pontos distintos do espaço têm distância sempre positiva,
enquanto dois pontos quaisquer possuem distância nula se, e somente se, consistem no mesmo
ponto. Essas duas propriedades não são obedecidas por (1.37), razão pela qual a métrica de
Minkowski recebe a denominação de pseudo-métrica.
Note que
2 2 2 2
ds2 = ηµν dxµ dxν = c2 (dt) − dx1 − dx2 − dx3
é nulo sempre que

2 2 2 2
c2 (dt) = dx1 + dx2 + dx3 , (1.40)
15
Cone de luz futuro de x0
Região causalmente Região causalmente

desconexa a x0 desconexa a x0
x0
Região causalmente
desconexa a x0 Região causalmente
desconexa a x0
Cone de luz passado de x0
Figura 1.3: Regiões de causalidade ligadas a um evento x0 .
que é a equação que representa a frente de uma onda que se desloca com velocidade c = dx/dt. No
espaço-tempo de Minkowski, esta equação demarca o cone de luz, ou seja, a região na qual todos
os corpos com velocidade c se deslocam. Todos os pontos no cone de luz estão a uma distância
nula entre si. Neste caso, temos
Definição 1. Dois eventos x, y ∈ M4 de distância nula, ou seja, tais que

2 2 2
|x − y| = x0 − y 0 − |x − y| = ηµν (xµ − y µ ) (xν − y ν ) = 0,

são denominados eventos tipo luz. Escolhido um sistema de coordenadas com uma
origem x0 , o conjunto de todos os pontos de M4 que são tipo luz com relação à origem
e, portanto, são tipo luz entre si, delimitam um subespaço denominado cone de luz.
Por outro lado, dois pontos tais que

2 2 2 2
c2 (∆t) < ∆x1 + ∆x2 + ∆x3 (1.41)
estão a uma distância negativa entre si, visto que ds2 < 0. Isto significa que uma linha reta
entre dois eventos x e y, que poderia ser a trajetória de um sinal de informação mandada de um
evento a outro, tem velocidade média

∆x
∆t > c,

ou seja, superior à da luz, quando a distância entre os dois eventos é negativa. Informação
propagada acima da velocidade da luz no vácuo é proibida pela relatividade restrita, portanto,
16
nenhuma informação pode trafegar entre dois eventos com distância negativa no espaço-tempo.
Neste caso, isto também significa que não pode haver relação de causalidade entre esses dois
eventos: dois pontos x e y com distância negativa são causalmente desconexos.
Definição 2. Dois eventos x, y ∈ M4 de distância negativa, ou seja, tais que

2 2 2
|x − y| = x0 − y 0 − |x − y| = ηµν (xµ − y µ ) (xν − y ν ) < 0,

são denominados eventos tipo espaço. Escolhido um sistema de coordenadas com

uma origem x0 , o conjunto de todos os pontos de M4 que são tipo espaço com relação à
origem delimitam um subespaço de pontos que se encontra fora do cone de luz de x0 .
Todos os pontos fora de um cone de luz estão causalmente desconectados de x0 , o que
significa que x0 não pode ser causa, ou consequência de nenhum desses eventos.
Quando dois pontos possuem distância positiva entre si, temos

2 2 2 2
c2 (∆t) > ∆x1 + ∆x2 + ∆x3 , (1.42)
então uma partícula teste mandada em linha reta de um evento a outro tem velocidade máxima
dada por

∆x
∆t < c,

o que é permitido pela teoria.
Definição 3. Dois eventos x, y ∈ M4 de distância positiva, ou seja, tais que

2 2 2
|x − y| = x0 − y 0 − |x − y| = ηµν (xµ − y µ ) (xν − y ν ) > 0,

são denominados eventos tipo tempo. Escolhido um sistema de coordenadas com

uma origem x0 , o conjunto de todos os pontos de M4 que são tipo tempo com relação à
origem delimitam um subespaço de pontos que se encontra dentro do cone de luz de x0 .
Todos os pontos dentro de um cone de luz podem estar causalmente conectados a x0 .
Determinada uma origem x0 , a métrica de Minkowski divide o espaço-tempo em regiões de-

terminadas pela relação de causalidade com relação à origem. Todos os pontos tipo espaço com
relação à origem estão fora do cone de luz de vértice em x0 , o que significa que nenhuma infor-
mação gerada em x0 pode alcançar esta região, e nenhuma informação gerada nesta região pode
alcançar a origem. Por outro lado, x0 é vértice de dois cones de luz: todo ponto x ∈ M4 tal que
x0 > x00 faz parte do futuro causalmente conectado a x0 . O conjunto desses pontos forma o cone
de luz futuro de x0 . Todo evento caracterizado por x0 < x00 faz parte do passado causal de x0 , e a
coleção desses pontos forma o cone de luz passado de x0 . A fronteira do cone de luz em si, solução
de ds2 = 0, é considerada parte do cone de luz, já que essa região está conectada causalmente a
x0 por raios de luz que se propagam com velocidade c.
1.8 Curvas em M4 e observáveis cinemáticos

Ambos os postulados de Einstein implicam em que todo observável físico deve ser invariante por
transformações de Lorentz. Isto deve ser válido para sistemas mecânicos em particular, mas
usaremos este princípio mais adiante para definir teorias de campos clássicos relativísticos. Por
17
enquanto, vamos apenas supor uma partícula livre relativística, que possivelmente interage com
um agente externo, como um campo. Assim como na mecânica clássica, interação é sentida pela
ação de forças, que desviam o caminho inercial da partícula, que lhe seria natural, resultando
em aceleração. Contudo, os análogos de velocidade, aceleração, força e energia necessitam ser
reformulados para serem compatíveis com os princípios da relatividade.
Na mecânica relativística, a linha de mundo, ou trajetória de uma partícula no espaço-tempo,
é definida por uma curva γ ⊂ M4 , descrita pelo sistema de equações
xµ = xµ (λ) , (1.43)
para um parâmetro λ. O parâmetro não é essencial na descrição do sistema físico: como vimos,
o tempo que um observador atribui à trajetória depende de seu referencial. Contudo, há uma
medida de tempo invariante que convenientemente pode ser usada para parametrizar (1.43).
Note que a métrica de Minkowski ds2 , em vista de (1.43), pode ser escrita por
dxµ dxν 2
ds2 = ηµν dxµ dxν = ηµν dλ , (1.44)
dλ dλ
ou seja,
r
dxµ dxν
ds = dλ ηµν . (1.45)
dλ dλ
Neste caso, ds torna-se o elemento de linha da curva γ, de modo que o comprimento de γ entre
dois valores de λ é dado por
ˆ λ2 r
dxµ dxν
∆s = s (λ2 ) − s (λ1 ) = dλ ηµν . (1.46)
λ1 dλ dλ
Se λ for escolhido como o tempo t medido por um relógio, temos

ˆ t2 r ˆ t2 r
dxµ dxν v2
s (t2 ) − s (t1 ) = dt ηµν =c dt 1 − 2 .
t1 dt dt t1 c
Com a expressão (1.32), temos
s = cτ, (1.47)
ou seja, o comprimento da curva é diretamente proporcional ao tempo próprio. De fato, alguns

autores definem s como o tempo próprio da partícula, embora sua dimensão seja de comprimento.
Assim como s, o tempo próprio de uma partícula é um invariante relativístico, o que torna ambos
os parâmetros igualmente convenientes para parametrizar a solução.
Se todo parâmetro é válido, vamos escolher o comprimento da curva s como parâmetro. Neste
caso, xµ = xµ (s) são as equações de γ. Temos:
Definição 4. A velocidade relacionada à curva γ em um ponto s ∈ γ é definida por
d dxµ ∂
u≡ = , (1.48)
ds ds ∂xµ
de modo que
dxµ
uµ ≡ (1.49)
ds
são suas componentes, sendo a uma constante de normalização adimensional. Esta
velocidade é também denominada 4-velocidade (ou quadrivelocidade) da partícula.
18
Esta velocidade, como veremos no próximo capítulo, é um invariante relativístico e, assim, é
um observável físico que obedece aos princípios de Einstein.
Dado que xµ = (ct, x) = (cγτ, x) = (γs, x), e
r
v2 dx
γ= 1− , v= ,
c2 dt
temos
dx0 ds
u0 = =γ = γ, (1.50a)
ds ds
dxi 1 dxi
ui = = . (1.50b)
ds c dτ
A quantidade dxi /dτ é a 3-velocidade se o referencial está em repouso com relação à partícula.
Contudo, para um referencial inercial geral, temos
dxi dt dxi dxi

= =γ = γv i ,
dτ dτ dt dt
ou seja,
γ dx γ
u= = v,
c dt c
em que v é a 3-velocidade da partícula em qualquer referencial inercial. Portanto, uµ = γ (1, v/c)
e são quantidades adimensionais. Podemos calcular u2 :
v2

u2 = uµ uµ = ηµν uµ uν = γ 2 1 − 2 = 1, (1.51)
c
ou seja, |u| = 1: a 4-velocidade é unitária.
Definição 5. A aceleração relacionada à curva γ em um ponto s ∈ γ é definida por
du duµ ∂
α≡ = , (1.52)
ds ds ∂xµ
de modo que
duµ
αµ ≡ (1.53)
ds
são suas componentes. Esta aceleração é também denominada 4-aceleração (ou qua-
driaceleração) da partícula.
Da mesma forma que com a velocidade, podemos deduzir
du0 dγ dt dγ dt 1
α0 = = = = γ̇ = γ γ̇ (1.54a)
ds ds dsdt ds c
dui d vi 1 γ 2 dv i
αi = = γ = 2 γ γ̇v i + 2 . (1.54b)
ds ds c c c dt
Seja a 3-aceleração dada por a = dv/dt, temos
−1/2
v2 γ3

d
γ̇ = 1− 2 = v · a.
dt c c2
19
Assim,
γ4
α0 = v · a, (1.55a)
c3
γ2 γ2

α = (v · a) v + a . (1.55b)
c2 c2
Caso o referencial esteja em repouso com relação à partícula, temos γ = 1 e v · a = 0, portanto
αµ = 0, a/c2 .

1.9 Dinâmica relativística de partículas

O caso mais simples de dinâmica relativística vem a ser a dinâmica de uma partícula livre. Como
vimos, essa dinâmica é facilmente dedutível das propriedades do espaço-tempo de Minkowski:
esperamos que uma partícula que não interaja com outros sistemas físicos tome o caminho mais
curto entre dois pontos causalmente conectados, dentro de um cone de luz, na região em que
ds2 é estritamente positivo. Isto também implica em que o caminho de uma partícula livre seja
aquele em que seu tempo próprio é mínimo.
Neste caso, vamos empregar um princípio variacional com o funcional
ˆ s1
S = −mc ds, ds2 = ηµν dxµ dxν , (1.56)
s0
ou seja, vamos procurar por uma curva γ ⊂ M4 com pontos inicial e final s0 e s1 , de comprimento
mínimo. A constante mc consiste na massa da partícula multiplicada pela velocidade da luz no
vácuo, sendo acrescentada na ação para que sua dimensão seja de energia vezes tempo. Vamos
supor, assim, uma curva γ ⊂ M4 que minimiza S, sendo portanto uma solução do problema
variacional, e uma segunda curva γ 0 ⊂ M4 em uma vizinhança fechada de γ, que denominaremos
curva de comparação. Se S [γ 0 ] > S [γ] para qualquer γ 0 , γ é um mínimo local. Por outro lado, se
S [γ 0 ] < S [γ] para qualquer γ 0 , γ é um máximo local. O sinal negativo em (1.56) garante que, γ
seja um mínimo nessas condições.
Seja γ : xµ = xµ (s) e γ 0 : x0µ = x0µ (s0 ), admitindo-se portanto que ambas as curvas podem ter
parametrização distinta, definimos as variações
δxµ = x0µ (s0 ) − xµ (s) , δs = s0 − s. (1.57)
Pelas regras do cálculo funcional, a diferencial δF de um funcional F (γ) com relação às variações
(1.57) é definida por
δF = lim 0 {F [γ 0 ] − F [γ]} ,
γ→γ
de modo que δ age como um operador diferencial. Neste caso, calculamos

ˆ s1 ˆ s1
δS = δ ds = δds. (1.58)
s0 s0
De (1.56), temos
δ ds2 = δ (ηµν dxµ dxν ) = δηµν dxµ dxν + ηµν δ (dxµ ) dxν + ηµν dxµ δ (dxν )

= δηµν dxµ dxν + 2ηµν dxµ δ (dxν ) .
Não há variação explícita em s, visto que o sistema é invariante por reparametrizações. Mesmo
20
assim podemos explicitar a dependência em s na forma
δ ds2 = δηµν dxµ dxν + 2ηµν dxµ δ (dxν )

dxµ dxν 2 dxµ

= δηµν (ds) + 2ηµν dsδ (dxν ) .
ds ds ds
Por outro lado,
δ ds2 = 2dsδ (ds) ,

assim,
2 dxµ
2dsδ (ds) = δηµν uµ uν (ds) + 2ηµν uµ dsδ (dxν ) , uµ ≡ .
ds
Então, temos
1
δ (ds) = δηµν uµ uν ds + ηµν uµ δ (dxν ) , (1.59)
2
Precisamos calcular δdxµ :

0 dx0µ 0
δ (dxµ ) = (dxµ ) − dxµ = 0
ds − dxµ
0µ 0 ds
dx ds ds µ dx0µ
= ds − dx = ds − dxµ
ds ds0 ds ds
= dx0µ − dxµ = d (δxµ ) . (1.60)
Portanto, a diferencial funcional e a ordinária comutam entre si.
Então, (1.59) torna-se

1 1
δ (ds) = δηµν uµ uν ds + ηµν uµ δ (dxν ) = δηµν uµ uν ds + ηµν uµ d (δxν )
2 2
1
= δηµν uµ uν ds − d (ηµν uµ ) δxν + d (ηµν uµ δxν )
2
1
= δηµν uµ uν ds − dηµν uµ δxν − ηµν duµ δxν + d (ηµν uµ δxν )
2
1 duµ
= δηµν uµ uν ds − dηµν uµ δxν − ηµν dsδxν + d (ηµν uµ δxν ) . (1.61)
2 ds
Não vamos supor que ηµν seja constante, pois isso só ocorre quando o sistema de coordenadas é
cartesiano. Em vez disso, vamos supor ηµν = ηµν (x), o que abriga os casos em que o sistema de
coordenadas é geral, ou mesmo o caso em que o referencial é não inercial. Temos
∂ηµν α ∂ηµν α
δηµν = δx , dηµν = dx . (1.62)
∂xα ∂xα
Assim,
1 ∂ηµν µ ν α ∂ηµν α µ ν duµ
δ (ds) = u u dsδx − dx u δx − η µν dsδxν + d (ηµν uµ δxν )
2 ∂xα ∂xα ds
1 ∂ηµν µ ν ∂ηµν α µ duµ
= α
u u dsδxα − α
u u dsδxν − ηµν dsδxν + d (ηµν uµ δxν )
2 ∂x ∂x ds
1 ∂ηµν µ ν ∂ηµα ν µ duµ
= α
u u dsδxα − ν
u u dsδxα − ηµα dsδxα + d (ηµν uµ δxν )
2 ∂x ∂x ds
duµ

1 ∂ηµν µ ν ∂ηµα µ ν
= u u − u u − ηµα dsδxα + d (ηµν uµ δxν ) (1.63)
2 ∂xα ∂xν ds
21
Vamos simetrizar o termo
∂ηµα µ ν 1 ∂ηµα µ ν 1 ∂ηνα µ ν
ν
u u = u u + u u .
∂x 2 ∂xν 2 ∂xµ
Assim,
duµ

1 ∂ηµν µ ν 1 ∂ηµα µ ν 1 ∂ηνα µ ν
δ (ds) = u u − u u − u u − η µα dsδxα + d (ηµν uµ δxν )
2 ∂xα 2 ∂xν 2 ∂xµ ds
duµ

1 ∂ηµα ∂ηνα ∂ηµν µ ν
= − ηµα + + − u u dsδxα + d (ηµν uµ δxν ) . (1.64)
ds 2 ∂xν ∂xµ ∂xα
Vamos definir os símbolos de Christoffel do primeiro tipo:

1 ∂ηµα ∂ηνα ∂ηµν
γαµν ≡ + − . (1.65)
2 ∂xν ∂xµ ∂xα
Então,
duµ

δ (ds) = − ηµα + γαµν uµ uν dsδxα + d (ηµν uµ δxν ) . (1.66)
ds
Com (1.66) em (1.58),

ˆ s1 ˆ s1
duµ

µ ν α
δS = mc ds ηµα + γαµν u u δx − d (mcuµ δxµ ) . (1.67)
s0 ds s0
Com esta expressão, podemos aplicar o princípio de Hamilton: γ deve ser um extremo de S com
as condições δxµ (s0 ) = δxµ (s1 ) = 0. Neste caso
ˆ s1
d (mcuµ δxµ ) = uµ δxµ |s=s1 − uµ δxµ |s=s0 = 0, (1.68)
s0
então δS = 0 resulta em
duµ
ηµα + γαµν uµ uν = 0. (1.69)
ds
Com a métrica inversa à esquerda, temos
duµ duµ
0 = η λα ηαµ + η λα γαµν uµ uν = δµλ + η λα γαµν uµ uν
ds ds
duλ
= + η λα γαµν uµ uν . (1.70)
ds
Vamos definir os símbolos de Christoffel do segundo tipo

µ µλ 1 µλ ∂ηαλ ∂ηβλ ∂ηαβ
Γ αβ ≡ η γλαβ = η + − . (1.71)
2 ∂xβ ∂xα ∂xλ
Então, temos como resultado a equação
αµ + Γµαβ uα uβ = 0, αµ = duµ /ds = d2 xµ /ds2 . (1.72)
Esta equação é denominada equação geodésica, pois suas soluções definem distâncias mínimas
entre dois pontos de M4 no cone de luz.
Quando a partícula interage, a equação da geodésica não é satisfeita, mas pode ser escrita
como
duµ 1 µ
+ Γµαβ uα uβ = F , (1.73)
ds mc
22
em que F µ é um termo de força que codifica a possível interação entre a partícula e um ente
externo. Neste caso, uma força no sentido relativístico desvia a partícula de sua trajetória geo-
désica.
Note também que (1.73) pode tomar a forma
µ
µ du µ α β µ d µ
F = mc + Γαβ u u = mc δβ + Γαβ u uβ .
α
ds ds
Neste caso, vamos definir a derivada covariante
s d
Dαβ ≡ ηαβ + Γαγβ uγ . (1.74)
ds
Então,
µ
mc [Ds u] = F µ , (1.75)
µ µ
em que usamos a notação [Ds u] = (Ds ) ν uν .
Os símbolos de Christoffel aparecem quando generalizamos as componentes da métrica em
M4 , embora o espaço permaneça o mesmo. Um espaço pseudo-euclidiano, sendo plano, sempre
admite um sistema de coordenadas retangular tal que ηµν seja representada pela matriz diago-
nal (1.36) constante. No entanto, sistemas de coordenadas não são essenciais na descrição física
de um fenômeno. Por exemplo, um sistema de coordenadas "esférico-polar" em M4 resulta em
componentes não constantes para a métrica. O mesmo ocorre para referenciais não inerciais:
um referencial não inercial que observa uma partícula livre vai observar uma aceleração dife-
rente de zero em seu próprio sistema de coordenadas. O termo em Γ presente em (1.73) dá conta
exatamente deste fenômeno, e é geralmente conhecido como um termo de força inercial. Quando
o sistema referencial é não inercial, a aceleração é redefinida por
µ duµ
αµ ≡ [Ds u] = + Γµαβ uα uβ , (1.76)
ds
de modo que
mcαµ = F µ . (1.77)
Contudo, em um sistema inercial com coordenadas cartesianas, ηµν são constantes e, portanto,
Γµαβ = 0. A equação (1.77) se aplica, assumindo a forma
d2 xµ
mc = F µ, (1.78)
ds2
que é a generalização relativística da segunda lei de Newton.
1.10 Momento linear e Energia

Em mecânica clássica, uma partícula de velocidade v tem momento linear p ≡ mv e energia
cinética K = mv2 /2. Se a partícula for sujeita a uma força conservativa, tal força é proporcional
ao gradiente de uma energia potencial V , e sua energia mecânica é dada por E = K + V . Fun-
damentalmente, entretanto, momento e energia são definidos como constantes de movimento
relacionadas a simetrias do sistema físico: se as equações de movimento são invariantes por
translações espaciais, existe uma quantidade conservada que corresponde ao momento linear.
Se as equações de movimento são invariantes por evolução temporal, existe uma quantidade
conservada que corresponde à energia do sistema. Se as equações são invariantes por rotações
espaciais, tal quantidade conservada é o momento angular.
23
Em sistemas relativísticos, vamos procurar pelos mesmos invariantes dinâmicos. Vamos tra-
balhar com a ação (1.56). Contudo, vamos supor um observador em um referencial inercial, com
um relógio que marca o tempo t em um sistema de coordenadas retangular. Para este observador,
temos
ˆ r
dxµ dxν
S = −mc dt ηµν . (1.79)
dt dt
O sistema de coordenadas é dado por xµ = (ct, x), de modo que

ˆ ˆ p
s 2 i 2
dx0 dx
S = −mc dt − = −mc dt c2 − v2
dt dt
ˆ r ˆ 2
2 v2 mc
= −mc dt 1 − 2 = − dt . (1.80)
c γ
Neste caso, a lagrangeana de uma partícula relativística medida por um observador inercial em
coordenadas cartesianas é dada por
1
L = −mc2 γ −1 , γ=p . (1.81)
1 − v 2 /c2
Uma translação espacial infinitesimal é definida por uma transformação x → x0 = x + c, em

que c é um 3-vetor constante. Neste caso, definimos
δx = x0 − x = c. (1.82)
A variação em S induzida por (1.82) é dada por

ˆ ˆ ˆ ˆ
mc2 mc2

δS = δ dt − = dtδ − = − dt mc2 δγ −1 = dt mc2 γ −2 δγ, (1.83)
γ γ
em que

−1/2 1 −3/2
= δ 1 − v 2 /c2 1 − v 2 /c2 δ 1 − v 2 /c2

δγ = −
2
1 γ3 2 γ3
= 2
δv = 2 v · δv. (1.84)
2c c
Temos
dx0 dx d
δv = − = δx, (1.85)
dt dt dt
portanto,
γ3 d
δγ = v · δx,
c2 dt
e
ˆ ˆ
2 −2 γ3 d
δS = dt mc γ δγ = dt mc2 γ −2 v · δx
c2 dt
ˆ
d
= dt mγv · δx
dt
ˆ ˆ
d dv
= dt (mγv · δx) − dt mγ · δx. (1.86)
dt dt
Observe as equações (1.77), mcαµ = F µ . Se F µ = 0, ou seja, no caso da partícula livre,

as equações de movimento são as de acelerações nulas, αµ = 0. Em um referencial inercial
24
com coordenadas cartesianas, αµ = (0, a), em que a = dv/dt. Portanto, uma partícula livre
relativística tem 3-aceleração zero, o que anula a segunda integral de (1.86). Assim,
ˆ ˆ
d d
δS = dt (mγv · δx) = dt (mγv · c) . (1.87)
dt dt
A invariância por translações implica em δS = 0. Portanto,
d
(mγv · c) = 0
dt
e, como c é um vetor constante,
d
(mγv) = 0. (1.88)
dt
Portanto, a quantidade mγv é um invariante dinâmico devido à invariância da ação com relação
a translações espaciais. Assim,
Definição 6. A quantidade invariante temporal
p ≡ mγv (1.89)
é denominada 3-momento linear da partícula descrita pela lagrangeana (1.81).
Vemos, então, que uma redefinição de momento linear é necessária no caso relativístico. No
caso da Energia, ela deve aparecer como um invariante diante da evolução temporal do sistema.
Evolução temporal é dada pela transformação infinitesimal t → t0 = t − δt. Essa transformação
induz a seguinte transformação nas coordenadas:
dx
δt = t0 − t =⇒ δx = δt = δt v. (1.90)
dt
Usando resultados anteriores, vemos que
ˆ ˆ ˆ
mc2 mc2 mc2

δS = δ dt − = δdt − + dtδ −
γ γ γ
ˆ 2
ˆ
mc d
= δdt − + dt (mγv · δx)
γ dt
ˆ ˆ
mc2

d
= δdt − + dt (mγv · vδt) . (1.91)
γ dt
Note que
dt0

dδt dδt
δdt = dt0 − dt = dt − dt = 1+ dt − dt = dt = dδt. (1.92)
dt dt dt
Então,
ˆ ˆ ˆ ˆ
mc2 mc2 mc2
2
mc
δdt − = dδt − = d − δt + δtd
γ γ γ γ
ˆ 2
ˆ 2
d mc d mc
= dt − δt + dt δt.
dt γ dt γ
Temos
mc2 γ3

d dγ dv
= −mc2 γ −2 = mc2 γ −2 2 v · = mγv · a = 0. (1.93)
dt γ dt c dt
25
O resultado é dado por
ˆ ˆ ˆ
mc2 mc2

d d d 2
δS = dt − δt + dt (mγv · vδt) = dt mγv − δt .
dt γ dt dt γ
Podemos ainda colocar δS na forma

ˆ
mc2 v2

d
δS = dt − 1 − γ 2 2 δt ,
dt γ c
em que
v2 1 v2 v2 c2 − v2 + v2 1
1 − γ2 2
= 1 − 2 2 2
= 1 − 2 2
= 2 2
= = γ2.
c 1 − v /c c c −v c −v 1 − v2 /c2
Assim,
ˆ
d
mγc2 δt .

δS = − dt (1.94)
dt
Invariância por evolução temporal implica em δS = 0, o que resulta, tomando-se δt constante,

em
d
mγc2 = 0.

(1.95)
dt
Então,
Definição 7. A quantidade invariante temporal
E ≡ mγc2 (1.96)
é denominada a energia da partícula descrita pela lagrangeana (1.81).
Assim, vemos que as quantidades p e E são invariantes dinâmicos, constantes por evolução
temporal, quando medidos por observadores inerciais. Se o observador estiver em repouso com
relação à partícula, v = 0 e, neste caso, p = mv e E = mc2 : o momento linear coincide com o da
mecânica clássica, enquanto a energia da partícula toma a forma famosa proposta por Einstein.
De fato, a equação para a energia de uma partícula relativística revela que ela possui, indepen-
dente de seu movimento, um conteúdo de energia intrínseco que é proporcional a sua massa.
Este fato contrasta com a mecânica newtoniana, que prevê energia zero para uma partícula li-
vre em repouso. Na mecânica relativística, todo corpo massivo tem um conteúdo de energia que
equivale ao seu conteúdo de massa.
Na literatura, é comum que m seja denominada m0 , a massa de repouso da partícula. Essa
massa é definida como a energia de repouso da partícula, dividida por c2 . Se o observador está
em movimento uniforme com relação à partícula, m0 é substituída por m0 γ, o que indica que tal
observador mede uma massa mγ = m0 γ a partir do conteúdo de energia da partícula. Isto ocorre
porque, como a partícula está em movimento com relação ao observador, a energia de repouso
deve sofrer o acréscimo de um conteúdo de energia cinética. Esta interpretação, contudo sofre
de certos problemas fundamentais. Como veremos, o conteúdo de massa de um sistema físico,
como uma partícula ou um campo, deve ser definido como um invariante de Lorentz. Este é o
caso de m0 , mas não de mγ . Por esta razão, vamos denominar m0 ≡ m como a massa do sistema,
enquanto seu conteúdo de energia E = mγc2 depende, por outro lado, do referencial, não sendo
um invariante de Lorentz.
26
1.11 4-momento linear e o invariante de Lorentz p2
Resta a questão, portanto, de se descobrir quais são as quantidades conservadas que são, de
fato, invariantes por transformações de Lorentz. Mais uma vez, a resposta está no problema
variacional mais geral
ˆ ˆ
p
S = −mc ds = −mc ηµν dxµ dxν . (1.97)
A trajetória é definida por funções xµ (s), em que s está relacionado ao tempo próprio. Agora,
vamos nos perguntar algo distinto da questão respondida na seção 1.10. Em vez de encontrar
as quantidades conservadas no tempo t medido por um relógio com um observador inercial,
queremos encontrar as quantidades conservadas pela linha de mundo da partícula, ou seja,
objetos para os quais os quais
dT
= 0, (1.98)
ds
seja T um observável tensorial.
Neste caso, vamos supor uma variação em s tal que
δs = s0 − s, (1.99)
que seja infinitesimal. Esta transformação implica na seguinte transformação nas coordenadas:
dxµ
δxµ = δs = uµ δs. (1.100)
ds
Já calculamos a forma geral da variação de S com relação a variações δxµ . Ela é dada pela
equação (1.67), ou seja,
ˆ γ ˆ
du
δS = mc dsηµγ + Γγαβ uα uβ δxµ − d (mcuµ δxµ ) . (1.101)
ds
Esta equação nos dá a equação de movimento geodésica
duγ
+ Γγαβ uα uβ = 0,
ds
bem como os momentos lineares relativísticos pµ ≡ mcuµ . No caso dos momentos, eles são as
quantidades invariantes por translações no espaço-tempo, em que δxµ são constantes
Como a partícula obedece à equação geodésica, a primeira integral de (1.101) é nula. Com a
expressão
pµ pµ
uµ = , uµ = , (1.102)
mc mc
temos
ˆ ˆ
d d
δS = ds (mcuµ δx ) = ds (mcuµ uµ δs)
µ
ds ds
ˆ
d 1 µ
= ds pµ p δs . (1.103)
ds mc
A constante mc deve ser um escalar relativístico, enquanto tomamos também δs uma constante.
27
Se S é invariante pela variação δs, então δS = 0 e
d
(pµ pµ ) = 0. (1.104)
ds
Portanto, temos a quantidade conservada
p2 ≡ pµ pµ , (1.105)
que é também um invariante relativístico.

Como estamos tratando do caso de uma partícula livre de massa m, As definições foram
construídas de modo a generalizar conceitos newtonianos. Neste caso,
p2 = pµ pµ = m2 c2 1uµ uµ = m2 c2 . (1.106)
Se o sistema físico não é uma partícula massiva, a ação (1.97) já não é aplicável. Por exemplo,
para uma partícula sem massa, S é identicamente nula para qualquer caminho em M4 . Ainda
assim, p2 é um invariante relativístico, desta vez de massa nula. Ou seja, para uma partícula
sem massa,
p2 = 0. (1.107)
De fato, todo sistema físico, especialmente campos relativísticos, possuem um observável de

momento linear que é conservado quando o sistema é isolado. Isto ocorre porque translações
são parte da simetria da relatividade restrita, de modo que podemos sempre procurar pelos
observáveis que são geradores dessa simetria. Veremos como isto é construído no momento
apropriado.
Para a partícula livre, temos
p2 = p20 + pi pi ,
em que p0 = mcγ = E/c, sendo E a energia da partícula, e pi = mcui = mγv = p, de acordo com
a definição (1.89). Assim,
E2
p2 = − p2 = m2 c2 ,
c2
ou seja,
E 2 = m2 c4 + p2 c2 . (1.108)
Esta relação, a despeito do fato de estarmos trabalhando com uma partícula relativística, é
universal para qualquer sistema físico. Se o sistema tem um conteúdo de massa diferente de
zero, o primeiro termo à direita de (1.108) diz respeito à contribuição da massa de repouso para
a energia do sistema. O segundo termo é aquele que reconheceríamos como a contribuição da
energia cinética.
Se a massa é nula, o primeiro termo é nulo mas o termo dependente do 3-momento ainda é
diferente de zero, no geral. Este é o caso, por exemplo, das ondas eletromagnéticas, ou fótons.
Então,
E 2 = p2 c2 =⇒ E = ± |p| c. (1.109)
Se a partícula tem massa m, seu 3-momento é dado por p = mγv, de modo que
p2 m2 γ 2 v2 γ 2 v2

2 2 4 2 2 2 4 2 4 2 4
E = m c +p c = m c 1+ 2 2 = m c 1+ =m c 1+ 2 = m2 γ 2 c4 ,
m c m 2 c2 c
28
que resulta em
E = ±mγc2 , (1.110)
como deduzido anteriormente. Os sinais ± em (1.109) e (1.110) foram alvo de grande debate
até a década de 1930: se se permitisse que as soluções de sinal negativo fossem físicas, isto
significaria a existência de um espectro de energia negativa para a partícula. De fato, isso não
faz sentido para o caso de uma partícula relativística, seja com ou sem massa. Entretanto,
veremos que a própria noção de partícula que temos utilizado é equivocada e carrega o peso da
tradição newtoniana. De fato, não há partícula relativística análoga à partícula newtoniana. A
interpretação correta dos sinais negativos para a energia é a de que partículas isoladas de fato
não existem, mas são componentes inseparáveis de campos relativísticos que possuem soluções
de frequências positivas e negativas, dando origem a partículas e anti-partículas em processos
quânticos.
29
30
Capítulo 2
Os Grupos de Lorentz e Poincaré
As transformações de Lorentz (1.14), usualmente denominadas boosts de Lorentz, não são a

única simetria dos sistema relativísticos. Também devem ser simetrias translações e rotações
espaciais, bem como a evolução temporal de observáveis. O conjunto completo dessas trans-
formações tem uma representação matricial, através de matrizes que pertencem a um espaço
vetorial. Este espaço vetorial é denominado Grupo de Poincaré. Neste capítulo, vamos traba-
lhar em uma introdução ao grupo de Poincaré com o ponto de vista da teoria de grupos.
2.1 Transformações infinitesimais em Rn

Vamos supor um espaço euclidiano de n dimensões Rn com um sistema de coordenadas xi . A
forma mais geral de uma transformação contínua em Rn é definida por um conjunto de m + 1
parâmetros (, λa ), em que a = 1, · · · , m. Com estes, definimos transformações nas coordenadas
e no tempo,
t → t̄ = t̄ () , xi → x̄i (t̄, λa ) = x̄i (, λa ) , (2.1)
com as seguintes condições:

1. As funções t̄ () e x̄i (, λa ) devem ser analíticas nas variáveis independentes.
2. As transformações devem ser conexas à identidade, ou seja,
(, λa ) → 0 =⇒ t̄ → t e x̄i (t̄) → xi (t) . (2.2)
Se as variáveis transformadas são analíticas, podem ser expandidas em séries de Taylor:

dt̄
+ O 2 ,

t̄ = t + (2.3a)
d =0

dx̄i dx̄i

x̄i = xi + λa + O 2 , λ2 .

+ a
(2.3b)
d ,λ=0
dλ ,λ=0

Considerando apenas termos de primeira ordem, temos

dt̄
t̄ ≈ t + , (2.4a)
d =0
dx̄i dt̄ dx̄i

i i
x̄ ≈ x + + λa (2.4b)
dt̄ d ,λ=0 dλa ,λ=0
dx̄i

dt̄
= xi + ẋi + λa (2.4c)
d =0 dλa ,λ=0
31
Nestas, definimos
dx̄i

dt̄ i
δt ≡ , δ̄x ≡ λa . (2.5)
d =0 dλa ,λ=0
Assim,
x̄i = xi + ẋi δt + δ̄xi . (2.6)
Neste caso, vemos que a forma final da transformação é dada por
dxi
δxi = δ̄xi + δt , (2.7)
dt
com
x̄i = xi + δxi , t̄ = t + δt. (2.8)
Portanto, transformações contínuas infinitesimais possuem a mesma forma analítica de primei-

ras variações. Neste caso, variações que dependem de um conjunto de parâmetros contínuos.
2.2 Evolução temporal
Vamos supor a transformação
t̄ = t + δt, (2.9)
mas que nenhuma transformação seja definida em xi . Ainda assim, (2.9) implica em
x̄i = xi + δtẋi , (2.10)
ou seja,
δxi = δtẋi . (2.11)
Se δt = dt, então temos dt = t̄ − t e δxi = dtẋi = dxi , que determina a evolução temporal dos
pontos em Rn em função do tempo.
Desejamos estudar as propriedades de composição de evoluções temporais. Primeiro, da equa-
ção (2.10) temos

i i i i d i d
x̄ = x + δtẋ = x + δt x = 1 + δt xi . (2.12)
dt dt
Assim, podemos realizar uma evolução temporal ao atuar o operador diferencial
d
gt ≡ 1 + δt (2.13)
dt
em xi , ou seja,
x̄i = gt xi . (2.14)
Sejam gt1 e gt2 dois operadores de evolução temporal. Notemos que
32
1. A composição de duas evoluções temporais é uma evolução temporal:
xi (t0 ) → xi (t1 ) → xi (t2 ) = gt2 xi (t1 ) = gt2 gt1 xi (t0 )

d d
= 1 + δt2 1 + δt1 xi (t0 )
dt dt

d d d d
= xi (t0 ) + δt1 xi (t0 ) + δt2 xi (t0 ) + δt2 δt1 xi (t0 ) . (2.15)
dt dt dt dt
O último termo é quadrático em δt, portanto ficamos apenas com os primeiros termos
d i d
xi2 = xi0 + δt1 x0 + δt2 xi0 = xi0 + (δt1 + δt2 ) ẋi0 = xi0 + δtẋi0 , (2.16)
dt dt
em que δt = δt1 + δt2 .
2. A ordem da composição não altera o resultado final:
gt2 gt1 q i = gt1 gt2 q i =⇒ [gt1 , gt2 ] = 0. (2.17)
3. A composição de k evoluções temporais é dada por

k k
Y k d
Gt = gtp = (gt ) = 1 + δt , (2.18)
p=1
dt
quando todos os δt0 s forem iguais. No limite para k → ∞, temos

k
∆t d d
Gt = lim 1+ = exp ∆t , ∆t = t − t0 . (2.19)
k→∞ k dt dt
Neste caso, dizemos que gt é membro de uma álgebra de Lie, enquanto Gt é membro de um
grupo de Lie. Este processo é conhecido como exponenciação da álgebra da evolução tempo-
ral, e dá origem a uma transformação finita, com ∆t finito, e não infinitesimal. Gt é simplesmente
o operador que carrega a evolução temporal de um tempo t0 a t. Em função de (2.17), a álgebra
é dita abeliana, ou comutativa.
No argumento da exponencial, há o campo vetorial
d
Xt = = q̇ i ∂i , (2.20)
dt
que acompanha o termo ∆t. Na forma infinitesimal, temos
gt = 1 + δtXt = 1 + δtq̇ i ∂i = 1 + δq i ∂i . (2.21)
O campo vetorial Xt é denominado gerador da evolução temporal.
2.3 Translações
Vamos supor a transformação
xi (t) → x̄i (t) = xi (t) + ai , ai ∈ R. (2.22)
Esta operação é chamada translação, pois translada um ponto a outro de Rn a tempo constante.
Neste caso,
δt = 0, δxi = ai . (2.23)
33
Duas translações resultam em uma translação, ou seja,
xi → x̄i = xi + ai → x
ei = x̄i + bi = xi + ai + bi = q i + ci ,
em que
ci = ai + bi .
Portanto, translações também formam um grupo. A natureza do grupo é a mesma da evolução

temporal: a ordem da composição não altera a translação total, ou seja, tal grupo é também
abeliano.
O operador infinitesimal que carrega a operação de translação pode ser deduzido pela igual-
dade
i

i i i i j ∂x j ∂
x̄ = x + a = x + a = 1+a xi , (2.24)
∂xj ∂xj
ou seja,
∂ ∂
gx ≡ 1 + ai = 1 + δxi i , (2.25)
∂xi ∂x
que tem a mesma forma da evolução temporal, exceto que neste caso, δxi = ai . O operador gx é
um elemento da álgebra de translações, que também é abeliana, ou seja,
[gx1 , gx2 ] = 0. (2.26)
A composição de k translações iguais resulta em

k
i j∂
x̄ = 1 + δx xi , (2.27)
∂xj
que no limite k → ∞ torna-se

k
∆xj ∂

i i j ∂
x̄ = lim 1+ x = exp ∆x xi = Gx xi , (2.28)
k→∞ k ∂xj ∂xj
em que

∂
Gx = exp ∆xj j (2.29)
∂x
é o elemento geral do grupo de translações. Os operadores diferenciais
∂
Pi ≡ (2.30)
∂xi
são os geradores de translações, denominados momentos conjugados.
2.4 Rotações
O grupo de rotações, por ser um exemplo não abeliano, merece uma atenção especial. Toda
rotação pode ser descrita pela relação
x̄i = Rij xj , (2.31)
34
em que R é uma matriz ortogonal n × n de determinante 1. O grupo de rotações em n dimensões
é chamado SO (n), o grupo ortogonal especial, que é isomórfico ao espaço das matrizes ortogonais
de determinante unitário. É uma propriedade das transformações ortogonais a preservação da
norma de vetores e da métrica de Rn .
Vamos tomar o exemplo tridimensional, em que consideraremos primeiro uma rotação pas-
siva no eixo ẑ com ângulo θ. A matriz desta transformação é dada por
cos θ − sin θ 0
 
Rz (θ) =  sin θ cos θ 0 . (2.32)

0 0 1
Para θ 1, podemos aproximar esta matriz pela sua forma infinitesimal de primeira ordem
1 −θ 0 1 0 0 0 −θ 0
     
rz (θ) =  θ 1 0 = 0 1 0 + θ 0 0  ≡ 1 + θJ z , (2.33)

0 0 1 0 0 1 0 0 0
em que
0 −1 0
 
Jz ≡  1 0 0 . (2.34)
0 0 0
Nos outros eixos, temos
rx (θ) = 1 + θJ x , ry (θ) = 1 + θJ y , (2.35)
em que
0 0 0 0 0 1
   
Jx ≡  0 0 −1  , Jy ≡  0 0 0 . (2.36)
0 1 0 −1 0 0
As matrizes J a são os geradores de rotações em três dimensões.
Uma rotação geral em três dimensões contém três parâmetros independentes, que podem ser
colecionados em um vetor θ ≡ (θ1 , θ2 , θ3 ). Na forma infinitesimal, temos
r (θ) = 1 + θ · J = 1 + θa J a = 1 + θ1 J 1 + θ2 J 2 + θ3 J 3 . (2.37)
Dizemos que o objeto
0 −θ3 θ2
 
W = θ a J a =  θ3 0 −θ1  , (2.38)
−θ2 θ1 0
é um elemento da álgebra de Lie de SO (3), denotado pelo símbolo so (3). A identidade 1, em

conjunto com os geradores J a , formam uma base para a álgebra so (3). A relação de comutação
de so (3) é facilmente calculada por
[J a , J b ] = abc J c , (2.39)
o que caracteriza a álgebra como não abeliana. A exponenciação da álgebra é direta, dada por
R (θa ) = exp [−θa J a ] . (2.40)
35
Agora, vamos definir
p
θ ≡ θ 2 = |θ| , u ≡ θ/ |θ| . (2.41)
A forma geral de um elemento do grupo é dada por
c + (1 − c) u1 u1 (1 − c) u1 u2 − su3 (1 − c) u1 u3 − su2
 
R =  (1 − c) u1 u2 − su3 c + (1 − c) u2 u2 (1 − c) u2 u3 − su1  , (2.42)

(1 − c) u1 u3 − su2 (1 − c) u2 u3 − su1 c + (1 − c) u3 u3
em que
c ≡ cos θ, s ≡ sin θ. (2.43)
Em componentes, temos
Rij = δji − ijk uk sin θ + ui uj − δji (1 − cos θ)

(2.44)
Vamos atuar a matriz R no vetor u:
Rij uj = δji − ijk uk sin θ + ui uj − δji (1 − cos θ) uj

= δji uj − ijk uk uj sin θ + ui uj uj − δji uj (1 − cos θ)

= ui − ijk uk uj sin θ + ui uj uj − δji uj (1 − cos θ)

= ui + u2 − 1 ui (1 − cos θ) = (1) ui ,

(2.45)
ou seja, u é um autovetor de R cujo autovalor é 1. Este é o denominado eixo de rotação.

Quando atua em um vetor posição x, temos
Rij xj = xi − ijk uk xj sin θ + ui uj xj − xi (1 − cos θ)

= xi − ijk uk xj sin θ + ui uj xj − ui uj xj cos θ − xi + xi cos θ

= −ijk uk xj sin θ + ui uj xj − ui uj xj cos θ + xi cos θ
i
= (u × x) sin θ + ui (u · x) + xi − ui (u · x) cos θ.

(2.46)
Nesta equação,
i
xk ≡ ui (u · x) (2.47)
é a componente de x paralela a u e
i
x⊥ ≡ xi − ui (u · x) (2.48)
é sua componente ortogonal. Assim,
Rx = xk + x⊥ cos θ + (u × x) sin θ. (2.49)
Agora, vamos voltar ao espaço Rn . Uma rotação finita é descrita por
x̄i = Rij xj , (2.50)
enquanto a infinitesimal tem forma
1 ∂ x̄i

x̄i (ω) = xi + δxi (ω) = xi + δω ab , (2.51)
2 ∂ω ab ω=0
em que ω ab são as componentes de uma matriz n × n antissimétrica, com m = n2 − n /2 com-

36
ponentes independentes. Dizemos que m é o número de parâmetros independentes necessários
para parametrizar a transformação infinitesimal, que deve ter a forma
x̄i (ω) = xi + δω ij xj . (2.52)
Neste caso,
1 ∂ x̄i ∂ x̄i

1
δxi = δω ab
= xj δω ab , considerando linearidade em x̄. (2.53)
2 ∂ω ab ω=0 2 ∂ω ab ∂xj ω=0
Assim, definimos
∂ x̄i

i
(Jab ) j ≡ , (2.54)
∂ω ab ∂xj ω=0
de modo que
∂ x̄i

1 i 1
(Jab ) j xj δω ab = xj δω ab = xj δω ij . (2.55)
2 2 ∂ω ab ∂xj ω=0
A solução para a equação anterior é dada por

i
(Jab ) j ≡ δaj δbi − δbj δai . (2.56)
A relação destes objetos com os geradores Ja é dada por
i 1 bc i
(Ja ) j = (Jbc ) j , (2.57)
2 a
e, assim,
(Ja )ij = −aij . (2.58)
Dizemos que os geradores na forma (2.58) estão na representação adjunta do grupo de rotações,
pois são representados por matrizes que possuem a mesma dimensão do grupo.
2.5 Os grupos de Lorentz e Poincaré
A forma mais geral congrega as transformações de Lorentz estudadas no capítulo 1, também

denominadas boosts de Lorentz, bem como as transformações de translações espaciais, evolução
temporal e rotações espaciais. No espaço-tempo de Minkowski, rotações espaciais se restringem
à parte espacial, enquanto boosts são pseudo-rotações entre o eixo temporal e os espaciais. Ve-
mos que, enquanto as rotações envolvem funções trigonométricas ordinárias, boosts envolvem
funções trigonométricas hiperbólicas.
Genericamente, rotações e boosts podem ser tratados como uma única "rotação" em M4 . Se
em três dimensões temos a transformação
x01
  1
R12 R13
 1 
R1 x

x0 = Rx =⇒  x02  =  R21 R22 2 

R3 x2  , (2.59)
x03 R31 R32 3
R3 x3
37
em quatro dimensões temos
x00
  0
Λ01 Λ02 Λ03
 0
Λ0 x
 
0
 x01   Λ10 R11 R12 R13   x1 
 x02  =  Λ2
x = Λx =⇒     . (2.60)
0 R21 R22 R23   x2 
x03 Λ30 R31 R32 R33 x3
Rotações em M4 são, portanto, pseudo-rotações, em razão da métrica de Minkowski. De

fato, uma rotação é qualquer operação matricial ortogonal que deixa invariante uma métrica.
Observemos a métrica de Minkowski
ds2 = ηµν dxµ dxν . (2.61)
Se uma transformação de coordenadas
xµ −→ x0µ = Λµν xν , (2.62)
com Λ definido em (2.60), é uma transformação de Lorentz, então ds2 → ds02 = ds2 é um invari-
ante. Note que a diferencial se transforma como
dx0µ ν
dxµ −→ dx0µ = dx = Λµν dxµ , (2.63)
dxν
em que (2.62) foi usada, e Λ suposta constante. Dessa forma,
ds2 −→ ds02 = ηµν

0
dx0µ dx0ν = ηµν
0
Λµα Λνβ dxα dxβ .
Usando (2.61), temos que
0
ηµν Λµα Λνβ = ηαβ . (2.64)
Agora, suponha Λ−1 a matriz inversa de Λ, de modo que Λ−1 Λ = ΛΛ−1 = 1. Multiplicando
duas inversas à direita de (2.64), temos
0
ηαβ = ηµν Λµα Λνβ
α β α β
ηαβ Λ−1 γ Λ−1 λ = ηµν0
Λµα Λνβ Λ−1 γ Λ−1 λ

α β h α i h β i
ηαβ Λ−1 γ Λ−1 λ = ηµν0
Λµα Λ−1 γ Λνβ Λ−1 λ
α β
ηαβ Λ−1 γ Λ−1 λ = ηµν0 0
δγµ δλν = ηγλ .
Assim, temos
0
α β
ηµν = ηαβ Λ−1 µ
Λ−1 ν
. (2.65)
Do ponto de vista da álgebra matricial, precisamos saber precisamente o que (2.65) significa.
A maneira correta é colocar os índices de maneira concordante com a multiplicação matricial.
µ
Se A e B são matrizes, sendo Aµν e B µν suas componentes, temos (AB) ν = Aµα B αν . Ou seja, dois
índices repetidos devem estar sempre em sequência, o que não ocorre em (2.65). Esta expressão
está correta em si, mas para saber qual sequência de matrizes compõe a multiplicação no lado
direito, precisamos seguir esta regra. Neste caso,
0
α β α β
ηµν = ηαβ Λ−1 µ Λ−1 ν = Λ−1 µ ηαβ Λ−1 ν
h T i α β
= Λ−1 ηαβ Λ−1 ν . (2.66)
µ
38
O símbolo T significa a operação de transposição. O mesmo pode ser feito com a expressão (2.64):
0 0
ηαβ = ηµν Λµα Λνβ = Λµα ηµν Λνβ
µ 0
= ΛT α ηµν Λνβ .

(2.67)
Neste caso, podemos usar uma notação matricial. Seja Λ a matriz definida em (2.60), Λ−1 sua
inversa e ΛT sua transposta. Neste caso, (2.67) e (2.66) podem ser escritas, respectivamente, por
T
η = ΛT η 0 Λ, η 0 = Λ−1 ηΛ−1 , (2.68)
em que η e η 0 são as matrizes com componentes da métrica (2.61).

Vamos voltar à expressão (2.67). Multiplicando a inversa da métrica η µν à direita, obtemos
µ γµ
η γα ηαβ = δβγ = η γα ΛT α
0
ηµν Λνβ = ΛT 0
ηµν Λνβ .
À esquerda, podemos inserir uma identidade δνµ , de modo que

γµ γλ
δβγ = ΛT 0
ηµν Λνβ = ΛT δλµ ηµν
0
Λνβ
γλ 0
γ
= ΛT ηλσ η σµ ηµν Λνβ = ΛT σ η σν Λνβ
T γ
γ
δ σ Λνβ = ΛT ν Λνβ .

= Λ σ ν
Esta expressão nos mostra que
ΛT Λ = 1 =⇒ ΛT = Λ−1 , (2.69)
ou seja, Λ é uma matriz ortogonal. Com esta nova informação, (2.68) torna-se mais simples:
η = ΛT η 0 Λ, η 0 = ΛηΛT , (2.70)
T
visto que Λ−1 = Λ para matrizes ortogonais.
Tomando-se o determinante de (2.81), obtemos
2
det ΛT Λ = 1

=⇒ (det Λ) = 1, (2.71)
ou seja,
det Λ = ±1. (2.72)
Agora, estamos em posição de definir:
Definição 8. O grupo de Lorentz é definido pelo conjunto de transformações lineares

ortogonais que preserva a métrica de Minkowski.
A dimensão do grupo de Lorentz é 4 (quatro), de modo que este é isomórfico ao conjunto

das matrizes ortogonais 4 × 4 de determinante unitário. Este conjunto forma um grupo com a
operação de multiplicação matricial, denominado SO (1, 3). O sinal do determinante define se a
transformação é conexa à identidade ou à anti-identidade. Por enquanto, estamos interessados
em transformações conexas à identidade. A razão é que essas transformações são contínuas e
formam um grupo de Lie. Exemplos com det Λ = −1 não são contínuos, por exemplo as operações
de paridade e reversão temporal, que analisaremos apropriadamente mais tarde.
39
O grupo de Lorentz SO (1, 3) é, portanto, o grupo de pseudo-rotações em M4 . A denominação
entre parênteses caracteriza o fato de que um elemento do grupo é uma pseudo-rotação: (1, 3)
indica que a direção temporal x0 é diferente das 3 direções espaciais. Neste caso, dizemos que
SO (1, 3) é um grupo pseudo-ortogonal, e é obviamente distinto do grupo de rotações em quatro
dimensões SO (4). Este último consiste no grupo que deixa invariante uma métrica euclidiana
em R4 .
Translações espaciais e evolução temporal não são transformações de Lorentz, mas também
são simetrias da métrica (2.61). No espaço de Minkowski, ambas as transformações são descritas
por translações espaço-temporais:
xµ −→ x0µ = xµ + aµ , (2.73)
em que aµ são constantes reais. Assim como as translações espaciais, as translações em M4

formam um grupo de Lie abeliano.
Em conjunto com as translações, as transformações de Lorentz são representadas pelas trans-
formações
xµ −→ x0µ = Λµν xν + aµ , (2.74)
que recebem o nome de transformações de Poincaré. A unificação matricial que dá origem

às transformações (2.74) é possível em um espaço de dimensão 5. Neste caso, vamos supor uma
matriz coluna com componentes xI , em que I = 0, 1, 2, 3, 4. Neste caso,
x0I = LIJ xJ ,
que escrevemos matricialmente por

    
x00 Λ00 Λ01 Λ02 Λ03 a0 x0
 x01   Λ1 R11 R12 R13 a1  x1 
   0  
x0 = Lx =⇒  x02  =  Λ20 R21 R22 R23 a2 x2 . (2.75)
    

 03   3
 x   Λ0 R31 R32 R33 a3 x3
 
 
1 0 0 0 0 1 1
O conjunto de todas as matrizes L que preservam a métrica de Minkowski forma um grupo

denominado grupo de Poincaré. Este grupo, que tem 5 dimensões, não é um grupo de rotações,
mas contém o grupo de Lorentz como subgrupo. Em razão da forma da matriz L, este grupo
também recebe o nome de grupo de Lorentz inomogêneo, com o símbolo ISO (1, 3).
2.6 Vetores e covetores de Lorentz

Agora, vamos considerar um espaço-tempo de Minkowski M4 com um sistema de coordenadas
cartesiano {xµ }. Como vimos, este espaço é caracterizado pela métrica
2 2 2 2
ds2 = ηµν dxµ dxν = dx0 − dx1 − dx2 − dx3 . (2.76)
Uma transformação de Lorentz é dada por uma matriz Λ na forma
x̄ = Λx ←→ x̄µ = Λµν xν . (2.77)
A métrica deve ser preservada por transformações de Lorentz.
40
Definição 9. Um vetor de Lorentz, ou vetor de Lorentz contravariante, consiste
em um objeto u = uµ ∂µ = uµ (∂/∂xµ ) invariante por transformações de Lorentz, ou seja,
x̄ = Λx =⇒ ū (x̄) = u (x) . (2.78)
Note que, dado (2.77),
∂ ∂ x̄ν ∂ ∂ ν
∂µ = = = Λ = Λνµ ∂¯ν .
∂x µ ∂xµ ∂ x̄ν ∂ x̄ν µ
Se a matriz Λ tem uma inversa Λ−1 , então multiplicamos a expressão anterior por Λ−1 :
µ µ µ
Λ−1 λ
∂µ = Λ−1 λ
Λνµ ∂¯ν = Λνµ Λ−1 λ
∂¯ν = δλν ∂¯ν ,
ou seja,
ν ν
∂¯µ = Λ−1 µ
∂ν = ΛT µ
∂ν = Λµν ∂ν . (2.79)
Aplicando-se a invariância em u, temos
u = uµ ∂µ = uµ Λνµ ∂¯ν = ūν ∂¯ν .
Portanto,
ūµ = Λµν uν . (2.80)
Assim, se um vetor u = uµ ∂µ é invariante de Lorentz, suas componentes se transformam com a

mesma forma do sistema de coordenadas. Dizemos que componentes de vetores que se transfor-
mam como (2.80) transformam-se contravariantemente.
A métrica (2.76) naturalmente implica em uma métrica para os vetores de Lorentz, de modo
que o produto escalar é dado por
u · v = ηµν uµ v ν . (2.81)
Se a métrica é invariante, este produto também o é.

Agora, definimos:
Definição 10. Todo vetor de Lorentz u possui um dual uT , denominado covetor, ou

vetor de Lorentz covariante, ou ainda 1-forma diferencial. Este objeto é um funcional
linear, ou seja, age em vetores e resulta em um escalar real tendo como regra o produto
escalar, de modo que
uT [u] ≡ u2 = ηµν uµ uν . (2.82)
A regra (2.82) define um isomorfismo entre vetores e covetores, de modo que uma base {∂µ } de
vetores induz uma base para os covetores. Esta base é naturalmente tomada como as diferenciais
41
{dxµ }, e toda 1-forma α pode ser escrita como α = αµ dxµ . Cada elemento da base é um covetor
que, ao agir sobre um elemento da base de vetores, resulta na operação
dxµ [∂ν ] = δ µν . (2.83)
Portanto, a ação de um covetor α em um vetor u é dada por
α [u] = αµ dxµ [uν ∂ν ] = αµ uν dxµ [∂ν ] = αµ uν δνµ = αµ uµ . (2.84)
Da mesma forma,
uT [u] = uµ dxµ [uν ∂ν ] = uµ uν dxµ [∂ν ] = uµ uµ = ηµν uµ uν . (2.85)
Então,
uµ = ηµν uν , (2.86)
ou seja, a métrica é a matriz jacobiana do isomorfismo entre vetores e covetores. Dizemos assim
que a métrica "baixa" índices de componentes de vetores e os transforma em componentes de
covetores.
Seja η −1 a inversa da matriz métrica, de modo que suas componentes sejam dadas por η µν :
η ηλν = δνµ . Podemos mostrar que
µλ
uµ = η µν uν , (2.87)
ou seja, a métrica inversa "levanta" índices de componentes de covetores, transformando-os em

componentes contravariantes.
Covetores também são invariantes por transformações de Lorentz, ou seja,
x̄ = Λx =⇒ ᾱ (x̄) = α (x) . (2.88)
Então,
ūT [ū] = ūµ ūµ = ūµ Λµν uν = uν uν , (2.89)
de modo que uν = ūµ Λµν , ou,

ν ν
ūµ = uν Λ−1 µ
= uν ΛT µ
= Λµν uν . (2.90)
Assim, componentes de covetores se transformam com a inversa da transformação. Dizemos que

esta transformação é covariante.
2.7 Tensores
Definição 11. Um tensor do tipo (p, q) é um objeto geométrico invariante de Lorentz

com a forma
p vezes
z }| {
µν···λ
(∂µ ⊗ ∂ν ⊗ · · · ⊗ ∂λ ) dxα ⊗ dxβ ⊗ · · · ⊗ dxγ .

T = Tαβ···γ (2.91)
| {z }
q vezes
42
As leis de transformação das componentes de base são dadas por
∂¯µ = Λµν ∂ν , trans. covariante,

dx̄µ = Λµν dxµ , trans. contravariante.
Portanto,
p trans. contravariantes
z }| {
α β γ
T̄τδ···ρ −1 −1 −1 µν···λ
Λδµ Λν · · · Λρλ

ψ···φ = Λ τ
Λ ψ
··· Λ φ
Tαβ···γ . (2.92)
| {z }
q trans. covariantes
Por exemplo, a métrica é um tensor do tipo (0, 2), ds2 = ηµν dxµ dxν . Então, suas componentes se
transformam por
η̄µν = Λµα Λνβ ηαβ . (2.93)
2.8 Álgebra de Lorentz

Vamos nos ater ao grupo de Lorentz por enquanto. Este grupo é um grupo de Lie, ou seja, possui
uma estrutura diferenciável. Na prática, isto significa que toda transformação de Lorentz pode
ser "expandida em série de Taylor" ao redor da identidade do grupo:
1 ∂ 2 Λ

∂Λ a
Λ = 1 + a δ + δa δb + · · · , (2.94)
∂ =0 2 ∂a ∂b =0
em que a é um conjunto de parâmetros linearmente independentes que caracteriza uma repre-

sentação do grupo. Se o grupo age em vetores e covetores, por exemplo, estes parâmetros serão
em número seis, mas podem ser colocados sob a forma de uma matriz 4 × 4 antissimétrica de
traço nulo.
Se tomarmos a expansão até o termo de ordem 1, temos

∂Λ a
gΛ ≡ 1 + a δ = 1 + a Ja . (2.95)
∂
Esta é a forma geral de um elemento da álgebra de Lie de SO (1, 3), que denominados a álgebra
so (1, 3). Ja formam um conjunto de operadores também linearmente independentes, que são os
geradores da álgebra. A forma explícita de Ja depende do objeto geométrico no qual o grupo atua,
portanto, de sua representação. Por enquanto, vamos supor que Λ seja uma matriz real.
Se o grupo é ortogonal, temos
T
ΛT Λ = 1 =⇒ (gΛ ) gΛ = 1.
Assim,
T T
1 = (1 + a Ja ) 1 + b Jb = 1 + a Ja + (a Ja ) ,

ou seja,
T
a Ja = − (a Ja ) .
Se a são parâmetros reais, temos
Ja = −JaT , (2.96)
43
ou seja, os operadores Ja são antissimétricos. Por outro lado, é fácil verificar que se det Λ = 1,
det Ja = 0.
Por outro lado, consideremos W = a Ja um elemento da álgebra. Temos
η̄ = ΛT ηΛ = 1 + W T η (1 + W ) ,

que resulta em
η̄ ≈ η + ηW + W T η,
em primeira ordem. Se Λ preserva a métrica, η̄ = η e, então,
ηW + W T η = 0,
ou
W T = −ηW η −1 . (2.97)
Vamos tomar o traço desta expressão:
trW T = tr −ηW η −1 = −tr ηW η −1 = −tr η −1 ηW = −trW.

(2.98)
Contudo, trW T = trW , então devemos ter que trW = 0.

Portanto, cada elemento do grupo de Lorentz SO (1, 3) é conectado a um elemento da álgebra
so (1, 3), que forma o conjunto das matrizes antissimétricas de traço nulo. A relação álgebra-
grupo de Lie se dá através da operação de exponenciação da álgebra: Se W é um elemento
genérico da álgebra de Lie, seu respectivo elemento de grupo é dado por
Λ = exp (W ) . (2.99)
2.9 A representação adjunta

Uma representação pode ser compreendida intuitivamente como uma realização de um grupo
abstrato através de um grupo matricial. Quando atuamos um elemento do grupo de Lorentz em
um vetor de Lorentz, por exemplo, os geradores J são realizados por um conjunto de matrizes
µ
Jab de elementos (Jab ) ν , com a, b = 1, 2, 3, 4. Neste caso, um elemento da álgebra é dado por
µ µ
(gΛ ) ν = δνµ + ω ab (Jab ) ν , (2.100)
em que ω ab forma uma matriz antissimétrica de traço nulo nos índices ab. Eles são, portanto,
seis parâmetros independentes.
O grupo SO (1, 3) é um subgrupo de GL (1, 3), ou seja, é um subgrupo de todas as matrizes
4 × 4 de determinante não nulo. O grupo GL (1, 3) forma um espaço vetorial, cuja base mais
simples consiste no conjunto de matrizes
µ
(∆ab ) ν = δaµ ηbν . (2.101)
Por exemplo,
1 0 0 0 0 −1 0 0 0 0 −1 0
     
 0 0 0 0   0 0 0 0   0 0 0 0 
∆11 =  , ∆12 =   , ∆13 =  , ··· .
 0 0 0 0   0 0 0 0   0 0 0 0 
0 0 0 0 0 0 0 0 0 0 0 0
44
Toda matriz de GL (1, 3) pode ser escrita por
µ
Aµν = Aab (∆ab ) ν . (2.102)
Esta base, denominada base canônica, é completa e linearmente independente. De fato, nesta
base uma matriz tem componentes iguais ao seus elementos, ou seja, Aab = Aµν .
Vamos tomar a multiplicação matricial ∆ab ∆dc
µ λ µ
(∆ab ) λ (∆cd ) ν = δaµ ηbλ δcλ ηdν = ηbc δaµ δdν = ηbc (∆ad ) ν .
O colchete de Lie é dado por

h i
µ λ µ λ µ λ
(∆ab ) λ , (∆cd ) ν = (∆ab ) λ (∆cd ) ν − (∆cd ) λ (∆ab ) ν ,
que resulta em
h i h i
µ λ µ
(∆ab ) λ , (∆cd ) ν = δae ηbc δdf − δce ηda δbf (∆ef ) ν . (2.103)
Portanto, a álgebra é caracterizada pelos colchetes

(ef )
[∆ab , ∆cd ] = C(ab)(cd) ∆ef , (2.104)
com constantes de estrutura

(ef )
C(ab)(cd) = δae ηbc δdf − δce ηda δbf . (2.105)
Portanto, de (2.104) vemos que gl (1, 3) é uma álgebra de Lie não abeliana.
Note que as matrizes
Jab = ∆ab − ∆ba (2.106)
são antissimétricas, possuem traço nulo e são linearmente independentes. Neste caso, elas for-
mam uma base para um subespaço de matrizes: são os geradores da álgebra so (1, 3). Suas
componentes são dadas por
µ
(Jab ) ν = δaµ ηbν − δbµ ηaν . (2.107)
Note que
[Jab , Jcd ] = [∆ab − ∆ba , ∆cd − ∆dc ] = [∆ab , ∆cd ] − [∆ab , ∆dc ] − [∆ba , ∆cd ] + [∆ba , ∆dc ]

(ef ) (ef ) (ef ) (ef )
= C(ab)(cd) − C(ab)(dc) − C(ba)(cd) + C(ba)(dc) ∆ef

= δae ηbc δdf − δce ηda δbf − δae ηbd δcf + δde ηca δbf ∆ef

+ −δbe ηac δdf + δce ηdb δaf + δbe ηad δcf − δde ηcb δaf ∆ef
= δae ηbc δdf (∆ef − ∆f e ) + δbe ηad δcf (∆ef − ∆f e )

+δde ηca δbf (∆ef − ∆f e ) + δce ηdb δaf (∆ef − ∆f e ) .
Com (2.106) temos

[Jab , Jcd ] = δae ηbc δdf + δbe ηad δcf + δde ηca δbf + δce ηdb δaf Jef

= δbe ηad δcf + δae ηbc δdf − δae ηbd δcf − δbe ηac δdf Jef
(ef )
= f(ab)(cd) Jef , (2.108)
45
em que as constantes de estrutura são
(ef )
f(ab)(cd) = δbe ηad δcf + δae ηbc δdf − δae ηbd δcf − δbe ηac δdf . (2.109)
Em forma explícita, temos a álgebra
[Jab , Jcd ] = ηad Jbc + ηbc Jad − ηdb Jac − ηac Jbd . (2.110)
Neste caso, os geradores Jab , definidos por (2.106) e (2.107), da álgebra de pseudo-rotações em
quatro dimensões, são os geradores da representação adjunta deste grupo. A representação
adjunta também é chamada, em física, de representação vetorial, porque realiza o grupo de
pseudo-rotações em vetores de M4 .
2.10 Invariantes
Uma álgebra de Lie é um espaço vetorial com uma base completa {Ja }, o conjunto de geradores
da álgebra. Neste caso, podemos definir um produto interno. Sejam dois elementos A = Aa Ja e
B = B a Ja da álgebra, temos
1 a b
A · B ≡ tr Aa B b Ja Jb = A B + Ab B a tr (Ja Jb ) ≡ γab Aa B b .

(2.111)
2
Nesta expressão,
µ µ ν
tr (Ja Jb ) = (Ja Jb ) µ = (Ja ) ν (Jb ) µ . (2.112)
Os objetos
1
γab ≡ tr (Ja Jb ) (2.113)
2
são componentes da denominada métrica de Killing. Se a métrica de Killing tem sinal definido
e é não degenerada, ela define um bom produto interno. Neste caso, uma álgebra de Lie é
também um espaço de Hilbert.
Elementos do grupo de Lie podem agir em elementos da álgebra. Por exemplo, uma rotação
em R3 age sobre um gerador Ja na forma
Ja −→ R−1 Ja R. (2.114)
Neste caso,
tr (Ja Jb ) −→ tr R−1 Ja RR−1 Jb R = tr R−1 Ja Jb R = tr RR−1 Ja Jb = tr (Ja Jb ) ,

ou seja, a métrica de Killing é invariante por rotações:
R−1 γab R = γab . (2.115)
Tratando-se de transformações infinitesimais, R = 1 + ω a Ja ,
R−1 γR = 1 + ω a JTa γ 1 + ω b Jb

= γ + ω a γJa + ω a JTa γ + ω a ω b JTa γJb

≈ γ + ω a γJa + JTa γ = γ,

portanto,
γJa + JTa γ = γJa − Ja γ = [γ, Ja ] = 0. (2.116)
46
A métrica de Killing, então, comuta com os geradores.
Neste caso, todo escalar construído com a métrica de Killing é um invariante. Contudo,
em um sistema dinâmico de dimensão finita, somente um número finito desses invariantes são
linearmente independentes. No caso de rotações em três dimensões, há apenas um invariante
J 2 = γab Ja Jb , (2.117)
que é o quadrado do momento angular. Este tipo de invariante é denominado invariante de

Casimir da álgebra. Para cada representação do grupo de rotações, o problema de autovalores
J 2 uj = αj uj
indica um espectro de autovalores de J 2 . Como J 2 é um invariante, o espectro também é invari-

ante. No caso do momento angular, é sempre possível escrever
J 2 uj = j (j + 1) uj . (2.118)
Neste caso, dizemos que j é o spin da representação. É fácil verificar para o grupo de rotações
que, na representação adjunta, j = 1 quando os autovetores são vetores euclidianos.
Para grupos de álgebras de Lie mais gerais, é possível encontrar outros invariantes de Ca-
simir, cada um deles uma forma multilinear invariante, como (2.117). O número maximal de
invariantes independentes é denominado rank da álgebra de Lie. O grupo de rotações tem rank
1: apenas J 2 é invariante. Em uma determinada representação, os autovalores desses operado-
res de Casimir também são invariantes pela ação do grupo, portanto o espectro é invariante. O
resultado é que uma representação é completamente determinada pelos espectros dos operado-
res de Casimir do grupo, então as quantidades físicas relevantes quando há uma simetria sob
determinado grupo de Lie são dadas pelos objetos geométricos que são autovetores simultâneos
dos operadores de Casimir.
2.11 A álgebra de Poincaré

...
47
48
Capítulo 3
O formalismo lagrangeano para

campos
3.1 Introdução
Agora, vamos nos voltar à análise do problema variacional de se encontrar condições necessá-
rias e suficientes para que uma dada integral fundamental tome um valor extremo (máximo ou
mínimo) local. Este problema variacional é comum em diversas áreas da física e da matemática
que compartilham de quantidades geométricas que assumam, por requerimentos físicos ou pu-
ramente matemáticos, um valor máximo ou mínimo. Por exemplo, o problema variacional que
descreve fenômenos da ótica geométrica consiste em encontrar a trajetória do raio de luz para a
qual o tempo de propagação seja mínimo (princípio de Fermat). A dinâmica de partículas relati-
vísticas, como outro exemplo, refere-se ao problema de se encontrar trajetórias no espaço-tempo
que maximizem o tempo próprio.
Problemas variacionais na mecânica clássica [?, ?], disciplina na qual o cálculo variacional
encontrou seu maior terreno de desenvolvimento, precisam ser definidos com base em espaços
não tão facilmente intuídos. Um sistema físico neste cenário é descrito por uma trajetória em um
espaço de configuração Qn formado por suas coordenadas generalizadas q a , em que a = 1, . . . , n
e n indica a dimensão de Qn . Tal trajetória é definida pelas equações paramétricas
γ : q a = q a (t) , (3.1)
em que t é um parâmetro relacionado univocamente com o tempo. O problema variacional con-

siste em encontrar condições necessárias e suficientes para que a integral fundamental
ˆ t1
A [γ] ≡ L (t, q a , q̇ a ) dt, (3.2)
t0
em que q̇ a ≡ dq a /dt, assuma um valor extremo sobre C, fornecida uma função Lagrangiana L que
dependa do tempo, das coordenadas e de suas velocidades. Neste caso, precisamos que as funções
q a (t) sejam pelo menos de classe C 2 . Este problema variacional recebe o nome de princípio de
Hamilton quando a primeira variação das coordenadas generalizadas em t = t0 e t = t1 é nula.
A aplicação direta do princípio de Hamilton leva às equações de Euler-Lagrange
d ∂L ∂L
a
− a = 0, (3.3)
dt ∂ q̇ ∂q
que são as equações diferenciais que ditam a dinâmica da teoria.

O caráter do tempo como parâmetro de evolução nessas teorias é bastante especial. Em pri-
meiro lugar, é um parâmetro de evolução único: a integral (3.2) é uma integral simples e as
49
soluções das equações (3.3), se existirem, são famílias de curvas de 1-parâmetro que dependem
de um conjunto de condições iniciais. Em segundo lugar, embora seja sempre possível um pro-
cesso de reparametrização, a integral fundamental não é independente da escolha do parâmetro.
Por isso, as equações de Euler-Lagrange não são apenas equações que descrevem uma dada
geometria no espaço de configuração, mas possuem também a interpretação de equações que
caracterizam um sistema dinâmico finito.
Por causa do papel especial do tempo, o formalismo Hamiltoniano pode ser naturalmente
introduzido e a mecânica clássica pode ser analisada através do espaço de fase T ∗ Qn , onde as
equações de movimento tomam a forma de um conjunto de equações de primeira ordem. No
espaço de fase há a introdução de uma estrutura simplética natural, através da qual é possível
conhecer a forma da evolução de qualquer observável físico sem a necessidade da resolução das
equações de movimento. Além disso, as propriedades geométricas do espaço de fase permitem
que o efeito de transformações sobre observáveis sejam imediatamente reconhecidos, indepen-
dentemente da dinâmica específica da teoria. Dentre as transformações mais importantes estão
as transformações canônicas, que preservam o elemento de volume do espaço de fase. A impor-
tância desse formalismo canônico para a física não pode ser subestimada, visto que a mesma
estrutura formal está presente também na mecânica quântica.
O cálculo variacional para a mecânica clássica envolve também os teoremas de Noether, que
dizem respeito a identidades obedecidas quando a integral fundamental (3.2) é invariante por
alguma classe de transformações, assim como o formalismo de Hamilton-Jacobi.
O mesmo quadro para teorias de campos não pode ser traçado tão naturalmente. Como vere-
mos, campos são sistemas que dependem de um conjunto de parâmetros, geralmente identifica-
dos com as coordenadas cartesianas do espaço-tempo. A integral fundamental que caracteriza o
problema variacional, análoga à integral (3.2), é uma integral múltipla. Além disso, os sistemas
em campos mais importantes na física são invariantes por reparametrizações. Essas caracterís-
ticas fazem desses sistemas essencialmente distintos dos sistemas clássicos, nos quais o tempo
tem um papel privilegiado. Em especial, não há uma forma única de dinâmica Hamiltoniana e,
tampouco, um único formalismo de Hamilton-Jacobi possível. Outro aspecto das teorias de cam-
pos mais importantes para a física são as simetrias de gauge, que são características de sistemas
singulares.
3.2 Variações
Um campo pode ser descrito por um conjunto de n funções φi (x), em que x representa um
ponto no espaço-tempo de 4 dimensões, localmente descrito por um sistema de coordenadas
xµ = x0 , x1 , x2 , x3 em um dado volume Ω. Todas as nossas considerações serão restritas ao

sistema contido nesse volume. O índice i varia de 1 a n. Vamos trabalhar em um espaço de con-
figuração construído da seguinte forma. Os campos φ são coordenadas de uma variedade Qn de
dimensão n. Em conjunto com essa variedade, definimos também um espaço para os parâmetros,
R4 . O espaço de configuração vem a ser o produto direto definido por Q ≡ Qn × R4 , de modo que
o volume Ω, o qual será tratado também como o domínio dos campos φ, esteja imerso em Q.
Vamos supor que os campos sejam funções de classe C ∞ , de modo que podemos definir todas
as suas derivadas
dφi
φiµ ≡ ≡ ∂µ φi , φiµν ≡ ∂µ ∂ν φi , .... (3.4)
dxµ
Uma configuração φ dos campos é definida como os valores dos campos e de suas derivadas
primeiras, ou velocidades, em cada ponto do espaço-tempo:
φ : φi (x) , φiµ (x) , ∀ x ∈ R4 .

(3.5)

Consideremos, agora, a existência de uma densidade Lagrangiana L xµ , φi , φiµ , contendo
50
derivadas dos campos até primeira ordem. Com essa densidade Lagrangiana definimos a ação
ˆ
L xµ , φi , φiµ dω,

A [φ] ≡ (3.6)
Ω
em que usamos a notação dω ≡ dx0 dx1 dx2 dx3 .
Para definir o problema variacional, vamos considerar uma transformação ativa no espaço
de configuração, que pode ser imaginada como um arraste suave dos campos e dos parâmetros.
Existe uma configuração física φ (x), que será arrastada suavemente para uma configuração
φ0 (y), de modo que a topologia e geometria do espaço de configuração e, consequentemente do
espaço de Minkowski, seja preservada. Isto significa que não serão permitidas transformações
que envolvam "colar" e "furar" o espaço-tempo, nem transformações que mudem a métrica de
Minkowski. A configuração física φ (x) deve ser um extremo da integral fundamental.
Para realizar esta transformação, vamos fazer da configuração φi um membro de uma família
de configurações de 1-parâmetro, definida por
φi = φi (xµ , u) ; φiµ = φiµ (xµ , u) ; · · · ,

φ (u) : (3.7)
pelo menos de classe C 2 em u. Se uma dada configuração φ (u0 ) é um extremo da integral funda-
mental (3.6), correspondendo à configuração física do sistema, A (u0 ) deve ser menor (ou maior)
que um valor A (u) calculado em uma configuração φ (u), pertencente a uma vizinhança fechada
|u − u0 | de φ (u0 ). Supondo |u − u0 | um número muito pequeno, desprezando termos de ordem
2
maior ou igual a |u − u0 | , a expansão de φ (u) em série de Taylor ao redor da configuração φ (u0 )
pode ser escrita por
dφi (xα , u)

i α i α
φ (x , u) ≈ φ (x , u0 ) + δu, (3.8)
du
u=u0
e assim também para as derivadas dos campos, em que δu ≡ u − u0 . Esta é a fórmula de

primeira ordem para a comparação entre duas configurações φ (u0 ) e φ (u) para um conjunto fixo
de parâmetros xµ . Ela nos permite definir a primeira variação dos campos a ponto fixo, dada
pela expressão
dφi

δ̄φi ≡ φi (xµ , u) − φi (xµ , u0 ) = δu. (3.9)
du u=u0
A mesma expressão é válida para as derivadas. Por exemplo, temos a primeira variação de φaµ :

i
dφ µ
δ̄φiµ ≡ φiµ (xα , u) − φiµ (xα , u0 ) = δu

du

u=u0
d2 φi d dφi

d
δu = µ δ̄φi .

= δu = µ
dxµ du u=u0 dx du u=u0 dx
Na expressão acima, usamos a derivada total definida por

ˆ
d ∂ i δ i δ i δ
≡ + dωx φ α (x) + φ µα (x) + φ µνα (x) + · · · . (3.10)
dxα ∂xα Ω δφi (x) δφiµ (x) δφiµν (x)
A integral que aparece na expressão acima atende ao fato de que campos são, de forma rigorosa,
tratados como distribuições do espaço-tempo: as derivadas com relação aos campos são derivadas
funcionais e não simples derivadas parciais. Por essa razão usamos o símbolo δF (x) /δφ (y) para
caracterizar a derivada funcional de uma função F (x), aplicada em um ponto x do volume Ω,
com relação a uma função φ (y), aplicada em um ponto y do mesmo domínio. A relação mais
51
fundamental vem a ser
δφi (x)
= δji δ 4 (x − y) , (3.11)
δφj (y)
em que temos a delta de Dirac de dimensão 4:

( ˆ
4 0 se x 6= y,
δ (x − y) = , δ 4 (x − y) d4 x = 1. (3.12)
∞ se x = y. M4
No geral podemos ignorar a escrita das integrais, de modo a não sobrecarregar a notação, o que
faremos em boa parte do trabalho. Contudo, quando somas em derivadas funcionais aparecem,
integrais geralmente as acompanham e devemos ficar atentos a este fato. Por exemplo, usaremos

repetidamente expressões do tipo φiµ δL/δφi , com L sendo a densidade Lagrangiana, que devem
ser lidas como
ˆ
i δL (y)
dωx φµ (x) i . (3.13)
Ω δφ (x)
A primeira variação (3.9), portanto, é o termo de primeira ordem da comparação entre duas
configurações infinitesimalmente próximas, mantendo fixos o conjunto de parâmetros xµ e, por-
tanto, o domínio Ω. Podemos generalizar este argumento e considerar também a comparação
com configurações que variem os parâmetros. Basta considerarmos
φ0 (u) : φ0i = φ0i (y µ , u) ; φ0i 0i µ

µ = φµ (y , u) , (3.14)
em que os parâmetros y µ representam coordenadas de um volume Ω0 do espaço-tempo. Podemos

escolher esta configuração de modo que y µ = xµ para u = u0 e, assim, ambos os conjuntos estão
relacionados pela equação
dy µ

µ µ ν µ
y = y (x , u) ≈ y + δu, (3.15)
du u=u0
em que, por último, tomamos a expansão até primeira ordem em δu.

Com a variação dos parâmetros, temos a primeira variação total
dφi (y µ , u) dφi (y µ , u) dy β

0i µ i µ
φ (y , u) ≈ φ (y , u0 ) + δu + δu
du
u=u0 dy β du u=u0
= φi (xµ , u0 ) + δ̄φi + φaβ u=u δxβ ,

0
ou seja,
δφi ≡ δ̄φi + φiβ δxβ , (3.16)
em que
dy β

β
δx ≡ δu. (3.17)
du u=u0
3.3 A primeira variação da ação

Vamos escrever a integral fundamental para a configuração φ (u0 ):
ˆ
L xµ , φi , φaµ dω,

A (u0 ) = (3.18)
Ω
52
assim como para a configuração φ0 (u):
ˆ
L y µ , φ0a , φ0a
0
A (u) = µ dω , (3.19)
Ω0
em que dω 0 ≡ dy 0 dy 1 . . . dy d . A primeira variação total da ação é definida por

dA (u)
δA ≡ A (u) − A (u0 ) ≈ δu. (3.20)
du u=u0
O operador
d
δ ≡ δu (3.21)
du
é um operador diferencial de primeira ordem, que obedece às propriedades de uma derivada
ordinária: é linear e obedece à regra de Leibniz. Neste caso, vamos calcular
ˆ ˆ
L xµ , φi , φaµ dω =

δA = δ (δLdω + Lδdω) . (3.22)
Ω Ω
A variação total atua sobre o elemento de volume na seguinte forma:

µ µ
dy dy
δ (dω) = dω 0 − dω = det dω − dω = det − 1 dω.
dxν dxν
Note que y µ = xµ + δxµ , então
dy µ d (δxµ )
ν
= δνµ + .
dx dxν
O determinante é dado por
d(δx0 ) d(δx0 ) d(δx0 ) d(δx0 )

 
1 + dx0 dx1 dx2 dx3
( ) d(δx1 ) d(δx1 ) d(δx1 )
µ  d δx1 
dy 
0 1 + dx1 dx2 dx3

det = det  d(dx .
 
dx ν δx2 ) d(δx2 ) d(δx2 ) d(δx2 )

 dx0 dx1 1 + dx2 dx3


d(δx3 ) d(δx3 ) d(δx3 ) d(δx3 )
dx0 dx1 dx2 1 + dx3
É fácil verificar que, em primeira ordem, o determinante é aproximado por

µ
dy d (δxµ )
det = 1 + . (3.23)
dxν dxµ
Então,
d (δxµ ) d (δxµ )

δ (dω) = 1 + µ
− 1 dω = dω. (3.24)
dx dxµ
Na integral, temos
ˆ ˆ
d (δxµ )

δA = (δLdω + Lδdω) = δL + L dω.
Ω Ω dxµ
Note que
d (δxµ ) d dL
L = µ (Lδxµ ) − δxµ µ ,
dxµ dx dx
53
e, neste caso,
ˆ
d µ µ dL
δA = δL + (Lδx ) − δx dω
Ω dxµ dxµ
ˆ ˆ
dL d
= δL − δxµ µ dω + dω µ (Lδxµ ) ,
Ω dx Ω dx
ou,
ˆ ˆ
d
δA = δ̄Ldω + dω (Lδxµ ) , (3.25)
Ω Ω dxµ
em que
dL
δ̄L = δL − δxµ . (3.26)
dxµ
Primeiro, vamos calcular
dL ∂L δL δL
δL = δu = δxµ µ + δφi i + δφiµ i . (3.27)
du ∂x δφ δφµ
Por outro lado,

dL ∂L δL δL
δxµ = δxµ + φiµ i + φiµν i , (3.28)
dxµ ∂xµ δφ δφν
de modo que
dL
δ̄L = δL − δxµ
dxµ
µ ∂L i δL i δL µ ∂L i δL i δL
= δx + δφ + δφµ i − δx + φµ i + φµν i
∂xµ δφi δφµ ∂xµ δφ δφν
δL δL
δφi − δxµ φiµ + δφiµ − δxµ φiµν

= ,
δφi δφiν
ou,

µ d i δL µ d δL
δ̄L = δ − δx φ + δ − δx φiν i
dxµ δφi dxµ δφν
δL δL
= δ̄φi i + δ̄φiµ i . (3.29)
δφ δφµ
Vamos calcular agora a variação
δ̄φiµ = δφiµ − δxν φiνµ . (3.30)
Primeiro,
dφi dφ0i dφi dxν dφ0i dφi

δφiµ = δ = − = −
dxµ dy µ dxµ dy µ dxν dxµ
ν 0i i
dx dφ dφ
= − µ.
dy µ dxν dx
54
Note que xµ = y µ − δxµ . Portanto,
d dφ0i dφi
δφiµ = µ
(y ν − δxν ) ν − µ
dy dx dx
0i
ν
dφi dφ0i d (δxν ) dφ0i dφi

d (δx ) dφ
= δµν − µ ν
− µ = µ
− µ ν
− µ
dy dx dx dx dy dx dx
ν 0i
d d (δx ) dφ
φ0i − φi −

=
dxµ dy µ dxν

d δφi 0i 2 0i

d ν dφ ν d φ
= − δx + δx .
dxµ dy µ dxν dy µ dxν
Em primeira ordem,

d δφi i
d 2 φi

d ν dφ
δφiµ = µ
− µ
δx ν
+ δxν µ ν
dx dx dx dx dx
d
δφi − δxν φiν + δxν φiνµ

=
dxµ
d
δ̄φi + δxν φiνµ ,

= µ
(3.31)
dx
que resulta em
d d
δ̄φiµ = δ̄φi + δxν φiνµ − δxν φiνµ = µ δ̄φi .

µ
(3.32)
dx dx
Temos
δL δL δL d δL
δ̄L = δ̄φi + δ̄φiµ i = δ̄φi i + µ δ̄φi
δφi δφµ δφ dx δφiµ

δL d δL d δL
= δ̄φi i
− µ i + µ δ̄φi i . (3.33)
δφ dx δφµ dx δφµ
Na integral,
ˆ ˆ
d
δA = δ̄Ldω + dω µ (Lδxµ )
dx
ˆΩ Ω
ˆ
i δL d δL d µ i δL
= δ̄φ − dω + dω Lδx + δ̄φ . (3.34)
Ω δφi dxµ δφiµ Ω dxµ δφiµ
Vamos deixar a primeira integral como está, mas desejamos escrever a segunda integral como
combinações lineares das variações totais dos campos. Vamos usar δ̄φ = δφ − δxµ φµ :
ˆ ˆ
i δL d δL d µ ν i δL i δL
δA = δ̄φ − µ i dω + dω µ Lδx − δx φν i + δφ
Ω δφi dx δφµ Ω dx δφµ δφiµ
ˆ ˆ
i δL d δL d i δL i δL µ ν
= δ̄φ − µ dω + dω µ δφ − φν i − δν L δx .
Ω δφi dx δφiµ Ω dx δφiµ δφµ
Vamos definir
δL i
Hµν ≡ φ − ηµν L, (3.35)
δφiµ ν
assim,
ˆ ˆ
δL d δL d i δL
δA = δ̄φi − dω + dω δφ − H µ
ν δxν
. (3.36)
Ω δφi dxµ δφiµ Ω dxµ δφiµ
55
3.4 Os termos de fronteira
A integral
ˆ
d δL i µ ν
dω µ δφ − H ν δx
Ω dx δφiµ
é uma integral de uma divergência total no volume Ω. Segundo o teorema de Gauss, a integral
de um divergente de um campo vetorial em um volume Ω deve ser igual à integral da projeção
ortogonal do mesmo campo vetorial na fronteira ∂Ω de Ω, ou seja,
ˆ ˆ
dF µ (x)
dω µ
= dσnµ (x) F µ (x) ,
Ω dx ∂Ω
em que nµ (x) são componentes de um vetor unitário tangente a ∂Ω em determinado ponto x.

Neste caso,
ˆ ˆ
d δL i µ ν δL i µ ν
dω µ δφ − H ν δx = dσnµ δφ − H ν δx . (3.37)
Ω dx δφiµ ∂Ω δφiµ
Por esta razão, integrais de divergentes em um problema variacional são denominados termos
de fronteira, já que eles dependem apenas das configurações e variações dos campos na fronteira
de Ω.
O campo vetorial relevante é dado por
δL
Φµ ≡ δφi − Hµν δxν , (3.38)
δφµi
e é uma combinação linear de δφ e δx. Os coeficientes são
δL i
Hµν = φ − ηµν L, (3.39)
δφµi ν
que são as componentes de um objeto que recebe o nome de densidade de energia-momento.

Há, também, os coeficientes
δL
πiµ ≡ , (3.40)
δφiµ
que são denominados momentos conjugados covariantes. Veremos mais adiante que essas quan-
tidades são fundamentais na definição de quantidades conservadas e invariantes do problema
variacional.
3.5 Os princípios de Hamilton e Weiss e as equações de

campo
Um princípio físico é necessário para que se defina a configuração física dos campos. É usual, a
princípio, a utilização do princípio de Hamilton:
56
Proposição 2. O Princípio de Hamilton para campos.
Seja uma configuração de campos φ e uma integral fundamental, ou ação A, definida a

partir de uma densidade Lagrangiana L = L (x, φ, φµ ). Considere, também, uma vari-
ação dos campos δφ que não modifique o volume Ω ⊂ M4 e seja nula na fronteira ∂Ω.
Neste caso, φ é uma configuração física do sistema se a ação for estacionária quando
calculada nesta configuração, em comparação com a ação calculada sobre qualquer ou-
tra configuração φ0 em uma vizinhança fechada de φ.
A condição necessária, mas não necessariamente suficiente, para que a ação seja estacionária
é dada por δA = 0, ou seja, a primeira variação da ação tendo como base a configuração esta-
cionária deve ser nula. Nas condições do princípio de Hamilton, a variação δφ deve ser tal que
δxµ = 0 e δφi (x)x∈∂Ω = 0.

(3.41)
Neste caso, a primeira variação da ação, (3.36), toma a forma

ˆ ˆ
i δL d δL d
dω µ πiµ δφi ,

δA = δφ i
− µ i
dω +
Ω δφ dx δφµ Ω dx
visto que δ = δ̄ quando δx = 0. O termo de fronteira envolve o cálculo de δφ na fronteira de Ω,

ˆ ˆ
d µ i
dσx nµ (x) πiµ (x) δφi (x)x∈∂Ω ,

dω µ πi δφ =
Ω dx ∂Ω
que é nulo devido à segunda condição (3.41).

Neste caso,
ˆ
δL d δL
δA = δφi − dω. (3.42)
Ω δφi dxµ δφiµ
O volume Ω é fixado a priori. Contudo, o procedimento acima deve ser válido para qualquer
volume no qual o sistema de coordenadas cartesiano {xµ } seja válido e, também, no qual os
campos sejam bem definidos. Sem perda de generalidade, podemos considerar Ω arbitrário.
Além disso, as variações δφi devem ser linearmente independentes: a variação de um campo φi
não pode depender da variação de uma campo φj para j 6= i. A condição de extremo δA = 0
implica em que a integral (3.42) seja nula. Se Ω é arbitrário e δφi são LI, o termo entre colchetes
deve ser nulo, ou seja,
δL d δL
i
− µ i = 0. (3.43)
δφ dx δφµ
Essas são as equações de campo, são as equações de Euler-Lagrange da ação (3.6).
57
Observação 2. O princípio de Hamilton pode ser flexibilizado na condição de que δφ seja
nulo na fronteira. Ainda mantendo Ω fixo, é suficiente que os momentos covariantes
sejam tangentes a ∂Ω na fronteira, ou seja,
nµ (x) πiµ (x)|x∈∂Ω = 0. (3.44)
Isto implica na nulidade dos termos de fronteira e resulta nas mesmas equações de
campo. Esta condição, contudo, restringe as configurações físicas àquelas que obede-
cem ao vínculo (3.44), que se torna uma condição de contorno.
Um segundo princípio é mais geral e permite variações no volume Ω:
Proposição 3. O Princípio de Weiss.
Seja uma configuração de campos φ e uma integral fundamental, ou ação A, definida a

partir de uma densidade Lagrangiana L = L (x, φ, φµ ). Sejam uma variação dos campos
δφ = φ0 (y) − φ (x) e uma variação no volume δx = y − x, infinitesimais e arbitrários.
Neste caso, φ (x) é uma configuração física do sistema se a primeira variação da ação
depender apenas da fronteira de Ω.
O princípio de Weiss permite, portanto, variações arbitrárias no espaço de configuração, ou

seja, permite todo arraste de campos que respeite a topologia e a geometria do espaço-tempo, ao
contrário do princípio de Hamilton. Se a primeira variação só depende da fronteira, existe pelo
menos um conjunto de funções F µ tais que
ˆ ˆ
dF µ
δA = dω µ = dσ |nµ (x) F µ (x)|x∈∂Ω .
Ω dx ∂Ω
Neste caso, δx 6= 0 e δφ = δ̄φ − δxµ φµ , de modo que

ˆ ˆ ˆ
dF µ

i δL d δL d i δL µ ν
δA = δ̄φ − dω + dω δφ − H ν δx = dω .
Ω δφi dxµ δφiµ Ω dxµ δφiµ Ω dxµ
Para que δA não dependa do volume, temos a condição

ˆ
i δL d δL
δ̄φ − µ i dω = 0,
Ω δφi dx δφµ
que deve ser respeitada com Ω arbitrário e δ̄φi linearmente independentes. Neste caso, temos
δL d δL
− µ i = 0,
δφi dx δφµ
que são as equações de campo (3.43) da ação.

No princípio de Weiss, não se exige que os termos de fronteira sejam nulos. Contudo, depen-
dendo do volume Ω em consideração, condições de contorno nos campos e nas velocidades talvez
sejam necessárias para garantir a existência das integrais.
58
3.6 Simetrias da ação
Vamos supor uma transformação infinitesimal
xµ → x̄µ = xµ + δxµ , φi (x) → φ̄i (x̄) = φi (x) + δφi . (3.45)
Um funcional de ação A é denominado invariante sob estas transformações se a ação calculada

nas novas variáveis,
ˆ

Ā φ̄ = dω̄L x̄, φ̄, φ̄µ , (3.46)
Ω̄
for igual à ação calculada nas antigas variáveis

ˆ
A [φ] = dωL (x, φ, φµ ) , (3.47)
Ω
ou seja,
Ā = A. (3.48)
A condição (3.48) pode ser escrita através da diferença finita
∆A = Ā − A = 0. (3.49)
Vamos supor que δxµ são funções analíticas de um conjunto de parâmetros aµ e que δφi
são funções analíticas de um conjunto de m parâmetros λa , em que a toma os valores de 1 a
m. Portanto, as transformações (3.45) fazem parte de uma classe de transformações contínuas.
Além disso, temos a condição
(aµ , λa ) → 0 =⇒ δx = δφ = 0 =⇒ x̄µ = xµ , φ̄i = φi , (3.50)
para as quais dizemos que as transformações são conexas à identidade.

Se as transformações são contínuas e conexas à identidade, podemos expandir Ā em série de
Taylor:

0 dĀ dĀ
a µ
λa + O λ2 .

Ā λ =A+ µ
a + a
(3.51)
da a,λ=0
dλ a,λ=0

Colecionando apenas termos até primeira ordem, temos
Ā ≈ A + δA, (3.52)
em que δA é uma primeira variação de A com relação às transformações (3.45), ou seja,
∆A ≈ δA, (3.53)
em primeira ordem da aproximação de Taylor.

Uma condição necessária para que ∆A seja nulo é, claramente, que δA seja nulo para as
transformações (3.45). É claro que esta condição não é suficiente, de modo que podemos definir
o que denominamos invariância fraca. A ação A é fracamente invariante sob as transformações
(3.45) se δA = 0. De agora em diante, sempre que nos referirmos a uma invariância, esta se
refere a uma invariância fraca. Uma invariância forte, em que ∆A = 0 é, claramente, também
uma invariância fraca.
As transformações que deixam um funcional invariante são chamadas simetrias deste funci-
onal. Simetrias contínuas e conexas à identidade, caracterizadas pelos m + 4 parâmetros aµ e
59
λa , podem ser explicitamente colocadas na forma
dx̄µ

δxµ = aν
daν a,λ=0
dφ̄i dφ̄i dφ̄i dx̄ν dφ̄i

i µ a µ
δφ = a + λ = a + λa
daµ a,λ=0 dλa a,λ=0 dx̄ν daµ a,λ=0 dλa a,λ=0
dxν dφ̄i

= φiν aµ
+ λa = δxµ φiµ + δ̄φi ,
daµ a,λ=0 dλa a,λ=0
em que
dφ̄i

δ̄φi = λa .
dλa a,λ=0
Nessas expressões, definimos
dx̄µ dφ̄i

µ i
Γν ≡ , Υa≡ , (3.54)
daν a,λ=0 dλa a,λ=0
que são funções independentes dos parâmetros. Em resumo,
δxµ = Γµν aν , δφi = φiµ δxµ + δ̄φi = φiµ Γµν aν + Υia λa . (3.55)
3.7 A equação de Lie
A primeira variação de A sob uma transformação infinitesimal geral caracterizada pelas funções
δxµ e δφi foi calculada em (3.36), resultando em
ˆ ˆ
δL d δL i d i δL µ ν
δA = dω − µ i δ̄φ + dω µ δφ − H ν δx . (3.56)
Ω δφi dx δφµ Ω dx δφiµ
Com as definições (3.55),

ˆ
δL d δL i a d µ i λ ν µ i a µ ν γ

δA = dω − Υ a λ + π φ Γ a + π Υ λ − H Γ a .
Ω δφi dxµ δφiµ dxµ i λ ν i a ν γ
Se δA = 0 em um volume Ω arbitrário, então

δL d δL d
− µ i Υia λa = − µ πiµ φiν − H µν Γνγ aγ + πiµ Υia λa .

(3.57)
δφi dx δφµ dx
Esta é a equação diferencial de Lie.
3.8 O primeiro teorema de Noether
Vamos separar, por conveniência, as transformações exclusivamente nos campos (δxµ = 0), das
transformações exclusivamente no ponto do espaço-tempo (δφ = 0). No primeiro caso, temos
δxµ = Γµν aν = 0, portanto tomaremos Γ = 0 em (3.57). Então,

δL d δL d
Υia λa = − µ πiµ Υia λa .

i
− µ i
δφ dx δφµ dx
60
Agora, vamos considerar os parâmetros λa independentes do ponto, ou seja, constantes em xµ .
Neste caso, se λa são linearmente independentes, temos

δL d δL d
Υia = − µ πiµ Υia .

i
− µ i
(3.58)
δφ dx δφµ dx
Dizemos que essas são transformações internas globais. Internas, pois consistem em m trans-
formações exclusivamente nos campos, sem mudança nas coordenadas de M4 . Globais, pois são
transformações a parâmetros constantes, que não dependem do ponto do espaço-tempo. Com
(3.58), podemos enunciar a forma matemática do primeiro teorema de Noether:
Teorema 1. Primeiro teorema de Noether (versão matemática).

Para cada simetria da ação, existe uma combinação linear das equações de campo que
é igual a uma divergência total.
Este teorema também vale no segundo caso, em que δφ = 0, consistindo em transformações

exclusivamente no espaço-tempo. Neste caso, temos δ̄φi = −δxµ φiµ , resultando em Υia λa =
−φiµ Γµν aν . Então, (3.57) torna-se

δL d δL d
φiµ Γµγ = − H µν Γνγ ,

i
− µ i µ
(3.59)
δφ dx δφµ dx
com aµ constantes. Então, temos o caso em que quatro simetrias resultam em quatro combina-
ções lineares das equações de Euler-Lagrange iguais a quatro divergências totais.
Toda simetria global (com parâmetros constantes) pode ser separada em uma transformação
interna e uma transformação no ponto, de modo que o caso misto não é de muito interesse.
Simetrias internas possuem uma enorme relevância em teorias de campos, como por exemplo
as transformações de gauge. Por outro lado, toda teoria de campo relativística é invariante pelo
grupo de Poincaré, que consiste em translações e pseudo-rotações em M4 . Transformações de
Poincaré são transformações globais no ponto, portanto.
Outra versão do primeiro teorema de Noether pode ser formulada a partir da equação de Lie

δL d δL d
− µ i δ̄φi = − µ πiµ δφi − H µν δxν ,

i
(3.60)
δφ dx δφµ dx
agora escrita na forma geral. Note que, se as equações de campo são satisfeitas,
δL d δL
− µ i = 0,
δφi dx δφµ
a seguinte divergência é nula:
dΦµ
= 0, Φµ ≡ πiµ δφi − H µν δxν . (3.61)
dxµ
No caso de transformações internas globais, temos
Φµ = πiµ δφi = πiµ Υia λa ,
ou seja,
dΦµ d
πiµ Υia = 0.

=0 =⇒
dxµ dx µ
61
As funções Φµa ≡ πiµ Υia são denominadas correntes próprias, e as equações
dΦµa
=0 (3.62)
dxµ
são denominadas equações de continuidade.
No caso de transformações no ponto, temos
Φµ = −H µν δxν = −H µν Γνλ aλ ,
que resulta em
dΦµ d
=0 =⇒ (H µν Γνλ ) = 0. (3.63)
dxµ dxµ
Neste caso, as correntes próprias são as funções Φµλ ≡ Hνµ Γνλ , que obedecem às equações de
continuidade dΦµν /dxµ = 0.
Teorema 2. Primeiro teorema de Noether (versão física I).

Para cada simetria da ação, existe uma equação de continuidade para um conjunto de
correntes próprias.
Equações de continuidade aparecem em toda teoria física com simetrias. Por exemplo, consi-
dere as equações de Maxwell com fontes
ρ
∇·E= , (3.64a)
ε0
∂E
∇ × B = µ0 j + µ0 ε0 . (3.64b)
∂t
Derivando a primeira equação parcialmente no tempo e tomando o divergente da segunda, temos
∂ ∂E 1 ∂ρ
(∇ · E) = ∇ · = ,
∂t ∂t ε0 ∂t
∂E
∇ · ∇ × B = µ0 ∇ · j + µ0 ε0 ∇ · = 0.
∂t
Portanto, a última equação resulta em
∂ρ
∇·j+ = 0, (3.65)
∂t
que é a equação de continuidade para a carga elétrica. Vamos introduzir a 4-corrente
ρ
jµ = ,j . (3.66)
c
Então,
∂ρ ∂j 0 ∂j 0 ∂j µ
∇·j+ =∇·j+c =∇·j+ = = 0. (3.67)
∂t ∂t ∂x0 ∂xµ
A corrente j µ é um exemplo de corrente de Noether própria, como veremos no estudo do campo
eletromagnético.
62
Outro exemplo consiste na equação de Schrödinger
∂ψ ~2 2
i~ =− ∇ ψ + V ψ. (3.68)
∂t 2m
Seu complexo conjugado resulta em
∂ψ ∗ ~2 2 ∗
−i~ =− ∇ ψ + V ψ∗ . (3.69)
∂t 2m
Multiplicando a primeira equação por ψ ∗ e a segunda por ψ, temos
∂ψ ~2 ∗ 2
i~ψ ∗ =− ψ ∇ ψ + V ψ ∗ ψ,
∂t 2m
∂ψ ∗ ~2
∇2 ψ ∗ ψ + V ψ ∗ ψ.

−i~ ψ=−
∂t 2m
Tomando a diferença, temos
∂ ~2
i~ (ψ ∗ ψ) = − ∇ · [ψ ∗ ∇ψ − ψ∇ψ ∗ ] .
∂t 2m
Definindo-se ρ = i~ψ ∗ ψ e j = ~2 /2m (ψ ∗ ∇ψ − ψ∇ψ ∗ ),

∂ρ
+ ∇ · j = 0, (3.70)
∂t
que é também uma equação de continuidade, desta vez para a probabilidade de transição em
mecânica quântica. Esta equação de continuidade também é resultante do primeiro teorema de
Noether, desta vez para a mecânica quântica.
3.9 Cargas conservadas

Agora, podemos trabalhar de forma mais geral. Se a ação possui uma simetria global, existe
uma corrente própria Φµā , em que ā = a para uma simetria interna e ā = µ para uma simetria de
ponto. A equação de continuidade é dada por
dΦµā
= 0. (3.71)
dxµ
Esta é uma equação diferencial parcial nas coordenadas, portanto tem um caráter local. Com
condições de contorno apropriadas, este tipo de equação também resulta em uma lei de conser-
vação global.
Primeiro, vamos supor um observador em repouso com relação à origem de um sistema de
coordenadas cartesiano {xµ }. Seu tempo próprio é a coordenada x0 /c = t, ou seja, seu relógio
mede um tempo t = x0 /c em seu referencial. Vamos supor, aqui, um sistema de unidades natural
em que c = 1. Este observador faz experiências sobre um conjunto de campos φi (x) em seu
laboratório, que tem volume V . Ele está interessado especialmente na integral da equação (3.71)
em Ω, de modo que
ˆ ˆ ˆ ˆ ˆ
dΦµ t1
dΦµ t1
dΦ0ā dΦkā

I= dω µā = dt d x µā =
3
dt 3
d x + , k = 1, 2, 3.
Ω dx t0 V dx t0 V dx0 dxk
Esta integral divide-se em duas:

ˆ t1 ˆ ˆ t1 ˆ
d ~ ā .
I= dt d3 xΦ0ā + dt d3 xdiv Φ
t0 dt V t0 V
63
Na segunda integral, podemos usar o teorema de Gauss em três dimensões. Ela resulta em
ˆ t1 ˆ ˆ t1 ˆ
dt ~ ā
d3 xdiv Φ = dt ~ ā .
d2 x n · Φ (3.72)
t0 V t0 A
Vamos supor que o observador expanda o volume ao infinito e, neste caso, ele supõe que as
~ ā vão a zero na fronteira de V . Portanto, a segunda integral é nula e
correntes tridimensionais Φ
ˆ t1 ˆ ˆ t1 ˆ ˆ t1
d
I= dt d3 xΦ0ā = d d3 xΦ0ā = d3 xΦ0ā . (3.73)
t0 dt V t0 V V t0
Se (3.71) é satisfeita, I = 0, de modo que

ˆ
d 3 0
d xΦā = 0. (3.74)
dt V
As quantidades
ˆ
Qā (t) ≡ d3 xΦ0ā (x, t) (3.75)
V
são denominadas cargas de Noether. Cargas são quantidades conservadas no tempo, visto que
dQā
= 0. (3.76)
dt
Teorema 3. Primeiro teorema de Noether (versão física II).

0 ~ ~ ā = 0 na fronteira de um volume tridimensional V , em
Seja Φā = Φā , Φā tal que n · Φ
que n é um vetor unitário ortogonal à superfície definida pela fronteira de V . Então,
´
para cada simetria da ação, existe uma carga Qā = V d3 xΦ0ā que é uma constante de
movimento.
Portanto, simetrias implicam em cargas conservadas, que são constantes de movimento do

ponto de vista de um observador inercial.
3.10 Translações e a conservação de energia e momento

Considere a transformação
δxµ = aµ , (3.77)
com coeficientes aµ constantes. Esta operação representa uma translação no espaço-tempo.

Neste caso,
δxµ = Γµν aν = aµ =⇒ Γµν = δνµ . (3.78)
Essas transformações são efetuadas de modo que δφi = 0, pois campos relativísticos são natural-
mente invariantes por translações. Então a equação de Lie torna-se

δL d δL d
− φiν δxν = − µ (H µν δxν ) ,
δφi dxµ δφiµ dx
64
que resulta em

δL d δL d
i
− µ i φiν = − µ (H µν ) . (3.79)
δφ dx δφµ dx
Se as equações de campo são satisfeitas,
δL d δL
− µ i = 0,
δφi dx δφµ
temos
d
(H µν ) = 0. (3.80)
dxµ
Portanto, existem quatro equações de continuidade para a densidade de energia-momento:
∂ 0 ~ ν = 0,
H +∇·H (3.81)
∂t ν

~ν .
em que consideramos H µν = H 0ν , H
Agora, é conveniente entendermos melhor o papel da densidade de energia-momento. Pode-
mos obter uma definição formal abaixo.
Definição 12. Densidade de energia-momento canônica.

Seja E o espaço vetorial dos vetores de Lorentz definidos em M4 e Φ o espaço de todas
as funções escalares de Lorentz definidas em M4 . A densidade de energia-momento é
um funcional bilinear T : E × E → Φ. Dado um sistema de coordenadas {xµ } e uma
base de covetores dxµ , T tem a forma T = Hµν dxµ dxν , cujas componentes são dadas
por
δL i
Hµν ≡ φ − ηµν L, (3.82)
δφiµ ν
em que L é uma densidade lagrangiana. Neste caso, T é um tensor do tipo (0, 2).
Considere agora um observador em um referencial inercial com 4-velocidade u = uµ ∂µ :
Definição 13. Densidade de energia.

Seja u a 4-velocidade de um observador e T a densidade de energia-momento de um
campo. A densidade de energia do campo ρ medida por este observador é definida pelo
escalar
ρ ≡ T (u, u) = Hµν uµ uν . (3.83)
Supondo que o observador esteja em repouso com relação ao seu sistema de coordenadas local,
temos u = (1, 0, 0, 0). Neste caso,
ρ = Hµν uµ uν = H00 u0 u0 = H00 . (3.84)
65
Neste caso, o tempo medido por este observador é dado por t = x0 /c e, a tempo constante,
podemos integrar esta expressão em um volume V tridimensional:
ˆ ˆ ˆ
δL i
ρ (x) d3 x = H00 (x) d3 x = φ − L d3 x.
V V V δφi0 0
Esta integral é precisamente a energia do campo no volume V , ou seja,

ˆ
H= H00 (x) d3 x (3.85)
V
é a função hamiltoniana do campo. Neste caso, a energia é a integral no volume da componente

H00 de T quando o observador encontra-se em repouso com relação ao seu próprio referencial.
No caso mais geral, a energia é dada por
ˆ
H= Hµν (x) uµ uν dσ, (3.86)
Σ
em que Σ é um volume tridimensional ortogonal à velocidade u.
Observação 3. O processo descrito acima é uma escolha de dinâmica relativística. Uma

dinâmica relativística envolve a escolha de um eixo temporal, neste caso a velocidade u
de um observador, de modo que seu tempo próprio seja o parâmetro de evolução tempo-
ral. Neste caso, o observador mede os campos não mais como funções no espaço-tempo,
mas como funções do tempo t e das posições x de um espaço tridimensional Σt onde
todos os pontos são definidos a t constante. Uma escolha de dinâmica relativística, por-
tanto, decompõe o espaço-tempo em espaços tridimensionais Σt em cada tempo t. Os
físicos chamam este processo de folheação do espaço-tempo, de modo que cada Σt é uma
folha tridimensional a t constante. Quando t = x0 /c e Σt = R3 , esta dinâmica é deno-
minada dinâmica instantânea. Existem, até o momento, cinco dinâmicas relativísticas
não equivalentes.
Agora, vamos considerar um vetor τ unitário e ortogonal a u. Este vetor é claramente tan-
gente a Σ, visto que u é ortogonal a Σ. De fato, podemos definir um conjunto de três vetores
τk = (τ1 , τ2 , τ3 ) que formam uma base ortonormal de Σ. Cada vetor é um eixo ortonormal de Σ.
Neste caso,
Definição 14. Densidade de momento.

Seja τ um vetor unitário ortogonal à velocidade u de um observador, e T a densidade
de energia-momento de um campo. A densidade de momento do campo na direção de
τ , pτ , medida por este observador é definida por
pτ ≡ T (u, τ ) = Hµν uµ τ ν . (3.87)
Na dinâmica instantânea, u = (1, 0, 0, 0). Seja τ1 = (0, 1, 0, 0). Neste caso,
p1 = Hµν uµ τ ν = H01 u0 τ 1 = H01 .
Esta é a densidade de momento na direção x1 . Da mesma forma, p2 = H02 e p3 = H03 , de modo

que
pk = H0k , k = 1, 2, 3. (3.88)
66
Integrando-se esta expressão, temos
ˆ ˆ
3
Pk ≡ pk (x) d x = H0k (x) d3 x. (3.89)
V V
Esta expressão define o momento total do campo em cada direção espacial.

Por fim, definimos:
Definição 15. Densidade de estresse.

Seja τk uma base para Σ, tal que Σ seja ortogonal à velocidade u de um observador. Seja
T a densidade de energia-momento de um campo. Considere também uma superfície
gaussiana Γk ortogonal a cada τk em determinado ponto de Σ. O fluxo da componente
m da densidade de momento através de uma superfície Γn é dado por
τmn ≡ T (τm , τn ) = Hmn τ m τ n , (3.90)
e é denominado densidade de estresse do campo.
Na dinâmica instantânea, é imediato verificar que
τmn = Hmn . (3.91)
Assim, quando u = (1, 0, 0, 0), temos
ρ p1 p2 p3
 
 p1 τ11 τ12 τ13 
Hµν =
 p2
. (3.92)
τ21 τ22 τ23 
p3 τ31 τ32 τ33
As componentes τ11 , τ22 e τ33 são denominadas densidades de estresses normais a cada direção.
Quando são iguais, τkk (sem soma em k) é denominado densidade de pressão do campo. Integra-
das em Σ, (3.92) formam as componentes do tensor de estresse. Da mesma forma, as integrais
ˆ
Tµν (t) ≡ Hµν (t, x) dσ (3.93)
Σt
são as componentes do denominado tensor energia-momento.

Vamos voltar à discussão anterior. Vimos que a invariância da ação sob translações implica
em que as equações de Euler-Lagrange resultam em uma equação de continuidade para a den-
sidade de energia-momento. Neste caso, vamos escrever
∂ µ Hµν = 0, (3.94)
que vem a ser a forma mais comum de notação. Dizemos que Hµν é uma quantidade conservada.
Vamos trabalhar na dinâmica instantânea de agora em diante. Integrando (3.94) em Ω ⊂ M4 ,
temos
ˆ ˆ ˆ
0= µ
dω∂ Hµν = dt d3 x∂ µ Hµν
ˆΩ
ˆ V
d3 x ∂ 0 H0ν + ∂ k Hkν , k = 1, 2, 3.

= dt
V
67
Temos
ˆ ˆ ˆ ˆ ˆ
d
d3 x ∂ 0 H0ν + ∂ k Hkν = d3 xH0ν d3 x∂ k Hkν = 0.

dt dt +
V dt V V
Vamos analisar apenas a equação para ν = 0. Assim, com H00 = ρ e Hk0 = H0k = pk , temos
ˆ ˆ ˆ
d 3 3 k
dt d xρ (x) + d x∂ pk = 0. (3.95)
dt V V
Dentro dos colchetes, a segunda integral é um termo de fronteira em V :

ˆ ˆ
3 k
d x∂ pk = d2 x nk (x) pk (x) , (3.96)
V ∂V
em que nk (x) são as componentes de um campo vetorial (em três dimensões) ortogonal a ∂V .
Esta integral é o fluxo de momento do campo através da superfície ∂V . Nós vamos supor que o
sistema é fechado, de modo que n · p = 0 em ∂V . Neste caso, a integral é nula e ficamos apenas
com
ˆ ˆ ˆ
d 3 dH dH
dt d xρ (x) = dt = 0 =⇒ = 0. (3.97)
dt V dt dt
´ ´
Portanto, a hamiltoniana H = V d3 xρ (x) = V d3 xH00 é uma constante de movimento. Quando
uma hamiltoniana é conservada, ela é relacionada com a energia do sistema. Portanto, invariân-
cia por translações (especificamente pela evolução temporal), resulta na conservação da energia
do campo.
As demais equações, para ν = k, resultam em
ˆ ˆ ˆ
d 3 3 l
dt d xpk + d x∂ τlk = 0,
dt V V
em que pk = H0k e τlk = Hlk , com l = 1, 2, 3. Mais uma vez, vamos supor que o sistema é fechado,
de modo que o estresse do campo é tangente à superfície ∂V . Assim,
ˆ ˆ
d3 x∂ l τlk = dx nl (x) τlk (x) = 0
V ∂V
e
ˆ ˆ
d
dt d3 xpk = 0. (3.98)
dt V
´
A equação acima implica em que os momentos Pk = V
d3 xpk (x) são conservados, ou seja,
dPk
= 0. (3.99)
dt
Então, translações (espaciais) implicam na conservação dos momentos lineares dos campos.
3.11 Rotações, momento angular e spin

Vamos analisar o que ocorre quando a ação é invariante por transformações de Lorentz, que vem
a ser uma pseudo-rotação global no espaço-tempo. Temos

µ µ ν µ µ ν µ 1 µ ab
y = Λ ν x ≈ 1x + ω ν x = δν + i (Jab ) ν ω xν , (3.100)
2
68
em que ω ab = −ω ba e Jab são os geradores da álgebra so (1, 3) na representação adjunta,
µ
(Jab ) ν = i (δaµ ηbν − δbµ ηaν ) , a, b, µ, ν = 0, 1, 2, 3. (3.101)
Neste caso,
1 µ
δxµ = i (Jab ) ν ω ab xν . (3.102)
2
Uma rotação no espaço-tempo implica uma rotação nos campos. Vamos definir esta rotação
de modo que δ̄φi = 0, ou seja, apenas a transformação no ponto influencia na transformação total
dos campos. Assim,
1 µ
δφi = δxµ φiµ = i (Jab ) ν ω ab xν φiµ , (3.103)
2
de modo que a equação de Lie

δL d δL i d i δL µ ν
− µ i δ̄φ = − µ δφ − H ν δx
δφi dx δφµ dx δφiµ
torna-se

d δL i 1 d δL i ν
δφ − H µν δxµ = i µ µ ab λ
φ − H ν (Jab ) λ ω x = 0
dxµ δφiµ 2 dx δφiµ ν
independentemente das equações de campo, visto que δ̄φi = 0. Como ω ab são constantes, temos

δL i µ ν λ
∂µ φ − H (J )
ab λ x = 0. (3.104)
δφiµ ν ν
Com (3.101),

δL ν
0 = ∂µ H µν (δaν ηbλ − δbν ηaλ ) xλ − i φiν (Jab ) λ xλ
δφµ

µ µ δL i ν λ
= ∂µ (H a xb − H b xa ) − i φν (Jab ) λ x .
δφµ
Vamos definir dois objetos:
Definição 16. Densidade de momento angular orbital.

As componentes da densidade de momento angular orbital são definidas por
`µab ≡ H µa xb − H µb xa . (3.105)
Este momento angular é um vetor de Lorentz, mas também é uma matriz na álgebra de
Lorentz. Todo campo que se transforma como uma representação do grupo de Lorentz possui
momento angular orbital. O segundo objeto é dado por:
69
Definição 17. Densidade de spin.
µ
Seja uma rotação infinitesimal δxµ = ω µν xν = (i/2) (Jab ) ν ω ab xν . Se os campos φi se
transformam de modo que
1 µ
δφi = i (Jab ) ν ω ab xν φiµ ,
2
as componentes da densidade de spin dos campos são definidas por

µ δL ∂ δφi δL ν
sab ≡ − i = − i φiν (Jab ) λ xλ . (3.106)
δφµ ∂ω ab δφµ
Neste caso, a corrente de Noether conservada é dada pela densidade de momento angular
total, cujas componentes são
mµab ≡ `µab + sµab , (3.107)
que obedecem às equações de continuidade
∂µ mµab = 0. (3.108)
Vamos integrar (3.108) em Ω, como temos feito usualmente:

ˆ ˆ ˆ
0= dω∂µ mµab = dt d3 x∂µ mµab
Ω V
ˆ ˆ ˆ ˆ
3 0 i
dMab 3 i
= dt d x ∂0 mab + ∂i mab + dt + d x∂i mab .
V dt V
Mais uma vez, vamos supor que o fluxo de momento angular em ∂V é nulo, anulando a última
integral. A matriz
ˆ
Mab ≡ d3 xm0ab (3.109)
V
é a matriz de momento angular total. Então, a equação de continuidade implica em
dMab
= 0, (3.110)
dt
ou seja, o momento angular total dos campos é uma carga conservada.
Portanto, o momento angular de um campo tem uma componente orbital e uma componente
de spin,
Mab = Lab + Sab , (3.111)
em que
ˆ ˆ
Lab = d3 x`0ab e Sab = d3 xs0ab . (3.112)
V V
Embora não exista uma razão matemática, o fato é que ambos os momentos angulares são con-
servados separadamente em campos relativísticos. Note que, se ∂µ mµab = 0 e ∂µ H µν = 0, temos
∂µ sµab = −∂µ `µab = −∂µ (H µa xb − H µb xa )

= H µb ∂µ xa − H µa ∂µ xb = H µb ηµa − H µa ηµb
= Hab − Hba , (3.113)
70
ou seja, a divergência da densidade de spin é igual à parte antissimétrica da densidade de ener-
gia momento. Se a densidade de energia-momento é simétrica, ∂µ sµab = 0 e, assim, ambas as
componentes do momento angular são conservadas separadamente.
Observação 4. No geral, as componentes da densidade de energia-momento
δL i
Hµν = φ − ηµν L
δφiµ ν
não são simétricas, ou seja, Hµν 6= Hνµ . Mas existe um procedimento de simetrização
de Hµν , conhecido como procedimento de Belinfante, que consiste em acrescentar um
termo de fronteira ao tensor energia-momento:
1
Tµν = Hµν + ∂λ sλµν + sλνµ − sνµλ .

(3.114)
2
Este tensor é chamado tensor de Belinfante-Rosenfeld e, usando (3.113), mostra-se que
Tµν = Tνµ . A diferença entre Tµν e Hµν é um termo de divergência total e, assim, torna-
se um termo de fronteira na ação, o que não altera as equações de campo. Neste caso,
é sempre preferível o uso do tensor energia-momento simétrico sobre o canônico, visto
que este garante a conservação da densidade de spin.
3.12 O segundo teorema
O segundo teorema de Noether diz respeito à invariância da ação sob transformações locais, ou
seja, cujos parâmetros são funções de pontos do espaço-tempo. Vamos considerar uma transfor-
mação dependente de um conjunto de funções do ponto do espaço-tempo λa , tal que a = 1, · · · , m:
∂φi dλa

δφi = δxµ . (3.115)
∂λa dxµ λ=0
Esta transformação implica em
δ̄φi = δφi − δxµ φiµ , (3.116)
que resulta em
∂φi dλa

i i µ
δ̄φ = − φ µ δx , (3.117)
∂λa dxµ λ=0
em que
dy µ

µ
δx = λa . (3.118)
dλa λ=0
Vamos definir as funções

µ
∂φi

i i dy
Aa ≡ φ µ e Baiµ ≡ δxµ , (3.119)
dλa λ=0 ∂λa λ=0
De forma que,
dλa dλa
δφi = Baiµ µ
, φiµ δxµ = Aia λa , δ̄φi = Baiµ µ − Aia λa . (3.120)
dx dx
71
A equação de Lie,
δL iµ dλa

i µ ν
(EL)i δ̄φ + ∂µ B − H ν δx = 0, (3.121)
δφiµ a dxµ
em que
δL d δL
(EL)i ≡ − µ i (3.122)
δφi dx δφµ
são os lados esquerdos das equações de campo, torna-se
(EL)i Baiµ ∂µ λa − Aia λa + ∂µ Φµ = 0,

(3.123)
com
dλa

µ δL
Φ ≡ i Baiµ µ − Aia λa + Lδxµ . (3.124)
δφµ dx
Podemos escrever (3.124) como
0 = (EL)i Baiµ ∂µ λa − Aia λa + ∂µ Φµ

= (EL)i Baiµ ∂µ λa − (EL)i Aia λa + ∂µ Φµ

= ∂µ (EL)i Baiµ λa − ∂µ (EL)i Baiµ λa − (EL)i Aia λa + ∂µ Φµ

= −∂µ (EL)i Baiµ λa − (EL)i Aia λa + ∂µ Φµ + (EL)i Baiµ λa .

Ou seja,
∂µ (EL)i Baiµ + (EL)i Aia λa − ∂µ Φµ + (EL)i Baiµ λa = 0.

(3.125)
Agora, vamos integrar esta equação em Ω:

ˆ ˆ
iµ i
a
dω∂µ Φµ + (EL)i Baiµ λa = 0.

∂µ (EL)i Ba + (EL)i Aa λ dω −
Ω Ω
Enquanto o primeiro teorema de Noether lida com o caso de parâmetros constantes, em que as
transformações são globais e a invariância da ação é definida em todo o domínio Ω, a invariância
da ação por transformações com parâmetros que dependem do espaço-tempo é local. A integral
fundamental não só é invariante quando calculada num volume Ω, mas também em qualquer
sub-domínio Ω̄ ⊂ Ω. Exceto em Ω, a integral
ˆ
dω̄∂µ Φµ + (EL)i Baiµ λa

(3.126)
Ω̄
deve ser nula em todo Ω̄ ⊂ Ω. Neste caso, temos

ˆ
∂µ (EL)i Baiµ + (EL)i Aia λa dω̄ = 0.

δAΩ̄ = (3.127)
Ω̄
Com volume e parâmetros arbitrários, temos as relações
∂µ (EL)i Baiµ + (EL)i Aia = 0.

(3.128)
Estas são as chamadas identidades de Noether.
72
Teorema 4. Segundo Teorema de Noether.
Seja uma transformação total dos campos que dependa de um conjunto de n parâme-
tros λa (x), dependentes do ponto do espaço-tempo. Se a ação é invariante sob estas
transformações, existem n identidades de Noether que envolvem combinações lineares
das equações de Euler-Lagrange.
As identidades de Noether (3.128) podem ser colocadas na forma de uma equação de conser-
vação covariante. Para tal, definimos as funções Gaiµ tais que
Gaiµ Bbjν = δij δba δµν . (3.129)
Assim,
0 = ∂µ (EL)i Baiµ + (EL)i Aia

h i
= ∂µ (EL)i Bbjν δνµ δji δab + (EL)i Ajb δab δji
h i
= ∂µ (EL)i Bbjν Gbjν Baiµ + (EL)i Ajb δab δji .
Vamos multiplicar por G à direita:

h i
0 = ∂µ (EL)i Bbjν Gbjν Baiµ Gckλ + (EL)i Aia Gckλ
h i
= ∂µ (EL)i Bbjν Gbjν δac δki δλµ + (EL)i Aia Gckλ
h i
= ∂λ (EL)k Bbjν Gbjν δac + (EL)i Aia Gckλ
h i
= ∂µ (EL)k Bbjν Gbjν δac + (EL)i Aia Gckµ .
Agora, vamos multiplicar por B à direita:

h i
0 = ∂µ (EL)k Bbjν Gbjν δac Bdlλ + (EL)i Aia Gckµ Bdlλ
h i
= ∂µ (EL)k Bbjν δdb δjl δνλ δac + (EL)i Aia Gckµ Bdlλ
= ∂µ (EL)i Bdlλ δki δac + (EL)i Bdlλ Aia Gckµ

= δji δab ∂µ + Aia Gbjµ (EL)i Bckν .

Vamos definir a derivada covariante

ib ib
(∇µ )ja ≡ δji δab ∂µ − (Γµ )ja , (3.130)
com os campos de conexão

ib
(Γµ )ja ≡ −Aia Gbjµ . (3.131)
Dessa forma, as identidades de Noether podem ser escritas por

ib
(∇µ )ja (EL)i Bckν = 0.

(3.132)
Essas identidades são independentes das equações de movimento e não dependem das condi-
ções de fronteira dos campos ou das variações do problema variacional. São válidas para qual-
quer configuração de campos, extremos ou não. Elas recebem o nome de leis de conservação
impróprias: não são verdadeiramente leis de conservação. As quantidades
Υjν jν
ic ≡ (EL)i Bc (3.133)
73
são chamadas correntes impróprias.
Na fronteira de Ω, a integral (3.126) não pode ser levada a zero para transformações com
forma geral. Assim, temos
ˆ ˆ
iµ i
a
dω∂µ Φµ + (EL)i Baiµ λa = 0.

∂µ (EL)i Ba + (EL)i Aa λ dω − (3.134)
Ω Ω
em Ω. Para campos que são extremos do problema variacional, (EL)i = 0 e

ˆ
dω∂µ Φµ = 0, (3.135)
Ω
com
δL dxµ a
Φµ = iν a i a

B a ∂ν λ − A a λ + L λ
δφiµ dλa
dxµ a

δL δL i δL
= i Baiν ∂ν λa − i
A a + L a
λ = i Baiν ∂ν λa − Φµa λa , (3.136)
δφµ δφµ dλ δφµ
e
δL i dxµ
Φµa ≡ i
Aa + L a . (3.137)
δφµ dλ
A equação (3.135) resulta em ∂µ Φµ = 0, de modo que Φµ é uma corrente própria. Portanto,

µ δL iν a µ a δL iν
∂µ Φ = ∂µ B ∂ν λ − Φa λ = ∂µ B ∂ν λ − ∂µ (Φµa λa )
a
δφiµ a δφiµ a

δL iν a δL iν
= ∂µ B ∂ν λ + B ∂µ ∂ν λa − ∂µ Φµa λa − Φµa ∂µ λa
δφiµ a δφiµ a

δL iν ν a δL iν
= ∂µ B − Φ ∂ν λ + B ∂µ ∂ν λa − (∂µ Φµa ) λa = 0
δφiµ a a
δφiµ a
Vamos supor que λ e suas derivadas sejam independentes. Neste caso,
∂µ Φµa = 0, (3.138a)

δL iν
Φνa = ∂µ B , (3.138b)
δφiµ a
δL iν δL
B + i Baiµ = 0. (3.138c)
δφiµ a δφν
Portanto, na validade das equações de campo, temos um conjunto de correntes próprias conser-
vadas (3.138a). Essas correntes, de acordo com (3.138b), podem ser escritas como divergências
ordinárias de um tensor de segunda ordem que, ainda de acordo com (3.138c), deve ser antissimé-
trico nos índices do espaço-tempo. Este conjunto de relações não é, obviamente, independente.
Se a corrente é escrita como a divergência de um tensor antissimétrico, a lei de conservação
(3.138a) é automática, devido à simetria das derivadas.
Se leis de conservação próprias são obedecidas, integrais de movimento podem ser encontra-
das com uma escolha de dinâmica relativística. Essas integrais são dadas pelas carga
ˆ ˆ
1 δL iµ δL i0
Qa = d3 xΦ0a = d3 x∂µ B − B .
V 2 V δφi0 a δφiµ a
74
Com o teorema de Gauss-Ostrogradski, essa carga pode ser escrita por
ˆ
1 2 δL iµ δL i0
Qa = d xnµ B − i Ba (3.139)
2 ∂V δφi0 a δφµ
como uma integral de 2 dimensões na fronteira de V .
3.13 Revisitando invariantes da álgebra de Poincaré

Para começar, vamos tratar sobre os invariantes que encontramos no capítulo passado. Esses
invariantes estão relacionados aos invariantes de Casimir da álgebra de Poincaré, que incluem
rotações e translações em M4 . A simetria por translações implica na conservação da densidade
de energia-momento
Hµν ≡ πiµ φiν − ηµν L, (3.140)
que obedece a uma equação de continuidade ∂ µ Hµν = 0. Na dinâmica instantânea, em que

t = x0 /c, a conservação de Hµν implica na existência das constantes de movimento
ˆ
Pµ = d3 xH0µ (x) , (3.141)
R3
em que P0 = E/c está relacionado à energia do sistema e Pk , com k = 1, 2, 3, são os momentos

lineares dos campos.
O invariante de Casimir relacionado a essas funções é o momento linear ao quadrado P 2 =
Pµ P µ . Note que Pµ , como geradores da álgebra de translações, são operadores abstratos que
atuam sobre os campos, de modo que (3.141) é uma realização analítica desses operadores. P 2
define um problema de autovalores
Pµ P µ φ = m2 φ, (3.142)
em que m é definido como o conteúdo de massa do campo φ. Se o campo é um campo clássico,

dependente do ponto do espaço-tempo, ou seja, φ = φ (x), a realização dos momentos apropriada
é dada por Pµ ≡ i∂µ , de modo que (3.142) torna-se a equação de Klein-Gordon-Fock
+ m2 φ (x) = 0,

(3.143)
em que
≡ ∂µ ∂ µ = ηµν ∂µ ∂ν = −P 2 (3.144)
é o operador D’Alambertiano. Todo campo relativístico obedece à equação de Klein-Gordon-Fock

por definição, já que tais campos são construídos como invariantes por translações.
A invariância por rotações, por outro lado, implica na conservação do momento angular total,
representado pela matriz
Mµν = Lµν + Sµν , (3.145)
que tem uma componente orbital e uma componente de spin, como definidos em (3.112), (3.105)
e (3.106). Neste caso, Pµ e Mµν são geradores da álgebra de Poincaré.
Com (3.145) podemos construir o operador de Pauli-Lubanski
i
Wµ ≡ − εµνγλ M νγ P λ . (3.146)
2
75
Definição 18. O tensor antissimétrico quadridimensional.
Em quatro dimensões, podemos definir o tensor de componentes

1 para combinações cíclicas de (µνγλ) ,


µνγλ
ε = 0 se quaisquer dois índices forem iguais, (3.147)

−1 para combinações anti-cíclicas de (µνγλ),

de modo que ε0123 = 1. Note que as componentes inversas
εµνγλ = ηµα ηνβ ηγτ ηλσ εαβτ σ (3.148)
obedecem à mesma regra, contudo, ε0123 = −1 devido à métrica de Minkowski.
O operador Wµ , obedece trivialmente à relação Wµ P µ = 0 e possui as seguintes relações de

comutação com os geradores da álgebra:
[Pµ , Wν ] = 0, [Mµν , Wγ ] = ηνγ Wµ − ηµγ Wν , (3.149)
além de
[Wµ , Wν ] = εµνγλ W γ P λ . (3.150)
A importância do operador de Pauli-Lubanski vem a ser o fato de que ele gera transformações de
Lorentz que preservam os autovalores de massa do operador momento. Neste caso, ele pode ser
utilizado, em conjunto com P 2 , para classificar campos relativísticos em termos de sua massa e
spin. O quadrado deste operador,
W 2 = Wµ W µ , (3.151)
é um invariante de Casimir da álgebra de Poincaré. Este esquema de classificação foi introduzido

por Wigner [?].
Considere um campo livre φ com conteúdo de massa m diference de zero e energia E. Após
quantizado, tal campo dará origem a estados de partículas de massa m. Como W 2 é um inva-
riante de Poincaré, podemos calculá-lo escolhendo um referencial inercial. Vamos escolher um
observador em repouso na origem, de modo que Pµ = (E/c = mc, 0, 0, 0) = P0 . Neste caso,
i
Wµ ≡ − mcε0µνγ M νγ .
2
Com as propriedades de ε, temos W0 = 0. Com k, m, n = 1, 2, 3, temos
i
Wk = − mcεkmn M mn = −mcJk , (3.152)
2
em que Jk = (i/2) εkmn M mn são as componentes do momento angular tridimensional. Usamos a
relação εkmn = ε0kmn . Neste caso,
W 2 = m2 c2 J i Ji = −m2 c2 J2 , (3.153)
Em que J2 = ηmn Jm Jn = −δmn Jm Jn é o quadrado do momento angular total. Supondo um estado

singleto, em que o momento orbital é nulo, temos
W 2 = −m2 c2 S2 , (3.154)
em que S2 = Sk S k é o quadrado do spin (tridimensional) do campo. No geral, um estado funda-
76
mental de um campo quântico é um estado singleto, de modo que o estado de momento angular
total resulta em seu estado de spin.
Ao atuar em um estado singleto, temos
S2 φ = s (s + 1) φ, (3.155)
ou seja, as partículas de massa m podem ser classificadas por seus valores de spin s = 0, 1, 2, · · · ,
caso em que o campo é denominado bosônico, ou s = 1/2, 3/2, · · · , caso em que o campo é
fermiônico.
No caso não massivo, notemos que P 2 = 0 não implica em W 2 = 0. De fato,
1
Wµ W µ = − εµνγλ εµαβρ M νγ P λ M αβ P ρ = Mαγ P γ M αβ Pβ , (3.156)
4
que pode ser calculado com uso da relação
δµτ ηµα ηµβ ηµρ

 
 δντ ηνα ηνβ ηνρ 
εµνγλ εταβρ = det 
 δτ
, (3.157)
γ ηγα ηγβ ηγρ 
δλτ ηλα ηλβ ηλρ
válida para o tensor ε.

Se P 2 = 0, temos E 2 = p2 c2 , em que p é o momento linear tridimensionaldo campo.
Assim,
p
Pµ é um vetor tipo luz, ou seja, repousa sobre o cone de luz. Neste caso, Pµ = 2
p ,p e
i
W0 = − εkmn M km P n = −Jk pk = J · p, (3.158a)
2
i E
Wk = − εkνγλ M νγ P λ = − Jk + iεkmn M 0m P n . (3.158b)
2 c
A equação 3.158b gera um conjunto de transformações que não preserva o spin do campo, por-
tanto vamos descartá-la como alternativa para construção de um invariante. Por outro lado, W0
é denominado helicidade do campo quando L · p = 0:
h ≡ S · p, (3.159)
e é um invariante relativístico. Se o campo tem spin s, a helicidade tem autovalores
(−s, −s + 1, · · · , 0, · · · , s − 1, s) . (3.160)
77
78
Capítulo 4
Campos Bosônicos
4.1 O campo escalar real
O campo relativístico mais simples é aquele cujas componentes são invariantes por transforma-
ções de Lorentz. Um campo escalar real é uma função φ (x) : M4 → R tal que
x → x0 = Λx =⇒ φ (x) → φ0 (x0 ) = φ (x) . (4.1)
Obviamente, se φ não muda por rotações em M4 , isto implica em que o momento angular total
do campo é nulo, ou seja, Lµν = 0 e Sµν = 0. Neste caso, um campo cujas componentes são
invariantes de Lorentz tem spin zero. Se o campo tem conteúdo de massa m, temos que P 2 φ =
m2 φ, o que na realização das posições Pµ = i∂µ resulta na equação de Klein-Gordon-Fock
+ m2 φ = 0.

(4.2)
A equação (4.2) é a única equação obedecida por φ, portanto, ela é considerada a equação de
campo do campo escalar real.
A densidade lagrangeana relacionada à equação (4.2) é dada por
1
∂µ φ∂ µ φ − m2 φ2 ,

L= (4.3)
2
que resulta em (4.2) através das equações de Lagrange
δL δL
− ∂µ = 0. (4.4)
δφ δ (∂µ φ)
A densidade de energia-momento é dada por
δL
∂ν φ − ηµν ∂γ φ∂ γ φ − m2 φ2

Hµν =
δ (∂ µ φ)
1
= ∂µ φ∂ν φ − ηµν ∂γ φ∂ γ φ − m2 φ2 ,

(4.5)
2
que já é simétrico.
79
A função hamiltoniana na dinâmica instantânea é dada por
ˆ ˆ
3 3 1 γ 2 2

H= d xH00 (x) = d x ∂0 φ∂0 φ − η00 ∂γ φ∂ φ − m φ
R3 R3 2
ˆ
3 2 1 2 1 k 1 2 2
= d x φ̇ − φ̇ − ∂k φ∂ φ + m φ
R3 2 2 2
ˆ
1
= d3 x φ̇2 + ∇φ · ∇φ + m2 φ2 , (4.6)
2 R3
em que usamos a notação φ̇ = ∂0 φ. H é uma quantidade conservada no tempo e sempre positiva,

portanto é igual ao seu conteúdo de energia. Por outro lado, os momentos lineares são calculados
por
ˆ ˆ
3
pk = d xH0k (x) = d3 x∂0 φ∂k φ. (4.7)
R3 R3
ou seja,
ˆ
p= d3 xφ̇∇φ. (4.8)
R3
Uma maneira imediata de introduzir uma interação é permitir que o campo interaja consigo
mesmo. No caso do campo escalar isto pode ser feito com termos do tipo λφn , em que n ≥ 3. Um
modelo de grande interesse, pois resulta em uma teoria quântica autoconsistente, é dado pela
densidade lagrangeana
1 λ
L= ∂µ φ∂ µ φ − m2 φ2 − φ4 , (4.9)
2 4!
cuja equação de campo é dada por
λ
+ m 2 φ = − φ3 .

(4.10)
3!
Sua densidade de energia-momento vem a ser

1 2λ 4
Hµν = ∂µ φ∂ν φ − ηµν ∂γ φ∂ γ φ − m2 φ2 − φ . (4.11)
2 4!
O termo φ4 modifica, portanto, o conteúdo de energia do campo. O conteúdo de momento, por

outro lado, é igual ao do campo livre.
80
Observação 5. Note que a transformação
φ = −φ
deixa a densidade lagrangeana (4.9) invariante, portanto, não altera a equação de

campo (4.10). Esta transformação não é contínua, portanto, não deixa um invariante
de Noether. Mas é um exemplo de simetria interna do campo escalar, neste caso deno-
minada Z 2 . Vamos considerar
1 2 2 λ 4
V (φ) = m φ + φ ,
2 4!
em analogia com o potencial em mecânica clássica. Se m é um parâmetro real, m2 > 0 e,

assim, V tem um único mínimo em φ = 0. Por outro lado, se m é um número imaginário
puro, m2 < 0 e, assim, V tem dois mínimos
r
6
φ = ± − m2
λ
e um máximo em φ = 0. Os mínimos do potencial estão relacionados com os estados de

vácuo da teoria quântica, de modo que há um vácuo único para m2 > 0, mas há uma
degenerescência para m2 < 0. No primeiro caso, o vácuo é invariante pela simetria Z 2 .
No segundo caso, no entanto, os estados de vácuo não são mais invariantes. Dizemos,
assim, que a simetria Z 2 sofre uma quebra, consistindo em um exemplo simples de
quebra espontânea de simetria.
4.2 O campo escalar complexo

Um campo escalar complexo, por outro lado, é uma função φ (x) : M4 → C tal que
x → x0 = Λx =⇒ φ (x) → φ0 (x0 ) = φ (x) . (4.12)
Novamente, este é um campo de spin zero. O campo complexo também obedece à equação de
Klein-Gordon-Fock
+ m2 φ = 0,

(4.13a)
mas agora temos também a equação conjugada
+ m2 φ∗ = 0.

(4.13b)
A ação deste campo é dada por

ˆ
d4 x ∂µ φ∗ ∂ µ φ − m2 φ∗ φ .

A= (4.14)
M4
Vamos encontrar as informações necessárias variando a ação com relação a um conjunto de

transformações infinitesimais δφ, δφ∗ , δxµ . O resultado vem a ser
ˆ
δA = d4 x∂γ (∂ γ φ) δφ∗ + (∂ γ φ∗ ) δφ − ∂µ φ∗ ∂ γ φ + ∂ γ φ∗ ∂µ φ − δµγ ∂λ φ∗ ∂ λ φ − m2 φ∗ φ δxµ

ˆ
+ d4 x + m2 φ (δxγ ∂γ − δ) φ∗ + + m2 φ∗ (δxγ ∂γ − δ) φ .

(4.15)
81
A segunda linha nos dá as equações de campo (4.13), segundo o princípio de Weiss. O termo de
fronteira nos dá os momentos covariantes
πγ∗ ≡ ∂γ φ, πγ ≡ ∂ γ φ ∗ (4.16)
conjugados à variáveis φ∗ e φ respectivamente. O coeficiente de δx é a densidade de energia-

momento
Hµν = πµ∗ πν + πν∗ πµ − ηµν πλ π ∗λ − m2 φ∗ φ .

(4.17)
Na dinâmica instantânea, temos a hamiltoniana

ˆ
d3 x π ∗ π + ∇φ · ∇φ∗ + m2 φ∗ φ ,

H= (4.18)
R3
em que π = π0 = φ̇∗ e π ∗ = π0∗ = φ̇, e os momentos lineares

ˆ
∗
d3 x (π0 ∇φ) + (π0 ∇φ) .

pk = (4.19)
R3
4.3 Simetrias internas do campo escalar

A simetria Z 2 também está presente no campo escalar complexo. Vamos tratá-la adequada-
mente mais adiante. Há uma simetria, contudo, que o campo real não apresenta. Considere a
transformação global
φ (x) → φ0 (x) = eiα φ (x) , φ∗ (x) → φ0∗ (x) = e−iα φ∗ (x) , (4.20)
em que α é um parâmetro real constante. Esta transformação claramente deixa invariante a

ação (4.14). Esta é uma transformação interna, que não modifica o ponto do espaço-tempo.
Para o primeiro teorema de Noether, consideramos as versões infinitesimais
δφ (x, α) = iαφ (x) , δφ∗ (x, α) = −iαφ∗ (x) . (4.21)
A equação de Lie

δL d δL i i δL µ ν
− µ i δ̄φ = −∂µ δφ − H ν δx
δφi dx δφµ δφiµ
torna-se, com δx = 0 e δφ = δ φ̄,
+ m2 φδφ∗ + + m2 φ∗ δφ = −∂µ (δφ∗ ∂ µ φ + δφ∂ µ φ∗ ) .

(4.22)
Neste caso, as equações de campo implicam na lei de conservação
∂µ (φ∗ ∂ µ φ − φ∂ µ φ∗ ) = 0, (4.23)
com o uso de (4.21). A carga conservada na dinâmica instantânea é dada por

ˆ
Q= d3 x φ∗ φ̇ − φ̇∗ φ . (4.24)
R3
A simetria (4.20) é um exemplo de simetria de gauge global. Ela pertence ao grupo de trans-
formações denominado U (1), que consiste em todas as transformações complexas unitárias cuja
álgebra possui apenas um gerador, precisamente o número 1. Um membro de U (1) é repre-
sentado simplesmente por um número complexo ω tal que ω ∗ ω = 1, que pode ser colocado na
82
forma ω = eiα para algum α real. Portanto, a invariância global por U (1) resulta em uma carga
conservada (4.24). Podemos tentar identificar Q como a carga elétrica do campo, mas esta iden-
tificação seria simplesmente incorreta. Um campo livre simplesmente não possui um conteúdo
de carga que gere campos eletromagnéticos. A razão é que a invariância global não é suficiente
para descrever a interação de φ com um campo eletromagnético, qualquer que seja a teoria que
o descreva. A localização da simetria por U (1) deve ser implementada para que o conteúdo de
carga elétrica tenha sentido físico.
4.4 Simetrias de gauge locais e interação
Vamos considerar, agora, as transformações
φ (x) → φ0 (x) = eiα(x) φ (x) , φ∗ (x) → φ0∗ (x) = e−iα(x) φ∗ (x) , (4.25)
em que α (x) é um parâmetro real dependente do ponto. Esta é uma transformação de gauge
local, ainda representada por um membro do grupo U (1). A diferença para o caso global está no
fato de que cada ponto de M4 está ligado a um membro distinto de U (1).
Esta transformação já não deixa invariante a ação (4.14). Note que a densidade lagrangeana
L = ∂µ φ∗ ∂ µ φ − m2 φ∗ φ (4.26)
transforma-se por

L → L0 =∂µ e−iα(x) φ∗ ∂ µ eiα(x) φ − m2 φ∗ φ
= (∂µ − iαµ ) φ∗ (∂ µ + iαµ ) φ − m2 φ∗ φ, (4.27)
em que αµ = ∂µ α. O problema está nas derivada dos campos, que se transformam por
∂µ φ → ∂µ eiα φ = eiα (∂µ + iαµ ) φ,

∂µ φ∗ → ∂µ e−iα φ∗ = e−iα (∂µ − iαµ ) φ∗ .

Ao impor a invariância local sobre a teoria, devemos encontrar uma lagrangeana invariante
de gauge local. A maneira mais simples é introduzir uma conexão, denominada campo de gauge
de componentes Aµ , tal que
Dµ ≡ ∂µ + iqAµ (4.28)
pode ser definida como uma derivada covariante. Para que Dµ φ seja covariante, temos
0
Dµ0 φ0 = (∂µ φ) + iqA0µ φ0
=∂µ eiα φ + iqA0µ eiα φ

=∂µ eiα φ + eiα ∂µ φ + ieiα qA0µ φ

=eiα ∂µ φ + iq −ie−iα ∂µ eiα + A0µ φ .

A covariância é atestada por Dµ φ → eiα Dµ φ, de modo que o campo de gauge deve se transformar
na forma
A0µ = Aµ + ie−iα ∂µ eiα ,

(4.29)
83
ou
A0µ = Aµ − ∂µ α. (4.30)
Em vez da densidade lagrangeana (4.26), vamos considerar

∗
L = (Dµ φ) Dµ φ − m2 φ∗ φ. (4.31)
se a conexão se transforma segundo (4.30), esta lagrangeana é invariante pelas transformações

de gauge locais do grupo U (1). (4.31) pode ser reescrita na forma
L = (∂µ − iqAµ ) φ∗ (∂ µ + iqAµ ) φ − m2 φ∗ φ

= ∂ µ φ ∗ ∂ µ φ − m 2 φ ∗ φ + Aµ J µ , (4.32)
em que
Jµ ≡ iq (φ∂µ φ∗ − φ∗ ∂µ φ − iqAµ φ∗ φ) (4.33)
é a densidade de corrente do campo escalar.

As equações dos campos escalares da lagrangeana (4.33) são
δJµ δJµ
+ m2 φ = −Aµ ∗ , + m2 φ∗ = −Aµ

, (4.34)
δφ δφ
em que
δJµ ∗
= iq (∂µ φ∗ − iqAµ φ∗ ) = iq (Dµ φ) , (4.35a)
δφ
δJµ
= −iq (∂µ φ + iqAµ φ) = −iqDµ φ. (4.35b)
δφ∗
Portanto, se uma simetria interna local é imposta ao sistema físico, um novo campo A =
Aµ dxµ deve ser introduzido, e suas componentes se transformam por
Aµ → Aµ − ∂µ α (4.36)
por transformações de gauge locais. Contudo,
x → Λx =⇒ Aµ → Λµν Aν , (4.37)
portanto A é também um covetor de Lorentz. Veremos mais adiante que essas são precisamente
as características do potencial eletromagnético. Assim, simetria por transformações de gauge
locais do grupo U (1) implicam em interação eletromagnética.
A lagrangeana (4.32) não pode ser completa. É necessário acrescentar ao sistema um termo
para o campo eletromagnético livre, que seja um escalar de Lorentz e, também, invariante de
gauge. Este termo é construído com o tensor
F = Fµν dxµ ∧ dxν , (4.38)
em que ∧ é o produto exterior e as componentes são definidas por
Fµν ≡ ∂µ Aν − ∂ν Aµ , (4.39)
automaticamente invariantes de gauge. Neste caso, a lagrangeana completa é dada por
1
L = − Fµν F µν + ∂µ φ∗ ∂ µ φ − m2 φ∗ φ + Aµ Jµ , (4.40)
4
84
que consiste em um temo livre do campo eletromagnético, um termo livre do campo escalar e um
termo de interação. Esta é a lagrangeana da eletrodinâmica escalar.
Se esta lagrangeana é invariante por U (1) local, ela é automaticamente invariante por U (1)
global. Portanto, o primeiro teorema de Noether se aplica, resultando na corrente própria
δL δL
Φµ = φ − φ∗
δ∂µ φ δ∂µ φ∗
= φ (∂ µ φ∗ − iqAµ φ∗ ) − φ∗ (∂ µ φ + iqAµ φ)
∗
= φ (Dµ φ) − φ∗ Dµ φ, (4.41)
que é conservada (∂ µ Φµ = 0). Na dinâmica instantânea, temos

ˆ
∗
d3 x φ (D0 φ) − φ∗ D0 φ

Q=
ˆR
3
h i
= d3 x φφ̇∗ − φ∗ φ̇ − 2iqV φ∗ φ , (4.42)
R3
em que V = A0 vem a ser o potencial escalar. Neste caso, Q é a carga elétrica do campo escalar.
4.5 O campo vetorial

Um campo vetorial vem a ser um objeto A : Φ (x) → Φ (x), em que Φ (x) é o espaço de funções
escalares com domínio em M4 . Em cada ponto do espaço-tempo, A é um vetor de Lorentz que
pode ser colocado na forma
A (x) = Aµ (x) ∂µ , (4.43)
portanto as componentes Aµ (x) possuem a lei de transformação
x0 = Λx =⇒ A0µ (x0 ) = Λµν Aν (x) , (4.44)
sob transformações de Lorentz. Cada componente é uma função Aµ (x) : M4 → F, em que F é

o conjunto dos números reais se o campo for real, mas complexo se o campo for complexo. Por
simplicidade, vamos trabalhar inicialmente com o campo real.
Cada campo vetorial possui um dual, representado por um campo 1-forma diferencial
Ā (x) = Aµ (x) dxµ , (4.45)
cujas componentes se transformam por

ν
x0 = Λx =⇒ A0µ (x0 ) = Aν (x) ΛT µ
= Λµν Aν (x) . (4.46)
Ambos os campos são necessários para a construção de uma dinâmica que seja invariante de Lo-
rentz. A relação entre as componentes de vetores e covetores é dada pela métrica de Minkowski:
Aµ = ηµν Aν , Aµ = η µν Aν . (4.47)
A lagrangeana desta teoria deve ser invariante por Lorentz, então a primeira tentativa de
construção de uma lagrangeana pode ser com a densidade
1
∂µ Aν ∂ µ Aν − m2 Aµ Aµ ,

L=−
2
que descreve um campo vetorial de massa m. Esta densidade lagrangeana possui dois proble-
85
mas. Primeiro, sua densidade de energia-momento não é positiva-definida, dando origem a uma
densidade de energia com setor negativo. Para corrigir este problema, o campo deve obedecer
à condição ∂µ Aµ = 0, denominada condição de Lorenz, ou às condições A0 = 0 e ∂i Ai = 0, com
i = 1, 2, 3, conhecidas por condições do gauge de radiação. Esses vínculos podem ser integrados à
densidade lagrangeana de formas diferentes, mas mostra-se que a lagrangeana
1 m2
L = − (∂µ Aν − ∂ν Aµ ) (∂ µ Aν − ∂ ν Aµ ) − Aµ Aµ
4 2
resolve este problema. É usual introduzir o tensor F = Fµν dxµ ∧ dxν , com componentes
Fµν ≡ ∂µ Aν − ∂ν Aµ , (4.48)
de modo que
1 m2
L = − Fµν F µν − Aµ Aµ . (4.49)
4 2
A densidade (4.49) é denominada lagrangeana de Proca. As equações de campo são dadas por
δL δL
µ
− ∂ν = 0,
δA δ∂ν Aµ
de modo que
m2 δ m2 δAγ γ δAγ

δL γ
= − (A γ A ) = − A + A γ
δAµ 2 δAµ 2 δAµ δAµ
m2 m2
ηγµ Aγ + Aγ δµγ = −

= − (Aµ + Aµ )
2 2
2
= −m Aµ ,
e
∂F αβ

δL δL δL
∂ν = ∂ν = ∂ν
δ∂ν Aµ δ∂ ν Aµ δF αβ ∂ (∂ ν Aµ )
" #
δL ∂ ∂ α Aβ − ∂ β Aα

ν ν δL α β α β

= ∂ =∂ δ δ − δµ δν .
δF αβ ∂ (∂ ν Aµ ) δF αβ ν µ
Nessas ocasiões, em que um objeto antissimétrico é derivado com relação a suas componentes, é
comum utilizar a delta antissimetrizada
α β
δ[µ δν] ≡ δµα δνβ − δνα δµβ . (4.50)
Assim,

δL δL α β ν δL
∂ν = ∂ν δ [ν µ] = 2∂
δ
δ∂ν Aµ δF αβ δF νµ

δ 1 1 δ
2∂ ν νµ − Fαβ F αβ = ∂ ν µν Fαβ F αβ

=
δF 4 2 δF
αβ

1 ν δFαβ αβ δF 1
= ∂ ν ηαµ ηβν F αβ + Fαβ δµα δνβ

= ∂ µν
F + F αβ µν
2 δF δF 2
1 ν 1 ν
= ∂ (Fµν + Fµν ) = ∂ (Fµν + Fµν ) = ∂ ν Fµν .
2 2
Faremos mais uso do resultado
δL
= Fµν . (4.51)
δ∂ ν Aµ
86
Então, temos as equações
∂µ F µν + m2 Aν = 0. (4.52)
Derivando-se (4.52), temos
∂ν ∂µ F µν + m2 ∂ν Aν = 0 =⇒ ∂ν Aν = 0,
pois Fµν é antissimétrico, anulando o primeiro termo. Portanto, o campo de Proca obedece à
condição de Lorenz identicamente.
A densidade de energia-momento de (4.49) torna-se
δL
Hµν ≡ ∂ν Aλ − ηµν L = −Fµλ ∂ν Aλ − ηµν L,
δ∂ µ Aλ
ou seja,
1 m2
Hµν = −Fµλ ∂ν Aλ + ηµν Fαβ F αβ + ηµν Aγ Aγ .
4 2
Vamos utilizar a versão simétrica
1 m2
Tµν = −Fµλ Fνλ + ηµν Fαβ F αβ + ηµν Aγ Aγ − m 2 Aµ Aν , (4.53)
4 2
que difere de Hµν por uma divergência total:
Tµν − Hµν = −m2 Aµ Aν − Fµλ Fνλ − ∂ν Aλ = ∂ λ (Fλµ Aν ) ,

fato que não altera as equações de campo. A equação acima também implica em ∂ µ Tµν = 0. Este
tensor dá origem à hamiltoniana
ˆ
H = d3 xT00
3
ˆ
R
m2

1
= d3 x −F0λ F0λ + Fαβ F αβ + Aγ Aγ − m2 A0 A0
R3 4 2
ˆ
m2

1 1
= d3 x − F0i F 0i + Fij F ij + Aγ Aγ + m2 A20 , (4.54)
R3 2 4 2
e aos momentos lineares
ˆ ˆ
d3 xT0i = d3 x F 0j Fij − m2 A0 Ai ,

Pi = (4.55)
R3 R3
que são conservados.

Uma transformação de Lorentz em um campo vetorial é dada explicitamente por

i αβ µ i µ
A (x) → exp ω (Jαβ ) ν Aν = Aµ + ω αβ (Jαβ ) ν Aν = Aµ + ω µβ Aβ ,
µ
2 2
então, a densidade de spin torna-se

δL ∂ (δAγ ) ∂ (δAγ )
sµαβ = = −F µγ
δ∂µ Aγ ∂ω αβ ∂ω αβ
∂ωγν
= −F µγ αβ Aν = −F µγ ηγ[α ηβ]ν Aν
∂ω
= −F µ[α Aβ] = F µβ Aα − F µα Aβ . (4.56)
87
O momento angular orbital, por outro lado, é dado por
`µαβ = Tµ[α xβ]

= Fµλ x[α Fβ]λ − m2 Aµ A[α xβ] − ηµ[α xβ] L (4.57)
o que resulta no momento angular total
mµαβ = Fµλ x[α Fβ]λ − m2 Aµ A[α xβ] − F µ[α Aβ] − ηµ[α xβ] L, (4.58)
cuja divergência é nula. A matriz Mαβ é dada por

ˆ
Mαβ = d3 xm0αβ
ˆR
3

= d3 x −F0i F ij x[α ηβ]j − m2 A0 A[α xβ] + A[α δβ]
i
F0i − η0[α xβ] L (4.59)
R3
também conservada.
4.6 O campo eletromagnético

O campo eletromagnético é um campo vetorial real de massa nula, que também é uma conexão
de gauge do grupo U (1). Neste caso, é mais conveniente defini-lo por sua 1-forma diferencial
A = Aµ dxµ , (4.60)
cujas componentes se transformam pela transposta de um elemento do grupo de Lorentz, mas

que também tem a lei de transformação
Aµ → Aµ − ∂ µ Λ (4.61)
sob uma transformação de gauge local U (1).

O grupo U (1) é o grupo mais trivial de transformações unitárias. Seu elemento mais geral é
escrito por
exp (iα) ,
em que α é um número real. A álgebra infinitesimal é dada pela expansão
exp (iα) ≈ 1 + iα = 1 + iα1,
ou seja, o único gerador é dado pelo número 1.

No capítulo anterior, vimos que este campo aparece como o campo que interage com o campo
escalar complexo, quando sua lagrangeana é invariante de gauge local. Esta lagrangeana é dada
por
1
L = − Fµν F µν + Aµ J µ + Lφ , Fµν = ∂µ Aν − ∂ν Aµ . (4.62)
4
em que Lφ é a lagrangeana livre do campo escalar, e J µ a corrente de interação. Todo campo
carregado eletricamente deve interagir com o campo Aµ de maneira similar, como veremos mais
adiante. Então, ao estudar exclusivamente o campo eletromagnético e sua interação, podemos
trabalhar com
1
LA = − Fµν F µν + Aµ J µ . (4.63)
4
Nosso sistema de unidades, por conveniência, é o natural, em que ~ = c = 1.
88
Neste caso,
δLA
= J µ,
δAµ
enquanto temos o resultado já calculado
δL
∂ν = ∂ν F µν ,
δ∂ν Aµ
o que resulta nas equações de campo
∂ν F µν = J µ . (4.64)
Os resultados encontrados para o campo de Proca podem ser utilizados aqui, com m → 0.
Neste caso, o tensor densidade de energia-momento tem componentes
1
Hµν = −Fµλ ∂ν Aλ + ηµν Fαβ F αβ , (4.65)
4
com a versão simétrica
1
Tµν = −Fµλ Fνλ + ηµν Fαβ F αβ . (4.66)
4
Temos também
ˆ
1 1
H= d3 x − F0i F 0i + Fij F ij , (4.67)
R3 2 4
como a hamiltoniana conservada, e os momentos lineares conservados

ˆ
Pi = d3 xF 0j Fij . (4.68)
R3
A matriz de momento angular, por outro lado, é dada por

ˆ
Mαβ = d3 x −F0i F ij x[α ηβ]j + A[α δβ]
i
F0i − η0[α xβ] LA . (4.69)
R3
Note que, tomando-se a derivada de (4.64), temos
∂µ ∂ν F µν = ∂µ J µ = 0, (4.70)
portanto, J µ é uma corrente conservada. Vamos definir suas componentes por
J µ = ρ, j i ,

(4.71)
em que ρ é a densidade de carga elétrica e j a densidade de corrente elétrica. Então,
∂ρ
∂µ J µ = 0 =⇒ − ∇ · j = 0, (4.72)
∂t
que é a equação de continuidade que envolve a conservação local de cargas elétricas.
As equações de campo tornam-se

(
∂i F 0i = ρ
∂ν F µν = J µ =⇒ . (4.73)
∂0 F i0 + ∂j F ij = j i
89
Vamos analisar a primeira equação:

ρ = ∂i F 0i = ∂i ∂ 0 Ai − ∂ i A0 = ∂i Ȧi − ∂ i A0 ,

de modo que V ≡ A0 = A0 vem a ser o potencial eletrostático escalar e Ai são as componentes do

potencial vetor eletromagnético A. Então,
i
∂A ∂V
ρ = ∂i Ȧi − ∂ i A0 = ∂i − ,
∂t ∂xi
que pode ser escrito por

∂A
∇ · −∇V − = ρ. (4.74)
∂t
Seja o campo elétrico definido por
∂A
E = −∇V − , (4.75)
∂t
então, a equação (4.74) torna-se
∇ · E = ρ, (4.76)
que é a lei de Gauss. Portanto, as componentes do campo elétrico são dadas por
Ei = F0i = Ȧi − ∂i A0 (4.77)
A segunda equação em (4.73) resulta em
j i = ∂0 F i0 + ∂j F ij = ∂0 E i + ∂j F ij ,
ou seja,
∂j F ij = −∂0 E i + j i . (4.78)
Vamos definir o campo magnético B tal que suas componentes sejam dadas por
1
Bi = ijk F jk =⇒ Fij = ijk B k . (4.79)
2
Note que
1 ijk 1
Bi = Fjk = ijk (∂j Ak − ∂k Aj ) = ijk ∂j Ak ,
2 2
que são as componentes do rotacional do potencial vetor, ou seja,
B = ∇ × A. (4.80)
Neste caso, (4.78) torna-se equivalente a
ijk ∂j Bk = −∂0 E i + j i ,
ou,
∂E
∇×B= + j, (4.81)
∂t
90
que vem a ser a lei de Ampère-Maxwell.
Com as definições de E e B, temos
0 Ex /c Ey /c Ez /c
 
 −Ex /c 0 −Bz Bx 
Fµν =
 −Ey /c Bz
. (4.82)
0 −By 
−Ez /c −Bz By 0
A hamiltoniana é dada por

ˆ ˆ
1 1 1 1
H = d3 x − F0i F 0i + Fij F ij = d3 x Ei E i + ijk B k ijm Bm
R3 2 4 3 2 4
ˆ ˆR
1 1 1 1
= d3 x E2 + (2δkm ) B k Bm = d3 x E2 + B k B k
R3 2 4 R3 2 2
ˆ
1
d3 x E2 + B2 ,

= (4.83)
2 R3
que é o conteúdo de energia do campo eletromagnético.
Os momentos lineares, por outro lado, resultam em
ˆ ˆ ˆ
Pi = d3 xF 0j Fij = d3 xE j ijk B k = d3 xijk E j B k , ou,
ˆR ˆ
3 R 3 R3
3 3
P = d x (E × B) = d xp, (4.84)
R3 R3
que vem a ser o vetor de Poynting.

Ainda temos a matriz de momento angular que, na projeção Mαβ → Mij , torna-se
ˆ h i
Mij = d3 x xi (E × B)j − xj (E × B)i + Ai Ej − Aj Ei . (4.85)
R3
O momento angular total (espacial) é dado por

ˆ
1 ijk 1 h i
Ji = Mjk = d3 x ijk xi (E × B)j − xj (E × B)i + Ai Ej − Aj Ei
2 2
ˆ h
R3
i
= d3 xijk xi (E × B)j + Ai Ej ,
R3
ou, equivalentemente,
ˆ
J= d3 x (x × p + E × A) . (4.86)
R3
Também podemos escrever uma forma explícita para o tensor energia-momento simétrico do
campo na dinâmica instantânea. Temos
E 2 + B 2 /2

px py pz
 
 px −σxx −σxy −σxz 
Tµν = . (4.87)
 py −σyx −σyy −σyz 
pz −σzx −σzy −σzz
Nesta expressão, a matriz
σxx σxy σxz

 
1 2 2

σij = Ei Ej + Bi Bj − δij E + B =  σyx σyy σyz  (4.88)
2
σzx σzy σzz
é o tensor de tensões de Maxwell.
91
Em resumo, as equações de campo
∂µ F νµ = J µ (4.89)
são equivalentes às equações de Maxwell com fontes
∂E
∇ · E = ρ, ∇×B− = j, (4.90)
∂t
no sistema de unidades naturais.
Note que a combinação de derivadas baixo se anula identicamente,
∂µ Fαβ + ∂α Fβµ + ∂β Fµα = 0. (4.91)
Essas são chamadas identidades de Bianchi do campo eletromagnético. Elas podem ser escritas
com o uso do campo dual
F̃µν ≡ µναβ F αβ , (4.92)
na forma
∂µ F̃ µν = 0. (4.93)
por exemplo, considere as componentes
1 1
F̃0i = 0imn F mn = imn F mn = Bi . (4.94)
2 2
Por outro lado,
1
F̃ij = ijαβ F αβ = ijm F 0m = ijm E m , (4.95)
2
portanto temos
0 Bx By Bz
 
 −Bx 0 −Ez Ey 
F̃µν =
 −By
. (4.96)
Ez 0 −Ex 
−Bz −Ey Ex 0
As equações (4.93) tornam-se

(
µν ∂i F̃ i0 = 0
∂µ F̃ =0 =⇒ ,
∂0 F̃ 0i + ∂i F̃ ji = 0
de modo que
∂i F̃ i0 = 0 =⇒ ∇·B=0 (4.97)
e
∂B
∂0 F̃ 0i + ∂i F̃ ji = 0 =⇒ ∇×E+ = 0, (4.98)
∂t
sendo a última, a lei de Faraday.
Portanto, o sistema de equações
∂µ F µν = −J ν , ∂µ F̃ µν = 0 (4.99)
92
é equivalente às equações de Maxwell no vácuo
∇·E=ρ ∇ · B = 0,
∂B ∂E
∇×E+ =0 ∇×B− = j. (4.100)
∂t ∂t
De fato, este campo representa o campo eletromagnético.
4.7 Liberdade de gauge
A transformação
Aµ → Aµ − ∂ µ Λ (4.101)
de fato deixa invariante as equações de Maxwell, supondo-se que j não dependa das componentes
Aµ . Isto ocorre porque, tendo quatro componentes, o campo A contém apenas dois graus de
liberdade independentes. Vamos supor as equações de Gauss e Ampère com fontes nulas,
∂µ F µν = 0, (4.102)
que podem ser escritas por
0 = ∂µ F µν = ∂µ (∂ µ Aν − ∂ ν Aµ ) = ∂µ ∂ µ Aν − ∂µ ∂ ν Aµ .
Então,
Aν − ∂ ν ∂µ Aµ = 0. (4.103)
Vamos tomar a equação para ν = 0:
A0 − ∂0 ∂µ Aµ = − ∂02 A0 + ∂0 ∇ · A = 0.

Note que
− ∂02 = ∂µ ∂ µ − ∂02 = ∂0 ∂ 0 + ∂i ∂ i − ∂02 = −∇2 ,
assim,
∇2 A0 − ∂0 ∇ · A = 0. (4.104)
Uma solução formal para (4.104) pode ser escrita por

−1
A0 = ∇ 2 ∂0 ∇ · A,
que deve ser compreendida por

ˆ
A0 (x) = d3 yG (x − y) ∂0 ∇y · A (y) , (4.105)
em que G (x − y) é a função de Green para o operador Laplaciano.

A equação para ν = i torna-se
A − ∇ (∂µ Aµ ) = A − ∇∂0 A0 + ∇ (∇ · A) = 0. (4.106)
93
Substituindo-se (4.105),
−1
A − ∇∂0 ∇2 ∂0 ∇ · A + ∇ (∇ · A) = 0.
−1
Inserindo-se a identidade ∇2 ∇2 = 1, temos
−1 −1
0 = A − ∇∂0 ∇2 ∂0 ∇ · A + ∇2 ∇ ∇2 (∇ · A)
−1
= A + −∂02 + ∇2 ∇ ∇2

(∇ · A)
2 −1

= A − ∇ ∇ (∇ · A)
−1
h i
= A − ∇ ∇2

(∇ · A) .
Vamos definir a função

−1
Λ = ∇2 (∇ · A) , (4.107)
assim,
[A − ∇Λ] = 0.
Portanto, existe uma transformação de gauge Ā = A − ∇Λ tal que a equação de onda
∂ 2 Ā
Ā = − ∇2 Ā = 0 (4.108)
∂t2
é obedecida. Note que
h −1 i
∇ · Ā = ∇ · A − ∇ ∇2 (∇ · A)
−1
= ∇ · A − ∇ 2 ∇2 (∇ · A) = ∇ · A − ∇ · A = 0, (4.109)
então, nesta escolha de gauge, o divergente de Ā é nulo. Na equação para A0 , temos

−1 −1
A0 = ∇ 2 ∂0 ∇ · A = ∇2 ∂0 ∇2 Λ = ∂0 Λ,
portanto,
Ā0 = A0 − ∂0 Λ = 0. (4.110)
Neste caso, existe uma função Λ (x) tal que toda configuração de campo pode ser levada a
obedecer as condições
A0 = 0, ∇ · A = 0. (4.111)
Essas condições são as condições do gauge de radiação. Neste gauge, o potencial vetor
eletromagnético obedece à equação de onda
A = 0 (4.112)
na ausência de fontes.
A condição ∇ · A = 0 é denominada condição de Coulomb. Para ver o que esta condição
significa, vamos decompor o campo A (x) em uma transformada de Fourier com relação a um
vetor k:
ˆ
A (x) = d3 kA (k) eik·A(x) .
94
Temos
ˆ
∇x · A (x) = ∇x · d3 kA (k) eik·x
ˆ ˆ
= d3 k (A · ∇x ) eik·x = d3 kA · kieik·x .
Portanto,
∇·A=0 =⇒ ik · A (k) = 0, (4.113)
ou seja, a componente de A longitudinal ao vetor k é nula. Dado um vetor k, todo campo vetorial
pode ser decomposto em componentes longitudinal e transversal,
A = Ak + A⊥ , (4.114)
de modo que
k × Ak = 0, k · A⊥ = 0, (4.115)
ou seja,
k ik
Ak = (k · A) , A⊥ = × A. (4.116)
k2 |k|
A condição de Coulomb simplesmente seleciona as componentes transversais do potencial

vetor, ou seja,
ik
∇·A=0 =⇒ A = A⊥ = × A,
|k|
ou, no espaço das posições,
∇·A=0 =⇒ A → A⊥ = ∇ × A. (4.117)
Esta operação pode ser efetuada por um projetor transversal
⊥
−1 ⊥ ki kj
βij = δij − ∇2 ∂i ∂j =⇒ βij (k) = δij − , (4.118)
k2
de modo que
k
β⊥A = A − (k · A) = A − Ak = A⊥ . (4.119)
k2
95
96
Capítulo 5
Campos Espinoriais
5.1 A álgebra de Clifford relativística

Vamos supor um vetor de Lorentz
u = uµ ∂µ = u0 ∂0 + u1 ∂1 + u2 ∂2 + u3 ∂3 , (5.1)
membro do espaço tangente a M4 , que denominados pelo símbolo E 1 . A base ∂µ é apenas uma
das possíveis escolhas de base para o espaço-tempo de Minkowski, que resulta no produto escalar
u · v = uµ vµ = ηµν uµ v ν , (5.2)
em que
1 0 0 0
 
 0 −1 0 0 
ηµν =  (5.3)
 0 0 −1 0 
0 0 0 −1
são as componentes da métrica de Minkowski.

Agora, vamos considerar uma base generalizada
u = uµ γµ = u0 γ0 + u1 γ1 + u2 γ2 + u3 γ3 . (5.4)
Considere um produto (u, v) ≡ uv de dois objetos do tipo (5.4), com as propriedades de bilineari-
dade
(αu + βv, w) = α (u, w) + β (v, w) , (5.5)
e a associatividade. A norma de um vetor u, contudo, continua definida por

2 2 2 2
u2 = (u, u) = uµ uµ = u0 − u1 − u2 − u3 , (5.6)
ou seja,
(u, u) = (uµ γµ , uν γν ) = uµ (γµ , γν ) uν = uµ uν γµ γν

γ0 γ0 γ0 γ1 γ0 γ2 γ0 γ3 u0
  
 γ1 γ0 γ1 γ1 γ1 γ2 γ1 γ3   1 
u 
= u0 u1 u2 u3   . (5.7)
 γ2 γ0 γ2 γ1 γ2 γ2 γ2 γ3   u2 
γ3 γ0 γ3 γ1 γ3 γ2 γ3 γ3 u3
97
Comparando-se (5.6) com (5.7), nota-se que
γ0 γ0 = 1, γi γi = −1, (5.8)
sem soma em i. Já os termos fora da diagonal devem satisfazer
γµ γν + γν γµ = 0, µ 6= ν. (5.9)
A álgebra vetorial ordinária, denominada álgebra de Gibbs, é obtida com γµ γν = ηµν , supondo-
se sempre que o produto de dois elementos da base é um escalar. Neste caso, o produto é também
simétrico. Mas no caso mais geral, consideramos γµ objetos não comutativos de natureza ainda
indeterminada. Assim,
Definição 19. Se {γµ } ⊂ E 1 é uma base completa que obedece às condições gerais de
anti-comutação
{γµ , γν } ≡ γµ γν + γν γµ = 2ηµν , (5.10)
dizemos que γµ são geradores de uma álgebra de Clifford C`1,3 .
Vemos claramente que (5.10) representa apropriadamente as condições (5.8) e (5.9). Aprovei-
tamos para introduzir o anticomutador {A, B} = AB + BA, e o comutador [A, B] = AB − BA. O
produto de Clifford (ou produto geométrico) entre dois vetores u e v é introduzido por
1 µ ν 1
uv = (uµ γµ ) (v ν γν ) = uµ v ν γµ γν = u v {γµ , γν } + uµ v ν [γµ , γν ]
2 2
1
= ηµν uµ v ν + uµ v ν (γµ γν − γµ γν )
2
≡ uµ vµ + uµ v ν γµ ∧ γν , (5.11)
em que
Definição 20. Seja {γµ } ⊂ C`1,3 uma base completa da álgebra de Clifford C`1,3 . O
produto
1 1
γµ ∧ γν ≡ [γµ , γν ] = (γµ γν − γν γµ ) (5.12)
2 2
é denominado produto exterior entre dois elementos da base.
Então o produto de Clifford consiste em duas partes: a primeira é o produto escalar ordinário
entre os vetores u e v. A segunda parte,
u ∧ v ≡ uµ v ν γµ ∧ γν , (5.13)
envolve o produto exterior entre u e v. Quando u e v são vetores de Lorentz, vemos claramente
que este produto é antissimétrico. Note que u ∧ v não pode ser um escalar, nem um vetor, devido
às relações (5.10). Ele forma um novo objeto, denominado forma diferencial de segunda
ordem, ou 2-forma. Portanto,
uv = u · v + u ∧ v, (5.14)
em que u · v é igual ao produto escalar ordinário uµ vµ , e u ∧ v é uma 2-forma.
98
Definição 21. Seja {γµ } ⊂ C`1,3 uma base completa. Um objeto do tipo
α = αµν γµ γν (5.15)
é denominado bivetor e pertence a um espaço denominado pelo símbolo E 2 . Todo

bivetor pode ser escrito como a soma de um escalar e uma 2-forma.
A seguinte questão é imediata: podemos tomar um produto de Clifford entre um vetor e um

bivetor? Sejam u ∈ E 1 e α ∈ E 2 , temos
uα = (uµ γµ ) ανλ γν γλ = uµ ανλ γµ γν γλ

= u ανλ γν γλ = u (ανγ ηνλ + ανγ γν ∧ γγ )

= u ανν + ανλ γν ∧ γλ = trαu + uµ ανλ γµ γν ∧ γλ

1
= trαu + uµ ανλ {γµ , γν } ∧ γλ + uµ ανλ γµ ∧ γν ∧ γλ
2
= trαuλ + uν ανλ γλ + uµ ανγ γµ ∧ γν ∧ γγ .

(5.16)
O primeiro termo é um vetor. O segundo é um objeto cuja base envolve um produto exterior
triplo. Este objeto é denominado 3-forma diferencial. Assim, o produto de Clifford uα é a soma
de um vetor e uma 3-forma:
T = T µνλ γµ γν γλ (5.17)
é denominado trivetor e pertence a um espaço denominado pelo símbolo E 3 . Todo

trivetor pode ser escrito como a soma de um vetor e uma 3-forma.
Por outro lado, o produto de um vetor com um trivetor T ∈ E 3 resulta em
uT = uα T µνλ γα γµ γν γλ , (5.18)
de modo que
uT = uµ T µνν + uµ T νµν + uµ Tννµ

+ uµ T µαβ + uα T µµβ + uα T βνν γα ∧ γβ

+uα T µνλ γα ∧ γµ ∧ γν ∧ γλ , (5.19)
que é a soma de um escalar, uma 2-forma e um objeto ainda desconhecido, que será denominado
4-forma diferencial.
Γ = Γαµνλ γα γµ γν γλ (5.20)
é denominado quadrivetor e pertence a um espaço denominado pelo símbolo E 4 . Todo

quadrivetor pode ser escrito como a soma de um escalar, uma 2-forma e uma 4-forma.
Vamos analisar as bases. Vetores, ou 1-formas diferenciais em nossa notação, são expandidos
com a base da álgebra de Clifford, que consiste no conjunto de quatro objetos independentes
{γ0 , γ1 , γ2 , γ3 } .
99
As 2-formas, por outro lado, possuem seis geradores independentes,
{γ0 ∧ γ1 , γ0 ∧ γ2 , γ0 ∧ γ3 , γ1 ∧ γ2 , γ1 ∧ γ3 , γ2 ∧ γ3 } .
A base de 3-formas possui quatro geradores:
{γ0 ∧ γ1 ∧ γ2 , γ0 ∧ γ2 ∧ γ3 , γ0 ∧ γ1 ∧ γ3 , γ1 ∧ γ2 ∧ γ3 } ,
e por fim, o único gerador de uma 4-forma é o elemento de base {γ0 ∧ γ1 ∧ γ2 ∧ γ3 }. Isto ocorre
pois qualquer índice repetido anula a base das formas diferenciais. Por esta razão, o produto
de um vetor e um 4-vetor não resulta em nenhum objeto novo: 4-formas são o máximo que
conseguiremos.
Neste caso, a soma direta E ≡ E 0 ⊕ E 1 ⊕ E 2 ⊕ E 3 ⊕ E 4 forma um espaço vetorial E sob o produto
de Clifford, cujos elementos são multivetores
u = a + u + α + T + Γ. (5.21)
O espaço multivetorial é fechado pelo produto de Clifford, ou seja, para dois multivetores u ∈ E
e v ∈ E, uv ∈ E. O espaço multivetorial E em conjunto com o produto geométrico é o que
denominamos álgebra de Clifford relativística. A seguir, vamos definir alguma operações que
dependem exclusivamente desta álgebra.
Definição 24. (Paridade)

Seja {γ µ } ⊂ C`1,3 uma base completa. Um operador P , tal que
P −1 γ µ P = δ0µ γ 0 − δiµ γ i , (5.22)
é denominado operador de paridade. A operação de paridade mantém o eixo temporal

da base, enquanto inverte os eixos espaciais.
Note que
γ0γ0γ0 = γ0
γ 0 γ i γ 0 = −γ 0 γ 0 γ i = −γ i ,
ou seja,
γ0γµγ0 = γ0 γµ, γ0 − γ0γ0γµ

= 2η µ0 γ 0 − γ µ
= 2δ0µ γ 0 − δ0µ γ 0 − δiµ γ i
= δ0µ γ 0 − δiµ γ i .
Ou seja, γ 0 atua em um elemento da base como um operador de paridade. De fato, P = γ 0 para

toda possível representação de uma álgebra de Clifford.
100
Definição 25. (Reversão temporal)
Seja {γ µ } ⊂ C`1,3 uma base completa. Um operador T , tal que
T −1 γ µ T = −δ0µ γ 0 + δiµ γ i , (5.23)
é denominado operador de reversão temporal. A operação de reversão temporal inverte

o eixo temporal da base, enquanto deixa invariantes os eixos espaciais.
A operação de dualidade é definida como segue.
Definição 26. (Dualidade)

Seja Ak ∈ E k um k-forma no espaço M4 . O dual ?Ak é uma (4 − k)-forma
?Ak = −iγ5 Ak , (5.24)
em que
γ5 ≡ iγ0 γ1 γ2 γ3 . (5.25)
O dual de uma 1-forma é, portanto, uma 3-forma:
?u = −iγ5 u
= uµ γ0 γ1 γ2 γ3 γµ
= u0 γ0 γ1 γ2 γ3 γ0 + u1 γ0 γ1 γ2 γ3 γ1 + u2 γ0 γ1 γ2 γ3 γ2 + u3 γ0 γ1 γ2 γ3 γ3
= −u0 γ1 γ2 γ3 − u1 γ0 γ2 γ3 + u2 γ0 γ1 γ3 − u3 γ0 γ1 γ2 .
O dual de uma 2-forma é uma 2-forma:
?α = −iγ5 α
= γ0 γ1 γ2 γ3 αµν γµ ∧ γν
= α[01] γ2 γ3 + α[20] γ1 γ3 + α[03] γ1 γ2
+α[21] γ0 γ3 + α[13] γ0 γ2 + α[32] γ0 γ1 .
?T = −iγ5 T
= −iγ5 T µνγ γµ ∧ γν ∧ γγ
= T [012] γ3 + T [013] γ2 + T [023] γ1 + T [123] γ0 .
?Γ = −iγ5 Γ = Γ[1234] γ5 γ5 = Γ[1234] .
Definição 27. (Conjugação de carga)

Seja {γ µ } ⊂ C`1,3 uma base completa. Um operador C, tal que
∗
C † C = 1 e C † γ µ C = − (γ µ ) (5.26)
é denominado operador de conjugação de carga. A operação de conjugação de carga

transforma os geradores em seus opostos conjugados. A relação com a "carga" será
elucidada mais adiante.
101
5.2 Rotações: a representação espinorial das transforma-
ções de Lorentz
Vamos trabalhar, agora, com a álgebra de Clifford gerada pelos objetos
γµ = γ0, γ1, γ2, γ3 ,

(5.27)
que obedecem às relações de anticomutação
{γ µ , γ ν } = 2η µν . (5.28)
Não há um conjunto de escalares ou vetores de Lorentz que satisfaçam essas condições, então
devemos pensar em objetos matemáticos mais gerais, como matrizes complexas. De fato, uma
inspeção em (5.28) também exclui matrizes quadradas de dimensão 2 ou 3. As matrizes de
ordem mais baixa que podem representar uma álgebra de Clifford em quatro dimensões são de
dimensão 4.
Uma possível representação é dada pelas matrizes de Dirac
σi

02×2 12×2 02×2
γ0 = , γi = , (5.29)
12×2 02×2 −σ i 02×2
em que σ i são as matrizes de Pauli

0 1 0 −i 1 0
σ1 = , σ2 = , σ3 = . (5.30)
1 0 i 0 0 −1
As matrizes de Pauli, por outro lado, obedecem a uma álgebra de Clifford euclidiana em três

dimensões σ i , σ j = 2δ ij . Toda possível representação da álgebra de Clifford quadridimensional
em termos de matrizes 4 × 4 são equivalentes por transformações inversíveis, ou seja
γ̄ µ = V γ µ V −1 =⇒ {γ̄ µ , γ̄ ν } = 2η µν .
A representação (5.29) é denominada representação de Weyl, ou chiral, a qual empregaremos

sempre que necessário.
O fato é que os comutadores
i µ ν i
S µν ≡ [γ , γ ] = (γ µ γ ν − γ ν γ µ ) (5.31)
4 4
são geradores da álgebra de Lorentz quadridimensional.
Exercício 1. A partir da definição (5.31), mostre que

µν αβ
= i η µβ S να − η µα S νβ + η να S µβ − η νβ S µα

S ,S (5.32)
e, portanto, S µν são geradores de pseudo-rotações em M4 .
Na representação chiral, com a dinâmica instantânea, temos
σi

i 0 i i 0
S 0i = γ ,γ = − , (5.33)
4 2 0 −σ i
102
que são geradores de boosts, enquanto

i i j 1 ijk σk 0 1 ijk
S ij = γ ,γ = = Σk , (5.34)
4 2 0 σk 2
em que σk = −δki σ i , são os geradores de rotações tridimensionais. De fato,

σi 0
Σi = ijk S jk = , (5.35)
0 σi
satisfazem a álgebra de Lie
[Σi , Σj ] = ijk Σk ,
portanto, rotações em 3 dimensões também podem ser geradas por Σi .

A representação mais trivial de uma transformação de Lorentz no espaço de Minkowski é a
representação adjunta, ou vetorial, na qual a matriz de transformação é dada por

i µν
Λαβ ≡ exp − ωµν (M )αβ , (5.36)
2
em que

(M µν )αβ = i δαµ δβν − δβµ δαν (5.37)
são os geradores de pseudo-rotações nesta representação. A matriz (5.36)determina como uma

transformação de Lorentz é aplicada em vetores (A0µ = Λµν Aν ) ou tensores e.g. T 0µν = Λµα Λνβ T αβ .
O que acabamos de encontrar, com o uso da álgebra de Clifford (5.28), é uma nova representação
da álgebra de Lorentz. Como γ µ são matrizes 4 × 4 complexas (γ µ )ab , o mesmo ocorre com os ge-
radores S µν . Portanto, os índices µ, ν = 0, 1, 2, 3 do espaço-tempo são acompanhados por índices
matriciais a, b = 1, 2, 3, 4. Se S µν obedecem a uma álgebra de Lie (5.32), podemos escrever um
elemento do respectivo grupo de Lie por exponenciação,

i µν
Sab (Λ) = exp − ωµν (S )ab . (5.38)
2
Dizemos que esta é a representação espinorial de um elemento do grupo de Lorentz. Podemos

mostrar que não há transformação inversível que conecte a matriz (5.36) à matriz (5.38), por-
tanto, a representação vetorial e a espinorial são inequivalentes. Isto significa que os objetos que
rodam sob a ação de (5.38) não são vetores ou tensores em M4 . Os índices a, b serão frequen-
temente ignorados, já que as operações de transformações são representadas por multiplicações
matriciais simples, a menos de casos em que explicitar esses índices torne-se necessário. Os
objetos geométricos sobre os quais age (5.38) são denominados espinores, que serão apropria-
damente definidos mais adiante.
Exercício 2. Demonstre a relação de comutação

µ αβ µ
= i η µα δνβ − η µβ δνα γ ν = M αβ ν γ ν .

γ ,S (5.39)
Com este resultado, mostre também que

i αβ µ i αβ µ i αβ µ
γν .

1 + ωαβ S γ 1 − ωαβ S ≈ δν − ωαβ M ν
(5.40)
2 2 2
103
A forma finita de (5.40) é dada por
S −1 (Λ) γ µ S (Λ) = Λµν γ ν . (5.41)
A relação (5.41) tem um significado fundamental. Se S (Λ) é um operador de pseudo-rotação, as

matrizes γ µ rodam como se fossem vetores de Lorentz.
Uma consequência importante desta construção segue agora. Vamos tomar apenas uma ro-
tação genérica em três dimensões

i ij
S (R) = exp − ωij S . (5.42)
2
Uma rotação espacial em um vetor de Lorentz deve ser ortogonal, o que implica que sua re-
presentação em termos de matrizes complexas deve ser unitária. Se S (R) é unitário, ou seja,
S † (R) S (R) = 1,

i ij i
1 = S † (R) S (R) = 1 + ωij S † 1 − ωmn S mn
2 2
i ij

≈ 1 − ωij S ij − S †

,
2
ou seja,
ij
S ij = S † , (5.43)
e os geradores devem ser auto adjuntos (hermitianos). Neste caso, (5.43) implica em
i i j i † h † † i
γ , γ = − γi, γj γi, γj = γi , γj

=⇒ ,
4 4
ou seja,
† −1
γi γi = ±1, (5.44)
então as matrizes γ i são hermitianas ou anti-hermitianas. A representação chiral é anti-hermitiana,

†
ou seja, γ i = − γ i , então, de fato, S (R) é unitário. Também podemos mostrar que uma trans-
formação de similaridade resulta também em uma representação anti-hermitiana para γ i .
Vamos ver o que ocorre para os boosts

i
S (K) = exp − ω0i S 0i . (5.45)
2
Se quisermos que S (K) seja unitário, temos igualmente o resultado de que S 0i devem ser her-
miteanos, o que resulta em
i 0 i i † 0 i h 0 † † i
γ , γ = − γ0, γi =⇒ γ ,γ = γ , γi .
4 4
Se γ i são anti-hermitianos, γ 0 também deve ser anti-hermitiano. Por outro lado, uma possível re-
presentação hermitiana das matrizes γ i implicaria em que γ 0 também precisaria ser hermitiana.
Contudo, γ 0 é claramente hermitiana na representação chiral. De fato, não há representação das
matrizes de Dirac na qual γ 0 e γ i sejam hermitianas ou anti-hermitianas em conjunto. A repre-
sentação espinorial de boosts de Lorentz não pode ser unitária.
104
Observação 6. O fato da não unitaridade dos boosts na representação espinorial é um
problema fundamental para a formulação da mecânica quântica relativística. Nesta
teoria, espinores de Dirac são interpretados como funções de onda, por exemplo, para
o elétron relativístico, o que significa que essas funções definem densidades de proba-
bilidade de transição entre estados quânticos do elétron. Uma transformação sobre as
funções de onda preserva a probabilidade apenas se esta for representada por um ope-
rador unitário ou anti-unitário, o que implica que os geradores devem ser hermiteanos
ou anti-hermiteanos. Nossa construção não pode ser uma teoria deste tipo. Se boosts
são necessariamente não unitários, uma mudança de referencial inercial resultaria em
mudança na probabilidade de transição, ou seja, o espectro do átomo de hidrogênio re-
sultaria ser distinto para dois observadores com velocidades relativas distintas. Isto
é fisicamente inaceitável, portanto um espinor de Dirac não pode ser uma função de
onda. A mecânica quântica relativística é uma teoria fisicamente incoerente
com o princípio da relatividade e, portanto, não tem validade física por princípio.
5.3 Representações de spin

A representação de Weyl, ou chiral, tem uma grande vantagem operacional. As matrizes γ µ são
representadas por matrizes 4 × 4 formadas por blocos de matrizes 2 × 2. Isto sugere que pode
haver uma representação de pseudo-rotações em duas dimensões, embora essa representação
certamente deve quebrar a álgebra de Clifford quadridimensional.
Vamos observar novamente os boosts

i 1 1 0
S (K) = exp − ω0i S 0i = exp φi σ i
2 4 0 −1
1 i
!
φi σ i eφi σ /4

4 0 0
= exp = i , (5.46)
0 − 41 φi σ i 0 e−φi σ /4
em que φi são as componentes da rapidez φ. Existem, portanto, duas operações distintas,

1 i
S± (K) = exp ± φ · σ = exp − φ · K , (5.47)
4 2
em que
i
K = ± σ. (5.48)
2
As matrizes S± (K) são bidimensionais.
Sobre as rotações, temos
e−iθ·σ/2

i i 1 0 0
S (R) = exp − ωij S ij = exp − θk σk = , (5.49)
2 2 0 1 0 e−iθ·σ/2
em que
1 kij
θk ≡ ωij .
2
Então, (5.49) é uma transformação duplicada, com a forma 2 × 2

i
S (J) = exp − θ · σ = exp [−iθ · J ] , (5.50)
2
105
em que
σ
J= . (5.51)
2
Exercício 3. Use as matrizes de Pauli para demonstrar as relações de comutação

i j
σ , σ = 2iijk σ k . (5.52)
Mostre também que

i j
J , J = iijk J k , K i , K j = −iijk J k , J i , K j = iijk K k .

(5.53)
Portanto, de fato o conjunto de seis geradores {J , K} são geradores de transformações

de Lorentz.
A relação (5.48) indica que J = ±iK, cada escolha de sinal implica em uma operação de boost
distinta. Assim, vamos definir dois geradores
1
W± = (J ± iK) , (5.54)
2
que fecham a álgebra
h i h i
W±i , W±j = iij k W±k , W±i , W∓j = 0. (5.55)
Portanto, W±i são geradores de duas rotações independentes no plano complexo, com seis parâ-
metros independentes. A equação J = ±iK implica em W + = 0 ou W − = 0, o que define dois
estados independentes:
(j, 0) → J = iK =⇒ W − = 0,
(0, j) → J = −iK =⇒ W + = 0.
O número j é o valor da representação de spin. No caso de transformações em que 5.48 e 5.51 são
os geradores, então j = 1/2. Assim, temos duas rotações inequivalentes. Não há transformação
inversível tal que W + ↔ W − .
Definição 28. Sejam dois objetos ψR e ψL , representados por matrizes coluna 2 × 1

que, numa transformação de Lorentz, se transformam na forma
ψR −→ exp [2iω · W + ] ψR , ψL −→ exp [2iω · W − ] ψL . (5.56)
Estes objetos são denominados bi-espinores. Os parâmetros ω são números complexos.
O bi-espinor ψR é denominado espinor de mão direita, ou do tipo (j, 0), enquanto ψL é um

espinor de mão esquerda, ou do tipo (0, j). Por convenção, vamos definir o tipo (1/2, 0) pelas
condições
1 i
J= σ, K = − σ, W − = 0. (5.57)
2 2
106
Assim,
ψR −→ exp [iω · W + ] ψR
= exp [iω · (J + iK)] ψR = exp [i (ω · J + iω · K)] ψR
h σi
= exp i (θ − iφ) · ψR . (5.58)
2
O tipo (0, 1/2) é dado por
1 i
J= σ, K= σ, W + = 0, (5.59)
2 2
que resulta em
h σi
ψL −→ exp i (θ + iφ) · ψL . (5.60)
2
Ambas as representações são inequivalentes por transformações inversíveis.
Contudo, espinores de mão direita e esquerda estão relacionados por uma transformação de
paridade. A paridade é uma transformação discreta no espaço-tempo, de modo que os eixos são
invertidos, ou seja,
(ct, x, y, z) → (ct, −x, −y, −z) .
As velocidades, inclusive as relativas entre dois referenciais inerciais, trocam de sinal. Por-
tanto, uma operação de paridade é equivalente a uma transformação de Lorentz inversa, em
que φ → −φ. Portanto, os geradores K também trocam de sinal, ou seja, K → −K. Por outro
lado, os geradores J permanecem invariantes (uma rotação no sentido horário permanece no
sentido horário após uma transformação de paridade), o que é coerente com o que conhecemos
do momento angular. Assim,
W ± → W ∓,
o que implica em
ψR ↔ ψL . (5.61)
Vamos considerar, agora, um boost simples em uma direção n do espaço. Temos

1 1
ψR −→ exp − σ · φ ψR = exp − σ · nφ ψR . (5.62)
2 2
107
Exercício 4. Mostre que
(
k 1 se k é par,
(σ · n) = (5.63)
σ·n se k é ímpar.
Com este resultado, mostre que

1 φ φ
exp σ · nφ = cosh + σ · n sinh . (5.64)
2 2 2
Agora, demonstre as relações

r r
φ γ+1 φ γ−1
cosh = , sinh = , (5.65)
2 2 2 2
Por fim, suponha que o observador original está em repouso, e o segundo observador
tem momento p com relação ao primeiro. Neste caso, E 2 = m2 + p2 implica em E = γm
(c = 1). Mostre que
E+m+σ·p
ψR (p) = p ψR (0) . (5.66)
2m (E + m)
Da mesma forma, mostre que
E+m−σ·p
ψL (p) = p ψL (0) . (5.67)
2m (E + m)
Temos que ψR (0) = ψL (0). Portanto,
E+σ·p
ψR (u) = ψL (u) , (5.68a)
m
e
E−σ·p
ψL (u) = ψR (u) . (5.68b)
m
Essas equações podem ser colocadas na forma
−mψR + (p0 + σ · p) ψL = 0
(p0 − σ · p) ψR − mψL = 0,
ou em forma matricial

−m p0 + σ · p ψR
= 0. (5.69)
p0 − σ · p −m ψL
Esta equação pode ser escrita em termos das matrizes γ µ (5.29) como
γ 0 p0 + γ i pi − m1 ψ = 0,

ou
(γ µ pµ − m) ψ = 0, (5.70)
108
em que

ψR
ψ= . (5.71)
ψL
A equação (5.70) é a equação de Dirac. Portanto, a equação de Dirac é uma relação algébrica
entre os espinores chirais ψR e ψL .
Escrita na forma (5.70), a equação de Dirac supõe que ψ = ψ (p) é um campo que depende do
momento do campo com relação a determinado referencial inercial. Assim, a álgebra de Clifford
é realizada em um espaço de momentos, análogo à representação dos momentos em mecânica
quântica. Por outro lado, se supomos ψ = ψ (x) um campo com valores no espaço-tempo, os
momentos são representados por
pµ = i∂µ . (5.72)
Neste caso, a equação de Dirac no espaço das posições é dada por
(iγ µ ∂µ − m) ψ (x) = 0, (5.73)
que é um conjunto acoplado de equações diferenciais parciais de primeira ordem. Ambas as

realizações são relacionadas por uma transformada de Fourier
ˆ
ψ (x) = d4 pψ (p) exp (−ipµ xµ ) , (5.74)
de modo que
ˆ ˆ
4
∂λ ψ (x) = µ
d pψ (p) ∂λ exp (−ipµ x ) = d4 p (−ipλ ) ψ (p) exp (−ipµ xµ ) ,
que implica em (5.72).
5.4 Espinores de Weyl

Vamos tomar as equações (5.69)

−m p0 + σ · p ψR
= 0, (5.75)
p0 − σ · p −m ψL
que, com m = 0 tornam-se

0 p0 + σ · p ψR
= 0,
p0 − σ · p 0 ψL
ou

ψR
γ µ pµ = 0. (5.76)
ψL
Agora, considere as matrizes 2 × 2
σ µ = 1, σ i e σ̄ µ = 1, −σ i .

(5.77)
Com (5.77), podemos escrever (5.76) por
σ̄ µ pµ ψR = 0 e σ µ pµ ψL = 0. (5.78)
109
Neste caso, espinores de mão direita e esquerda não massivos são denominados espinores de
Weyl, enquanto (5.78) são as equações de Weyl para estes espinores.
5.5 A ação de Dirac
Construir uma ação que resulte na equação (5.73) implica na construção de invariantes de Lo-
rentz com as matrizes γ µ . A primeira tarefa é construir um escalar, cuja primeira tentativa pode
ser simplesmente o objeto
ψ † (x) ψ (x) ,
T
em que ψ † é o operador auto-adjunto de ψ, ou seja, ψ † = (ψ ∗ ) . Para que este objeto seja um
escalar, é necessário que
ψ † ψ (x) → ψ † ψ Λ−1 x

sob uma transformação de Lorentz Λ. Os espinores, contudo, se transformam por
ψ (x) → S (Λ) ψ Λ−1 x e ψ † (x) → ψ † Λ−1 x S † (Λ) .

Assim,
ψ † (x) ψ (x) → ψ † Λ−1 x S † (Λ) S (Λ) ψ Λ−1 x ,

que resultaria em um escalar se S (Λ) fosse unitário.
O fato de não haver representação 4 × 4 unitária do grupo de Lorentz impede, assim, que
ψ † ψ seja um escalar de Lorentz. Note, contudo, que podemos usar a operação de paridade para
†
encontrar uma função adequada, já que γ 0 γ 0 = 1 implica em γ 0 = γ 0 e γ i γ i = −1 implica em
†
γ i = − γ i , como já vimos. Neste caso,
†
P −1 γ µ P = (γ µ ) , P = γ0. (5.79)
Por outro lado,
† i † ih µ † †
i
(S µν ) = − [γ µ , γ ν ] = (γ ) , (γ ν )
4 4
i 0 µ 0 0 ν 0 i
= γ γ γ , γ γ γ = γ 0 [γ µ , γ ν ] γ 0
4 4
= γ 0 S µν γ 0 , (5.80)
que implica em
†
i i †
S † (Λ) = exp − ωµν S µν = exp ωµν (S µν )
2 2

i i
= exp ωµν γ 0 S µν γ 0 = γ 0 exp ωµν S µν γ 0
2 2
= γ 0 S −1 (Λ) γ 0 , S −1 S = 1. (5.81)
Assim, definimos
110
Definição 29. (Espinor de Dirac adjunto)
O objeto
ψ̄ (x) = ψ † (x) γ 0 (5.82)
é denominado adjunto de ψ (x).
Agora, mostramos que ψ̄ψ é um escalar de Lorentz:
ψ̄ψ = ψ † γ 0 ψ = ψ † γ 0 ψ →ψ † S † γ 0 Sψ = ψ † γ 0 S −1 γ 0 γ 0 Sψ
= ψ † γ 0 S −1 Sψ = ψ † γ 0 ψ = ψ̄ψ,
ou explicitando os argumentos,
ψ̄ψ (x) → ψ̄ψ Λ−1 x .

(5.83)
Afirmação 1. O objeto
ψ̄ (x) γ µ ψ (x) (5.84)
é um vetor de Lorentz.
Para demonstrar esta afirmação, vamos utilizar o resultado (5.41)
S −1 (Λ) γ µ S (Λ) = Λµν γ ν ,
tendo em mente que
ψ̄ (x) → ψ̄ Λ−1 x S −1 (Λ) .

Assim,
ψ̄ (x) γ µ ψ (x) →ψ̄ Λ−1 x S −1 (Λ) γ µ S (Λ) ψ Λ−1 x

= ψ̄ Λ−1 x Λµν γ ν ψ Λ−1 x

= Λµν ψ̄γ ν ψ Λ−1 x ,

o que prova a Afirmação 1.

Da mesma forma, podemos demonstrar que
1 1
ψ̄γ µ γ ν ψ = ψ̄ {γ µ , γ ν } ψ + ψ̄ [γ µ , γ ν ] ψ
2 2
µν µν

= η ψ̄ψ − 2i ψ̄S ψ (5.85)
transforma-se como um tensor de Lorentz do tipo (2, 0), e constitui um bivetor. Toda forma
multilinear pode ser construída a partir de ψ̄ψ, ψ̄γ µ ψ e ψ̄γ µ γ ν ψ, de modo que escalares podem
ser definidos a partir da contração desses multivetores.
Definição 30. A ação de Dirac é definida pelo funcional

ˆ
A≡ dω ψ̄ (x) (iγ µ ∂µ − m) ψ (x) . (5.86)
Ω
111
É fácil demonstrar que o objeto ψ̄ (iγ µ ∂µ ) ψ é um invariante de Lorentz:
ν −1
ψ̄ (x) iγ µ ∂µx ψ (x) →ψ̄ Λ−1 x S −1 (Λ) iγ µ Λ† µ ∂νΛ x S (Λ) ψ Λ−1 x

ν −1
= ψ̄ Λ−1 x S −1 (Λ) (iγ µ ) S (Λ) Λ† µ ∂νΛ x ψ Λ−1 x

ν −1
= ψ̄ Λ−1 x Λµλ iγ λ Λ† µ ∂νΛ x ψ Λ−1 x

−1

= ψ̄ Λ−1 x iγ ν ∂νΛ x ψ Λ−1 x .

(5.87)
O termo mψ̄ψ, que é um invariante já que m é um invariante, representa o termo de massa do

campo.
5.6 Aplicando o princípio de Weiss
Agora, vamos mostrar que a equação de Dirac surge da ação (5.86), juntamente com uma equação
adjunta. Além disso, estamos interessados em calcular o tensor energia-momento do campo ψ
e os invariantes dinâmicos relacionados à simetrias desta ação. Contudo, esta ação pode ser
suplementada por um termo de fronteira, que não modifica as equações de campo, de modo que
usaremos a integral simétrica
ˆ
↔

µ
A≡ dω ψ̄ (x) iγ ∂ µ − m ψ (x) , (5.88)
Ω
em que
↔ 1
ψ̄γ µ ∂ µ ψ = ψ̄γ µ ∂µ ψ − ∂µ ψ̄γ µ ψ .

(5.89)
2
Consideremos a seguinte transformação infinitesimal
δx = x0 − x, δψ (x) = ψ 0 (x0 ) − ψ (x) , δ ψ̄ (x) = ψ̄ 0 (x0 ) − ψ̄ (x) . (5.90)
A transformação no espinor adjunto ψ̄ é considerada independente da transformação em ψ.

ˆ
↔
ˆ ↔
δA = δ dω ψ̄ iγ µ ∂ µ − m ψ = δ dω ψ̄Dψ, D ≡ iγ µ ∂ µ − m,
ˆ Ω ˆ Ω
ˆ ˆ
dω∂λ δxλ ψ̄Dψ +

= δdω ψ̄Dψ + dωδ ψ̄Dψ = dωδ ψ̄Dψ
ˆΩ Ω
ˆ Ω Ω
λ λ

= dω δ − δx ∂λ ψ̄Dψ + dω∂λ ψ̄Dψδx
ˆΩ ˆ Ω
dω∂λ ψ̄Dψδxλ , δ̄ ≡ δ − δxλ ∂λ .

= dω δ̄ ψ̄Dψ +
Ω Ω
Temos que calcular o termo

δ̄ ψ̄Dψ = δ̄ ψ̄ (Dψ) + ψ̄ δ̄ [Dψ] .
Temos

δ̄ (∂µ ψ) = ∂µ δ̄ψ =⇒ δ̄D = Dδ̄,
112
de modo que

↔ ↔
µ µ

δ̄ ψ̄Dψ = δ̄ ψ̄ (Dψ) + ψ̄D δ̄ψ = δ̄ ψ̄ iγ ∂ µ − m ψ + ψ̄ iγ ∂ µ − m δ̄ψ
↔ ↔
= iδ̄ ψ̄γ µ ∂ µ ψ − mδ̄ ψ̄ψ + iγ µ ψ̄ ∂ µ δ̄ψ − mψ̄ δ̄ψ
i
δ̄ ψ̄γ µ ∂µ ψ − ∂µ δ̄ ψ̄ γ µ ψ + ψ̄γ µ ∂µ δ̄ψ − ∂µ ψ̄γ µ δ̄ψ − m δ̄ ψ̄ ψ − mψ̄ δ̄ψ

=
2
µ
µ
i µ i µ
= δ̄ ψ̄iγ ∂µ ψ − m δ̄ ψ̄ ψ − ∂µ ψ̄iγ δ̄ψ − mψ̄ δ̄ψ + ∂µ ψ̄γ δ̄ψ − ∂µ δ̄ ψ̄γ ψ
2 2

i µ i
= δ̄ ψ̄ (iγ µ ∂µ − m) ψ − ∂µ ψ̄iγ µ + mψ̄ δ̄ψ + ∂µ ψ̄γ δ̄ψ − δ̄ ψ̄γ µ ψ

2 2
Vamos definir as derivada à direita e à esquerda

← →
ψ̄γ µ i ∂ µ ≡ i∂µ ψ̄γ µ , iγ µ ∂ µ ≡ iγ µ ∂µ ψ. (5.91)
Assim,

→ ← i µ i
µ µ µ

δ̄ ψ̄Dψ = δ̄ ψ̄ iγ ∂ µ − m ψ − ψ̄ i ∂ µ γ + m δ̄ψ + ∂µ ψ̄γ δ̄ψ − δ̄ ψ̄γ ψ (5.92)
2 2
Então,
ˆ
→

←
ˆ
δA = dω δ̄ ψ̄ iγ µ ∂ µ − m ψ − ψ̄ i ∂ µ γ µ + m δ̄ψ + div, (5.93)
Ω
em que
ˆ ˆ
i λ i λ λ
div ≡ dω∂λ ψ̄γ δ̄ψ − δ̄ ψ̄γ ψ + ψ̄Dψδx . (5.94)
Ω 2 2
Para que δA seja um termo de fronteira, temos as equações de Dirac

→
iγ µ ∂ µ − m ψ (x) = 0, (5.95a)

←
ψ̄ (x) iγ µ ∂ µ + m = 0, (5.95b)
tanto para ψ quanto para o adjunto ψ̄.
O termo de fronteira é escrito por

ˆ
i λ i i λ i
dω∂λ ψ̄γ δψ − δ ψ̄γ λ ψ − ψ̄γ ∂γ ψ + ∂γ ψ̄ − γ λ ψ − δγλ ψ̄Dψ δxγ . (5.96)
Ω 2 2 2 2
Neste caso, temos os momentos conjugados
i λ i
πψλ = ψ̄γ , πψ̄λ = − γ λ ψ, (5.97)
2 2
e a densidade de energia-momento
T αβ = πψα ∂ β ψ + ∂ β ψ̄πψ̄α − η αβ ψ̄Dψ. (5.98)
Simetrias e cargas conservadas
113
Energia-momento
O tensor densidade de energia-momento (5.98) é conservado pelas equações de campo em razão

da simetria por translações. Note que
1
ψ̄iγ µ ∂µ ψ − ∂µ ψ̄iγ µ ψ − mψ̄ψ

ψ̄Dψ =
2
1
ψ̄iγ µ ∂µ ψ − mψ̄ψ − ∂µ ψ̄iγ µ ψ − mψ̄ψ

=
2
1 → ←
µ µ
= ψ̄ iγ ∂ µ − m ψ − ψ̄ iγ ∂ µ + m ψ ,
2
que é nulo quando as equações (5.95) são satisfeitas. Assim, a corrente conservada pode ser
escrita simplesmente por
i α β i
T αβ = ψ̄γ ∂ ψ − ∂ β ψ̄γ α ψ. (5.99)
2 2
A energia do campo na dinâmica instantânea é dada por

ˆ ˆ ˆ
i 0 0 i i
E = d3 xT 00 = d3 x ψ̄γ ∂ ψ − ∂ 0 ψ̄γ 0 ψ = d3 x ψ † ψ̇ − ψ̇ † ψ .
2 2 2
Note que

→ → → →
µ 0 i 0 i
0 = iγ ∂ µ − m ψ = iγ ∂ 0 + iγ ∂ i − m ψ = iγ ψ̇ + iγ ∂ i − m ψ,
ou seja,

→
0
i
ψ̇ = iγ iγ ∂ i − m ψ. (5.100)
Da mesma forma,

←
˙ 0 + ψ̄ iγ i ←
0 = ψ̄ iγ µ ∂ µ + m = iψ̄γ
←
∂ i + m = iψ̇ † + ψ̄ iγ i ∂ i + m ,
que resulta em

←
† i
ψ̇ = iψ̄ iγ ∂ i + m . (5.101)
Neste caso,
ˆ
↔

3 i
E = d xψ̄ m − iγ ∂ i ψ. (5.102)
ˆ
↔
† ˆ
↔
†
E† = d3 x ψ̄ m − iγ i ∂ i ψ = d3 x ψ † γ 0 m − iγ i ∂ i ψ
ˆ
↔
† ˆ
↔
†
3 † i 0 3 † 0 i
= d xψ m − iγ ∂ i γ ψ = d xψ γ m + iγ ∂i ψ
ˆ
↔

3 i
= d xψ̄ m − iγ ∂ i ψ.
114
Momento angular
Simetria axial (m = 0)
5.7 Soluções de ondas planas
115
116
Capítulo 6
Campos de Gauge
6.1 Revisitando o campo escalar
No capítulo 4, vimos que o campo escalar complexo possui uma simetria especial, caracterizada
pelas transformações
φ (x) → U φ (x) , U = eiα . (6.1)
Se α é um parâmetro real independente do evento espaço-temporal, esta transformação é de-

nominada transformação de gauge global do grupo U (1). O grupo U (1) é o grupo de todas as
matrizes quadradas, complexas e unitárias de dimensão 1, ou seja, U é um simples número
complexo unitário. Esta transformação deixa invariante a densidade lagrangeana
L = ∂µ φ∗ ∂ µ φ − m2 φ∗ φ. (6.2)
Esta densidade lagrangeana, contudo, não é mais invariante se a transformação for local, ou
seja, α → α (x). Neste caso, a transformação
φ (x) → U (x) φ (x) , U = eiα(x) , (6.3)
implica na transformação
L → L0 = (∂µ − i∂µ α) φ∗ (∂ µ + i∂ µ α) φ − m2 φ∗ φ. (6.4)
Para introduzir uma lagrangeana localmente invariante, precisamos de um campo de conexão

de componentes Aµ , que se transforma por
Aµ (x) → Aµ (x) + iU −1 (x) ∂µ U (x) = Aµ (x) − ∂µ α (x) . (6.5)
Neste caso, a derivada covariante
Dµ ≡ ∂µ + iqAµ (6.6)
define a lagrangeana invariante de gauge local

∗
L = (Dµ φ) Dµ φ − m2 φ∗ φ = ∂µ φ∗ ∂ µ φ − m2 φ∗ φ + Aµ Jµ , (6.7)
com a corrente de interação
Jµ ≡ iq (∂µ φ∗ φ − φ∗ ∂µ φ − iqAµ φ∗ φ) . (6.8)
117
Portanto, a invariância de gauge local de uma teoria escalar implica na necessidade da intro-
dução de um campo interagente, representado por Aµ . Se este campo se transforma como (6.5)
por transformações de gauge do grupo U (1), ele é um campo de conexão de gauge do grupo U (1).
Se, em adição, este campo for um vetor de Lorentz, ou seja,
xµ = Λµν xν =⇒ Aµ = Λµν Aν ,
Aµ serão as componentes de um campo eletromagnético. A lagrangeana completa
∗ 1
L = (Dµ φ) Dµ φ − m2 φ∗ φ − Fµν F µν , (6.9)
4
com
Fµν ≡ ∂µ Aν − ∂ν Aµ , (6.10)
descreve a teoria do campo escalar complexo carregado em um campo eletromagnético.
6.2 Simetria de Gauge U (1) no campo espinorial
Vamos analisar a densidade lagrangiana

↔
L = ψ̄ (x) iγ µ ∂ µ − m ψ (x) , (6.11)
em que ψ (x) é um espinor de Dirac com dual ψ̄ (x).
Em primeiro lugar, nota-se que a transformação
ψ (x) → exp (−iα) ψ (x) , (6.12)
em que α é um número real constante, independente do ponto do espaço-tempo, é uma simetria

de (6.11). A transformação para o dual é dada por
†
ψ̄ (x) = ψ † (x) γ 0 → [exp (−iα) ψ (x)] γ 0 = ψ † (x) exp (iα) γ 0 = ψ̄ (x) exp (iα) , (6.13)
de modo que é fácil demonstrar que

↔ ↔
µ µ

ψ̄ iγ ∂ µ − m ψ → ψ̄ exp (iα) iγ ∂ µ − m [exp (−iα) ψ]

↔
µ
= ψ̄ [exp (iα) exp (−iα)] iγ ∂ µ − m ψ

↔
µ
= ψ̄ iγ ∂ µ − m ψ.
Neste caso, a densidade lagrangiana é invariante pelas transformações (6.12) e (6.13), que são
denominadas transformações de gauge globais do grupo U (1), a exemplo do que vimos no caso
do campo escalar.
Contudo, (6.11) não é mais invariante quando a transformação de gauge é local. Supondo
118
α = α (x) um parâmetro real dependente da posição, temos

↔ ↔
ψ̄ iγ µ ∂ µ − m ψ → ψ̄ exp (iα) iγ µ ∂ µ − m [exp (−iα) ψ]

↔
= ψ̄ exp (iα) iγ µ ∂ µ [exp (−iα) ψ] − ψ̄mψ

i
ψ̄ exp (iα) γ µ ∂µ [exp (−iα) ψ]

=
2
i
− ∂µ ψ̄ exp (iα) γ µ [exp (−iα) ψ] − ψ̄mψ

2
i i
= ψ̄ exp (iα) γ µ ∂µ exp (−iα) ψ + ψ̄γ µ ∂µ ψ
2 2
i µ i µ
− ∂µ ψ̄γ ψ − ψ̄∂µ exp (iα) γ exp (−iα) ψ − ψ̄mψ
2 2
1 µ 1
= ψ̄γ ∂µ αψ + ψ̄∂µ αγ µ ψ + ψ̄Dψ,
2 2
assim,

↔ ↔
ψ̄ iγ µ ∂ µ − m ψ → ψ̄ iγ µ ∂ µ − m ψ + ψ̄γ µ (∂µ α) ψ. (6.14)
Mais uma vez, se desejamos uma teoria que seja invariante de gauge local, devemos modificar
a derivada com um termo de conexão de gauge
∂µ → Dµ = ∂µ − ieAµ , (6.15)
em que e é um parâmetro arbitrário, a princípio. Com a derivada covariante, o operador de Dirac

torna-se
" † #
↔ ↔ i → i ←
iγ µ ∂ µ − m → iγ µ Dµ − m = γ µ Dµ − γ µ Dµ − m . (6.16)
2 2
Note que
†
↔ i µ→ i µ ←
µ
ψ̄ iγ Dµ − m ψ = ψ̄γ Dµ ψ − ψ̄γ Dµ ψ − ψ̄mψ
2 2
i µ i † µ
= ψ̄γ Dµ ψ − D ψ̄γ ψ − ψ̄mψ (6.17)
2 2 µ
é invariante por transformações de gauge locais se
Dµ ψ → exp (−iα) Dµ ψ e Dµ† ψ̄ → Dµ† ψ̄ exp (iα) . (6.18)
Assim, calculamos a derivada transformada

0
(Dµ ψ) = ∂µ ψ 0 − ieA0µ ψ 0 = ∂µ e−iα ψ − ieA0µ e−iα ψ

= ∂µ e−iα ψ + e−iα ∂µ ψ − ieA0µ e−iα ψ

= ∂µ (−iα) e−iα ψ + e−iα ∂µ ψ − ieA0µ e−iα ψ

(6.19)
Por outro lado,
e−iα Dµ ψ = e−iα ∂µ ψ − ieAµ e−iα ψ. (6.20)
119
Comparando ambas as expressões, temos
1
Aµ = ∂µ α + A0µ ,
e
ou seja,
1
Aµ → Aµ − ∂µ α. (6.21)
e
O cálculo com o dual leva ao mesmo resultado.
A transformação (6.21) é a transformação de gauge do campo de conexão. Note que ela é a
mesma transformação do campo eletromagnético, a menos de uma redefinição de α para absorver
o parâmetro e.
Se a conexão de gauge Aµ se transforma segundo (6.21), a densidade lagrangiana

↔
µ
L = ψ̄ iγ Dµ − m ψ, (6.22)
com o operador de Dirac definido por (6.16) e a derivada covariante definida por (6.15), é um
invariante de gauge local. Mais uma vez, para obter uma lagrangiana localmente invariante
basta substituir as derivadas ordinárias pelas suas respectivas derivadas covariantes.
Neste caso, temos

↔ i i
L = ψ̄ iγ µ Dµ − m ψ = ψ̄γ µ Dµ ψ − Dµ† ψ̄γ µ ψ − ψ̄mψ
2 2
i µ i i i
= ψ̄γ ∂µ ψ − ∂µ ψ̄γ µ ψ + ψ̄γ µ (−ie) Aµ ψ − (ie) A†µ ψ̄γ µ ψ − ψ̄mψ.
2 2 2 2
Assumindo-se Aµ = A†µ ,

↔ ↔
L = ψ̄ iγ ∂ µ − m ψ + eψ̄γ Aµ ψ = ψ̄ iγ ∂ µ − m ψ + j µ Aµ ,
µ µ µ
em que
j µ ≡ eψ̄γ µ ψ (6.23)
é a corrente fermiônica.
Claramente, Aµ real representa o campo eletromagnético, enquanto ψ é um espinor que re-
presenta um campo fermiônico carregado, como o elétron. Como o campo eletromagnético tem
uma densidade lagrangiana cinética, um sistema fermiônico completo em interação com um
campo eletromagnético é descrito pela densidade

↔ 1
L = ψ̄ iγ ∂ µ − m ψ + j µ Aµ − Fµν F µν .
µ
(6.24)
4
Esta é a lagrangiana da eletrodinâmica quântica, a teoria que descreve a interação entre férmi-
ons através de fótons, que carregam a interação eletromagnética.
Para obter a corrente de Noether conservada pela transformação de gauge, consideramos
δL δL
δψ + δ ψ̄ ,
δ∂µ ψ δ∂µ ψ̄
que consiste no argumento do divergente que ocorre na equação de Lie (??). Neste caso,
ψ → exp (−iα) ψ ≈ ψ − iαψ,
120
de modo que δψ = −iαψ, e δ ψ̄ = iαψ̄. Por outro lado,
δL i δL i
= ψ̄γ µ e = − γ µ ψ,
δ∂µ ψ 2 δ∂µ ψ̄ 2
de modo que as equações de Dirac resultam em
∂µ ψ̄γ µ ψ = 0,

(6.25)
ou seja, a corrente (6.23) é conservada, como esperávamos. A carga conservada, neste caso, é
dada por
ˆ ˆ ˆ
Q=e dσj 0 = e dσ ψ̄γ 0 ψ = e dσψ † ψ, (6.26)
Σ Σ Σ
que é a carga elétrica dos férmions.
6.3 Transformações de gauge globais

Desde então, fizemos um progresso considerável, especialmente ao estudar o campo eletromag-
nético livre e ao introduzir o campo espinorial de Dirac. Nossa intensão, agora, é aplicar o
espírito da invariância de gauge local a campos espinoriais. O procedimento mais geral possível
resulta no que, hoje, conhecemos por teorias de gauge.
Vamos começar com um conjunto de N espinores ψ i (x), todos com o mesmo parâmetro de
massa m. Lembremos que cada espinor é um objeto com quatro componentes (em nosso espaço
quadridimensional), então o índice i neste capítulo não denota componentes espinoriais, que
permanecerão implícitas, mas apenas identifica cada espinor. A lagrangeana livre deste conjunto
de campos é dada por

↔
L = ψ̄ i iγ µ ∂ µ − m ψi , (6.27)
com soma no índice i = 1, · · · , N . Por construção, esta lagrangeana é um invariante de Lorentz,

mas também é um invariante U (1) global:
ψ i → eiα ψ i , ψ̄ i → ψ̄ i e−iα =⇒ L → L. (6.28)
Neste expressão, α é um parâmetro real constante.

No entanto, esta não é a única simetria interna. Considere a matriz Uij , com i, j = 1, · · · , N ,
e a transformação
ψ i → U ij ψ j . (6.29)
Neste caso, temos

† † † † j i
ψi → U ij ψ j = ψj U ij = ψ† U† j
,
ou seja,
† j i
ψi γ 0 → ψ† γ0 U † j
,
o que resulta em
i
ψ̄ i → ψ̄ j U † j
. (6.30)
121
Neste caso,

↔ ↔
† i
ψ̄ iγ ∂ µ − m ψi → ψ̄ U k iγ ∂ µ − m Ui j ψj
i µ k µ

↔
k † i j µ

= ψ̄ U k Ui iγ ∂ µ − m ψj ,
se Uij tiver componentes constantes.

Se a transformação é unitária, temos
i i
U †U j
= U† k
U kj = δji ,
ou seja,

i ↔ ↔ ↔
k † j µ k j µ i µ
ψ̄ U k
Ui iγ ∂ µ − m ψc = ψ̄ δk iγ ∂ µ − m ψj = ψ̄ iγ ∂ µ − m ψi .
Neste caso,
ψ i → U ij ψ j =⇒ L → L, (6.31)
e a lagrangeana é invariante global.

Agora, a transformação não envolve apenas um número complexo, mas uma matriz complexa
unitária. O conjunto de todas as matrizes complexas unitárias N × N forma um grupo, o grupo
U (N ). Contudo, estamos interessados no subgrupo conexo à identidade, ou seja, desejamos que
um elemento do grupo possa ser expandido em transformações infinitesimais na forma
Uij = δij + ωij = δij + iωa Tija .
O índice a é o índice da álgebra de Lie das transformações infinitesimais. Para que Uij seja
conexo à identidade, det Uij = 1. Neste caso, transformações do grupo U (N ) conexas à identidade
formam um subgrupo denominado SU (N ): S para "special", que significa determinante 1, e U
para "unitary". Portanto, temos a
Proposição 4. Um conjunto de N espinores livres de mesmo parâmetro de massa for-

mam um sistema invariante global sob a ação do grupo SU (N ).
Para evitar a sobrecarga de índices, vamos usar uma notação matricial. Assim, a matriz de
componentes Uij é denotada por U , e os espinores ψ i serão parte de uma matriz coluna N × 1,
ψ. Cada componente desta coluna é, em si, uma coluna de quatro componentes, as componentes
espinoriais: ψ é, assim, uma coluna de colunas. A transformação (6.29) é escrita apenas por
ψ → U ψ, ψ̄ → ψ̄U † , (6.32)
e é denominada transformação de gauge.

O grupo SU (N ) é um grupo de Lie. Portanto, um elemento de SU (N ) tem a forma geral
U = exp (iω a T a ) , (6.33)
em que T a são geradores de uma álgebra de Lie su (N ) com as relações de comutação
[Ta , Tb ] = −ifabc Tc , (6.34)
122
para um conjunto de coeficientes de estrutura fabc . Cada gerador é representado por uma matriz
N × N hermiteana e de traço nulo. Estes geradores definem a representação fundamental
do grupo SU (N ). O número de geradores da álgebra, ou seja, a dimensão da álgebra é dada por
N 2 − 1, ou seja, a = 1, · · · , N 2 − 1. A forma infinitesimal é dada por
U = 1 + iωa T a , (6.35)
A rigor, escrevemos a densidade lagrangiana

↔
µ
L = ψ̄ iγ 1 ∂ µ − 1m ψ. (6.36)
Observação 7. Por exemplo, a cromodinâmica é uma teoria de gauge do grupo SU (3),

que é o grupo de matrizes 3 × 3 unitárias de determinante 1. Quarks são representados
por espinores na representação fundamental do grupo, ou seja, ψ toma a forma de uma
matriz 3 × 1, enquanto ψ̄ é uma matriz 1 × 3. Quarks também vêm em seis tipos,
denominados sabores, com massas distintas mI . Sua densidade lagrangeana livre é
dada por
6
X ↔
LCD = ψ̄I iγ µ ∂ µ − mI ψI .
I=1
O grupo SU (3) tem oito geradores na representação fundamental, Ta = γa /2, em que

γa podem ser representados pelas oito matrizes de Gell-Mann
0 1 0 0 −i 0 1 0 0
     
γ1 =  1 0 0  , γ2 =  i 0 0  , γ3 =  0 −1 0  ,
0 0 0 0 0 0 0 0 0
0 0 1 0 0 −i 0 0 0
     
γ4 =  0 0 0  , γ5 =  0 0 0  , γ6 =  0 0 1  ,
1 0 0 i 0 0 0 1 0
0 0 0 1 0 0
   
1
γ7 =  0 0 −i  , γ8 = √  0 1 0 .
3
0 i 0 0 0 −2
Os coeficientes de estrutura da álgebra, fabc , são dados por
f123 = −1,
f147 = f165 = f246 = f257 = f345 = f376 = −1/2,
√
3
f458 = f678 = − ,
2
enquanto os demais são permutações destes, ou zero.
6.4 Transformações de gauge locais

A lagrangeana (6.36), portanto, é invariante global pelo grupo SU (N ). Contudo, a localização do
grupo de gauge, como no caso do campo escalar complexo, resulta na quebra de invariância de
(6.36). Mais uma vez, o problema está no fato de que as derivadas ∂µ ψ e ∂µ ψ̄ não são covariantes
123
por transformações de gauge locais. Seja
U (x) = exp (iω a (x) T a ) , (6.37)
temos
ψ (x) → U (x) ψ (x) =⇒ ∂µ ψ (x) → U (x) ∂µ ψ (x) + ∂µ U (x) ψ (x) , (6.38)
enquanto os campos adjuntos se transformam por
ψ̄ (x) → ψ̄ (x) U † (x) =⇒ ∂µ ψ̄ (x) → ∂µ ψ̄ (x) U † (x) + ψ̄ (x) ∂µ U † (x) . (6.39)
Seguindo a ideia de que teorias fundamentais da natureza devem ser invariantes por trans-
formações de gauge locais, precisamos encontrar uma densidade lagrangeana localmente inva-
riante. Mais uma vez a introdução de uma lagrangeana invariante pode ser efetuada com a
inclusão de um campo de conexão ao formalismo, e assim uma derivada covariante pode ser
construída. Este procedimento é conhecido como acoplamento mínimo.
O campo de conexão é introduzido pela forma diferencial
A = Aµ dxµ , (6.40)
em que os campos Aµ = Aaµ T a assumem valores na representação fundamental da álgebra

su (N ). A forma (6.40) é automaticamente invariante de Lorentz se as componentes se trans-
formarem como Aµ → Λµν Aν diante de uma pseudo-rotação em M4 . Neste caso, introduzimos a
seguinte derivada na representação fundamental,
Dµ ≡ 1∂µ − igAµ , (6.41)
em que g é denominada constante de acoplamento. Usando (6.38), vemos que a derivada Dµ ψ

transforma-se por
0
D µ ψ → (D µ ψ) = D 0µ ψ 0 = 1∂µ − igA0µ U ψ

= 1∂µ (U ψ) − igA0µ U ψ = U ∂µ ψ + (∂µ U ) ψ − igA0µ U ψ

= U ∂µ ψ + U U † (∂µ U ) ψ − igU U † A0µ U ψ
h i
= U ∂µ ψ + U U † (∂µ U ) − igU † A0µ U ψ

† 0 i †
= U 1∂µ − ig U Aµ U + U (∂µ U ) ψ.
g
Para que a derivada seja covariante, a lei de transformação deve ser D µ ψ → U (D µ ψ), de modo
que a conexão deve ser transformar por
i
Aµ = U † A0µ U + U † (∂µ U ) , (6.42)
g
ou
i
Aµ → A0µ = U Aµ U † − (∂µ U ) U † . (6.43)
g
Todo campo vetorial que se transforma como (6.43) é denominado conexão de gauge.
Vamos observar a forma infinitesimal de (6.43), que é dada por

i
Aµ → A0µ = (1 + iω a T a ) Aµ 1 − iω b T b − U (i∂µ ω a T a ) U † ,
g
124
ou seja, em primeira ordem,
1
δAµ = ∂µ ω a T a − iω a [Aµ , T a ] .
g
Explicitando as componentes da álgebra, Aµ = Aaµ T a , temos
1
δAaµ T a = ∂µ ω a T a − iω a Abµ [T b , T a ] .
g
Usando as relações de comutação fundamentais (6.34), temos
1
δAaµ T a = ∂µ ω a T a + ω a fab c Abµ T c ,
g
que com troca de índices mudos torna-se
1
δAcµ T c = ∂µ ω c T c + ω a fab c Abµ T c .
g
Como os geradores são linearmente independentes, temos
1
δAaµ = ∂µ ω a + gf acb Abµ ω c .

(6.44)
g
As relações (6.44) definem as transformações de gauge das componentes Aaµ dos campos de
gauge. Esta é a forma "favorita" dos físicos, enquanto a forma (6.43) é mais utilizada pelos
matemáticos, que preferem trabalhar em notação independente de representação. A forma (6.44)
explicita, por outro lado, uma segunda derivada covariante:
1 a 1 a
δAaµ = δc ∂µ + gf acb Abµ ω c = (Dµ ) c ω c ,

g g
em que
a
(Dµ ) c ≡ δca ∂µ − gf abc Abµ . (6.45)
125
Observação 8. A derivada (6.45), longe de ser completamente distinta da derivada
(6.41), é na verdade a mesma derivada em outra representação, a representação
adjunta. Na representação adjunta, um elemento do grupo SU (N ) é representado
por matrizes N 2 − 1 × N 2 − 1 , ou seja, os geradores da álgebra são representados

por N 2 − 1 matrizes N 2 − 1 × N 2 − 1 : a dimensão da representação é a mesma

dimensão da álgebra.
Neste caso, a lógica dita que devemos pensar em objetos abstratos que podem ser rea-
lizados em representações do grupo de gauge. Temos a derivada covariante
Dµ = ∂µ − igAµ , (6.46)
sem negrito, como a derivada completamente abstrata, independente de representação.

Ao escolher uma representação, por exemplo a fundamental, temos
fund (Dµ ) = fund (1) ∂µ − igfund (Aµ )

= fund (1) ∂µ − igAaµ fund (Ta ) , (6.47)
em que fund (1) = 1 é a identidade na representação fundamental, N × N , enquanto

fund (Ta ) = T a são os geradores da álgebra nesta mesma representação, N 2 − 1 ma-
trizes N × N . Na representação fundamental, a derivada covariante toma a forma
explícita (6.41).
Na representação adjunta, temos
adj (Dµ ) = adj (1) ∂µ − igAaµ adj (Ta ) . (6.48)
Esta representação realiza o grupo de Lie como matrizes N 2 − 1 × N 2 − 1 e, por

a
consequência, a dimensão da representação é a mesma da álgebra. De fato, adj (1)b =
δba é a identidade nesta representação, enquanto adj (Ta )bc ≡ (Ta )bc = ifabc , ou seja, os
geradores são relacionados às constantes de estrutura. Neste caso, (6.48) torna-se
a a
(Dµ ) b = δba ∂µ − igAcµ (Tc ) b
= δba ∂µ − igAcµ (i) fca b = δba ∂µ − gf acb Acµ ,
que corresponde a (6.45).
Assim, nas componentes da álgebra, a transformação dos campos de gauge é dada por
1 a 1 a
δAaµ = (Dµ ) b ω b = [Dµ ω] , (6.49)
g g
a a
em que usamos a notação mais compacta [Dµ ω] ≡ (Dµ ) b ω b para a derivada covariante na
representação adjunta.
Observação 9. Note que, se o grupo de simetria é U (1), a álgebra de Lie é trivial, com
geradores que são simplesmente o número 1. Neste caso, o campo de gauge é o próprio
campo eletromagnético, visto que todo o procedimento acima é realizado com fabc = 0.
A derivada covariante na representação fundamental torna-se simplesmente Dµ ≡ ∂µ −
igAµ , enquanto na representação adjunta ela é igual à derivada ordinária. Neste caso,
temos δA = (1/g) ∂µ ω, que é a transformação de gauge do campo eletromagnético.
126
6.5 O termo de interação
Se os campos de gauge se transformam por (6.49), ou mesmo (6.43), a derivada D µ ψ é covariante

por transformações de gauge. Neste caso, devemos substituir a derivada ordinária pela derivada
covariante, especialmente no termo
↔ 1
ψ̄γ µ ∂ µ ψ = ψ̄γ µ ∂µ ψ − ∂µ ψ̄γ µ ψ .

(6.50)
2
Para o primeiro termo à direita, é imediato ver que a substituição
ψ̄γ µ ∂µ ψ → ψ̄γ µ D µ ψ (6.51)
dá origem a um termo invariante.

O segundo termo requer certo cuidado. Ele torna-se
←†

←
µ µ µ
∂µ ψ̄γ ψ → ψ̄γ D µ ψ = ψ̄γ 1 ∂ µ + igAµ ψ
= ∂µ ψ̄γ µ ψ + ig ψ̄γ µ Aµ ψ.
Podemos verificar que este termo também é invariante. Uma transformação de gauge resulta
em

∂µ ψ̄U † + ψ̄∂µ U † γ µ U ψ + ig ψ̄U † γ µ A0µ U ψ =

= ∂µ ψ̄γ µ ψ + ψ̄∂µ U † γ µ U ψ + ig ψ̄γ µ U † A0µ U ψ =

µ † µ µ i †
= ∂µ ψ̄γ ψ + ψ̄∂µ U γ U ψ + ig ψ̄γ Aµ − U (∂µ U ) ψ =
g

= ∂µ ψ̄γ µ ψ + ig ψ̄γ µ Aµ ψ + ψ̄γ µ ∂µ U † U ψ = ∂µ ψ̄γ µ ψ + ig ψ̄γ µ Aµ ψ.
Assim, a densidade lagrangeana

↔
µ
L = ψ̄ iγ D µ − 1m ψ (6.52)
é um invariante de gauge, com
←†

↔ 1 →
µ µ µ
ψ̄γ D µ ψ ≡ ψ̄γ D µ ψ − ψ̄γ D µ ψ . (6.53)
2
Note que
←†

↔ 1 →
ψ̄iγ µ D µ ψ = i ψ̄γ µ D µ ψ − ψ̄γ µ D µ ψ
2

1 ←
= i ψ̄γ µ (1∂µ − igAµ ) ψ − ψ̄γ µ 1 ∂ µ + igAµ ψ
2

1 ←
= i ψ̄γ µ ∂µ ψ − ψ̄γ µ ∂ µ ψ − 2ig ψ̄γ µ Aµ ψ
2

1 ←
= i ψ̄γ µ ∂µ ψ − ψ̄γ µ ∂ µ ψ + g ψ̄γ µ Aµ ψ,
2
ou seja, a densidade (6.52) equivale à lagrangeana

↔
L = ψ̄ iγ ∂ µ − 1m ψ + g ψ̄γ µ Aµ ψ.
µ
(6.54)
127
O termo g ψ̄γ µ Aµ ψ torna-se
g ψ̄γ µ Aµ ψ = Aaµ g ψ̄γ µ T a ψ = Aaµ Jaµ ,

em que
Jaµ ≡ g ψ̄γ µ T a ψ (6.55)
é a corrente fermiônica, fonte dos campos de gauge. Portanto, outra forma para as densidades
lagrangeanas (6.52) e (6.54) vem a ser a lagrangeana

↔
L = ψ̄ iγ µ ∂ µ − m ψ + Aaµ Jaµ (6.56)
Então, a imposição de uma teoria localmente invariante pelo grupo de gauge implica na
existência de um termo de interação do tipo corrente-campo de gauge, assim como vimos no
caso do campo escalar.
6.6 A lagrangeana completa

A densidade lagrangeana (6.56) contém dois termos. O primeiro é a lagrangeana de Dirac, que
descreve um conjunto de N espinores de Dirac livres. O segundo termo é um termo linear de
interação, que descreve como a corrente espinorial (6.55) se acopla com os campos de gauge Aaµ .
Se o campo de gauge é um campo físico, esta densidade deve ser complementada com um termo
cinético para os campos de gauge. Já que (6.56) é invariante por transformações de gauge locais
do grupo SU (N ), o termo cinético deve ser também invariante de gauge, além de ser também
um invariante de Lorentz local.
Uma pista de como proceder está na teoria eletromagnética. Naquele caso, a simetria do
sistema é U (1) e os campos de gauge são descritos pelo 4-potencial eletromagnético Aµ . O termo
que procuramos é construído com a curvatura F , de componentes
Fµν ≡ ∂µ Aν − ∂ν Aµ .
Para o caso SU (N ), os campos Fµν devem ser generalizados para campos que pertencem à ál-
a
gebra de Lie, ou seja, Fµν → F µν = Fµν T a . Contudo, verifica-se facilmente que os campos
resultantes não são invariantes de gauge locais. Então, vamos tentar a generalização
F µν ≡ D µ Aν − D ν Aµ , (6.57)
com a derivada covariante (6.41) Dµ ≡ 1∂µ − igAµ . Neste caso, (6.57) torna-se
F µν = ∂µ Aν − ∂ν Aµ − ig [Aµ , Aν ] . (6.58)
Agora, vamos escrever os campos de gauge em suas componentes Aµ = Aaµ Ta , obtendo
a
Fµν T a = ∂µ Aaν T a − ∂ν Aaµ T a − igAbµ Acν [T b , T c ] .
Com as relações de comutação (6.34)
[Ta , Tb ] = −ifabc Tc ,
chegamos a
a
Fµν T a = ∂µ Aaν T a − ∂ν Aaµ T a − gfbc a Abµ Acν T a .
128
Como os geradores são linearmente independentes, temos
a
Fµν = ∂µ Aaν − ∂ν Aaµ − gf abc Abµ Acν . (6.59)
129
130
Capítulo 7
O Campo Gravitacional
7.1 O princípio da Covariância Geral
7.2 O princípio de Equivalência de Einstein
7.3 A simetria de Lorentz local

Então, o princípio de equivalência de Einstein implica na existência de isomorfismos locais entre
a variedade base M, a qual assumimos por princípio ser uma variedade diferenciável, e refe-
renciais de Lorentz locais em espaços de Minkowski Qx em cada ponto x ∈ M. Por ser uma
variedade diferenciável, podemos escolher um sistema de coordenadas {x} ⊂ M em uma bola
aberta com centro em x, bem como um sistema de coordenadas {u} ∈ Qx no respectivo espaço de
Minkowski. Assim, existe um conjunto de aplicações eaµ tais que
ua = eaµ (x) xµ , a = 0, 1, 2, 3, µ = 0, 1, 2, 3. (7.1)
Neste caso, ua são coordenadas do espaço de Minkowski do referencial inercial local, enquanto
xµ são as coordenadas locais do espaço base.
Não conhecemos a geometria do espaço base, mas conhecemos a geometria do espaço local.
Sua métrica é dada por
2 2 2 2
ds2 = du0 − du1 − du2 − du3 = ηab dua dub ,
visto que esta é a métrica invariante por transformações de Lorentz. A relação (7.1) implica em
dua = eaµ dxµ , (7.2)
de modo que
ds2 = ηab dua dub = ηab eaµ ebν dxµ dxν = gµν dxµ dxν ,
ou seja, o isomorfismo (7.1) resulta em uma métrica do espaço base induzida pelo espaço local:
gµν = ηab eaµ ebν = eaµ eaν , (7.3)
em que η foi utilizada para baixar o último índice a.

Se a métrica g tem inversa de componentes g µν , então
gµν g νγ = δµγ = eaµ eaν g νγ = eaµ eaγ ,
131
ou seja,
eaµ eaγ = δµγ (7.4)
e, neste caso, eaµ são as componentes da inversa de eaµ .

Os campos e (x), cuja componentes são eaµ (x), são denominados campos de Vielbein. Como
estamos interessados em teorias nas quais ambos os espaços base e local possuem quatro dimen-
sões, também podemos chamar esses campos de Tetradas (ou Tríades, em três dimensões). Em
geometria, as tetradas são componentes de uma 1-forma diferencial no espaço cotangente a M,
mas ao mesmo tempo são também um conjunto de quatro vetores em Qx , que formam uma base
ortonormal. Note que
δac = ηab η bc = ηab ebµ ecν g µν = eaµ ecµ ,
ou seja,
eaµ ebµ = ηab . (7.5)
Vamos supor um campo A que seja uma 1-forma em M. Neste caso,
α = αµ dxµ = αµ eµa dua = αa dua ,
e temos
αa = eaµ αµ ⇐⇒ αµ = αa eaµ . (7.6)
No caso de um vetor, temos

a
∂ µ du ∂ ∂
A = Aµ ∂ µ = Aµ = A = Aµ eaµ a ,
∂xµ dxµ ∂ua ∂u
que nos leva a
Aa = eaµ Aµ ⇐⇒ Aµ = Aa eaµ . (7.7)
De fato, todo tensor tem sua representação no espaço de base e local, bem como é possível repre-
sentações mistas. Por exemplo,
Tµν = eaµ Taν = eaµ ebν Tab . (7.8)
7.4 A derivada de Lorentz e a conexão de spin

No entanto, não é possível representar espinores no espaço de base. Espinores, como vimos, são
objetos que se transformam sob representações espinoriais de SO (1, 3). Como o espaço base é
geral, pode inclusive admitir nenhuma simetria, não há como definir uma álgebra de Clifford,
então não existem espinores definidos em M. Os espinores podem, contudo, ser definidos em Qx .
Sob uma transformação de Lorentz ua → Λab ub , ψ é um espinor se

i ab i
ψ → S (Λ) ψ = exp − α σab ψ, σab ≡ [γa , γb ] , (7.9)
4 2
enquanto
{γa , γb } = γa γb − γb γa = 2ηab . (7.10)
132
Se ψ é um espinor de Dirac, sua ação é dada por
ˆ ↔
I = d4 uψ̄ iγ a ∂ a −m ψ, (7.11)
em que d4 u é um elemento de volume de Qx :
1
d4 u = du0 du1 du2 du3 = abcd dua dub duc dud
4!
1
= abcd eaµ ebν ecγ edλ dxµ dxν dxγ dxλ ,
4!
em que abcd é a densidade tensorial de Levi-Civita em Qx . Note que, tomando o determinante
da relação (7.3),
g = |det (gµν )| = det ηab eaµ ebν = det eaµ det ebν = E 2 ,

em que E ≡ det eaµ . Por outro lado,
1
d4 x = dx0 dx1 dx2 dx3 = µνγλ dxµ dxν dxγ dxλ ,
4!
de modo que
√
d4 u = abcd µνγλ eaµ ebν ecγ edλ d4 x = Ed4 x = gd4 x, (7.12)
que é o elemento de volume invariante em M. Mostra-se que d4 u é invariante de Lorentz local,

√
portanto, o elemento de volume gd4 x também o é.
Agora, chegamos ao mesmo problema das teorias anteriores. Como a simetria de Lorentz é
local, os parâmetros αab (x) são dependentes do ponto x ∈ M. Neste caso, a derivada de um
espinor não se transforma covariantemente:
∂a ψ → ∂a0 ψ 0 = Λab ∂b [S (u) ψ] = Λab ∂b S (u) ψ + Λab S (u) ∂b ψ. (7.13)
Neste caso, vamos introduzir uma derivada covariante
∇a ≡ ∂a + iωa . (7.14)
Então,
∇a ψ → ∇0a ψ 0 = Λab (∂b + iωb0 ) [S (u) ψ]

= Λab ∂b [S (u) ψ] + iΛab ωb0 [S (u) ψ]
= Λab [∂b S (u)] ψ + Λab S (u) [∂b ψ] + iΛab S (u) S −1 (u) ωb0 S (u) ψ
= Λab [∂b S (u)] ψ + Λab S (u) ∂b + iS −1 (u) ωb0 S (u) ψ

= Λab S (u) S −1 (u) [∂b S (u)] ψ + Λab S (u) ∂b + iS −1 (u) ωb0 S (u) ψ

= Λab S (u) ∂b + iS −1 (u) ωb0 S (u) + S −1 (u) [∂b S (u)] ψ

Para que seja covariante, a derivada deve se transformar por
∇a ψ → ∇0a ψ 0 = Λab S (u) ∇b ψ, (7.15)
então,
ωb = S −1 (u) ωb0 S (u) − iS −1 (u) [∂b S (u)] ,
133
ou,
ωa → ωa0 = S (u) ωa S −1 (u) − iS (u) ∂a S −1 (u) .

(7.16)
O campo ω se transforma, assim, como uma conexão de gauge. De fato, ωa são componentes de
uma 1-forma no espaço local:
ω = ωa dua ,
contudo, também deve tomar valores na álgebra de Lorentz espinorial, ou seja,
ω = ωa dxa = ωabc σbc dxa . (7.17)
Com excessão dos espinores, todo tensor local em Qx tem uma representação na variedade
base M. Neste caso, podemos deduzir como derivadas em M age em tensores definidos em Qx .
Por exemplo, a derivada ∂µ αa , em que α = αa dua é uma 1-forma em Qx , deve ser levada a uma
derivada covariante
b
∂µ αa → ∇µ αa = ∂µ αa − ωµa αb , (7.18)
pelo mesmo procedimento empregado acima. entretanto, esta conexão não assume valores na
álgebra de Lorentz espinorial, mas na álgebra de Lorentz tensorial. Em outras palavras,
ω = ωµ dxµ = ωµab ea ∧ eb dxµ , (7.19)
em que ∧ representa o produto exterior.

Por outro lado, seja A = Aa ∂a um vetor de Lorentz em Qx ,
∂µ Aa → ∇µ Aa = ∂µ Aa + ωµb
a
Ab . (7.20)
Em ambas as expressões para a derivada covariante, em 1-formas e em vetores, temos ωµab =

ecµ ωcab . A forma geral desta derivada para tensores do tipo (r, s) é dada por
r r vezes
z }| { z }| {
∇µ T abc · · · = ∂ T abc··· + ω a T gbc··· + ω b T agc··· + · · · − ω g T abc··· − ω g T abc··· − · · · . (7.21)
def · · · µ def ··· µg def ··· µg def ··· µd gef ··· µe dgf ···
| {z } | {z }
s s vezes
Portanto, a forma da derivada de Lorentz ∇µ depende do objeto em que a derivada atua, ou seja,
de uma representação específica do grupo de Lorentz.
7.5 A derivada covariante em M e a conexão de Levi-Civita

A derivada de Lorentz define o transporte paralelo de objetos em Qx para objetos em Qx+dx , ou
seja, de tensores e espinores definidos em um referencial de Lorentz para outro referencial infi-
(r,s)
nitesimalmente próximo. De fato, seja um tensor T ∈ Tx Q, a derivada covariante é definida
por
T 0 (x + dx) − T (x) = dxµ ∇µ T (x) . (7.22)
Contudo, também podemos nos perguntar como tensores definidos em M são paralelamente
transportados. Neste caso, a simetria de M não é mais a simetria de Lorentz, mas a simetria
por difeomorfismos. Vamos supor uma transformação em M tal que
xµ → x0µ = x0µ (xν ) = xµ + δxµ (xν ) . (7.23)
134
Um campo vetorial v (x) = v µ (x) ∂µ , que pertence ao espaço tangente a M no ponto x, Tx M, é
definido como um objeto invariante: v 0 (x0 ) = v (x). Assim,
ν
∂ 0µ dx ∂ ∂
v → v 0 = v 0µ 0µ
= v 0µ ν
= vν ν ,
∂x dx ∂x ∂x
ou seja, as componente de v se transformam contravariantemente:
dxµ dx0µ ν
v µ = v 0ν ⇐⇒ v 0µ
= v . (7.24)
dx0ν dxν
Por outro lado, seja α ∈ Tx∗ M uma 1-forma diferencial que pertence ao espaço cotangente
definido em M. Para que este seja um campo físico, ele também deve ser definido como um
invariante pelas transformações (7.23), portanto,
dx0µ ν
α → α0 = αµ0 dx0µ = αµ0 dx ,
dxν
ou seja, as componente de α se transformam covariantemente:
dx0µ dxν
αµ = ν
αν ⇐⇒ αµ0 = αν 0µ . (7.25)
dx dx
(rs)
Seja T ∈ Tx M um tensor do tipo (r, s) definido em M. Para que T seja invariante, é
necessário que suas componentes se transformem segundo
r
r
z }| { z 0α }|0β { σ
dx dxτ

0 αβ · · · dx dx ρ···
T µν · · · = dxρ
··· 0µ dx0ν
· · · Tστ ··· . (7.26)
| {z } dx dx
s | {z }
s
No entanto, ações para campos em M não dependem apenas de campos tensoriais, mas tam-
bém de suas derivadas, e derivadas ordinárias das componentes tensoriais não se transformam
covariantemente. Vemos, por exemplo, que
0ν
dxα dxα dx0ν dxα dx0ν

ν 0 0ν dx β β
∂α v β ,

∂µ v → ∂µ v = 0µ ∂α β
v = 0µ
∂α β
v + 0µ β
dx dx dx dx dx dx
de modo que o primeiro termo à esquerda dessa transformação, que depende da derivada da
matriz Jacobiana de (7.23), atrapalha a covariância das derivadas de um vetor v. O mesmo
ocorre com as componentes de formas diferenciais e tensores de ordem superior. Esse problema
se reflete na quebra de invariância de derivadas totais de objetos geométricos, que deveriam ser
invariantes por difeomorfismos para serem considerados quantidades físicas.
7.6 Curvatura e Torção
7.7 Ações para o campo gravitacional
7.8 Termos de Chern-Simons
135
136
Referências Bibliográficas
[1] R. Aldrovandi and J. G. Pereira. Notes for a Course on Classical Fields. 2008. URL:
http://www.ift.unesp.br/users/jpereira/ClassiFields.pdf.
[2] Asim Orhan Barut. Electrodynamics and Classical Theory of Fields & Particles. Cou-
rier Corporation, 1964. URL: https://books.google.com/books?id=gNsx7_9MJgEC&
pgis=1.
[3] John David Jackson. Classical Electrodynamics. Wiley, 1998. URL: https://books.
google.com/books?id=tYEAkAEACAAJ&pgis=1.
[4] Nelli Pavlovna Konopleva and Viktor Nikolaevich Popov. Gauge fields. Harwood Acade-
mic Publishers, 1981. URL: https://books.google.com/books?id=6dHvAAAAMAAJ&
pgis=1.
[5] Cornelius Lanczos. The Variational Principles of Mechanics. Courier Corporation, 2012.
URL: https://books.google.com/books?id=cmPDAgAAQBAJ&pgis=1.
[6] L. D. Landau and E. M. Lifshitz. The Classical Theory of Fields. Elsevier Science, 2013.
URL: https://books.google.com/books?id=HudbAwAAQBAJ&pgis=1.
[7] David Lovelock and Hanno Rund. Tensors, Differential Forms, and Variational Prin-
ciples. Courier Corporation, 2012. URL: https://books.google.com/books?id=
uUi8AQAAQBAJ&pgis=1.
[8] Jayme Vaz Jr. A Algebra Geometrica do Espaco Euclideano e a Teoria de Pauli. Revista
Brasileira de Ensino de Física, 19(2):234–259, 1997.
[9] Jayme Vaz Jr. A álgebra geométrica no espaço-tempo e a teoria da relatividade. Revista
brasileira de ensino de física, 22(1):5–31, 2000.
[10] Steven Weinberg. The Quantum Theory of Fields: Volume 1, Foundations. Cambridge
University Press, 1995. URL: https://books.google.com/books?id=V7ggAwAAQBAJ&
pgis=1.
[11] Arthur S. Wightman, editor. The Collected Works of Eugene Paul Wigner. Springer Ber-
lin Heidelberg, Berlin, Heidelberg, 1993. URL: http://link.springer.com/10.1007/
978-3-662-02781-3, doi:10.1007/978-3-662-02781-3.
[12] E. Wigner. On unitary representations of the inhomogeneous lorentz group.

Nuclear Physics B - Proceedings Supplements, 6:9–64, March 1989. URL:
http://www.sciencedirect.com/science/article/pii/0920563289904027,
doi:10.1016/0920-5632(89)90402-7.
137

Teoria Classica de Campos

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Teoria Classica de Campos

Enviado por

Direitos autorais:

Formatos disponíveis

Notas em Teoria Clássica de Campos

2 Os Grupos de Lorentz e Poincaré 31

3 O formalismo lagrangeano para campos 49

6 Campos de Gauge 117

7 O Campo Gravitacional 131

Referências Bibliográficas 137

1.1 Introdução: as transformações de Galilei

A configuração de dois referenciais inerciais dispostos dessa maneira é denominada configuração

ds2 = dx2 + dy 2 + dz 2 = dx · dx, (1.5)

que é a métrica euclidiana do espaço cartesiano R3 . Tomando-se (1.2), temos

que são chamadas transformações de Galilei.

Proposição 1. Princípios da Relatividade Restrita

1. Todo sistema físico é invariante pela escolha de referencial inercial;

2. A velocidade da luz é uma constante independente do movimento relativo entre

c2 t02 − r02 = c2 t2 − r2 , (1.8)

em que r2 = x2 + y 2 + z 2 , o mesmo para r0 . Na configuração padrão, O0 move-se com velocidade

constante u = uex com relação a O, com u constante, real e positivo. Assim,

c2 t02 − x02 = c2 t2 − x2 . (1.9)

1.3 Transformações de Lorentz

Podemos, também, colocar o sistema na forma

x0 = cosh φ (x − tanh φct) ,

Para interpretar o significado físico de φ, vamos observar a origem de O0 , ou seja, x0 = 0. Isto

Vamos definir, também,

cosh2 φ − sinh2 φ = 1 =⇒ sinh2 φ = γ 2 − 1.

Comparando-se as duas equações, temos

Nesta configuração, as direções y e z ficam inalteradas e a forma completa é dada por

ou nas duas formas de notação matricial,

As transformações (1.14), ou mesmo na forma (1.15), são denominadas transformações de Lo-

em que B é o vetor coluna

O produto BBT é dado por

BBT =  βy βx βy2 βy βz  , (1.19)

Neste caso, temos

1.4 Composição de velocidades

x = γ (x0 + βct0 ) . (1.21)

Temos, considerando-se γ e β constantes,

Para as demais componentes, temos

c−u c−u 1 − u/c

em concordância com o segundo postulado.

1.5 Contração de Lorentz e dilatação do tempo

l = γ [x02 − x01 + u (t02 − t01 )] = γ [l0 + u∆t0 ] = γl0 ,

∆t0 = γ t2 − t1 − u/c2 (x2 − x1 ) = γ ∆t − u/c2 ∆x .

Caso o relógio em movimento tenha velocidade constante, a expressão (1.32) reduz-se a ∆τ =

1.6 O espaço-tempo de Minkowski

De forma análoga à relatividade de Galilei, existe uma medida invariante às transformações de

em que renomeamos as coordenadas xi = x1 = x, x2 = y, x3 = z , e definimos uma quarta co-

ordenada x0 = ct. A métrica de Minkowski é uma métrica para o espaço-tempo de Minkowski

Observação 1. A escolha de sinais em (1.33) é convencional. Uma métrica descrita pela

também é invariante por transformações de Lorentz, e representa estritamente a

ou, em forma tensorial:

A notação tensorial é de grande vantagem operacional, além de explicitar, como veremos, a

ds2 = ηµν dxµ dxν . (1.37)

x0µ = Λµν xν . (1.38)

Na configuração padrão, temos em representação matricial

γ −γβ 0 0 cosh φ − sinh φ 0 0

1.7 O cone de luz e o critério de causalidade

é nulo sempre que

Região causalmente Região causalmente

Cone de luz passado de x0

Figura 1.3: Regiões de causalidade ligadas a um evento x0 .

Definição 1. Dois eventos x, y ∈ M4 de distância nula, ou seja, tais que

Por outro lado, dois pontos tais que

Definição 2. Dois eventos x, y ∈ M4 de distância negativa, ou seja, tais que

são denominados eventos tipo espaço. Escolhido um sistema de coordenadas com

t → t̄ = t̄ () , xi → x̄i (t̄, λa ) = x̄i (, λa ) , (2.1)

(, λa ) → 0 =⇒ t̄ → t e x̄i (t̄) → xi (t) . (2.2)