Mecanica Quantica II

NOTAS DE AULAS
MECÂNICA QUÂNTICA II
Prof.: Dr. Salviano A. Leão
Goiânia 29 de outubro de 2018

Sumário
Capa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0
Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i
1 Spin 1
1.1 O que é um Spin? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Natureza Quântica do Spin . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1.1 Sistema de partículas . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Momentum angular intrínseco: spin . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Evidências experimentais do spin do elétron . . . . . . . . . . . . . . . . . . . . 5
1.4 Descrição quântica: os postulados de Pauli . . . . . . . . . . . . . . . . . . . . . 5
1.4.1 Postulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 Partículas de spin s = 1/2: propriedades especiais . . . . . . . . . . . . . . . . . 7
1.5.1 Matrizes de Pauli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.2 Propriedades do operador de spin S . . . . . . . . . . . . . . . . . . . . . 9
1.6 Partícula de spin 1/2: Descrição não-relativística . . . . . . . . . . . . . . . . . . 10
1.6.1 Observáveis e vetores de estado . . . . . . . . . . . . . . . . . . . . . . . 10
1.6.2 Representação {|r, εi} . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6.3 Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6.3.1 Operadores de spin . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6.3.2 Operadores Orbitais . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6.3.3 Operadores mistos . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7 Cálculo de probabilidades de uma medição física . . . . . . . . . . . . . . . . . . 15
1.7.1 Medindo a componente Sx . . . . . . . . . . . . . . . . . . . . . . . . . . 15
2 Spin - Rotação 17
2.1 Operadores de rotação para uma partícula de spin 1/2 . . . . . . . . . . . . . . . 17
2.1.1 Momentum angular total . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2 Produto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.3 Rotação do estado de spin . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.4 Operador associado com uma rotação de 2π . . . . . . . . . . . . . . . . 18
2.1.5 Natureza vetorial versus rotação . . . . . . . . . . . . . . . . . . . . . . . 20
2.1.6 Rotação de um spinor com duas componentes . . . . . . . . . . . . . . . 21
i
Sumário
3 Adição de Momenta Angulares 23

3.1 Adição de Momenta Angulares: Caso clássico . . . . . . . . . . . . . . . . . . . 23
3.1.1 Lei Fundamental da Dinâmica das Rotações . . . . . . . . . . . . . . . . 25
3.1.2 Conservação do Momentum Angular: Simetrias e as leis de conservação . 27
3.2 Momentum Angular Na Mecânica Quântica . . . . . . . . . . . . . . . . . . . . 28
3.2.1 Considerações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.2 Momentum angular total de duas partículas . . . . . . . . . . . . . . . . 30
3.2.3 Base em termos de Jz e J2 . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 Adição de dois Spin 1/2: Método elementar . . . . . . . . . . . . . . . . . . . . 31
3.3.1 Formulação do problema: Espaço de estados . . . . . . . . . . . . . . . . 31
3.3.2 O Espaço de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3.3 O Spin Total S: Relações de comutação . . . . . . . . . . . . . . . . . . 32
3.3.4 Mudança de base a ser realizada . . . . . . . . . . . . . . . . . . . . . . . 34
3.3.5 Os autovalores de Sz e o seus graus de degenerescência . . . . . . . . . . 35
3.3.6 Diagonalização de S2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2
3.3.6.1 Cálculo dos elementos de matriz de S . . . . . . . . . . . . . . 36
2
3.3.6.2 Matriz S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3.6.3 Autovalores e autovetores de S2 . . . . . . . . . . . . . . . . . . 37
3.3.7 Resultado: estados tripletos e singletos . . . . . . . . . . . . . . . . . . . 39
3.3.8 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.4 Revisão da teoria do momentum angular . . . . . . . . . . . . . . . . . . . . . . 40
3.5 Propriedades do subespaço E(k, j) . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.6 Espaço de estados de dois momenta angulares . . . . . . . . . . . . . . . . . . . 40
3.6.1 Momentum angular total: Relações de comutação . . . . . . . . . . . . . 41
3.6.2 Mudança de base a ser realizada . . . . . . . . . . . . . . . . . . . . . . . 43
2
3.7 Autovalores de J e Jz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.7.1 Caso especial: Dois spins 1/2 . . . . . . . . . . . . . . . . . . . . . . . . 45
3.7.2 Autovalores de Jz e o seu grau de degenerescência . . . . . . . . . . . . . 46
3.7.3 Degenerescência de Jz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.7.4 Autovalores de J 2 : primeira forma . . . . . . . . . . . . . . . . . . . . . 48
2
3.7.5 Autovalores de J : segunda forma . . . . . . . . . . . . . . . . . . . . . . 49
3.8 Autovetores comuns de J2 e Jz . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.8.1 Caso especial spin 1/2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.8.2 Duas partículas de spin 1/2: O subespaço E(S = 1) . . . . . . . . . . . . 51
3.8.3 O estado |S = 0, M = 0i . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.9 Caso geral, com j1 e j2 arbitrários . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.9.1 O subespaço E(J = j1 + j2 ) . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.9.2 Os outros subespaços E(j) . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.10 Coeficientes de Clebsch-Gordan . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.10.1 Relações de Ortogonalidade . . . . . . . . . . . . . . . . . . . . . . . . . 58
Prof. Salviano A. Leão ii

Sumário
3.10.2 Relações de Recorrência . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

3.10.3 Convenção de Fase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.10.4 Os coeficientes hj1 , j2 ; m1 , m2 | J, Ji: fase do ket |J, Ji . . . . . . . . . . . 61
3.10.5 Outros Coeficientes de Clebsch-Gordan . . . . . . . . . . . . . . . . . . . 62
3.10.6 Algumas relações úteis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.10.6.1 Os Sinais de alguns coeficientes . . . . . . . . . . . . . . . . . . 62
3.10.6.2 Mudança de ordem de j1 e j2 . . . . . . . . . . . . . . . . . . . 63
4 Teorema de Wigner-Eckart 65
4.1 Operadores escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.2 Operadores vetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.2.1 Definição dos operadores vetores . . . . . . . . . . . . . . . . . . . . . . . 66
4.3 O teorema de Wigner-Eckart para operadores vetores . . . . . . . . . . . . . . . 67
4.3.1 Elementos de matriz não-nulos de V na base padrão . . . . . . . . . . . 67
4.3.2 Proporcionalidade entre os elementos de matriz J e V dentro de um
subespaço E(k, j) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.3.2.1 Elementos de matriz de V+ e V− . . . . . . . . . . . . . . . . . 68
4.3.2.2 Elementos de matriz de Vz . . . . . . . . . . . . . . . . . . . . . 69
4.3.2.3 Generalização para uma componente arbitrária de V . . . . . . 70
4.3.2.4 Cálculo da constante de proporcionalidade: O teorema da projeção 70
4.3.2.5 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.4 Aplicação: Cálculo do fator de Landé gj de um nível atômico . . . . . . . . . . . 72
4.4.1 Degenerescência rotacional: Multípletos . . . . . . . . . . . . . . . . . . . 73
4.4.2 Remoção da degenerescência por um campo magnético . . . . . . . . . . 73
5 Teoria de Perturbação Independente do Tempo 77

5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.2 Método de Rayleigh-Schrödinger: Formulação do Problema . . . . . . . . . . . . 78
5.2.1 Autovetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.3 Correções para um nível não-degenerado . . . . . . . . . . . . . . . . . . . . . . 82
5.3.1 Correção de primeira ordem . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.3.1.1 Correção em primeira ordem na energia . . . . . . . . . . . . . 83
5.3.1.2 Correção em primeira ordem do autovetor . . . . . . . . . . . . 84
5.3.2 Correção de Segunda Ordem: energia . . . . . . . . . . . . . . . . . . . . 86
5.3.3 Correção de Segunda Ordem: autovetor . . . . . . . . . . . . . . . . . . . 88
(2)
5.3.4 Limite superior de En . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.4 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.4.1 Oscilador harmônico com perturbação linear: V (X) = ~ωX . . . . . . . 92
5.4.1.1 Solução exata . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.4.1.2 Solução perturbativa . . . . . . . . . . . . . . . . . . . . . . . . 94
5.4.2 Potencial perturbativo quadrático . . . . . . . . . . . . . . . . . . . . . . 95
Prof. Salviano A. Leão iii

Sumário
5.4.3 Potencial perturbativo de ordem X 3 . . . . . . . . . . . . . . . . . . . . 96

5.5 O Caso de Autovalores Degenerados . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.6 Teoria de Perturbação de Wigner-Brillouin . . . . . . . . . . . . . . . . . . . . . 99
5.7 O método variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.7.1 Propriedades do estado fundamental do sistema . . . . . . . . . . . . . . 103
5.7.2 Generalização: O teorema de Ritz . . . . . . . . . . . . . . . . . . . . . . 103
5.7.3 Exemplo: oscilador harmônico unidimensional . . . . . . . . . . . . . . . 104
5.7.3.1 Estado fundamental . . . . . . . . . . . . . . . . . . . . . . . . 104
5.7.3.2 Primeiro estado excitado . . . . . . . . . . . . . . . . . . . . . . 107
5.7.3.3 Estado fundamental: Funções de onda racionais . . . . . . . . . 108
5.7.4 Átomo de Hélio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110
6 A Estrutura Fina e Hiperfina do Átomo de Hidrogênio 117

6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.2 O Hamiltoniano não perturbado . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.3 Correções adicionais ao hamiltoniano do átomo de hidrogênio . . . . . . . . . . . 120
6.3.1 O Hamiltoniano da estrutura fina . . . . . . . . . . . . . . . . . . . . . . 120
6.4 Interpretação dos vários termos do hamiltoniano H . . . . . . . . . . . . . . . . 120
6.4.1 Termo Wmv da variação da massa com a velocidade . . . . . . . . . . . . 121
6.4.2 Termo Wso : Acoplamento spin-órbita . . . . . . . . . . . . . . . . . . . . 121
6.4.3 O termo de Darwin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.4.4 Hamiltoniano da estrutura fina . . . . . . . . . . . . . . . . . . . . . . . 127
6.5 A interação hiperfina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6.5.1 O spin do próton e seu momento magnético . . . . . . . . . . . . . . . . 128
6.5.2 O hamiltoniano magnético hiperfino . . . . . . . . . . . . . . . . . . . . . 129
6.5.3 Forma detalhada do hamiltoniano hiperfino . . . . . . . . . . . . . . . . 130
6.5.4 Acoplamento do momento magnético do próton com momentum angular
orbital do elétron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
6.5.5 Acoplamento com o spin do elétron . . . . . . . . . . . . . . . . . . . . . 133
6.5.6 Campo magnético associado ao próton . . . . . . . . . . . . . . . . . . . 133
6.5.7 Termo de dipolo magnético . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.5.8 Termo de contato de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.6 O hamiltoniano completo da estrutura hiperfina . . . . . . . . . . . . . . . . . . 137
6.6.1 Interpretação dos vários termos de Whf . . . . . . . . . . . . . . . . . . . 137
6.6.2 Ordem de magnitude de Whf . . . . . . . . . . . . . . . . . . . . . . . . 138
6.7 A estrutura fina do nível n = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
6.7.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
6.7.1.1 Degenerescência do nível n = 2 . . . . . . . . . . . . . . . . . . 139
6.7.2 O hamiltoniano perturbativo . . . . . . . . . . . . . . . . . . . . . . . . . 139
6.8 Representação matricial da estrutura fina Wf no nível n = 2 . . . . . . . . . . . 140
6.8.1 O Wf não atua nas variáveis de spin do próton . . . . . . . . . . . . . . . 140
Prof. Salviano A. Leão iv

Sumário
6.8.2 O Wf não conecta as subcamadas 2s com as 2p . . . . . . . . . . . . . . 140

6.8.3 Representação matricial de Wf na subcamada 2s . . . . . . . . . . . . . 142
6.8.4 Representação matricial de Wf na subcamada 2p . . . . . . . . . . . . . 142
6.8.4.1 Termos Wmv e WD . . . . . . . . . . . . . . . . . . . . . . . . . 142
6.8.4.2 Termo Wso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
6.9 Resultados: A estrutura fina do nível n = 2. . . . . . . . . . . . . . . . . . . . . 144
6.9.1 Notação espectroscópica . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
6.9.2 Posição dos níveis 2s1/2 ; 2p1/2 ; 2p3/2 . . . . . . . . . . . . . . . . . . . . 145
6.10 A estrutura hiperfina do nível n = 1 . . . . . . . . . . . . . . . . . . . . . . . . . 146
6.10.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
6.10.1.1 A degenerescência do nível 1s . . . . . . . . . . . . . . . . . . . 146
6.10.1.2 O nível 1s não possui estrutura fina . . . . . . . . . . . . . . . . 147
6.10.2 Representação matricial de Whf no nível 1s . . . . . . . . . . . . . . . . 147
6.10.2.1 O termo de contato WD . . . . . . . . . . . . . . . . . . . . . . 147
6.10.3 Autoestados e autovalores do termo de contato . . . . . . . . . . . . . . 148
6.10.4 Estrutura hiperfina do nível 1s . . . . . . . . . . . . . . . . . . . . . . . 149
6.10.5 A importância da estrutura hiperfina do nível 1s . . . . . . . . . . . . . . 151
6.11 Efeito Zeeman da estrutura hiperfina do estado fundamental 1s . . . . . . . . . 151
6.11.1 A perturbação vista pelo nível 1s . . . . . . . . . . . . . . . . . . . . . . 152
6.11.2 Diferentes domínios de intensidade do campo magnético . . . . . . . . . 153
6.11.3 Efeito Zeeman no regime de campos fracos . . . . . . . . . . . . . . . . . 153
6.11.4 Representação matricial de Sz na base {|F ; mF i} . . . . . . . . . . . . . 153
6.11.5 Campo fraco: Autoestados e autovalores . . . . . . . . . . . . . . . . . . 155
6.11.6 A frequência de Bohr e as evoluções de hF i e hSi . . . . . . . . . . . . . 156
6.11.7 Efeito do campo magnético forte . . . . . . . . . . . . . . . . . . . . . . 158
6.11.7.1 Efeitos do termo hiperfino Whf considerado como uma perturbação159
6.11.8 A frequência de Bohr envolvida na evolução de Sz . . . . . . . . . . . . . 161
6.12 Efeito Stark . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.12.1 Efeito Stark no nível 1s . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
6.12.2 Polarizabilidade do estado 1s . . . . . . . . . . . . . . . . . . . . . . . . 163
6.12.3 Efeito Stark para o nível n = 2 . . . . . . . . . . . . . . . . . . . . . . . 164
7 Teoria de Perturbação Dependente do Tempo 167

7.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
7.2 Probabilidade de transição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
7.2.1 Separando as contribuições temporais . . . . . . . . . . . . . . . . . . . . 170
7.3 Equações perturbativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
7.3.1 Função de onda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
7.4 Probabilidade de transição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
7.5 Perturbação súbita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
7.6 Perturbação adiabática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176
Prof. Salviano A. Leão v

Sumário
7.7 Representação de Schrödinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

7.8 Representação de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
7.9 Representação de interação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
7.10 Caso especial: Perturbação constante ou senoidal . . . . . . . . . . . . . . . . . 181
7.11 Perturbação senoidal acoplando dois estados discretos: o fenômeno da ressonância183
7.11.1 Relação de incerteza Energia-Tempo e a largura de linha da ressonância . 186
7.12 Limites do cálculo de primeira-ordem . . . . . . . . . . . . . . . . . . . . . . . . 187
7.13 Sistema de dois níveis discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
7.13.1 Condição de ressonância . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
7.13.2 Evolução temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
7.13.3 Aproximação secular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
7.14 Acoplamento com o contínuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
7.15 Integração sobre um contínuo de estados finais: Densidade de Estados . . . . . . 194
7.16 Caso geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
7.17 Regra de ouro de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
7.18 Função delta de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
7.19 Perturbação constante: condições . . . . . . . . . . . . . . . . . . . . . . . . . . 197
7.20 Regra de ouro de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
7.21 Perturbação Senoidal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
7.22 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
8 Decaimento de um estado discreto acoplado ressonantemente a um contínuo

de estados finais 201
8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
8.2 Descrição do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
8.2.1 Hipóteses sobre o acoplamento W . . . . . . . . . . . . . . . . . . . . . . 203
8.2.2 Resultados da teoria de perturbação de primeira ordem . . . . . . . . . . 203
8.2.3 Equação Integro-diferencial equivalente à Equação de Schrödinger . . . . 205
8.3 Aproximação para tempos curtos: Relação com a teoria de perturbação em
primeira ordem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
8.4 Segunda aproximação para resolver a equação de Schrödinger . . . . . . . . . . . 208
8.5 Análise dos resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
8.5.1 Tempo de vida do estado discreto . . . . . . . . . . . . . . . . . . . . . . 210
8.6 O deslocamento discreto do estado devido ao acoplamento com o contínuo . . . 211
8.7 Distribuição de energia dos estados finais . . . . . . . . . . . . . . . . . . . . . . 212
9 Quantização do Campo Eletromagnético 215

9.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
9.2 Equações de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
9.3 Potenciais vetor e escalar – Invariância de calibre . . . . . . . . . . . . . . . . . 217
9.4 Transformações de Calibre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218
Prof. Salviano A. Leão vi

Sumário
9.5 Equações de onda para o espaço livre . . . . . . . . . . . . . . . . . . . . . . . . 221

9.6 Quantização do campo eletromagnético . . . . . . . . . . . . . . . . . . . . . . . 225
9.7 A energia do vácuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
9.8 Operadores criação e aniquilação . . . . . . . . . . . . . . . . . . . . . . . . . . 229
9.9 A energia de ponto zero é real? . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
9.10 Propriedades dos fótons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
9.11 Operador Momentum do campo e dos fótons . . . . . . . . . . . . . . . . . . . . 233
9.11.1 Polarização do fóton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
9.12 Flutuações e relações de incerteza . . . . . . . . . . . . . . . . . . . . . . . . . . 238
10 Hamiltoniano de Interação 241

10.1 Onda Plana Eletromagnética . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
10.1.1 Campos E e B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
10.1.2 Vetor de Poynting S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
10.2 Hamiltoniano de interação para baixas intensidades . . . . . . . . . . . . . . . . 243
10.3 Luz de Baixa Intensidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
10.4 Hamiltoniano do Dipolo-Elétrico . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
10.5 Termo de Dipolo-Elétrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
10.6 Calibre Alternativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
10.6.1 Elementos de Matriz do Dipolo-Elétrico . . . . . . . . . . . . . . . . . . . 247
10.7 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
10.7.1 Regras de Seleção Para as Transições de Dipolo-Elétrico . . . . . . . . . 248
10.8 Acoplamento Spin-Órbita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
10.9 Hamiltonianas de Dipolo Magnético e Quadrupolo Elétrico . . . . . . . . . . . . 250
10.9.1 Transições de Dipolo Magnético . . . . . . . . . . . . . . . . . . . . . . . 251
10.10Regras de seleção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
10.10.0.1 Comentários: Acoplamento spin-órbita . . . . . . . . . . . . . . 251
10.10.1 Transições de Quadrupolo Elétrico . . . . . . . . . . . . . . . . . . . . . 252
10.10.2 Análise do termo de quadrupolo elétrico . . . . . . . . . . . . . . . . . . 252
10.10.3 Cálculo dos elementos de Matriz . . . . . . . . . . . . . . . . . . . . . . . 252
10.10.4 Regras de Seleção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
10.10.5 COMENTÁRIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
10.11Excitações Não-Ressonantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
10.12Modelo Clássico de Elétrons Ligados . . . . . . . . . . . . . . . . . . . . . . . . 254
10.13Susceptibilidade Elétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
10.14Interação da Radiação com Elétrons Ligados aos Átomos . . . . . . . . . . . . . 256
10.15Cálculo Quântico do Momento de Dipolo Induzido . . . . . . . . . . . . . . . . . 257
10.16Força do Oscilador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
10.17Excitação ressonante. Absorção e emissão induzidas . . . . . . . . . . . . . . . . 262
10.17.1 Onda plana monocromática: Transição de probabilidade . . . . . . . . . 262
10.18Largura de Linha da excitação. Probabilidade de transição por unidade de tempo 263
Prof. Salviano A. Leão vii

Sumário
11 Espalhamento 267
11.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
11.2 O problema do espalhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
11.2.1 Potencial espalhador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
11.2.2 Seção de choque de espalhamento . . . . . . . . . . . . . . . . . . . . . . 268
11.2.3 Grandezas físicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
11.3 Espalhamento por estados estacionários: Cálculo da seção de choque . . . . . . . 269
11.4 Forma assintótica dos estados estacionários espalhados. Amplitude de espalhamento270
11.4.1 Comportamento assintótico da onda espalhada . . . . . . . . . . . . . . . 270
11.4.2 Cálculo das seções de choque usando as correntes de probabilidade . . . . 271
11.4.3 Corrente espalhada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
11.4.4 Expressão para a seção de choque . . . . . . . . . . . . . . . . . . . . . . 271
11.4.5 Interferência entre onda incidente e a espalhada . . . . . . . . . . . . . . 272
11.4.6 A equação integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
11.4.7 Integral da função de Green . . . . . . . . . . . . . . . . . . . . . . . . . 274
11.4.8 Laplaciano de G± . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
11.5 Aproximação de Born . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
11.5.1 Interpretação dos termos da expansão de Born . . . . . . . . . . . . . . . 280
11.6 Espalhamento por muitos centros idênticos . . . . . . . . . . . . . . . . . . . . . 283
12 Espalhamento por um potencial central: Método das ondas parciais 289

12.1 Estados estacionários de uma partícula livre . . . . . . . . . . . . . . . . . . . . 289
12.1.1 Partícula Livre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
12.1.2 Estados estacionários com momentum bem definido. Ondas planas . . . . 290
12.1.3 Estados estacionários com momentum angular bem definido. Ondas
esféricas livres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
12.2 Propriedades físicas das ondas esféricas livres . . . . . . . . . . . . . . . . . . . . 291
12.2.1 Expansão de uma onda plana em termos de ondas esféricas livres . . . . 293
12.3 Onda parciais no potencial V (r) . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
12.3.1 Condição de Contorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
12.3.2 Equação Radial para r → ∞ . . . . . . . . . . . . . . . . . . . . . . . . . 295
12.3.3 Significado Físico do Deslocamento de Fase . . . . . . . . . . . . . . . . . 296
12.3.4 Potencial de Alcance Finito . . . . . . . . . . . . . . . . . . . . . . . . . 297
12.4 Seção de choque em termos do deslocamento de fase . . . . . . . . . . . . . . . . 297
12.4.1 Estados estacionários espalhados a partir de ondas parciais . . . . . . . . 298
12.4.2 Argumento Intuitivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
12.4.3 Dedução explicita dos termos da expansão . . . . . . . . . . . . . . . . . 299
12.4.4 Cálculo da Seção de Choque . . . . . . . . . . . . . . . . . . . . . . . . . 300
12.4.5 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
12.4.6 Teorema Óptico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
Prof. Salviano A. Leão viii

Sumário
13 Método das Funções de Green: Resolvente 303

13.1 Método das funções de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
13.1.1 Equação de Lippman-Schwinger . . . . . . . . . . . . . . . . . . . . . . . 303
13.1.2 A função de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
13.1.3 Expansão de Born . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
13.1.4 Convergência da série de Born . . . . . . . . . . . . . . . . . . . . . . . . 306
13.2 A matriz de espalhamento T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
13.3 Cálculo da função de Green via o cálculo de resíduos . . . . . . . . . . . . . . . 308
13.3.1 Partícula livre em uma dimensão . . . . . . . . . . . . . . . . . . . . . . 309
13.3.2 Partícula livre em três dimensões . . . . . . . . . . . . . . . . . . . . . . 310
13.4 Exemplo: Espalhamento por uma função delta 1d . . . . . . . . . . . . . . . . . 311
13.4.1 A matriz T de uma função delta 1d . . . . . . . . . . . . . . . . . . . . . 311
13.4.2 Solução direta da equação de Lippman-Schwinger . . . . . . . . . . . . . 313
13.5 Resolventes e Funções de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . 313
14 Sistema de Partículas Indistinguíveis 321

14.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
14.1.1 Partículas idênticas: definição . . . . . . . . . . . . . . . . . . . . . . . . 321
14.1.2 Partículas idênticas em mecânica clássica . . . . . . . . . . . . . . . . . . 321
14.1.3 Partículas idênticas na mecânica quântica: as dificuldades de aplicação
dos postulados gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
14.1.4 Origem das dificuldades: a degenerescência de troca . . . . . . . . . . . . 325
14.1.5 Troca degenerada para um sistema de duas partículas de spin 1/2 . . . . 325
14.1.6 Generalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
14.2 Operadores de permutação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
14.2.1 Sistemas de duas partículas . . . . . . . . . . . . . . . . . . . . . . . . . 328
14.2.2 Definição do operador de permutação P21 . . . . . . . . . . . . . . . . . . 328
14.2.3 Propriedades do operador permutação P21 . . . . . . . . . . . . . . . . . 329
14.2.4 Kets simétricos e antissimétricos: Simetrizar e antissimetrizar . . . . . . 330
14.2.5 Transformação de observáveis por permutação . . . . . . . . . . . . . . . 331
14.3 Sistemas contendo um número arbitrário de partículas . . . . . . . . . . . . . . . 332
14.3.1 Definição do operador permutação para N = 3. . . . . . . . . . . . . . . 332
14.3.2 Propriedade: o conjunto dos operadores de permutação constituem um
grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
14.3.3 Propriedade: Transposição, a paridade de um operador de permutação . 333
14.3.4 Propriedade: Operadores de permutação são unitários . . . . . . . . . . . 334
14.3.5 Kets Completamente Simétrico ou antissimétricos. Simetrizador e Antis-
simetrizador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
14.3.6 Transformação de um observável por permutação . . . . . . . . . . . . . 336
14.4 Postulado da simetrização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
14.4.1 Remoção da degenerescência de troca . . . . . . . . . . . . . . . . . . . . 337
Prof. Salviano A. Leão ix

Sumário
14.5 Construção de kets físicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338

14.5.1 A Regra de Construção . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
14.5.2 Aplicação: sistema de duas partículas idênticas . . . . . . . . . . . . . . 338
14.5.3 Generalização para um número qualquer de partículas . . . . . . . . . . . 339
14.5.3.1 Bósons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
14.5.4 Férmions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
14.5.5 Construção de uma base no espaço de estado físico . . . . . . . . . . . . 341
14.6 Aplicação dos outros postulados . . . . . . . . . . . . . . . . . . . . . . . . . . . 343
14.6.1 Postulados de medição . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343
14.6.1.1 Probabilidade de encontrar o sistema em um determinado estado
físico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343
14.6.1.2 Observáveis físicos: invariância de ES e EA . . . . . . . . . . . . 343
14.6.1.3 Postulados da evolução temporal . . . . . . . . . . . . . . . . . 345
14.6.2 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
14.6.2.1 Diferença entre bósons e férmions. Princípio de exclusão de Pauli346
14.6.2.2 Estado fundamental de um sistema de partículas idênticas inde-
pendentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347
14.7 Estatística quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348
14.7.1 As consequências da indistinguibilidade da partícula no cálculo de suas
predições físicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349
14.7.2 Interferências entre os processos diretos e os de troca . . . . . . . . . . . 349
14.7.2.1 As predições relativas a uma medida em um sistema de partículas
idênticas: o termo direto e o termo de troca . . . . . . . . . . . 349
14.7.3 Exemplo: colisão elástica de duas partículas idênticas . . . . . . . . . . . 352
14.7.4 Situação na qual o postulado da simetrização pode ser ignorado . . . . . 355
14.7.4.1 Partículas idênticas situadas em duas regiões distintas do espaço 355
14.7.4.2 Partículas que podem ser identificadas pela direção de seus spins 356
14.8 O caráter simétrico dos estados de um sistema de muitas partículas idênticas . . 357
14.9 Formalismo do Espaço de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . 365
14.10O Problema da Normalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
14.11Operadores de Criação e de Destruição . . . . . . . . . . . . . . . . . . . . . . . 371
14.11.1 Caso de Bose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
14.11.2 Caso de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
14.12Operadores de uma-partícula no formalismo da segunda quantização . . . . . . . 377
14.12.1 Operador Número . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380
14.12.2 Operador Momentum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380
14.12.3 Operador Energia Cinética . . . . . . . . . . . . . . . . . . . . . . . . . . 382
14.12.4 Operador Energia Potencial . . . . . . . . . . . . . . . . . . . . . . . . . 382
Prof. Salviano A. Leão x

Chapter 1
Spin
1.1 O que é um Spin?

Viu-se que tratar o elétron como sendo uma partícula que possui três graus de liberdade
associados, os quais são as suas três coordenadas espaciais (x, y, z), e que é caracterizado
quanticamente por uma função de onda ψ(x, y, z), a qual depende apenas das coordenadas
cartesianas (x, y, z) é insuficiente. Essa abordagem já foi usada em diversos sistemas produzindo
bons resultados. Entretanto, como foi visto, o elétron é melhor caracterizado como sendo uma
partícula que possui as seguintes propriedade intrínsecas: massa, carga e o spin. A ordem de
grandezas desses parâmetros que caracterizam o elétron são apresentados na tabela a seguir.
Propriedade Símbolo Valor Unidade

Massa me 9, 11 × 10−31 kg
− −19
Carga e −1, 602 × 10 C
Spin S ± 12 ~ J·s
Apesar do spin possuir as mesmas dimensões de momentum angular, ele deve ser considerado
como uma propriedade intrínseca do elétron sem análogo clássico, ou seja, um “momentum
angular intrínseco”. Note que toda e qualquer tentativa de fazer uma analogia clássica traz mais
problemas do que benefícios para a compreensão deste conceito.
Example 1.1. Mostre que no modelo clássico que trata o elétron como uma pequena bolinha
que gira em torno de um eixo próprio, a velocidade superficial do elétron tem de ser mais de
60 vezes a velocidade da luz, para produzir um momentum angular de (1/2)~. Por isso, esse
modelo não é adequado.
Solution 1.2. O momentum angular é dado por:
1
L = Iω = me vs re = ~,
2
1
1.1. O que é um Spin?
+ =
Figure 1.1: Modelo clássico para o elétron, o qual o trata-o por uma pequena bolinha que gira com
uma velocidade angular ω em torno do seu eixo.
na qual vs é a velocidade superficial do elétron e re é o raio clássico do elétron ou raio de Lorentz

e é dado por [27, Ver pág. 83, na seção Energia própria de uma carga puntiforme]1 :
e2 1 me e2
2
1 ~
re = 2
= 2
,
4πε0 me c 4πε0 ~ m2e c2
1
= · (αa0 )2 = α2 a0
a0
= 2.8179403267(27) × 10−15 m
na qual usou-se o fato de que o raio de Bohr cujo valor é a0 = 0.52917724924 × 10−10 m também
é expresso por:
~2 4π0 ~2
a0 = (CGS) e a0 = (M KSA) (1.1)
me e2 me e 2
e que em termos da contante de estrutura fina α = 1/137, 035989561 ele também pode ser
expresso por
~ ~
a0 = (CGS) e a0 = (M KSA) (1.2)
αme c αme c
e2 1
α= = (M KSA)
4πε0 ~c 137, 035989561
Então temos que
~ 1 ~ c 1 c 1
vs = = 2
= αa0 2 = c ≈ 68, 52 · c
2me re 2 m e c α a0 2 α a0 2α
Portanto, a velocidade superficial é da ordem de 68 vezes a velocidade da luz.
1.1.1 Natureza Quântica do Spin

A mais comum das analogias clássicas do spin, é aquela na qual ele é associado ao momentum
angular intrínseco de uma bolinha girando em torno do seu eixo. Entretanto, como viu-se no
exemplo anterior tal analogia é muito grosseira e insatisfatória, e além disso ela deixa de explicar
algumas de suas propriedade, dentre elas, o fato dele ser quantizado.
1
Para obter o raio clássico do elétron, o mesmo é tratado com um partícula pontual uma vez que sua carga é
a elementar e ela não é divisível. No cálculo da autoenergia de uma esfera carregada surge um fator 3/5, o qual
é ignorado aqui devido a natureza elementar da carga do elétron.
Prof. Salviano A. Leão 2

1.1. O que é um Spin?
S N
e−
e−
N S
m = + 21 m = − 12
Figure 1.2: A analogia do momentum angular intrínseco de uma bolinha girando em torno do seu
eixo com o spin é insatisfatória.
A existência do spin está na inclusa mecânica quântica relativística, elaborada por Dirac
[43, 44]. Na equação de Schrödinger, o spin foi incorporado de forma a parte ao formalismo da
mecânica quântica de Schrödinger por Wolfgang Pauli.
De acordo com Landau [22], a lei de conservação do momentum angular, tanto na mecânica
clássica quanto na mecânica quântica, é uma consequência direta da isotropia espacial em
um sistema fechado, e isso, é uma evidência direta da relação entre o momentum angular e
as propriedades de simetria com relação as rotações. Na mecânica quântica, essas relações
de simetria com relação as rotações constituem a essência do conceito de momentum angular
de uma partícula, já que a sua definição clássica, como o produto vetorial r × p, perde seu
significado direto pois não se pode medir simultaneamente a posição e o momentum.
Foi mostrado que as relações de comutação do momentum angular orbital de uma partícula
podem ser vistas como uma consequência da estrutura não-comutativa do grupo de rotações
geométricas. Estabeleceu-se também que os números quânticos l e mL determinam a dependência
angular da função de onda de uma partícula, e portanto, todas as suas propriedades de simetria
com relação às rotações. A conservação do momentum angular, de forma geral, estabelece
a lei de transformação dos autoestados do momentum angular nas rotações do sistema de
coordenadas.
Para um sistema de partículas, os autoestados do momentum angular |l, mL i, com os valores
específicos do momentum angular l e de sua projeção m, não serão alterados apenas no caso de
rotações do sistema de coordenadas em torno do eixo Oz. Qualquer rotação que mude a direção
do eixo z terá como consequência que a projeção do momentum angular sobre o eixo Oz não
será mais um valor bem determinado. Pois no novo sistema de coordenadas, os autoestados
|l, m0L i em geral se transformam em uma superposição dos 2l + 1 autoestados |l, mL i da seguinte
forma,
i
X
|l, m0L i = CL,τ e− ~ L·û |l, τ i (1.3)
τ
a qual corresponde a cada um dos possíveis valores de mL para um dado l.

Nas rotações do sistema de coordenadas os 2l + 1 autoestados |l, mL i transformam-se

1.2. Momentum angular intrínseco: spin
em combinações lineares uns nos outros. A lei que governa essas transformações, isto é, os
coeficientes Cl,τ da superposição dos autoestados (como funções do ângulo de rotação do sistema
de coordenadas), é determinada completamente ao especificarmos o valor de l. Desse modo,
o momentum angular adquire o significado de um número quântico, o qual classifica o estado
do sistema de acordo com suas propriedades de transformação sobre uma rotação do eixo de
coordenadas do sistema.
Note que esse aspecto do conceito de momentum angular na mecânica quântica é particu-
larmente importante porque ele não está diretamente relacionado com a dependência angular
explicita dos autoestados do sistema, (as funções de onda): a lei de transformação mútua desses
autoestados pode ser expressa de modo independente, sem se fazer referência a essa dependência
angular.
1.1.1.1 Sistema de partículas
Consideremos uma partícula composta, como por exemplo um núcleo atômico, o qual está
em repouso como um todo (ou seja seu CM está em repouso) e encontra-se em um estado interno
bem definido. Além disso, ela tem uma energia interna e um momentum angular de magnitude
l, devido ao movimento das partículas que compõem o núcleo. Esse momentum angular pode
ter 2l + 1 diferentes orientações no espaço.
Nota
Portanto, ao considerarmos o movimento de uma partícula complexa
como um todo devemos, além de suas coordenadas, atribuir a ela uma
variável discreta: a projeção do seu momentum angular interno sobre
uma direção qualquer do espaço.
1.2 Momentum angular intrínseco: spin

Portanto, após uma reflexão sobre os argumentos precedentes a respeito do conceito de
momentum angular, pode-se concluir que as questões que surgem a respeito de sua origem
não são mais essenciais, e com isso chegamos naturalmente ao conceito de momentum angular
intrínseco, o qual deve ser atribuído a uma partícula independente do fato dela ser composta ou
elementar.
Nota
Deste modo, na mecânica quântica deve-se atribuir à partícula el-
ementar um momentum angular intrínseco, não relacionado ao seu
movimento espacial.
Esta propriedade das partículas elementares é especificamente de natureza quântica (ela

desaparece na passagem em que tomamos o limite ~ → 0), e portanto, em princípio ela não tem
uma interpretação clássica (um análogo clássico).

1.3. Evidências experimentais do spin do elétron
Nota
O momentum angular intrínseco de uma partícula é chamado de spin da
partícula, em distinção ao momentum angular da partícula associado
ao movimento da partícula no espaço, denominado de, momentum
angular orbital.
Quanto a partícula em si, tanto faz se a partícula concebida é elementar ou composta, o que
importa é que ela se comporta como uma partícula elementar no fenômeno em questão (por
exemplo, o núcleo atômico).
Quanto ao spin da partícula temos:
• O spin de uma partícula, é medido como o momentum angular orbital, em unidades de ~

e será denotado por s.
• Para partículas possuidoras de spin, a descrição do estado mediante a função de onda

deve determinar não somente as probabilidades das suas diversas posições no espaço, mas
ainda as probabilidades das diversas orientações possíveis de seu spin. Portanto, a função
de onda deve depender não só das três variáveis contínuas, isto é, das coordenadas da
partícula, mas também de uma variável de spin discreta que determina o valor da projeção
do spin sobre uma direção escolhida no espaço (o eixo Oz) e que só pode ter um número
limitado de valores discretos, os quais denotaremos por σ.
1.3 Evidências experimentais do spin do elétron

Há numerosas demonstrações experimentais da existência do spin do elétron, entre elas
pode-se destacar:
• As propriedades magnéticas de inúmeras substâncias, particularmente os metais ferromag-

néticos, só podem ser explicados se o spin for levado em conta.
• A estrutura fina das linhas espectrais na física atômica.
• O efeito Zeeman.
• O experimento de Stern-Gerlach [37, 39, 41, 42]. A experiência de Stern-Gerlach foi

realizada em Frankfurt, Alemanha em 1922 por Otto Stern e Walther Gerlach.
1.4 Descrição quântica: os postulados de Pauli

Em 1924, Wolfgang Pauli propôs um novo grau de liberdade quântico [37, 42], para explicar
as inconsistências entre o espectro molecular observado e os desenvolvimentos da mecânica
quântica. Ele formulou o Princípio de exclusão, talvez seu mais importante trabalho, que

1.4. Descrição quântica: os postulados de Pauli
estabelece que nenhuma partícula (por exemplo, os elétrons) pode existir no mesmo estado
quântico.
Em 1925 George Eugene Uhlenbeck e Samuel Abraham Goudsmit [37, 40], para explicarem
os resultado experimentais do experimento realizado por Stern-Gerlach em 1922, propuseram a
seguinte hipótese: o elétron possui um momentum angular intrínseco chamado spin, identificaram
o grau de liberdade extra do elétron proposto por Pauli como sendo o spin. Além disso, para
interpretar corretamente os resultados experimentais propuseram que o momentum magnético
MS associado a este momentum angular intrínseco S fosse dado por
µB µB
M S = gs S e ML = gl L (1.4)
~ ~
Note que o coeficiente de proporcionalidade entre o momentum angular de spin S e o seu
momento magnético é duas vezes aquele para o momentum angular orbital L, ou seja,
α
gs = 2(1 + + · · · ) = 2, 0 × 1, 001159657(4) = 2.0023193043617(15) e gl = 1, 0 (1.5)
2π
Nesse caso diz-se que:
Nota
A razão giromagnética do spin é duas vezes a razão giromagnética
orbital.
Em 1927, Wolfgang Pauli [5, 37] enunciou mais precisamente essa declaração e forneceu
uma descrição quântica para o spin, a qual era válida no limite não-relativístico. Seu trabalho
influenciou Paul A.M. Dirac na descoberta da equação de Dirac para o elétron relativístico.
1.4.1 Postulados
Para uma partícula como o elétron, associamos respectivamente a sua posição r e ao seu
momentum linear p, os observáveis R e P que atuam no espaço de estados Er , o qual é isomórfico
ao espaço das funções de onda F.
Todas quantidades físicas são funções das variáveis fundamentais r e p, e a regra de
quantização nos permite associarmos a elas observáveis que atuam no espaço de estados Er .
Agora iremos chamá-lo de o espaço de estados orbital Er .
A essas variáveis orbitais adicionaremos as variáveis de spin, as quais satisfazem os seguintes
postulados:
i) O operador de spin S é um momentum angular intrínseco, e portanto, satisfaz a mesma

álgebra. Isso significa que suas três componentes são observáveis que satisfazem as
seguintes relações de comutação:
[Sx , Sy ] = i~Sz ; [Sz , Sx ] = i~Sy ; [Sy , Sz ] = i~Sx . (1.6)
[Sα , Sβ ] = i~α,β,γ Sγ com α, β, γ = x, y, z. (1.7)

1.5. Partículas de spin s = 1/2: propriedades especiais
ii) Os operadores de spin atuam atuam em um novo espaço, o espaço de estados Es , no

qual S2 e Sz constituem um conjunto completo de observáveis que comutam entre
si, um C.S.C.O. Portanto, o espaço de estados Es é expandido pelo conjunto de
autoestados |s, mi comuns à S2 e Sz , com
S2 |s, mi = s(s + 1)~2 |s, mi (1.8)

Sz |s, mi = m~ |s, mi (1.9)
De acordo com a teoria do momentum angular, desenvolvida anteriormente, sambemos

que s deve ser um inteiro ou um semi-inteiro, e além disso que m = −s, −s+1, . . . , s−
1, s.
Quando uma dada partícula é caracterizada por um único valor de s: diz-se que ela
possui um spin s e portanto o seu espaço de estado de spin Es é sempre de dimensão
finita (2s+1), e todos os estados de spin são autovetores de S2 com o mesmo autovalor
s(s + 1)~2 .
iii) O espaço de estados E da partícula em questão é dado pelo produto tensorial de Er

por Es :
Er ⊗ Es .
Portanto, todos os observáveis de spin comutam com todos os observáveis orbital.
Exceto para o caso particular em que s = 0, não é o suficiente especificarmos um ket
de Er para caracterizar um estado de uma partícula.
iv) O elétron é uma partícula de spin 1/2, (s = 1/2) e o seu momento magnético intrínseco
é dado por:
µB
MS = 2 S. (1.10)
~
Portanto, para o elétron o espaço Es é bidimensional.
1.5 Partículas de spin s = 1/2: propriedades especiais

O espaço de estados do spin Es é bidimensional. Considerando uma base ortonormal
{|+i , |−i} dos autoestados comuns de S2 e Sz que satisfazem:
3
S2 |±i = ~2 |±i (1.11a)
4
1
Sz |±i = ± ~ |±i (1.11b)
2
e além disso, da ortonormalização temos
h+ | −i = 0; h+ | +i = h− | −i = 1, (1.12)
e vale também a completeza

|+i h+| + |−i h−| = 1. (1.13)

O estado de spin mais geral é descrito por um vetor arbitrário de Es
|χi = c+ |+i + c− |−i , (1.14)
em que c+ e c− são números complexos.

De acordo com (1.11a), todos os kets de Es são autovetores de S2 com o mesmo autovalor
3~/4, logo S2 deve ser proporcional ao operador identidade 1 de Es , ou seja,
!
3 3 1 0
S2 = ~2 1 ou S2 = ~2 (1.15)
4 4 0 1
Como S é por definição um momentum angular, ele possui todas as propriedades gerais de
um operador momentum angular. Portanto, a ação do operador
S± = Sx ± iSy (1.16)
sobre os vetores da base |+i e |−i é dada por
S+ |+i = 0 |+i S+ |−i = ~ |+i (1.17a)

S− |+i = ~ |−i S− |−i = 0 (1.17b)
Qualquer operador atuando em Es pode ser representado, na base {|+i , |−i} por uma matriz
2 × 2.
1.5.1 Matrizes de Pauli

A matriz S, pode ser escrita em termos das matrizes de Pauli σ, da seguinte forma
~
S= σ (1.18)
2
com suas componentes sendo dadas por
~ ~ ~
Sx = σx , Sy = σy , Sz = σz . (1.19)
2 2 2
e as matrizes de Pauli são:
! ! !
0 1 0 −i 1 0
σx = , σy = , σz = . (1.20)
1 0 i 0 0 −1
As matrizes de Pauli possuem as seguintes propriedades:
σx2 = σy2 = σz2 = 1, (1.21)
σx σy + σy σx = 0, σy σz + σz σy = 0, σz σx + σx σz = 0, (1.22)
[σx , σy ] = 2iσz ou [σα , σβ ] = α,β,γ 2iσγ (1.23)

em que α,β,γ é o tensor de Levi-Civita. Temos ainda que
σx σy = iσz , σy σz = iσx , σz σx = iσy (1.24)
Essas relações anteriores podem ser escritas em uma forma mais compacta, como
σα σβ = iα,β,γ σγ + δα,β I. (1.25)
Temos ainda que

Tr σx = Tr σy = Tr σz = 0, (1.26)
Det σx = Det σy = Det σz = −1. (1.27)
Nota
Qualquer matriz 2 × 2 pode ser escrita como uma combinação linear,
com coeficientes complexos, das três matrizes de Pauli e da matriz
identidade.
Para as matrizes de Pauli, vale a seguinte propriedade:
(σ · A)(σ · B) = A · B + iσ · (A × B) (1.28)
em que A e B são dois vetores arbitrários, ou dois vetores operadores cujas três componentes
comutam com aquelas do spin S, ou seja,
[Ai , Sj ] = 0 i, j = x, y, z. (1.29a)
[Bi , Sj ] = 0 i, j = x, y, z. (1.29b)
[Ai , Bj ] = 0 i, j = x, y, z. (1.29c)
Se A e B não comutarem entre si, a identidade permanece válida se A e B aparecerem na

mesma ordem em ambos os lados da identidade.
1.5.2 Propriedades do operador de spin S

Destas propriedades seguem imediatamente que
~2
Sx2 = Sy2 = Sz2 = , (1.30)
4
Sx Sy + Sy Sx = 0, Sy Sz + Sz Sy = 0, Sz Sx + Sx Sz = 0, (1.31)
[Sx , Sy ] = i~Sz ou [Sα , Sβ ] = i~Sγ α,β,γ (1.32)

i i i
Sx Sy = ~Sz , Sy Sz = ~Sx , Sz Sx = ~Sy (1.33)
2 2 2
S+2 = S−2 = 0 (1.34)

1.6. Partícula de spin 1/2: Descrição não-relativística
1.6 Partícula de spin 1/2: Descrição não-relativística

1.6.1 Observáveis e vetores de estado
Quando todos os graus de liberdade são levados em conta, o estado quântico de um elétron
é caracterizado por um ket pertencente ao espaço E o qual é um produto tensorial de Er por Es .
Entre os vários C.S.C.O podemos escolher qualquer um dos seguintes:
{X, Y, Z, S2 , Sz }
{Px , Py , Pz , S2 , Sz }
{H, L2 , Lz , S2 , Sz }
Note que como todos os kets de E são autovetores de S2 com o mesmo autovalor, então pode-se
omitir S2 desse conjunto de observáveis.
Usando o primeiro conjunto, e usaremos como base de E uma na qual o ket |ri = |x, y, zi ∈ Er
e a outra |εi ∈ Es , logo podemos escrever
|r, εi ≡ |x, y, z, εi = |ri ⊗ |εi (1.35)
Por definição temos o vetor |r, εi é um autovetor comum de X, Y , Z, S2 , Sz :
X |r, εi = x |r, εi (1.36a)

Y |r, εi = y |r, εi (1.36b)
Z |r, εi = z |r, εi (1.36c)
3
S2 |r, εi = ~2 |r, εi (1.36d)
4
~
Sz |r, εi = ε |r, εi (1.36e)
2
Temos ainda que:
hr0 , ε0 | r, εi = δε0 ,ε δ(r0 − r) (1.37)
e a relação de completeza
Xˆ ˆ ˆ
d r |r, εi hr, ε| = d r |r, +i hr, +| + d3 r |r, −i hr, −| = 1
3 3
(1.38)
ε
1.6.2 Representação {|r, εi}

Qualquer vetor de estado |ψi pode ser expandido na base {|r, εi}, e para isso, basta usar a
completeza da seguinte forma
Xˆ
|ψi = d3 r |r, εi hr, ε | ψi (1.39)
ε
O vetor de estado |ψi pode ser representado por uma função de onda
hr, ε | ψi = ψε (r), (1.40)

a qual depende dos três índices contínuos x, y e z e do índice discreto ε (+ ou −).

Para caracterizarmos completamente o estado de um elétron, será necessário especificarmos
as duas funções de onda das variáveis espaciais, ou seja,
ψ+ (r) = hr, + | ψi e ψ− (r) = hr, − | ψi . (1.41)
Essas duas funções, geralmente são escritas na forma de um spinor de duas componentes
!
ψ+ (r)
[ψ](r) = (1.42)
ψ− (r)
O bra hψ| associado ao ket |ψi é dado pelo adjunto de (1.39):

Xˆ
hψ| = d3 r hψ | r, εi hr, ε| (1.43)
ε
o qual, pode ser reescrito como

Xˆ
hψ| = d3 r ψε∗ (r) hr, ε| . (1.44)
ε
∗ ∗
Portanto, o bra hψ| é representado pelas duas funções ψ+ (r) e ψ− (r), as quais podem ser
reescritas na forma de um spinor
[ψ † ](r) = (ψ+
∗ ∗
(r) ψ− (r)). (1.45)
Com essa notação, produto escalar de dois vetores de estado |ψi e |ϕi pode ser escrito como:
Xˆ
hψ | ϕi = d3 r hψ | r, εi hr, ε | ϕi
ˆε
∗ ∗
= d3 r [ψ+ (r)ϕ+ (r) + ψ− (r)ϕ− (r)] (1.46)
o qual ainda pode ser escrito como

ˆ
hψ | ϕi = d3 r [ψ]† (r)[ϕ](r). (1.47)
A normalização do ket |ψi é dada por

ˆ ˆ
†
hψ | ψi = d r [ψ] (r)[ψ](r) = d3 r [|ψ+ (r)|2 + |ψ− (r)|2 ] = 1
3
(1.48)
Entre os vetores de E, alguns são produtos tensoriais de um ket de Er por um ket de Es .

Considere por exemplo, o caso em que o vetor de estado é do seguinte tipo:
|ψi = |ϕi ⊗ |χi , (1.49)
em que ˆ
|ϕi = d3 r ϕ(r) |ri ∈ Er (1.50)
|χi = c+ |+i + c− |−i ∈ Es (1.51)

logo, o spinor associado a ele toma a seguinte forma:

! !
ϕ(r)c+ c+
[ψ](r) = = ϕ(r) . (1.52)
ϕ(r)c− c−
Esse resultado, deve-se a definição do produto escalar em E, e neste caso temos:
ψ+ (r) = hr, + | ψi = hr | ϕi h+ | χi = ϕ(r)c+ (1.53a)

ψ− (r) = hr, − | ψi = hr | ϕi h− | χi = ϕ(r)c− (1.53b)
O quadrado da norma de |ψi é então dado por:

ˆ
2 2
hψ | ψi = hϕ | ϕi hχ | χi = (|c+ | + |c− | ) d3 r |ϕ(r)|2 (1.54)
1.6.3 Operadores
Seja A um operador tal que
A |ψi = |ψ 0 i com |ψi , |ψ 0 i ∈ E (1.55)
usando a completeza (1.38), podemos reescrever (1.55) como

XXˆ ˆ
0
|ψ i = 3
dr d3 r0 |r0 , ε0 i hr0 , ε0 | A | r, εi hr, ε | ψi (1.56)
ε ε0
Agora vamos obter cada elemento do spinor. Primeiro vamos projetar o ket |ψ 0 i em |r, +i, assim
Xˆ
0 0
ψ+ (r) = hr, + | ψ i = d3 r hr, + | A | r, εi hr, ε | ψi (1.57)
ε
e projetando em |r, −i, obtemos

Xˆ
0 0
ψ− (r) = hr, + | ψ i = d3 r hr, − | A | r, εi hr, ε | ψi (1.58)
ε
Portanto, de acordo com os resultados anteriores |ψi e |ψ 0 i podem ser representados por um
spinor de duas componentes [ψ](r) e [ψ 0 ](r).
Agora mostraremos que podemos associar com o operador A uma matriz 〚A〛 2 × 2, tal que
[ψ 0 ](r) = 〚A〛[ψ](r) (1.59)
em que os elementos de matriz, em geral, permanecem operadores diferenciais em relação a

variável r.
1.6.3.1 Operadores de spin
Esses foram definidos inicialmente em Es , portanto, eles atuam somente sobre o índice ε dos
vetores da base |r, εi. Considere por exemplo o caso da ação do operador S+ sobre um vetor
|ψi, resultando em |ψ 0 i: ˆ
0
|ψ i = ~ d3 r ψ− (r) |r, +i . (1.60)

Note que o operador S+ aniquila todos os kets |r, +i e transforma os kets |r, −i em ~ |r, +i.
As componentes de |ψ 0 i na base {|r, εi} são:
hr, + | ψ 0 i = ψ+
0
(r) = ~ψ− (r) (1.61)
hr, − | ψ 0 i = ψ−
0
(r) = 0. (1.62)
Portanto, o spinor representando |ψ 0 i é

!
ψ− (r)
[ψ 0 ](r) = ~ (1.63)
0
Esse é de fato o resultado obtido ao multiplicarmos a matriz do spinor por

!
~ 0 1
〚S+ 〛 = (σx + iσy ) = ~ . (1.64)
2 0 0
pois,
[ψ 0 ](r) = 〚S+ 〛[ψ](r)

! !
0 1 ψ+ (r)
=~
0 0 ψ− (r)
!
ψ− (r)
=~
0
1.6.3.2 Operadores Orbitais
Ao contrário dos operadores de spin, os operadores orbitais sempre deixam inalterados o

índice ε dos vetores da base |r, εi: suas matrizes 2 × 2 associadas no termo de spin são sempre
proporcionais a matriz identidade. Entretanto eles atuam sobre a dependência em r do spinor,
da mesma forma como atuam sobre uma função de onda ordinária.
Considere por exemplo o caso da ação dos operadores X e Px sobre um vetor de estado |ψi,
resultando respectivamente em |ψ 0 i e |ψ 00 i:
|ψ 0 i = X |ψi e |ψ 00 i = Px |ψi , (1.65)
logo suas componentes na base {|r, εi} são respectivamente
ψε0 (r) = hr, ε | X | ψi = xψε (r) (1.66a)

~ ∂
ψε00 (r) = hr, ε | Px | ψi = ψε (r) (1.66b)
i ∂x
Os spinores [ψ 0 ](r) e [ψ 00 ](r) foram obtidos do spinor [ψ](r) por meio das matrizes 2 × 2:
 
! ∂
x 0 ~ 0 
〚X〛 = e 〚Px 〛 =  ∂x ∂  . (1.67)
0 x i 0
∂x

Note que, ! ! !
x 0 ψ+ (r) ψ+ (r)
[ψ 0 ](r) = 〚X〛[ψ](r) = =x (1.68)
0 x ψ− (r) ψ− (r)
e que  
∂ ! !
~ 0  ψ+ (r) ~ ∂ ψ+ (r)
[ψ 00 ](r) = 〚Px 〛[ψ](r) =  ∂x = (1.69)

i ∂  ψ (r) i ∂x ψ− (r)
0 −
∂x
1.6.3.3 Operadores mistos
A forma mais geral de um operador atuar em E é representada, em uma notação matricial,

por uma matriz 2 × 2 cujos elementos são operadores diferenciais com relação a variável r. Por
exemplo,
~ ∂
 
~ 0
〚Lz Sz 〛 =  i ∂ϕ (1.70)

2 ~ ∂ 
0 −
i ∂ϕ
ou
~
〚S · P〛 = (σx Px + σy Py + σz Pz )
2
∂ ∂ ∂
 
2
~  − i
= ∂z ∂x ∂y 
∂ ∂ ∂ 
2i +i −
∂x ∂y ∂z
Notas
• A representação spinorial na base {|r, εi} é análoga a representação na base {|ri} de Er .

O elemento de matriz hψ | A | ϕi para um operador A qualquer de E é dado por
ˆ
hψ | A | ϕi = d3 r [ψ]† (r)〚A〛[ϕ](r) (1.71)
na qual, 〚A〛 designa uma matriz 2 × 2 a qual representa o operador A.
• Obviamente que há também a representação {|p, εi} cujos vetores da base são autovetores
comuns do C.S.C.O {Px , Py , Pz , S2 , Sz }. A definição do produto escalar em E produz:
1
hr, ε | p, ε0 i = hr | pi hε | ε0 i = eip·r/~ δε,ε0 (1.72)
(2π~)3/2
Nessa representação, temos !

ψ̄+ (p)
[ψ̄](p) = (1.73)
ψ̄− (p)
com
ψ̄+ (p) = hp, + | ψi e ψ̄− (p) = hp, − | ψi (1.74)

1.7. Cálculo de probabilidades de uma medição física
Ainda pode-se escrever ψ̄ε (p) como

Xˆ
ψ̄ε (p) = hp, ε | ψi = d3 r hp, ε | r, ε0 i hr, ε0 | ψi
ε0
ˆ
1
= d3 r eip·r/~ ψε (r).
(2π~)3/2
1.7 Cálculo de probabilidades de uma medição física

Considere um elétron, descrito pelo estado |ψi normalizado cujas componentes são ψ+ (r) e
ψ− (r), que medimos simultaneamente sua posição e a componente ao longo do eixo Oz do seu
spin. Desde que, X, Y , Z e Sz constituem um C.S.C.O, há um único vetor de estado o qual
corresponde a um dado resultado: x, y, z e ±~/2.
A probabilidade d3 P(r, +) do elétron ser encontrado no elemento de volume infinitesimal
d3 r em torno do ponto r(x, y, z) com o seu spin para cima (Sz = +~/2) é igual a:
d3 P(r, +) = |hr, + | ψi|2 d3 r = |ψ+ (r)|2 d3 r (1.75)
e analogamente para o spin para baixo (Sz = −~/2), temos
d3 P(r, −) = |hr, − | ψi|2 d3 r = |ψ− (r)|2 d3 r (1.76)
1.7.1 Medindo a componente Sx

Considere um elétron, descrito pelo estado |ψi normalizado cujas componentes são ψ+ (r)
e ψ− (r), que medimos simultaneamente sua posição e a componente ao longo do eixo Ox
do seu spin. Desde que, X, Y , Z e Sz constituem um C.S.C.O, o resultado de uma medida
{x, y, z, ±~/2}, corresponde há um único vetor de estado o qual é dado por:
1
|ri |±ix = √ [|r, +i ± |r, −i] (1.77)
2
A probabilidade d3 P(r, +) do elétron ser encontrado no elemento de volume infinitesimal

d3 r em torno do ponto r(x, y, z) com o seu spin para cima (Sx = +~/2) é igual a:
2
1 1
d P(r, +) = √ [hr, + | ψi + hr, − | ψi] × d3 r = |ψ+ (r) + ψ− (r)|2 d3 r
3
2 2
e analogamente para o spin para baixo (Sx = −~/2), temos

2
1 1
d P(r, −) = √ [hr, + | ψi − hr, − | ψi] × d3 r = |ψ+ (r) − ψ− (r)|2 d3 r
3
2 2

1.7. Cálculo de probabilidades de uma medição física

Capítulo 2
Spin - Rotação
2.1 Operadores de rotação para uma partícula de spin 1/2

2.1.1 Momentum angular total
Uma partícula de spin 1/2, possui um momentum angular orbital L e um momentum angular
de spin S. O momentum angular total J é definido como a soma dos dois momenta angular:
J=L+S (2.1)
Aqui os operadores R, P e S são observáveis vetoriais.

No espaço de estado da partícula em questão, o operador de rotação Rû (α) está associado
com a rotação geométrica Rû (α) através de um ângulo α em torno do vetor unitário û por:
i
Rû (α) = e− ~ αJ·û (2.2)
em que J é o momentum angular total.
2.1.2 Produto tensorial

Desde que L atua somente em Er e S em Es (o que significa, que todas as componentes de L
comutam com as de S), podemos escrever o operador rotação Rû (α) na forma de um produto
tensorial:
Rû (α) = (r) Rû (α) ⊗ (S) Rû (α) (2.3)
no qual
i i
(r)
Rû (α) = e− ~ αL·û e (S)
Rû (α) = e− ~ αS·û (2.4)
são os operadores de rotação associados com Rû (α) em Er e em Es respectivamente.
Portanto, se realizarmos uma rotação Rû (α) sobre uma partícula de spin 1/2, cujo estado é
representado pelo produto tensorial,
|ψi = |ϕi ⊗ |χi com |ϕi ∈ Er e |χi ∈ Es . (2.5)
seu estado após a rotação será
|ψ 0 i = Rû (α) |ψi =

(r)
Rû (α) |ϕi ⊗ (S) Rû (α) |χi

(2.6)
17
2.1. Operadores de rotação para uma partícula de spin 1/2
2.1.3 Rotação do estado de spin

Como S = ~2 σ, então o operador de rotação toma a forma:
i α
(S)
Rû (α) = e− ~ αS·û = e−i 2 σ·û (2.7)
Para fazermos isso, usamos a definição de um operador exponencial:

α 1 α 2 1 α n
(S)
Rû (α) = 1 − i σ · û + −i (σ · û)2 + . . . + −i (σ · û)n + . . . (2.8)
2 2! 2 n! 2
Agora usando a identidade,
(σ · A)(σ · B) = A · B + iσ · (A × B) (2.9)
e fazendo A = B = û vê-se que

(σ · û)2 = û2 = 1 (2.10)
o que nos leva à 

1 Se n par
(σ · û)n = (2.11)
σ · û Se n ímpar
Portanto, se agruparmos os termos pares e ímpares da expansão anterior
(−1)p α 2p

(S) 1 α 2
Rû (α) = 1 − + ... + + ...
2! 2 (2p)! 2
(−1)p α 2p+1

α 1 α 3
− iσ · û − + ... + + ...
2 3! 2 (2p + 1)! 2
ou seja,
α α
(S)
Rû (α) = cos − iσ · û sen (2.12)
2 2
(S)
Posto dessa forma, agora é fácil calcular a ação do operador Rû (α) sobre um estado de spin
qualquer.
(1/2)
Usando essa expressão, podemos escrever a matriz de rotação Rû (α) explicitamente na
base {|+i , |−i}, como
!
(1/2) cos α2 − iuz sen α2 (−iux − uy ) sen α2
Rû (α) = (2.13)
(−iux + uy ) sen α2 cos α2 + iuz sen α2
2.1.4 Operador associado com uma rotação de 2π

Para um ângulo de rotação α = 2π, a rotação geométrica Rû (α) coincidi, se o vetor û for
unitário, com a rotação identidade. Entretanto, se fizermos α = 2π na eq. (2.12), vemos que:
(S) (S)
Rû (0) = 1 e com Rû (2π) = −1 (2.14)
Portanto, o operador associado com uma rotação de 2π não é o operador identidade, mas o
negativo desse operador. Logo, as leis de transformação de grupo, são conservadas somente

localmente na correspondência entre as rotações geométricas e os operadores de rotação em Es .

Ou seja, somente as leis de transformações infinitesimais são conservadas. Isso , deve-se ao valor
semi-inteiro do momentum angular de spin da partícula em questão.
Da eq. (1.15), vê-se que:
(S)
Rû (4π) = 1
somente uma rotação de 4π é igual a unidade. Isso seria equivalente a estar sobre a superfície
de uma Fita de Möebius.
Figura 2.1: Analogia da invariância por rotação de 4π do spin, (S) R (4π) = 1, com a fita de Möebius.
û
O fato de que o estado de spin muda o sinal durante uma rotação através de um ângulo de
2π não é perturbador, já que os dois vetores de estado diferem somente por um fator de fase
global, tendo as mesmas propriedades físicas. É mais importante estudarmos e compreendermos
como um observável se transforma durante uma rotação como essa.
Considere os autovetor |χn i é submetido a uma rotação tal que
|χ0n i = (S) Rû (α) |χn i (2.15)
e que além disso, ele é uma autovetor do operador A, assim
A |χn i = an |χn i (2.16)
então como deve ser o operador A0 tal que
A0 |χ0n i = an |χ0n i . (2.17)
Substituindo a eq. (2.15) na (2.17), e multiplicando o resultado obtido, a esquerda de ambos os

lados da igualdade, por (S)
Rû† (α) e usando o fato de que os operadores de rotação são unitários,
obtém-se que
(S)
Rû† (α)A0(S) Rû (α) |χn i = an (S) Rû† (α)(S) Rû (α) |χn i = an |χn i (2.18)
da qual, comparando com a (2.16), podemos concluir que
A =(S) Rû† (α)A0(S) Rû (α) (2.19)

ou ainda que
A =(S) Rû† (α)A0(S) Rû (α) (2.20)
ou ainda
A0 =(S) Rû (α)A(S) Rû† (α). (2.21)
Desta última expressão segue então que:
A0 =(S) Rû (2π)A (S) Rû† (2π) = A (2.22)
Esse resultado é totalmente satisfatório, já que uma rotação através de 2π não pode modificar
o dispositivo de medida de A. Portanto, o espectro de A0 deve permanecer o mesmo de A.
Note que já mostramos anteriormente que
(r)
Rû (2π) = 1 (2.23)
portanto, temos que no espaço de estado global E = Er ⊗ Es , assim com em Es que
Rû (2π) = (r) Rû (2π) ⊗ (S) Rû (2π) = −1 (2.24)
2.1.5 Natureza vetorial versus rotação

Considere o estado de spin |χi arbitrário. Mostramos
que, a menos de um fator de fase global, há dois ângulos z
θ e ϕ tais que |χi pode ser reescrito como:
θ θ v = êz
|χi = e−iϕ/2 cos |+i + eiϕ/2 sen |−i (2.25)
2 2
v0
o que significa que |χi é um autovetor associado com o u
autovalor +~/2 da componente S · v do spin S ao longo
θ
do vetor unitário v definido pelos ângulos polares θ e ϕ.
Chamaremos de v0 o resultado da transformação de
v pela rotação em questão. Desde que S é um observá-
vel vetorial, o estado |χ0 i após a rotação deve ser um
ϕ
autovetor com um autovalor de +~/2, da componente y
0 0
S · v do spin S ao longo do vetor unitário v :
|χi = |+iv =⇒ |χ0 i = R |χi ∝ |+iv0 (2.26) x

Figura 2.2: Rotação de um vetor em
com torno de um eixo.
0
v = Rv (2.27)
Aqui iremos simplesmente fazer uma verificação desse resultado, para um caso bem específico.
Portanto, considere o caso em que o vetor v é um vetor unitário ao longo do do eixo Oz , ou
seja, ele é dado por v = êz e que por sua vez o vetor v0 é um vetor unitário arbitrário, com
ângulos polares θ e ϕ.

O vetor v0 é obtido a partir do vetor v = êz por uma rotação através de um ângulo θ em
torno do vetor unitário û, o qual é fixado pelos ângulos polares:
π π
θû = e ϕû = ϕ + (2.28)
2 2
Portanto, devemos mostrar que:
(S)
Rû (θ) |+i ∝ |+iv0 (2.29)
As componentes cartesianas do vetor û são:
ux = − sen ϕ ; uy = cos ϕ ; uz = 0, (2.30)
(S)
então o operador Rû (θ) pode ser escrito, usando a eq. (2.12) como
(S) θ θ
Rû (θ) = cos − iσ · û sen (2.31)
2 2
θ θ
= cos − i (−σx sen ϕ + σy cos ϕ) sen (2.32)
2 2
θ 1 θ
σ+ e−iϕ − σ− eiϕ sen

= cos − (2.33)
2 2 2
com
σ± = σx ± iσy (2.34)
Entretanto como
σ+ |+i = 0 e que σ− |+i = 2 |−i (2.35)
(S)
então, o resultado da transformação do |+i pelo operador Rû (θ) é:
(S) θ θ
Rû (θ) |+i = cos |+i + eiϕ sen |−i (2.36)
2 2
O qual, a menos de um fator de fase, é o ket |+iv0 :
(S)
Rû (θ) |+i = eiϕ/2 |+iv0 (2.37)
2.1.6 Rotação de um spinor com duas componentes

Para um partícula de spin 1/2 cujo estado é representado pelo ket |ψi do espaço de estado
E = Er ⊗ Es . O ket |ψi pode ser representado pelo spinor [ψ](r), de componentes
ψε (r) = hr, ε| ψi . (2.38)
Se realizarmos uma rotação geométrica arbitrária R sobre esta partícula, seu estado torna-se:
|ψ 0 i = R |ψi (2.39)
com
R =(r) R ⊗ (S)
R (2.40)

é em E o operador associado com a rotação geométrica R. Como é o spinor [ψ 0 ](r), o qual

corresponde ao estado |ψ 0 i obtido do spinor [ψ](r) ?
Note que como
ψε0 (r) = hr, ε| ψ 0 i = hr, ε| R |ψi (2.41)
ao inserirmos uma completeza relativa a base {|r0 , ε0 i} entre R e |ψi, obtemos:

Xˆ
0
ψε (r) = d3 r0 hr, ε| R |r0 , ε0 i hr0 , ε0 | ψi . (2.42)
ε0
Agora, desde que os vetores da base {|r, εi} são dados por um produto tensorial, então os
elementos de matriz do operador R nessa base pode ser decomposto na seguinte forma:
hr, ε| R |r0 , ε0 i = hr|(r) R |r0 i hε|(S) R |ε0 i (2.43)
como já sabemos que:
hr|(r) R |r0 i = R−1 r r0 i = δ r0 − (R−1 r)

(2.44)
e introduzindo a notação
(1/2)
hε|(S) R |ε0 i = Rε,ε0 (2.45)
temos que
(1/2)
ψε0 (r) = Rε,ε0 ψε0 (R−1 r)
P
(2.46)
ε0
Mais explicitamente, temos

! (1/2) (1/2)
! !
0
ψ+ (r) R+,+ R+,− ψ+ (R−1 r)
0
= (1/2) (1/2) (2.47)
ψ− (r) R−,+ R−,− ψ− (R−1 r)

Capítulo 3
Adição de Momenta Angulares
3.1 Adição de Momenta Angulares: Caso clássico

Considere um sistema formado por um número n qualquer de partículas, e seja mi a massa
da partícula i (i = 1, 2, . . . , n), cujos vetores posição e velocidade em relação a uma dada origem
O no instante t são respectivamente ri (t) e vi (t). O momentum angular total do sistema em
relação a origem O do sistema de coordenadas é
r4 r5
ri
r1 r
r2 3
y
x
Figura 3.1: Aqui temos um sistema composto por n partículas, e cada uma com o vetor posição ri e
velocidade vi dados em relação a origem do sistema de coordenadas.
n
X n
X
L= ri ×pi = mi ri ×vi (3.1)
i=1 i=1
Em geral, como no caso de uma partícula, L depende do ponto O em relação ao qual é

tomado. Para o momentum linear total P do sistema obtém-se uma simplificação considerável
23
3.1. Adição de Momenta Angulares: Caso clássico
nas equações do sistema, ao tomar-se a origem O do sistema de coordenadas no centro de massa

(CM) do sistema de partículas, cujo vetor posição R é dado por
n
1 X m1 r1 + m2 r2 + · · · + mn rn
R= mi ri = (3.2)
M i=1 m1 + m2 + · · · + mn
Se r0i e vi0 são os vetores posição e velocidade da partícula i em relação ao CM, temos então que
n
X
ri = r0i + R =⇒ mi r0i = 0, (3.3)
i=1
n
X n
X
vi = vi0 + V =⇒ mi vi0 = p0i = 0, (3.4)
i=1 i=1
n
X dR
P=V mi = M V = M , (3.5)
i=1
dt
na qual V é a velocidade do CM. A eq. (3.4) significa que o momentum linear do movimento
interno, ou seja, o momentum resultante em relação ao CM, se anula. Já a eq. (3.5) nos diz que
o CM move-se como se o momentum total P do sistema estivesse concentrado todo nele.
Para ver o que ocorre com o momentum angular total L, basta substituir (3.3) e (3.4) em
(3.1):
n
X
L = mi (r0i + R) × (vi0 + V)
i=1
n n
!
X X
= mi r0i × vi0 + R× mi vi0 +
i=1 i=1
n
! n
X X
mi r0i ×V+ mi R × V
i=1 i=1
Usando (3.3) e (3.4), obtemos

L = L0 + R×P, (3.6)
em que,
n
X n
X
0
L = mi r0i × vi0 = r0i × p0i (3.7)
i=1 i=1
é o momentum angular total do sistema em relação ao CM e R×P é o momentum angular do

CM em relação a O, considerado como se o momentum total P do sistema estivesse concentrado
nele.
Note que,
• chamamos de L0 o momentum angular interno do sistema e R×P de momentum angular

externo.

• se o CM do sistema de partículas está em repouso (P = 0), temos
L = L0 (CM em Repouso) (3.8)
o que é independente da escolha do ponto de referência O, pois corresponde ao momentum

angular interno.
• ao contrário do momentum linear do movimento interno (relativo ao CM), que sempre

se anula (cf. eq. (3.4)), o momentum angular L0 do movimento interno em geral não se
anula.
3.1.1 Lei Fundamental da Dinâmica das Rotações

O análogo da segunda lei de Newton para rotações, a lei fundamental da dinâmica das
rotações para uma partícula é
dL
τ = r×F = , em que L = r×p, (3.9)
dt
a qual, iremos aplicar a um sistema de muitas partículas.

Derivando (3.1) com relação ao tempo obtemos que
n
! n n
dL d X X dri X dvi
= mi ri × vi = mi × vi + mi ri × ,
dt dt i=1 i=1
dt i=1
dt
logo
n n
dL X dvi X
= mi ri × = mi ri × ai . (3.10)
dt i=1
dt i=1
Se o referencial é inercial, podemos aplicar a segunda lei de Newton a partícula i, escrevendo
n
X
mi ai = FExt.
i + Fij (i = 1, 2, . . . , N ) (3.11)
j=1
j6=i
na qual Fij é a força interna sobre a partícula i devido a partícula j.

Substituindo (3.11) em (3.10) obtemos,
n n n n n n
dL X XX X XX
= ri ×FExt.
i + r i ×F i,j = τ Ext.
i + ri ×Fij (3.12)
dt i=1 i=1 j=1 i=1 i=1 j=1
j6=i j6=i
A dupla somatória em (3.12) pode ser escrita como,

n X
n n n
X 1X X
ri ×Fi,j = [ri ×Fi,j + rj ×Fj,i ] (3.13)
i=1 j=1
2 i=1 j=1
j6=i j6=i

mi Fij
rij = ri − rj
ri
Fji
O rj mj
Figura 3.2: Força de interação entre duas partículas de massas mi e mj , cuja a linha de ação está
dirigida segundo a linha que une as duas partículas.
da terceira lei de Newton temos que Fi,j = −Fj,i , logo

n X
n n n
X 1X X
ri ×Fij = (ri − rj )×Fij (3.14)
i=1 j=1
2 i=1 j=1
j6=i j6=i
Considerando que as forças internas de interação entre partículas são tais que sua linha de
ação está dirigida segundo a linha que une as duas partículas, ou seja, Fij é paralela ao vetor
(ri − rj ) o que implica (ri − rj )×Fij = 0, então
n X
n n n
X 1X X
ri ×Fij = (ri − rj )×Fij = 0 (3.15)
i=1 j=1
2 i=1 j=1
j6=i j6=i
Logo, o resultante interno dos torques internos do sistema é nulo. Este resultado permanece
válido em condições mais gerais, sem que seja preciso fazer a hipótese acima sobre a linha de
ação das forças de interação.
Substituindo (3.15) em (3.12), obtemos
n n
dL X X
= ri ×FExt.
i = τiExt. = τ Ext. (3.16)
dt i=1 i=1
que é a lei fundamental da dinâmica das rotações para um sistema de partículas: a taxa de
variação com o tempo do momento angular total do sistema em relação a um ponto O (num
referencial inercial) é igual à resultante de todos os torques externos em relação a O que atuam
sobre o sistema.
A restrição a um referencial inercial decorre de termos usado a 2a¯ lei de Newton em (3.11).
O referencial do CM não é necessariamente inercial: se a resultante das forças externas não se
anula, o CM tem uma aceleração A dada por
dP
= M A = FExt. (3.17)
dt
Apesar disto, vamos mostrar que (3.16) permanece válida quando referida ao CM, mesmo que
ele esteja acelerado. Para isto voltemos à (3.10), que vale em qualquer referencial, e apliquemo-la
ao referencial do CM: n n
dL0 X 0 dvi0 X
= mi ri × = mi r0i × a0i . (3.18)
dt i=1
dt i=1

Se ai é a aceleração da partícula i num referencial inercial, dada por (3.11), temos, por (3.4),
ai = a0i + A, (3.19)
de modo que a eq. (3.18) pode ser reescrita como

n n
!
dL0 X X
= mi r0i × ai − mi r0i ×A
dt i=1 i=1
n n
!
X X
= r0i ×(mi ai ) − mi r0i ×A
i=1 i=1
usando (3.3) e (3.11), podemos reescrever a equação anterior como

n n n
dL0 X 0 XX
= ri ×FExt.
i + r0i ×Fi,j (3.20)
dt i=1 i=1 j=1
j6=i
Note que o último termo de (3.20) se anula pelo mesmo argumento empregado para obter a eq.
(3.16). Portanto, por (3.3), r0i − r0j = ri − rj , de modo que a demonstração permanece válida.
Obtemos então n n
dL0 X 0 X Ext.
= ri ×FExt.
i = τi0 Ext. = τ 0 (3.21)
dt i=1 i=1
em que τ 0Ext. é a resultante dos torques externos em relação ao CM. Vemos portanto que a eq.
(3.16) permanece válida com relação ao CM, mesmo que este esteja acelerado.
3.1.2 Conservação do Momentum Angular: Simetrias e as leis de

conservação
A lei de conservação do momentum angular para qualquer sistema de partículas decorre da
eq. (3.16), assim
τ 0Ext. = 0 ⇐⇒ L = L0 = constante (3.22)
ou seja, se a resultante dos torques externos em relação a um dado ponto se anula, então o
momentum angular do sistema em relação a esse ponto se conserva.
Os principais resultados vistos foram:
• Quando o τ 0Ext. = 0 na ausência de forças externas, ou seja, para um sistema isolado;

neste caso, como o torque é nulo em relação a qualquer ponto do espaço, o momentum
angular em relação a qualquer ponto se conserva.
• A eq. (3.22) é uma lei de conservação vetorial. Isto significa que a conservação de L
implica na:
– conservação de seu módulo, direção e sentido.

– que ela se aplica separadamente a cada componente.

3.2. Momentum Angular Na Mecânica Quântica
• Se uma dada componente do torque resultante se anula, a componente correspondente do

momento angular total se conserva, independentemente do que se sucede com as demais.
Sabe-se da mecânica clássica que as lei de conservação do momentum angular está a uma
simetria espacial, ou seja, com a isotropia espacial. Portanto, em um sistema físico cujo o espaço
é isotrópico o momentum angular do sistema é conservado.
3.2 Momentum Angular Na Mecânica Quântica

Agora veremos como tratar um sistema de partículas na mecânica quântica. Considere o
caso de duas partículas não-interagentes, cujo o Hamiltoniano do sistema na representação
{|r1 , r2 i} é:
~2 2
H0 = H1 + H2 com Hi = − ∇ + V (Ri ) i = 1, 2 (3.23)
2µi i
em que para cada partícula i temos que, µi é sua massa, Ri é o operador posição, V (Ri ) é o
potencial central sob o qual ela está submetida e ∇i é o operador Laplaciano atuando sobre
suas coordenadas.
Ao estudarmos momentum angular, foi deixado como exercício demostrar os seguintes
comutadores:
[Lk , Pj ] = i~kjn Pn e [Lk , Rj ] = i~kjn Rn (3.24)
e que
Lk , P2 = Lk , R2 = [Lk , R · P] = 0.

(3.25)
Como o comutador
1 Rj
, Pj = −i~ , (3.26)
Rn Rn+2
segue então que

1
, Lj = 0. (3.27)
Rn
Dessas relações de comutação segue-se imediatamente, que as três componentes do operador
Li comuta com Hi , ou seja,
[Li , Hi ] = 0 com i = 1, 2 (3.28)
portanto, cada uma das três componentes Li do operador momentum angular L são constantes
do movimento.
Agora considere o caso clássico em que as duas partículas interagem e que a correspondente
energia potencial da interação U (r1 , r2 ) depende somente da distância entre elas, ou seja,
U (r1 , r2 ) = U (|r1 − r2 |) (3.29)
no qual
p
|r1 − r2 | = (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 . (3.30)

Nesse caso, o Hamiltoniano do sistema é dado por
H = H1 + H2 + U (|R1 − R2 |) = H0 + U (|R1 − R2 |). (3.31)
Portanto, agora temos que o comutador de Li com H reduz-se a forma
[Li , H] = [Li , U (|R1 − R2 |)]. (3.32)
o qual em geral é diferente de zero. Note que para a componente Liz , em coordenadas cartesianas
temos:
~ ∂U ∂U
[Liz , H] = [Liz , U (|R1 − R2 |)] = xi − yi . (3.33)
i ∂yi ∂xi
Em geral temos que
[Li , H] 6= 0 e [Liz , H] = [Liz , U (|R1 − R2 |)] 6= 0, (3.34)
logo Li não é mais uma constante de movimento.

Por outro lado, as componentes do operador momentum angular total L,
L = L1 + L2 (3.35)
são constantes do movimento, pois, note por exemplo que
[Lz , H] = [L1z + L2z , H] = [L1z + L2z , U (|R1 − R2 |)]

~ ∂U ∂U ∂U ∂U
= x1 − y1 + x2 − y2 ,
i ∂y1 ∂x1 ∂y2 ∂x2
porém como na representação das coordenadas U = U (|r1 − r2 |) = U (r), temos que
∂U ∂U ∂r ∂U x1 − x2
= =
∂x1 ∂r ∂x1 ∂r r
∂U ∂U ∂r ∂U x1 − x2
= =− .
∂x2 ∂r ∂x2 ∂r r
Portanto,

~ ∂U y1 − y2 x1 − x2 y1 − y2 x1 − x2
[Lz , H] = x1 − y1 − x2 + y2
i ∂r r r r r
~ 1 ∂U
= [(x1 − x2 )(y1 − y2 ) − (y1 − y2 )(x1 − x2 )]
i r ∂r
= 0. (3.36)
Portanto, pode-se concluir que as componentes do momentum angular total são constantes do
movimento.
3.2.1 Considerações
Note que:

1. Até o momento não mencionamos o spin das partículas.
2. Se considerarmos uma partícula com spin s num campo de força central U (R), cujo
Hamiltoniano é H e o seu momentum angular orbital é L, temos que
[L, H] = 0; [S, H] = 0 e [L, S] = 0. (3.37)
Posteriormente, veremos que ao introduzirmos correções relativísticas no Hamiltoniano da

partícula, surgirá um termo chamado acoplamento spin-órbita cuja a forma é a seguinte,
Hso (r) = ξ(R)L · S. (3.38)
Nessa expressão ξ(R) é uma função conhecida e de uma única variável, o operador R.
Ao introduzirmos essa correção, devido ao acoplamento spin-órbita, na Hamiltoniana H do
sistema, vemos que os operadores L e S não comutam mais com o Hamiltoniano H.
Por exemplo, observe que,
[Lz , Hso ] = ξ(r)[Lz , Lx Sx + Ly Sy + Lz Sz ]

= ξ(r) ([Lz , Lx ]Sx + [Lz , Ly ]Sy ))
= i~ξ(r) (Ly Sx − Lx Sy )) (3.39)
e de modo similar que
[Sz , Hso ] = ξ(r)[Sz , Lx Sx + Ly Sy + Lz Sz ]

= ξ(r) (Lx [Sz , Sx ] + Ly [Sz , Sy ]))
= i~ξ(r) (Lx Sy − Ly Sx )) (3.40)
Definindo operador momentum angular total da partícula como sendo
J = L + S, (3.41)
vemos que
[Jz , H] = [Lz + Sz , H] = 0. (3.42)
Logo como as componentes do operador J comutam com o Hamiltoniano, então ele é uma
constante do movimento.
3.2.2 Momentum angular total de duas partículas

Considere agora o caso de duas partículas com spin de momentum angular total J = J1 + J2 ,
para o qual temos que
[J1 , H] 6= 0; [J2 , H] 6= 0; e [J1 , J2 ] = 0. (3.43)
[J21 , H] 6= 0; [J22 , H] 6= 0; e [J21 , J22 ] = 0. (3.44)

3.3. Adição de dois Spin 1/2: Método elementar
Portanto, escolher os operadores J1z , J21 , J2z e J22 como C.S.C.O não é uma boa escolha apesar
de formarem uma base de autovetores comuns. Note que nem J1 e nem J2 são constantes do
movimento, porém o operador
J = J1 + J2 , (3.45)
é uma constante de movimento, pois
[J, H] = 0 e [J2 , H] = 0. (3.46)
Portanto, usando a base formada pelos autovetores comuns dos operadores J1z , J21 , J2z e J22 ,
tentaremos construir uma nova base formado pelos autovetores comuns dos operadores de Jz e
J2 , ou seja,
{J1z , J21 , J2z , J22 } =⇒ {Jz , J2 }
3.2.3 Base em termos de Jz e J2

Quanto a essa nova base podemos concluir que:
• Para determinar os estados estacionários do sistema, isto é, os autoestados de H, é mais

simples diagonalizar a matriz que representa H nessa nova base.
• Como [Jz , H] = [J2 , H] = 0, a matriz H pode ser ser dividida em blocos associados aos
auto-subespaços dos vários conjuntos de autovalores de Jz e J2 .
• A estrutura da matriz H é mais simples nessa base do que na base dos autovetores comuns
de J1z , J21 , J2z e J22 , já que em geral nem J1z e nem J2z comutam com H.
3.3 Adição de dois Spin 1/2: Método elementar
3.3.1 Formulação do problema: Espaço de estados

Considere um sistema composto por duas partículas de spin s = 1/2 (por exemplo, elétrons
ou átomos de prata em seu estado fundamental), para o qual o spin será o único grau de
liberdade da partícula. Seja S1 e S2 os operadores de spin das duas partículas, para os quais
temos
S2i |si , mi i = ~2 si (si + 1) |si , mi i com (i = 1, 2) (3.47)
e
Siz |si , mi i = ~mi |si , mi i com (i = 1, 2). (3.48)
O espaço de estado desse sistema, será constituído pelo produto tensorial do espaço de estado
de cada partícula, assim
|s1 , m1 ; s2 , m2 i ≡ |s1 , m1 i ⊗ |s2 , m2 i (3.49)

Agora, para não carregarmos a notação usaremos a seguinte notação:
|ε1 i = |s1 , m1 i |ε2 i = |s2 , m2 i (3.50)
|ε1 , ε2 i = |s1 , m1 ; s2 , m2 i = |s1 , m1 i ⊗ |s2 , m2 i (3.51)
3.3.2 O Espaço de Estados

Para sistema como o descrito acima, o seu espaço de estados já foi definido, e de acordo com
o que foi visto, ele é um espaço quadridimensional, resultante do produto tensorial dos dois
espaço de estado de spin de cada partícula.
A base ortonormal para esse espaço será:
{|ε1 , ε2 i} = {|+, +i , |+, −i , |−, +i , |−, −i} (3.52)
Note que o spin da cada partícula pode ser si = 1/2, logo o spin total será s = 0, 1. Nessa
notação os possíveis valores para ε1 e ε2 são:
ε1 = ±1 e ε2 = ±1 (3.53)
Esses vetores são os autoestados dos quatro observáveis:
{S21 , S22 , S1z , S2z } (3.54)
para os quais temos que

3
S21 |ε1 , ε2 i = S22 |ε1 , ε2 i = ~2 |ε1 , ε2 i (3.55)
4
1 1
S1z |ε1 , ε2 i = ε1 ~ |ε1 , ε2 i e S2z |ε1 , ε2 i = ε2 ~ |ε1 , ε2 i (3.56)
2 2
Portanto, S21 , S22 , S1z e S2z formam um C.S.C.O. Note que os dois primeiros observáveis são
realmente múltiplos do operador identidade, e o conjunto de operadores restante permanecerá
completamente regular se eles dois forem omitidos.
3.3.3 O Spin Total S: Relações de comutação

Definimos o spin total S do sistema como sendo
S = S1 + S2 (3.57)
Sabendo que tanto S1 quanto S2 são momenta angulares regulares, mostrar que S também o é,
é simples. Basta mostrar que suas componentes satisfazem as mesmas relações de comutação
que S1 e S2 .
Devemos lembrar que:

k = 1, 2
[S1 , S2 ] = 0 e [Skα , Skβ ] = i~α,β,γ Skγ com
α, β, γ = x, y, z.

Para isso, considere o comutador
[Sα , Sβ ] = [S1α + S2α , S1β + S2β ] com α, β, γ = x, y, z.

= [S1α , S1β ] + [S2α , S2β ]
= i~α,β,γ S1γ + i~α,β,γ S2γ
= i~α,β,γ Sγ
O operador S2 é dado por
S2 = (S1 + S2 )2 = S21 + S22 + 2S1 · S2 (3.58)
já que [S1 , S2 ] = 0. O produto escalar S1 · S2 pode ser expresso em termos das componentes dos
respectivos operadores,
S1 · S2 = S1x S2x + S1y S2y + S1z S2z (3.59)
mas como 
S
kx = 21 (Sk+ + Sk− )
Sk± = Skx ± iSky (3.60)
1
S
ky = 2i
(Sk+ − Sk− )
então podemos escrever
1
S1 · S2 = [(S1+ + S1− )(S2+ + S2− ) − (S1+ − S1− )(S2+ − S2− )] +
4
S1z S2z
1
= [S1+ S2+ + S1+ S2− + S1− S2+ + S1− S2− −
4
S1+ S2+ + S1+ S2− + S1− S2+ − S1− S2− ] + S1z S2z
1
= (S1+ S2− + S1− S2+ ) + S1z S2z
2
Portanto, podemos escrever
S2 = (S1 + S2 )2 = S21 + S22 + 2S1z S2z + S1+ S2− + S1− S2+ (3.61)
Note que como,

[S1 , S21 ] = [S2 , S22 ] = [S21 , S22 ] = [S1 , S2 ] = 0. (3.62)
logo temos que

[Sz , S21 ] =0 [Sz , S22 ]=0 
[S2 , S21 ] =0 2 2
[S , S2 ] = 0 (3.63)

[Sz , S1z ] = 0 [Sz , S2z ] = 0

Além disso, S2 não comuta com S1z e nem com S2z , assim
[S2 , S1z ] = [S21 + S22 + 2S1 · S2 , S1z ]

= 2[S1 · S2 , S1z ]
= 2[S1x S2x + S1y S2y + S1z S2z , S1z ]
= 2 ([S1x , S1z ]S2x + [S1y , S1z ]S2y + [S1z , S1z ]S2z )
= 2i~ (−S1y S2x + S1x S2y ) (3.64)

Analogamente temos que,
[S2 , S2z ] = [S21 + S22 + 2S1 · S2 , S2z ]

= 2[S1 · S2 , S2z ]
= 2[S1x S2x + S1y S2y + S1z S2z , S2z ]
= 2 (S1x [S2x , S2z ] + S1y [S2y , S2z ] + S1z [S2z , S2z ])
= 2i~ (−S1x S2y + S1y S2x ) (3.65)
Note, portanto que como Sz = S1z + S2z , então
[S2 , Sz ] = [S2 , S1z + S2z ]

= [S2 , S1z ] + [S2 , S2z ]
= 2i~ (−S1y S2x + S1x S2y − S1x S2y + S1y S2x )
= 0. (3.66)
Note que S2 não comuta nem com S1z e nem com S2z , porém ele comuta com Sz = S1z + S2z ,
que é a soma dos dois.
3.3.4 Mudança de base a ser realizada

A base
{|ε1 , ε2 i} = {|+, +i , |+, −i , |−, +i , |−, −i} (3.67)
como vimos é composta pelos autovetores comuns do C.S.C.O:
{S21 , S22 , S1z , S2z } (3.68)
Foi mostrado que os quatro observáveis,
{S21 , S22 , S2 , Sz } (3.69)
comutam, portanto eles também formam um C.S.C.O.

Ao adicionarmos duas partículas de spin S1 e S2 , levando em conta somente o grau de
liberdade de spin, podemos construir um base ortonormal baseada no conjunto de observáveis
(3.69). O vetores de estado dessa base será
{|S, M i}, (3.70)
na qual os autovalores de S21 e S22 permanecem intrinsecamente os mesmos. Portanto, os vetores

|S, M i , satisfazem as seguintes relações
3


 S21 |S, M i = S22 |S, M i = ~2 |S, M i

 4
2 2
S |S, M i = S(S + 1)~ |S, M i (3.71)



Sz |S, M i = M ~ |S, M i


Sabemos que S é um momentum angular, consequentemente S deve ser um número inteiro

ou semi-inteiro, e além disso M deve variar de −S até S com um passo unitário.
Agora o problema é encontrar quais os valores que S e M podem ter para podermos expressar
os vetores |S, M i em termos daqueles da base conhecida |ε1 , ε2 i.
3.3.5 Os autovalores de Sz e o seus graus de degenerescência

Como os observáveis S21 e S22 são facilmente tratados, pois possuem sempre o mesmo autovalor,
logo todos os vetores da base {|S, M i} serão autovetores deles.
Como Sz comuta com os quatro observáveis {S21 , S21 , S1z , S2z }, então os vetores da base
|ε1 , ε2 i serão automaticamente autovetores de Sz . Assim
1
Sz |ε1 , ε2 i = (S1z + S2z ) |ε1 , ε2 i = (ε1 + ε2 )~ |ε1 , ε2 i (3.72)
2
portanto |ε1 , ε2 i é um autoestado de Sz com autovalor:
1
M = (ε1 + ε2 ) (3.73)
2
Desde que ε1 = ±1 e ε2 = ±1, segue que os possíveis valores de M são: M = −1, 0, 1,.
Note que os valores M = 1 e M = −1 não são degenerados. Somente um único autovetor
corresponde a cada um deles.
1 1
Sz |+, +i = ( + )~ |+, +i = ~ |+, +i
2 2 (3.74)
1 1
Sz |−, −i = (− − )~ |−, −i = −~ |−, −i
2 2
Porém, M = 0 é duplamente degenerado, logo
1 1
Sz |+, −i = ( − )~ |+, −i = 0
2 2 (3.75)
1 1
Sz |−, +i = (− + )~ |−, +i = 0.
2 2
Portanto, qualquer combinação linear desses dois vetores é um autoestado de Sz com autovalor
0.
Esses resultados aparecem claramente na representação matricial de Sz na base |ε1 , ε2 i
 
h+, +|Sz |+, +i h+, +|Sz |+, −i h+, +|Sz |−, +i h+, +|Sz |−, −i
 
h+, −|Sz |+, +i h+, −|Sz |+, −i h+, −|Sz |−, +i h+, −|Sz |−, −i
(Sz ) = ~ 
h−, +|S |+, +i h−, +|S |+, −i h−, +|S |−, +i h−, +|S |−, −i
 (3.76)
 z z z z 
h−, −|Sz |+, +i h−, −|Sz |+, −i h−, −|Sz |−, +i h−, −|Sz |−, −i
 
1 0 0 0
 
0 0 0 0 
(Sz ) = ~ 
  (3.77)
 0 0 0 0 

0 0 0 −1

3.3.6 Diagonalização de S2
Tudo que resta a ser feito é diagonalizar a matriz que representa S2 na base |ε1 , ε2 i. Já
sabemos que ela não é diagonal.
3.3.6.1 Cálculo dos elementos de matriz de S2
Usaremos seguinte expressão:
S2 = S21 + S22 + 2S1z S2z + S1+ S2− + S1− S2+ (3.78)
e além disso, usaremos o fato de que:
S+ |+i = 0 |+i S+ |−i = ~ |+i

(3.79)
S− |+i = ~ |−i S− |−i = 0
Logo,

2 3 2 3 2 1
S |+, +i = ~ + ~ |+, +i + ~2 |+, +i = 2~2 |+, +i
4 4 2

2 3 2 3 2 1
S |+, −i = ~ + ~ |+, −i − ~2 |+, −i + ~2 |−, +i = ~2 (|+, −i + |−, +i) .
4 4 2
(3.80)
2 3 2 3 2 1
S |−, +i = ~ + ~ |−, +i − ~2 |−+i + ~2 |+, −i = ~2 (|−, +i + |+, −i) .
4 4 2

2 3 2 3 2 1
S |−, −i = ~ + ~ |−, −i + ~2 |−, −i = 2~2 |−, −i
4 4 2
3.3.6.2 Matriz S2
 
h+, +|S2 |+, +i h+, +|S2 |+, −i h+, +|S2 |−, +i h+, +|S2 |−, −i
2 2 2 2
 
 h+, −|S |+, +i h+, −|S |+, −i h+, −|S |−, +i h+, −|S |−, −i 
(S2 ) = ~ 
h−, +|S2 |+, +i h−, +|S2 |+, −i h−, +|S2 |−, +i h−, +|S2 |−, −i
 (3.81)
 
2 2 2 2
h−, −|S |+, +i h−, −|S |+, −i h−, −|S |−, +i h−, −|S |−, −i
 
2 0 0 0
 
2 2
 0 1 1 0 
(S ) = ~ 
 0 1 1 0

 (3.82)
 
0 0 0 2
Comentários:
• Os zeros já eram esperados, pois os autovetores |+, +i e |−, −i não possuem autovalores
degenerados para Sz .
• Como S2 comuta com Sz , ela portanto, terá elementos de matriz não-nulos somente entre
os autovetores de Sz associados com o mesmo autovalor, ou seja, os degenerados.

3.3.6.3 Autovalores e autovetores de S2
A matriz (S2 ) pode ser dividida em três submatrizes, como mostradas, sendo duas delas
unidimensionais, pois os vetores |+, +i e |−, −i são autovetores de S2 , e ambos possuem o
mesmo autovalor 2~2 .
Para encontrarmos os outros dois autovetores de (S2 ), devemos diagonalizar a submatriz
2 × 2: !
1 1
(S2 )0 = ~2 (3.83)
1 1
a qual representa S2 no subespaço bidimensional expandido pelos vetores |+, −i e |−, +i, isto é,
o subespaço de Sz correspondendo aos autovalores com M = 0. Os autovalores da submatriz
(3.83) são obtidos resolvendo a equação (S2 )0 |ψiλ = ~2 λ |ψiλ , ou na forma matricial
! ! !
1 − λ 1 a 1 − λ 1
~2 = 0 =⇒ det =0 (3.84)
1 1−λ b 1 1−λ
Resolvendo a equação característica, obtemos que


0
(1 − λ)2 − 1 = 0 =⇒ λ= (3.85)
2
Portanto, os autovalores de S2 são 0 e 2~2 . Bom agora devemos encontrar seus respectivos
autovetores. Para isso Considere inicialmente o caso em que λ = 0, para o qual
|ψiλ=0 = a |+, −i + b |−, +i e S2 |ψi = ~2 λ |ψi (3.86)
logo, na forma matricial temos

! ! ! !
1−λ 1 a 1 1 a
~2 =0 ou =0 (3.87)
1 1−λ b 1 1 b
Essa equação fornece duas equações idênticas
a+b=0 =⇒ a = −b (3.88)
Nesse caso, precisamos de uma condição extra, que é o fato de hψ | ψi = 1, ou seja, a normalização
de |ψi. Essa condição leva a
|a|2 + |b|2 = 1 (3.89)
Usando o fato de que a = −b, na equação anterior, obtemos que

1 1
a= √ e b = −√ (3.90)
2 2
Portanto,
1
|ψiλ=0 = √ (|+, −i − |−, +i) Autovalor 0 (3.91)
2

Note que, este também é um autovetor Sz = S1z + S2z com autovalor,
1
Sz |ψiλ=0 = √ (Sz |+, −i − Sz |−, +i)
2

1 1 1 1 1
= √ + ~ |+, −i − ~ |+, −i + ~ |−, +i − ~ |−, +i
2 2 2 2 2
=0. (3.92)
Então o autovalor de Sz desse autovetor é zero.

Para λ = 2 temos que
|ψiλ=2 = a |+, −i + b |−, +i e S2 |ψi = ~2 λ |ψi (3.93)
logo, na forma matricial temos

! ! ! !
1−λ 1 a −1 1 a
~2 =0 ou =0 (3.94)
1 1−λ b 1 −1 b
Essa equação fornece duas equações idênticas
a−b=0 =⇒ a=b (3.95)
Com a normalização |a|2 + |b|2 = 1, e o fato de que a = b, temos
1 1
a= √ e b= √ (3.96)
2 2
Portanto,
1
|ψiλ=2 = √ (|+, −i + |−, +i) Autovalor 2~2 (3.97)
2
Note que, este também é um autovetor Sz = S1z + S2z e que o seu autovalor é dado por
1
Sz |ψiλ=2 = √ (Sz |+, −i + Sz |−, +i)
2

1 1 1 1 1
=√ ~ |+, −i − ~ |+, −i − ~ |−, +i + ~ |−, +i
2 2 2 2 2
= 0. (3.98)
Então o autovalor de Sz desse autovetor é também é zero.

Nota
• O operador S2 possui somente dois autovalores distintos: 0 e 2~2 .
• O autovalor 0 de S2 é não-degenerado.
• O autovalor 2~2 de S2 é triplamente degenerado.

3.3.7 Resultado: estados tripletos e singletos

Obtivemos todo o espectro de autovalores de S2 e Sz , e como na base {|S, M i} temos
S2 |S, M i = S(S + 1)~2 |S, M i ; Sz |S, M i = M ~ |S, M i (3.99)
então temos que S(S + 1) = 0 o que significa S = 0 ou S(S + 1) = 2 o que significa S = 1. O

valor S = 0 está associado com um único vetor da base |ε1 , ε2 i, que também é um autovetor
de Sz , com autovalor M = 0. Já que ele é uma combinação linear de |+, −i e |−, +i, podemos
chamá-lo na base {|S, M i} de |0, 0i, assim
1
|0, 0i = √ (|+, −i − |−, +i) (3.100)
2
e os outros três vetores para S = 1 e com diferentes valores de M são:
|1, 1i = |+, +i
1
|1, 0i = √ (|+, −i + |−, +i) (3.101)
2
|1, −1i = |−, −i
Pode-se mostrar facilmente que,
• os quatro vetores |S, M i anteriores formam uma base ortonormal. Ao especificarmos os

valores de S e M , selecionamos um único vetor de estado dessa base.
• que S2 e Sz constituem um C.S.C.O. no qual poderia ser incluído os operadores S21 e S22 ,
embora não seja necessário.
Quando adicionamos dois spins 1/2 (s1 = s2 = 1/2) o número quântico S que caracteriza os
autovalores S(S + 1)~2 dos autovetores |S, M i do observável S2 , pode ter dois valores: 0 ou 1.
Com cada um desses valores de S está associado uma família de (2S + 1) vetores de estado
ortogonais (três para S = 1 e um S = 0) correspondendo aos (2S + 1) valores de M , os quais
são compatíveis com S.
3.3.8 Comentários
1. A família dos três vetores |S = 1, M i, com M = −1, 0, 1, constitui os estados tripletos,
enquanto o vetor |S = 0, M = 0i é chamado de um estado singleto.
2. Os estados tripletos são simétricos com relação a troca de dois spin, enquanto o estado
singleto é anti-simétrico. Isso significa que se cada vetor |ε1 , ε2 i for trocado pelo vetor
|ε2 , ε1 i, os estados tripletos na base {|SM i} permanecerão invariantes enquanto, o estado
singleto irá trocar de sinal.

3.4. Revisão da teoria do momentum angular
3.4 Revisão da teoria do momentum angular

Considere um espaço de estados E, composto pelos autovetores comuns a J2 e Jz , com uma
base {|k, j, mi}, tal que
J2 |k, j, mi = j(j + 1)~2 |k, j, mi
(3.102)
Jz |k, j, mi = m~ |k, j, mi .
Vimos que os operadores J± = Jz ± iJy , atuam sobre os vetores |k, j, mi da seguinte forma
p
J± |k, j, mi = j(j + 1) − m(m ± 1)~ |k, j, m ± 1i . (3.103)
Seja E(k, j) o espaço de estado vetorial expandido pelo conjunto de vetores da base padrão
a qual corresponde aos valores de k e j fixos. Existem (2j + 1) desses vetores, e de acordo com
(3.102) e com (3.103) eles podem ser transformados uns nos outros pela ação dos operadores
J2 , Jz , J+ e J− . Esse espaço de estado pode ser considerado como sendo uma soma direta dos
subespaços ortogonais E(k, j) os quais possuem as seguintes propriedades:
3.5 Propriedades do subespaço E(k, j)

1. E(k, j) é um subespaço (2j + 1)–dimensional.
2. E(k, j) é globalmente invariante sobre a ação de J2 , Jz , J+ e J− , em geral de uma função

qualquer da forma F (J).
3. Os operadores J2 , Jz , J+ , J− e F (J) possuem elementos de matriz não nulos somente

dentro de cada subespaço E(k, j).
4. Dentro de um subespaço E(k, j), os elementos de matriz de uma função qualquer F (J) de
J são independentes de k.
3.6 Espaço de estados de dois momenta angulares

Considere um sistema constituído pela união de dois sistemas, cujos espaços de estados E1 (k, j)
e E2 (k, j), são conhecidos. Esse espaços de estados são dado pela base padrão {|kα , jα , mα i}
composta pelos autovetores comuns dos operadores J2α e Jαz , em que α = (1, 2). Temos que
J2α |kα , jα , mα i = jα (jα + 1)~2 |kα , jα , mα i

Jαz |kα , jα , mα i = mα ~ |kα , jα , mα i (3.104)
p
Jα± |kα , jα , mα i = jα (jα + 1) − mα (mα ± 1)~ |kα , jα , mα ± 1i .
com α = (1, 2).

O espaço de estado do sistema global é dado pelo produto tensorial
E = E1 ⊗ E2 (3.105)

3.6. Espaço de estados de dois momenta angulares
e nessa base os vetores de estado são
|k1 , k2 ; j1 , j2 ; m1 , m2 i = |k1 , j1 , m1 i ⊗ |k2 , j2 , m2 i . (3.106)
Os espaços de estado E1 e E2 podem ser considerados como sendo a soma direta dos subespaços
E1 (k1 , j1 ) e E2 (k2 , j2 ), os quais possuem as propriedades relatadas anteriormente. Assim
X X
E1 = E1 (k1 , j1 ) e E2 = E2 (k2 , j2 ), (3.107)
⊕ ⊕
e consequentemente
X
E= E(k1 , k2 ; j1 , j2 ), com E(k1 , k2 ; j1 , j2 ) = E1 (k1 , j1 ) ⊗ E2 (k2 , j2 ).
⊕
A dimensão do subespaço E(k1 , k2 ; j1 , j2 ) é portanto
(2j1 + 1) × (2j2 + 1). (3.108)
Esse subespaço é globalmente invariante sobre a ação de uma função qualquer de J1 e J2 .
3.6.1 Momentum angular total: Relações de comutação

O momentum angular total do sistema em consideração é
J = J 1 + J2 (3.109)
Como os operadores J1 e J2 são momenta angulares regulares, pois satisfazem todas as relações
de comutação que caracterizam um momentum angular. Agora mostraremos que J também é
um momentum angular, pois suas componentes satisfazem as mesmas relações de comutação
que J1 e J2 .
Como J1 e J2 comutam com J21 e J22 , então J também irá comutar com eles,

k = 1, 2
[J1 , J2 ] = 0 e [Jkα , Jkβ ] = i~α,β,γ Jkγ com
α, β, γ = x, y, z.
[J1 , J21 ] = [J2 , J22 ] = 0 [J2 , J21 ] = [J1 , J22 ] = 0 (3.110)
[J, J21 ] = [J, J22 ] = 0 (3.111)
E além disso temos que o comutador
[Jα , Jβ ] = [J1α + J2α , J1β + J2β ] com α, β, γ = x, y, z.

= [J1α , J1β ] + [J2α , J2β ]
= i~α,β,γ J1γ + i~α,β,γ J2γ
= i~α,β,γ Jγ

Em particular, J2 e Jz comutam com J21 e J22 :
[Jz , J21 ] = [Jz , J22 ] = 0 (3.112)

= [J2 , J22 ] = 0. (3.113)
Além disso, J1z e J2z , obviamente comutam com Jz :
[J1z , Jz ] = [J2z , Jz ] = 0, (3.114)
mas não com J2 , já que esse operador pode ser escrito em termos de J1 e J2 na forma:
J2 = (J1 + J2 )2 = J21 + J22 + 2J1 · J2 . (3.115)
Como [J1 , J2 ] = 0. O produto escalar J1 · J2 pode ser expresso em termos das componentes
dos respectivos operadores,
J1 · J2 = J1x J2x + J1y J2y + J1z J2z (3.116)
mas como 
J
kx = 21 (Jk+ + Jk− )
Jk± = Jkx ± iJky (3.117)
1
J
ky = 2i
(Jk+ − Jk− )
então podemos escrever
1
J1 · J2 = [(J1+ + J1− )(J2+ + J2− ) − (J1+ − J1− )(J2+ − J2− )] + J1z J2z
4
1
= [J1+ J2+ + J1+ J2− + J1− J2+ + J1− J2− −
4
J1+ J2+ + J1+ J2− + J1− J2+ − J1− J2− ] + J1z J2z
1
= (J1+ J2− + J1− J2+ ) + J1z J2z
2
J2 = (J1 + J2 )2 = J21 + J22 + 2J1z J2z + J1+ J2− + J1− J2+ (3.118)
Como,
[J1 , J21 ] = 0 [J2 , J22 ] = 0

=0 [J1 , J2 ] = 0.
logo temos que
[Jz , J21 ] = [Jz , J22 ] = 0

= [J2 , J22 ] = 0
= [Jz , J2z ] = 0.

Além disso, J2 não comuta com J1z e nem com J2z , assim
[J2 , J1z ] = [J21 + J22 + 2J1 · J2 , J1z ]

= 2[J1 · J2 , J1z ]
= 2[J1x J2x + J1y J2y + J1z J2z , J1z ]
= 2 ([J1x , J1z ]J2x + [J1y , J1z ]J2y + [J1z , J1z ]J2z )
= 2i~ (−J1y J2x + J1x J2y )
Analogamente temos que,
[J2 , J2z ] = [J21 + J22 + 2J1 · J2 , J2z ]

= 2[J1 · J2 , J2z ]
= 2[J1x J2x + J1y J2y + J1z J2z , J2z ]
= 2 (J1x [J2x , J2z ] + J1y [J2y , J2z ] + J1z [J2z , J2z ])
= 2i~ (−J1x J2y + J1y J2x )
Portanto, como Jz = J1z + J2z , segue que
[J2 , Jz ] = [J2 , J1z + J2z ]

= [J2 , J1z ] + [J2 , J2z ]
= 2i~ (−J1y J2x + J1x J2y − J1x J2y + J1y J2x )
=0
Note que J2 não comuta nem com J1z e nem com J2z , porém ele comuta com Jz = J1z + J2z ,
que é a soma dos dois.
3.6.2 Mudança de base a ser realizada

Um vetor |k1 , k2 ; j1 , j2 ; m1 , m2 i é um autoestado simultâneo dos observáveis
{J21 , J22 , J1z , J2z } (3.119)
com os respectivos autovalores
J21 |k1 , k2 ; j1 , j2 ; m1 , m2 i = j1 (j1 + 1)~2 |k1 , k2 ; j1 , j2 ; m1 , m2 i (3.120)

J22 |k1 , k2 ; j1 , j2 ; m1 , m2 i = j2 (j2 + 1)~2 |k1 , k2 ; j1 , j2 ; m1 , m2 i (3.121)
J1z |k1 , k2 ; j1 , j2 ; m1 , m2 i = m1 ~ |k1 , k2 ; j1 , j2 ; m1 , m2 i (3.122)
J2z |k1 , k2 ; j1 , j2 ; m1 , m2 i = m2 ~ |k1 , k2 ; j1 , j2 ; m1 , m2 i (3.123)
Mostrou-se que essa base é muito boa para estudarmos os momenta angulares individuais J1
e J2 de dois subsistemas.
Foi mostrado que os quatro observáveis,
{J21 , J22 , J2 , Jz } (3.124)

 
 

 ··· 

 
 
 
 
 
 

 ··· 

 
 
 
 
 
 
 
 

 ··· 

 
 . .. .. ..
...

 .
 . . . .


 
 
 
 
···
Figura 3.3: Ilustra a forma da matriz Jz e J2 , que são blocos diagonais.
também comutam, portanto eles também formam um C.S.C.O.

Agora encontraremos um sistema ortonormal de autovetores comuns desses observáveis: essa
nova base será bem adaptada ao estudo do momentum angular total de um sistema. Essa base é
diferente da anterior, pois J2 não comuta com J1z e nem com J2z .
Deve-se ressaltar que:
• O subespaço E(k1 , k2 ; j1 , j2 ) é globalmente invariante sobre a ação de um operador qualquer

o qual é uma função de J1 e J2 , e portanto sobre a ação de uma função qualquer do
momentum angular total J.
• As matrizes que representam J2 e Jz no subespaço E(k1 , k2 ; j1 , j2 ) são bloco diagonais;
• Para diagonalizar o sistema, devemos diagonalizar em cada subespaço o bloco de uma

submatriz de dimensão (2j1 + 1) × (2j2 + 1), o que consiste em uma mudança de base,
específica para cada bloco, ou seja, em cada subespaço E(k1 , k2 ; j1 , j2 ).
• Os elementos de matriz na base {|k1 , k2 ; j1 , j2 ; m1 , m2 i} de uma função qualquer de J1 e

J2 são independentes de k1 e k2 , disso segue, J2 e Jz também são independentes de k1 e
k2 .
• Portanto, o problema da diagonalização de J2 e Jz é o mesmo dentro de todos os subespaços

E(k1 , k2 ; j1 , j2 ) os quais corresponde ao mesmo valor de j1 e j2 .
• Por isso, diz-se que adiciona-se os momenta angulares j1 e j2 , sem especificarmos os outros
números quânticos.

3.7. Autovalores de J 2 e Jz
• Então para simplificar a notação, de agora em diante omitiremos os índices k1 e k2 . Assim
E(j1 , j2 ) ≡ E(k1 , k2 ; j1 , j2 ) (3.125)

|j1 , j2 ; m1 , m2 i ≡ |k1 , k2 ; j1 , j2 ; m1 , m2 i (3.126)
Como o subespaço E(j1 , j2 ) é globalmente invariante sobre a ação de um operador qualquer,

o qual é uma função do momentum angular total J, então E(j1 , j2 ) é uma soma direta dos
subespaços ortogonais E(k, J), cada um dos quais são globalmente invariante sobre a ação dos
operadores J21 , Jz , J+ e J− :
X
E(j1 , j2 ) = E(k, J), (3.127)
⊕
Portanto, agora ficamos com dois problemas:
1. Dado j1 e j2 , quais são os valores de J que aparecem em (3.127), e quantos são os

subespaços distintos E(k, J) que estão associados com cada um deles?
2. Como podemos expandir os autovetores de J21 e Jz pertencentes a E(j1 , j2 ) sobre a base

{|j1 , j2 ; m1 , m2 i}?
3.7 Autovalores de J 2 e Jz
3.7.1 Caso especial: Dois spins 1/2

Iremos por um questão de simplicidade considerar inicialmente o caso em que os espaços
de estados E1 e E2 , constituem o subespaço de cada uma das partículas de spin 1/2, assim
E = E1 ⊗ E2 = E(j1 , j2 ), com j1 = j2 = 1/2. Por se tratar de spin, em vez de j, chamaremos de
S, portanto temos que

S = 0 ⇒ M =0
S = j1 + j2 = 1 =⇒ (3.128)
S = 1 ⇒ M = −1, 0, 1
Nesse caso temos que:
• O espaço de estados E = E(1/2, 1/2) deve ser uma soma direta dos subespaços E(k, S) de
(2S + 1)-dimensão.
• Cada um desses subespaços contém um e somente um autovetor de Sz , correspondendo a

cada um dos valores de M tal que |M | ≤ S.
• Os autovalores de Sz , M = ±1, são não-degenerados enquanto M = 0, ele é duplamente

degenerado.

3.7.2 Autovalores de Jz e o seu grau de degenerescência

O subespaço E(j1 , j2 ) tem dimensão (2j1 + 1) × (2j2 + 1). Aqui iremos considerar que,
j1 ≥ j2 .
Os vetores |j1 , j2 ; m1 , m2 i são autoestados de Jz , com
Jz |j1 , j2 ; m1 , m2 i = (J1z + J2z ) |j1 , j2 ; m1 , m2 i (3.129)

= (m1 + m2 )~ |j1 , j2 ; m1 , m2 i (3.130)
= M ~ |j1 , j2 ; m1 , m2 i (3.131)
e os correspondentes autovalores M ~ são tais que
M = m1 + m2 . (3.132)
Consequentemente M pode ser qualquer um dos seguintes valores:
M = j1 + j2 , j1 + j2 − 1, j1 + j2 − 2, . . . , −(j1 + j2 ) + 2, −(j1 + j2 ) + 1, −(j1 + j2 )
Usaremos um procedimento geométrico para encontrar a degenerescência gj1 ,j2 (M ).

A cada vetor |j1 , j2 ; m1 , m2 i, associamos em um diagrama bidimensional os pontos cuja
abcissa é m1 e cuja ordenada é m2 .
• Todos esses pontos estão situados dentro, ou sobre os lados de um retângulo cujo os cantos
são: (j1 , j2 ), (j1 , −j2 ), (−j1 , −j2 ) e (−j1 , j2 ).
• Na figura 3.4 representamos os 15 pontos associados com os vetores da base no caso em

que j1 = 2 e j2 = 1.
• Todos os pontos situados sobre a mesma linha pontilha vermelha correspondem aos mesmos
valores de M = m1 + m2 .
• O número de tais pontos é portanto, igual a degenerescência gj1 ,j2 (M ) deste valor de M .
3.7.3 Degenerescência de Jz
Quanto a degenerescência de Jz , note que:
gj1 ,j2 (j1 + j2 ) = 1 na figura gj1 ,j2 (3) = gj1 ,j2 (−3) = 1 (3.133)
enquanto para
gj1 ,j2 (j1 + j2 − 1) = 2 na figura gj1 ,j2 (2) = gj1 ,j2 (−2) = 2
gj1 ,j2 (j1 + j2 − 2) = 3 na figura gj1 ,j2 (1) = gj1 ,j2 (−1) = 3
gj1 ,j2 (j1 + j2 − 3) = 3 na figura gj1 ,j2 (0) = 3

m2
(-2,1) (-1,1) (0,1) (1,1) (2,1)
M
M
M
=
=
=
=
−
2
m1
0
1
1
(-2,0) (-1,0) (0,0) (1,0) (2,0)
M
=
−
2
(-2,-1) (-1,-1) (0,-1) (1,-1) (2,-1)
Figura 3.4: Par de possíveis valores (m1 , m2 ) para os kets |j1 , j2 ; m1 , m2 i. Aqui j1 = 2 e j2 = 1.
Os pontos associados com um dado valor de M = m1 + m2 estão situados sobre uma linha reta de
inclinação −1 (linha pontilhada vermelha).
g2,1 (M )
M
0
−3 −2 −1 0 1 2 3
Figura 3.5: Valores do grau de degenerescência gj1 ,j2 (M ) como uma função de M . Aqui j1 = 2 e
j2 = 1. Os graus de degenerescência gj1 ,j2 (M ) são obtidos simplesmente pela contagem do número de
pontos sobre as correspondentes linhas pontilhadas vermelhas da figura 3.4.

3.7.4 Autovalores de J 2 : primeira forma

Note que, quanto a valor de M temos que:
• se j1 e j2 forem ambos semi-inteiros ou ambos inteiros, então J = j1 + j2 será inteiro, e

portanto M será um inteiro.
• Se j1 ou j2 for semi-inteiros e o outro inteiro, então J = j1 + j2 será semi-inteiro, e portanto

M será um semi-inteiro.
• O valor máximo alcançado por M foi j1 + j2 , e nenhum dos valores de J, maiores do que
j1 + j2 são encontrados em E(j1 , j2 ) e portanto não aparecem na soma direta,
X
E(j1 , j2 ) = E(k, j). (3.134)
⊕
• Como o valor de J = j1 + j2 , está associado a um subespaço invariante, desde que

M = j1 + j2 exista, e somente um, desde que M = j1 + j2 não seja degenerado. Nesse sub-
espaço E(J = j1 +j2 ), há um e somente um vetor o qual corresponde a M = M = j1 +j2 −1;
porém esse valor de M é duplamente degenerado em E(j1 , j2 ); portanto, J = j1 + j2 − 1
também ocorre, e a ele corresponde um único sub-espaço invariante E(J = j1 + j2 − 1).
• Como o valor de J = j1 + j2 e M = J = j1 + j2 , está associado a um e somente um

subespaço invariante E(J = j1 + j2 ), pois a degenerescência gj1 ,j2 (j1 + j2 ) = 1.
• Para J = j1 + j2 − 1, o valor de M é duplamente degenerado, em E(j1 , j2 ), portanto,

J = j1 + j2 − 1 ocorre e corresponde a um único subespaço invariante E(J = j1 + j2 − 1).
Classicamente o comprimento da soma de dois vetores satisfazem a seguinte desigualdade:
|J1 − J2 | ≤ |J1 + J2 | ≤ |J1 + J2 | = J1 + J2 (3.135)
Com Jz = J1z + J2z , temos então que M = m1 + m2 e como os valores máximos de m1 e m2

são respectivamente j1 e j2 então o valor máximo de Mmax = m1max + m2max = j1 + j2 e como
|M | ≤ J, então podemos concluir que Jmax = j1 + j2 .
Para determinar o valor mínimo de J (Jmin ), usaremos o fato de que há (2j1 + 1) × (2j2 + 1)
kets |J, M i. Para cada valor de J há (2j + 1) autoestados |J, M i, então temos que;
JX
max
(2j + 1) = (2j1 + 1) × (2j2 + 1) (3.136)

j=Jmin
Note que a soma dos termos de uma progressão aritmética é dada por
nf
X (nf − ni + 1) · (anf + ani )
ai = , (3.137)
i=ni
2

J2
J2
J2
J1 +
2
J1 + J
J2
−J2 J1 J1
J1
2
J1 + J
J2
J1 −
Alinhamento qualquer Alinhamento com Alinhamento com
soma máxima soma mínima
Figura 3.6: Classicamente os valores mínimo e máximo de soma de dois vetores, satisfazem a
desigualdade do triângulo: |J1 − J2 | ≤ |J1 + J2 | ≤ J1 + J2 .
logo, usando este fato, podemos escrever

1
(Jmax − Jmin + 1) · (2Jmax + 1 + 2Jmin + 1) = (2j1 + 1) × (2j2 + 1)
2
[(Jmax + 1) − Jmin ] · [(Jmax + 1) + Jmin ] = 4j1 j2 + 2j1 + 2j2 + 1
(Jmax + 1)2 − Jmin
2
= 4j1 j2 + 2j1 + 2j2 + 1
2 2
Jmax + 2Jmax + 1 − Jmin = 4j1 j2 + 2j1 + 2j2 + 1
(j1 + j2 )2 + 2j1 + 2j2 − Jmin
2
= 4j1 j2 + 2j1 + 2j2
j12 + j22 + 2j1 j2 − Jmin
2
= 4j1 j2
j12 + j22 − 2j1 j2 = Jmin
2
(j1 − j2 )2 = Jmin
2
como J ≥ 0, então segue imediatamente que
Jmin = |j1 − j2 |. (3.138)
Portanto, temos que

|j1 − j2 | ≤ J ≤ j1 + j2 . (3.139)
3.7.5 Autovalores de J 2 : segunda forma

O resultado, também pode ser obtido, ao percebermos que de forma geral, podemos denotar
por pj1 ,j2 (J) o número de subespaços E(k, J) de E(j1 , j2 ) associados com um dado valor de J,

3.8. Autovetores comuns de J2 e Jz
isto é, o número de diferentes valores de k para esse valor de J, mantendo-se fixo os valores de
j1 e j2 . Note que há uma relação muito próxima entre os pj1 ,j2 (J) e os gj1 ,j2 (M ). Considere o
particular de M . Para ele corresponder a um e somente um vetor em cada sub-espaço E(k, J)
tal que J ≥ |M |. O seu grau de degenerescência gj1 ,j2 (M ) em E(j1 , j2 ), pode portanto ser escrito
como:
gj1 ,j2 (M ) =pj1 ,j2 (J = |M |) + pj1 ,j2 (J = |M | + 1)+

pj1 ,j2 (J = |M | + 2) + · · ·
Invertendo ela, obtemos pj1 ,j2 (J) em função de gj1 ,j2 (M ), assim
pj1 ,j2 (J) = gj1 ,j2 (M = J) − gj1 ,j2 (M = J + 1) (3.140)

= gj1 ,j2 (M = −J) − gj1 ,j2 (M = −J − 1) (3.141)
Temos que,
pj1 ,j2 (J) = 0 para J > j1 + j2 (3.142)
já que gj1 ,j2 (M ) é zero para |M | > j1 + j2 . Além disso, para J = j1 + j2 e M = J = j1 + j2 ,
temos
pj1 ,j2 (J) = gj1 ,j2 (M ) = 1

pj1 ,j2 (J − 1) = gj1 ,j2 (M − 1) − gj1 ,j2 (M ) = 1
pj1 ,j2 (J − 2) = gj1 ,j2 (M − 2) − gj1 ,j2 (M − 1) = 1
Portanto, iterativamente encontramos que
pj1 ,j2 (J = j1 + j2 ) = pj1 ,j2 (J = j1 + j2 − 1) = pj1 ,j2 (J = j1 + j2 − 2)

= · · · = pj1 ,j2 (J = j1 − j2 ) = 1
e finalmente, para o limite inferior temos:
pj1 ,j2 (J) = 0 para J < j1 − j2 (3.143)
Portanto, para valores fixos de j1 e j2 , isto é, dentro do subespaço E(j1 , j2 ) , os autovalores de

J2 são tais que
J = j1 + j2 , j1 + j2 − 1, j1 + j2 − 2, . . . , |j1 − j2 |. (3.144)
3.8 Autovetores comuns de J2 e Jz

Designaremos por |J, M i os autovetores comuns de J2 e Jz pertencentes ao espaço de estados
E(j1 , j2 ) e
J2k |J, M i = jk (jk + 1)~2 |J, M i k = 1, 2 (3.145)

J2 |J, M i = J(J + 1)~2 |J, M i (3.146)
Jz |J, M i = M ~ |J, M i (3.147)

3.8. Autovetores comuns de J2 e Jz
3.8.1 Caso especial spin 1/2
Antes de apresentarmos os resultados gerais, apresentaremos o caso particular de duas

partículas de spin 1/2, em valem todos os resultados estabelecidos para a base {|S, M i}. Nesse
caso temos:
S = S1 + S2 e Sz = S1z + S2z (3.148)
S2 |S, M i = S(S + 1)~2 |S, M i (3.149)

Sz |S, M i = M ~ |S, M i (3.150)
Aqui S = 1 e M = 1, 0, −1.
3.8.2 Duas partículas de spin 1/2: O subespaço E(S = 1)
O ket |+, +i é, no espaço de estado E(1/2, 1/2), o único autovetor de Sz associado com o
valor M = 1. Como [S2 , Sz ] = 0 e o valor M = 1 é não-degenerado, então o ket |+, +i deve
ser um autovetor de S2 . Assim |S = 1, M = 1i = |1, 1i, e portanto podemos escolher a fase do
vetor |1, 1i de modo que
|1, 1i = |+, +i . (3.151)
Agora é fácil encontrarmos os outros estados do tripleto, pois da teoria do momentum angular
sabemos que:
p
S± |S, M i = S(S + 1) − M (M ± 1)~ |S, M ± 1i , (3.152)
logo
p
S− |1, 1i = 1(1 + 1) − 1(1 − 1)~ |1, 1 − 1i
√
= ~ 2 |1, 0i
Consequentemente,
1
|1, 0i = √ S− |1, 1i (3.153)
~ 2
Para calcular |1, 0i explicitamente na base {|ε1 , ε2 i} é suficiente lembrar que S− = S1− + S2− ,
logo temos que
1
|1, 0i = √ (S1− + S2− ) |+, +i
~ 2
1
= √ [~ |−, +i + ~ |+, −i]
~ 2
1
= √ [|−, +i + |+, −i]
2

3.9. Caso geral, com j1 e j2 arbitrários
Finalmente, podemos aplicar novamente S− em |1, 0i, isto é,

1
|1, −1i = √ S− |1, 0i
~ 2
1
= √ (S1− + S2− ) [|−, +i + |+, −i]
~ 2
1 1
= √ √ [|−, +i + |+, −i]
~ 2 2
1
= [~ |−, −i + ~ |−, −i] = |−, −i
2~
3.8.3 O estado |S = 0, M = 0i
De fato, esse último resultado poderia ter sido obtido diretamente usando um argumento
análogo ao aplicado para |+, +i.
O único vetor do subespaço E(S = 0), o vetor |S = 0, M = 0i, é determinado a menos de
um fator constante, pela condição de que ele deve ser ortogonal aos três vetores |S = 1, M i, os
quais acabamos de construir.
Desde que ele é ortogonal a |1, 1i = |+, +i e |1, −1i = |−, −i, portanto |0, 0i deve ser uma
combinação linear dos kets |+, −i e |−, +i, assim
|0, 0i = α |+, −i + β |−, +i (3.154)
o qual será normalizado se

h0, 0 | 0, 0i = |α|2 + |β|2 = 1 (3.155)
agora usaremos o fato de que:

1
h1, 0 | 0, 0i = 0 =⇒ √ (α + β) = 0. (3.156)
2
Portanto, temos que
1
α = −β = √ eiδ (3.157)
2
em que δ é um número real qualquer. Escolhemos δ = 0 o que fornece
1
|0, 0i = √ [|+, −i − |−, +i] (3.158)
2
Dessa forma, calculamos os quatro vetores |S, M i sem ter escrito explicitamente a matriz
que representa S2 na base {|ε1 , ε2 i} .
3.9 Caso geral, com j1 e j2 arbitrários

Mostramos que a decomposição de E(j1 , j2 ) em uma soma direta dos subespaços invariantes
E(J) é:
E(j1 , j2 ) = E(j1 + j2 ) ⊕ E(j1 + j2 − 1) · · · ⊕ E(|j1 − j2 |). (3.159)
Agora veremos como determinar os vetores |J, M i que expandem esses subespaços.

3.9.1 O subespaço E(J = j1 + j2 )

Para esse caso temos que:
• O ket |j1 , j2 ; m1 = j1 , m2 = j2 i é, em E(J = j1 + j2 ), o único vetor de Jz associado com

M = j1 + j2 .
• Desde que J2 comuta com Jz e o valor M = j1 +j2 é não degenerado, então |j1 , j2 ; m1 = j1 , m2 = j2 i
também deve ser um autovetor de J2 .
• De acordo com (3.159), o correspondente valor de J só pode ser J = j1 + j2 .
Então, escolhendo o fator de fase adequadamente, temos
|J = j1 + j2 ; M = j1 + j2 i = |j1 , j2 ; m1 = j1 , m2 = j2 i
= |j1 + j2 ; j1 + j2 i
= |j1 , j2 ; j1 , j2 i .
Aplicações repetidas do operador J− sobre este vetor de estado, fornece toda a família de
vetores |J, M i, para os quais J = j1 + j2 . Portanto, de (3.103) temos, que
p
J± |k, j, mi = ~ j(j + 1) − m(m ± 1) |k, j, m ± 1i . (3.160)
logo
p
J− |j1 + j2 ; j1 + j2 i = ~ 2(j1 + j2 ) |j1 + j2 ; j1 + j2 − 1i (3.161)
então
1
|j1 + j2 ; j1 + j2 − 1i = p J− |j1 + j2 ; j1 + j2 i . (3.162)
~ 2(j1 + j2 )
Agora aplicando J− = J1− + J2− ao vetor |j1 + j2 ; j1 + j2 i, obtemos que
1
|j1 + j2 ; j1 + j2 − 1i = p J− |j1 + j2 ; j1 + j2 i
~ 2(j1 + j2 )
1
= p (J1− + J2− ) |j1 , j2 ; j1 , j2 i
~ 2(j1 + j2 )
1 hp p i
= p ~ 2j1 |j1 , j2 ; j1 − 1, j2 i + 2j2 |j1 , j2 ; j1 , j2 − 1i
~ 2(j1 + j2 )
isto é
s s
j1 j2
|j1 + j2 ; j1 + j2 − 1i = |j1 , j2 ; j1 − 1, j2 i + |j1 , j2 ; j1 , j2 − 1i (3.163)
j1 + j2 j1 + j2
De fato, obtivemos uma combinação linear dos dois vetores bases os quais corresponde a
M = j1 + j2 − 1, e essa combinação está normalizada diretamente. Pois
j1
hj1 + j2 ; j1 + j2 − 1 | j1 + j2 ; j1 + j2 − 1i = hj1 , j2 ; j1 − 1, j2 | j1 , j2 ; j1 − 1, j2 i + (3.164)
j1 + j2
j2
hj1 , j2 ; j1 , j2 − 1 | j1 , j2 ; j1 , j2 − 1i (3.165)
j1 + j2
j1 j2
= + = 1. (3.166)
j1 + j2 j1 + j2

Ao repetirmos o procedimento anterior, podemos construir o ket |j1 + j2 ; j1 + j2 − 2i pela

aplicação de J− em ambos os lados de (3.163). Para o lado direito devemos usar a forma
J− = J1− + J2− . Com isso
1
|j1 + j2 ; j1 + j2 − 2i = p J− |j1 + j2 ; j1 + j2 − 1i ,
~ 4(j1 + j2 ) − 2
logo,
1
|j1 + j2 ; j1 + j2 − 2i = p J− |j1 + j2 ; j1 + j2 − 1i
~ 4(j1 + j2 ) − 2
1
= p (J1− + J2− ) |j1 + j2 ; j1 + j2 − 1i
~ 4(j1 + j2 − 1) − 2
1
= p (J1− + J2− ) ×
~ 4(j1 + j2 ) − 2
"s s #
j1 j2
|j1 , j2 ; j1 − 1, j2 i + |j1 , j2 ; j1 , j2 − 1i
j1 + j2 j1 + j2
"s
1 j1 p
= p ~ 4j1 − 2 |j1 , j2 ; j1 − 2, j2 i
~ 4(j1 + j2 ) − 2 j1 + j2
s #
j2 p
4j2 − 2 |j1 , j2 ; j1 , j2 − 2i
j1 + j2
isto é
s
j1 (2j1 − 1)
|j1 + j2 ; j1 + j2 − 2i = |j1 , j2 ; j1 − 2, j2 i +
(j1 + j2 )[2(j1 + j2 ) − 1]
s
j2 (2j2 − 1)
|j1 , j2 ; j1 , j2 − 2i . (3.167)
(j1 + j2 )[2(j1 + j2 ) − 1]
Fazendo aplicações sucessivas de J− , somos capazes de calcular os primeiros 2(j1 + j2 ) + 1

vetores da base de {|J, M i}, a qual corresponde a J = j1 + j2 e M = j1 + j2 , j1 + j2 −
1, . . . , −(j1 + j2 ) e além disso podemos expandir o subespaço E(J = j1 + j2 ) de E(j1 , j2 ).
Repetindo o procedimento, podemos calcular
|j1 + j2 ; j1 + j2 − 3i
|j1 + j2 ; j1 + j2 − 4i
..
.
|j1 + j2 ; −(j1 + j2 )i
3.9.2 Os outros subespaços E(j)

Agora considere o subespaço ζ(j1 + j2 ), o suplementar de E(j1 + j2 ) em E(j1 , j2 ). De acordo
com (3.159), ζ(j1 + j2 ) pode ser quebrado em
ζ(j1 + j2 ) = E(j1 + j2 − 1) ⊕ E(j1 + j2 − 2) · · · ⊕ E(|j1 − j2 |). (3.168)

com,
J = j1 + j2 − 1 e M = j1 + j2 − 1 (3.169)
Portanto, podemos usar um raciocínio análogo ao anterior.
Uma forma de ver o procedimento como um todo é lembrar que:
|j1 − j2 | ≤ J ≤ j1 + j2
J M
j1 + j2 j1 + j2 j1 + j2 − 1 j1 + j2 − 2 ··· 1 0 -1 ··· −(j1 + j2 − 2) −(j1 + j2 − 1) −(j1 + j2 )

j1 + j2 − 1 j1 + j2 − 1 j1 + j2 − 2 ··· 1 0 -1 ··· −(j1 + j2 − 2) −(j1 + j2 − 1)
j1 + j2 − 2 j1 + j2 − 2 ··· 1 0 -1 ··· −(j1 + j2 − 2)
..
.
|j1 − j2 | 0
Note que a partir de J = j1 + j2 − 1, esse estado é duplamente degenerado em Jz , o próximo

J = j1 + j2 − 2 é triplamente degenerado em Jz , e assim por diante. Lembre-se que após aplicar
o operador J− em todos os estados de J = j1 + j2 , o próximo passo é iniciar com o estado
|J = j1 + j2 − 1, M = j1 + j2 − 1i, porém este estado não é conhecido, mas sabe-se que ele deve
ser uma combinação linear dos estado com M = j1 + j2 − 1 , assim
|j1 + j2 − 1, j1 + j2 − 1i = α |j1 , j2 ; j1 , j2 − 1i + β |j1 , j2 ; j1 − 1, j2 i .

Em ζ(j1 + j2 ), o grau de degenerescência gj0 1 ,j2 (M ) de um dado valor de M é menor do que
gj1 ,j2 (M ) por um fator de um, desde que E(j1 + j2 ) possui um e somente um vetor associado
com este valor de M :
gj0 1 ,j2 (M ) = gj1 ,j2 (M ) − 1 (3.170)
Isso significa que não há mais M = j1 +j2 em ζ(j1 +j2 ), e que o novo valor máximo M = j1 +j2 −1
é não degenerado. Disso pode-se concluir que o vetor correspondente deve ser proporcional ao
ket |J = j1 + j2 − 1, M = j1 + j2 − 1i.
Esse vetor pode ser expandido na base {|j1 , j2 ; m1 , m2 i} como:
|j1 + j2 − 1, j1 + j2 − 1i = α |j1 , j2 ; j1 , j2 − 1i + β |j1 , j2 ; j1 − 1, j2 i
ao impormos a normalização para esse vetor, encontramos que
|α|2 + |β|2 = 1. (3.171)
Além disso, esse vetor deve ser ortogonal ao vetor |j1 + j2 , j1 + j2 − 1i o qual pertence a E(j1 +j2 ),
e é dado por (3.163). Portanto,
hj1 + j2 , j1 + j2 − 1 | j1 + j2 − 1, j1 + j2 − 1i = 0 (3.172)
s s
j1 j2
α +β =0 (3.173)
j1 + j2 j1 + j2

logo s
j2
α=− β (3.174)
j1
Substituindo, na expressão da normalização obtemos que:

2 j1
|α| 1 + =1 (3.175)
j2
A menos de um fator de fase, podemos determinar α e β, escolhendo α com sendo real e positivo,
obtemos que s s
j1 j2
α= =⇒ β=− (3.176)
j1 + j2 j1 + j2
Com isso temos
s s
j1 j2
|j1 + j2 − 1; j1 + j2 − 1i = |j1 , j2 ; j1 , j2 − 1i − |j1 , j2 ; j1 − 1, j2 i (3.177)
j1 + j2 j1 + j2
Este vetor é o primeiro da nova família, caracterizada por J = j1 + j2 − 1.

Os outros vetores podem ser obtidos por aplicações sucessivas de J− sobre esse vetor. Temos
que
1
|j1 + j2 − 1; j1 + j2 − 2i = p J− |j1 + j2 − 1; j1 + j2 − 1i (3.178)
~ 2(j1 + j2 − 1)
Aqui basta aplicar J− = J1− +J2− , sobre esse estado para obtermos os outros 2(j1 +j2 −1)+1
vetores |J, M i correspondentes a
J = j1 + j2 − 1 e M = j1 + j2 − 1, j1 + j2 − 2, . . . , −(j1 + j2 − 1)
os quais expandem o subespaço E(j1 + j2 − 1).

Agora considere o espaço ζ(j1 + j2 , j1 + j2 − 1), o suplemento da soma direta E(j1 + j2 ) ⊕
E(j1 + j2 − 1) em E(j1 , j2 ):
ζ(j1 + j2 , j1 + j2 − 1) = E(j1 + j2 − 2) ⊕ E(j1 + j2 − 3) ⊕ · · · ⊕ E(|j1 − j2 |).
Em ζ(j1 + j2 , j1 + j2 − 1), a degenerescência de cada valor de M é novamente decrescida por

com relação aquela que tinha em ζ(j1 +j2 ). Em particular o valor máximo agora é M = j1 +j2 −2,
e ele é não degenerado. O correspondente vetor deve ser portanto,
|J = j1 + j2 − 2; M = j1 + j2 − 2i . (3.179)
Para calcularmos ele na base {|j1 , j2 ; m1 , m2 i} é suficiente notarmos que ele deve ser dado pela
seguinte combinação linear:
|j1 + j2 − 2; j1 + j2 − 2i =α |j1 , j2 ; j1 , j2 − 2i + β |j1 , j2 ; j1 − 1, j2 − 1i + (3.180)

γ |j1 , j2 ; j1 − 2, j2 i (3.181)

3.10. Coeficientes de Clebsch-Gordan
Os coeficientes dessa combinação, devido a condição de normalização, satisfazem a seguinte

relação:
|α|2 + |β|2 + |γ|2 = 1. (3.182)
Além disso ele deve ser ortogonal ao seguintes vetores:
hj1 + j2 ; j1 + j2 − 2 | j1 + j2 − 2; j1 + j2 − 2i = 0 (3.183)
hj1 + j2 − 1; j1 + j2 − 2 | j1 + j2 − 2; j1 + j2 − 2i = 0, (3.184)
os quais, após a realização dos passos anteriores já são conhecidos.

Esse procedimento deve ser repetido até exaurirmos todos os valores de M ≥ |j1 − j2 |.
3.10 Coeficientes de Clebsch-Gordan

Em cada espaço E(j1 , j2 ), os autovetores de J2 e Jz são combinações lineares dos vetores da
base inicial {|j1 , j2 ; m1 , m2 i}:
j1 j2
X X
|J, M i = |j1 , j2 ; m1 , m2 i hj1 , j2 ; m1 , m2 | J, M i . (3.185)
m1 =−j1 m2 =−j2
Os coeficientes hj1 , j2 ; m1 , m2 | J, M i dessa expansão são chamados de coeficientes de Clebsch-

Gordan.
Não há uma expressão geral para os coeficientes de Clebsch-Gordan, entretanto o procedi-
mento apresentado anteriormente nos permite obtermos todos os coeficientes.
Para determinarmos os coeficientes de Clebsch-Gordan unicamente, devemos escolher algumas
fases. Essa escolha ocorre de modo a garantir que os coeficientes de Clebsch-Gordan sejam
sempre reais.
Vimos anteriormente que os coeficientes C só serão diferentes de zero se,
M = m1 + m2
|j1 − j2 | ≤ J ≤ j1 + j2 . (3.186)
A expressão (3.186) é chamada de desigualdade do triângulo, pois pode-se formar um

triângulo com três segmentos de linhas de comprimentos j1 , j2 e J, conforme ilustra a figura.
Note que os lados do triângulo obedecem a seguintes desigualdades:
|j1 − j2 | ≤J ≤ j1 + j2 (3.187)
|J − j1 | ≤j2 ≤ J + j1 (3.188)
|J − j2 | ≤j1 ≤ J + j2 . (3.189)
Além disso, as propriedades gerais dos momenta angulares impõe que o ket |J, M i, e portanto,
os coeficientes hj1 , j2 ; m1 , m2 | J, M i existam somente se M tiver um dos seguintes valores:
M = J, J − 1, . . . , −(J − 1), −J (3.190)

Desiguladade do triângulo
J
J2 |J1 − J2 | ≤ J ≤ J1 + J2
|J − J1 | ≤ J2 ≤ J + J1
|J − J2 | ≤ J1 ≤ J + J2
J1
Figura 3.7: Regra de seleção do triângulo: o coeficiente hj1 , j2 ; m1 , m2 | J, M i pode ser diferente de
zero somente se for possível forma um triângulo com os três segmentos de reta de comprimentos j1 , j2 e
J.
e necessário ainda que

m1 = j1 , j1 − 1, . . . , −(j1 − 1), −j1 (3.191a)
m2 = j2 , j2 − 1, . . . , −(j2 − 1), −j2 (3.191b)
Se esse não for o caso, os coeficientes de Clebsch-Gordan não são definidos. Entretanto, no que
segue, será conveniente considerar que eles existem para todos os valores de m1 , m2 e M , mas
que os coeficientes serão nulos se um deles não satisfazer as condições (3.191) anteriores.
Desde que os vetores |J, M i também formam uma base ortonormal do espaço E(j1 , j2 ),
podemos expressar um vetor |j1 , j2 ; m1 , m2 i em termos dos vetores |J, M i como
j1 +j2 J
X X
|j1 , j2 ; m1 , m2 i = |J, M i hJ, M | j1 , j2 ; m1 , m2 i . (3.192)
J=|j1 −j2 | M =−J
Desde que escolhemos todos os fatores de fase para os coeficientes de Clebsch-Gordan de modo
que eles fossem reais, então segue que:
hJ, M | j1 , j2 ; m1 , m2 i = hj1 , j2 ; m1 , m2 | J, M i . (3.193)
Portanto, os coeficientes de Clebsch-Gordan nos permite tanto expressar os vetores da base

{|j1 , j2 ; m1 , m2 i} em termos dos vetores da base {|J, M i}, quanto o contrário.
3.10.1 Relações de Ortogonalidade

Ao inserirmos a relação de completeza:
j1 j2
X X
|j1 , j2 ; m1 , m2 i hj1 , j2 ; m1 , m2 | = 1 (3.194)
m1 =−j1 m2 =−j2
na relação de ortogonalidade dos kets |J, M i:
hJ, M | J 0 , M 0 i = δJ,J 0 δM,M 0 (3.195)

nos obtemos
j1 j2
X X
hJ, M | j1 , j2 ; m1 , m2 i hj1 , j2 ; m1 , m2 | J 0 , M 0 i = δJ,J 0 δM,M 0
m1 =−j1 m2 =−j2
Se levarmos em conta que esse coeficientes são reais, pode-se escrever,

j1 j2
X X
hj1 , j2 ; m1 , m2 | J, M i hj1 , j2 ; m1 , m2 | J 0 , M 0 i = δJ,J 0 δM,M 0
m1 =−j1 m2 =−j2
Essa é a primeira relação de ortogonalidade dos coeficientes de Clebsch-Gordan.

Similarmente, se inserirmos a relação de completeza
j1 +j2 J
X X
|J, M i hJ, M | = 1 (3.196)
J=|j1 −j2 | M =−J
na relação de ortogonalidade
hj1 , j2 ; m1 , m2 | j1 , j2 ; m01 , m02 i = δm1 ,m01 δm2 ,m02 (3.197)
obtemos
j1 +j2 J
X X
hj1 , j2 ; m1 , m2 | J, M i hJ, M | j1 , j2 ; m01 , m02 i = δm1 ,m01 δm2 ,m02 ,
J=|j1 −j2 | M =−J
agora levando-se em conta que esses coeficientes são reais, temos

j1 +j2 J
X X
hj1 , j2 ; m1 , m2 | J, M i hj1 , j2 ; m01 , m02 | J, M i = δm1 ,m01 δm2 ,m02 ,
J=|j1 −j2 | M =−J
3.10.2 Relações de Recorrência

Desde que os kets |j1 , j2 ; m1 , m2 i formam uma base, temos:
p
J1± |j1 , j2 ; m1 , m2 i = ~ j1 (j1 + 1) − m1 (m1 ± 1) |j1 , j2 ; m1 ± 1, m2 i
p
J2± |j1 , j2 ; m1 , m2 i = ~ j2 (j2 + 1) − m2 (m2 ± 1) |j1 , j2 ; m1 , m2 ± 1i
Similarmente, por construção os kets |J, M i satisfazem:

p
J± |J, M i = J(J + 1) − M (M ± 1)~ |J, M ± 1i . (3.198)
Portanto, podemos aplicar o operador J− a expressão (3.185). Desde que J− = J1− + J2− ,
obtemos (se M > −J):
p
J(J + 1) − M (M − 1) |J, M − 1i =
j1 j2
X X
hj1 , j2 ; m01 , m02 | J, M i ×
1 m0 =−j1 m0 =−j2
2
hp
j1 (j1 + 1) − m01 (m01 − 1) |j1 , j2 ; m01 − 1, m02 i +
p i
j2 (j2 + 1) − m02 (m02 − 1) |j1 , j2 ; m01 , m02 − 1i (3.199)

Multiplicando a esquerda essa expressão pelo bra hj1 , j2 ; m1 , m2 |, e usando o fato de que:
hj1 , j2 ; m1 , m2 | j1 , j2 ; m01 − 1, m02 i = δm1 ,m01 −1 δm2 ,m02 (3.200)
e
hj1 , j2 ; m1 , m2 | j1 , j2 ; m01 , m02 − 1i = δm1 ,m01 δm2 ,m02 −1 (3.201)
com isso obtemos que:
p
J(J + 1) − M (M − 1) hj1 , j2 ; m1 , m2 | J, M − 1i =
p
j1 (j1 + 1) − m1 (m1 + 1) hj1 , j2 ; m1 + 1, m2 | J, M i +
p
j2 (j2 + 1) − m2 (m2 + 1) hj1 , j2 ; m1 , m2 + 1| J, M i (3.202)
Se o valor de M for igual a −J, então temos que J− |J, −Ji = 0, e a relação (3.202) permanece
válida, e devemos notar que:

0 se |M | > J,
hj1 , j2 ; m1 , m2 | J, M i = (3.203)
Diferente de zero se |M | ≤ J.
Da relação (3.202) para M = −J, temos que:

s
j2 (j2 + 1) − m2 (m2 + 1)
hj1 , j2 ; m1 + 1, m2 | J, −Ji = − hj1 , j2 ; m1 , m2 + 1| J, −Ji . (3.204)
j1 (j1 + 1) − m1 (m1 + 1)
Analogamente, podemos aplicar o operador J+ a expressão (3.185). Desde que J+ = J1+ +J2+ ,
obtemos (se M < J):
p
J(J + 1) − M (M + 1) |J, M + 1i =
j1 j2
X X
hj1 , j2 ; m01 , m02 | J, M i ×
m0 =−j1 m0 =−j2
1 2
hp
j1 (j1 + 1) − m01 (m01 + 1) |j1 , j2 ; m01 + 1, m02 i +
p i
j2 (j2 + 1) − m02 (m02 + 1) |j1 , j2 ; m01 , m02 + 1i (3.205)
Multiplicando a esquerda essa expressão pelo bra hj1 , j2 ; m1 , m2 |, e usando o fato de que:
hj1 , j2 ; m1 , m2 | j1 , j2 ; m01 + 1, m02 i = δm1 ,m01 +1 δm2 ,m02 (3.206)
e
hj1 , j2 ; m1 , m2 | j1 , j2 ; m01 , m02 + 1i = δm1 ,m01 δm2 ,m02 +1 (3.207)
com isso obtemos que:
p
J(J + 1) − M (M + 1) hj1 , j2 ; m1 , m2 | J, M + 1i =
p
j1 (j1 + 1) − m1 (m1 − 1) hj1 , j2 ; m1 − 1, m2 | J, M i +
p
j2 (j2 + 1) − m2 (m2 − 1) hj1 , j2 ; m1 , m2 − 1| J, M i (3.208)

Se o valor de M for igual a J, então temos que J+ |J, Ji = 0, e a relação (3.208) permanece
válida, e devemos notar que:

0 se |M | > J,
hj1 , j2 ; m1 , m2 | J, M i = (3.209)
Diferente de zero se |M | ≤ J.
Da relação (3.208) para M = J, temos que:

s
j2 (j2 + 1) − m2 (m2 − 1)
hj1 , j2 ; m1 − 1, m2 | J, Ji = − hj1 , j2 ; m1 , m2 − 1| J, Ji . (3.210)
j1 (j1 + 1) − m1 (m1 − 1)
3.10.3 Convenção de Fase

As relações (3.202) e (3.208), são relações de recorrência para calcularmos os coeficientes de
Clebsch-Gordan.
A expressão (3.202) fixa a fase relativa dos kets |J, M i associados com o mesmo valor
de J. Entretanto, devemos fixar a fase de todos os coeficientes de Clebsch-Gordan, asso-
ciados aos kets |J, M i. Para isso, iremos investigar algumas propriedades dos coeficientes
hj1 , j2 ; m1 , m2 − 1| J, Ji.
3.10.4 Os coeficientes hj1 , j2 ; m1 , m2 | J, Ji: fase do ket |J, Ji

No coeficiente hj1 , j2 ; m1 , m2 | J, Ji, o valor máximo de m1 é m1 = j1 , e nesse caso m2 = J −j1 .
Ao decrescermos o valor de m1 por um, aumentamos o valor de m2 de um até m2 atingir seu
valor máximo m2 = −j2 e m1 o seu valor mínimo m1 = J − j2 , cujo módulo deve ser menor
que j1 . Portanto, podem haver (j1 + j2 − J + 1) coeficientes de Clebsch-Gordan não nulos
hj1 , j2 ; m1 , m2 | J, Ji. Agora iremos mostrar que nunca serão nulos, para isso considere a relação
(3.210) quando M = J, na qual
s
j2 (j2 + 1) − m2 (m2 − 1)
hj1 , j2 ; m1 − 1, m2 | J, Ji = − hj1 , j2 ; m1 , m2 − 1| J, Ji , (3.211)
j1 (j1 + 1) − m1 (m1 − 1)
o radical do lado direito nunca será zero, e nem infinito. Portanto, se o coeficiente hj1 , j2 ; m1 , J − m1 | J, Ji
for zero, então todos os outros coeficientes que o sucede também serão nulos. Mas isso não é
possível, pois o ket |J, Ji é normalizado e diferente de zero. Portanto, todos os coeficientes são
diferentes de zero.
Em particular se o coeficiente hj1 , j2 ; j1 , J − j1 | J, Ji, para o qual m1 tem o seu valor máximo,
for não nulo, então para fixarmos a fase do ket |J, Ji requeremos que esse coeficiente satisfaça a
seguinte condição:
hj1 , j2 ; j1 , J − j1 | J, Ji Seja um número real e positivo. (3.212)
e da relação (3.210), segue então que todos os coeficientes
(−1)j1 −m1 × hj1 , j2 ; m1 , J − m1 | J, Ji

devem ser reais e o o fator (−1)j1 −m1 fornece o seu sinal.

Note que a convenção da fase escolhida para o ket |J, Ji fornece para os dois momenta
angulares J1 e J2 regras assimétricas. Ela realmente depende da ordem na qual os números
quânticos j1 e j2 estão arranjados nos coeficientes de Clebsch-Gordan: se a ordem de j1 e j2 for
permutada, a fase do ket |J, Ji é fixada pela condição
hj1 , j2 ; j2 , J − j2 | J, Ji Seja um número real e positivo. (3.213)
a qual não é necessariamente equivalente, a priori, a (3.212) [(3.212) e (3.213) podem definir
diferentes fases para o ket |J, Ji].
3.10.5 Outros Coeficientes de Clebsch-Gordan

A relação (3.202), nos permite expressarmos em termos de hj1 , j2 ; m1 , m2 | J, Ji, todos os
coeficientes hj1 , j2 ; m1 , m2 | J, J − 1i, e então todos os coeficientes hj1 , j2 ; m1 , m2 | J, J − 2i, etc.
Essa relação, na qual nenhum número imaginário é envolvido, impõe que todos os coeficientes
de Clebsch-Gordan sejam reais:
hj1 , j2 ; m1 , m2 | J, M i∗ = hj1 , j2 ; m1 , m2 | J, M i (3.214)
a qual também pode ser escrita na forma
hj1 , j2 ; m1 , m2 | J, M i = hJ, M | j1 , j2 ; m1 , m2 i (3.215)
Portanto, para M 6= J, os sinais dos coeficiente hj1 , j2 ; m1 , m2 | J, M i não obedecem nenhuma

regra simples.
3.10.6 Algumas relações úteis

Aqui forneceremos algumas relações que complementam as fornecidas nas seções anteriores.
Para prova-las, iniciaremos fazendo uma análise dos sinais de um certo número de coeficientes
de Clebsch-Gordan.
3.10.6.1 Os Sinais de alguns coeficientes
Os coeficientes hj1 , j2 ; m1 , m2 | j1 + j2 , M i: A convenção (3.212) impõe que o coeficiente
hj1 , j2 ; j1 , j2 | j1 + j2 , j1 + j2 i
seja real e positivo, e além disso, que ele seja igual a 1. Fazendo M = J = j1 + j2 em (3.202),
vemos então que os coeficientes hj1 , j2 ; m1 , m2 | j1 + j2 , j1 + j2 − 1i são positivos. Por recorrência
então é fácil provar que
hj1 , j2 ; m1 , m2 | j1 + j2 , M i ≥ 0. (3.216)

Os coeficientes nos quais m1 tem seu valor máximo: Considere o coeficiente hj1 , j2 ; m1 , m2 | J, M i.
Em princípio o valor máximo de m1 = j1 . Entretanto, temos que m2 = M − j1 , o que de acordo
com (3.191b) é possível somente se M − j1 ≥ −j2 , isto é
M ≥ j1 − j2 (3.217)
Se, por outro lado

M ≤ j1 − j2 (3.218)
o valor máximo de m1 corresponde ao valor mínimo de m2 (m2 = −j2 ) e é portanto igual a

m1 = M + j2 .
A seguir mostraremos que todos os coeficientes de Clebsch-Gordan para os quais m1 tem o
seu valor máximo, são positivos e não-nulos. Para tal, seja m1 = j1 em (3.202), assim
p p
J(J + 1) − M (M − 1) hj1 , j2 ; j1 , m2 | J, M − 1i = j2 (j2 + 1) − m2 (m2 + 1) hj1 , j2 ; j1 , m2 + 1| J, M i
(3.219)
Usando essa relação, um argumento por recorrência iniciando com (3.212) mostra que todos
os coeficientes hj1 , j2 ; j1 , M − j1 | J, M i são positivos (e não-nulos se M satisfaz a eq. (3.217)).
Analogamente, fazendo m2 = −j2 em (3.208), podemos provar que todos os coeficientes
hj1 , j2 ; M + j2 , −j2 | J, M i são positivos, se M satisfaz (3.218).
Os coeficientes hj1 , j2 ; m1 , m2 | J, Ji e hj1 , j2 ; m1 , m2 | J, −Ji: Vimos anteriormente que o

sinal de hj1 , j2 ; m1 , m2 | J, Ji é (−1)j1 −m1 . Em particular o sinal de hj1 , j2 ; J − j2 , j2 | J, Ji é
(−1)j1 +j2 −J , ou seja,
hj1 , j2 ; J − j2 , j2 | J, Ji = (−1)j1 +j2 −J |hj1 , j2 ; J − j2 , j2 | J, Ji| (3.220)
Para determinarmos o sinal de hj1 , j2 ; m1 , m2 | J, −Ji, podemos fazer M = −J em (3.202),

cujo lado esquerdo vai então a zero. Portanto, vemos que o sinal de hj1 , j2 ; m1 , m2 | J, −Ji
muda se m1 ou (m2 ) variar por ±1. Desde que, de acordo com os resultados anteriores,
hj1 , j2 ; j2 − J, −j2 | J, −Ji é positivo, segue que o sinal de hj1 , j2 ; m1 , m2 | J, −Ji é (−1)m2 +j2 , e
em particular: o sinal de hj1 , j2 ; −j1 , −J + j1 | J, −Ji é (−1)j1 +j2 −J , ou seja,
hj1 , j2 ; −j1 , −J + j1 | J, −Ji = (−1)j1 +j2 −J |hj1 , j2 ; −j1 , −J + j1 | J, −Ji| (3.221)
3.10.6.2 Mudança de ordem de j1 e j2
Com a convenção escolhida a fase do ket |J, Ji depende da ordem na qual os dois momenta
angulares j1 e j2 estão arranjados nos coeficientes de Clebsch-Gordan. Se eles estão na ordem
j1 , j2 a componente do ket |J, Ji ao longo do ket |j1 , j2 ; j1 , J − j1 i é positiva, o que significa que
o sinal da componente ao longo do ket |j1 , j2 ; J − j2 , j2 i é (−1)j1 +j2 −J como indicado por (3.220).
Por outro lado, se escolhermos a ordem j2 , j1 a relação (3.213) mostra que a última componente
é positiva. Portanto, se invertermos j1 e j2 o ket |J, Ji será multiplicado por (−1)j1 +j2 −J . O
mesmo é verdade para os kets |J, M i, os quais são construídos a partir do ket |J, Ji pela ação

de J− de tal modo que a ordem de j1 e j2 não tem efeito algum. Finalmente a troca da ordem
de j1 e j2 conduz a relação:
hj2 , j1 ; m2 , m1 | J, M i = (−1)j1 +j2 −J hj1 , j2 ; m1 , m2 | J, M i .

Capítulo 4
Teorema de Wigner-Eckart
4.1 Operadores escalares

Um operador A é dito ser um operador escalar quando ele comuta com o momentum angular
J do sistema em estudo, ou seja, [A, J] = [A, J2 ] = 0. Uma propriedade importante deste
operador é que na base padrão {|k, j, mi} os elementos de matriz não nulos hk, j, m|A|k 0 , j 0 , m0 i,
do operador escalar, devem satisfazer a condição j = j 0 e m = m0 ; além disso, este elemento não
depende de m, logo
hk, j, m|A|k 0 , j 0 , m0 i = aj (k, k 0 )δj,j 0 δm,m0 (4.1)
Se fixarmos os valores de k e j, teremos (2j+1) kets |k, j, mi com m = −j, −j+1, . . . , j−1, j,
portanto temos uma matriz (2j + 1) × (2j + 1), a qual é diagonal com todos os elementos iguais,
ou seja,
hk, j, m|A|k, j, m0 i = a(k, j)δm,m0 (4.2)
Considerando um outro operador escalar B com as mesmas propriedades do operador A,

vê-se que eles são proporcionais, logo, denotando por P (k, j) o projetor do subespaço E(k, j), os
quais são fixos, podemos escrever
P (k, j)BP (k, j) = λ(k, j)P (k, j)AP (k, j), (4.3)
na qual o projetor do subespaço E(k, j) é dado por

j
X
P (k, j) = |k, j, mi hk, j, m| . (4.4)
m=−j
A seguir iremos estudar os operadores vetores que possuem propriedades análogas aos
operadores escalares.
4.2 Operadores vetores

Se V e W são dois operadores vetores, veremos que seus elementos de matrizes obedecem a
determinadas regras de seleção. Além disso, mostraremos que ao restringirmos os operadores V
65
4.2. Operadores vetores
e W ao subespaço E(k, j), então os seus elementos de matrizes serão proporcionais, ou seja,
P (k, j)WP (k, j) = µ(k, j)P (k, j)VP (k, j). (4.5)
Este resultado constitui o teorema de Wigner-Eckart para os operadores vetores.
4.2.1 Definição dos operadores vetores

Seja V um vetor observável, cujas componentes Vx , Vy e Vz em um sistema de referências
ortonormal Oxyz, satisfaz as seguintes relações de comutação
[Jx , Vx ] = 0 [Jy , Vx ] = −i~Vz [Jz , Vx ] = i~Vy (4.6a)

[Jx , Vy ] = i~Vz [Jy , Vy ] = 0 [Jz , Vy ] = −i~Vx (4.6b)
[Jx , Vz ] = −i~Vy [Jy , Vz ] = i~Vx [Jz , Vz ] = 0. (4.6c)
então V é dito ser um operador vetor.

Exemplo 4.1. Trocando V por J em (4.6), obtemos as relações de comutação que definem o
momentum angular J.
Exemplo 4.2. Para uma partícula sem spin, cujo espaço de estado é Er , temos que J = L, logo
é imediato mostrar que R e P são operadores vetores pois:
[Lx , X] = [Y Pz − ZPy , X] = 0 (4.7a)

[Lx , Y ] = [Y Pz − ZPy , Y ] = −[ZPy , Y ] = i~Z (4.7b)
[Lx , Z] = [Y Pz − ZPy , Z] = [Y Pz , Z] = −i~Y (4.7c)
[Lx , Px ] = [Y Pz − ZPy , Px ] = 0 (4.8a)

[Lx , Py ] = [Y Pz − ZPy , Py ] = [Y Pz , Py ] = i~Pz (4.8b)
[Lx , Pz ] = [Y Pz − ZPy , Pz ] = −Py [Z, Pz ] = −i~Py . (4.8c)
Exemplo 4.3. Para uma partícula de spin S, cujo espaço de estado é Er ⊗ Es , J = L + S.

Neste caso os operadores L, S, R e P são vetores. Se levarmos em conta o fato de que todos os
operadores de spin, os quais atuam somente em Es , comutam com os operadores orbitais, os
quais atuam somente em Er , a prova destas propriedade seguem imediatamente dos exemplos
4.1 e 4.2.
Já os operadores do tipo L2 , L · S, etc, não são vetores, mas escalares. Outros operadores
vetores poderiam ser construídos, por exemplo:
R × S; (L · S) P; etc. (4.9)
Exemplo 4.4. Considere um sistema W formado pela união de dois sistemas W1 e W2 , no qual
W1 está no espaço de estados E1 e W2 está no espaço de estados E2 . Se V1 é um operador que
atua somente em E1 , e se este operador é vetor, então a extensão de V1 em E1 ⊗ E2 também é
um vetor. Por exemplo, para um sistema de dois elétrons, os operadores L1 , R1 , S2 , etc, são
vetores.

4.3. O teorema de Wigner-Eckart para operadores vetores
4.3 O teorema de Wigner-Eckart para operadores vetores
4.3.1 Elementos de matriz não-nulos de V na base padrão

Seja
V± = Vx ± iVy (4.10a)
J± = Jx ± iJy (4.10b)
então
[Jx , V± ] = [Jx , Vx ] ± i[Jx , Vy ] = 0 ± i(i~Vz ) = ∓~Vz (4.11a)

[Jy , V± ] = [Jy , Vx ] ± i[Jy , Vy ] = −i~Vz + 0 = −i~Vz (4.11b)
[Jz , V± ] = [Jz , Vx ] ± i[Jz , Vy ] = i~Vy ± i(−i~Vx ) = ±~V± (4.11c)
e segue que
[J+ , V+ ] = 0 [J− , V+ ] = −2~Vz (4.12a)

[J+ , V− ] = 2~Vz [J− , V− ] = 0. (4.12b)
Note que como [Jz , Vz ] = 0 e como Jz |k, j, mi = m~ |k, j, mi, então
hk, j, m|Vz |k 0 , j 0 , m0 i = vz (k, k 0 , j, j 0 )δm,m0 . (4.13)
Agora vamos calcular o elemento de matriz hk, j, m|V± |k 0 , j 0 , m0 i, e para isso usaremos o fato
de que:
[Jz , V± ] = ±~V± =⇒ Jz V± = V± Jz ± ~V± , (4.14)
logo
Jz (V± |k 0 , j 0 , m0 i) = V± Jz |k 0 , j 0 , m0 i ± ~V± |k 0 , j 0 , m0 i
Jz (V± |k 0 , j 0 , m0 i) = (m0 ± 1)~ (V± |k 0 , j 0 , m0 i) (4.15)
Essa relação indica que V± |k 0 , j 0 , m0 i é um autovetor de Jz com autovalor (m0 ± 1)~, logo
XX
V± |k 0 , j 0 , m0 i = Ck,j |k, j, m0 ± 1i . (4.16)
k j
Portanto, dois autovetores do operador hermitiano Jz associados a diferentes autovalores são

ortogonais, segue que o produto escalar hk, j, m|V± |k 0 , j 0 , m0 i é zero se m 6= m0 ± 1.
Em síntese obtivemos as seguintes regras de seleção para os elementos de matriz de V:
Vz =⇒ ∆m = m − m0 = 0 (4.17a)
V+ =⇒ ∆m = m − m0 = +1 (4.17b)
V− =⇒ ∆m = m − m0 = −1. (4.17c)

4.3.2 Proporcionalidade entre os elementos de matriz J e V dentro

de um subespaço E(k, j)
4.3.2.1 Elementos de matriz de V+ e V−
Como [J+ , V+ ] = 0, então temos que
hk, j, m + 2|J+ V+ |k, j, mi = hk, j, m + 2|V+ J+ |k, j, mi . (4.18)
Inserindo na expressão (4.18), entre os operadores J+ e V+ a completeza

X
|k 0 , l0 , m0 ihk 0 , l0 , m0 | = 1, (4.19)
k0 ,l0 ,m0
temos
X
hk, j, m + 2|J+ |k 0 , j 0 , m0 i hk 0 , j 0 , m0 |V+ |k, j, mi =
k0 ,l0 ,m0
X
hk, j, m + 2|V+ |k 0 , j 0 , m0 i hk 0 , j 0 , m0 |J+ |k, j, mi . (4.20)
k0 ,l0 ,m0
que após realizar a soma, temos
hk, j, m + 2|J+ |k, j, m + 1i hk, j, m + 1|V+ |k, j, mi =

hk, j, m + 2|V+ |k, j, m + 1i hk, j, m + 1|J+ |k, j, mi . (4.21)
a qual ainda pode ser escrita na seguinte forma

hk, j, m + 1|V+ |k, j, mi hk, j, m + 2|V+ |k, j, m + 1i
= (4.22)
hk, j, m + 1|J+ |k, j, mi hk, j, m + 2|J+ |k, j, m + 1i
Como os bras e os kets nesta expressão existem se j − 2 ≥ m ≥ −j, pode-se mostrar
imediatamente que nenhum dos denominadores vai a zero. Para m = −j, −j +1, . . . , j −3, j −2,
temos
hk, j, −j + 1|V+ |k, j, −ji hk, j, −j + 2|V+ |k, j, −j + 1i
= =
hk, j, −j + 1|J+ |k, j, −ji hk, j, −j + 2|J+ |k, j, −j + 1i
hk, j, j|V+ |k, j, j − 1i
...,= = α+ (k, j). (4.23)
hk, j, j|J+ |k, j, j − 1i
na qual o coeficiente α+ (k, j) é a razão entre estes elementos de matriz. Note que α+ (k, j)
depende somente dos índices k e j e não depende do índice m. Portanto, da relação (4.23),
podemos concluir que
hk, j, m|V+ |k, j, m0 i = α+ (k, j) hk, j, m|J+ |k, j, m0 i δm0 ,m−1 , (4.24)
o que relaciona os elementos de matriz dos operadores V+ e J+ .

Um procedimento análogo ao anterior, nos permite escrever a seguinte relação
hk, j, m|V− |k, j, m0 i = α− (k, j) hk, j, m|J− |k, j, m0 i δm0 ,m+1 , (4.25)
a qual relaciona os elementos de matriz dos operadores V− e J− .

4.3.2.2 Elementos de matriz de Vz
Para relacionar os elementos de matriz de Vz e Jz , usamos a relação de comutação [J− , V+ ] =

−2~Vz para calcular o seguinte elemento de matriz
hk, j, m|[J− , V+ ]|k, j, mi = −2~ hk, j, m|Vz |k, j, mi , (4.26)
expandindo o comutador, temos
− 2~ hk, j, m|Vz |k, j, mi = hk, j, m|(J− V+ − V+ J− )|k, j, mi . (4.27)
Inserindo a completeza (4.19) entre os operadores J− e V+ obtemos que

X
−2~ hk, j, m|Vz |k, j, mi = hk, j, m|J− |k 0 , l0 , m0 i hk 0 , l0 , m0 |V+ |k, j, mi − (4.28)
k0 ,l0 ,m0
X
hk, j, m|V+ |k 0 , l0 , m0 i hk 0 , l0 , m0 |J− |k, j, mi
k0 ,l0 ,m0
= hk, j, m|J− |k, l, m + 1i hk, l, m + 1|V+ |k, j, mi −

hk, j, m|V+ |k, l, m − 1i hk, l, m − 1|J− |k, j, mi
p
=~ j(j + 1) − m(m + 1) hk, j, m + 1|V+ |k, j, mi −
p
~ j(j + 1) − m(m − 1) hk, j, m|V+ |k, j, m − 1i (4.29)
Usando a relação (4.24), podemos reescrever a expressão (4.28) como

1 np
hk, j, m|Vz |k, j, mi = − α+ (k, j) j(j + 1) − m(m + 1) hk, j, m + 1|J+ |k, j, mi − (4.30)
2 o
p
j(j + 1) − m(m − 1) hk, j, m|J+ |k, j, m − 1i
1
= − α+ (k, j) {j(j + 1) − m(m + 1) − j(j + 1) + m(m − 1)}
2
=m~α+ (k, j) (4.31)
Similarmente, usando a relação de comutação [J+ , V− ] = 2~Vz para calcular o seguinte

elemento de matriz
hk, j, m|[J+ , V− ]|k, j, mi = 2~ hk, j, m|Vz |k, j, mi , (4.32)
obtemos que
hk, j, m|Vz |k, j, mi = m~α− (k, j) (4.33)
Da igualdade das relações (4.30) e (4.33), temos que
α+ (k, j) = α− (k, j) = α(k, j). (4.34)
E com isso temos então que
hk, j, m|Vz |k, j, m0 i = α(k, j) hk, j, m|Jz |k, j, m0 i (4.35a)

hk, j, m|V+ |k, j, m0 i = α(k, j) hk, j, m|J+ |k, j, m0 i (4.35b)
hk, j, m|V− |k, j, m0 i = α(k, j) hk, j, m|J− |k, j, m0 i (4.35c)

4.3.2.3 Generalização para uma componente arbitrária de V
Como qualquer uma das componentes do vetor V, pode ser escrita como uma combinação
linear de Vz , V+ e V− , ou seja
1 1
Vx = (V+ + V− ) e Vy = (V+ − V− ) . (4.36)
2 2i
Portanto, podemos escrever de forma geral que
hk, j, m|V|k, j, m0 i = α(k, j) hk, j, m|J|k, j, m0 i , (4.37)
portanto, dentro do espaço de estados E(k, j), todos os elementos de matriz de V são proporcio-
nais aqueles de J. Esse resultado expressa o teorema de Wigner-Eckart, para um caso especial.
Introduzindo as “restrições” de V e J em E(k, j), podemos escrever:
P (k, j)VP (k, j) = α(k, j)P (k, j)JP (k, j) (4.38)
Note que,
X
P (k, j) = |k, j, mi hk, j, m| (4.39)
m
logo
P 2 (k, j) = P (k, j)P (k, j)

XX
= |k, j, mi hk, j, m | k, j, m0 i hk, j, m0 |
m m0
X
= |k, j, mi hk, j, m|
m
= P (k, j).
4.3.2.4 Cálculo da constante de proporcionalidade: O teorema da projeção
É fácil ver que:

[Jz , P (k, j)] = 0 e [J± , P (k, j)] = 0, (4.40)
e como
1 1
J= (J+ + J− ) êx + (J+ − J− ) êy + Jz êz (4.41)
2 2i
então segue imediatamente que
[J, P (k, j)] = 0. (4.42)
Considere o operador J·V, e sua restrição a E(k, j) é P (k, j)J·VP (k, j). Como P (k, j)VP (k, j) =
α(k, j)P (k, j)JP (k, j), segue então que
P (k, j)J · VP (k, j) = J · (P (k, j)VP (k, j))

= J · [α(k, j)P (k, j)JP (k, j)]
= α(k, j)P (k, j)J2 P (k, j)
= α(k, j) (JP (k, j))2
= α(k, j)J2 P (k, j)
= j(j + 1)~2 α(k, j)P (k, j)

Assim
P (k, j)J · VP (k, j) = j(j + 1)~2 α(k, j)P (k, j) (4.43)
A restrição ao espaço E(k, j) do operador J · V é portanto igual ao operador identidade
multiplicado por j(j + 1)~2 α(k, j). Portanto, se |ψik,j denota um estado normalizado e arbitrário
pertencente ao subespaço E(k, j), o valor médio hJ · Vik,j de J · V é independente do ket |ψk,j i
escolhido, desde que:
hJ · Vik,j = hψk,j |J · V|ψk,j i = α(k, j)j(j + 1)~2 . (4.44)
Note ainda que:

hJ · Jik,j = hJ2 ik,j = j(j + 1)~2 . (4.45)
j
Logo substituindo estes resultados em (4.38),
obtemos:
hJ · Vik,j
P (k, j)VP (k, j) = P (k, j)JP (k, j)
j(j + 1)~2
hJ · Vik,j
= P (k, j)JP (k, j)
hJ2 ik,j
(4.46)
Vk ou ainda
V V=
hJ · Vik,j
J =
hJ · Vik,j
J. (4.47)
hJ2 ik,j j(j + 1)~2
Figura 4.1: Aqui mostramos a projeção de V
sobre j. Este resultado é chamado de “teorema da pro-
jeção”. Deste modo, todo o sistema físico, no qual
tratamos com estados pertencentes ao mesmo su-
bespaço E(k, j), podemos considerar que todos os operadores vetores são proporcionais a J.
Interpretação clássica Se j denota o momentum angular total de um sistema físico qualquer

isolado, todas as quantidades físicas atreladas ao sistema giram em torno de j, que é um vetor
constante. Em particular, para uma quantidade vetorial V, tudo o que sobra após uma média
temporal é sua projeção Vq em j, isto é, um vetor paralelo a j, dado por
j·V
Vq = j. (4.48)
j2
4.3.2.5 Comentários
1. Não pode ser deduzido de (4.47) que, no espaço de estados total (a soma direta de
todos os subespaços E(k, j)), V e J são proporcionais. Deve-se notar que a constante de
proporcionalidade α(k, j) ou hJ · Vik,j depende do subespaço E(k, j)) escolhido. Além
disso, qualquer operador vetor V pode possuir elementos de matriz não-nulos entre os
kets pertencentes a diferentes subespaços E(k, j)), enquanto os correspondentes elementos
de J são sempre zero.

4.4. Aplicação: Cálculo do fator de Landé gj de um nível atômico
2. Considere um segundo operador vetor W. Assim como V a sua restrição em E(k, j) é que
ele é proporcional a J. Portanto, dentro de um subespaço E(k, j), todos os operadores
vetores são proporcionais.
Entretanto, para calcular o coeficiente de proporcionalidade entre V e W, não podemos

simplesmente trocar J por W em (4.47). Na prova da relação (4.47), usamos o fato de
que J comuta com P (k, j), o que não é geral no caso de W. Para calcular este coeficiente
de proporcionalidade corretamente, devemos notar que, dentro do subespaço E(k, j):
hJ · Wik,j hJ2 ik,j

W= J ou J= W. (4.49)
hJ2 ik,j hJ · Wik,j
isolando J na expressão acima e substituindo na expressão para V obtemos
hJ · Vik,j
V= W (4.50)
hJ · Wik,j
4.4 Aplicação: Cálculo do fator de Landé gj de um nível

atômico
Aplicaremos o teorema de Wigner-Eckart para calcular os efeitos do campo magnético B sobre
os níveis de energia de um átomo. Veremos que o uso do teorema simplifica consideravelmente os
cálculos, e nos permite prever que, de modo geral, o campo magnético remove degenerescências,
causando o aparecimento de níveis de energia equidistantes (em primeira ordem do campo
magnético B). A diferença de energia entre estes níveis é proporcional a B e a constante gj (o
fator de Landé) o qual será calculado.
Seja L, o momentum angular orbital total dos elétrons de um átomo, ou seja,
X
L= Li (4.51)
i
e S, o seu momentum angular de spin

X
S= Si (4.52)
i
então o momentum angular interno total do átomo é:
J = L + S. (4.53)
Seja H0 o hamiltoniano do átomo na ausência de campo magnético, e ele satisfaz as seguintes

relações de comutação:
[H0 , J] = [H0 , J2 ] = [H0 , L2 ] = [H0 , S2 ] = [H0 , Jz ] = 0. (4.54)

Consideremos, então que H0 , L2 , S2 , J2 e Jz formam um conjunto completo de operadores

que comutam entre-si, formando uma base completa {|E0 , L, S, J, M i} cujos operadores são:
H0 |E0 , L, S, J, M i = E0 |E0 , L, S, J, M i (4.55)

L2 |E0 , L, S, J, M i = L(L + 1)~2 |E0 , L, S, J, M i (4.56)
S2 |E0 , L, S, J, M i = S(S + 1)~2 |E0 , L, S, J, M i (4.57)
J2 |E0 , L, S, J, M i = J(J + 1)~2 |E0 , L, S, J, M i (4.58)
Jz |E0 , L, S, J, M i = M ~ |E0 , L, S, J, M i . (4.59)
Esta hipótese é válida para um certo número de átomos leves para os quais o acoplamento
do momentum angular é do tipo L · S. Entretanto, para os átomos que possuem um outro
tipo de acoplamento este não é mais o caso. Cálculos baseados no teorema de Wigner-Eckart,
similares aos que faremos aqui, podem ser feitos, e a ideia física central permanecerá a mesma.
Por questão de simplicidade consideraremos que L e S são bons números quânticos, para os
sistemas atômicos que iremos estudar.
4.4.1 Degenerescência rotacional: Multípletos

Considere o ket J± |E0 , L, S, J, M i, como J± comuta com L2 , S2 , J2 e Jz então ele também
comuta com H0 ; portanto J± |E0 , L, S, J, M i é um autovetor de H0 com autovalor E0 . Além
disso
p
J± |E0 , L, S, J, M i = ~ J(J + 1) − M (M ± 1) |E0 , L, S, J, M ± 1i (4.60)
A degenerescência essencial
−J ≤M ≤J =⇒ (2J + 1)-vezes degenerado (4.61)
Este é um multípleto.
4.4.2 Remoção da degenerescência por um campo magnético

Na presença de um campo magnético B = Bêz , temos
H = H0 + H1 , (4.62)
com
H1 = ωL (Lz + 2Sz ) (4.63)
(o fator 2 antes de Sz , surge da razão giromagnética do spin do elétron). A frequência angular

de “Larmor” ωL do elétron é definida em termos de sua massa m e de sua carga q por:
−qB µB q~
ωL = = − B, com µB = . (4.64)
2m ~ 2m
Para calcularmos os efeitos do campo magnético sobre os níveis de energia do átomo,

consideraremos somente os elementos de matriz de H1 dentro do subespaço E(E0 , L, S, J)
associado ao multípleto em estudo.
No subespaço E(E0 , L, S, J), de acordo com o teorema da projeção temos:
hJ · Li hJ · Si
L= J e S= J (4.65)
J(J + 1)~2 J(J + 1)~2
em que hJ · Li e hJ · Si são os valores médios dos operadores J · L e J · S, nos estado do sistema

pertencentes a E(E0 , L, S, J).
Assim, como
1 2
L · J = L · (L + S) = L2 + J − L2 − S2

(4.66a)
2
2 1 2
J − L2 − S2

S · J = S · (L + S) = S + (4.66b)
2
segue então que
~2
hL · Ji = L(L + 1)~2 + (J(J + 1) − L(L + 1) − S(S + 1)) (4.67a)
2
~2
hS · Ji = S(S + 1)~2 + (J(J + 1) − L(L + 1) − S(S + 1)) (4.67b)
2
Substituindo as equações (4.67) em (4.65), e o resultado em (4.63), obtemos que
H1 = gj ωL Jz (4.68)
na qual o fator de Landé gj é
3 S(S + 1) − L(L + 1)
gj = + . (4.69)
2 2J(J + 1)
A relação (4.68) implica que os autoestados de H1 no subespaço E(E0 , L, S, J) são simples-

mente os vetores base |E0 , L, S, J, M i com autovalores
E1 (M ) = gj M ~ωL . (4.70)
Portanto, vimos que o campo magnético remove a degenerescência dos multípletos.

M
E
+ 52
+ 32
+ 12
5
E0
J= 2 − 12
− 32
− 52
Figura 4.2: Diagrama de energia mostrando a remoção das (2J + 1) degenerescências de um multipleto
(aqui J = 5/2) por um campo magnético B. A distância entre dois níveis de energias adjacentes são
proporcionais ao campo B e ao fator de Landé gJ .


Capítulo 5
Teoria de Perturbação Independente do

Tempo
5.1 Introdução
A mecânica quântica de sistemas físicos conservativos, isto é, de sistemas cujos hamiltonianos
não dependem explicitamente do tempo, está baseada na equação autovalores do operador
hamiltoniano, ou seja, na equação de Schrödinger. Para ambos, o oscilador harmônico e o
átomo de hidrogênio, suas respectivas equações de autovalores possuem uma solução analítica
exata, e devido essa sua simplicidade eles são dois importantes modelos de sistemas físicos,
com diversas aplicações. Note que na mecânica quântica, obter a solução exata de um sistema
físico é um fato raro e há somente um pequeno número de sistemas físicos em que isso ocorre.
Em geral, a equação de autovalores é complicada o suficiente para que sejamos capazes de
encontrar suas soluções analíticas. Por exemplo, não é conhecida uma forma de tratar átomos
de muitos elétrons, exatamente, mesmo o mais simples deles o átomo de hélio. Além disso, o
modelo teórico do átomo de hidrogênio o qual possui uma solução analítica leva em conta apenas
a interação eletrostática entre o próton e o elétron; quando correções relativistas (tal como
forças magnéticas) são adicionados a esta interação principal, a equação obtida para o átomo de
hidrogênio não pode ser resolvida analiticamente. Em tais casos, frequentemente recorre-se a
uma solução numérica para o problema, a qual dependendo do tamanho do sistema, poderá ou
não ser resolvida numericamente devido ao esforço computacional. No entanto, existem métodos
de aproximação que em certos casos, nos permitem obter soluções analiticamente aproximados
da equação de autovalores básica. O estudo a seguir será voltado para um destes métodos mais
conhecidos como “teoria de perturbação estacionária”. Posteriormente, avançaremos mais um
pouco e iremos estudar a “teoria de perturbação dependente do tempo”, a qual será usada para
tratar sistemas cujos hamiltonianos contém termos dependentes explicitamente do tempo.
A teoria de perturbação estacionária é muito usada na mecânica quântica, uma vez que
ela corresponde muito bem à abordagem usual dada aos problemas físicos. Ao estudar um
fenômeno ou um sistema físico, começa-se por isolar os efeitos principais que são responsáveis
pelas principais características deste fenômeno ou este sistema. Quando forem compreendidas,
77
5.2. Método de Rayleigh-Schrödinger: Formulação do Problema
tenta-se explicar os detalhes “finos”, levando em conta os efeitos menos importantes que foram
negligenciadas na primeira aproximação. É no tratamento destes efeitos secundários que
geralmente usa-se uma teoria de perturbação. Posteriormente, será visto a relevância da teoria
de perturbação na física atômica: ela nos permitirá calcular, no caso do átomo de hidrogênio, as
correções relativistas. Da mesma forma, o tratamento que será dado ao átomo de hélio, indica
como teoria de perturbação permite que átomos de muitos elétrons sejam tratados. Inúmeras
outras aplicações da teoria de perturbação são dadas.
5.2 Método de Rayleigh-Schrödinger: Formulação do Pro-

blema
Aqui serão tratados os problemas que não podem ser resolvidos exatamente, o que significa
que deve-se recorrer a algum tipo de aproximação ou método aproximado. Dentre os métodos
disponíveis para tal, encontra-se a família dos métodos de perturbativos. Esses métodos em
geral, iniciam determinando um sistema não perturbado que seja exatamente solúvel e mais
próximo possível do problema em questão. O hamiltoniano de interação H é expresso como uma
soma de duas partes: a primeira parte corresponde ao hamiltoniano do sistema não perturbado
H0 , cuja solução é conhecida, enquanto a segunda parte é dada pelo novo termo de interação
W , assim o hamiltoniano do sistema é dado por
H = H0 + W.
Dessa forma, o problema é resolvido essencialmente como uma série de potências na força deste
termo de interação.
Portanto, a teoria de perturbação independente do tempo é aplicável quando o problema de
autovalores tem a seguinte forma
H |ψn i = (H0 + W ) |ψn i = En |ψn i (5.1)
na qual H0 e W são operadores lineares hermitianos e W pode ser considerado como uma
perturbação de H0 . Considere por exemplo o caso em que W = λV , no qual λ é um pequeno
parâmetro, λ 1, e nesse caso, W H0 , ou seja,
W = λV Para λ 1. λ ∈ R (5.2)
Além disso, será considerado que os autovalores e autovetores de H0 são conhecidos. O operador
H0 , o qual é independente do tempo é chamado de hamiltoniano não-perturbado, enquanto o
operador W é conhecido como perturbação. Se W for independente do tempo, diz-se que a
perturbação é estacionária. O problema agora é encontrar as modificações nos níveis de energia
de H0 introduzidas pela perturbação W .
A solução conhecida do problema não-perturbado é

H0 ϕ(i)
n = E (0) (i)
n ϕn , (5.3)

E(λ)
E40
E30
E20
E10 λ
λ1
Figura 5.1: Variação dos autovalores de E(λ) do hamiltoniano H(λ) = H0 + λV com relação a
λ. Cada curva corresponde a um autoestado de H(λ). Para λ = 0, obtém-se o espectro de H0 .
Aqui os autovalores de H0 , E30 e E40 são duplamente degenerados. A perturbação W = λV remove a
degenerescência de E30 mas não de E40 . Além disso, para λ = λ1 surge uma degenerescência adicional.
E
(0) (i)
a qual possui um espectro de energia En
discreto. Note que o conjunto de vetores ϕn
formam uma base ortonormal no espaço de estados, ou seja,
gn

(i) (j) XX (i)
(i)
ϕm ϕn = δm,n δi,j com ϕn ϕn = 1. (5.4)
n i=1
E
(i) (0)
Aqui, os índice i dos vetores de estado ϕn permite, no caso de autovalores degenerados En ,
que haja uma distinção entre os vários vetores de estado da base ortonormal.
Quanto ao problema perturbado, é razoável considerar que seus autovetores e seus autovalores
diferem apenas ligeiramente dos valores não-perturbados. Além disso, pode-se representar por
|ψn i e En o par característico (um par característico é a função característica
do E autovetor |ψn i
(i) (0)
com o seu correspondente autovalor En ) de H = H0 + W , que se reduz a ϕn e En , quando
λ → 0, pois W é proporcional a um pequeno parâmetro λ (ou seja, W = λV ) e nesse caso
H(λ) = H0 + λV, (5.5)
então
H(λ) |ψn (λ)i = (H0 + λV ) |ψn (λ)i = En (λ) |ψn (λ)i (5.6)
mas com a condição de que

lim H(λ) = H0 ; lim E(λ) = En(0) ; lim |ψn (λ)i = ϕ(i)
n (5.7)
λ→0 λ→0 λ→0
na qual a contribuição de W desaparece. Entretanto, para usar uma método perturbativo

deve-se ter em conta que

Nota
Usar uma teoria de perturbação só faz sentido se o problema em questão
for suficientemente semelhante ao problema original cujas soluções são
conhecidas exatamente.
O método de perturbação depende de obtenção das soluções como uma série de potências
em λ. A hipótese central é que essas séries de potências sejam convergentes e que as soluções
sejam funções suaves e contínuas do parâmetro λ, para que se possa obter a solução necessária
no caso em que λ = 1.
No que segue, será considerado
que E os níveis não perturbados são não degenerados o que
(0) (0)
significa que uma única função ψn está associada ao autovalor En e que portanto, En e
|ψn (λ)i podem ser expandidos em uma série de potências infinita em λ (uma “série perturbativa”),
da seguinte forma
∞
X
En = En(0) +λ 1
En(1) +λ2
En(2) + ... = λi En(i) (5.8)
i=0
∞
X

|ψn i = ψn(0) + λ ψn(1) + λ2 ψn(2) + . . . = λi ψn(i)

(5.9)
i=0
Note que, essa é uma condição fundamental para a solução do problema.

Substituindo (5.8) e (5.9) em (5.6), obtém-se
"∞ # "∞ #" ∞ #
X X X
λk ψn(k) = λk En(k) λj ψn(j) ,

(H0 + λV ) (5.10)
k=0 k=0 j=0
e ao expandirmos ambos os lados da igualdade encontra-se que

H0 ψn(0) + λ H0 ψn(1) + V ψn(0) + λ2 H0 ψn(2) + V ψn(1) + . . . =

En(0) ψn(0) + λ En(0) ψn(1) + En(1) ψn(0) + λ2 En(0) ψn(2) + En(1) ψn(1) + En(2) ψn(0) + . . .

(5.11)
Agora impõe-se que essa equação seja satisfeita para um λ qualquer pequeno e arbitrário. Ao
movermos todos os termos do lado direito para o lado esquerdo, a série acima toma a seguinte
forma
A + λB + λ2 C + · · · = 0. (5.12)
A validade da série acima para um valor qualquer de λ 1, implica que
A = B = C = · · · = 0.
Com isso, separa-se em ambos os lados da igualdade em (5.11) os termos que tem a mesma
ordem de grandeza em λ, o que resulta em
• Ordem zero em λ:

H0 − En(0) ψn(0) = 0;

(5.13)

• Primeira ordem em λ:

H0 − En(0) ψn(1) + V − En(1) ψn(0) = 0;

(5.14)
• Segunda ordem em λ:

H0 − En(0) ψn(2) + V − En(1) ψn(1) − En(2) ψn(0) = 0

(5.15)
• j-ésima ordem em λ:

H0 − En(0) ψn(j) + V − En(1) ψn(j−1) − En(2) ψn(j−2) − · · · − En(j) ψn(0) = 0

(5.16)
E
(i)
Essas equações podem ser escritas em termos dos autovetores conhecidos ϕn e do autovalores
(0)
conhecidos En , entretanto,paraE isso, deve-se calcular o produto escalar destas equações com
(i)
os vetores não-perturbados ϕn e usar os resultados da aproximação de ordem (k − 1) para
calcular os de ordem k, como veremos a seguir.
5.2.1 Autovetores
Antes de prosseguirmos, devemos lembrar que a equação de autovalores (5.6) define |ψn (λ)i
a menos de um fator constante, o qual é definido ao escolhermos sua norma
D e fase:
impõe-se
E que
(0)
|ψn (λ)i seja normalizado e que sua fase seja tal que o produto escalar ψn ψ(λ) seja real.
E
(0)
Para a ordem zero, isso implica que o vetor de estado ψn deve ser normalizado,

ψn(0) ψn(0) = 1.

(5.17)
Entretanto, sua fase ainda permanece arbitrária. Na aproximação de primeira ordem, temos que

ψn(0) + λ ψn(1) ψn(0) + λ ψn(1) + O(λ2 )

hψn (λ)| ψn (λ)i =

= ψn(0) ψn(0) + λ ψn(1) ψn(0) + ψn(0) ψn(1) + O(λ2 )

(5.18)
na qual o símbolo O(λn ) significa termos da ordem de λn ou mais alta. Usando o fato de que
|ψn (λ)i deve ser normalizado e (5.17), encontra-se que

ψn(1) ψn(0) + ψn(0) ψn(1) = 0,

λ
D E
(0) (1)
mas como o produto escalar ψn ψn pode ser um número complexo, e na expressão acima
soma-se um número com seu complexo conjugado, logo isso implica que

< ψn(1) ψn(0) = < ψn(0) ψn(1) = 0,

(5.19)
D E
(1) (0)
logo pode-se dizer que ψn ψn = ic, com c ∈ R, esse elemento de matriz é um número
imaginário puro.

5.3. Correções para um nível não-degenerado
De modo análogo, para a aproximação de segunda ordem temos que

ψn(0) + λ ψn(1) + λ2 ψn(2) ψn(0) + λ ψn(1) + λ2 ψn(2) + O(λ3 )

hψn (λ)| ψn (λ)i =

= ψn(0) ψn(0) + λ ψn(1) ψn(0) + ψn(0) ψn(1) +

λ2 ψn(2) ψn(0) + ψn(1) ψn(1) + ψn(0) ψn(2) + O(λ3 )

(5.20)
Usando o fato de que |ψn (λ)i deve ser normalizado e as equações (5.17) e (5.19), encontra-se
que

λ2 ψn(2) ψn(0) + ψn(1) ψn(1) + ψn(0) ψn(2) = 0,

D E
(0) (2)
mas com um raciocínio análogo ao caso anterior, pode-se concluir que produto escalar ψn ψn 6=
0 e possui uma parte real não nula, a qual é dada por
1

ψn(2) ψn(0) = < ψn(0) ψn(2) = − ψn(1) ψn(1) .

< (5.21)
2
Com argumentos análogos aos anteriores, para a aproximação de ordem k chega-se ao seguinte
resultado,

ψn(k) ψn(0) = < ψn(0) ψn(k)

<
1
(k−1) (1)
(k−2) (2)
= − ψn ψn + ψn ψn + · · ·
2

+ ψn(2) ψn(k−2) + ψn(1) ψn(k−1) .

(5.22)
E
(0)
Note, que a equação (5.13) expressa o fato de ψn é um autovetor de H0 com autovalor
(0) (0)
En , portanto o autovalor En pertence ao espectro de H0 . Esse resultado já era esperado, já
que cada autovalor de H(λ), quando λ → 0, deve se aproximar do valor de uma das energias
(0)
não-perturbadas En .
5.3 Correções para um nível não-degenerado

(0)
Agora será considerado o caso de um autovalor En não-degenerado do hamiltoniano não
perturbado H0 . Associado a esse autovalor está o autovetor |ϕn i, o qual é único a não ser
por um fator de fase constante. Determinaremos as modificações introduzidas, na energia não
perturbada e no seu correspondente autovetor, pela adição da perturbação W ao hamiltoniano
H0 do sistema.
Para isso, serão usadas as equações perturbativas que vão da equação (5.13) até (5.16), assim
como as condições que vão da equação (5.17) até (5.22). Para o autovalor de H(λ) o qual se
(0) (0)
aproxima
Ede En quando λ → 0, tem-se que En (λ) = En oE que, de acordo com (5.13) implica
(0) (0)
que ψn deve ser proporcional a |ϕn i. Os vetores ψn e |ϕn i são ambos normalizados e
nesse caso, escolhe-se uma fase adequada de modo que
(0)
ψn = |ϕn i . (5.23)
Portanto, quando λ → 0, obtém-se o estado não perturbado |ϕn i com a mesma fase.

Chamando de En (λ) os autovalores de H(λ) os quais, quando λ → 0, se aproxima do

(0)
autovalor En de H0 . Será considerado que λ é pequeno o suficiente de modo que esse autovalor
permaneça não-degenerado, isto é, haverá um único autovetor |ψn (λ)i correspondente a ele. A
seguir serão calculados os primeiros termos da expansão de En (λ) e |ψn (λ)i em potências de λ.
5.3.1 Correção de primeira ordem

A seguir serão obtidas as correções em primeira ordem tanto para os autovalores, a energia,
quanto para o autovetores, as funções de onda. Ao limitarmos a correção somente aos termos
de primeira ordem em λ, e usando (5.23), pode-se escrever que
|ψn i ∼ En ∼

= |ϕn i + λ ψn(1) = En(0) + λEn(1) .

e (5.24)
5.3.1.1 Correção em primeira ordem na energia
Dá equação (5.14), tem-se que:

H0 − En(0) ψn(1) + V − En(1) ψn(0) = 0

E
(0)
Projetando essa equação sobre o vetor |ϕn i = ψn , obtém-se

(0)
ψn H0 − En(0) ψn(1) + ψn(0) V − En(1) ψn(0) = 0

(5.25)
Note que devido a condição (5.19), o primeiro termo da equação acima é nulo, pois como H0
é um operador hermitiano, então
D
ψn H0 ψn(1) = H0† ψn(0) ψn(1) = En(0) ψn(0) ψn(1) ,

(0)

(5.26)
logo,

ψn(0) H0 − En(0) ψn(1) = En(0) − En(0) ψn(0) ψn(1) = 0,

portanto, chega-se em

En(1) = ψn(0) V ψn(0) = hϕn | V | ϕn i .

(5.27)
A seguinte notação para os elementos de matriz

Vnn = ψn(0) V ψn(0) = hϕn | V | ϕn i ,

(5.28)
é muito comum, e será usada de agora em diante.

(0)
No caso de um estado não degenerado com energia En , o autovalor En (λ) de H o qual
(0)
corresponde em primeira ordem a energia En pode ser escrito, em primeira ordem de perturbação,
com W = λV , como
E(λ) = En(0) + Wnn + O(λ2 ) = En(0) + hϕn | λV | ϕn i + O(λ2 ). (5.29)

Nota
A correção em primeira ordem, para uma energia não degenerada
(0)
En , é simplesmente igual a sua soma com o valor médio Wnn do
termo perturbativo W no estado não perturbado |ϕn i, ou seja, En =
(0)
En + Wnn .
5.3.1.2 Correção em primeira ordem do autovetor
A seguir serão calculadas as correções de primeira ordem dos autovetores não perturbados.
Note que a projeção (5.25) não exauri toda a informação contida em (5.14) e que além disso, a
hipótese que está sendo usada é a de que somente o autoestado |ϕn i de H0 é não degenerado,
porém nada sabemos sobre os seus outros autoestados, portanto, será considerado E que eles podem
(i)
ser degenerados, assim, um autovetor qualquer de H0 será referido como ϕ` , com ` 6= n, onde
o índice i = 1, . . . , g` , representa a degenerescência deste nível de energia. Será considerado que
o conjunto dos autovetores não-perturbados de H0 constitui uma base ortonormal completa
conforme
E(5.4), o que significa que ele pode ser usado como base para nosso espaço de estados e
(1)
que ψn pode ser escrito como uma superposição linear dos autovetores não-perturbados,
gm
(1) X X
(j) (j)

ψn = Bnm ϕm , (5.30)
m j=1
em que a soma pode ser finita ou infinita,

dependendo
E da natureza do espaço de estados. Logo
(i)
o produto interno dessa expressão, com ϕ` fornece
D gm
E XX D gm
E XX
(i) (1) (j) (i) (j) (j) (i)
ϕ` ψn = Bnm ϕ` ϕm = Bnm δ`m δi,j = Bn` com n 6= `
m j=1 m j=1
E E
(0) (i)
Lembrando-se que |ϕn i = ψn , ao projetar o ket ϕ` em (5.14), obtém-se que
D E D E
(i) (0) (1) (i) (1)
ϕ` H0 − En ψn + ϕ` V − En ϕn = 0,
substituindo (5.30) nessa expressão tem-se que
gm D E D E gm D D E
XX (i) (i)
XX (i)
(i)
(j) (j) (0) (j)
ϕ` ϕ(j) (1)

Bnm ϕ` H0 ϕm + ϕ` V ϕn = En Bnm +E ϕ ` ϕn .

m n
m j=1 m j=1
E (5.31)
(i)
Como os autovalores são não-degenerados, os autovetores ϕm são ortogonais entre si, de
maneira que
D E D E
(i) (i)
ϕ` ϕ(j)
m = δ`m δi,j ϕ` ϕn = 0 (pois n 6= ` ), (5.32)
isso reduz a nossa equação à seguinte forma

D E
(0) (i) (i) (i)
E` Bn` + ϕ` V ϕn = En(0) Bn` (` 6= n).

D E
(i)
A quantidade V`n = ϕ` V ϕn é chamada de elemento matriz do operador V entre os

(i)
vetores (estados) indexados por ` e por n. Isolando Bn` tem-se
(i) V`n
Bn` = (0) (0)
(` 6= n). (5.33)
En − E`
E
(1)
Portanto, pode-se escrever o autovetor ψn como
D E
g (i)
ϕ` V ϕn E

(1) X X̀ (i)
ψn = ϕ` (5.34)
(0) (0)
`6=n i=1 En − E`
consequentemente, para a primeira ordem de perturbação W = λV , o autovetor |ψn (λ)i de H

correspondendo ao estado não perturbado |ϕn i pode ser escrito como
D E
g (i)
ϕ` V ϕn (i)
E
X X̀
|ψn (λ)i = |ϕn i + (0) (0)
ϕ` + O(λ2 ). (5.35)
`6=n i=1 En − E`
E
(1)
A expressão (5.33) determina todos os coeficientes no termo de correção ψn , exceto
um, ou seja, o coeficiente Bnn . Para obter alguma informação sobre BnnE, será usadaE uma
condição adicional. Exigiremos que os autovetores aproximados |ψn i ∼
(0) (1)
= ψn + λ ψn sejam

normalizados, pelo menos em primeira ordem.

Em geral, ao tomar o produto interno de |ψm i e |ψn i, tem-se que
hψm |ψn i ∼

(0) (0)
(0) (1)
(1) (0)
(1) (1) 2
= ψm ψn + λ ψm ψn + λ ψm ψn + ψm ψn λ
hψm |ψn i ∼

(0) (0)
(0) (1)
(1) (0)
= ψm ψn + ψm ψn + ψm ψn
D E
(0) (0)
conservando somente os termos de primeira ordem. Se m = 6 n, então ψm n = 0 e os dois
ψ
(i) (i) (i)
termos restantes se reduzirão a Bnm + Bmn , que se anulam devido à fórmula para Bnm e devido
ao fato de que V é um operador hermitiano, então
(0)
† (0) (0)
(0) (0)
(0) (0) ∗ ∗
Vnm = ψn(0) V ψm

= V ψn ψm = V ψn ψm = ψm V ψn = Vmn . (5.36)
Por conseguinte, os autovetores perturbados permanecem ortogonais entre si. Fazendo m = n

(i)
e exigindo que hψn |ψn i = 1 nessa aproximação, então obtém-se a seguinte condição sobre Bnm
hψn | ψn i ∼

= ψn(0) ψn(0) + ψn(0) ψn(1) + ψn(1) ψn(0)

gm gm
1∼
XX
(0) (0) X X
(0) (0)
(i) (i)
=1+ Bnm ψn ψm +
Bnm ψm ψn
m i=1 m i=1

∗
Bnn + Bnn = 0. (5.37)
Para os espaços de estados os quais sejam espaços reais, esta condição exigirá imediatamente
que Bnn = 0. Por outro lado, se o espaço for complexo, pode-se afirmar somente que <(Bnn ) = 0,
enquanto que Im(Bnn ) permanece indeterminado. Neste ponto, deve-se ressaltar que: um
autovetor complexo, mesmo de módulo unitário, não é de nenhuma maneira único, pois pode
ainda ser multiplicado por um fator de fase eiα com fase real α arbitrária. Se escolhermos
arbitrariamente, como Bnn , um certo número imaginário puro Bnn = iδ, onde δ é real e de
primeira ordem, então o autovetor perturbado será
gm
∼
(0) (0) X X
(i) (0)

|ψn i = ψn + iδ ψn +
Bnm ψm . (5.38)
m6=n i=1
E
(0)
No entanto, isto pode ser simplesmente interpretado como se o vetor não-perturbado ψn
(iδ)2
tenha sido pré multiplicado por eiδ , pois eiδ = 1 + iδ + 2!
+ . . ..
Com isso, pode-se escrever, em primeira ordem que
eiδ ψn(0) ∼
(0)
= ψn + iδ ψn(0) .

E E
(0) (0)
É evidente que eiδ ψn é sempre aceitável, em vez de simplesmente ψn , como sendo o
(i)
vetor original não-perturbado, e isso equivale à escolha de Bnm = 0, na teoria de perturbação de
primeira ordem.
Sobre o fator de fase eiδ , pode-se salientar que sempre que forem usados espaços de estados
complexos na mecânica quântica, as quantidades fisicamente mensuráveis serão do tipo hψ| O |ψi,
onde O é um operador. Essas quantidades não são afetadas pelo fator de fase.
Então, o autovetor e o seu respectivo autovalor são dados por
X Wmn (0)
|ψn i = ψn(0) + (0) (0)
· ψm (5.39)
m6=n En − Em
En = En(0) + Wnn (5.40)
5.3.2 Correção de Segunda Ordem: energia

Começando com a equação de ordem zero, vemos que está trivialmente satisfeita. A equação
de primeira ordem é exatamente a mesma da seção precedente. Efetuando as mesmas operações
que antes, temos ainda as fórmulas
Vmn
En(1) = Vnn (i)
Bnm = (0) (0)
(m 6= n).
En − Em
No entanto, devemos rever as afirmativas feitas sobre os coeficientes Bnn , pois estes eram limi-
tados a aproximações de primeira ordem. Se desejarmos utilizar uma condição de normalização
de segunda ordem, deveremos primeiro investigar as correções de segunda ordem.

E
(0)
O produto interno da equação de segunda ordem (5.15) com ψn é determinado ao
E
(0)
considerar o fato de que H0 é hermitiano e que é ψn normalizado, ou seja

(0)
(0) (0)
ψn H0 ψn(2) = En(0) ψn(0) ψn(2)

e ψn ψn = 1
então

(0)
ψn H0 ψn(2) + ψn(0) V ψn(1) = En(0) ψn(0) ψn(2) +En(1) ψn(0) ψn(1) +En(2) ψn(0) ψn(0) , (5.41)

Logo obtém-se que

En(0) ψn(0) ψn(2) + ψn(0) V ψn(1) = En(0) ψn(0) ψn(2) + En(1) ψn(0) ψn(1) + En(2)

(0) (1)
ψn V ψn = En(1) ψn(0) ψn(1) + En(2)

(5.42)
Ao usarmos a expansão (5.30), as relações de ortonormalização (5.32) e o resultado de

(1)
primeira ordem En = Vnn a equação (5.27), a expressão (5.42) transforma-se na seguinte
relação
gm
XX
(i)
Vnm Bnm = En(1) Bnn + En(2) (5.43)
m i=1
Observe que os termos contendo Bnn se cancelam, e a equação fornece
gm
X X
En(2) = (i)
Bnm Vnm
m6=n i=1
ou, explicitamente, substituindo (5.33), teremosVnm
D ED E D E2
gm (i) (i) gm ϕ(i) W ϕ
ϕn W ϕm ϕm W ϕn

X Vnm Vmn X X X X m n
En(2) = (0) (0)
= (0) (0)
= (0) (0)
,
m6=n En − Em m6=n i=1 En − Em m6=n i=1 En − Em
(5.44)
(2)
A correção de segunda
E daEenergia En , é obtida através da realização de um somatório
ordem E
(0) (j) (0)
por todos os estados ψm = ϕm com m 6= n, como indicado em (5.44). Os estados ψm
sobre a qual o somatório é realizado muitas vezes são chamados de estados “intermediários”. A
partir do somatório de (5.44), é comum interpretar cada termo desta soma como uma sucessão
de duas transições de primeira
Eordem, ponderada pela diferença em energia do denominador
(0) (0) (0)
En − Em , entre o estado ψn que o sistema sai e propaga-se, ou seja, “visita todos os estado
E E
(0) (0)
intermediárioψm possíveis e, em seguida, retorna” para o estado inicial ψn . Também
pode-se observar a partir de (5.44) que, se o nível n que estamos estudando corresponde ao
(0) (0)
estado fundamental do sistema, então a diferença de energia do denominador En − Em < 0

(2)
para m 6= n, portanto, nesse caso, a correção de segunda ordem na energia En é sempre
negativo, para qualquer perturbação W .
Portanto a energia total corrigida em até segunda ordem é
D E2
gm ϕ(i) W ϕ
X X m n
En (λ) = En(0) + hϕn | W | ϕn i + (0) (0)
. (5.45)
m6=n i=1 En − Em
5.3.3 Correção de Segunda Ordem: autovetor

Agora
seráE calculado os autovetores em até segunda
Eordem, ou seja, o termo de segunda
(2) (i)
ordemψn . Vamos inciar projetando (5.15) no ket ϕ` , com ` 6= n, o que resulta em
D E D E D E D E D E
(i) (i) (i) (i) (i)
ϕ` H0 ψn(2) + ϕ` V ψn(1) = En(0) ϕ` ψn(2) + En(1) ϕ` ψn(1) + En(2) ϕ` ψn(0)

E (5.46)
(2)
Expandido o termo de segunda ordemψn em função dos autovalores não-perturbados,
obtém-se
gm
(2) X X
(j) (j)

ψn = Cnm ϕm . (5.47)
m j=1
E
(0)
Substituindo as expansões (5.47) e (5.30) em (5.46), e usando o fato de que ψn = |ϕn i é um
autovetor não degenerado, isso resulta em
gm D E gm D E gm D E
XX (i) (j) X X (j) (i)
XX (i) (j)
(j) (j) (0) (j)
Cnm ϕ` H0 ϕm + Bnm ϕ` V ϕm = En Cnm ϕ` ϕm +

m j=1 m j=1 m j=1
gm D E D E
XX (i) (j) (i)
En(1) (j)
Bnm (2)
ϕ` ϕm + En ϕ` ϕn
m j=1
D E
(i)
Note que como ` 6= n, então devido a ortogonalidade ϕ` ϕn = 0. Assim

gm
(0) (i)
XX (i) (i)
(j)
E` Cn` + Bnm V`m = En(0) Cn` + En(1) Bn` .
m j=1
(i)
Como Cnm ainda está indeterminado, separamos este termo na soma sobre m; usamos as
fórmulas de primeira ordem para obter
(0) (i)
X (i)
(En(0) − E` )Cn` = V`n Bnn + V`m Bnm − En(1) Bn` ,
m6=n
(1) (i)
mas de (5.27) temos que En = Vnn , e usando o valor encontrado para os coeficientes Bn` de
primeira ordem (5.33), logo pode-se reescrever a expressão anterior como
(0) (i)
X V`m Vmn V`n Vnn
(En(0) − E` )Cn` = V`n Bnn + (0) (0)
− (0) (0)
,
m6=n En − Em En − E`

logo
(i) V`n X V`n Vmn V`n Vnn

Cn` = (0)
B +
(0) nn (0) (0) (0) (0)
− (0) (0)
(5.48)
En − E` m6=n (En − E` ) · (En − Em ) (En − E ` )2
(i)
Vemos que os coeficientes Cn` não ficam completamente determinados antes de acharmos
(i)
Bnn . O coeficiente Cnn também permanece indeterminado. Essa é a informação máxima que
pode ser obtida, até segunda ordem, da equação original de autovalores. Voltando agora a
atenção para os problemas de ortogonalidade e de normalização. Se tomarmos, em geral, o
produto interno de |ψm i e de |ψn i, como representado pela série
(0) (1) (2) X

+ λ2 ψm λk ψm
(k)

|ψm i = ψm + λ ψm + ··· =
k
obteremos termos de diferentes ordens na expressão de hψm |ψn i = δmn , conforme os resultados
obtidos de (5.17) à (5.22), do que ao exigirmos que hψm | ψn i = δmn segue então para cada
ordem que
ordem zero:

(0) (0)
ψm ψn = δmn
primeira ordem:

(0) (1)

(1) (0)
ψm ψn + ψm ψn = 0
segunda ordem:

(0) (2)
(1) (1)
(2) (0)
ψm ψn + ψm ψn + ψm ψn = 0,
Segue-se então, que os termos de qualquer ordem dada devem anular-se identicamente, e
não faz diferença se m 6= n ou m = n. Usando a expansão
(1) X (0)
ψn = Bnm ψm ,
m
a equação de primeira ordem fornece imediatamente
∗
Bnm + Bnm =0 (m e n quaisquer)
6 n, esta relação se satisfaz automaticamente; se m = n, obtemos Re {Bnn } = 0 como

Se m =
condição.
De maneira semelhante, usando também a expansão de segunda ordem
(2) X (0)
ψn = Cnm ψm ,
m
a equação de segunda ordem impõe que

X
(0) (0) E X X ∗ D
(0) (0)
E X
∗
D
(0)

Cmi ψi ψn(0) = 0,

Cni ψm ψi + Bmi Bnj ψi ψj +
i i j i
da qual segue imediatamente
X
∗ ∗
Cnm + Cmn + Bm` Bn` = 0. (5.49)
`
Se usarmos as expressões obtidas para Bnm e Cnm , é possível mostrar que esta relação é
satisfeita para m 6= n, não interessa qual seja Bnn . Para o caso m = n, obtemos, no entanto, a
condição
1X
|Bn` |2
(2)
Re Cnn =− (5.50)
2 `
E E
im (0) (0)
Como na teoria de primeira ordem, pode-se considerar o vetor e ψn , em vez de ψn ,
como autovetor não-perturbado temos
δ2
eim ψn(0) = ψn(0) + iδ ψn(0) − ψn(0) + . . .

2!
É evidente que, se fizermos δ = Im {Bnn } + Im {Cnn }, podemos incorporar as partes imaginárias
de Bnn e Cnn no fator de fase arbitrário eiδ . Isso é equivalente a escolher Im {Bnn } = Im {Cnn } = 0
nos cálculos das perturbações.
Por conseguinte, pode-se reunir os resultados da teoria de segunda ordem no seguinte conjunto
de fórmulas:
Vmn
En(1) = Vnn Bnn = 0 (i)
Bnm = (0) (0)
(m 6= n)
(En − Em )
X Vnm Vmn 1 X (i) 2
En(2) = , Cnn = − B ,
m6=n
(0)
En − Em
(0) 2 m,i nm
(i)
X Vm` V`n Vmn Vnn
Cnm = − 2 (m 6= n).
(0) (0) (0) (0) (0) (0)
`6=n En − Em En − E` En − Em
Mas como
(2) X (0) (0)

ψn = Cnm ψm + Cnn ψm
`6=n
 
(2) X X Vm` V`n Vmn Vnn  (0) 1 X |Vmn |2 (0)
ψn = − 2 ψm − 2 ψm

2
 (0) (0) (0) (0)

(0) (0) (0) (0)
m6=n `6=n En − Em En − E` En − Em m En − Em
(0) (0)
Seja agora ωnm = (En − Em )/~.

" #
(2) X X Vm` V`n V V
mn nn (0) 1 X |Vmn |2 (0)
ψn =
2ω
− 2ω2
ψ m − 2ω2
ψm (5.51)
~ nm ωn` ~ nm 2 m
~ nm
m6=n `6=n
X Vnm Vmn
En(2) = (5.52)
m6=n
~ωnm
Portanto a energia em até segunda ordem é

D E2
(i)
gm
X X ϕm W ϕn

En (λ) = En(0) + hϕn | W | ϕn i + (0) (0)
(5.53)
m6=n i=1 En − Em
Este tipo de análise pode ser levado a ordens mais altas. Na prática, no entanto, a maior parte
dos cálculos se limita à primeira e segunda ordens. Além das complexidades computacionais,
o ponto é que, se os resultados de segunda ordem não forem suficientemente exatas, então a
validade geral (convergência) da série perturbada ficará geralmente duvidosa.
(2)
5.3.4 Limite superior de En
Ao limitar a expansão da energia em primeira ordem em λ poderá se obter uma ideia
aproximada do erro envolvido ao avaliar o termo de segunda ordem.
(2)
Considere expressão (5.52) para En . Ela contém uma soma (a qual geralmente é infinita)
cujos termos do numerador são positivo ou zero. Denota-se por ∆E o valor absoluto da diferença
(0)
entre a energia En , do nível a ser estudado e aquela do nível mais próximo. Para todo n,
tem-se obviamente que:
|En(0) − Em
(0)
| ≥ ∆E
(2)
Essa expressão fornece um limite superior para o valor absoluto de En :
En ≤ 1
(2) X X
2
ϕ(i)
m V ϕn

∆E i m6=n
a qual pode ser reescrita como
En ≤ 1
(2) X X

(i)
ϕn V ϕ(i)
m ϕm V ϕn
∆E i m6=n
* " # +
1 X X
ϕ(i)

(i)

≤ ϕn V ϕ V ϕn (5.54)

m m
∆E
i m6=n

O operador que aparece dentro dos colchetes é diferente do operador identidade somente
devido ao projetor sobre o estado |ϕn i, uma vez que a base de estados não perturbados satisfaz
a relação de completeza:
m = 1.
X X

|ϕn ihϕn | + ϕ(i)
m ϕ(i)
i m6=n

5.4. Aplicações
Portanto a desigualdade (5.54), toma a seguinte forma
En ≤ 1 hϕn | V [1 − |ϕn ihϕn |] V | ϕn i

(2)
∆E
1
2
ϕn V ϕn − (hϕn | V | ϕn i)2

≤ (5.55)
∆E
Multiplicando ambos os lados de (5.55) por λ2 , obtém-se um limite superior para o termo de
segunda ordem na expansão de En (λ), na seguinte forma:
λ En ≤ 1 (4W )2
2 (2)
∆E
na qual 4W é o desvio quadrático médio da perturbação W não estado não perturbado |ϕn i.
Esta indica a ordem de magnitude do erro cometido ao levar em conta somente a correção em
primeira ordem.
5.4 Aplicações
Nessa seção apresentaremos alguns exemplos de aplicação da teoria de perturbação não
degenerado ao problema do oscilador harmônico unidimensional
P2 1
H0 = + mω 2 X 2 , (5.56)
2m 2
com
1
H0 |ni = En(0) |ni , com En(0) = (n + )~ω (5.57)
2
e esse será o hamiltoniano do sistema não perturbado. A seguir serão analisadas alguns potenciais
perturbadores a esse problema.
5.4.1 Oscilador harmônico com perturbação linear: V (X) = ~ωX

Considere o seguinte potencial perturbativo
r
mω
W (X) = λ~ω X̃, com X̃ = X (5.58)
~
o que significa que o hamiltoniano do sistema é dado agora por
P2 1
H = H0 + W = + mω 2 X 2 + λ~ω X̃. (5.59)
2m 2
Em particular esse sistema possui uma solução exata. A seguir resolveremos exatamente o
problema e em seguida aplicaremos o método perturbativo para determinar novas as energias
do sistema.

5.4. Aplicações
5.4.1.1 Solução exata
Esse problema é equivalente ao de uma partícula de massa m e carga q, movendo-se em um

potencial harmônico, do tipo (5.56), a qual é submetida a um campo elétrico uniforme E = E êx ,
o que significa que operador hamiltoniano da partícula toma a seguinte forma
P2 1
H = H0 − qEX = + mω 2 X 2 − qEX. (5.60)
2m 2
Note que os hamiltonianos (5.59) e(5.60) possuem a mesma forma, e sua equivalência é
obtida fazendo-se
√
r
mω
−qEX = λ~ω X =⇒ qE = −λω m~ω
~
O hamiltoniano (5.59) desse sistema, pode ser manipulado de forma que
√
r
P2 1 2 2 mω P2 1
H= + mω X + λ~ω X= + mω 2 X 2 + λω m~ωX
2m 2 ~ 2m 2
r !
P2 1 ~
= + mω 2 X 2 + 2λ X
2m 2 mω
 r r !2  r !2
2
P 1 ~ ~ 1 ~
= + mω 2 X 2 + 2λ X+ λ  − mω 2 λ
2m 2 mω mω 2 mω
" r #2
P2 1 ~ 1
= + mω 2 X + λ − λ2 ~ω. (5.61)
2m 2 mω 2
Definindo r
~ 1
X0 = λ ; e U0 = λ2 ~ω, (5.62)
mω 2
então, fazendo uma mudança de variável
Z = X + X0 e E 0 = E − U0 (5.63)
então teremos
Pz2 1
H= + mω 2 Z 2 − U0 = H0z − U0 . (5.64)
2m 2
Logo, como
1
H0z |ϕn,z i = En,z |ϕn,z i = ~ω n + |ϕn,z i (5.65)
2
e [H, H0z ] = 0, então os autovetores de H0z também são autovetores de H e com autovalores

1
H |ϕn,z i = En |ϕn,z i = ~ω n + − U0 |ϕn,z i . (5.66)
2
Portanto, as energias desse sistema são

1 1
En = n + ~ω − λ2 ~ω, (5.67)
2 2

5.4. Aplicações
Note que se os autovetores de H0z são dados pelos kets |ϕn,z i = |ϕn i então os autovetores de
H serão dados pelos kets |ψn i, os quais estão relacionados por
hx | ψn i = ψn (x) ⇐⇒ hz | ϕn,z i = hx − x0 | ϕn,z i = ϕn (x − x0 ),
ou seja, os dois são equivalente, porém suas origens estão deslocadas, ou seja, ψn (x) = ϕn (x−x0 ),
assim como vimos os dois autoestados estão relacionados um com outro por meio do operador
translação espacial, dado por
− √λ (a† −a)
|ψn i = U (λ) |ϕn i , com U (λ) = e 2 .
Uma expansão limitada de U (λ) fornece o seguinte resultado

λ †
|ψn i = 1 − √ (a − a) + · · · |ϕn i
2
r r
n+1 n
= |ϕn i − λ |ϕn+1 i + λ |ϕn−1 i + · · · (5.68)
2 2
5.4.1.2 Solução perturbativa

√
Trocando X̃ por (a† + a)/ 2 em (5.58), obtém-se que
~ω
W = λ √ (a† + a). (5.69)
2
Dá expressão acima vê-se que o termo perturbativo W , mistura o estado |ϕn i somente com
os estados |ϕn−1 i e |ϕn+1 i. Portanto, os únicos elementos de matriz não nulos de W , que
contribuem para a expansão perturbativa são

 hϕ | W | ϕm i =0 para |m − n| =
6 1
 n

 q
n+1 (5.70)
hϕn+1 | W | ϕn i =λ 2
~ω



hϕ pn
|W |ϕ i
n−1 n =λ 2
~ω
Portanto, a correção na energia em segunda ordem de perturbação pode ser escrita como
X |hϕm | W | ϕn i|2
(0)
En = En + hϕn | W | ϕn i + (0) (0)
+ ··· (5.71)
m6=n En − Em
Substituindo os elementos de matriz (5.70) em (5.71), obtém-se
(n + 1)λ2 nλ2
En = En(0) + 0 − ~ω + ~ω + · · ·
2 2
1 1
= n+ ~ω − λ2 ~ω + · · · (5.72)
2 2
Isso, mostra que a correção perturbativa em segunda ordem para a energia coincide com o
resultado exato. Já a correção em primeira ordem para os autoestados fornece
X Wmn (0)
|ψn i = ψn(0) + (0) (0)
· ψm (5.73)
m6=n En − Em
r r
n+1 n
= |ϕn i − λ |ϕn+1 i + λ |ϕn−1 i + · · · , (5.74)
2 2
a qual também coincide com a expansão em série, em primeira ordem, do resultado exato.

5.4. Aplicações
5.4.2 Potencial perturbativo quadrático

Considere agora o seguinte potencial perturbativo
1 1
W (X) = ρ~ω X̃ 2 = ρmω 2 X 2 , (5.75)
2 2
portanto agora o hamiltoniano do sistema será dado por
P2 1
H = H0 + W = + mω 2 (1 + ρ)X 2 , (5.76)
2m 2
o que por uma questão de simplicidade introduz-se a frequência
ω 02 = (1 + ρ)ω 2 , (5.77)
logo a solução exata do problema é imediata e seus autovalores são dados por

1 0 1 p
En = n + ~ω = n + 1 + ρ~ω. (5.78)
2 2
Expandindo essa solução em série, para ρ 1, obtém-se

1 1 1 2
En = n + ~ω 1 + ρ − ρ + · · · (5.79)
2 2 8
Como
1 1
X̃ = √ (a† + a) =⇒ W (X) = ρ~ω(a† + a)(a† + a) (5.80)
2 4
o qual ainda pode ser escrito como
1
W (X) = ρ~ω(a† + a)(a† + a)
4
1
= ρ~ω a†2 + a2 + a† a + aa†

4
1
= ρ~ω a†2 + a2 + 2N + 1 ,

(5.81)
4
na qual N é o operador número dado por N = a† a = aa† − 1. Portanto os únicos elementos de
matriz não nulos para esse termo são

= 12 ρ n + 12 ~ω

hϕn | W | ϕn i


 p
hϕn+2 | W | ϕn i = 14 ρ (n + 1) (n + 2)~ω (5.82)

 p
hϕ 1
n−2 | W | ϕn i = 4 ρ n (n − 1)~ω.

Note ainda que

En0 − Em
0
= (n − m)~ω, (5.83)
logo, a correção na energia em segunda ordem de perturbação pode ser escrita como

0 1 1 1 ~ω 1 ~ω
En = En + ρ n + ~ω − ρ2 (n + 1) (n + 2) + ρ2 n (n − 1) + ···
2 2 16 2 16 2
ρ2

1 1 ρ 1
= n+ ~ω + n + ~ω · − n + ~ω · + ···
2 2 2 2 8

1 1 1 2
= n+ ~ω 1 + ρ − ρ + · · · . (5.84)
2 2 8
Esse resultado, coincide com a expansão do resultado exato.

5.4. Aplicações
5.4.3 Potencial perturbativo de ordem X 3

Considere agora o seguinte potencial perturbativo
W (X) = σ~ω X̃ 3 (5.85)
o qual em termos dos operadores de criação e aniquilação pode se reescrito como

√
2
W (X) = σ~ω(a† + a)(a† + a)(a† + a)
√4
2
σ~ω a†2 + a2 + 2N + 1 (a† + a)

=
4
o que após alguma álgebra, chega em
√
2
σ~ω a†3 + a3 + 3N a† + 3(N + 1)a

W (X) = (5.86)
4
Os elementos de matriz não nulos para esse termo são

n+1 3/2



hϕn+1 | W | ϕn i = 3σ 2
~ω

n 3/2

hϕn−1 | W | ϕn i

= 3σ ~ω
2
q (5.87)


hϕn+3 | W | ϕn i = σ (n+3)(n+2)(n+1)
8
~ω

 q
= σ n(n−1)(n−2)

hϕ
n−3 | W | ϕn i 8
~ω.
e as diferenças em energia são
En0 − En±3
0
= ∓3~ω e En0 − En±1
0
= ∓~ω.
Portanto, a correção na energia em segunda ordem de perturbação pode ser escrita como
σ 2 n (n − 1) (n − 2) σ 2 (n + 3)(n + 2) (n + 1)

1
En = n + ~ω + · ~ω − · ~ω+
2 3 8 3 8
n3 (n + 1)3
3σ 2 ~ω − 9σ 2 ~ω + · · ·
8 8
a qual ainda pode ser reescrita na forma compacta
2
1 15 2 1 7
En = n + ~ω − σ n + ~ω − σ 2 ~ω + · · · (5.88)
2 4 2 4
Nesse caso, o efeito de W é baixar os níveis de energia, conforme indica o sinal de σ. A

diferença entre dois níveis adjacentes é dada por

15 2
En − En−1 = 1 − σ n ~ω (5.89)
2
Essa diferença de energia não é mais independente de n, como no caso do oscilador harmônico.
Nesse caso as energias do estados não são mais equidistantes, a medida em que n cresce a a
diferença em energia diminui, conforme mostrado ilustrativamente na figura 5.2.

5.5. O Caso de Autovalores Degenerados
n+2
n+1
n−1
n−2
Figura 5.2: Níveis de energia de H0 , linhas pontilhadas, e de H, linhas sólidas. Sobre o efeito da
perturbação W , cada nível de H0 é baixado, e os n maiores possuem um deslocamento maior.
Substituindo as relações (5.87) na expansão (5.73), obtém-se que
X Wmn (0)
|ψn i = ψn(0) + (0) (0)
· ψm
m6=n En − Em
3/2
n+1 n 3/2
= |ϕn i − 3σ |ϕn+1 i + 3σ |ϕn−1 i
2 2
r r
σ (n + 3)(n + 2) (n + 1) σ n (n − 1) (n − 2)
− |ϕn+3 i + |ϕn−3 i + · · ·
3 8 3 8
Portanto, sobre o efeito da perturbação W , o estado |ϕn i é misturado com os estados |ϕn+1 i,
|ϕn−1 i, |ϕn+3 i e |ϕn−3 i.
5.5 O Caso de Autovalores Degenerados

Não é de nenhuma maneira raro que o tratamento do problema de autovalores
(H0 + V ) |ψi = E |ψi ,
por métodos perturbativos, faça surgir uma dificuldade fundamental. Quando o problema de
autovalores não-perturbado

H0 ψn(0) = En(0) ψn(0)

exibe degenerescência; ou seja, alguns (ou todos) dos autovalores estão associados a mais de um
autovetor. A dificuldade provém de que não conhecemos o autovetor não-perturbado a que se

5.5. O Caso de Autovalores Degenerados
reduz o perturbado, se a perturbação for reduzida a zero. Como uma tal informação é vital em
qualquer teoria perturbativa, nossa primeira missão será investigar este problema.
(0)
Concentremos nossa atenção em um certo autovalor En que supomos ter degenerescência
de ordem gn , isto é, possui gn autovetores linearmente independentes. Qualquer combinação
linear destes é também um autovetor, de maneira que estamos tratando de todo um subespaço
g-dimensional de autovetores. Neste subespaço, podemos sempre selecionar uma base ortonormal,
composta dos vetores
|ψkn i (kn = 1, 2, 3, . . . , gn ) (5.90)

(0)
observe que todos estes vetores pertencem ao autovetor En , assim
H0 |ψkn i = En(0) |ψkn i (kn = 1, 2, 3, . . . , gn ). (5.91)

(0)
Ora, se um autovetor perturbado com energia E se reduz a um outro com energia En , então
seu autovetor |ϕi deverá reduzir-se a algum vetor de nosso subespaço. Como anteriormente
escreveremos
En (λ) = En(0) + λEn(1) + λ2 En(2) + . . .

|ϕi = ϕ(0) + λ ϕ(1) + λ2 ϕ(2) + . . .

(5.92)

É importante perceber que ϕ(0) não necessita ser um dos vetores |ψkn i, mas tem de ser
uma combinação linear deles:
gn
(0) X
ϕ = λkn Ckn |ψkn i , (5.93)
kn =1
e desejamos encontrar o conjunto de coeficiente Ckn . Como antes λ é um pequeno parâmetro,

tal que, 0 < λ ≤ 1.
Como antes, escrevemos a equação perturbada exata
∞
X ∞ ∞
(i) X i (i)
X (j)
(H0 + λV ) ϕ = λ En ϕ (5.94)
i=0 i=0 j=0
e separamos as ordens de perturbação,

ordem zero:

H0 ϕ(0) (0) (0)

n = E n ϕ ;
primeira ordem:

H0 ϕ(1) + V ϕ(0) = En(0) ϕ(1) + En(1) ϕ(0) ;

segunda ordem:

5.6. Teoria de Perturbação de Wigner-Brillouin

H0 ϕ(2) + V ϕ(1) = En(0) ϕ(2) + En(1) ϕ(1) + En(2) ϕ(0) .

Enquanto que a equação de ordem zero é automaticamente satisfeita, podemos obter alguma
informação da equação de primeira ordem, formando os produtos internos com vetores |ψkn i.

Não importa o que seja ϕ(1) , temos
ψkn Hϕ(1) = H † ψkn ϕ(1) = En(0) ψkn ϕ(1) ,

pois H0 é hermitiano. Expressando ϕ(0) como
gn
(0) X
ϕ = C` |ψ` i , (5.95)
`=1
obtemos as seguintes g equações, correspondendo a cada valor de k:

g
X
C` hψk | V | ψ` i = En(1) Ck k = (1, 2, . . . , g) (5.96)
`=1
Como as quantidades Vk` = hψk | V | ψ` i podem ser calculadas, estamos em face de um

sistema de g equações algébricas em g incógnitas C1 .C2 , . . . , Cg . Estas equações são homogêneas
e do tipo de autovetores; exibimos isso explicitamente:
g g
X X
C` Vk` − En(1) · Ck = (Vk` − En(1) δk` )C` = 0
`=1 `=1
(1)
   
V11 − En V12 ··· V1g C1
(1)
V21 V22 − En ··· V2g C2
   
   
.. .. .. · .. =0 (5.97)
..


 . . . .
 
  .


(1)
Vg1 Vg2 · · · Vgg − En Cg
Este sistema de equações lineares homogêneas com respeito as quantidades C` tem soluções
diferentes de zero se o determinante dos coeficientes das incógnitas anula-se. Obtemos assim a
equação

V11 − En(1)

V12 ··· V1g

(1)
V21 V22 − En ··· V2g

.. .. .. =0 (5.98)
..

. . . .

(1)

Vg1 Vg2 · · · Vgg − En

det Vk` − En(1) δk` = 0. (5.99)
5.6 Teoria de Perturbação de Wigner-Brillouin

Teoria de perturbação de estados ligados se aplica aos estados ligados de sistemas perturbados,
para os quais os níveis de energia são discretos e separados uns dos outros. O sistema também

pode ter um espectro contínuo, mas o interesse está direcionado aos estados discretos. Os efeitos
de perturbações nos estados do espectro contínuo, ou nos estados discretos dentro do contínuo,
requerem diferentes técnicas, tais como a teoria de perturbação dependente do tempo.
A versão da teoria de perturbação de estado limite que você provavelmente está familiarizado
com é chamado de teoria de perturbação de Rayleigh-Schrödinger. Nessa seção, iniciaremos
com uma variação da teoria de perturbação de Rayleigh-Schrödinger, chamada de teoria de
perturbação de Brillouin-Wigner. A teoria Brillouin-Wigner é mais simples e menos confusa
para derivar do que a teoria de Rayleigh-Schrödinger, e também dá respostas mais precisas em
muitas circunstâncias. A sua desvantagem é que os níveis de energia desconhecidos são dados
apenas implicitamente, em termos das soluções de equações não lineares. Mas se as fórmulas
explícitas para os níveis de energia são desejadas, é fácil de expandir as soluções em potências
do parâmetro de perturbação, após o que os resultados da teoria de Rayleigh-Schrödinger são
recuperados.
Aqui o problema colocado é o mesmo da teoria de perturbação de Rayleigh-Schrödinger, ou
seja, dado o seguinte problema de autovalores
(H0 + W ) |ψi = H |ψi = E |ψi
o qual deve ser resolvido. Porém, agora ele será reescrito na seguinte forma
(E − H0 ) |ψi = W |ψi . (5.100)
Considere que os autoestados de H0 são tais que

H0 ϕ(i)
n = En(0) ϕ(i)
n
com
n ihϕn | = 1.

(i) (j) X
ϕn ϕm = δm,n δi,j e |ϕ(i) (i)
(5.101)
i,n
Agora serão introduzidos os projetores definidos por

gk
XX (i) (i)
P = |ϕ(i) (i)
n ihϕn | e Q= |ϕk ihϕk |, (5.102)
k6=n i=1
os quais satisfazem a seguinte relação
P +Q=1 =⇒ Q=1−P (5.103)
Viu-se anteriormente que era possível expandir o ket |ψi da seguinte forma
X
|ψi = ψ (0) + λ ψ (1) + λ2 ψ (2) + · · · = λi ψ (i) .

i

Considerando λ = 1 e que ψ (0) ψ (0) = 1, viu-se que

(0)
(i)
ψ ψ = ϕn ψ = 1.

Como pode-se escrever que
|ψi = 1 |ψi = (P + Q) |ψi = P |ψi + Q |ψi , (5.104)
porém como

(i) (i)
P |ψi = ϕ(i)
n ϕn ψ = ϕn , (5.105)
portanto, tem-se que

|ψi = ϕ(i)
n + Q |ψi (5.106)
Note que
[H0 , Q] = 0, (5.107)
então de (5.100) e(5.107) pode-se escrever
Q (E − H0 ) |ψi = (E − H0 ) Q |ψi = QW |ψi ,
da qual segue imediatamente que
Q |ψi = (E − H0 )−1 QW |ψi (5.108)
Agora, substituindo a equação (5.108) em (5.106) obtém-se que

|ψi = ϕ(i)
n + RW |ψi (5.109)
na qual foi introduzido um novo operador R, definido por

1 1
R = (E − H0 )−1 Q = Q = Q (E − H0 )−1 = Q . (5.110)
E − H0 E − H0
A equação (5.109) é resolvida por um processo iterativo, no qual substitui-se ela nela mesma.
Mais explicitamente tem-se que:
• Primeira iteração:
+ RW ϕn(i) + (RW )2 |ψi

|ψi = ϕ(i)
n
• Segunda iteração:
+ (RW )2 ϕn(i) + (RW )3 |ψi

|ψi = ϕ(i)
n + RW ϕ(i)
n
• k-ésima iteração
+ (RW )2 ϕ(i) + (RW )3 ϕ(i) + · · · + (RW )k+1 |ψi .

|ψi = ϕ(i)
n + RW ϕ(i)
n n n
Portanto, a série infinita é
+ (RW )2 ϕ(i) + (RW )3 ϕ(i) + · · · + (RW )k+1 ϕn(i) + · · · (5.111)

|ψi = ϕ(i)
n + RW ϕ(i)
n n n
Somando essa série infinita, obtém-se

1
|ψi = (1 − RW )−1 ϕ(i)
(i)
n = ϕ (5.112)
1 − RW n

5.7. O método variacional
Portanto, essa é a solução formal exata do problema.

E
(i)
Para obter a energia, projeta-se (5.100) em ϕn e como resultado tem-se que

E − E0 = ϕ(i) E = E0 + ϕ(i)

n
W ψ =⇒ n
W ψ (5.113)
Ao substituir (5.111) em (5.113), obtém-se a seguinte série de potências

(i)
(i)
E = E0 + ϕ(i) W ϕn + ϕn W RW ϕn(i) + ϕn(i) W RW RW ϕ(i)

n n + ··· (5.114)
mas com a representação espectral do operador R é

gk gk (i) (i)
1 XX (i) (i)
XX |ϕk ihϕk |
R= |ϕk ihϕk | = (0)
(5.115)
E − H0 k6=n i=1 k6=n i=1 E − Ek
então o resultado da substituição de (5.115) em (5.114) é uma forma mais familiar para a
expansão da energia em uma série perturbativa, ou seja, obtém-se que
D ED E
(i) (j) (j) (i)
(i) X ϕn W ϕk ϕk W ϕn
E = En(0) + ϕ(i)

n
W ϕn + +
(0)
j,k6=n E − Ek
D ED ED E
(i) (j) (j) (`) (`) (i)
X X ϕ n W ϕk ϕk W ϕm ϕ m W ϕn
+ · · · (5.116)
(0) (0)
j,k6=n `,m6=n E − E k E − E m
Note que a energia desconhecida E, aparece no denominador do lado direito; portanto, essa
não é uma expressão explicita para a energia E. Para calcular a energia com precisão em até
(0)
terceira ordem, nesse caso basta trocar E por seu valor de ordem zero, ou seja, E = En no
denominador do termo de Dterceira
ordem
E de (5.116); mas deve-se usar o valor da correção de
(i) (i)
primeira ordem E = E0 + ϕn W ϕn , no denominador do termo de segunda ordem.
Um modo mais prático de calcular a energia E a partir da expressão (5.116) é inicialmente
fazer uma estimativa para E, a qual deve ser substituída em todos os denominadores e a série
deve ser somada numericamente, e o novo valor obtido para a energia E deve ser reintroduzido
na série , até se obter um valor convergido para a energia E com
a precisão
−1 desejada.
(0)
Se realizarmos uma expansão formal de todos os fatores de E − En do lado direito de
(5.116) em uma série de potência da força da perturbação, recupera-se a série perturbativa de
Rayleigh-Schrödinger. Em todas as ordens além da segunda, ela irá conter muito mais termos
do que (5.116), então ela é menos conveniente de se lidar do que a série (5.116), do formalismo
perturbativo de Wigner-Brillouin.
5.7 O método variacional

Existem muitas aplicações dos métodos variacionais para encontrar um extremo útil. Esta
é a essência do “método variacional”. Como forma de encontrar soluções aproximadas para a
equação de Schrödinger, uma abordagem comum é adivinhar uma forma aproximada de uma

solução, parametrizado de alguma forma. Os parâmetros são variadas até que seja encontrado
um extremo. Esta abordagem será ilustrada com exemplos.
Considere o seguinte problema de autovalores
H |ϕn i = En |ϕn i , com n = 0, 1, 2, . . . (5.117)
Embora o operador hamiltoniano H seja conhecido, não necessariamente os seus autovalores En

e os seus correspondentes autovetores |ϕn i são conhecidos.
5.7.1 Propriedades do estado fundamental do sistema

Para um vetor de estado |ψi qualquer tem-se que
hψ | H | ψi
hHiψ = ≥ E0 . (5.118)
hψ | ψi
Note que, o vetor de estado |ψi, pode ser expandido na base do autovetores de H, assim
X
|ψi = Cn |ϕn i , (5.119)
n
do que segue imediatamente que

X X
hψ | H | ψi = |Cn |2 En ≥ E0 |Cn |2 . (5.120)
n n
Aqui foi considerado que o vetor de estado |ψi é normalizado, ou seja,

X
hψ | ψi = |Cn |2 = 1. (5.121)
n
Com isso, tem-se que

X
hψ | H | ψi = |Cn |2 En ≥ E0 (5.122)
n
5.7.2 Generalização: O teorema de Ritz

Considere que
hψ | H | ψi
hHiψ = , (5.123)
hψ | ψi
nesse caso, o hHiψ é um funcional do vetor de estado |ψi. Portanto, pode-se calcular o incremento
δ hHiψ , quando |ψi → |ψi + δ |ψi, com δ |ψi = |δψi sendo infinitesimalmente pequena.
Reescrevendo a expressão (5.123) na seguinte forma
hHiψ hψ | ψi = hψ | H | ψi , (5.124)
ao fazer uma variação infinitesimal δ |ψi no vetor de estado |ψi, essa expressão toma a forma
δ hHiψ hψ | ψi + hHiψ [hδψ | ψi + hψ | δψi] = hδψ | H | ψi + hψ | H | δψi ,

e como hHiψ é um número, segue que

D E D E
hψ | ψi δ hHiψ = ψ H − hHiψ δψ + δψ H − hHiψ ψ .

Após uma cuidadosa análise dessa expressão, pode-se concluir que hHiψ será estacionário se
δ hHiψ = 0,
o que significa que

D E D E
ψ H − hHiψ δψ + δψ H − hHiψ ψ = 0.

Considere ainda que,

|ϕi = H − hHiψ |ψi ,
logo
hϕ | δψi + hδψ | ϕi = 0.
Essa relação deve ser satisfeita para qualquer valor infinitesimal do ket |ψi , em particular para
|δψi = δλ |ϕi ,
do que segue imediatamente que

2 hϕ | ϕi δλ = 0.
Então hϕ | ϕi = 0, o que nesse caso significa que |ϕi = 0, ou seja,

|ϕi = 0 =⇒ H − hHiψ |ψi = 0,
logo
H |ψi = hHiψ |ψi .
Portanto, o valor médio de hHiψ será estacionário se e somente se o vetor de estado |ψi
correspondente a ele, for um autovetor de H, e os valores estacionários de hHiψ forem autovalores
de H.
5.7.3 Exemplo: oscilador harmônico unidimensional

5.7.3.1 Estado fundamental
A seguir será usado o método variacional para determinar a energia do estado fundamental
de um oscilador harmônico unidimensional, cujo o hamiltoniano é
~2 d2 1
H=− 2
+ mω 2 x2 ,
2m dx 2
usando a seguinte função tentativa
2
ψα (x) = e−αx com α > 0.

Tem-se que ˆ +∞
2
hψα | ψα i = dx e−2αx
−∞
e que
ˆ +∞
~ 2 d2

−αx2 1 2
hψα | H | ψα i = dx e − 2
+ mω x e−αx
2 2
−∞ 2m dx 2
ˆ +∞
~2 d

−αx2 −αx2
= dx e − (−2αx) e +
−∞ 2m dx
ˆ +∞
1 2
dx mω 2 x2 e−2αx
−∞ 2
Chamando a primeira integral do lado direito de I1 , tem-se
ˆ +∞
~2 d

−αx2 −αx2
I1 = dx e − (−2αx) e ,
−∞ 2m dx
usando a integração por partes, na qual
ˆ ˆ
udv = uv − vdu,
com 
2 2


 u = e−αx du = −2αxe−αx dx


~2 ~2
 2 2
dv = d
αxe−αx dx v= αxe−αx

dx m m
logo +∞ ˆ
~2 −2αx2 ~2 2 +∞ 2
dx x2 e−2αx

I1 = αxe +2 α
m
−∞ m −∞
| {z }
=0
assim ˆ +∞
~2 α2 2
I1 = 2 dx x2 e−2αx .
m −∞
Dessa forma, tem-se que
ˆ +∞
~2 α2 1

2
Hαα = hψα | H | ψα i = 2 + mω 2 dx x2 e−2αx .
m 2 −∞
Note ainda que ˆ ˆ +∞

+∞
1 d
2 −2αx2 2
dx x e =− dx e−2αx
−∞ 2 dα −∞
e que a integral gaussiana. A seguir mostraremos algumas propriedades da integral gaussiana
definida por
ˆ +∞
2
In (α) = dx xn e−2αx (5.125)
−∞
Note que para n ímpar o integrando, da integral (5.125), é uma função ímpar, portanto, nesse
caso a integral é nula, esse resultado pode ser expresso da seguinte forma
ˆ +∞
2
I2n+1 (α) = dx x2n+1 e−2αx = 0 para n = 0, 1, 2, 3, . . .
−∞

Já para n par na integral (5.125), é integral possui um valor não nulo.

Sabe-se que
ˆ +∞ ˆ +∞
r r
0 −2αx2 −2αx2 π π −1/2
I0 (α) = dx x e = dx e = hψα | ψα i = = α .
−∞ −∞ 2α 2
Diferenciando ambos os lados da expressão anterior em relação α, obtém-se que
r
dI0 (α) 1 π −3/2 1
=− α = − I0 (α), (5.126)
dα 2 2 2α
portanto,
ˆ +∞
2 1 dI0 (α) 1
I2 (α) = dx x2 e−2αx = − = I0 (α). =⇒ 4αI2 (α)−I0 (α) = 0. (5.127)
−∞ 2 dα 4α
Temos ainda que
ˆ +∞
1 d 2 −2αx2 1 dI2 (α) 1 d 1
I4 (α) = dx x e =− =− I0 (α)
2 dα −∞ 2 dα 2 dα 4α
1 1 1 1 dI0 (α)
= 2
I0 (α) −
8α 8 α dα
11 1 1
= + I0 (α)
8 α α 2α
3 1
= I0 (α) (5.128)
16 α2
Da qual segue que
3 1 31
I4 (α) = I0 (α) ou I4 (α) = I2 (α) (5.129)
16 α2 4α
Assim
2 2
1 ~α 1 2 dI0 (α)
Hαα = hψα | H | ψα i = − 2 + mω
2 m 2 dα
2 2
1 ~α 1
= 2 + mω 2 I0 (α)
4α m 2
2
~α 1 21
= + mω hψα | ψα i .
2m 8 α
Consequentemente, tem-se
hψα | H | ψα i
hHiψα = = hHiψα (α)
hψα | ψα i
~2 α 1 1
hHiψα (α) = + mω 2 .
2m 8 α
O mínimo dessa função, ocorre quando
~2

d 1 1
hHiψα (α) = − mω 2 2 = 0,
dα α0 2m 8 α0
logo
1 mω
α0 = .
2 ~
Portanto, para α = α0 tem-se que
1
hHiψα (α0 ) = ~ω.
2
Essa é a energia do estado fundamental do oscilador harmônico unidimensional.

5.7.3.2 Primeiro estado excitado
A energia do primeiro estado excitado também pode ser estimada, e para isso, basta escolher
uma função de onda que seja ortogonal a ψα0 (x) = hx | |ψα0 ii. Com esse intuito escolhe-se a
seguinte função de onda tentativa
2
ψα (x) = xe−αx com α > 0.
Assim,
ˆ +∞
2 1
hψα | ψα i = dx x2 e−2αx = I2 (α) = I0 (α)
−∞ 4α
e ˆ +∞
~2 d2

−αx2 1 2
hψα | H | ψα i = dx xe − 2
+ mω x xe−αx .
2 2
−∞ 2m dx 2
Chamando de I1 , a primeira integral do lado direito
ˆ +∞
~2 d

−αx2 2
−αx2
I1 = dx xe − 1 − 2αx e ,
−∞ 2m dx
integrando ela por partes, com


2 2


 u = xe−αx du = (1 − 2αx2 )e−αx dx

 h i
dv = − ~2 d (1 − 2αx2 ) e−αx2 dx 2
 2
v = − 2m
~
(1 − 2αx2 ) e−αx

2m dx
logo
ˆ +∞
~2 −2αx2 +∞ ~2

2 2
I1 = − 2
x 1 − 2αx e + dx 1 − 2αx2 e−2αx
2m
−∞ 2m −∞
| {z }
=0
assim
ˆ +∞
~2 2 2
I1 = dx 1 − 2αx2 e−2αx
2m −∞
ˆ +∞
~2 2
dx 1 − 4αx2 + 4α2 x4 e−2αx

=
2m −∞
~2
I0 (α) − 4αI2 (α) + 4α2 I4 (α)

=
2m
Dessa forma, tem-se que

ˆ +∞
~2

2 2 1 2
1 − 2αx + mω x e−2αx
2 4

Hαα = hψα | H | ψα i = dx
−∞ 2m 2
2
~ 1
I0 (α) − 4αI2 (α) + 4α2 I4 (α) + mω 2 I4 (α).

=
2m 2

Mas de (5.127), 4αI2 (α) − I0 (α) = 0, segue que
2~2 α2 1
hψα | H | ψα i = I4 (α) + mω 2 I4 (α),
m2 2 2
2~ α 1
= + mω 2 I4 (α)
m 2
2
1 m2 ω 2

2~ 2
= α + I4 (α)
m 4 ~2
2~2 2 mω 2

= α + I4 (α)
m 2~
mas de (5.129), tem-se que I4 (α) = (3/4α)I2 (α), segue então que
3~2
mω 2 1
hψα | H | ψα i = α+ I2 (α).
2m 2~ α
Logo pode-se escrever

hψα | H | ψα i
hHiψα = = hHiψα (α)
hψα | ψα i
3~2 mω 2 1 3~2 α 3

1
hHiψα (α) = α+ = + mω 2 .
2m 2~ α 2m 8 α
O mínimo dessa função, ocorre quando
3~2 3

d 1
hHiψα (α) =
− mω 2 2 = 0,
dα α0 2m 8 α0
logo
1 mω
α0 = .
2 ~
Portanto, para α = α0 tem-se que
3~2 mω 2 1 3~2

3
hHiψα (α0 ) = α0 + = α0 = ~ω.
2m 2~ α0 m 2
Essa é a energia correta do primeiro estado excitado do oscilador harmônico unidimensional.
5.7.3.3 Estado fundamental: Funções de onda racionais
A seguir será estimada a energia do estado fundamental do oscilador harmônico unidimensi-

onal, usando para tal uma função de onda tentativa, da seguinte forma
1
ψα (x) = , com a > 0.
x2 + a
Nesse caso tem-se que

ˆ +∞
1 π
hψα | ψα i = dx 2 = 3/2 .
−∞ (x2 + a) 2a

Observação 5.1. A integral

ˆ +∞
1
I= dx ,
−∞ (x2 + a)2
pode ser calculada fazendo-se a seguinte substituição
√ √
x= a tg(θ) =⇒ dx = a sec2 (θ)dθ,
logo
√ ˆ +π/2 ˆ +π/2
a sec2 θ 1
I= dθ = 3/2 cos2 θdθ
a2 −π/2 sec4 θ a −π/2
ˆ +π/2
1 1
= 3/2
[1 + cos 2θ] dθ
a −π/2 2
+π/2
1 1
= θ + sen 2θ
2a3/2 2 −π/2
π
=
2a3/2
Como o hamiltoniano do sistema é dado por
~2 d2 1
H=− 2
+ mω 2 x2 ,
2m dx 2
e
~2 d x2

2x 1
Hψα = − − + mω 2 2 ,
2m dx (x + a)2
2 2 x +a
logo
ˆ +∞
~2 d x2

1 2x 1 2
hψα | H | ψα i = dx 2 − − + mω 2 .
−∞ x +a 2m dx (x2 + a)2 2 x +a
A primeira integral do lado direito, pode ser feita por partes, assim
ˆ +∞
+∞ 2 ˆ +∞
~2 ~2

1 d x x ~ 2x
I1 = dx 2 = · + · dx ,
m −∞ x + a dx (x + a)2
2 3
m (x + a) −∞ m −∞
2 (x + a)4
2
logo
ˆ +∞ ˆ +∞
2~2 2x 1 x2
hψα | H | ψα i = · dx 4 + mω 2 dx .
m −∞ (x2 + a) 2 −∞ (x2 + a)2
Para resolver as integrais a seguir, usa-se a seguinte transformação
√ √
x= a tg(θ) =⇒ dx = a sec2 (θ)dθ,

assim
√ ˆ √ ˆ +π/2 2
2~2 a a +π/2 tg2 θ · sec2 θ 1 2 a a tg θ · sec2 θ
hψα | H | ψα i = · 4 dθ + mω · dθ
m a −π/2 sec8 θ 2 a2 −π/2 sec4 θ
ˆ +π/2 ˆ +π/2
2~2 sen2 θ 1 2 1
= dθ + mω · 1/2 sen2 θ dθ
ma5/2 −π/2 sec4 θ 2 a −π/2
2 ˆ +π/2 2 ˆ +π/2
2~ (2 sen θ · cos θ) 2 1 2 1
= cos θ dθ + mω · 1/2 (1 − cos(2θ)) dθ
ma5/2 −π/2 4 4 a −π/2
ˆ +π/2
~2 1 1
= 5/2
sen2 (2θ) (1 + cos(2θ)) dθ + mω 2 · 1/2 [π − 0]
4ma −π/2 4 a
" ˆ ˆ #
~2 1 +π/2 1 +π/2 1 π
= 5/2
(1 − cos(4θ))dθ + sen (2θ)d(sen(2θ)) + mω 2 · 1/2
2
4ma 2 −π/2 2 −π/2 4 a
~2 π 1 π
= · 3/2 + mω 2 · 1/2
8ma 2a 4 a
1 ~ 1 π
= · + mω 2 a · 3/2 .
4 ma 2 2a
Portanto,
hψα | H | ψα i 1 ~2 1
hHiψα = = hHiψα (a) = · + mω 2 a.
hψα | ψα i 4 ma 2
O mínimo da função hHiψα (a) é obtido, derivando-se ela em relação a variável a e igualando-se
o resultado a zero, assim
1 ~2

d 1 2
hHiψα (a)
= − · + mω = 0,
da a=a0 4 ma2 2 a=a0
logo √
2 ~
a0 = · .
2 mω
Consequentemente
√
2
hHiψα (a0 ) = · ~ω
2
Esse valor se desvia do resultado exato por
√
hHiψα (a0 ) − 21 · ~ω 2−1
≈ ≈ 0.2 =⇒ 20%
~ω 2
5.7.4 Átomo de Hélio

A seguir o método variacional será usado para determinar a energia do estado fundamental
do átomo de Hélio. Note que ao escolher a função de onda tentativa, deve-se ter em mente o
seguinte objetivo: deve-se escolher uma função tentativa que esteja muito próxima do estado
exato do sistema desejado, para obter-se um bom valor médio para a energia hEi do estado
desejado. Para o estado fundamental do átomo de hélio uma boa escolha é o estado fundamental
do átomo de hidrogênio, dado por
3/2
1 Z
hr | 1, 0, 0i1s =√ e−Zr/a0 ,
π a0

e a função de onda tentativa para o estado fundamental do átomo de hélio
|ψ0 i = |1, 0, 0i1 ⊗ |1, 0, 0i2 ,
na qual os índices 1 e 2 referem-se aos dois elétrons.

Para calcularmos hEi = hψ0 | H | ψ0 i, é conveniente agrupar os termos do hamiltoniano da
seguinte forma
P21 P2 Ze2 Ze2 e2
H= + 2 − − +
2m 2me |R1 | |R2 | |R1 − R2 |
" e # " #
P21 Z̃e2 P22 Z̃e2 (Z̃ − Z)e2 (Z̃ − Z)e2 e2
= − + − + + +
2me |R1 | 2me |R2 | |R1 | |R2 | |R1 − R2 |
aqui introduziu-se o número atômico efetivo Z̃ que é o parâmetro o qual irá minimizar a
energia. Aqui o movimento do núcleo está sendo negligenciado, me é a massa do elétron e a
seguinte convenção foi adotada
q2
e2 = ; R1 = |R1 |; R2 = |R2 |; e R12 = |R1 − R2 |.
4π0
Para obtermos uma boa “função de onda tentativa”, note que, se o termo de interação e2 /R12
não estiver presente, a função de onda do estado fundamental por será dada simplesmente
pelo produto de duas funções de onda do estado fundamental do átomo de hidrogênio, com as
respectivas funções R1 e R2 :
Z̃ 3 − aZ̃ (r1 +r2 ) 4π0 ~2 ~2

hr1 , r2 | ψ0 i = ψ0 (r1 , r2 ) = e 0 , a0 = = . (5.130)
πa30 me q 2 me e2
Não há um motivo pelo qual possa-se esperar que o termo e2 /R12 seja especialmente “pequeno”
comparado com os outros termos, então uma aproximação via teoria de perturbação pode não
funcionar bem aqui. Entretanto, a função de onda acima será usada no método variacional,
e usaremos o Z̃ como sendo o parâmetro variacional do problema, para obtermos um limite
superior para a energia do estado fundamental do átomo de hélio.
É necessário calcular o valor esperado de H. A energia cinética de um elétron é:
ˆ ˆ
P2 Z̃ 3 −Z̃r1 /a0 P21 −Z̃r1 /a0 Z̃ 3
hψ0 | 1 |ψ0 i = 3
d (r1 ) 3 e e × d3 (r2 ) 3 e−2Z̃r2 /a0
2me (∞) πa0 2me (∞) πa0
ˆ +∞
Z̃ 3 ~2 1 ∂ 2 −Z̃r1 /a0

2 −Z̃r1 /a0
= −4π · 3 · r1 e r1 e dr1 × 1
πa0 2me 0 r1 ∂r12
ˆ +∞ " ! #
4Z̃ 3 ~2 1 ∂ Z̃
=− · · r12 e−Z̃r1 /a0 1 − r1 e−Z̃r1 /a0
a0 2me a20 0 r1 ∂r1 a0
ˆ +∞ " ! #
4Z̃ 3 Z̃ Z̃ Z̃ −Z̃r1 /a0
=− · Ry · r1 e−Z̃r1 /a0 − − 1 − r1 e
a0 0 a0 a0 a0
ˆ +∞ !
4Z̃ 4 Z̃
= 2 · Ry · r1 2 − r1 e−2Z̃r1 /a0
a0 0 a0

Como, foi visto anteriormente que as integrais

ˆ ∞ k+1
k −pr/a0 a0
I(k, p) = r e dr = k! ·
0 p
logo
" #
P21 4Z̃ 4 Z̃
hψ0 | |ψ0 i = 2 · Ry · 2I(1, 2Z̃) − I(2, 2Z̃)
2me a0 a0
" 3 #
2
4Z̃ 4 a0 Z̃ a0
= 2 · Ry · 2 − 2
a0 2Z̃ a0 2Z̃
2
4Z̃ 4

a0
= 2 · Ry · [2 − 1]
a0 2Z̃
= Z̃ 2 · Ry
Aqui Ry é o Rydberg efetivo, que é dado por
e2 ~2 me e4 1 1 ~c
Ry = = 2
= 2
= α 2 m e c2 = α .
2a0 2me a0 2~ 2 2 a0
A constante de estrutura fina α é dada por
e2 q2 1 ∼ 1
α= = · =
~c 4π0 ~c 137, 036
Em termos da constante de estrutura fina, o raio de Bohr pode ser reescrito como
~ ~ ~ 1 ~
a0 = · 2 = = · ·
me e αme c α me c
Portanto,
P21 P2
hψ0 | + 2 |ψ0 i = 2Z̃ 2 Ry = Z̃ 2 α2 me c2 . (5.131)
2me 2me
Similarmente tem-se que,
ˆ ˆ
Z̃e2 Z̃ 3 Z̃e2 −Z̃r1 /a0 Z̃ 3 −2Z̃r2 /a0
hψ0 | − |ψ0 i = − d (r1 ) 3 e−Z̃r1 /a0
3
e × d3 (r2 ) e
|R1 | (∞) πa0 |R1 | (∞) πa30
ˆ ∞
Z̃ 4 e2
= −8 2 · · r1 e−2Z̃r1 /a0 dr1
a0 2a0 0
2
Z̃ 4 a0
= −8 2 · Ry ·
a0 2Z̃
= −2Z̃ 2 Ry
Portanto, temos que calcular

ˆ ˆ
(Z̃ − Z)e2 Z̃ 3 (Z̃ − Z)e2 −Z̃r1 /a0 Z̃ 3 −2Z̃r2 /a0
hψ0 | |ψ0 i = d (r1 ) 3 e−Z̃r1 /a0
3
e × d3 (r2 ) e
|R1 | (∞) πa0 |R1 | (∞) πa30
ˆ ∞
Z̃ 3 (Z̃ − Z) e2
=8 · · r1 e−2Z̃r1 /a0 dr1
a20 2a0 0
2
Z̃ 3 (Z̃ − Z) a0
=8 2
· Ry ·
a0 2Z̃
= 2Z̃(Z̃ − Z) · Ry
" #
P21 Z̃e2 P22 Z̃e2
hψ0 | − + − |ψ0 i = 2Z̃ 2 Ry − 4Z̃ 2 Ry = −2Z̃ 2 Ry (5.132)
2me |R1 | 2me |R2 |
" #
(Z̃ − Z)e2 (Z̃ − Z)e2
hψ0 | + |ψ0 i = 4Z̃(Z̃ − Z) · Ry (5.133)
|R1 | |R2 |
Portanto, falta calcular a “energia de interação” entre os dois elétrons, para a função de onda
tentativa:
ˆ ˆ !2
− 2aZ̃ (r1 +r2 )
e2 Z̃ 3 e 0
hψ0 | |ψ0 i = e2 3 3
d (r1 )d (r2 ) . (5.134)
R12 (∞) (∞) πa30 |r1 − r2 |
A seguir será feita uma integral, a qual será muito útil .
Teorema 5.2. Seja u, v, e w três números reais positivos (os quais também podem ser zero).
Então
ˆ
0 exp(−u|y − x| − v|y − x0 |)
I(u, v; x, x ) ≡ d3 (y)
(∞) |y − x||y − x0 |
4π e−v∆ − e−u∆

= , (5.135)
∆(u2 − v 2 )
na qual ∆ ≡ |x − x0 |.
ˆ ˆ
3 exp(−u|x| − v|y| − w|x − y|)
J(u, v, w) ≡ d (x) d3 (y)
(∞) (∞) |x||y||x − y|
2
(4π)
= . (5.136)
(u + v)(v + w)(w + u)
Demonstração. A seguir é mostrado com determinar tal integral

Inicialmente considere que z = y − x, e que |z| = r. Então a seguinte troca de variáveis
pode ser feita
d3 (y) → d3 (z) = r2 drd cos θdφ. (5.137)
Para simplificar a integração sobre os ângulos, considere, sem perdas de generalidade, que um
dos eixos do sistema está direcionado ao longo do vetor x − x0 :
√
|y − x0 | = |z + x − x0 | = r2 + ∆2 + 2r∆ cos θ. (5.138)

Portanto,
ˆ ∞ ˆ 1
√
exp(−v r2 + ∆2 + 2r∆ cos θ)
I(u, v; x, x0 ) = 2π re−ur dr d cos θ √ . (5.139)
0 −1 r2 + ∆2 + 2r∆ cos θ
A integração sobrecos θ resulta

ˆ ∞
2π
0
dre−ur e−v|r−∆| − e−v(r+∆) .

I(u, v; x, x ) = (5.140)
v∆ 0
Finalmente, integrando sobre r obtém-se

−v∆ −u∆

4π e − e
I(u, v; x, x0 ) = . (5.141)
∆(u2 − v 2 )
Seja x = |x|, y = |y|, logo escreva

ˆ ∞ ˆ ∞ ˆ 1
2 2
J(u, v, w) = 4π x dx 2π
y dy d cos θ (5.142)
0 0 −1
p
exp(−ux − vy − w x2 + y 2 − 2xy cos θ)
p .
xy x2 + y 2 − 2xy cos θ
A integração procede similarmente a acima.
Aplicando agora esse teorema ao nosso problema, temos

!2 ˆ ˆ − 2aZ̃ (|x|+|y|)
e2 Z̃ 3 e 0
hψ| |ψi = e2 3
d (x)d (y) 3
R12 πa30 (∞) (∞) |x − y|
!2
2 Z̃ 3
= e ∂u ∂v J(u = 2Z̃/a0 , v = 2Z̃/a0 , 0) (5.143)
πa30
5
= Z̃Ry. (5.144)
4
Portanto,

5 2
hψ| H |ψi = −2Z̃ + 4Z̃(Z̃ − Z) + Z̃ · Ry.
4

5
= 2Z̃ 2 − 4Z̃Z + Z̃ · Ry
4
Para determinar o mínimo, deve-se

∂ 5 5
hψ| H |ψi = 4Z̃ − 4Z + · Ry = 0 =⇒ Z̃ = Z − ,
∂ Z̃ 4 16
mas como Z = 2, então segue que
5 27
Z̃ = 2 − = .
16 16
Portanto, o mínimo está em Z̃ = 27/16. Logo

5
hψ| H |ψimin |Z̃=27/16 = 2Z̃(Z̃ − 2Z) + Z̃ · Ry
4

5
= Z̃ 2(Z̃ − 2Z) + · Ry
4

27 27 5
= 2( − 4) + · Ry
16 16 4
= −77.04 eV.
Experimentalmente, a energia do estado fundamental do átomo de hélio, da primeira e segunda

energias de ionização, é
E0 = −(24.59 + 54.41) = −79.00 eV. (5.145)
O valor obtido pelo método variacional com a função tentativa do átomo de hidrogênio está
2.5% acima do resultado experimental. Cálculos variacionais mais cuidadosos, com melhores
funções tentativa, fornecem valores mais próximos do resultado experimental. Note que o melhor
valor obtido para o número atômico efetivo foi Z̃ = 27/16 em vez de Z̃ = Z = 2. Isso sugere
5
que o núcleo blinda um elétron em relação ao outro, o que reduz a carga efetiva para 16
e.


Capítulo 6
A Estrutura Fina e Hiperfina do Átomo

de Hidrogênio
6.1 Introdução
Aqui será considerada a estrutura fina do átomo de hidrogênio e de átomos hidrogenoides

assim como do alcalinos1 , o que diz respeito aos efeitos relativísticos e de spin sobre a dinâmica do
elétron. Ambos efeitos são da mesma ordem de grandeza, e devem ser tratados em conjunto em
qualquer tratamento realista da estrutura atômica. De fato, o spin em si pode ser visto como um
fenômeno fundamentalmente relativístico, embora em aplicações de baixa energia ele geralmente
é tratado dentro de uma estrutura nominalmente não-relativística pela inclusão de termos extras
na equação de Schrödinger. Esta será a abordagem dada aqui, na qual os termos da estrutura
fina serão tratados como perturbações impostas ao modelo eletrostático simples usado na solução
do átomo de hidrogênio. Os termos de estrutura fina são responsáveis por efeitos relativísticos
da ordem de (v/c)2 , e tem o efeito de ampliar o espaço de Hilbert com a inclusão dos graus de
liberdade de spin, e consequentemente com a introdução de novos números quânticos, deslocando
e abrindo a degenerescência dos níveis de energia do modelo eletrostático. Em particular o
deslocamento dos níveis de energia significa que as linhas espectrais que aparecem com sendo
um estado singleto em baixa resolução tornam-se multípletos espaçados em alta resolução e vem
daí o termo “estrutura fina”. A estrutura fina era conhecida experimentalmente muito antes
de ter sido alcançada uma compreensão teórica adequada, e foi uma importante força motriz
no desenvolvimento teórico em determinada fase da história da física atômica. Além de seu
interesse intrínseco e importância na física atômica, a estrutura fina é interessante como uma
janela sobre mecânica quântica relativística.
1
Os metais alcalinos apresentam configuração eletrônica terminada em ns1 . O único elétron existente na
camada de valência está relativamente afastado do núcleo, e protegido pela camada interna preenchida. Por isso
esse elétron pode ser removido com facilidade. Em contraste, os elétrons internos estão próximos ao núcleo, mais
firmemente ligados, sendo muito difícil removê-los. Por isso, esse modelo funciona bem.
117
6.2. O Hamiltoniano não perturbado
6.2 O Hamiltoniano não perturbado

As forças mais importantes no modelo atômico são as forças eletrostáticas de Coulomb, as
quais foram levadas em conta na solução do átomo de hidrogênio. O sistema não perturbado
é um átomo de um único elétron, o átomo de hidrogênio, os hidrogenoides e alcalinos, cujo
Hamiltoniano tem a seguinte forma geral
P2
H0 = + V (R), (6.1)
2µ
na qual o primeiro termo representa a energia cinética do átomo no referencial do centro de
massa, e µ é a massa reduzida do sistema elétron-núcleo. Já o segundo termo,
q2 1 e2
V (R) = − =− (6.2)
4π0 R R
representa a interação eletrostática entre o elétron e o próton, e q, com q < 0, é a carga do
elétron.
A expressão (6.1) é uma aproximação, pois ela não leva em conta efeitos relativísticos. Além
disso, todos os efeitos magnéticos relacionados ao spin do elétron são ignorados, assim como, o
spin do próton e suas correspondentes interações magnéticas. Esses termos são de fato muito
pequenos, porém com a precisão obtida nos experimentos de espectroscopia, torna possível
observarmos efeitos que não estão incluídos no Hamiltoniano (6.1). Portanto, essas correções
podem ser levadas em conta, ao escrevermos o Hamiltoniano do átomo de hidrogênio na forma:
H = H0 + W, (6.3)
em que o termo H0 é dado por (6.1) e W representa todos os termos negligenciados. Desde que
W é muito menor que H0 é possível calcularmos seus efeitos sobre a energia total do átomo
de hidrogênio, usando a teoria de perturbação independente do tempo. Mostraremos que as
correções perturbativas devido ao termo W , podem ser separadas em duas categorias, devido ao
valor da correção na energia, as quais são:
1. Estrutura fina do átomo de hidrogênio;
2. Estrutura hiperfina do átomo de hidrogênio.
As correções devido aos efeitos relativísticos do átomo de hidrogênio são pequenas, pois de
acordo com o modelo de Bohr, temos
q2 1 mv 2 1 2 1 q2 1
Fe = Fc =⇒ = =⇒ mv = · (6.4)
4π0 r r 2 2 4π0 r
porém da conservação da energia temos
1 q2 1 q2 1
E = T + U = mv 2 − =⇒ E=− . (6.5)
2 4π0 r 8π0 r
Definindo
q2
e2 = (6.6)
4π0

6.2. O Hamiltoniano não perturbado
temos que
e2
E=−
, (6.7)
2r
usando a regra de quantização do momentum angular de Bohr temos
nh n~
L = mvr = = n~, n = 1, 2, 3, . . . =⇒ mv = (6.8)
2π r
portanto, desta segue que
n2 ~22
mv = (6.9)
mr2
Comparando (6.4) com (6.9), obtemos que
1 2 n2 ~2 e2
mv = = (6.10)
2 2mr2 2r
logo,
n2 ~2
r= =⇒ rn = n2 a0 (6.11)
me2
na qual o raio de Bohr efetivo a0 é dado por
~2
a0 = = 0, 5 Å (6.12)
me2
então
e2 1 Ry
En = − · , =⇒ En = − (6.13)
2a0 n2 n2
na qual Ry é o Rydberg efetivo, que é dado por
e2 ~2 me4
Ry = = = (6.14)
2a0 2ma20 2~2
A constante de estrutura fina α é dada por
e2 ∼ 1
α= = (6.15)
~c 137, 036
Em termos da constante de estrutura fina, o raio de Bohr pode ser reescrito como
~ ~ ~ 1 ~
a0 = · 2 = = · · (6.16)
m e αmc α mc
enquanto o Rydberg efetivo pode se escrito como
1 e4 1 1 ~c
Ry = m 2 = α2 mc2 = α . (6.17)
2 ~ 2 2 a0
A velocidade da n-ésima órbita do átomo de hidrogênio é dada por
1 ~ 1
L = mvn rn = n~ =⇒ mvn n2 a0 = n~ =⇒ vn = · = · αc
n ma0 n
logo pode-se escrever
v α
n
=. (6.18)
c n
Portanto, desta vê-se que a velocidade do elétron, na primeira órbita do átomo de hidrogênio
é bem menor do que a velocidade da luz c, logo fica evidente que as correções relativísticas para
a energia do estado fundamental do átomo de hidrogênio são pequenas.

6.3. Correções adicionais ao hamiltoniano do átomo de hidrogênio
6.3 Correções adicionais ao hamiltoniano do átomo de hi-

drogênio
Inicialmente vamos partir da equação de Dirac relativística para o átomo de hidrogênio
no regime fracamente relativístico. Nesse caso, será feita uma expansão para determinar uma
expressão para o hamiltoniano das correções perturbativas W . Posteriormente, será identificado
cada termo, e apresentada uma interpretação para o mesmo.
6.3.1 O Hamiltoniano da estrutura fina
A equação de Dirac é o modo mais rigoroso de se obter uma expressão para as correções
relativísticas. Considere a equação de Dirac de um elétron interagindo com um próton via um
potencial coulombiano V (R). No limite em que o sistema é fracamente relativístico, como é o
caso do átomo de hidrogênio, ao expandirmos a equação de Dirac em uma série de potências em
(v/c), obtém-se que
P2 P4 1 1 dV (R) ~2
H = me c2 + + V (R) − + · L · S + ∇2 V (R) + · · · (6.19)
2me 8m3e c² 2m2e c² R dR 8m2e c²
na qual têm-se que:
E0 = me c2 =⇒ Energia de repouso do elétron (6.20a)

P2
H0 = + V (R) =⇒ Hamiltoniano clássico do átomo de hidrogênio (6.20b)
2me
P4
Wmv = − 3 =⇒ Variação da massa com a velocidade (6.20c)
8me c²
1 1 dV (R)
Wso = 2
· L·S =⇒ Acoplamento spin-órbita (6.20d)
2me c² R dR
~2
WD = ∇2 V (R) =⇒ Termo de Darwin (6.20e)
8m2e c²
Deve-se ressaltar que é possível resolver a equação de Dirac para um elétron, num potencial
coulombiano. Entretanto a abordagem via teoria de perturbação nos permiti identificar e
compreender o significado físico das várias interações existentes dentro do átomo.
6.4 Interpretação dos vários termos do hamiltoniano H

Nesta seção será fornecida uma interpretação física para cada um dos três novos termos que
surgem ao expandirmos a equação de Dirac em uma série de potências em (v/c) [7, 24]. Os dois
primeiros de (6.19) possuem uma interpretação direta.

6.4. Interpretação dos vários termos do hamiltoniano H
6.4.1 Termo Wmv da variação da massa com a velocidade

Origem Física
Ao expandirmos a expressão da energia total relativística de uma partícula, dada por

s 2
p
2 2 2 2 p
E = (me c ) + (Pc) = me c 1 + , (6.21)
me c
em uma série de potências do termo |p|/me c2 , obtemos que

s 2
1 p2 1 p4

p
1+ =1+ − − ···
me c 2 m2e c2 8 m4e c4
e com isso pode-se escrever
p2 1 p4
E = me c2 + − + ··· (6.22)
2me 8 m3e c2
Nessa expressão tem-se a energia de repouso do elétron E0 = me c2 e a sua energia cinética

p2 /2me . Por sua vez o terceiro termo dessa expansão, −p4 /8m3e c2 representa a primeira correção
na energia devido a variação da massa com a velocidade.
Ordem de magnitude
Para estimarmos a ordem de magnitude da correção Wmv , será calculada a ordem de

magnitude da razão Wmv /H0 , e para isso será considerado que H0 ' P2 /2me , assim
1 p4 2
P2

Wmv 8 m3e c2 1 v 2 1 2 1 1
' = = = α = = 1, 3 × 10−5 (6.23)
H0 P2 4m2e c2 4 c 4 4 137, 036
2me
Portanto, como H0 ' 13, 6 eV, segue então que Wmv ' 0, 18 meV.
6.4.2 Termo Wso : Acoplamento spin-órbita

Origem física
O termo devido ao acoplamento spin-órbita possui a seguinte forma
HSO = −Ms · B0 ,
na qual, MS é o momento magnético do elétron e B0 é o campo magnético visto pelo elétron no

seu referencial (esse referencial é indicado pelo linha nos campos, para maiores detalhes sobre as
transformações dos campos veja o livro do Purcell [30, Ver capítulo 5] e do Matveev [23, Parágrafo
2
Lembre-se que
n(n − 1) 2 n(n − 1)(n − 2) 3
(1 + x)n = 1 + nx + x + x + ···
2! 3!

11, pág 77]). No caso do átomo de hidrogênio, esse campo magnético pode ser compreendido
como sendo devido a carga positiva do núcleo, a qual no referencial do elétron ela orbitá o
elétron, gerando uma corrente. No caso dos átomos alcalinos, o elétrons do caroço também
estão orbitando o elétron de valência, vistos no referencial do elétron de valência, e também
contribuem para o campo magnético naquele referencial.
Em um outro ponto de vista, o campo magnético B0 pode ser visto como o campo magnético
que surge quando faz-se uma transformação de Lorentz do campo eletrostático no referencial do
núcleo (referencial do laboratório) para o referencial do elétron. Será considerado que não há um
campo magnético no referencial do laboratório. Entretanto, se o núcleo possui um spin diferente
de zero, então ele produz campo de dipolo magnético, o qual é o responsável pela interação
hiperfina. Mas quando presente, esse campo de dipolo é muito menor do que o campo magnético
B0 responsável pelos efeitos da interação spin-órbita, assim aqui ele é ignorado. Portanto, usando
as expressões sem linha E e B para os campos no referencial do laboratório temos que

V 1 dV (r)
E = −∇ =− êr e B=0
q q dr
na qual
e2 r
V (r) = − e êr = .
r |r|
Agora, como o elétron move-se com uma velocidade v = p/me no campo eletrostático E
criado pelo próton. De acordo com a relatividade especial, no referencial do elétron, o elétron
percebe um campo magnético B0 , o qual é dado por [31, ver seção 8.1, pág. 163]
1
B0 = − v × E. (6.24)
c2
Como o elétron possui um momento magnético intrínseco,
q
Ms = S, (6.25)
me
ele interage com o campo magnético B0 , e sua correspondente energia de interação é dada por
W 0 = −Ms · B0 . (6.26)
O campo eletrostático E é dado por
e2

V 1 dV (r) r
E = −∇ =− , com V (r) = −
q q dr |r| r
logo o campo magnético B0 pode ser escrito como
1 1 dV (r) p
B0 = × r,
qc2 r dr me
mas como o operador momentum angular é dado por
L = R × P = −P × R,

segue então que

1 1 dV (r)
B0 = − L (6.27)
qme c2 r dr
Portanto, a interação W 0 dada por (6.26), toma a seguinte forma
1 1 dV (R) e2 1
W0 = L · S = L·S (6.28)
qme c2 R dR m2e c² R3
Portanto, a menos de um fator 1/2, encontramos os termos que constituem o acoplamento

spin-órbita Wso . Esse fator 1/2 deve-se a precessão de Thomas, para a qual o movimento
do elétron em torno do próton é circular e não retilíneo, para detalhes consulte o livro do
Jackson [20, seção 11.5, pág 364]. O termo Wso representa a interação do momento magnético
do spin do elétron com o campo magnético “percebido, sentido” pelo elétron, devido ao seu
movimento no campo eletrostático do próton.
Ordem de magnitude
Desde que os momenta angulares L e S são da ordem de ~, temos que,
e2 ~2 e2 ~2 2 e2 ~2 2
Wso ' 2 3
' 2 3
= · · 2
= · Ry · Ry, (6.29)
2me c² R 2me c² a0 me c² 2a0 2me a0 me c²
considerando que H0 ' e2 /2a0 , então tem-se que
Wso 2 1
' · α2 me c2 = α2 ' 7, 30 × 10−6 . (6.30)
H0 me c² 2
6.4.3 O termo de Darwin

Sir Charles Galton Darwin (1887-1962), físico britânico, neto do biólogo Charles Darwin, foi
um dos primeiros, a trabalhar com os níveis de energia exatos do hidrogênio de acordo com a
equação de Dirac e desse modo descobriu o termo que leva o seu nome para a correção fina da
energia do estado fundamental do hidrogênio [9], o qual é dado por
~2
WD (r) = 2 2
∇2r V (r).
8me c
O termo Darwin pode ser obtido a partir de uma aproximação de baixa energia da equação
de Dirac do elétron em um campo central. Uma maneira elegante de executar esta tarefa é
por meio da transformação Foldy-Wouthuysen [29] ou usando a aproximação de Pauli para a
equação de Dirac [32–34, 36]. A mesma aproximação leva também aos outros termos detectados
na estrutura fina átomo de hidrogênio, incluindo o termo spin-órbita.
Origem física
Diferentemente dos outros dois termos da estrutura fina, o Wmv e o Wso , este termo não é
fácil de se interpretar, pois de modo grosseiro pode-se dizer que ele descreve uma certa não
localidade na interação do elétron com o campo eletrostático descrito pelo potencial coulombiano

Figura 6.1: Ilustração do movimento tremido do elétron, conhecido como “Zitterbewegung”, cujo
origem vem do alemão “zittern” que significa tremer e “Bewegung” que significa movimento. Este é um
movimento oscilatório extremamente rápido realizado pelo elétron.
V (R). Esta última contribuição para a estrutura fina é conhecida com termo de Darwin s surge
do movimento “tremido” do elétron, conhecido como “Zitterbewegung”, no qual é equivalente a
um pequena “perturbação” no potencial sentido pelo elétron.
No caso convencional, há uma dedução alternativa simples, a qual é baseada no fato de que um
pacote de ondas formado pela soluções da equação de Dirac realizam um movimento oscilatório
muito rápido com uma amplitude da ordem de δr ≈ λc := ~/(mc), na qual λc é o comprimento
de onda de Compton. Esse é o chamado ’Zitterbewegung’ (movimento tremido) resulta da
interferência das componentes de energia positiva e negativa dos pacotes de onda [19, 32, 33, 36].
Na média, a partícula sente portanto um potencial um pouco alargado sobre uma região da
ordem de δr, em vez de seu valor em r. A mudança média resultante na energia é facilmente
estimada como sendo [19, 32, 33]
hδV (r)i = hV (r + δr) − V (r)i

* +
X ∂V 1X ∂ 2V
= δri + δri δrj + ...
i
∂ri 2 ij ∂ri ∂rj
1 ~2
≈ (δr)2 ∇2r V (r) ≈ ∇2 V (r)
6 6m2 c2 r
na qual considerou-se que as flutuações não possuem uma direção preferencial no espaço. O
potencial médio resultante hδV (r)i está acima daquele do termo convencional de Darwin WD (r)
por um fator numérico de 6/8.
Na equação de Dirac, a interação entre o elétron e o campo elétrico coulombiano do núcleo é
“local”, pois ela só depende do valor do campo na posição r do elétron. Porém, na aproximação
não-relativística, na qual faz-se uma expansão da equação de Dirac em série de Taylor em termos
de (v/c), que fornece para as duas componentes do spinor, como resultado, uma equação cuja
descrição do estado do elétron, que trata a interação do elétron com o campo elétrico de forma
não local.

Se colocarmos um elétron dentro de uma caixa de largura

L, então, pelo princípio da incerteza o momentum do elétron p = mc L
poderá ter valores da ordem de ~/L. Se L for pequeno o
suficiente, pode-se tornar este momentum tão grande quanto
se deseja, tendo até mesmo valores relativísticos. Tomando L
L
então o momentum p = me c, para o qual os efeitos relativís- Figura 6.2: Caixa com um elétron
ticos são significativos, e resolvendo para ∆x = L o princípio com um momentum linear p = me c.
de incerteza ∆p · ∆x = ~, obtém-se que
~ ~
L = λc = = (6.31)
∆p me c
na qual foi introduzida a constante λc , conhecida como comprimento de onda de Compton.
Esta constante, define uma escala de tamanhos em que os efeitos relativísticos e quânticos
tornam-se importantes para distâncias menores do que esta escala de tamanho. Esta escala de
comprimento pode ser definida para qualquer partícula, entretanto, para o elétron ela é
λc = αa0 = 3, 0 × 10−13 m
em que α é a constante de estrutura fina e a0 é o raio de Bohr. O comprimento de onda de

Compton do elétron é da ordem 1/137 vezes o tamanho do átomo de hidrogênio. Note que este
tamanho ainda é da ordem de 102 maior que o raio nuclear, o qual é da ordem de 10−15 m,
então os efeitos quânticos e relativísticos são importantes dentro do núcleo.
Se um elétron está confinado a uma distância da ordem do comprimento de onda Compton,
então, o correspondente momentum devido ao princípio da incerteza implica em uma energia
comparável à mc2 , a energia de repouso do elétron. Então, processos, tais como criação de pares
tornam-se possível, ou seja, a reação,
e− → e− + e− + e+ , (6.32)
na qual, e− representa um elétron e e+ representa um pósitron.

Tais reações, de fato, não ocorrem dentro de um átomo, porque não há energia suficiente
(é necessário no mínimo de 2mc2 ) para criar um par elétron-pósitron. Mas os estados que
contêm dois elétrons e um pósitron aparecem virtualmente, ou seja, por um período de tempo
curto o suficiente para que a violação da conservação da energia não possa ser notada (isto é,
algumas vezes menor do que ~/2mc2 ). Por outro lado, tais estados virtuais aparecem na teoria
de perturbação quando se soma sobre todos os “estados intermediários”, os quais surgem, em
última análise a partir de uma relação de completeza.
O par elétron-pósitron criado conforme a eq. (6.32), sobrevive por um curto intervalo de
tempo da ordem de ∆t = ~/me c2 , então viajando em uma velocidade comparável a velocidade
da luz, as partículas percorrem uma distância da ordem de λc = ~/me c, antes de se aniquilarem
e sumirem novamente. O efeito pode ser visto como um borrão, uma mancha, na posição
atômica do elétron através de uma distância da ordem λc .

Para modelar esse efeito, considere a função de distribuição f (r) a qual representa esse
borrão, ou incerteza, na posição atômica do elétron. Essa função é normalizada de modo que
ˆ
d3 r f (r) = 1. (6.33)
Então a energia efetiva da interação do elétron com com um potencial eletrostático V (r) na
posição r0 não é V (r0 ), mas em vez disso
ˆ
hV (r)i = d3 r f (r − r0 )V (r)
Considerando que V (r) varie lentamente na escala de variação de f (r − r0 ), então nesse caso,
pode-se expandir V (r) em um série de Taylor em torno do ponto r0 , obtendo que
ˆ
∂ 2 V (r0 )

3 1
hV (r + r0 )i = d r f (r) V (r0 ) + (r − r0 ) · ∇V (r0 ) + (ri − r0i )(rj − r0j ) + ···
2 ∂ri ∂rj
(6.34)
Devido a normalização dada por (6.33), o primeiro termo da expressão anterior, V (r0 ), a
expressão usual para a energia potencial de um elétron na posição r0 . Considerando que a
distribuição f (r) é invariante por rotação, ou seja, f (r) = f (r), em que r = |r|, então o termo
devido a primeira correção é nulo. Para estimar o segundo termo, será considerado que a função
de distribuição f (r) do alargamento é gaussiana, ou seja, que
1 2 /λ2
f (r) = e−r c ,
π 3/2 λ3c
para a qual o comprimento do alargamento é o comprimento de onda de Compton. Fazendo a
integral para o segundo termo, encontra-se que
ˆ ˆ
1 2 /λ2 1
d3 r (ri − r0i )(rj − r0j )f (r − r0 ) = d3 r ri rj e−r c = λ2c δi,j .
π 3/2 λ3c 2
Usando esse resultado, obtém-se que a correção na energia é dada por
1
∆E = hV (r + r0 ) − V (r0 )i = λ2c ∇2 V (r).
6
A expressão acima é idêntica ao termo de Darwin, a menos do fator 1/6 cujo fator valor
correto é 1/8, assim
1 1 ~2
WD = λ2c ∇V (r) = ∇2 V (r). (6.35)
8 8 m2e c2
Ordem de Magnitude
O termo de Darwin é dado pela equação (6.35), porém como no casos dos átomos tipo
hidrogenoides, a energia potencial eletrostático é dada por
q2 e2
V (R) = − =− ,
4π0 R R
e para esse caso tem-se que

2 1 2 2
∇ V (R) = −e ∇ = 4πe2 δ(R),
R

6.5. A interação hiperfina
e disso segue imediatamente que

π~2 e2
WD = δ(R). (6.36)
2m2e c2
Portanto, no estado atômico ψ(r) = hr | ψi, o valor esperado desse termo é dado por
π~2 e2
hWD i = |ψ(0)|2 ,
2m2e c2
note ainda que,
~2 e2 ~2 1 e2 1
2 2
= 2
· 2
· · 2a30 = α2 Ry · 2a30
2me c 2me a0 me c 2a0 2
logo
hWD i = πα2 Ry · a30 |ψ(0)|2
e como para estados do tipo s tem-se que |ψs (0)|2 ' a30 , que é o valor da função de onda na
origem. Logo esse termo irá fornecer uma contribuição não nula somente para o estados atômicos
do tipo s, pois somente para esses estados temos |ψs (0)|2 6= 0. Portanto, para os estados do tipo
s, tem-se que
hWD is ' πα2 Ry
ou seja,
hWD is
' πα2
Ry
6.4.4 Hamiltoniano da estrutura fina

Portanto, agora é possível escrever o Hamiltoniano completo que fornece a correção em
energia chamada de estrutura fina, ou seja,
Wef = Wmv + Wso + WD ,
pois todos os seus termos fornecem uma correção para a energia da mesma ordem.
6.5 A interação hiperfina

Basicamente, a interação hiperfina é aquela que ocorre entre e os momenta nucleares e os
campos eletromagnéticos atômicos de origem externa ao núcleo, ou seja, é a interação entre o
spin nuclear e os campos eletromagnéticos das partículas carregadas ao seu redor.
O núcleo de um átomo contém cargas localizadas e distribuições de corrente, que produzem
campos elétricos e magnéticos que podem ser decompostos em campos multipolares, como na
eletrostática clássica ou na magnetostática. O primeiro dos momentos multipolares, o monopolo
elétrico, é o campo eletrostático de Coulomb que mantém os elétrons em suas órbitas e produz a
estrutura grosseira do átomo. Os momentos multipolares de ordem superior produzem pequenas
correções na estrutura atômica que são geralmente conhecidas como efeitos hiperfinos.
A terminologia “hiperfina” refere-se à escala de energia desses efeitos, que é menor que aquela
da estrutura fina. Entretanto, a física dos efeitos hiperfinos é completamente diferente daquela

da estrutura fina. Na prática, os efeitos hiperfinos mais importantes são aqueles devidos aos
campos de dipolo magnético e quadrupolo elétrico do núcleo. Momentos multipolares mais
elevados do núcleo são importantes na física nuclear, mas não costumam ser na física atômica.
Aqui trataremos os efeitos hiperfinos em átomos, concentrando-nos principalmente no campo
de dipolo magnético no caso do átomo de hidrogênio. Como veremos, efeitos hiperfinos ligam a
dinâmica do elétron atômico à do núcleo, ampliando assim o espaço de Hilbert, introduzindo
novos números quânticos e deslocando e abrindo a degenerescência dos níveis de energia.
Apesar das pequenas escalas de energia envolvidas, os efeitos hiperfinos são muito importantes
em aplicações que vão da física atômica à astrofísica. Por exemplo, a transição radiativa entre
os dois níveis hiperfinos do estado fundamental do átomo de hidrogênio produz a linha de 21
centímetros que desempenha um papel importante na radioastronomia.
Por outro exemplo, os relógios atômicos utilizam frequentemente como oscilador básico uma
transição hiperfina no estado fundamental dos átomos alcalinos pesados, rubídio ou césio. A
reprodutibilidade da frequência dessas transições é tão grande que a segunda é agora definida em
133
termos da transição hiperfina no átomo Cs, ou seja, a segunda é definida como 9.192.631.770
períodos do fóton emitido neste transição, exatamente. Relógios atômicos atuais baseados em
transições hiperfinas de césio têm atualmente uma precisão da ordem de uma parte em 1015 .
Mais recentemente, foram inventados “relógios ópticos” que usam transições na faixa ótica de
frequências. Algumas delas têm precisão aproximando-se de uma parte em 1018 .
O GPS (sistema de posicionamento global) se baseia em sinais temporais de rádio emitidos
por satélites, contendo relógios atômicos, em elevadas órbita terrestre. A fim de alcançar a
precisão desejada das medições de posição na Terra, é necessário levar em conta os efeitos da
relatividade geral e especial na análise dos sinais de tempo. A relatividade especial entra por
causa da dilatação do tempo dos relógios movendo-se em suas órbitas e da relatividade geral
devido à diferença no potencial gravitacional entre o relógio em órbita e o receptor na superfície
da Terra (este é o desvio gravitacional para o vermelho).
A seguir será determinada uma expressão para essa interação.
6.5.1 O spin do próton e seu momento magnético

Aqui o próton será considerado como sendo uma partícula pontual de massa mp e carga
qp = −q, e o seu spin, assim como o elétron, é |I| = 1/2. Portanto, para o próton tem-se que
mp = 1836me ; qp = −q e |I| = |s| = 1/2. (6.37)
Ao spin I do próton, associa-se um momento magnético MI dado por
I
MI = gp µn , (6.38)
~
na qual, µn é o magnéton nuclear de Bohr, dado por
qp ~
µn = , (6.39)
2mp

MS
E(r)
MI qe
Zqp
Figura 6.3: Representação esquemática dos momentos magnéticos nuclear e eletrônico.
e gp é a razão giromagnética do próton, dada por
gp = 5, 585. (6.40)
Note ainda que

µn qp ~ 2me me 1
= · = = . (6.41)
µB 2mp q~ mp 1836
Portanto, embora as expressões para os momenta angulares do próton e do elétron sejam
idênticas, o magnetismo nuclear, devido as diferença entre as massas do elétron e do próton, é
muito menor do que o eletrônico. Portanto, as interações magnéticas devido ao spin do próton
são muito fracas.
6.5.2 O hamiltoniano magnético hiperfino

Como o próton possui spin e momento magnético, então em seu movimento em torno do
núcleo, o elétron percebe um campo eletrostático e um campo magnético criado pelo próton,
os quais são descrito pelo potencial escalar VI (r) e pelo potencial vetor AI (r), portanto, o
hamiltoniano do elétron no campo do próton é
[P − qAI (R)]2
H= + UI (R) − MS · BI , (6.42)
2me
no qual o momento magnético eletrônico é

S
MS = 2µB
~
e o campo magnético BI é dado por
BI (R) = ∇ × AI (R). (6.43)
O potencial eletrostático VI (R), para o qual o hamiltoniano do átomo de hidrogênio é dado

por
P2 P2
H0 = + qVI (R) = + UI (R), (6.44)
2me 2me
resulta da superposição linear de várias contribuições, sendo que cada uma delas está associada
a um dos momento de dipolo do núcleo.
Para um núcleo arbitrário deve-se considerar:

1. A energia potencial de um núcleo de carga total Zq (momento de dipolo de ordem zero) é
Zq 2
U0 (r) = qV0 (r) = − . (6.45)
4π0 r
2. O termo de quadrupolo elétrico do núcleo [7, ver complemento EX , pág. 1058] (de
segunda ordem) adiciona um termo ao potencial V0 (r), o qual produz um dos termos
do hamiltoniano hiperfino, o qual é chamado de termo de quadrupolo elétrico. No caso
do átomo de hidrogênio, ele é zero, já que o próton, cujo spin I é |I| = 1/2, não possui
momento de quadrupolo elétrico.
3. Os momentos de multipolos elétricos [7, ver complemento EX , pág. 1058], de ordem

k = 2, 4, 6, . . ., os quais teoricamente são tantos quanto k ≤ 2|I|, para o próton, todos eles
são zero.
Portanto para o átomo de hidrogênio o potencial V0 (r), é realmente o potencial percebido pelo
elétron.
Agora serão considerados os termos que surge do potencial vetor AI (R). Pelas mesmas
razões anteriores não se pode ter multipolos magnéticos de ordem superior a primeira. Assim o
potencial vetor, para o momento de dipolo magnético MI do próton é dado por [31, seção 8.6,
pág. 177]
µ0 M I × R
AI (R) = · (6.46)
4π R3
Portanto, ao substituir (6.46) em (6.42) e mantendo somente os termos lineares em AI (R),
obtém-se que o hamiltoniano do átomo de hidrogênio com as correções hiperfinas
H = H0 + Whf , (6.47)
no qual H0 é dado por (6.44) e o hamiltoniano hiperfino é dado então por

q S
Whf =− [P · AI (R) + AI (R) · P] − 2µB · ∇ × AI (R) (6.48)
2me ~
6.5.3 Forma detalhada do hamiltoniano hiperfino

Inicialmente será descrito o acoplamento com o momento magnético do próton.
6.5.4 Acoplamento do momento magnético do próton com momentum

angular orbital do elétron
Vamos iniciar, pelo primeiro termo de (6.48), Whf , para o qual temos que

µ0 MI × R MI × R
P · AI (R) + AI (R) · P = P· + ·P . (6.49)
4π R3 R3

Como as componentes de MI comutam com os operadores R e P, ou seja, [R, MI ] = [P, MI ] = 0,

tem-se então que
P · (MI × R) = Pm êm · êi (MI )j Rk ijk

= Pi (MI )j Rk ijk
= (MI )j Pi Rk ijk
= (MI )j Pi Rk (−jik )
= (MI )j Rk Pi (+jki )
= (MI )m êm · êj Rk Pi jki
= MI · (R × P)
= MI · L
temos ainda que
(MI × R) · P = ijk (MI )j Rk êi · êm Pm

= ijk Pi (MI )j Rk
= (−jik ) (MI )j Pi Rk
= jki (MI )j Rk Pi
= (MI )m êm · êj jki Rk Pi
= MI · (R × P)
= MI · L
Portanto, em síntese viu-se que: P · (MI × R) = (MI × R) · P = MI · L.

A seguir será mostrado que [L, F (R)] = 0, e para isso, deve-se lembrar que
Rl 0
[Pl , F (R)] = −i~ F (R),
R
e com isso temos
[L, F (R)] = ijk êi [Rj Pk , F (R)]

= ijk êi Rj [Pk , F (R)]
i~
= − F 0 (R)ijk êi Rj Rk
R
= 0. (6.50)
Note ainda que o resultado anterior ainda pode ser escrito como
1
[L, F (rR)] = −i~ F 0 (R)R × R = 0.
R
Disso segue imediatamente que
[L, R−n ] = 0,

L
v
MI
qe
Zqp
BL
Figura 6.4: Momentum angular orbital e o campo magnético no núcleo devido a rotação do elétron
em torno do núcleo.
e portanto,
1 1 1 MI · L
(MI × R) · P = MI · L = P · (MI × R) =
R³ R³ R³ R³
Portanto, o termo da correção hiperfina, devido a interação com o momentum angular orbital
do elétron é
L µ0 q MI · L µ0 MI · (L/~)
Whf =− 2 = − 2µB (6.51)
4π 2me R³ 4π R³
Esse termo corresponde ao acoplamento entre o momentum magnético nuclear MI e o campo
magnéticoBL criado pela corrente associada ao movimento de rotação do elétron em torno do
núcleo é dado por
µ0 qL
BL (r) = , (6.52)
4π me r3
e portanto, a correção hiperfina pode ser reescrita como
L
Whf = −MI · BL (R). (6.53)
conforme ilustra a figura.

L
Note, que o campo magnéticoBL que surge em Whf decai com 1/R3 , o que ainda assim não
introduz uma singularidade na origem, para ver isso, pois considere por exemplo, o seguinte

elemento de matriz ϕk,l,m W L ϕk0 ,l0 ,m0 para o átomo de hidrogênio. Na representação R
hf
tem-se que
hR | ϕk,l,m i = Rk,l (r)Ylm (θ, ϕ),
para a qual na origem, tem-se que
lim Rk,l (r) w crl .

r→0

Na integração o elemento de volume d3 r = r2 dr sen θ dθ dϕ, logo o comportamento do elemento

de matriz na origem será da ordem de
0 0
rl+l +2−3 = rl+l −1 .
Além disso, presença do operador hermitiano L significa que o elemento de matriz é zero quando
l ou l0 for zero. Temos então que esse termo permanecerá finito na origem quando
0
l + l0 ≥ 2 e rl+l −1 6= ∞ .
Entretanto, de forma geral para esse elemento de matriz, como o operador o L pode ser
escrito como
1 1
L = (L+ + L− )êx + (L+ − L− )êy + Lz êz ,
2 2i
tem-se então que
hϕk,l,m | Lx | ϕk0 ,l0 ,m0 i ∝ δk,k0 δl,l0 (δm,m0 +1 + δm,m0 −1 )
hϕk,l,m | Ly | ϕk0 ,l0 ,m0 i ∝ δk,k0 δl,l0 (δm,m0 +1 − δm,m0 −1 )
hϕk,l,m | Lz | ϕk0 ,l0 ,m0 i ∝ m0 ~δk,k0 δl,l0 δm,m0 .
6.5.5 Acoplamento com o spin do elétron

Mostrou-se na seção anterior a relevância das singularidades na origem devido ao potencial
vetor dado por (6.46). Note que o último termo de (6.48), contém essa singularidade na origem,
e para evitar problemas com essa singularidade, o próton será considerado como sendo uma
partícula de raio finito, e somente na expressão final será tomado o limite no qual o raio do
próton vai a zero. Além disso, do ponto de vista físico , sabe-se que o próton possui uma certa
extensão espacial e seu magnetismo se estende sobre um certo volume do espaço. Porém, as
dimensões do próton são muito menores do que o raio de Bohr a0 . Isso, justifica o fato de que
no final do tratamento que será dado ao próton, ele possa ser novamente considerado com uma
partícula pontual.
6.5.6 Campo magnético associado ao próton

Considere o próton com sendo uma pequena esfera de raio ρ0 e que possui um campo
magnético interno uniforme dado por
Bi = Bi êz ,
e consequentemente um momento magnético MI . Portanto, a distribuição de magnetismo no

interior do próton cria em pontos a uma distância r do seu centro um campo magnético B.
Nessas condições as componentes de B são dadas pelo eletromagnetismo clássico (para maiores

z
MI Bi
x
Figura 6.5: Estrutura interna de um próton
detalhes sobre o campo de um dipolo magnético consulte por exemplo o livro do Greiner [11, págs.
209-211], o do Griffiths [15, Exemplo 5.13] ou o do Jackson [20, Seção 5.6]) para r ρ0 por
µ0 xz
Bxdip = 3MI 5
4π r
µ0 yz
Bydip = 3MI 5 (6.54)
4π r
µ0 3z 2 − r2
Bzdip = MI
4π r5
Essa expressão é válida mesmo para valores de r somente um pouco maiores do que ρ0 . Como
o próton possui spin 1/2, ele não possui momentos de multipolos elétricos de ordens maiores
do que 1. Portanto, o campo magnético fora é o de um dipolo magnético. Dentro do próton o
campo magnético é uniforme e é paralelo ao momento magnético MI .
Tem-se que
˛ ˆ ˆ
B · dS = B · dS + lim B · dS = 0,
xy R→∞ ∩
e como
ˆ
1
lim B · dS = 0, pois lim B(R) → .
R→∞ ∩ R→∞ R3
ˆ ˆ ˆ
B · dS = Bint · dS + Bext · dS = 0.
xy • }

Entretanto, tem se que

ˆ ˆ ∞
Bext · dS = 2π rdrBz (z = 0)
} ρ0
ˆ ∞ 2
3z − r2

µ0
= 2π MI rdr
4π r5
ˆ ∞
ρ0 z=0
µ0 MI
=− r−2 dr
2 ρ0
µ0 2π
= − MI ·
4π ρ0
Portanto, tem-se que

µ0 2π
Φxy
ext (ρ0 ) = − MI · .
4π ρ0
Já para o campo interno, como ele é uniforme, segue imediatamente que
ˆ
xy
Φint (ρ0 ) = Bint · dS = πρ20 · Bint .
•
Entretanto, como
Φxy xy
int (ρ0 ) + Φext (ρ0 ) = 0,
tem-se
µ0 2π µ0 2
πρ20 · Bint − MI · =0 =⇒ Bint = MI · 3 .
4π ρ0 4π ρ0
Portanto, tem-se agora o campo magnético
z gerado pelo próton em todos os pontos do
espaço, o qual pode ser escrito como
BI (r) = Bint + Bdip

ext (r),
R
ou ainda,

Bint (r) = µ0 MI · 23 êz para r ≤ ρ0
y BI (r) =
I 4π ρ0
Bext (r) = Bdip (r) para r > ρ0
I ext
x (6.55)
dip
Figura 6.6: Próton de raio ρ0 no interior de um no qual, o termo Bext (r), é dado pela expressão
hemisfério esférico de raio R, com R ρ0 . (6.54).
Agora pode-se escrever o termo do hamil-
toniano hiperfino que estava faltando, como

L S
Whf = Whf − 2µB · BI (R), (6.56)
~
o qual, devido ao campo magnético interno do próton pode ser reescrito como
L dip c
Whf = Whf + Whf + Whf , (6.57)

para o qual temos que

dip S
Whf = −2µB · Bdip
ext (r) Termo de dipolo (6.58)
~

c S
Whf = −2µB · Bint
I (r) Termo de contato (6.59)
~
esses dois termos são conhecidos respectivamente, devido a sua origem, por termo de dipolo e
de contato.
6.5.7 Termo de dipolo magnético

A forma explicita do termo de dipolo magnético é obtida ao substituirmos (6.54) em (6.58)
o que resulta em
dip 2µB
Sx Bxdip + Sy Bydip + Sz Bzdip ,

Whf =−
~
a qual toma a seguinte forma

dip µ0 2µB xSx + ySy + zSz Sz
Whf =− · · 3zx − MI ,
4π ~ R5 R³
como MI = MI êz , então

dip µ0 2µB 1 (S · R) (R · MI )
Whf = · · S · MI − 3 . (6.60)
4π ~ R3 R2
Essa é a expressão final para o hamiltoniano da interação dipolo-dipolo entre os dois momentos
magnéticos MI e MS dados por

S I
MS = 2µB e MI = gp µn . (6.61)
~ ~
De fato, a expressão (6.54) para o campo magnético criado pelo próton só é valida no limite em
que |r| ρ0 e a expressão (6.60) para a interação de dipolo, deveria ser aplicada somente na
parte da função de onda que satisfaz essa condição. Entretanto, quando ρ0 → 0, a expressão
(6.60) não apresenta singularidade na origem, portanto a mesma é válida em todo o espaço.
6.5.8 Termo de contato de Fermi

Ao substituir o campo interno da expressão (6.55) na (6.59), obtém-se a contribuição do
campo interno do próton para o hamiltoniano da interação hiperfina Whf . Essa operação tem
c
como resultado o operador Whf , o qual é chamado de termo de contato de Fermi, e cujos
elementos de matriz na base {|ϕk,l,m, i} são
˚
ϕk0 ,l0 ,m0 ,0 = − µ0 · 2µB MI · h | Sz | 0 i 2 d3 rϕ∗k,l,m (r = 0)ϕk0 ,l0 ,m0 (r = 0).

c
ϕk,l,m, Whf
4π ~ ρ30 r≤ρ0
Quando ρ0 → 0, o volume de integração é 4πρ30 /3, o qual também se aproxima de zero, logo
ϕk0 ,l0 ,m0 ,0 = − µ0 · 2µB MI · h | Sz | 0 i 8π · ϕ∗k,l,m (r = 0)ϕk0 ,l0 ,m0 (r = 0). (6.62)

c
ϕk,l,m, Whf
4π ~ 3
6.6. O hamiltoniano completo da estrutura hiperfina
Portanto, o termo de contato pode ser escrito em uma forma mais compacta como,
c µ0 2µB 8π
Whf =− · · · MI · Ms δ(R) (6.63)
4π ~ 3
Note que embora o volume contendo o campo magnético interno vai a zero quando ρ0 → 0, o
c
valor de Whf permanece finito, j que o campo interno se aproxima do infinito com 1/ρ30 .
Deve-se ressaltar que em (6.63) que o operador δ(R) é simplesmente o projetor
δ(R) = |r = 0ihr = 0|.
Observe ainda, que o elemento de matriz dado por (6.62), só será diferente de zero se l = l0 = 0.
Esta é a condição necessária para que ϕ∗k,l,m (r = 0) e ϕk0 ,l0 ,m0 (r = 0) sejam diferentes de zero na
origem. Portanto, o termo de contato de Fermi só dará contribuições não nulas para os estados
do tipo s.
6.6 O hamiltoniano completo da estrutura hiperfina

O operador que fornece o hamiltoniano da interação hiperfina, é obtido somando-se os
L dip c
operadores Whf , Whf e Whf , assim
L dip c
Whf = Whf + Whf + Whf . (6.64)
Usando o fato de que o momento magnético do próton é dado por (6.61), então podemos escrever
a equação (6.64) como

µ0 2µB µn gp I · L (S · R) (I · R) I · S 8π
Whf =− · +3 − 3 + · I · Sδ(R) , (6.65)
4π ~2 R³ R5 R 3
na qual

q~ q~ I S R
µB = ; µn = − ; MI = gp µn ; MS = 2µB ; n̂ = r̂ = . (6.66)
2me 2Mp ~ ~ R
o que leva a expressão (6.65), a tomar a seguinte forma

µ0 q (L · MI ) 3(MS · n̂)(MI · n̂) − MS · MI 8π
Whf = − · + + · MI · Ms δ(R) . (6.67)
4π me R 3 R3 3
6.6.1 Interpretação dos vários termos de Whf

1. O primeiro termo de Whf representa a interação do momento magnético nuclear MI com
o campo magnético
µ0 qL
BLI (r) = , (6.68)
4π me r3
criado na região onde encontra-se o próton, pela rotação da carga eletrônica em torno do
núcleo.

6.6. O hamiltoniano completo da estrutura hiperfina
2. O segundo termo de (6.67), representa a interação dipolo-dipolo entre os momentos

magnéticos nuclear e eletrônico: a interação do momento magnético do spin do elétron
com o campo magnético criado por MI , ou vice-versa.
3. O último termo de (6.67) é o chamado termo de contato de Fermi, e surge devido a

singularidade, em r = 0, do campo criado pelo momento magnético do próton. De fato, o
próton não é uma partícula pontual. O termo de contato descreve a interação do momento
magnético do spin do elétron com o campo magnético existente no interior do próton. A
função “delta” expressa o fato de que o termo de contato existe, e como o seu nome indica,
somente quando há uma superposição das funções de onda do elétron e do próton.
6.6.2 Ordem de magnitude de Whf

A expressão (6.65) pode ser reescrita da seguinte forma
(2I · n̂) (S · n̂) (2I) · S 8π R3

µ0 µB µn gp (2I) · L
Whf =− · +3 − + · (2I · S) δ(R) ,
4π R³ ~2 ~2 ~2 3 ~2
Considerando que gp /4 ≈ 1, pode-se mostrar que a ordem de magnitude dos dois primeiros
termos é dada por
q 2 ~2 1 µ0 1 q 2 µ0 0 ~2
· · = · · · ,
me Mp R3 4π Mp 4π0 me a30
mas como Mp = 1836me e e2 = q 2 /4π0 , segue
q 2 ~2 1 µ0 1 e2 2 ~2
· 3· = · · · ·2
me Mp R 4π 1836 2a0 me c2 2me a20
1 2
= · Ry · · Ry · 2
1836 me c2
2 · Ry 2Ry
= · ,
1836 me c2
mas como
e2 ~2 1 2Ry
Ry = = 2
= m e c2 α 2 =⇒ α2 = ,
2a0 2me a0 2 m e c2
portanto, tem-se que
Whf 2α2
≈ .
Ry 1836
Mas como
e2 ~2 Whf 1
Wso ≈ · =⇒ ≈ .
m2e c2 R3 Wso 1836
Portanto, vê-se que os termos de Whf são da ordem de 2000 vezes menores do que os termos de
Wso .

6.7. A estrutura fina do nível n = 2
6.7 A estrutura fina do nível n = 2

6.7.1 Formulação do problema
6.7.1.1 Degenerescência do nível n = 2
Como a energia do átomo de hidrogênio, depende somente do número quântico n, através da

relação
Ry 1 1
En = − 2
= − µc2 2 .
n 2 n
Segue que para o nível n = 2, tem-se
Nível n l ml ms Número de estados gn

2s 2 0 0 ±1/2 1 2
2p 2 1 -1,0,1 ±1/2 3 6
Ao considerar o spin do próton, a degenerescência dos estados mudam e tabela anterior toma
a forma,
Nível n l ml ms mI Número de estados gn

2s 2 0 0 ±1/2 ±1/2 1 4
2p 2 1 -1,0,1 ±1/2 ±1/2 3 12
e portanto, uma possível base ortonormal para tratar problemas referentes ao nível n = 2 é:
1. Subcamada 2s:

n = 2; l = 0; ml = 0; ms = ± 1 ; mI = ± 1

=⇒ Dimensão: 4
2 2
2. Subcamada 2p :

n = 2; l = 1; ml = −1, 0, 1; ms = ± 1 ; mI = ± 1

=⇒ Dimensão: 12
2 2
Portanto, o nível n = 2, possui uma degenerescência total de 16.

Logo, para calcular o efeito de uma perturbação W , sobre o nível n = 2, será necessário
diagonalizar uma matriz de 16 × 16. Para o caso específico do nível 2s, deverá se levada em
conta as restrições imposta ao nível, na matriz perturbativa W. Os autovalores dessa matriz
fornecem as correções em primeira ordem da energia e os correspondentes autoestados, são os
autoestados do hamiltoniano de ordem zero.
6.7.2 O hamiltoniano perturbativo

No tratamento dado a seguir, será considerado que não há nenhum campo externo atuando
sobre o átomo em questão. A diferença W , entre o hamiltoniano exato H e o hamiltoniano H0 ,
contém os termos da estrutura fina
Wf = Wmv + Wso + WD ,

6.8. Representação matricial da estrutura fina Wf no nível n = 2
e os termos da estrutura hiperfina
L dip c
Whf = Whf + Whf + Whf ,
assim
W = Wf + Whf .
Porém como os termos que compõem Wf são da ordem de 2000 vezes maiores do que aqueles
que compõem Whf , então inicialmente serão descritos os efeitos das interações finas dadas por
Wf .
6.8 Representação matricial da estrutura fina Wf no nível

n=2
As propriedades do hamiltoniano Wf , vistas até o momento, permite que se mostre que a
matriz Wf , a qual representa o hamiltoniano Wf no nível n = 2, possui dimensão 16×16, e que a
mesma pode ser separada em uma série de blocos de submatrizes quadradas de dimensões menores.
Como a matriz Wf é constituída por diversas submatrizes, isso simplifica consideravelmente a
tarefa de determinar seus autovalores e autovetores.
6.8.1 O Wf não atua nas variáveis de spin do próton

Como no hamiltoniano Wf não há nenhum termo o qual dependa do spin I do próton, segue
imediatamente que o spin do próton pode ser ignorado, ao se investigar os efeitos da estrutura
fina, porém deve-se lembrar de multiplicar por 2, todos os graus de degenerescência obtidos.
Portanto, a dimensão da matriz a ser diagonalizada vai de 16 × 16 para 8 × 8.
6.8.2 O Wf não conecta as subcamadas 2s com as 2p

Inicialmente será necessário mostrar que L2 comuta com Wf , ou seja, que [L2 , Wf ] = 0.
Entretanto, note que para tal é necessário mostrar que:
1. o operador L2 comuta com as componentes de L, ou seja, que
[L2 , Lx ] = [L2 , Ly ] = [L2 , Lz ] = 0,
o qual já é bem conhecido e foi mostrado anteriormente.
2. o operador L2 comuta com o operador posição R, o que é imediado pois o operador L2

atua somente sobre as variáveis angulares, e além disso, foi mostrado que
[L, f (R)] = 0 =⇒ [L2 , R] = 0.

3. que o operador L2 comuta com os operadores de spin
[L2 , S] = [L2 , I] = 0,
o que é óbvio da definição dos spins.
4. que o operador L2 comuta com o operador P2 , ou seja
[L2 , P2 ] = 0.
Para tal note que
[L2 , P2 ] = [L2i , P2 ] =
= Li [Li , P2 ] + [Li , P2 ]Li
portanto, para tal, basta mostrar que [Li , P2 ] = 0. Assim, como L = R × P, então
Lα = Rβ Pγ εαβγ = Rβ Pγ − Rγ Pβ , logo
[Lα , P2 ] = [Rβ Pγ − Rγ Pβ , Pα Pα ] = [Rβ , Pβ Pβ ]Pγ − [Rγ , Pγ Pγ ]Pβ

= 2[Rβ , Pβ ]Pβ Pγ − 2[Rγ , Pγ ]Pγ Pβ = 0.
Portanto agora viu-se que [L2 , Wf ] = 0, e como
Wf = Wmv + Wso + WD
e
P4 1 1 dV (R) ~2
Wmv = − ; c= · L · S; WD (R) = ∇2 V (R),
8m3e c² 2
2me c² R dR 8m2e c2 r
então pode-se concluir que
[L2 , Wmv ] = [L2 , Wso ] = [L2 , WD ] = 0.
Os estados 2s e 2p são autoestados de L2 com diferentes autovalores (0 e 2~2 ). Portanto, o

hamiltonianoWf o qual comuta com L2 , não possui elementos de matriz que conecta o estados
2s com estados 2p. Dessa forma, a matriz 8 × 8 que representa o hamiltoniano Wf no nível
n = 2 pode ser dividida em uma submatriz 2 × 2 relativa aos elementos de matriz dos estados 2s
e em uma submatriz 6 × 6 relativa aos elementos de matriz dos estados 2p. Portanto, a matriz
Wf toma a seguinte forma
 




2×2 0 



2s
 
 
 
(Wf )n=2 = (6.69)
 

 
 




0 6×6




 
2p

As propriedades precedentes podem ser consideradas como sendo consequências do fato de

que o hamiltoniano Wf é par. Sobre uma reflexão, R vai em −R, trocar P em −P, L em L e S
em S. Logo, é fácil ver que Wf permanece invariante. Entretanto, Wf não tem elementos de
matriz entre os estados 2s e 2p, os quais possuem paridade opostas.
6.8.3 Representação matricial de Wf na subcamada 2s

A dimensão 2 do subespaço 2s é resultante dos dois possíveis valores de ms = ±1/2 de Sz ,
ao ignorar o próton.
Como Wmv e WD não dependem de S, as matrizes que representam esses dois operadores no
subespaço 2s, são portanto múltiplas da matiz unidade (ou seja, são diagonais), com coeficientes
de proporcionalidades iguais, respectivamente, aos elementos de matriz puramente orbital:
P4

n = 2; l = 0; ml = 0 − 3 2 n = 2; l = 0; ml = 0

8me c
e
~2

n = 2; l = 0; ml = 0 − 2 2 ∇V (R) n = 2; l = 0; ml = 0 .

8m c e
Como conhecemos as autofunções de H0 , o cálculo desses elementos de matriz, não represen-
tam uma dificuldade, logo os seus resultados são
13 13 2
hWmv i2s = − me c2 α4 hWmv i2s = − α Ry
128 64
1 1
hWD i2s = me c2 α4 hWD i2s = α2 Ry
16 8
Finalmente, o cálculo do elemento de matriz de Wso envolve elementos de matrizes “angulares”
da forma
hl = 0; ml = 0 | Lx,y,z | l = 0; ml = 0i ,
os quais são zero porque o valor l = 0 do número quântico l, anula todos. Portanto,
hWso i2s = 0.
Portanto,
5 5
hWf i2s = hWmv i2s + hWD i2s + hWso i2s = − me c2 α4 = − α2 Ry
128 64
6.8.4 Representação matricial de Wf na subcamada 2p

6.8.4.1 Termos Wmv e WD
Devido aos mesmos argumentos da seção anterior, tem-se que

7 7 2
hWmv i2p = − me c2 α4 = − α Ry e hWD i2p = 0.
384 192
Note que hWD i2p = 0, reflete o fato de que WD é proporcional a função δ(R) e pode ter um
valor não nulo somente na origem, ou seja, para estado tipo s, entretanto, para aqueles com
l ≥ 1, a função de onda é zero na origem.

6.8.4.2 Termo Wso
Para obter esse, deve-se calcular diversos elementos de matriz da seguinte forma
D E
0 0
n = 2; l = 1; s = 1/2; ml ; ms ξ(R)L · S n = 2; l = 1; s = 1/2; ml ; ms ,

com
e2 1
ξ(R) = 2 2
· 3
2me c R
Na representação {|ri} pode-se separar a parte radial do elemento de matriz, da parte angular
e de spin, o que resulta em
D E
0 0
ξ2p n = 2; l = 1; s = 1/2; ml ; ms L · S n = 2; l = 1; s = 1/2; ml ; ms ,

na qual ξ2p é um número, dado pela integral radial

ˆ ∞
e2 1
ξ2p = |R21 (r)|2 r2 dr.
2m2e c2 0 r 3
Como a função radial R21 (r) é conhecida, então após o cálculo da integral obtemos

1 1 2 4 1 1 2
ξ2p = 2 me c α = 2 α Ry .
~ 48 ~ 24
Com isso, eliminou-se a dependência das variáveis radiais, sobrando uma dependência das
variáveis angulares e de spin. Portanto, o problema reduz-se a diagonalizar o operador L · S.
Para representar o operador ξ2p L · S por uma matriz, várias bases diferentes podem ser
escolhidas:
i) Primeira escolha, base: {|l = 1; s = 1/2; ml ; ms i}, construída a partir dos autoestados comuns
dos operadores L2 , S2 , Lz e Sz .
ii) Segunda escolha, base: {|l = 1; s = 1/2; J; mJ i}, construída a partir dos autoestados comuns
dos operadores L2 , S2 , J2 e Jz na qual
J=L+S
é o momentum angular total do sistema. Como l = 1 e s = 1/2, então Jmax = 1+1/2 = 3/2
e Jmin = 1 − 1/2 = 1/2.
Note que a segunda base é melhor adaptada ao problema do que a primeira, o que nos interessa,
já que o termo ξ2p L · S é diagonal na segunda base. Para evidenciar isso, observe que
1 2
J2 = (L + S)2 = L2 + S2 + 2L · S J − L2 − S2 ,

=⇒ L·S=
2
assim
1
ξ2p L · S = ξ2p J2 − L2 − S2 .

2
6.9. Resultados: A estrutura fina do nível n = 2.
Como cada vetor de estado da segunda base também é um autoestado de L2 , S2 e J2 , tem-se

que
~2

3
ξ2p L · S |l = 1; s = 1/2; J; mJ i = ξ2p J(J + 1) − 2 − |l = 1; s = 1/2; J; mJ i .
2 4
Como os autovalores do termo ξ2p L · S dependem somente de J e não de mJ , então para
~2 ~2

3 15 3 1 1
J = Jmax = ξ2p −2− = ξ2p = me c2 α4 = α2 Ry
2 2 4 4 2 96 48
2

1 ~ 3 3 1 1
J = Jmin = ξ2p −2− = −~2 ξ2p = − me c2 α4 = − α2 Ry
2 2 4 4 48 24
A degenerescência sêxtupla do nível 2p foi parcialmente removida pelo ermo Wso . Obteve-se
uma degenerescência quadrupla correspondente ao nível J = Jmax = 3/2 e uma degenerescência
dupla correspondente ao nível J = Jmin = 1/2. A degenerescência (2J + 1) associada a cada
estado J, é uma degenerescência essencial relacionada a invariância por rotação de Wf . Note
que
3 3 1 1 3
J= =⇒ mJ = − , − , ,
2 2 2 2 2
1 1 1
J= =⇒ mJ = − , .
2 2 2
Comentários
i) No subespaço 2s (l = 0, s = 1/2). J pode tomar somente um valor, o J = 0 + 1/2 = 1/2.
ii) No subespaço 2p (l = 1, s = 1/2). J pode tomar somente um valor, o J = 1 + 1/2 = 3/2.

Nesse subespaço Wmv e WD são representados por múltiplos da matriz identidade. Essa
propriedade permanece válida em qualquer base desde que a matriz unitária seja invariante
a uma mudança de base.
6.9 Resultados: A estrutura fina do nível n = 2.

6.9.1 Notação espectroscópica
Serão usados a seguir os números quânticos: n, l, s, J. O número quântico J deve-se ao fato
do termoWso depender dele.
Para o nível 2s tem-se J = 1/2 e para o nível 2p tem-se que J = 1/2 ou J = 3/2. O nível
associado com o conjunto de valores n, l, J é geralmente denotado pela adição do índice J ao
símbolo (n, l) representando a subcamada na notação espectroscópica: nlJ , com
l 0 1 2 3 4
Símbolo s p d f g
Portanto, para o nível n = 2 do átomo de hidrogênio tem-se o seguintes níveis:
2s1/2 ; 2p1/2 ; 2p3/2 .

6.9. Resultados: A estrutura fina do nível n = 2.
6.9.2 Posição dos níveis 2s1/2 ; 2p1/2 ; 2p3/2

A seguir os resultados anteriores serão reagrupados, para as energias dos níveis 2s1/2 , 2p1/2 e
2p3/2 , com relação a energia não perturbada do nível n = 2 do átomo de hidrogênio, a qual é
dada por
Ry µc2 α2 1
En = − = − =⇒ E 2 = − Ry.
n2 2n2 4
Conforme o resultado anterior, o nível 2s1/2 é diminuído pela seguinte quantidade
5 2 2 4 5
hWf i2s1/2 = hWmv i2s1/2 + hWD i2s1/2 + hWso i2s1/2 = − me c α = − α2 Ry
128 64
Temos que o nível 2p1/2 é diminuído de
hWf i2p1/2 = hWmv i2p1/2 + hWD i2p1/2 + hWso i2p1/2

7 2 1 2
=− α Ry + 0 + − α Ry
192 24
5 2
= − α Ry.
64
Portanto, mostrou-se que os níveis 2s1/2 e 2p1/2 possuem a mesma energia, de acordo com a
correção usada até o momento. Esta degenerescência deve ser considerada com acidental, oposta
a degenerescência essencial (2J + 1) de cada nível J.
Finalmente, para o nível 2p3/2 , a correção é
hWf i2p3/2 = hWmv i2p3/2 + hWD i2p3/2 + hWso i2p3/2

7 2 1 2
=− α Ry + 0 + α Ry
192 48
1
= − α2 Ry.
64
Comentários
i) Somente o acoplamento spin-órbita é o responsável pela separação entre os níveis 2p1/2 e

2p3/2 , já que os termos Wmv e WD deslocam o nível 2p com um todo.
ii) O átomo de hidrogênio agora pode ir do estado 2p para o 1s emitindo um fóton Lyman
∝ (λ = 1216 Å).
4 1
∆E2p3/2 −2s1/2 = E2p3/2 − E2s1/2 = me c2 α4 = α2 Ry
128 16
n=2
∆E0
2p3/2
5∆E0 5∆E0
1 2
∆E0 = 64 α Ry
2s1/2 2p1/2
Nota: o Lamb-shift remove a degenerescência dos níveis 2s1/2 e 2p1/2

6.10. A estrutura hiperfina do nível n = 1
iii) Viu-se que os dois níveis com o mesmo J possuem a mesma energia. Esse resultado não
é meramente verdade somente para as correções de primeira ordem do termo Wf : ele
permanece válido em todas as ordens de correção. A solução exata da equação de Dirac,
fornece para um nível de energia caracterizado pelos números quânticos n, l, s, e J o
seguinte valor
 r !−2 −1/2
1 1
En,j = me c2 1 + α2 n−J + + (J + )2 − α2 
2 2
Essa energia depende somente de J e não de l. Ao expandir a expressão acima para a

energia da equação de Dirac, em potências de α, obtém-se que

1 1 1 1 n 3
En,j = me c − me c2 α2 2 − me c2 4
2
1 − α4 + · · ·
2 n 2 n J+ 2
4
O primeiro termo é a energia de repouso do elétron. O segundo termo é a energia do

átomo de hidrogênio. O terceiro termo fornece as correções Wf em primeira ordem.
iv) As flutuações do vácuo (do campo eletromagnético do vácuo) removem a degenerescência

2s1/2 e 2p1/2 , e este efeito é conhecido por Lamb-shift.
6.10 A estrutura hiperfina do nível n = 1

A seguir serão estudados os efeitos da correção Whf na estrutura de níveis de energia 2s1/2 ,
2p1/2 e 2p3/2 , para determinarmos se a interação do próton com spin I causa o surgimento de
uma estrutura hiperfina em cada um dos níveis de energia. Entretanto, como Wf não remove
a degenerescência do estado fundamental 1s, iniciaremos investigando o efeito da correção
hiperfina sobre esse estado. os resultados obtidos para esse caso especial podem ser facilmente
generalizados para os níveis 2s1/2 , 2p1/2 e 2p3/2 .
6.10.1 Formulação do problema

6.10.1.1 A degenerescência do nível 1s
Para o nível 1s não há degenerescência orbital (l = 0). Entretanto, as componentes Sz e Iz

de S e I ainda podem tomar dois valores a saber: ±1/2, ou seja
1 1
ms = ± e mI = ± .
2 2
Portanto, a degenerescência do nível 1s é 4, e nesse caso, uma possível base é dada vetor de
estado
1
n = 1; l = 0; ml = 0; ms = ± ; mI = ± 1
.
2 2

6.10.1.2 O nível 1s não possui estrutura fina
Mostrou-se que Wf não remove a degenerescência do nível 1s. Pois, os termos Wmv e WD
não atuam nos números quânticos mS e mI e são representados no subespaço 1s por múltiplos
da matriz identidade, dadas por
5
hWmv i1s = − α2 Ry e hWD i1s = α2 Ry.
4
Finalmente o cálculo do elemento de matriz do termo Wso envolve elementos de matriz
angulares do tipo
hl = 0; ml = 0 | Lx,y,z | l = 0; ml = 0i ,
o que é obviamente zero, pois l = 0, portanto
hWso i1s = 0.
Portanto, a correção fina de primeira ordem do nível 1s é
hWf i1s = hWmv i1s + hWD i1s + hWso i1s

5
= − α2 Ry + α2 Ry + 0
4
1
= − α2 Ry.
4
Essa correção não abre a degenerescência do nível 1s. Como l = 0 e s = 1/2, logo J = 1/2.
Portanto, como a correção fina Wf não levanta a degenerescência do nível 1s, a seguir será
investigado os efeitos da correção hiperfina sobre o nível 1s.
6.10.2 Representação matricial de Whf no nível 1s

O hamiltoniano da correção hiperfina é dado por

µ0 q (L · MI ) 3(MS · n̂)(MI · n̂) − MS · MI 8π
Whf = − · + + · MI · Ms δ(R) .
4π me R 3 R3 3
Note que os dois primeiros termos não contribuem para o nível 1s, por argumentos similares
aqueles da correção Wso para o qual hWso i1s = 0.
6.10.2.1 O termo de contato WD
Os elementos de matriz do último termo de Whf , isto é, o termo de contato de Fermi, são da
forma

0 0 2µ 0
n = 1; l = 0; ml = 0; /2; ms ; mI − · MI · Ms δ(R) n = 1; l = 0; ml = 0; ms ; mI .
3
Passando para a representação das coordenadas {|ri}, pode-se separar a parte orbital e de
spin desse elemento de matriz e reescrevê-lo na seguinte forma
D 0 0 E
A ms ; mI I · S ms ; mI ,


no qual A é um número dado por
q2 gp
A= · hn = 1; l = 0; ml = 0 | δ(R) | n = 1; l = 0; ml = 0i
30 c2 me Mp
q2 gp 1
= · · |R10 (0)|2 ,
30 c2 me Mp 4π
mas como
2 ~ λ
R10 (r) = q · e−r/a0 ; com a∗0 = = ,
3 αµc α
(a∗0 )
~ me Mp me a∗ e2 q2 1
a0 = ; µ= ; γ =1+ = 0; α= = ·
αme c me + Mp Mp a0 ~c 4π0 ~c
e2 ~2 1
Ry = = 2
= me c2 α2
2a0 2me a0 2
então, como a∗0 = γa0 , segue que
q2 gp 1 4
A= 2
· · · ∗ 3
30 c me Mp 4π (a0 )
4 q2 1 gp 1
= · · 2
· · 3 3
3 4π0 me c Mp γ a0
4 e2 1 2 gp 1
= · · 3· · ·
3 2a0 γ me c Mp a20 2
4 2 gp 1 1
= ·α · · ·
3 Mp a20 γ 3
4 2 gp m2e c2 α2 1
= ·α · · · 3
3 Mp ~2 γ
−3
4 me 2 4 1 me
= · gp · · me c α · 2 · 1 +
3 Mp ~ Mp
2
−3
4 me α me
= · gp · · 2Ry · 2 · 1 +
3 Mp ~ Mp
As variáveis orbital desaparecem devido a normalização, e portanto, sobra somente o problema

dos dois spin 1/2, S e I acoplados por por uma interação da forma
Whf c = AI · S,
na qual A é uma constante.
6.10.3 Autoestados e autovalores do termo de contato

Para representar o operador Whf c = AI·S, deve-se considerar somente a base {|s = 1/2; I = 1/2; ms ; mI i}
formada pelos autovetores comuns aos operadores S2 , I2 , Sz e Iz . Pode-se introduzir o momentum
angular total F, dado por
F = J + I = L + S + I = 0 + S + I = S + I,

e usar a base
{|s = 1/2; I = 1/2; F ; mF i} ,
formada pelos autovetores comuns aos operadores S2 , I2 , F2 e Fz . Desde que, s = I = 1/2, F

pode tomar apenas dois valores F = 0 e F = 1.
Note que a base {|F ; mF i} é mais adequada do que a {|ms ; mI i} para estudar o operador
Whf c = AI · S, pois na base {|F ; mF i} ele é representado por uma matriz diagonal,
1
Whf c = AI · S = A F2 − I2 − S2 .

2
Segue imediatamente que o estado |F ; mF i é autoestado do operador Whf c = AI · S:
1
AI · S |F ; mF i = A [F (F + 1) − I(I + 1) − S(S + 1)] ,
2
como os autovalores do operador Whf c = AI · S, dependem somente de F e não de mF , eles são
dados então por

1 3 3 3
Para F = 0 A 0− − =− A com (mF = 0)
2 4 4 4

1 3 3 1
Para F = 1 A 2− − =+ A com (mF = −1, 0, 1).
2 4 4 4
Portanto, a degenerescência quadrupla do nível 1s é parcialmente removida pela correção
hiperfina Whf c = AI · S. Obteve-se uma degenerescência tripla para F = 1 e um nível não
degenerado para F = 0. A degenerescência (2F + 1) de F = 1 é essencial e está relacionada a
invariância de Whf sobre uma rotação do sistema total.
6.10.4 Estrutura hiperfina do nível 1s

Sobre o efeito de Wf , a energia do nível 1s, é diminuída por uma quantidade me c2 α4 /8 =
(α2 /4)Ry com relação ao valor −µc2 α2 /2, ou seja,
E1s = E1 + hWf i1s + hWhf i1s


2 2
µc α 1 − 3 A~2 Para F = 0
2 4 4
E1s =− − me c α +
2 8 + 1 A~2 Para F = 1
4
O termo A~2 é muitas vezes chamado de a estrutura hiperfina do estado fundamental.
Comentários
Similarmente a correção Whf abre a degenerescência de cada umas das estruturas finas dos
níveis 2s1/2 , 2p1/2 e 2p3/2 em uma série de níveis hiperfinos, correspondendo a todos os valores
de F separados por uma unidade incluída entre Fmax = J + I e Fmin = |J − I|. Para os níveis
2s1/2 e 2p1/2 tem-se que J = 1/2, portanto F terá os somente dois valores, F = 1 e F = 0.
Entretanto para o nível 2p3/2 , J = 3/2 e consequentemente F = 2 e F = 1.

1s
E1
− 18 mec2α4 F =1
+ 14 A~2
1s1/2
A~2 − 3 A~2
4
F =0
Figura 6.7: Representação levantamento da degenerescência do nível 1s pelas correções finas e
hiperfinas. A figura não está em escala.
F =2
∆E = 23, 7 MHz
2p3/2 F =1
∆E2p3/2 −2p1/2 = 10.969, 1 MHz
F =1
2s1/2 ∆E = 177, 56 MHz
F =0
∆E = 1057, 8 MHz
F =1
2p1/2 ∆E = 59, 19 MHz
F =0
Figura 6.8: Representação levantamento da degenerescência do nível 2s pelas correções finas e
hiperfinas. A figura não está em escala.

6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s
6.10.5 A importância da estrutura hiperfina do nível 1s

A estrutura hiperfina do átomo de hidrogênio é conhecida experimentalmente com alta
precisão. Ela uma grandeza física conhecida com um número elevado de algarismos significativos,
ou seja,
A~2
= 1.420.405.751, 768 ± 0, 001 Hz
2π
Tal elevado grau de precisão experimental tornou-se possível com o desenvolvimento do
“maser de hidrogênio” em 1963. O princípio de tal dispositivo é, esquematicamente, o seguinte:
átomos de hidrogênio, são previamente selecionados (por uma seleção magnética do tipo Stern-
Gerlach) escolhendo-se aqueles cujo nível de energia seja superior ao nível hiperfino com F = 1,
são armazenados em uma célula de vidro. Este constitui um meio de amplificação para a
frequência hiperfina
E(F = 1) − E(F = 0)
ν= .
h
Se a célula é colocada em uma cavidade sintonizada na frequência hiperfina, e se as perdas da
cavidade são o suficientemente pequenas para o ganho ser maior do que as perdas, o sistema
torna-se instável e pode oscilar: obtém-se um “oscilador atômico” (um maser ). A frequência do
oscilador é muito estável e de grande pureza espectral. A sua medição resulta diretamente no
valor da abertura hiperfina, expressa em Hz.
Note-se, finalmente, que os átomos de hidrogênio no espaço interestelar são detectados em
radioastronomia pela radiação que emitem espontaneamente quando eles caem do nível hiperfino
F = 1 para o nível hiperfino F = 0 do estado fundamental (esta transição corresponde a um
comprimento de onda de 21 cm). A maioria das informações que possuímos sobre nuvens
interestelares de hidrogênio é fornecido pelo estudo dessa linha 21 cm.
6.11 Efeito Zeeman da estrutura hiperfina do estado fun-

damental 1s
Considere um átomo na presença de um campo magnético estático B = B0 êz , o qual interage
com os vários momentos magnéticos presentes no átomo: o momento magnético orbital ML , de
spin do elétron MS e o nuclear MI , dados por
qL qge S qS qgp I
ML = ; MS = ' ; MI = − .
2me 2me me 2Mp
O hamiltoniano Zeeman WZ o qual descreve a interação do átomo com o campo magnético é
Wz = −B · (ML + MS + MI ) = ω0 (Lz + 2Sz ) + ωn Iz ,
no qual, as frequências ω0 e ωn são definidas por

q qgp
ω0 = − B0 e ωn = − B0 .
2me 2Mp
Entretanto, como Mp me isso significa que: |ω0 | |ωn |.

Comentários
Rigorosamente, Wz contém um outro termo, o qual é quadrático em B0 , o termo diamagnético.

Esse termo não atua nas variáveis eletrônicas e de spin, ele simplesmente desloca o nível 1s
como um todo. Além disso, ele é muito menor do que Wz .
6.11.1 A perturbação vista pelo nível 1s

A seguir será estudado o efeito de Wz no estado fundamental 1s do átomo de hidrogênio (no
caso do nível n = 2 é um pouco mais complicado, pois mesmo em um campo magnético zero,
este nível possui tanto uma estrutura fina quanto uma hiperfina, enquanto que o nível n = 1
tem apenas uma estrutura hiperfina: o princípio de cálculo é, no entanto o mesmo). Mesmo
com os campos magnéticos mais fortes que podem ser produzidos em laboratório, Wz é muito
menor do que a distância entre o nível 1s e os outros níveis: consequentemente, o seu efeito
pode ser tratada pela teoria de perturbação.
O efeito de um campo magnético sobre um nível de energia atômica é chamado de “efeito
Zeeman”. Quando B0 é representado no eixo x e as energias dos diferentes subníveis que ele cria
estão representados graficamente no eixo y, um diagrama de Zeeman é obtido.
Se B0 for o suficientemente forte, o hamiltoniano Zeeman Wz pode ser da mesma ordem de
grandeza que o hamiltoniano hiperfino Whf , ou mesmo maior. Por outro lado, se B0 for muito
fraco, Wz Whf . Portanto, em geral, não é possível estabelecer a importância relativa de Wz e
Whf . Para obter as energias dos vários subníveis, (Wz + Whf ) devem ser diagonalizadas dentro
do nível n = 1.
Foi mostrado anteriormente que a restrição da correção hiperfina Whf para o nível n = 1,
deve se colocada na forma Whf = AI · S. Usando a expressão obtida para Wz , vê-se que nesse
caso será necessário calcular o seguinte elemento de matriz
D E
0 0
n = 1; l = 0; ml = 0; /2; ms ; mI ω0 (Lz + 2Sz ) + ωn Iz n = 1; l = 0; ml = 0; ms ; mI .

A contribuição de ω0 Lz é nula já que l = ml = 0. Como o termo 2ω0 Sz + ωn Iz atua somente

nas variáveis de spin, segue que
hn = 1; l = 0; ml = 0 | n = 1; l = 0; ml = 0i = 1,
devido a normalização. Portanto, pode-se ignorar os números quânticos n, l e ml e diagonalizar

o operador
Whf −p = AI · S + 2ω0 Sz + ωn Iz , (6.70)
o qual atua somente sobre o grau de liberdade do spin. Para diagonalizar esse operador, pode-se
usar tanto a base {|ms ; mI i} quanto a base {|F ; mF i}.
Como Iz e Sz são da mesma ordem e ω0 ωn , então em uma primeira aproximação o termo
ωn Iz pode ser desprezado com relação ao termo 2ω0 Sz . Assim a perturbação sentida pelo nível
1s é
Whf −p = AI · S + 2ω0 Sz . (6.71)

6.11.2 Diferentes domínios de intensidade do campo magnético

Ao variar-se continuamente o campo magnético B0 , modifica-se a magnitude do termo 2ω0 Sz ,
o que significa que o sistema está em um dos seguintes regimes:
1. Campos fracos:~ω0 A~²
2. Campos fortes: ~ω0 A~²
3. Campos intermediários: ~ω0 ' A~²
Posteriormente será mostrado que é possível diagonalizar exatamente o operador Wp , entre-

tanto, inicialmente será aplicado um tratamento perturbativo ao problema, como um exemplo
particularmente simples da teoria de perturbação. No caso de (1), vamos tratar o termo 2ω0 Sz
como uma perturbação com relação ao termo AI · S. Por outro lado, no caso (2), vamos tratar
o termo AI · S como uma perturbação com relação ao termo 2ω0 Sz . A diagonalização exata
do conjunto dos dois operadores, é indispensável no caso (3), permitindo uma verificação dos
resultados anteriores.
6.11.3 Efeito Zeeman no regime de campos fracos

Os autovalores e autoestados do termo AI · S, já foram determinados na seção anterior.
Viu-se que para esse caso, na base {|F ; mF i}, tem-se que:
1. Um nível com uma degenerescência tripla: {|F = 1; mF = −1, 0, 1i}. Nesse caso, tem-se
que
1
AI · S |F = 1; mF = −1, 0, 1i = A~2 |F = 1; mF = −1, 0, 1i
4
2. Um nível não degenerado: {|F = 0; mF = 0i}. Nesse caso, tem-se que
3
AI · S |F = 0; mF = 0i = − A~2 |F = 0; mF = 0i .
4
Como o termo 2ω0 Sz será tratado como uma perturbação em relação ao termo AI · S, deve-se
diagonalizar separadamente as duas matrizes representando o termo 2ω0 Sz nos dois níveis, a
saber F = 1 e F = 0, correspondentes aos dois autovalores distintos do termo AI · S.
6.11.4 Representação matricial de Sz na base {|F ; mF i}

Como F = S + I, com ms = ±1/2 e mI = ±1/2, e para um estado tripleto viu-se que
|F = 1; mF = 1i = |ms = 1/2; mI = 1/2i

1
|F = 1; mF = 0i = √ (|ms = 1/2; mI = −1/2i + |ms = −1/2; mI = 1/2i)
2
|F = 1; mF = −1i = |ms = −1/2; mI = −1/2i
1
|F = 0; mF = 0i = √ (|ms = 1/2; mI = −1/2i − |ms = −1/2; mI = 1/2i)
2

Portanto, tem-se que

~
Sz |F = 1; mF = 1i = |F = 1; mF = 1i
2
~
Sz |F = 1; mF = 0i = |F = 0; mF = 0i
2
~
Sz |F = 1; mF = −1i = − |F = 1; mF = −1i
2
~
Sz |F = 0; mF = 0i = |F = 1; mF = 0i
2
Segue então que a representação matricial de Sz na base {|F ; mF i} com os vetores de estado na
ordem |1, 1i, |1, 0i, |1, −1i e |0, 0i é
|1, 1i |1, 0i |1, −1i |0, 0i

 
1 0 0 0 |1, 1i
~
(Sz ) =
 
 0 0 0 1  |1, 0i (6.72)
2 
 0

 |1, −1i
 0 -1 0 
0 1 0 0 |0, 0i
Comentário
Note que Fz = Sz + Iz e que Fz |F ; mF i = ~mF |F ; mF i logo sua representação matricial na

base {|F ; mF i} é
|1, 1i |1, 0i |1, −1i |0, 0i

 
1 0 0 0 |1, 1i
~
(Fz ) =
 
 0 0 0 0  |1, 0i (6.73)
2 
 0

 |1, −1i
 0 -1 0 
0 0 0 0 |0, 0i
Note que Fz não é proporcional a Sz , já que Fz é diagonal e Sz não.
Entretanto se nos restringirmos somente ao subespaço F = 1, as duas matrizes são proporci-
onais. Do teorema de Wigner-Eckart, se P1 é o projetor em F = 1, temos
1
P1 Sz P1 = P1 Fz P1
2
É relativamente simples mostrar que existe essa mesma relação para Sx e Fx e Sy e Fy .
Há um caso especial do teorema de Wigner-Eckart de acordo com o qual, em um dado
subespaço do momentum angular total, todas as matrizes as quais representam um vetor
operador são proporcionais. Está claro neste exemplo, que essa proporcionalidade existe somente
para operadores restritos a um dado auto-subespaço do momentum angular total, e não para o
operador como um todo.
Além disso, o coeficiente de proporcionalidade, o fator 1/2, que aparece, pode ser obtido
imediatamente a partir do teorema da projeção: de acordo com o qual tem-se que
hF · SiF =1 F (F + 1) + S(S + 1) − I(I + 1) 1 1
= = para I=S= .
hF2 iF =1 2F (F + 1) 2 2

pois
F · S = (I + S) · S = S2 + I · S,
mas
1 2
F2 = S2 + I2 + 2I · S F − S2 − I2

=⇒ I·S=
2
logo
1 1 1 1 2
F · S = F2 + S2 − I2 = F + S2 − I2

2 2 2 2
e como
F2 |F ; mF i = F (F + 1)~2 |F ; mF i .
6.11.5 Campo fraco: Autoestados e autovalores

Portanto, para o nível F = 1, a matriz que representa 2ω0 Sz é
 
1 0 0
(2ω0 Sz ) = ~ω0 0 0 0 
 
0 0 −1
Já para o nível F = 0, a matriz reduz-se a zero. Assim
Autoestado Autovalor
1
|F = 1; mF = 1i ←→ 4
A~2 + ~ω0
1
|F = 1; mF = 0i ←→ 4
A~2 +0 (6.74)
1
|F = 1; mF = −1i ←→ 4
A~2 − ~ω0
|F = 0; mF = 0i ←→ − 34 A~2 + 0
Na figura 6.9, no eixo x temos ~ω0 e no eixo y as energias dos quatro subníveis Zeeman
(Zeeman diagrama). Em um campo de zero, temos os dois níveis hiperfinos, F =1 e F = 0.
Quando o campo B0 é ligado, o subnível |F = 0; mF = 0i, o qual não é degenerado, inicia na
horizontal; como para o nível de F = 1, a sua degenerescência tripla é completamente remo-
vida: três subníveis são obtidos equidistantes, variando linearmente com ~ω0 , com inclinações
respectivamente de 1, 0, -1.
O tratamento dado anteriormente é válido enquanto a diferença ~ω0 entre dois subníveis
Zeeman adjacentes do nível F = 1 permanecer menor que a diferença em campo zero, entre os
níveis F = 1 e F = 0, a estrutura hiperfina.

E
mF = 1
F =1 mF = 0
mF = −1
A~2
F =0 mF = 0
~ω0
Figura 6.9: Diagrama Zeeman para campos magnéticos fracos do nível 1s do átomo de hidrogênio.
O nível hiperfino F = 1, se desdobra em 3 níveis equidistantes, cada um dos quais com um número
quântico mF bem definido. O nível F = 0, não se altera.
Comentários
O teorema de Wigner-Eckart, mencionado anteriormente, possibilita mostrar que em um

dado nível F do momentum angular total, o hamiltoniano Zeeman
Hz = ω0 (Lz + 2Sz )
é representado por uma matriz proporcional a Fz . Portanto, podemos escrever, denotando por
PF o projetor para o nível F :
PF [ω0 (Lz + 2Sz )] PF = gF ω0 PF Fz PF ,
na qual gF é o chamado fator de Landé do estado F . No caso tratado anteriormente, temos que
gF =1 = 1.
6.11.6 A frequência de Bohr e as evoluções de hF i e hSi

Em um campo magnético zero, F = I + S é uma constante de movimento. I e S realizam um
movimento de precessão em torno do F resultante, com uma velocidade angular proporcional a
constante de acoplamento A entre I e S. Se além disso, o sistema está na presença de um campo
magnético fraco B = B0 êz paralelo ao eixo z, então em adição ao movimento de precessão
rápido, de frequência ω, de I e S em torno do F surge um movimento de precessão lento de
frequência Ω, de F em torno de torno do campo magnético, na direção z, denominada precessão
de Larmor, cuja a frequência Ω é conhecida como frequência de Larmor. Para campos fracos,
tem-se que ω Ω e nesse caso tem-se que ω ∝ A, a constante da estrutura hiperfina.
Portanto, Fz é uma constante de movimento, enquanto Sz possui uma parte estática, que é
a projeção no eixo z da componente de S paralela a F, e uma outra parte a qual é modulada
pela frequência de precessão hiperfina, a projeção no eixo z da componente de S perpendicular
a F, a qual precessa em torno de F. Portanto, conforme ilustrado na figura 6.10, tem-se

Sz = Sz(Est.) + Sz(Din) (t)
analogamente
Iz = Iz(Est.) + Iz(Din) (t)
e como Fz é constante, isso significa que
Sz(Din) (t) + Iz(Din) (t) = cte.
z
Vamos comparar esses resultados semiclássicos
B
com os da teoria quântica apresentadas anterior-
mente nesta seção. Para fazer isso, temos que
considerar a evolução no tempo dos valores médios
hFz i e hSz i. O valor médio hGi (t) de uma grandeza
Ω física G contém uma série de componentes que os-
cilam nas várias frequências de Bohr (E − E 0 )/h do
I sistema. Além disso, uma determinada frequência
de Bohr aparece em hGi (t) apenas se o elemento
Sz (t) de matriz de G entre os estados correspondentes
ω
para as duas energias for diferente de zero. Note
F que,
d 1 ∂
Sz hGi (t) = h[G, H]i + hGi (t)
S dt i~ ∂t
e
XX
Figura 6.10: Modelo vetorial do movimento |ψ(t)i = Cn,τ (t0 ) e−iEn (t−t0 )/~ |ϕn,τ i ,
dos vetores F, I e S. Os vetores I e S pre- n τ
cessam rapidamente em torno de F sobre o portanto

efeito do acoplamento hiperfino, enquanto F XX
∗
precessa mais lentamente em torno do fraco hGi (t) = Cm,Γ (t0 ) · Cn,τ (t0 )
n,m τ,Γ
campo magnético aplicado.
× hϕm,Γ | G | ϕn,τ i e−i(Em −En )(t−t0 )/~
No problema que nos interessa aqui, os autoestados do hamiltoniano de campo fraco são os
estados |F ; mF i. Agora, considere duas matrizes (6.72) e (6.73) que representam Sz e Fz nesta
base. Desde Fz tem apenas elementos de matriz diagonais, nenhuma frequência Bohr diferente
de zero pode aparecer em hFz i (t): hFz i é, por conseguinte, estático, pois
hFz i (t) = ~ |C1,1 |2 − |C1,−1 |2 .

Por outro lado, Sz tem, não só os elementos de matriz diagonal (com o qual está associada
uma componente estático de hSz i), mas também um elemento não-diagonal entre os estados

|F = 1; mF = 0i e |F = 0; mF = 0i, cuja diferença de energia é A~2 , de acordo com a tabela

(6.74) (ou a figura 6.10). Disso resulta que hSz i tem, além da sua componente estática, uma
componente modulada pela frequência angular A~, ou seja,
~ ~ ∗
|B1,1 |2 − |B1,−1 |2 + B0,0 B1,0 e−iA~(t−t0 ) + B1,0
∗
B0,0 e+iA~(t−t0 ) .

hSz i (t) =
2 2
(Est.) (Din)
= Sz + Sz (t).
Este resultado recorda o obtido utilizando o modelo vetorial do átomo. Um paralelo poderia
ser estabelecido entre a evolução de hFx i, hSx i, hFy i e hSy i e aquele das projeções dos vetores
F e S da figura 6.10 em Ox e Oy. Entretanto, o movimento de hFi e hSi não coincide
perfeitamente com aquele do momentum angular clássico. Em particular, o módulo de hSi não
6 hSi2 .
é necessariamente constante, pois na mecânica quântica tem-se que hS2 i =
Comentários
Uma relação pode ser estabelecida entre a teoria de perturbação e o modelo vetorial do átomo.
A influência de um campo fraco B0 nos níveis F = 1 e F = 0 pode ser obtido através da retenção
no hamiltoniano Zeeman Hz = 2ω0 Sz apenas dos elementos de matriz dos níveis F = 1 e F = 0
, “esquecendo” o elemento matriz de Sz entre |F = 1; mF = 0i e |F = 0; mF = 0i. Procedendo
deste modo, também “esquecemos” a componente modulada de hSz i, que é proporcional a este
elemento da matriz. Nós, portanto, manter apenas a componente de hSi paralela ao hFi.
Agora, isso é precisamente o que fazemos no modelo vetorial do átomo quando queremos
avaliar a energia de interação com o campo B0 . Em um campo fraco, F precessiona muito mais
lentamente em torno deB do que S o faz em torno de F. A interação de B com a componente
de S perpendicular a F, portanto, em média, não tem nenhum efeito; somente a projeção de S
para F é que conta. É assim, por exemplo, que é calculado o fator de Landé.
6.11.7 Efeito do campo magnético forte

Para estudar os efeitos de um campo magnético forte, o termo Zeeman Hz = 2ω0 Sz deverá
ser diagonalizado na base {|F ; mF i} , pois o mesmo é diagonal na base {|mS ; mI i}, pois
Hz |mS ; mI i = 2ω0 Sz |mS ; mI i = 2~ω0 ms |mS ; mI i ,
mas como ms = ±1/2, segue que
Hz |mS ; mI i = ±~ω0 |mS ; mI i .
Logo como mI = ±1/2, então cada um dos autoestados de Hz é duplamente degenerado.

Assim, 
2ω S |+; ±i = +~ω |+; ±i
0 z 0
2ω S |−; ±i = −~ω |−; ±i
0 z 0

6.11.7.1 Efeitos do termo hiperfino Whf considerado como uma perturbação
As correções em primeira ordem em A podem ser obtidas diagonalizando as restrições do

operador AI · S ao subespaços {|+, ±i} e{|−; ±i} correspondendo aos dois autovalores diferentes
de Hz = 2ω0 Sz .
Note que, em cada um desses subespaços, os dois vetores bases |+, +i e |+, −i ou |−, +i e
|−, −i também são autovetores de Fz , mas não correspondem ao mesmo valor de mF = mS + mI .
Desde que o operador Whf = AI · S = 21 A (F2 − S2 − I2 ) comuta com Fz , ou seja,

1 2 2 2

[Fz , Whf ] = Fz , A F − S − I = 0,
2
ele não possui elementos de matriz entre os estados |+, +i e |+, −i ou entre os estados |−, +i e
|−, −i, ou seja,

1 2 2

2
1 2 2

2
+, + A F − S − I +, − = −, − A F − S − I −, + = 0.

2 2
As duas matrizes representando o operador AI · S nos dois subespaços {|+, ±i} e{|−; ±i}, são
então diagonais, e os seus autovalores são então os elementos diagonais de
hWhf i = hmS ; mI | AI · S | mS ; mI i ,
as quais também podem ser reescritas usando a relação
I · S = Ix Sx + Iy Sy + Iz Sz .
Entretanto a a relação anterior pode ser reescrita em uma forma mais simples, e para tal
lembre-se que
1 1
Sx = (S+ + S− ) e Sy = (S+ − S− ) ,
2 2i
logo
1 1
Ix Sx + Iy Sy = (S+ + S− ) (I+ + I− ) − (S+ − S− ) (I+ − I− )
4 4
1
= (I+ S− + I− S+ ) ,
2
assim,
1
I·S=
(I+ S− + I− S+ ) + Iz Sz . (6.75)
2
Portanto o hamiltoniano da interação hiperfina toma a seguinte forma,

1
Whf = AI · S = A Iz Sz + (I+ S− + I− S+ ) . (6.76)
2
Desta relação, é imediato ver que os únicos elementos de matriz não nulos são os diagonais, ou
seja,
hmS ; mI | AI · S | mS ; mI i = A hmS ; mI | Iz Sz | mS ; mI i
= A~2 mS mI .

E
|εS , εI i |+, +i
|+, −i
F =1
A~2
|−, −i
F =0
|−, +i
~ω0
Figura 6.11: Diagrama Zeeman para o regime de campo forte, do estado fundamental, o nível 1s, do
átomo de hidrogênio. Para cada orientação do spin eletrônico (εS = + ou εS = − ), obtém duas linha
retas paralelas, separadas por uma energia A~2 /2, cada uma correspondendo as diferentes orientações
do spin do próton(εI = + ou εI = − ).
Para H = Hz + Whf , ao tratarmo o termo Whf como uma perturbação de Hz , a energia do

sistema corrigida em primeira ordem de perturbação será dada por
Autoestado Autovalor corrigido

|+, +i ←→ ~ω0 + 41 A~2
|+, −i ←→ ~ω0 − 14 A~2 (6.77)
|−, +i ←→ −~ω0 − 41 A~2
|−, −i ←→ −~ω0 + 14 A~2 + 0
Na figura 6.11, as curvas de linha sólida no lado direito (para ~ω0 A~2 ) representam os
níveis de energia em regime de campo forte: obtemos duas linhas retas paralelas de inclinação
+1, separados por uma energia A~2 /2, e duas linhas retas paralelas de inclinação −1, também
separadas por A~2 /2. O tratamento de perturbativo apresentadas nesta seção e, por conseguinte,
na anterior fornecem os comportamentos assintóticos para o campo forte e fraco, a tangente na
origem dos níveis de energia.
O forte campo desdobra os dois estados |+, +i e |+, −i ou |−, +i e |−, −i em A~2 /2, pode
ser interpretado do seguinte modo. Vimos que apenas o termo Iz Sz da expressão (6.76) para
I · S está envolvido em um regime de campo forte, quando o acoplamento hiperfino é tratado
como uma perturbação do termo Zeeman. O hamiltoniano de campo forte total (6.71), portanto,
pode ser escrito:
1
Whf = 2ω0 Sz + AIz Sz = 2 ω0 + AIz Sz
2
É como se o spin eletrônico “visse” além do campo externo B = B0 êz um pequeno campo

interno menor, resultante do acoplamento hiperfino entre I e S e que tem dois valores possíveis,
dependendo se o spin nuclear está para cima ou baixa. Este campo adiciona ou subtrai de
B = B0 êz e é responsável pela diferença de energia entre os estados |+, +i e |+, −i ou entre
|−, +i e |−, −i.
6.11.8 A frequência de Bohr envolvida na evolução de Sz

Em um campo forte, o acoplamento de Zeeman
z de S com B é mais importante do que o acopla-
mento hiperfino de S com I. Se começarmos por
B
negligenciar este acoplamento hiperfino, o modelo
vetorial do átomo prevê que S irá precessionar
(muito rapidamente desde que |B| é grande) sobre
a direção Oz de B (I permanece imóvel, uma vez
Ω que foi considerado que ωn , era negligenciável).
Expressão (6.75) para o acoplamento hiperfino
permanece válida para vetores clássicos. Por causa
da precessão muito rápida de S, os termos S+ e S−
oscilam muito rapidamente, e em média sem efeito,
S
de modo que apenas o termo Iz Sz conta. O efeito do
acoplamento hiperfino é, portanto, o de adicionar
um campo pequeno paralelo à Oz e proporcional à
Iz , o que acelera ou retarda a precessão de S sobre
Oz, dependendo do sinal de Iz . O modelo vetorial
I
do átomo prevê assim que Sz será estático em um
campo forte.
Figura 6.12: O movimento do spin S no mo- Vamos mostrar que a teoria quântica fornece
delo vetorial do átomo no regime de campo um resultado análogo para o valor médio hSz i do
forte. O spin S precessiona rapidamente em observável Sz . Em um campo forte, os estados de
torno do campo B. Aqui é negligenciado am- energia bem definidas são, como vimos, os estados
bos os acoplamentos do spin nuclear I com o |m , m i. Agora, nesta base, o operador S tem so-
S I z
campo B e o acoplamento hiperfino entre I e
mente elementos de matriz diagonais. Frequências
S, de modo que I permanece estático.
de Bohr diferente de zero, portanto, podem surgir
em hSz i que, consequentemente, é uma quantidade estática ao contrário de sua contrapartida o
campo fraco.
Efeito Zeeman para campos intermediários

Os estados |F, mF i são autoestados de Whf = AI · S, então nessa base o operador Whf é
diagonal. Note que,
H = Hz + Whf = 2ω0 Sz + AI · S,

6.12. Efeito Stark
e nesse caso
1
Whf = A F2 − S2 − I2 .

2
Temos que para F = 0, mF = 0 e para F = 1, mF = −1, 0, 1, logo a base {|F, mF i} =
{|0, 0i , |1, −1i , |1, 0i , |1, 1i}. Nessa base, como
1 ~2
A F2 − S2 − I2 |F, mF i = A [F (F + 1) − s(s + 1) − I(I + 1)] ,

2 2
então o elemento diagonal do termo Whf para F = 0 é −3A~2 /4 e para F = 1 é A~2 /4
Mostrou-se que nessa base a matriz que representa o operador Sz é dada por (6.72), portanto
nessa base, a matriz hamiltoniana do sistema é dada por
|1, 1i |1, −1i |1, 0i |0, 0i

 
1
~ω0 + 4
A~2 0 0 0 |1, 1i
( H) =  ~ω0 − 41 A~2
 
0 0 0  |1, −1i (6.78)
 
1

 0 0 4
A~2 ~ω0  |1, 0i

0 0 ~ω0 − 34 A~2 |0, 0i
A matriz H pode ser separada em dois blocos 2 × 2. O primeiro bloco já é diagonal e seus
autovalores são
1
E1 = ~ω0 + A~2 =⇒ |1, 1i ⇐⇒ |+, +i
4
1
E2 = ~ω0 − A~2 =⇒ |1, −1i ⇐⇒ |−, −i
4
Já a matriz que compõem o segundo bloco é dada por
!
1
A~2 ~ω0
(H)b2 = 4
~ω0 − 34 A~2
e ao diagonalizarmos ela obtemos a seguinte equação

1 2 3 2
A~ − E · − A~ − E − (~ω0 )2 = 0,
4 4
cujas raízes são respectivamente
s 2
1 1 2
E3 = − A~2 + A~ + ~2 ω02
4 2
s 2
1 1 2
E4 = − A~2 − A~ + ~2 ω02
4 2
6.12 Efeito Stark

Considere sobre o átomo de hidrogênio atue o campo elétrico E = E êz , logo novo termo do
hamiltoniano do sistema é
WS = −qE · R = −qEz.

6.12. Efeito Stark
mF
E1
E
+1 E3
0
1
4
A~2 ~ω0
(F = 1)
−1
− 34 A~2
(F = 0)
E2
0
E4
Figura 6.13: Diagrama Zeeman para um campo arbitrário do nível 1s do átomo de hidrogênio. Nesse
caso, o número quântico mF é um bom número quântico para qualquer valor do campo aplicado. As
duas linhas retas (cheias) de inclinação, correspondem aos valores de mF = ±1, assim como as outras
duas curvas correspondem a mF = 0. As linhas tracejada correspondem ao comportamento assintótico,
para campos altos, das duas curvas correspondente aos níveis de energia E3 e E4 .
Esse é o termo que descreve a interação de dipolo elétrico qR do átomo com o campo elétrico
E = E êz . Considerando que H0 WS , então será possível dar um tratamento perturbativo ao
termo WS . Nesse caso como nem o hamiltoniano H0 e nem WS atuam nas variáveis de spin,
então os números quânticos mS e mI serão ignorados.
6.12.1 Efeito Stark no nível 1s

A correção perturbativa para a energia, em primeira ordem é
(1)
E1s = hWS i1s = −qE hn = 1, l = 0, mL = 0 | Z | n = 1, l = 0, mL = 0i = 0,
pois Z é uma função ímpar. Já o próximo termo da correção perturbativa é
(2)
X X X |h1, 0, 0 | Z | n, l, mL i|2 Ry
2 2
E1s =q E , com En = − .
n6=1 l mL
E1 − En n2
Como E1 − En < 0 sempre, e como haverá casos em que Z |n, l, mL i será uma função par, então
(2)
pode-se concluir que E1s < 0.
6.12.2 Polarizabilidade do estado 1s

(1)
Viu-se que E1s = hWS i1s = −q h1, 0, 0 | R | 1, 0, 0i · E = 0, devido a paridade das funções de
onda e consequentemente do integrando do elemento de matriz, entretanto na presença de um
campo elétrico o estado fundamental do átomo não é mais dado pelo |1, 0, 0i e sim por
X X X |hn, l, mL | Z | 1, 0, 0i|
|ψ0 i = |1, 0, 0i − qE |n, l, mL i + · · ·
n6=1 l mL
E1 − En

6.12. Efeito Stark
portanto, a correção em primeira ordem é
XXX 1
hWs iψ0 = hψ0 | qR | ψ0 i = −q 2 E ×
n6=1 l mL
E1 − En
[h1, 0, 0 | R | n, l, mL i hn, l, mL | Z | 1, 0, 0i + h1, 0, 0 | Z | n, l, mL i hn, l, mL | R | 1, 0, 0i] .
Ao escrever os operadores X e Y em termos dos harmônicos esféricos, pode-se mostrar que
hψ0 | qX | ψ0 i = hψ0 | qY | ψ0 i = 0.
X X X |hn, l, mL | Z | 1, 0, 0i|2
hψ0 | qZ | ψ0 i = −2q 2 E .
n6=1 l mL
E1 − En
O campo elétrico induz um momento de dipolo elétrico p = qE, para o qual tem-se
dp
P= = χ0 E.
dv
O coeficiente de proporcionalidade χ entre o momento de dipolo elétrico induzido p e o campo
elétrico E, é chamado de susceptibilidade elétrica linear. Portanto, com essas definições, pode-se
escrever
X X X |hn, l, mL | Z | 1, 0, 0i|2
2
χ1s = hψ0 | χ | ψ0 i = −2q .
n6=1 l mL
E1 − En
6.12.3 Efeito Stark para o nível n = 2

Para o nível n = 2, a base é {|2, 0, 0i , |2, 1, 1i , |2, 1, 0i , |2, 1, −1i}. Quanto a paridade dos
estados dessa base temos



 |2, 1, 1i

Par = {|2, 0, 0i e Ímpar = |2, 1, 0i


|2, 1, −1i

Como a perturbação WS é uma função ímpar, segue-se que
h2, 0, 0 | WS | 2, 0, 0i = h2, 1, m0 | WS | 2, 1, mi = 0, com m0 = m = −1, 0, 1.
Portanto, os únicos elementos de matriz não nulos são os h2, 1, m | WS | 2, 0, 0i =

6 0, assim como
WS = −qEZ = −qER cos θ e como o harmônico esférico Y10 (θ) é dado por
r r
3 4π 0
Y10 (θ) = cos θ =⇒ cos θ = Y (θ),
4π 3 1
Portanto, nos cálculos do elementos de matriz da série perturbativa, teremos integrais da

forma ˆ
Y1m∗ (Ω)Y10 (Ω)Y00 (Ω) dΩ

6.12. Efeito Stark
√
e desde que, Y00 (Ω) = 1/ 4π = cte, logo as integrais dessa forma serão proporcionais ao produto
de Y10 (Ω) por Y1m∗ (Ω) e portanto essas integrais serão não nulas somente se m = 0. Temos ainda
a relação de ortogonalidade entre o harmônicos esféricos dada por
ˆ
0
dΩ Y`m∗ (Ω)Y`m
0 (Ω) = δ`,`0 δm,m0
Note ainda que, desde que Y10 (Ω), R2,0 (r) e R1,0 (r) são funções reais, então pode-se concluir
que o elemento de matriz
h2, 1, m = 0 | WS | 2, 0, 0i ∈ <,
assim considerando que

h2, 1, 0 | WS | 2, 0, 0i = γE,
tem-se então que a matriz do termo WS no nível 2s é dada por
|2, 1, 1i |2, 1, −1i |2, 1, 0i |2, 0, 0i

 
0 0 0 0 |2, 1, 1i
(WS )n=2
 
=  0 0 0 0  |2, 1, −1i (6.79)
 
 0 0 0 γ  |2, 1, 0i
 
0 0 γ 0 |2, 0, 0i
Assim em primeira ordem, as correções perturbativas dos autoestados no nível n = 2 são
dadas por
Autoestado Correção
|2, 1, 1i ←→ 0
|2, 1, −1i ←→ 0 (6.80)
√1 (|2, 1, 10i + |2, 0, 0i) ←→ γE
2
√1 (|2, 1, 10i − |2, 0, 0i) ←→ −γE
2
Portanto, o campo elétrico remove parcialmente a degenerescência do nível n = 2, com um

deslocamento linear com o módulo E do campo elétrico.

6.12. Efeito Stark

Capítulo 7
Teoria de Perturbação Dependente do

Tempo
Até o momento foram consideradas somente situações estáticas (exceto na discussão dos
postulados da mecânica quântica, na qual surge surge o colapso do vetor de estado para um
dos estados do sistema ao realizarmos uma medição). Chegou o momento de discutirmos a
dependência temporal do vetor de estado, o que requer um novo princípio. A equação de
Schrödinger dependente do tempo resultante é resolvida exatamente para os casos simples, como
o do spin, e usando uma teoria de perturbação. A noção de probabilidade de transição produz
um significado físico para os elementos de matriz não-diagonal do potencial perturbados, como
vimos estudarmos os sistemas de dois níveis, o que nos permite apresentar a relação de incerteza
energia-tempo junto com o conceito de tempo de vida.
Devemos ressaltar o fato de que na mecânica quântica o tempo é tomado como sendo um
parâmetro, e não um observável. Embora haja um operador evolução temporal, não há um
operador tempo ou algo do tipo.
7.1 Formulação do problema

Considere um sistema físico descrito pelo operador hamiltoniano H0 , que satisfaz a seguinte
equação de autovalores:
H0 |ϕn i = En |ϕn i . (7.1)
Por simplicidade, considere que o espectro de H0 é discreto e não degenerado, e que H0 é

independente do tempo.
No instante t = 0 aplica-se uma perturbação dependente do tempo ao sistema de forma que
o hamiltoniano do sistema agora é dada por
H(t) = H0 + W (t) com W (t) = λV (t), (7.2)
na qual λ é um parâmetro real adimensional muito menor do que um (λ 1) e V (t) é um

observável da mesma ordem de magnitude de H0 e zero para t < 0.
167
7.1. Formulação do problema
No tratamento dado ao problema, considera-se que o sistema encontra-se inicialmente no

estado estacionário |ϕi i, um autoestado de H0 com autovalor Ei . Iniciando em ti = 0, quando
a perturbação é aplicada ou ligada, o sistema evolui, pois o estado |ϕi i não é um autoestado
do hamiltoniano perturbado H(t). Investigaremos como o sistema evolui do instante t = 0,
de um autoestado inicial |ϕi i para um autoestado final |ϕf i de H0 no instante t, e com que
probabilidade Pif (t) isso ocorre. Com isso, pretende-se compreender como ocorrem as transições
entre dois estados quaisquer do sistema não perturbado, induzidas pelo potencial perturbativo
W (t).
A evolução temporal do sistema entre os instantes ti = 0 e tf = t é dada por
d |ψ(t)i
i~ = [H0 + λV (t)] |ψ(t)i , (7.3)
dt
e a sua solução, com a condição inicial
|ψ(t = 0)i = |ϕi i , (7.4)
é única. A probabilidade Pif (t) desejada pode ser escrita como
Pif (t) = | hϕi | ψ(t)i |2
O problema posto acima consiste em encontrar a solução de (7.3) que corresponde à condição
inicial (7.4). No entanto, em geral tal problema não é rigorosamente solúvel. É por isso que
recorre-se aos métodos aproximados para obtermos informações a respeito do sistema. Será
mostrado que se o parâmetro λ for pequeno o suficiente, a solução|ψ(t)i pode ser encontrada
na forma de uma expansão de série de potência limitada em λ. Assim, calcula-se o |ψ(t)i
explicitamente em primeira ordem em λ, assim como a probabilidade correspondente. As
expressões gerais obtidas serão aplicadas ao estudo do caso especial, aquele em que a perturbação
é uma função sinusoidal do tempo ou uma constante, como é o caso da interação de um átomo
com uma onda eletromagnética. Este é um exemplo do fenômeno de ressonância. Duas situações
serão consideradas: aquela em que o espectro de H0 é discreto, e então aquele em que o estado
inicial |ϕi i é acoplado a um contínuo de estados finais. Neste último caso, obteremos uma
importante expressão conhecida como “regra de ouro de Fermi ”.
Os resultados obtidos ao discutirmos um sistema de dois níveis, cujos estados são|ϕ1 i e
|ϕ2 i, inicialmente no estado|ϕ1 i, era submetido no instante de tempo t = 0 a uma perturbação
constante W , podem ser considerados uma caso particular do que será investigado no que se
segue. A probabilidade P12 (t) poderá então ser calculada exatamente, o que leva à fórmula de
Rabi.
O problema que será tratado aqui é muito mais geral. Será considerado um sistema com um
número arbitrário de níveis de energia e uma perturbação W (t) que é uma função arbitrária do
tempo. Isso explica por que, em geral obtém-se apenas uma solução aproximada.

7.2. Probabilidade de transição
7.2 Probabilidade de transição

Para compreendermos de forma clara que tipo de informação física pode ser extraída
das amplitudes de transição precedentes, será feita uma distinção entre os diferentes casos,
dependendo se os estados iniciais |ϕi i e finais |ϕf i, do processo pertencem ao espectro discreto
ou contínuo do hamiltoniano não perturbado H0 . Para cada um desses casos, a dependência do
tempo que a mecânica quântica prevê para os elementos da matriz do operador de evolução
será investigada, e será mostrado como é possível conectar as amplitudes de transição com
quantidades físicas mensuráveis, tais como mudanças de nível, tempos de vidas, seções choques
transversais, etc. Tais ideias gerais serão úteis para analisar os processos físicos a serem vistos
posteriormente.
A probabilidade Pif (t) do sistema no instante t estar no estado |ψ(t)i = |ϕf i, diferente de
|ψ(t = 0)i = |ϕi i, o estado em que ele se encontrava em t = 0, é dada por
Pif (t) = |hϕf | ψ(t)i|2 (7.5)
Escolhendo então a representação {|ϕn i}, o ket |ψ(t)i ao ser expandido na base {|ϕn i} toma
a seguinte forma:
X
|ψ(t)i = Cn (t) |ϕn i , (7.6)
n
com
Cn (t) = hϕn | ψ(t)i . (7.7)
Nessa base, é costume definir
Vnk (t) = hϕn |V (t)|ϕk i (7.8)
como o elemento de matriz do observável V (t). Note que nessa base o hamiltoniano H0 é
representado pela matriz diagonal
hϕn |H0 |ϕk i = En δnk . (7.9)
Para uma base completa, vale a relação de completeza,

X
|ϕk i hϕk | = 1. (7.10)
k
Substituindo (7.6) em (7.3), obtém-se

X dCk (t) X
i~ |ϕk i = [H0 + λV (t)] Ck (t) |ϕk i .
k
dt k
Tomando o produto interno da equação acima com o bra hϕn |, resulta em

X dCk (t) X
i~ hϕn | ϕk i = Ck (t) hϕn |H0 + λV (t)|ϕk i
k
dt k

Portanto, pode-se escrever a evolução temporal dos coeficientes Cn (t) como
d X
i~ Cn (t) = En Cn (t) + λVnk (t)Ck (t). (7.11)
dt k
Note que o resultado anterior é constituído por um conjunto de equações diferenciais de primeira
ordem acopladas. A princípio ao resolver o sistema (7.11), a solução desejada |ψ(t)i seria
encontrada, pois todos os coeficientes Cn (t) seriam conhecidos. O que acopla o conjunto de
equações (7.11) é somente a perturbação W (t) = λV (t), a qual relaciona a evolução temporal
de um coeficiente Cn (t) qualquer com todos os outros coeficientes Ck (t) por meio dos elementos
de matriz Vnk (t) dados por (7.8).
7.2.1 Separando as contribuições temporais

Para V (t) = 0, a solução da equação (7.11) é
Cn (t) = bn e−iEn t/~ , (7.12)
na qual bn é uma constante que depende das condições iniciais.

Se o acoplamento for muito pequeno, como no caso em que λ 1 e V (t) 6= 0 e nesse
caso W (t) 1, é natural esperar que os valores dos coeficientes Cn (t) da equação (7.11) não
sejam muito diferentes dos valores fornecidos pela equação (7.12). Então para esse caso será
considerada a seguinte solução tentativa para a equação (7.11),
Cn (t) = bn (t)e−iEn t/~ , (7.13)
na qual os coeficientes bn (t) devem variar muito pouco com o tempo. Com isso, separa-se os
termos que variam letamente daqueles que variam rapidamente.
Substituindo (7.13) em (7.11), obtemos
d X
i~e−iEn t/~ bn (t) + En bn (t)e−iEn t/~ = En bn (t)e−iEn t/~ λVnk (t)bk (t)e−iEk t/~ (7.14)
dt k
Multiplicando ambos os lados da equação acima por e+iEn t/~ , e introduzindo a frequência angular
de Bohr
En − Ek
ωnk = (7.15)
~
relacionada ao par de estados com energias En e Ek . Com isso, obtém-se que
d X
i~ bn (t) = λ eiωnk t Vnk (t)bk (t) (7.16)
dt k
a qual fornece a evolução temporal dos coeficientes bn (t).

7.3. Equações perturbativas
7.3 Equações perturbativas

Note que o sistema de equações (7.16) corresponde rigorosamente a equação de Schrödinger
dependente do tempo. Em geral, não sabemos como resolver esse sistema de equações exatamente.
Por isso, para tentar encontrar uma solução para esse sistema, será usado o fato de λ 1, o
que permite que se faça uma expansão de cada coeficiente bn (t) em série de potências em λ da
seguinte forma:
bn (t) = b(0) (1) 2 (2)

n (t) + λbn (t) + λ bn (t) + · · · (7.17)
Aqui não será analisada a convergência da série, entretanto, espera-se que sua convergência seja
rápida já que λ é muito pequeno.
Substituindo essa expansão em (7.16), obtém-se a seguinte equação

d (0) d (1) 2 d (2)
X
i~ bn (t) + λ bn (t) + λ bn (t) + · · · = λ eiωnk t Vnk (t)×
dt dt dt
hk i
(0) (1) 2 (2)
bk (t) + λbk (t) + λ bk (t) + · · · (7.18)
Agora, junta-se em ambos os lados da igualdade todos os termos de mesma potência no parâmetro
λ, e com isso obtemos uma série de potência da seguinte forma a0 + a1 λ + a2 λ2 + a3 λ3 + · · · +
an λn + · · · = 0. A única forma dessa equação ser satisfeita é igualando cada um dos coeficientes
de λ a zero, o que resulta no seguinte sistema de equações
d (0)
i~ b (t) = 0
dt n
d X (0)
i~ b(1)
n (t) = eiωnk t Vnk (t)bk (t)
dt k
d X (1)
i~ b(2)
n (t) = eiωnk t Vnk (t)bk (t)
dt k
.. ..
. = .
d (r) X (r−1)
i~ bn (t) = eiωnk t Vnk (t)bk (t)
dt k
A solução deste sistema de equações é obtida considerando que para t ≤ 0 o sistema encontrava-se
no estado |ϕi i. Nesse casso todos os coeficientes bn (t) são nulos exceto bi (t) = bi = cte. Portanto
temos que:
b(0)
n (t = 0) = δni e b(r)
n (t = 0) = 0 se r > 1 (7.19)
Portanto da correção de ordem zero temos que
b(0)
n (t) = δni (7.20)
Ao substituir o resultado da correção de ordem zero na correspondente equação para a
correção de primeira ordem obtém-se que
d X
i~ b(1) (t) = eiωnk t Vnk (t)δki = eiωni t Vni (t), (7.21)
dt n k

7.3. Equações perturbativas
cuja solução é
ˆt
1 0
b(1)
n (t) = eiωni t Vni (t0 )dt0 (7.22)
i~
0
Substituindo o resultado da correção em primeira ordem na expressão para a correção em
segunda ordem, resulta na seguinte equação
ˆt
d X 1 0
i~ b(2)
n (t) = eiωnk t Vnk (t) eiωki t Vki (t0 )dt0 (7.23)
dt k
i~
0
para a qual a solução é imediata, e é dada por
Xˆ ˆt0
t
1 0 00
b(2)
n (t) = dt0 eiωnk t Vnk (t0 ) dt00 eiωki t Vki (t00 ) (7.24)
(i~)2 k 0 0
(q)
Analogamente para o coeficiente bn (t) tem-se que
Xˆ ˆt0 ˆ
t tq−1
1
b(q)
n (t) = dt0 eiωnk t0 Vnk (t0 ) dt1 eiωki t1 Vki (t1 ) . . . dtq eiωki tq Vki (tq ).
(i~)q k
0 0 0
Portanto, com essa abordagem, em princípio conseguimos resolver o problema, pois obtivemos
(q)
expressões fechadas para os coeficientes bn (t) .
Considerando somente as correções até primeira ordem, podemos escrever
ˆt
1 0
bn (t) = δni + eiωni t Vni (t0 )dt0 ,
i~
0
da qual nota-se que os cálculos em primeira ordem são confiáveis se |bn (t)| 1 com n 6= i. Se
essa condição for violada, os resultados obtidos se tornam inconsistentes.
7.3.1 Função de onda

Agora será interessante recuperarmos a forma funcional da função de onda o ket |ψ(t)i.
Para isso substitui-se os coeficientes (7.20), (7.22) e (7.24) na expressão (7.17), o que resulta na
seguinte expressão
ˆt 2 Xˆ
t ˆt0
λ 0 λ 0 00
bn (t) = δni + eiωni t Vni (t0 )dt0 + dt0 eiωnk t Vnk (t0 ) dt00 eiωki t Vki (t00 )+· · · (7.25)
i~ (i~)2 k
0 0 0
Substituindo (7.25) em (7.13) e o resultado em (7.6), obtém-se
X e−iEn t/~ ˆ
t
0
|ψ(t)i = e−iEi t/~ |ϕi i + eiωni t Wni (t0 )dt0 |ϕn i +
n
i~
0
X e−iEn t/~ ˆ ˆt0

t
t0 00
dt0 eiωnk Wnk (t0 ) dt00 eiωki t Wki (t00 ) |ϕn i + · · · (7.26)
n,k
(i~)2
0 0

Aqui trocamos W (t) = λV (t).

Esta equação ainda pode ser reescrita em uma forma mais compacta, como
ˆt

δn,i + 1 0
X
−iEn t/~
|ψ(t)i = e eiωni t Wni (t0 )dt0 +
n
i~
0
ˆt ˆt0

X 1 0 00
dt0 eiωnk t Wnk (t0 ) dt00 eiωki t Wki (t00 ) + · · ·  |ϕn i (7.27)
k
(i~)2
0 0
a qual tem uma forma similar a série de Dyson. Formalmente, a série Dyson é a solução para
a equação de Schrödinger para os elementos da matriz do operador de evolução temporal na
representação de interação, como veremos.
7.4 Probabilidade de transição

Define-se a probabilidade de transição, ou a probabilidade de que o sistema no instante inicial
(t = 0) estivesse no estado |ψ(t = 0)i = |ϕi i e após uma evolução temporal seja encontrado no
instante t no estado final |ψ(t)i = |ϕf i o qual é diferente daquele do instante inicial, como
Pif (t) = |hϕf | ψ(t)i|2 = |Cf (t)|2 = |bf (t)|2 (7.28)
na qual
(0) (1) (2)
bf (t) = bf (t) + λbf (t) + λ2 bf (t) + · · · (7.29)
Agora então será considerado que os estados iniciais |ϕi i e finais |ϕf i são diferentes e que eles são
autoestados de H0 . Dessa forma está-se tratando somente com a transição, entre dois estados
estacionários distintos de H0 , induzida pela perturbação W (t) = λV (t). Considerando ainda
somente as correções em primeira ordem, pode-se escrever
(1)
Pif (t) = λ2 |bf (t)|2 , (7.30)
usando a expressão (7.22) e o fato de que W (t) = λV (t) temos

(7.1)
ˆ
t 2

1 iωf i t0 0 0

Pif (t) = 2 e Wf i (t )dt (7.31)
~
0
Considere uma função W̃if (t0 ), a qual é zero para t0 < 0 e para t0 > t, e igual a Wif (t0 )
no intervalo 0 ≤ t0 ≤ t, conforme ilustrado na figura 7.1, ou seja, estamos usando a chamada
aproximação súbita. A função W̃if (t0 ) é o elemento de matriz da perturbação “vista/sentida”
pelo sistema entre os instantes t = 0 e o instante t em que é realizada a medição, quando tenta-se
inferir o estado em que o sistema se encontra. O resultado (7.31) mostra que a probabilidade
de transição Pif (t) é proporcional ao módulo ao quadrado da transformada de Fourier da

W̃if (t0 )
t0
0 t
Figura 7.1: Representação da variação da função W̃if (t0 ) com relação a t0 . Note que W̃if (t0 ) coincide
com Wif (t0 ) no intervalo 0 ≤ t0 ≤ t, e vai a zero fora desse intervalo. É a transformada de Fourier de
W̃if (t0 ) que entra na probabilidade de transição Pif (t) de mais baixa ordem.
perturbação realmente “vista/sentida” pelo sistema W̃if (t0 ). Essa transformada de Fourier é
calculada na frequência angular de Bohr associada com a transição em consideração.
A seguir, será considerado o caso de um oscilador harmônico unidimensional que encontra-se
no estado fundamental |0i do hamiltoniano não perturbado H0 no instante t = −∞. Considere
que a perturbação
2 /τ 2
V (t) = −eEXe−t , (7.32)
atua sobre o sistema no intervalo de tempo t = −∞ até t = +∞. Qual é a probabilidade de

que o oscilador esteja no estado |ni no instante t = +∞? Para n 6= 0, temos que
ˆ+∞
1 2 2
bn (t = ∞) = (−eE)einωt hn|X|0i e−t /τ dt,
i~
−∞
e desde que
1/2
~
X= (a + a† ).
2mω
Dá relação acima, é óbvio que somente o termo b1 (t = ∞) 6= 0, pois a† |0i = |1i. Portanto,
pode-se escrever
1/2 ˆ+∞ 1/2 √
ieE ~ −t2 /τ 2 iωt ieE ~ 2 2
b1 (t = ∞) = e e dt = πτ 2 e−ω τ /4 .
~ 2mω ~ 2mω
−∞
Logo a probabilidade de transição de 0 → 1, ou seja, P0→1 é
e2 E 2 πτ 2 −ω2 τ 2 /4
P0→1 = |b1 (t = ∞)|2 = e . (7.33)
2m~ω
7.5. Perturbação súbita
7.5 Perturbação súbita

Considere um sistema cujo hamiltoniano muda abruptamente durante um pequeno intervalo
de tempo ε. Qual é a mudança no vetor de estado quando ε > 0? Pode-se encontrar a resposta
sem recorrer à teoria da perturbação. Assumindo que a mudança ocorreu em torno de t = 0, ao
integrar a equação de Schrödinger entre t = −ε/2 e t = +ε/2, obtemos
ˆ
+ε/2
1
|ψ(ε/2)i − |ψ(−ε/2)i = H(t0 ) |ψ(t0 )i dt0 . (7.34)
i~
−ε/2
Desde que o integrando do lado direito é finito, a integral é da ordem de ε. No limite em que
ε → 0, obtém-se que |ψ(ε/2)i = |ψ(−ε/2)i, ou seja,
|ψantes i = |ψdepois i . (7.35)
Uma mudança instantânea em H não produz mudanças instantâneas no vetor de estado |ψi.
Agora o limite ε → 0 não é físico. A utilidade do resultado acima reside no fato de que é uma
excelente aproximação se H mudar durante um curto intervalo de tempo que é muito pequeno
em comparação com a escala de tempo natural do sistema. Este último pode ser estimado
semiclassicamente. Para o presente, vamos considerar o caso de um oscilador ao qual é aplicada
a perturbação Eq. (7.32). É claro que qualquer que seja a escala de tempo deste sistema,
a mudança no vetor de estado |ψi deve desaparecer quando τ , a largura do pulso gaussiano,
desaparecer. Isto significa, em particular, que o sistema inicialmente no estado fundamental
deve permanecer lá após o pulso, ou seja, a probabilidade de transição 0 → 1 deve desaparecer.
Sendo este um resultado exato, esperamos que se a probabilidade de transição for calculada de
forma perturbativa, ela deve desaparecer para qualquer ordem dada. (Isto é o mesmo que dizer
que, se uma função analítica se desvanece de forma idêntica, o mesmo acontece com todo termo
em sua expansão de Taylor.) Voltando à probabilidade de primeira ordem para 0 → 1 na Eq.
(7.32), vemos que, de fato, ela desaparece à medida que tende a zero.
Um problema mais realista, em que ε é fixo, envolve um elétron 1s ligado a um núcleo de
carga Z que sofre um decaimento β emitindo um elétron relativístico e mudando sua carga para
(Z + 1). O tempo que o elétron emitido leva para sair da camada n = 1 é
τ ' a0 /Zc, (7.36)
enquanto o tempo característico para o elétron 1s é

a0

tamanho do estado Z a0
T ' −
' = 2 (7.37)
velocidade do e Zαc Z αc
tal que
τ
= Zα (7.38)
T
Para Z pequeno, pode-se aplicar uma aproximação súbita e concluir que o estado do elétron
atômico é o mesmo imediatamente antes e após o decaimento β. De fato, esse estado não é um
autoestado da carga (Z + 1) do íon, mas em vez disso, uma superposição de tais estados.

7.6. Perturbação adiabática
7.6 Perturbação adiabática

Agora será considerado um sistema cujo hamiltoniano H(t) muda muito lentamente com o
tempo, passando de H(0) para H(τ ) em um dado instante de tempo τ . Se o sistema iniciar
em t = 0 em um autoestado |n(0)i de H(0), onde ele irá terminará no tempo τ ? O teorema
adiabático afirma que, se a taxa de mudança de H for lenta o suficiente, o sistema terminará no
autoestado correspondente |n(τ )i de Н(τ ). Em vez de derivar o teorema e a definição precisa
de “lento o suficiente”, serão considerados alguns exemplos ilustrativos. Na mecânica quântica,
a aproximação adiabática é expresso na forma de um teorema, conhecido como “Teorema
adiabático” [16, Capítulo 10, pág. 271]. Considere que o Hamiltoniano mude gradualmente de
um determinada forma inicial H(0) para certa forma final H(τ ). O teorema adiabático afirma
que se, inicialmente, a partícula está no n-ésimo autoestado de H(0), ela será levada (por meio
da equação de Schrödinger) ao n-ésimo autoestado de H(τ ). (Considere que o espectro seja
discreto e não degenerado no decorrer da transição de H(0) a H(τ ), e que, portanto, não exista
ambiguidade sobre a ordenação dos estados; essas condições podem ser suavizadas em função de
um procedimento apropriado para o “acompanhamento”" das autofunções, mas não será tratado
aqui.)
Por exemplo, considere uma partícula no estado fundamental de um poço quântico quadrático
infinito de comprimento L(0). Para esse caso a sua função de onda é dada por
s
2 π
ψi (x) = sen x .
L(0) L(0)
Se sua parede da direita iniciar-se a mover com velocidade constante para direita, para um
comprimento L(τ ), o teorema adiabático dirá que a partícula acabará no estado fundamental
do poço quântico quadrático infinito de comprimento L(τ ), cuja função de onda é dada por
s
2 π
ψi (x) = sen x
L(τ ) L(τ )
a menos de um fator de fase. Note que, diferentemente do caso da teoria de perturbação
independente do tempo, aqui estamos lidando com uma grande mudança no hamiltoniano, pois
o poço pode estar saindo de um comprimento ` para 2`. Nesse caso, deve-se garantir somente
que a mudança ocorra lentamente. Observe que a energia do sistema não é conservada: pois
quem move a parede é que estará extraindo energia do sistema. Em contrapartida, se a expansão
do poço for abrupta (súbita) o estado resultante ainda será ψi (x), o qual é dado por uma
combinação linear dos autoestados do novo hamiltoniano.
Se o poço se expandir lentamente para um comprimento L(τ ), o teorema nos diz que uma
partícula que estava no n-ésimo estado do opço de comprimento L(0) agora estará no n-ésimo
estado do poço de comprimento L(τ ). Mas o que significa o termo “lentamente”?
Existem duas maneiras de estimar isso. O primeiro é um método semiclássico e é o seguinte.
O momento da partícula é da ordem (a menos de fatores da ordem da unidade como π, n, etc.)
~
p' (7.39)
L
e o temos gasto para realizar uma oscilação completa é da ordem de

v mL mL2
T ' = ' (7.40)
L p ~
Pode-se dizer que a expansão ou contração é lenta se a fração de mudança no comprimento do
poço por ciclo for muito menor do que a unidade
|∆L|por ciclo |dL/dt| mL2 /~

mL dL
' = 1. (7.41)
L L ~ dt
Essa expressão também pode ser reescrita como
vparedes
1. (7.42)
vpartícula
A segunda aproximação é menos intuitiva e ela estima T como
1
T ' (7.43)
ωmin
na qual ωmin é a menor frequência das transições entre um estado inicial i e qualquer estado
final acessível f . Ela é menor do que
(0) (0)
Ef − Ei
ωf i = . (7.44)
~
Nesse caso, desde que
n2 ~2 π 2
En(0) = , (7.45)
2mL2
as diferenças de energia são da ordem de ~2 /mL2 e
1 mL2
T ' ' (7.46)
ωmin ~
a qual coincide com a eq. (7.40). Esse resultado é até certo modo esperado, pois também
podemos reescrever o T da eq. (7.40) da seguinte forma
mL2 1 1
T ' ' (0) ∼ (7.47)
~ Ei /~ ωi
(0)
Portanto, T na eq. (7.40) também é dado por ∼ ~/Ei , enquanto T na eq. (7.46) é ∼
(0) (0)
~/|Ej − Ei |min . Desde que os níveis de energia de um sistema quântico são todos da mesma
ordem de magnitude (pode-se dizer que são da ordem do Rydberg ou ~ω), as energias e as
diferenças de energia são da mesma ordem de magnitude e as duas estimativas para T são
equivalentes, a não ser que os níveis de energia estejam muito proximamente degenerados. Nesse
caso, ele é da ordem de T ∼ 1/ωmin o que é verdadeiro, para expor a instabilidade de sistemas
degenerados ou proximamente degenerados. A seguir, para ilustrar apresentamos um exemplo
dessa situação.
Considere mais um exemplo do teorema adiabático, um oscilador submetido a perturbação
2 /τ 2
V (t) = −eEXe−t (7.48)

entre os instantes −∞ ≤ t ≤ ∞. Espera-se que se τ , o qual mede o tempo que V (t) leva para ir
de 0 até seu valor máximo, tender a infinito, a mudança no sistema será adiabática. portanto,
se um sistema inicia no estado fundamental de H(−∞) = H0 em t = −∞, ele irá terminar
no estado fundamental de H(∞) = H(−∞) = H0 . A expressão em primeira ordem (7.46),
para P0→1 conforme seu valor esperado e desaparece exponencialmente quando ωτ → ∞. A
expressão obtida nos diz que para valores de τ grandes isso significa que:
ωτ 1, τ 1/ω (7.49)
Isso é o que se espera de uma estimativa semiclássica ou estimando que T ∼ 1/ωmin e a condição
τ T.
O teorema adiabático sugere um modo de recuperarmos os resultados da teoria de perturbação
independente do tempo a partir da teoria dependente do tempo. Considere um hamiltoniano
H(t) o qual muda continuamente de H0 em t = −∞ para H0 + W em t = 0:
H(t) = H0 + W et/τ , −∞ ≤ t ≤ 0 (7.50)
Quando τ , aumenta o tempo na exponencial, vai para infinito, o teorema adiabático assegura

que um autoestado n(0) de H0 em t = −∞ ira evoluir para os autoestados |ni de H no instante
t = 0. Se calcularmos o estado em t = 0 para uma dada ordem a teoria perturbação dependente
do tempo e tomar τ → ∞, iremos obter uma expressão independente do tempo para o estado
|ni daquela ordem. Para a primeira ordem, temos que a projeção do estado em t = 0 ao longo

do m(0) com m 6= n é
ˆ0
1
bm (t) = hm(0) |W |n(0) i et/τ eiωmn t dt
i~
−∞
1 hm(0) |W |n(0) i
= (7.51)
i~ 1/τ + iωmn
Se tomarmos o limite em que τ → ∞, obtemos um resultado familiar

hm(0) |W |n(0) i
m(0) n =

(0) (0)
(7.52)
En − Em
De fato, o τ → ∞ é trocado por um valor grande de τ . A equação (7.51) nos diz que um valor
grande de τ significa que: ele é definido por
|1/τ | |ωmin |
ou
τ 1/ωmin . (7.53)
Portanto viu-se que T ' 1/ωmin é de fato uma medição confiável da escala de tempo natural do
sistema. Em particular, se o sistema for degenerado (ou próximo disso), T → ∞ e ele torna-se
impossível, na prática, para mudar o estado do sistema adiabaticamente.

7.7. Representação de Schrödinger
Vamos encerrar a discussão sobre a aproximação adiabática, observando sua similaridade

com a aproximação WKB. A primeiro nos diz que se o hamiltoniano muda com o tempo de

H0 para H0 + W , o autoestado n(0) evolui suavemente para sua contrapartida o |ni no limite
em que τ /T → ∞, em que τ é a duração na qual o hamiltoniano muda e T é a escala natural
de tempo do sistema. Este último nos diz que se o potencial muda no espaço de V0 para V1 ,
p
uma onda plana de momentum p0 = 2m(E − V0 ) evolui suavemente para uma onda plana de
p
momentum p1 = 2m(E − V1 ) no limite em que L/λ → ∞, no qual L é o comprimento sobre
o qual o potencial V muda e λ = 2π~/p é a escala de comprimento natural do sistema.
7.7 Representação de Schrödinger

Na representação de Schrödinger os estados evoluem no tempo de acordo com
|ψS (t)i = US (t, t0 ) |ψS (t0 )i , (7.54)
na qual
US (t, t0 ) = e−iH(t−t0 )/~ (7.55)
é o operador evolução temporal na representação de Schrödinger, quando o Hamiltoniano H
do sistema é independente do tempo. Mas quando ele depende do tempo o operador evolução
temporal satisfaz a seguinte equação
∂
i~ U (t, t0 ) = H(t)U (t, t0 ). (7.56)
∂t
Na representação de Schrödinger o valor esperado do operador OS , hOS i = hψS (t)|OS |ψS (t)i é
dado por
d 1 ∂OS
hOS i = h[OS , H(t)]i + h i (7.57)
dt i~ ∂t
no caso em que OS não depende explicitamente do tempo temos
d 1
hOS i = h[OS , H(t)]i (7.58)
dt i~
7.8 Representação de Heisenberg

Na representação de Heisenberg, os estados são constantes no tempo, assim
|ψH i = US† (t, t0 ) |ψS (t)i = US† (t, t0 )US (t, t0 ) |ψS (t0 )i = |ψS (t0 )i (7.59)
Note que US† (t, t0 )US (t, t0 ) = US (t, t0 )US† (t, t0 ) = 1, pois ele é unitário. Naturalmente temos que
|ψS (t)i = US (t, t0 ) |ψH i = US (t, t0 ) |ψS (t0 )i (7.60)
O valor esperado do operador OS (t), pode ser escrito como
hψS (t)|OS (t)|ψS (t)i = hψS (t0 )|US† (t, t0 )OS (t)US (t, t0 )|ψS (t0 )i (7.61)
= hψH |US† (t, t0 )OS (t)US (t, t0 )|ψH i (7.62)

7.9. Representação de interação
da qual usando o fato de que
hψS (t)|OS (t)|ψS (t)i = hψH |OH (t)|ψH i (7.63)
tiramos que
OH (t) = US† (t, t0 )OS (t)US (t, t0 ) (7.64)
Portanto, vê-se que OH (t) irá depender do tempo, mesmo que o operador OS (t) = OS não
dependa do tempo.
Note então que

d d † † d
OH (t) = U (t, t0 ) OS (t)US (t, t0 ) + US (t, t0 ) OS (t) US (t, t0 )+
dt dt S dt

† d
US (t, t0 )OS (t) US (t, t0 )
dt

1 † † d
= − US (t, t0 )HS (t)OS (t)US (t, t0 ) + US (t, t0 ) OS (t) US (t, t0 )+
i~ dt
1
US† (t, t0 )OS (t) HS (t)US (t, t0 )
i~
1 † † † d
= − US (t, t0 )HS (t)US (t, t0 )US (t, t0 )OS (t)US (t, t0 ) + US (t, t0 ) OS (t) US (t, t0 )+
i~ dt
1 †
US (t, t0 )OS (t)US (t, t0 )US† (t, t0 )H(t)US (t, t0 )
i~

d 1 1 d
OH (t) = − HH (t)OH (t) + OH (t)HH (t) + US† (t, t0 ) OS (t) US (t, t0 )
dt i~ i~ dt

1 d
= [OH (t), HH (t)] + OS (t)
i~ dt H
Esta ainda pode ser escrita como,

d d
i~ OH (t) = [OH (t), HH (t)] + i~ OS (t) (7.65)
dt dt H
7.9 Representação de interação

Agora estamos prontos para uma representação intermediária, na qual tanto o vetor de estado
quanto os operadores evoluem no tempo. Iremos considerar um sistema físico caracterizado pela
Hamiltoniana H0 (t) e cujo operador evolução temporal U0 (t, t0 ) satisfaz a seguinte equação
∂
i~ U0 (t, t0 ) = H0 (t)U0 (t, t0 ) com U0 (t0 , t0 ) = 1, (7.66)
∂t
Considere que o sistema é perturbado e sua Hamiltoniana torna-se
H(t) = H0 (t) + W (t) (7.67)
Define-se o vetor de estado |ψI (t)i como
|ψI (t)i = U0† (t, t0 ) |ψS (t)i (7.68)

7.10. Caso especial: Perturbação constante ou senoidal
Temos então que

d d † d
|ψI (t)i = U0 (t, t0 ) |ψS (t)i + U0† (t, t0 ) |ψS (t)i
dt dt dt
mas como
d
i~ |ψS (t)i = [H0 (t) + W (t)] |ψS (t)i (7.69)
dt
logo,

d 1 † 1
|ψI (t)i = − U0 (t, t0 )H0 (t) |ψS (t)i + U0† (t, t0 ) [H0 (t) + W (t)] |ψS (t)i
dt i~ i~
1 †
= U0 (t, t0 )W (t) |ψS (t)i
i~
1
= U0† (t, t0 )W (t)U0 (t, t0 )U0† (t, t0 ) |ψS (t)i
i~
1
= WI (t) |ψI (t)i
i~
Aqui, introduzimos a seguinte regra de transformação
WI (t) = U0† (t, t0 )W (t)U0 (t, t0 ). (7.70)
Portanto, na representação de interação, a evolução temporal do vetor de estado é dada pela

seguinte equação
d 1
|ψI (t)i = WI (t) |ψI (t)i , (7.71)
dt i~
cuja solução formal fornece a evolução temporal do vetor de estado |ψI (t)i
A evolução temporal do vetor de estado |ψI (t)i é
ˆt
1
|ψI (t)i = |ψI (t0 )i + dt0 WI (t0 ) |ψI (t0 )i (7.72)
i~
t0
Uma série interativa pode ser obtida, substituindo em |ψI (t0 )i o resultado acima, assim
ˆt ˆt0
 
1 1
|ψI (t)i = |ψI (t0 )i + dt WI (t0 ) |ψI (t0 )i + dt00 WI (t00 ) |ψI (t00 )i (7.73)
i~ i~
t0 t0
Interagindo assim sucessivamente obtemos a seguinte série
ˆt ˆt ˆt0
 
1 1
|ψI (t)i = 1 + dt0 WI (t0 ) + dt0 WI (t0 ) dt00 WI (t00 ) + · · ·  |ψI (t0 )i (7.74)
i~ (i~)2
t0 t0 t0
7.10 Caso especial: Perturbação constante ou senoidal

Considere que
V (t) = V cos(ωt) ou V (t) = V sen(ωt) (7.75)
em que V é um observável independente do tempo e ω uma frequência angular constante.

7.10. Caso especial: Perturbação constante ou senoidal
Para o caso em que V (t) = V cos(ωt), temos
Vf i iωt
Vf i (t) = Vf i cos(ωt) = (e + e−iωt ) (7.76)
2
logo
ˆt
Vf i 0 0
b(1)
n (t) = dt0 (ei(ωni +ω)t + ei(ωni −ω)t )
2i~
0
Vf i 1 − ei(ωni +ω)t 1 − ei(ωni −ω)t

=− + (7.77)
2~ ωni + ω ωni − ω
e de acordo com (7.31), e lembrando que W (t) = λV (t) podemos escrever

2
|Wf i |2 1 − ei(ωf i +ω)t 1 − ei(ωf i −ω)t

Pif (t) = + . (7.78)
4~2 ωf i + ω ωf i − ω
Note que V (t) = V cos(ωt), torna-se uma constante independente do tempo no caso em que
ω = 0. Nesse caso, a probabilidade de transição Pif (t) induzida por uma perturbação constante
é dada por
|Wf i |2
Pif (t) = |1 − eiωf i t |2
~2 ωf2i
|Wf i |2
= 2 2
|(1 − cos(ωf i t)) − i sen(ωf i t)|2
~ ωf i
|Wf i |2
= 2 2 (1 − cos(ωf i t))2 + sen2 (ωf i t)

~ ωf i
|Wf i |2 |Wf i |2
= [1 − 2 cos(ω fi t) + 1] = 2 [1 − cos(ωf i t)]
~2 ωf2i ~2 ωf2i
2
|Wf i |2 4sen2 (ωf i t/2) |Wf i |2 sen(ωf i t/2)

= =
~2 ωf2i ~2 ωf i /2
com isso temos 2

|Wf i |2 sen(ωf i t/2)

Pif (t) = (7.79)
~2 ωf i /2
|Wf i |2
Pif (t) = F (t, ωf i ), (7.80)
~2
em que
2
sen(ωf i t/2)
F (t, ωf i ) = (7.81)
ωf i /2
Para V (t) = V sen(ωt), o elemento de matriz Vf i (t) é dado por
Vf i iωt
Vf i (t) = Vf i sen(ωt) = (e − e−iωt ) (7.82)
2i
7.11. Perturbação senoidal acoplando dois estados discretos: o fenômeno da ressonância
logo
ˆt
Vf i 0 0
b(1)
n (t) =− dt0 (ei(ωni +ω)t − ei(ωni −ω)t )
2~
0
Vf i 1 − ei(ωni +ω)t 1 − ei(ωni −ω)t

= − (7.83)
2i~ ωni + ω ωni − ω
Portanto, de acordo com (7.31), e lembrando que W (t) = λV (t) temos
|Wf i |2 1 − ei(ωf i +ω)t 1 − ei(ωf i −ω)t 2

2 (1)
Pif (t) = λ |bf (t)|2 = ωf i + ω − ωf i − ω .
(7.84)
4~2
Para compreendermos o conteúdo físico das equações (7.80) e (7.84), analisaremos dois casos:
1. Probabilidade: os estados |ϕi i e |ϕf i são dois níveis discretos. Neste caso Pif (t; ω) ou
Pif (t) representa realmente uma probabilidade de transição a qual pode ser medida.
2. Densidade de Probabilidade: o estado |ϕi i é um nível discreto e |ϕf i pertence a

um contínuo de estado finais. Neste caso estamos tratando com uma densidade de
probabilidade (a quantidade física realmente mensurável envolve uma somatória sobre
todos os estados finais).
7.11 Perturbação senoidal acoplando dois estados discre-

tos: o fenômeno da ressonância
Aqui surgirá o fenômeno de ressonância, evidenciando a natureza ressonante da probabilidade
de transição.
Considere que o tempo é fixo em Pif (t), assim
Pif (t; ω) = Pif (ω) (7.85)
Vimos que a probabilidade de transição para uma perturbação senoidal pode ser escrita
como
|Wf i |2
Pif (t; ω) = |A+ (t, ω) + A− (t, ω)|2 (7.86)
4~2
na qual
1 − ei(ωf i ±ω)t
A± (t, ω) = (7.87)
ωf i ± ω
Note que
A± (t, ω) =
ωf i ± ω

i(ωf i ±ω)t/2 sen[(ωf i ± ω)t/2]
= −ie
(ωf i ± ω)/2
Agora vamos analisar como é o comportamento desta função.

Note que para ω ' ωf i , temos que


0 ≤ |A (t, ω)| ≤ t
+
ω ' ωf i =⇒ (7.88)
|A (t, ω)| =t
−
logo Pif (t; ωf i ) é máximo.

Já para ω ' −ωf i , temos que

0 ≤ |A (t, ω)| ≤ t
−
ω ' −ωf i =⇒ (7.89)
|A (t, ω)| =t
+
logo nesse caso Pif (t; −ωf i ) também é máximo.

Portanto, irá ocorrer um fenômeno da ressonância quando a frequência angular ω do potencial
perturbador coincidir com a frequência angular de Bohr ωf i = (Ef − Ei )/~ associada aos estados
|ϕi i e |ϕf i. Se ω > 0 então as duas condições de ressonância ocorrem para ωf i > 0 e ωf i < 0
conforme ilustra a figura abaixo.
Ef Ei
|ϕf i |ϕi i
ω ≈ ωf i > 0
ω ≈ −ωf i < 0
Ei Ef
|ϕi i |ϕf i
Absorção A− (t, ω) Emissão A+ (t, ω)

Figura 7.2: As figuras ilustram as disposições relativas das energias Ei e Ef , associadas aso estados
|ϕi i e |ϕf i. No processo de absorção, temos que Ei < Ef e ocorre a transição |ϕi i → |ϕf i, via a
absorção de um fóton de energia ~ω = Ef − Ei . Já no processo de emissão temos que Ei > Ef e ocorre
a transição |ϕi i → |ϕf i, via a emissão de um fóton de energia ~ω = Ei − Ef .
Portanto é natural chamarmos
• A− (t, ω) −→ Termo ressonante
• A+ (t, ω) −→ Termo anti-ressonante
Consideremos agora o caso em que
|ω − ωf i | |ωf i | ou seja ω ' ωf i (7.90)
Note das expressões para A± (t, ω) que
A+ (t, ω) = A− (t, −ω) (7.91)
logo as contribuições de A± (t, ω) são simétricas em relação à origem.

Pif (t,ω)
A+ (t, ω) A− (t, ω)
0.8
∆ω ∆ω
0.6
0.4
0.2
−ωf i 0 ωf i
ω
Figura 7.3: Variação, com relação a ω da probabilidade de transição de primeira ordem Pif (t; ω),
associada com uma perturbação senoidal de frequência angular ω; com t fixo. Quando ω ' ωf i , surge
uma ressonância cuja intensidade é proporcional a t2 e cuja largura é inversamente proporcional a t.
Temos do gráfico que

2|ωf i | ∆ω (7.92)
Temos então que para ω > 0, a contribuição do termo anti-ressonante A+ (t, ω) é desprezível
para a probabilidade de transição Pif (t; ω), portanto para esse caso podemos escrever
|Wf i |2
Pif (t) = F (t; ω − ωf i ), (7.93)
4~2
na qual 2
sen[(ω − ωf i )t/2]
F (t; ω − ωf i ) = (7.94)
(ω − ωf i )/2
Esta probabilidade de transição apresenta um máximo em ω = ωf i , quando ela tem o valor
|Wf i |2 t2
Pif (t) = (7.95)
4~2
Como dois zeros consecutivos da função sen(θ) ocorrem num intervalo de ∆θ = 2π, diante disso,
observe que os primeiros zeros de Pif (t) ocorrem em
ω − ωf i 2π 4π
| |= =⇒ ∆ω = (7.96)
2 t t
Note que para ω > 0, a probabilidade de transição varia de acordo com
|Wf i |2 t2
0 ≤ Pif (t; ω) ≤ (7.97)
~2 (ω − ωf i )2
e essa variação da probabilidade de transição é similar a um padrão de interferência.

7.11.1 Relação de incerteza Energia-Tempo e a largura de linha da

ressonância
A largura de linha ou largura da ressonância ∆ω pode ser definida aproximadamente como
a distância entre os dois primeiros zeros da probabilidade de transição Pif (t; ω), ou seja,
4π
∆ω = (7.98)
t
Note que o segundo pico de Pif (t; ω) ocorre quando

(ω − ωf i )t 3π
= , (7.99)
2 2
logo o segundo maior valor da probabilidade de transição será
|Wf i |2 t2
Pif (t; (ω − ωf i )t = 3π = (7.100)
9π 2 ~2
A razão entre o segundo e o primeiro máximo da probabilidade de transição é

(2max)
Pif |Wf i |2 t2 4~2 4
(1max)
= 2 2
· 2 2
= 2 ≈ 0.05 (7.101)
Pif 9π ~ |Wf i | t 9π
Portanto, a probabilidade do segundo máximo é da ordem de 95% menor do que a do primeiro.

Para medirmos a diferença de energia Ef − Ei = ~ωf i de um sistema, aplicamos uma
perturbação senoidal de frequência angular ω, e variamos ela até encontrar a ressonância. Se a
perturbação atua durante um intervalo de tempo t, a incerteza ∆E no valor Ef − Ei será da
ordem de
~
∆E = ~∆ω ' . (7.102)
t
Portanto, o produto t∆E não pode ser menor do que ~. Este resultado assemelha-se à relação
de incerteza energia-tempo, embora aqui t não represente um intervalo de tempo característico
da evolução livre do sistema, mas sim um intervalo imposto externamente.
Note que a condição de ressonância é válida se
2|ωf i | ∆ω, (7.103)
e usando o fato de que ∆ω ' 4π/t, temos
1 1
t ' (7.104)
|ωf i | ω
Portanto, a probabilidade de transição Pif (t; ω) dada por (7.93), só será válida se a perturbação
senoidal atuar durante um intervalo de tempo t, o qual é grande comparado com 1/ω. O
significado físico de tal condição é:

7.12. Limites do cálculo de primeira-ordem
Nota
Durante o intervalo de tempo [0, t], a perturbação deve realizar nu-
merosas oscilações para se mostrar ao sistema como uma perturbação
senoidal. Porém, se t for pequeno comparado com 1/ω, a perturbação
não teria tempo para oscilar e seria equivalente a uma perturbação que
varia linearmente no tempo.
Para uma perturbação constante, a condição (7.104) nunca será satisfeita, já que ω = 0.
7.12 Limites do cálculo de primeira-ordem

Na ressonância a probabilidade de transição é
|Wf i |2 t2
Pif (t; ω) = (7.105)
4~2
então em intervalos de tempos o suficientemente longos, ou seja, t → ∞, esta função vai para
infinito, o que é um absurdo, já que uma probabilidade nunca pode ser maior do que um.
Portanto, para a aproximação de primeira ordem ser válida na ressonância, a probabilidade em
(7.105) deve ser menor do que um, isto é,
~
t (7.106)
|Wf i |
7.13 Sistema de dois níveis discretos

Considere um sistema de dois níveis submetido a uma perturbação que varia senoidalmente
com o tempo
O método aproximado só é válido para intervalos de tempos tais que:
~
t
|Wf i |
Então para tempos maiores temos uma possibilidade seria: Determinar uma solução em
mais altas ordens perturbativas, ou seja,
(1) (2)
Pif (t; ω) = |λbf (t) + λ2 bf (t) + · · · |2 .
Entretanto tal procedimento implica em um cálculo extremamente longo e cansativo.

Portanto será usada uma forma alternativa mais rápida e simples para resolver o problema.
Neste procedimento, ajustamos o método aproximado a natureza ressonante do problema

7.13. Sistema de dois níveis discretos
7.13.1 Condição de ressonância

A condição de ressonância ω ' ω21 implica que somente os dois estado discretos |ϕ1 i e
|ϕ2 i estão efetivamente acoplados pela perturbação W (t). Desde que, inicialmente o sistema
encontra-se no estado inicial |ϕ1 i então b1 (0) = 1. Portanto a amplitude de probabilidade b2 (t)
de encontrar o sistema em um instante t qualquer no estado |ϕ2 i é apreciável.
|ψ2 i E2
|ϕ2 i E2
~ω
∆
W (t)
|ϕ1 i E1
|ψ1 i E1
Temos então que:

H(t) = H0 + W (t),
com
H0 |ϕi i = Ei |ϕi i , i = 1, 2 e |ψ(0)i = |ϕ1 i
e com a probabilidade é dada por
P12 (t; ω) = | hϕ1 | ψ(t)i |2 .
Agora o Hamiltoniano do sistema pode ser reescrito como
H = E1 |ϕ1 ihϕ1 | + E2 |ϕ2 ihϕ2 | + |ϕ1 i W12 hϕ2 | + |ϕ2 i W21 hϕ1 |
ou na forma matricial como !

E1 W12
H=
W21 E2
∗
mas como W12 = W21 = W e−iφ . Esse Hamiltoniano ainda pode ser reescrito na seguinte forma
mais adequada ! !
1 0 ∆ W12
H=E· +
0 1 W21 −∆
com
E1 + E2 E1 − E2
E= e ∆=
2 2
Então agora pode-se escrever a matriz hamiltoniana H como
H = E1 + ∆ · K
na qual 1 é a matriz identidade e a matriz K é dada por
!
1 e−iφ tg(2θ)
K=
eiφ tg(2θ) −1

para a qual foi introduzida a notação
W
tg(2θ) =
∆E
com
0 ≤ θ ≤ π/2.
Para resolver o problema deve-se diagonalizar a matriz K. Inicialmente obtém-se seu

autovalores resolvendo a equação secular
det[K − λ1] = 0 =⇒ −(1 − λ2 ) − tg2 (2θ) = 0,
logo as raízes são λ± = ± sec(2θ) e com isso as energias são dadas por
E1 = E − ∆ sec(2θ) e E2 = E + ∆ sec(2θ)
A expressões da energia em função dos parâmetros iniciais são

1 1p
E1 = (E1 + E2 ) − (E1 + E2 )2 + 4|W12 |2
2 2
e
1 1p
E2 = (E1 + E2 ) + (E1 + E2 )2 + 4|W12 |2
2 2
Agora é necessário determinar os autoestados do Hamiltoniano, e para tal temos que
H |ψi i = Ei |ψi i
para os quais, a diagonalização da matriz K e consequentemente a matriz H, fornecem
|ψ1 i = cos(θ)e−iφ/2 |ϕ1 i + sen(θ)eiφ/2 |ϕ2 i (7.107)

|ψ2 i = − sen(θ)e−iφ/2 |ϕ1 i + cos(θ)eiφ/2 |ϕ2 i (7.108)
Note que desde que os vetores de estados |ϕi i são ortonormais, ou seja
hϕi | ϕj i = δi,j
então os vetores de estado |ψi i também são ortonormais, ou seja,
hψi | ψj i = δi,j
Todos os efeitos interessantes, surgem do fato de que a perturbação W possui elementos de

∗
matriz não-diagonais W12 = W21 (se W12 = 0, os autovetores de H são os mesmos de H0 , e os
novos autovalores serão simplesmente E1 = E1 e E2 = E2 ).
Acoplamento Fraco: |W |/|∆ 1, nesse caso temos θ ≈ 0 e que
|ψ1 i → |ϕ1 i e |ψ2 i → |ϕ2 i

Acoplamento Forte: |W |/|∆ 1, nesse caso temos θ → π/4 e os estados da base {|ψ1 i , |ψ2 i}
tornam-se indistinguíveis.
Agora o autoestados do sistema são combinações simétricas e anti-simétricas dos estados
da base {|ϕ1 i , |ϕ2 i} ou seja:
1
|ψ1 i = √ (|ϕ1 i − |ϕ2 i)
2
1
|ψ2 i = √ (|ϕ1 i + |ϕ2 i)
2
O sinal do parâmetro ∆ indica quem é simétrico e quem é anti-simétrico. Pois para ∆ < 0,
temos que θ → −π/4, enquanto que para ∆ > 0, temos que θ → +π/4.
E −E
E1
E1
2|W | ∆
E2
E2
7.13.2 Evolução temporal

O operador evolução temporal do sistema é dado por
U (t, t0 ) = e−iH(t−t0 )/~
mas como
H(t) = |ψ1 i E1 hψ1 | + |ψ2 i E2 hψ2 |
segue imediatamente que
U (t, t0 ) = |ψ1 i e−iω1 (t−t0 ) hψ1 | + |ψ2 i e−iω2 (t−t0 ) hψ2 |
na qual
Ei
ωi = .
~
Desde que no instante t = 0, temos que
|ψ(0)i = |ϕ1 i

a probabilidade de em um instante t qualquer, o sistema se encontrar no estado |ϕ2 i é
P21 (t; ω) = | hϕ2 | ψ(t)i |2 = | hϕ2 |U (t, 0)|ϕ1 i |2
Mas como
hϕ2 |U (t, t0 )|ϕ1 i = hϕ2 | ψ1 i e−iω1 (t−t0 ) hψ1 | ϕ1 i +

hϕ2 | ψ2 i e−iω2 (t−t0 ) hψ2 | ϕ1 i
e como
hϕ1 | ψ2 i = − sen(θ)e−iφ/2 hϕ1 | ψ1 i = cos(θ)e−iφ/2

hϕ2 | ψ2 i = cos(θ)eiφ/2 hϕ2 | ψ1 i = sen(θ)eiφ/2
segue então que
hϕ2 |U (t, t0 )|ϕ1 i = −eiφ cos(θ) sen(θ)e−iω1 (t−t0 ) + eiφ cos(θ) sen(θ)e−iω2 (t−t0 )
= eiφ cos(θ) sen(θ) e−iω2 (t−t0 ) − e−iω1 (t−t0 )

Mas como,
e−iα − e−iβ = e−iα 1 − e−i(β−α)

= e−iα e−i(β−α)/2 ei(β−α)/2 − e−i(β−α)/2

−i(α+β)/2 β−α
= 2i e sen
2

−i(α+β)/2 α−β
= −2i e sen
2
Segue então que

ω2 − ω1
iφ
hϕ2 |U (t, t0 )|ϕ1 i = ie sen(2θ) sen (t − t0 ) e−i(ω1 +ω2 )(t−t0 )/2 (7.109)
2
Introduzindo a frequência de Rabi ΩR , como
ω2 − ω1 E2 − E 1
ΩR = =
2 2~
a qual ainda pode ser escrita como
1p 2
ΩR = ∆ + |W12 |2
~
e notando que
|W12 |2
sen2 (2θ) =
∆2 + |W12 |2
podemos escrever que:
hϕ2 |U (t, t0 )|ϕ1 i = ieiφ sen(2θ) sen (ΩR (t − t0 )) e−i(ω1 +ω2 )(t−t0 )/2 (7.110)
portanto a probabilidade é dada por

|W12 |2
P21 (t; ω) = 2 2
sen2 (ΩR t)
∆ + |W12 |

P21 (t; ω)
t
T 2T 3T 4T 5T 6T
7.13.3 Aproximação secular

Nesta aproximação voltamos nossa atenção as equações acopladas
dbn (t) X iωnk t
i~ = e Wnk (t)bk (t)
dt k
levando em conta que a perturbação é senoidal pode-se escrever

1
|Wif | eiωt − e−iωt

Wif (t) = |Wif | sen(ωt) =
2i
Como estamos tratando com um sistema de dois níveis, então temos
d 1 iωt
e − e−iωt |W11 |b1 (t)+

i~ b1 (t) =
dt 2i
− e−i(ω+ω12 )t |W12 |b2 (t)
i(ω−ω12 )t
e
d 1 i(ω+ω21 )t
− e−i(ω−ω21 )t |W21 |b1 (t)+

i~ b2 (t) = e
dt 2i
e − e−iωt |W22 |b2 (t)
iωt
Note que os termos proporcionais a e±i(ω−ω21 )t , oscilam lentamente quando ω ≈ ω21 enquanto os
termos proporcionais a e±iωt e e±i(ω+ω21 )t oscilam muito rapidamente.
Usando a aproximação secular, a qual consiste em negligenciar os termos que oscilam
rapidamente em detrimento daqueles que oscilam lentamente, em virtude disso os termos que
permanecem são chamados de termos “seculares”.
Note ainda que b1 (t) e b2 (t) variam muito pouco com o tempo. Portanto, nessa aproximação
a evolução temporal dos coeficientes b1 (t) e b2 (t) é dada por:
d 1
b1 (t) = − ei(ω−ω12 )t |W12 |b2 (t)
dt 2~
d 1 −i(ω−ω12 )t
b2 (t) = e |W21 |b1 (t)
dt 2~

7.14. Acoplamento com o contínuo
Esse conjunto de equações é desacoplado ao derivarmos novamente em relação ao tempo

cada equação. Esse procedimento resulta em
d2

1 i(ω−ω12 )t d
b1 (t) = − e |W12 | i(ω − ω12 )b2 (t) + b2 (t)
dt2 2~ dt
d2

1 −i(ω−ω12 )t d
b2 (t) = e |W21 | −i(ω − ω12 )b1 (t) + b1 (t)
dt2 2~ dt
Substituindo as expressões anteriores para as derivadas primeira nesse conjunto, ele toma a
seguinte forma:
d2 i(ω − ω12 ) i(ω−ω12 )t 1
2
b1 (t) = − e |W12 |b2 (t) − 2 |W12 |2 b1 (t)
dt 2~ 4~
d2 i(ω − ω12 ) −i(ω−ω12 )t 1
2
b2 (t) = − e |W21 |b1 (t) − 2 |W12 |2 b2 (t)
dt 2~ 4~
Usando a condição de ressonância, na qual ω ≈ ω12 , o conjunto de equações acopladas toma
a seguinte forma
d2 1
b1 (t) = − |W12 |2 b1 (t)
dt2 4~2
d2 1
b2 (t) = − |W12 |2 b2 (t)
dt2 4~2
Definindo,
|W12 |
ΩR = ,
2~
então a solução das equações diferenciais acima, com as condições iniciais
b1 (0) = 1 e b2 (0) = 0,
são respectivamente
b1 (t) = cos(ΩR t)
b2 (t) = B sen(ΩR t),
Agora é necessário determinar a constante B.

No regime de ressonância temos que
d 1
b2 (t) = |W21 |b1 (t)
dt 2~
1
BΩR cos(ΩR t) = |W21 | cos(ΩR t)
2~
|W21 |
B= B = 1.
2~ΩR
Portanto a probabilidade de encontrar o sistema no estado |ψ2 i (t) em um dado instante de
t na aproximação secular é dada por
P21 (t; ω = ω12 ) = sen2 (ΩR t).
7.14 Acoplamento com o contínuo

7.15. Integração sobre um contínuo de estados finais: Densidade de Estados
Estados:
|ϕf i • Estado inicial, discreto: |ϕi i
• Estado final, contínuo: |ϕf i
Energias:
|ϕi i
• Estado inicial, discreto: Ei
• Estado final, contínuo: Ef
Qual é a probabilidade de que no instante t,

encontremos o sistema no estado |ϕf i?
De acordo com os postulados da mecânica quântica | hϕf | ψ(t)i |2 é uma densidade de

probabilidade e devemos integrar, “somar”, as densidades de probabilidade | hϕf | ψ(t)i |2 sobre
um certo grupo de estado finais.
7.15 Integração sobre um contínuo de estados finais: Den-

sidade de Estados
Detector
pf
δΩf
Feixe incidente
W (r) θ
z
0
Alvo
Considere o espalhamento de uma partícula sem spin por um potencial W (r) cujos estados
|ψ(t)i da partícula num instante t, podem ser expandidos sobre os estados |pi de momenta p
bem definidos e energias
p2
E=
2m
e cujas funções de onda ψ(r) são dados por
3
1
ψ(r) = hr | pi = eip·r/~ .
2π~

7.16. Caso geral
A densidade de probabilidade associada a uma medida do momentum, em um dado instante

de tempo t é dada por
|hp | ψ(t)i|2 .
Aqui, consideramos que |ψ(t)i é normalizado.

O detector usado no experimento fornece um sinal quando uma partícula é espalhada com
momentum com momentum pf e energia Ef , dada por
p2f
Ef =
2m
Como o detector possuí uma abertura angular δΩf finita, ele seleciona um pequeno espectro
de energia no intervalo Ef ± δEf . Considerando que Df representa o domínio dos estados no
espaço-p definido por estas condições, então a probabilidade de obtermos um sinal do detector é
ˆ
δP(pf , t) = d3 p | hp | ψ(t)i |2
pf ∈Df
Temos que
dp
d3 p = p2 dpdΩ = ρ(E)dEdΩ =⇒ ρ(E) = p2
dE
√
mas temos ainda que, p = 2mE e que
p2 p
E= =⇒ dE = dp
2m m
Logo
dp m √
ρ(E) = p2 = p2 = mp = m 2mE
dE p
e desta forma, a probabilidade de obtermos um sinal do detector pode ser escrita como
ˆ
δP(pf , t) = ρ(E)dEdΩ | hp | ψ(t)i |2
Ω∈δΩf
E∈δδEf
7.16 Caso geral

Considere um espectro contínuo de H0 , tal que
H0 |αi = Eα |αi com hα | α0 i = δ(α − α0 )
Ao realizarmos uma medida, a probabilidade δ℘(αf , t) de encontrarmos o sistema em um

grupo de estados finais |αf i, caracterizados pelo domínio Df de valores do parâmetro α, centrados
em αf , é dada por ˆ
δ℘(αf , t) = dα| hα | ψ(t)i |2
α∈Df
Mudança de Variáveis

7.17. Regra de ouro de Fermi
Os estados serão caracterizados
• pelos autovalores de H0 , a energia E.
• pelo conjunto de parâmetros β, os quais são necessários quando H0 , por si só, não constituí
um conjunto completo de observáveis que comutam entre si.
Logo em termos de E e de β temos:
dα = ρ(β, E) dβ dE,
na qual ρ(β, E) é a densidade de estados finais. Portanto,

ˆ
δ℘(αf , t) = dβ dE ρ(β, E)| hβ, E | ψ(t)i |2 (7.111)
β∈δβf
E∈δEf
na qual δβf e δEf são respectivamente os intervalos de valores de β e E definidos pelo domínio
Df .
Aqui,
hψ(t) | ψ(t)i = 1.
d3 p = p2 dpdΩ = ρ(E)dEdΩ
7.17 Regra de ouro de Fermi

Aplicando (7.111) ao caso de uma perturbação senoidal, o resultado só será válido se os
estado finais pertencerem ao espectro contínuo de H0 .
Considerando uma perturbação W constante, temos que a probabilidade de transição é dada
por
2
|Wf,i |2

sen ωf,i t/2
℘if (t) = F (t; ωf,i ) com F (t; ωf,i ) =
~2 ωf,i /2
logo a densidade de probabilidade | hβ, E | ψ(t)i |2 em primeira ordem em W é

2 1 2 E − Ei
| hβ, E | ψ(t)i | = 2 | hβ, E|W |ϕi i | F t,
~ ~
na qual E e Ei são respectivamente as energias dos estados |β, Ei e |ϕi i.

Trocando a notação δ℘(αf , t) por δ℘(ϕi , αf , t), podemos escrever,
ˆ
1 2 E − Ei
δ℘(ϕi , αf , t) = 2 dβ dE ρ(β, E)| hβ, E|W |ϕi i | F t, (7.112)
~ ~
β∈δβf
E∈δEf

7.18. Função delta de Dirac
F (t,ωf i )
7.18 Função delta de Dirac

A função F (t; ωf,i ) varia rapidamente em torno de ωf,i = 0, ou seja, em torno de E = Ei , já
que ωf,i = (E − Ei )/~.
Se t for o suficientemente grande, esta função pode ser aproximada, a menos de um fator
constante, por um função δ(E − Ei ), pois

E − Ei
lim F (t; ωf,i ) = πtδ = 2π~tδ(E − Ei ) (7.113)
t→∞ 2~
Condições
• A função ρ(β, E)| hβ, E|W |ϕi i |2 geralmente varia muito lentamente com E.
• Consideraremos que t seja o suficientemente grande, para que a variação desta função no
intervalo de largura 4π~/t, centrado em E = Ei seja negligenciável.
Portanto, troncando F (t; ωf,i ) pela 2π~tδ(E − Ei ) na equação (7.112) a integração na energia
torna-se imediata.
7.19 Perturbação constante: condições

Se δβf for muito pequeno, a integração sobre β é desnecessária, e temos:
• Quando a energia Ei pertence ao domínio δEf

2π
δ℘(ϕi , αf , t) = δβf t| hβf , Ef = Ei |W |ϕi i |2 ρ(βf , Ef = Ei ) (7.114)
~
7.20. Regra de ouro de Fermi
• Quando a energia Ei não pertence a este domínio:
δ℘(ϕi , αf , t) = 0 (7.115)
Note que:
• Uma perturbação constante só pode induzir uma transição entre estados de mesma energia.
• O sistema deve ter a mesma energia no intervalo 2π~/t para o estado inicial e final.
• Por isso que se o domínio δEf excluir a energia Ei , a probabilidade de transição é nula.
7.20 Regra de ouro de Fermi

A probabilidade (7.114) cresce linearmente como o tempo. Consequentemente, a probabilidade
de transição por unidade de tempo, δW (ϕi , αf ), definida por
d
δW (ϕi , αf ) = δ℘(ϕi , αf , t) (7.116)
dt
é independente do tempo.
A densidade de probabilidade de transição por unidade de tempo e por intervalo unitário da
variável βf é:
δW (ϕi , αf )
w(ϕi , αf ) = (7.117)
δβf
Portanto temos que:
2π
w(ϕi , αf ) = | hβf , Ef = Ei |W |ϕi i |2 ρ(βf , Ef = Ei ) (7.118)
~
a qual é conhecida como regra de ouro de Fermi.
7.21 Perturbação Senoidal

Se W for uma perturbação senoidal que acopla o estado discreto |ϕi i com o estado |βf , Ef i
do contínuo com energia Ef próxima da energia Ei + ~ω, ou seja,
Ef ≈ Ei + ~ω.
Um procedimento similar ao da perturbação constante fornece:
2π
w(ϕi , αf ) = | hβf , Ef = Ei + ~ω|W |ϕi i |2 ρ(βf , Ef = Ei + ~ω) (7.119)
~

7.22. Exemplo
7.22 Exemplo
Considere o espalhamento de uma partícula sem spin por um potencial W cujos elementos
de matriz na representação |ri são:
hr|W |r0 i = W (r)δ(r − r0 )
Se o estado inicial do sistema possui um momentum bem definido pi , então:

3
1
|ψ(t = 0)i = |pi i , com hr | pi = eip·r/~
2π~
A probabilidade de espalhamento de uma partícula incidente de momentum pi em um grupo

de estado de momentum p em torno do valor pf , com |pi | = |pf |, é
2π
w(pi , pf ) =| hpf |W |pi i |2 ρ(Ef = Ei )
~
√
Para uma partícula livre vimos que ρ(Ef = Ei ) = m 2mEi , logo
6 ˆ 2
2π p 1 3 i(p −p )·r/~

w(pi , pf ) = m 2mEi d re i f W (r)
~ 2π~
No lado direito da expressão anterior temos a transformada de Fourier do potencial W (r),

calculada para os valores de p iguais a pi − pf .
Note que:
• O estado inicial escolhido |pi i não é normalizável e não pode representar o estado físico
de uma partícula.
• Apesar da norma de |pi i ser infinita, o lado direito de w(pi , pf ) tem um valor finito.
Se dividirmos a probabilidade obtida pela corrente de probabilidades:

3 3 r
1 ~ki 1 2Ei
Ji = =
2π~ m 2π~ m
obtemos ˆ 2
w(pi , pf ) m2 3 i(pi −pf )·r/~

= 2 4 d re W (r)
Ji 4π ~
que é a expressão para a seção de choque de espalhamento na aproximação de Born.

7.22. Exemplo

Capítulo 8
Decaimento de um estado discreto

acoplado ressonantemente a um contínuo
de estados finais
8.1 Introdução
Vimos que o acoplamento induzido por uma perturbação constante entre um estado inicial
discreto de energia Ei e um contínuo de estados finais (alguns dos quais têm uma energia igual
a Ei ) faz com que o sistema vá do estado inicial para esse continuo de estados finais. Mais
precisamente, a probabilidade de encontrar o sistema em um grupo bem definido de estados
do continuo no instante de tempo t aumenta linearmente com o tempo. Consequentemente, a
probabilidade Pii (t) de encontrar o sistema no estado inicial |ϕi i, no instante t deve diminuir
linearmente com o tempo a partir do valor Pii (0) = 1. É claro que este resultado é válido somente
intervalos de tempo curtos, uma vez que a extrapolação da diminuição linear de Pii (t) para
tempos longos levaria a valores negativos de Pii (t), o que é um absurdo para uma probabilidade.
Isto traz a tona o problema de determinar o comportamento do sistema após um longo tempo.
Encontramos um problema análogo quando estudamos as transições ressonantes induzida
por uma perturbação senoidal entre dois estados discretos |ϕi i e |ϕf i. A teoria de perturbação,
em primeira ordem, prevê uma diminuição de Pii (t) proporcional à t2 , a partir do valor inicial
de Pii (0) = 1. O método apresentado no complemento CXIII , mostra que o sistema realmente
oscila entre os estados |ϕi i e |ϕf i. A diminuição, com t2 encontrada pela teoria de perturbação
em primeira ordem, representa apenas o “início” da correspondente perturbação senoidal.
Poderíamos esperar encontrar um resultado análogo para o problema que iremos investigar
aqui, ou seja, as oscilações do sistema entre um estado discreto e o contínuo. Vamos mostrar
que este não é o caso: o sistema físico deixa o estado |ϕi i irreversivelmente. Encontraremos uma
diminuição exponencial e−Γt por Pii (t) (para os quais o tratamento de perturbativo dá apenas o
comportamento para tempos curto que é 1 − Γt). Portanto, a natureza contínua do conjunto
de estados finais faz com que a reversibilidade encontrada em complemento CXIII desapareça;
ela é responsável por uma deterioração do estado inicial, que adquire assim um tempo de vida
201
8.2. Descrição do modelo
finito (estado instável; complemento KIII ).

A situação prevista aqui é frequentemente encontrado na física. Por exemplo, um sistema,
inicialmente em um estado discreto, pode-se dividir, sob o efeito de um acoplamento interno
(descrito, por conseguinte, por um Hamiltoniano W independente do tempo), em duas partes
distintas cujas energias (cinética, no caso de partículas materiais e eletromagnéticos no caso
de fótons) pode ter, teoricamente, qualquer valor, o que dá ao conjunto de estados finais uma
natureza contínua. Assim, no decaimento α, um núcleo que está inicialmente em um estado
discreto é transformado (através do efeito de túnel) em um sistema composto de uma partícula
α e outro núcleo. Um átomo de muitos elétrons A, que está inicialmente em uma configuração
(conforme os complementos AXIV e BXIV ), no qual os elétrons estão excitados podem, sob o
efeito da interação eletrostática entre elétrons, dar origem a um sistema formado por um íon A+
e um elétron livre (a energia da configuração inicial deve, é claro, ser maior do que o limite de
ionização simples de A): este é o fenômeno “auto-ionização”. Podemos também citar a emissão
espontânea de um fóton por um estado atômico (ou nuclear) excitado: a interação do átomo
com o campo eletromagnético quantizado acopla o estado discreto inicial (o átomo excitado
na ausência de fótons) com um continuo de estados finais (o átomo em um estado inferior na
presença de um fóton de direção arbitrária, polarização, e energia). Finalmente, podemos citar
o efeito fotoelétrico, no qual uma perturbação, agora senoidal, acopla um estado discreto de um
átomo A a um continuo de estados finais (o íon A+ e os fotoelétrons e− ).
Estes poucos exemplos de estados instáveis tirados de vários domínios da física são suficientes
para indicar a importância do problema que está sendo tratado neste texto.
8.2 Descrição do modelo

Para simplificar os cálculos tanto quanto o possível, faremos uso das seguintes hipóteses
sobre o espectro do Hamiltoniano não perturbado H0 . Este espectro inclui
1. Estado inicial, discreto |ϕi i , de energia Ei não degenerado:
H0 |ϕi i = Ei |ϕi i (8.1)
2. Um conjunto de estados finais |αi os quais formam um contínuo:
H0 |αi = E |αi (8.2)
Aqui E pode tomar uma infinidade de valores continuamente, distribuídos sobre uma porção do
eixo real incluindo Ei . Iremos considerar que E varia no intervalo
0 ≤ E ≤ ∞, ou seja, E ≥ 0. (8.3)
Cada estado |αi é caracterizado por sua energia E e um conjunto de outros parâmetros
os quais denotaremos por β. Portanto, o estado |αi pode ser escrito na seguinte forma |β, Ei.
Temos então que
dα = ρ(β, E) dβ dE (8.4)

na qual ρ(β, E) é a densidade final de estados.

Os autoestados de H0 satisfazem as seguintes relações ortogonalidade e completeza:
hϕi | ϕj i = δi,j (8.5a)

hϕi | αi = 0 (8.5b)
hα | α0 i = δ(α − α0 ) (8.5c)
X ˆ
|ϕi ihϕi | + dα |αihα| = 1 (8.6)
i
8.2.1 Hipóteses sobre o acoplamento W

Consideramos que W não depende explicitamente do tempo e não tem elementos na diagonal:
hϕi |W |ϕi i = hα|W |αi = 0, (8.7)
se esses elementos diagonais não fossem zero, podíamos adicioná-los aos termos de H0 , o que
simplesmente mudaria o valor das energias não perturbadas). Similarmente iremos considerar
que W não pode acoplar dois estados discretos e nem dois estados do contínuo
hϕj |W |ϕi i = 0 e hα|W |α0 i = 0. (8.8)
Os únicos elementos não nulos de W são aqueles os quais conectam o estado discreto |ϕi i com os
estados do contínuo. Estes são os elementos hα|W |ϕi i, os quais são responsáveis pelo decaimento
do estado |ϕi i.
Antes de apresentarmos um novo método de resolver a equação de Schrödinger, apresentare-
mos os resultados da teoria de perturbação de primeira ordem.
8.2.2 Resultados da teoria de perturbação de primeira ordem

A probabilidade de encontrarmos o sistema físico no instante t, (inicialmente no estado |ϕi i),
em um estado final de energia arbitrária pertencendo ao grupo de estados finais caracterizados
pelo intervalo δβf em torno do valor βf .
A probabilidade de encontrarmos o sistema em um estado final qualquer |αi: aqui nem β e
nem E foram especificados. Devemos portanto integrar a expressão (7.118) com relação a β, a
qual fornece a densidade de probabilidade (na expressão (7.118) a integração sobre a energia já
foi realizada). Portanto, introduzimos a constante
ˆ ˆ
2π
Γ= dβ w(ϕi , β, E = Ei ) = dβ |hβ, E = Ei |W |ϕi i|2 ρ(β, E = Ei ) (8.9)
~
A probabilidade desejada é igual a Γt. Com as hipóteses iniciais, essa constante representa
probabilidade do sistema ter deixado o estado inicial |ϕi i no instante t. Chamando de Pii (t) a
probabilidade de que no instante t o sistema ainda esteja no estado |ϕi i, temos então que:
Pii (t) = 1 − Γt (8.10)
Devemos lembrar que a expressão (8.10) é válida se:

[i)]

1. A expressão (8.10) resulta da teoria de perturbação de primeira ordem a qual é válida

somente se Pii (t) diferir suavemente do seu valor inicial Pii (0) = 1. Então devemos ter que
1
t . (8.11)
Γ
2. Além disso, a expressão (8.10) somente para tempos o suficientemente longos.
Para declararmos a segunda condição em uma forma mais precisa, e para vermos, em particular,
se ela é compatível com (8.11), retornamos a expressão (7.112), na qual E e β não estão
vinculados a variar somente dentro do intervalo δβf e δEf . Procedendo conforme na seção 7.17,
integramos a densidade de probabilidade que aparece em (8.11), primeiro sobre β e depois sobre
E. Ao fazermos isso, surge a seguinte integral:
ˆ∞
1 E − Ei
dE F t, K(E) (8.12)
~2 ~
0
na qual K(E), o qual resulta da primeira integração em β, é dado por:

ˆ
K(E) = dβ |hβ, E|W |ϕi i|2 ρ(β, E) (8.13)
e com 2
E − Ei sen(ωt/2)
F t, = F (t, ω) = (8.14)
~ ω/2
a qual é a função de difração, com ω = (E − Ei )/~, centrada em E = Ei e de largura 4π~/t.
Seja ~∆ a largura de K(E): ~∆ representa então a ordem de magnitude da variação de E
necessária para K(E) mudar significantemente, conforme a figura ??. Logo para tempos t o
suficientemente grande tal que:
1
t (8.15)
∆
a função F (t, (E − Ei )/~) comporta-se como um função delta, com relação a função K(E).
Usando a relação (7.113) podemos escrever (8.12) na seguinte forma:
ˆ∞
2π 2πt
t dE δ (E − Ei ) K(E) = K(E = Ei ) = Γt, (8.16)
~ ~
0
desde que comparando (8.9) com (8.13), podemos ver facilmente que:
2π
K(E = Ei ) = Γ (8.17)
~
Novamente encontramos que o decréscimo linear que surge em (8.10) é válido somente se t
for grande o suficiente para satisfazer (8.15).
As condições (8.11) e (8.15), obviamente, são compatíveis somente se
∆ Γ. (8.18)
No que segue, iremos considerar que a condição (8.18) é satisfeita.

Pif (t,ω)
4π
∆ω = t
~∆
K(E)
F (t, E−E
~
i
)
Ei E
Figura 8.1: Na figura mostramos a variação da função K(E) e F (t, (E − Ei )/~) com relação a E. As
respectivas larguras das duas curvas são mostradas, sendo da ordem de ~∆ e 4π~/t. Para tempos t o
suficientemente longos, a função F (t, (E − Ei )/~) se comporta como um função delta, com relação a
função K(E).
8.2.3 Equação Integro-diferencial equivalente à Equação de Schrödin-

ger
O estado do sistema no instante t pode ser expandido na base {|ϕi i , |αi} da seguinte forma
X ˆ
|ψ(t)i = Cn (t) |ϕn i + dα C(α, t) |αi , (8.19)
n
considerando que esses coeficientes não variam muito com o tempo, podemos escrever
Cn (t) = bn (t)e−iEn t/~ e C(α, t) = b(α, t)e−iEt/~ ,
assim o estado do sistema em um dado instante t é dado por

X ˆ
−iEn t/~
|ψ(t)i = bn (t)e |ϕn i + dα b(α, t)e−iEt/~ |αi . (8.20)
n
Substituindo essa expressão na equação de Schrödinger, obtemos que

X d ˆ
−iEn t/~ d
i~ bn (t)e |ϕn i + i~ dα b(α, t)e−iEt/~ |αi =
dt dt
n
X ˆ
−iEn t/~
bn (t)e W |ϕn i + dα b(α, t)e−iEt/~ W |αi . (8.21)
n

Projetando essa equação no estado |ϕi i e levando em conta como a perturbação W , acopla os
estados encontramos que
ˆ
d
i~ bi (t) = dα b(α, t)e−i(E−Ei )t/~ hϕi |W |αi . (8.22)
dt
Projetando a equação (8.21) no estado |α0 i e levando em conta como a perturbação W ,

acopla os estados encontramos que:
d
i~ b(α, t) = bi (t)ei(E−Ei )t/~ hα|W |ϕi i . (8.23)
dt
O problema em questão, consiste em usar rigorosamente as equações (8.22) e (8.23) para
predizer como será o comportamento do sistema após um longo intervalo de tempo t, levando
em conta as seguintes condições iniciais
bi (0) = 1 e b(α, 0) = 0. (8.24)
As hipóteses simplificadoras para o acoplamento W , implicam que o termo dbi (t)/dt depende
somente de b(α, t) e por sua vez o termo db(α, t)/dt depende somente de bi (t). Portanto, podemos
integrar a equação (8.22) levando em conta as condições iniciais (8.24), obtendo assim que
ˆ t ˆ
1 0 0
bi (t) = 1 + dt dα b(α, t0 )e−i(E−Ei )t /~ hϕi |W |αi , (8.25)
i~ 0
e ao integrar a equação (8.23) levando em conta as condições iniciais (8.24) têm-se que
ˆ t
1 0
b(α, t) = dt0 bi (t0 )ei(E−Ei )t /~ hα|W |ϕi i . (8.26)
i~ 0
Substituindo (8.26) na equação (8.22), têm-se que

ˆ ˆ t
d 1 0
bi (t) = dα dt0 e−i(E−Ei )(t−t )/~ |hα|W |ϕi i|2 bi (t0 ). (8.27)
dt (i~)2 0
Já ao substituir a equação (8.25) na equação (8.23), têm-se que

ˆ ˆ t
d 1 1 0
b(α, t) = ei(E−Ei )t/~ hα|W |ϕi i + dα dt0 ei(E−Ei )(t−t )/~ |hϕi |W |αi|2 b(α, t0 )
dt i~ (i~)2 0
(8.28)
Temos agora dois conjuntos de equações integro-diferenciais desacopladas para os coeficientes
bi (t) e b(α, t). Porém antes de avançar um pouco mais, vamos reescrever estas duas equações
em termos dos seguintes parâmetros
dα = dβ dE com |αi = |β, Ei ,
e usando a seguinte definição

ˆ
K(E) = dβ | hβ, E|W |ϕi i |2 ρ(β, E), (8.29)

8.3. Aproximação para tempos curtos: Relação com a teoria de perturbação em primeira ordem
a equação (8.27) pode ser reescrita como

ˆ ∞ ˆ t
d 1 0
bi (t) = − 2 dE dt0 K(E)e−i(E−Ei )(t−t )/~ bi (t0 ) (8.30)
dt ~ 0 0
Note que a equação (8.30) envolve somente os coeficientes bi (t), entretanto, ela não é mais
uma equação diferencial, mas sim uma equação integro-diferencial. Nesse caso, temos que o
termo dbi (t)/dt depende inteiramente da “história do sistema”, entre os instantes 0 e t.
A equação (8.30) é rigorosamente equivalente a equação de Schrödinger, entretanto, não
sabemos resolvê-la exatamente. A seguir serão apresentadas duas soluções aproximadas para
essa equação, sendo a primeira equivalente a teoria de perturbação em primeira ordem. Já a
segunda solução, permitirá que se investigue de forma satisfatória o comportamento do sistema
para intervalos de tempos longos.
8.3 Aproximação para tempos curtos: Relação com a teo-

ria de perturbação em primeira ordem
Para tempos curtos, isto é, se bi (t) não for muito diferente de bi (0) = 1, pode-se trocar bi (t0 )
por bi (0) = 1 no lado direito de (8.30), o que a reduz a seguinte forma
ˆ ∞ ˆ t
d 1 0
bi (t) = − 2 dE K(E) dt0 e−i(E−Ei )(t−t )/~ , (8.31)
dt ~ 0 0
cuja integração temporal não apresenta dificuldades. Introduzindo o fator Γ definido por
ˆ
2π 2π
Γ= dβ | hβ, E = Ei |W |ϕi i |2 ρ(β, E = Ei ) = K(E = Ei ) (8.32)
~ ~
e usando a relação
ˆ +∞ ˆ ∞
ikx ik(x+i) i 1
dk θ(k)e = lim+ dk e = lim+ = iP + πδ(x) (8.33)
−∞ →0 0 →0 x + i x
pode-se escrever
ˆ t
0 −i(E−Ei )τ /~ 1
lim dt e dτ = ~πδ (Ei − E) + iP . (8.34)
t→∞ 0 Ei − E
Para escrever este resultado fez-se a seguinte transformação τ = t − t0 .

Realmente não é necessário fazermos t se aproximar de infinito para usarmos a equação
(8.34), no cálculo de (8.31). Em (8.31) é o suficiente que ~/t seja muito menor que a “largura”
~∆ de K(E), isto é, que t seja muito maior que 1/∆, conforme ilustra a Fig. (??). Novamente,
encontramos a condição de validade t 1/∆, da teoria de perturbação em primeira ordem.
Se essa condição for satisfeita, podemos usar (8.34) para escrever a equação (8.31) na seguinte
forma: ˆ ∞
d π i K(E)
bi (t) = − K(E = Ei ) − P dE. (8.35)
dt ~ ~ 0 Ei − E

8.4. Segunda aproximação para resolver a equação de Schrödinger
De acordo com (8.32) o primeiro termo de (8.35) é dado por −Γ/2. Fazendo
ˆ ∞
K(E)
δE = P dE (8.36)
0 Ei − E
então pode-se reescrever a equação (8.35) na seguinte forma
d 1 δE
bi (t) = − Γ − i . (8.37)
dt 2 ~
Ao integrarmos essa equação, usando a condição de que bi (0) = 1, encontra-se que

1 δE
bi (t) = 1 − Γ+i t. (8.38)
2 ~
Obviamente, que esse resultado só é válido se |bi (t)| diferir muito pouco de 1, isto é, se:
1 ~
t e t (8.39)
Γ δE
Essa é uma outra condição de validade, para a teoria de perturbação em primeira ordem.
Usando a expressão (8.38) pode-se calcular facilmente a probabilidade Pii (t) = |bi (t)|2 de
que o sistema ainda esteja no estado |ϕi i no instante t. Se neglicenciarmos os termos da ordem
de Γ2 e (δE)2 , essa probabilidade pode ser escrita como
Pii (t) = 1 − Γt. (8.40)
Todos os resultado obtidos anteriormente para a teoria de perturbação dependente do tempo

em primeira ordem, podem ser obtidos a partir da equação (8.30), na qual troca-se bi (t0 ) por
bi (0) = 1. Essa equação nos permiti incluir o parâmetro δE, cujo significado será discutido
posteriormente.
8.4 Segunda aproximação para resolver a equação de Schrö-

dinger
Uma aproximação melhor do que a anterior, consiste em trocar bi (t0 ) por bi (t), em vez de
bi (0), em (8.30), o que resulta em
ˆ ∞ ˆ t
d bi (t) 0
bi (t) = − 2 dE dt0 K(E)e−i(E−Ei )(t−t )/~ (8.41)
dt ~ 0 0
da qual obtém-se a seguinte função g(Ei , t − t0 ) de Ei e de t − t0 :

ˆ
0 1 ∞ 0
g(Ei , t − t ) = − 2 dE K(E)ei(Ei −E)(t−t )/~ (8.42)
~ 0
a qual é claramente diferente de zero somente se t − t0 for muito pequeno. Em (8.42), está se
integrando sobre E o produto de K(E), a qual varia lentamente com E (conforme Fig. (??)),
com uma exponencial cujo período com relação a variável E é 2π~/(t − t0 ). Se escolhermos
valores para t e t0 tais que esse período seja muito menor do que a largura ~∆ de K(E), o

8.4. Segunda aproximação para resolver a equação de Schrödinger
produto dessas funções irá sofrer uma grande número de oscilações quando E for variada, e nesse
caso, a sua integral sobre E será negligenciável. Consequentemente, o módulo de g(Ei , t − t0 ) é
grande para t − t0 ≈ 0 e torna-se negligenciável tão rápido quanto t − t0 1/∆. Essa propriedade
significa que, para todo t, os únicos valores de bi (t0 ) que contribuem significantemente no lado
direito de (8.30) são aqueles os quais correspondem a um t0 muito próximo de t (t − t0 1/∆).
De fato, uma vez que a integração sobre E tenha sido realizada, este lado direito torna-se
ˆ t
d
bi (t) = dt0 g(Ei , t − t0 )bi (t0 ), (8.43)
dt 0
e vê-se que a presença do termo g(Ei , t − t0 ) praticamente elimina a contribuição de bi (t0 ) tão
rápido quanto t − t0 1/∆.
Portanto, a derivada dbi (t)/dt no instante t tem somente uma curta memória dos valores
prévios de bi (t) entre os instante 0 e t. Realmente ela só depende dos valores de bi (t) no instante
t imediatamente antes, isso é verdade para todos os instantes t. Essa propriedade permite que
essa equação integro-diferencial seja transformada em uma equação diferencial. Se bi (t) variar
muito pouco sobre um intervalo de tempo da ordem de 1/∆, o erro cometido ao trocar bi (t0 )
por bi (t) em (8.43) será pequeno. Esse procedimento resulta em:
ˆ t
d 0 0 1 δE
bi (t) = bi (t) dt g(Ei , t − t ) = − Γ+i bi (t) (8.44)
dt 0 2 ~
conforme o resultado da equação (8.37).

De acordo com os resultados da seção anterior, a escala temporal característica da evolução
de bi (t) é da ordem de 1/Γ ou δE/~. A condição de validade de (8.43) é então
δE
Γ∆ e ∆, (8.45)
~
a qual já foi considerada como sendo satisfeita.
Para obter uma melhor aproximação, para todos os tempos t, integra-se a equação (8.44), a
qual é dada por
ˆ bi (t) ˆ t
dbi 0 1 δE
= dt − Γ−i ,
1 bi 0 2 ~
com a condição inicial bi (0) = 1, o que resulta em
bi (t) = e−Γt/2 e−iδEt/~ (8.46)
A expansão em série Taylor no parâmetro complexo que multiplica o tempo na equação (8.46),
fornece em primeira ordem, nesse parâmetro, o mesmo resultado fornecido por (8.38).
Note que não foi imposto nenhum limite superior ao tempo t. Porém a integral
ˆ t
0 0 1 δE
dt g(Ei , t − t ) = − Γ+i ,
0 2 ~
a qual surge em (8.44), possui esse valor somente se t 1/∆, com foi mostrado na seção
anterior. Para tempos muito curtos, a teoria apresentada nessa seção está submetida as mesmas

8.5. Análise dos resultados
limitações da teoria de perturbação; porém, ela possui a grande vantagem de ser válida para
tempos longos.
Agora ao substituir a expressão (8.46) na equação (8.26), obtém-se que
ˆ
1 t 0 i(E−Ei +i~Γ/2−δE)t0 /~
b(α, t) = dt e hα|W |ϕi i
i~ 0
ˆ
hα|W |ϕi i t 0 i(E−Ei +i~Γ/2−δE)t0 /~
= dt e (8.47)
i~ 0
a qual é uma expressão muito simples para a amplitude de probabilidade b(α, t). Após a
integração de (8.47), têm-se que
hα|W |ϕi i 1 − e−Γt/2 ei(E−Ei −δE)t/~

b(α, t) = · (8.48)
i~ (E − Ei − δE)/~ + iΓ/2
As equações (8.46) e (8.48), respectivamente descrevem o decaimento do estado inicial e o

preenchimento do estado final |αi = |β, Ei. Na próxima seção será investigado o conteúdo físico
dessas duas equações com mais detalhes.
8.5 Análise dos resultados
8.5.1 Tempo de vida do estado discreto

Conforme a equação (8.46), temos então que a probabilidade da permanecer em se estado
inicial é dada por
Pii (t) = |bi (t)|2 = e−Γt (8.49)
Pii (t)
1
1/e
τ = 1/Γ t
Figura 8.2: Gráfico da taxa de decaimento, ou seja, da probabilidade do estado inicial não decair, ou
seja, não transicionar para um outro estado.

8.6. O deslocamento discreto do estado devido ao acoplamento com o contínuo
Na figura 8.2 temos a variação da probabilidade de encontrarmos o sistema no estado discreto

|ϕi i no instante t, em função do tempo. O resultado obtido, foi um decréscimo exponencial,
e−Γt para o qual a regra de Ouro de Fermi fornece a tangente na origem.
Portanto, Pii (t) decresce irreversivelmente, iniciando com Pii (0) = 1 e se aproxima de zero
quando o tempo vai infinito, ou seja, Pii (t → ∞) → 0. Então dizemos que o estado inicial
discreto possui um “tempo de vida” t finito; aqui τ é uma constante característica do decaimento
exponencial, dada por
τ = 1/Γ. (8.50)
Esse comportamento irreversível, contrasta muito com a oscilação do sistema (a fórmula de

Rabi) entre dois estados discretos quando eles são submetidos a uma perturbação ressonante
acoplando esses dois estados.
8.6 O deslocamento discreto do estado devido ao acopla-

mento com o contínuo
Ao retornarmos a notação original, reescrevendo os coeficientes Ci (t) em termos dos coefici-
entes bi (t), assim têm-se que
Ci (t) = e−Γt/2 e−i(Ei +δE)t/~ . (8.51)
Deve-se notar que na ausência do acoplamento W , o coeficiente
Ci (t) = e−Γt/2 e−iEi t/~ . (8.52)
Portanto, além do decaimento exponencial, e−Γt/2 , o acoplamento com o contínuo é responsável

por um deslocamento da energia do estado discreto, a qual vai de Ei para Ei + δE. Essa é a
interpretação da quantidade δE, introduzida anteriormente.
Agora será analisada a expressão (8.36) para δE. Ao Substituir a definição (8.29) de K(E)
em (8.36), resulta em
ˆ ∞ ˆ
dE
δE = P dβ | hβ, E|W |ϕi i |2 ρ(β, E) (8.53)
0 Ei − E
ou se usarmos o fato de que dα = ρ(β, E)dβdE e trocarmos o bra hβ, E| pelo bra α, pode-se
escrever ˆ ∞
| hα|W |ϕi i |2
δE = P dα. (8.54)
0 Ei − E
A contribuição para essa integral, de um estado |αi qualquer do contínuo, para o qual E 6= Ei
é:
| hα|W |ϕi i |2
(8.55)
Ei − E
A equação (8.55) apresenta uma expressão cuja forma é similar a que surge da teoria de
perturbação estacionária. A equação (8.55) representa o deslocamento em energia do estado |ϕi i
devido ao acoplamento com o estado |αi do contínuo, em segunda ordem em W . Por sua vez,

8.7. Distribuição de energia dos estados finais
δE é simplesmente a soma dos deslocamentos dos vários estados |αi do contínuo. Pode-se pensar
que irá surgir um problema para os estados |αi do contínuo, para os quais E = Ei : Realmente
a presença em (8.54) da parte principal P implica que as contribuições dos estados |αi situados
imediatamente acima do estado |ϕi i, compensa aquela dos estados situados imediatamente
abaixo.
Sem síntese temos:
1. O acoplamento do estado |ϕi i com o estado |αi de mesma energia é o responsável pelo
tempo de vida finito do estado |ϕi i, devido a função δ(E − Ei ) que surge em (8.34).
2. acoplamento do estado |ϕi i com o estado |αi de diferentes energias é o responsável por
um deslocamento na energia do estado |ϕi i. Este deslocamento pode ser calculado por
uma teoria de perturbação estacionária.
No caso particular da emissão de um fóton por um átomo, δE, representa o deslocamento do

nível atômico em questão devido ao acoplamento com o contínuo de estados finais (um átomo
em um outro estado discreto, na presença de um fóton). A diferença entre os deslocamentos de
energia δE dos estados 2S1/2 e 2p1/2 do átomo de hidrogênio é conhecido como “Lamb-Shift”.
8.7 Distribuição de energia dos estados finais

Uma vez que o estado discreto decai, isto é, quando t 1/Γ, o estado final do sistema pertence
ao contínuo de estados |αi. É interessante investigarmos o comportamento da distribuição de
energia dos estados finais. Por exemplo, na emissão espontânea de um fóton por um átomo, essa
distribuição de energia é aquela de um fóton emitido quando o átomo decai do estado excitado
para um nível de mais baixa energia (a largura natural da linha espectral).
Quando t 1/Γ, a exponencial que aparece no numerador de (8.48) é praticamente zero.
Nesse caso, têm-se então que
∼ 1
|b(α, t)|2 | hα|W |ϕi i |2 · (8.56)
t 1/Γ (E − Ei − δE)2 + ~2 Γ2 /4
aqui |b(α, t)|2 representa uma densidade de probabilidade. A probabilidade de encontrar o

sistema após o decaimento, em um estado qualquer de um grupo de estados finais caracterizados
pelo intervalo dβf e dEf em torno de βf e Ef , pode ser calculada diretamente da expressão
(8.56):
1
dP(βf , Ef , t) = |hβf , Ef |W |ϕi i|2 ρ(βf , Ef ) · dβf , dEf , (8.57)
(Ef − Ei − δE)2 + ~2 Γ2 /4
como a dependência em Ef da densidade de probabilidade é
dP(βf , Ef , t) 1
= |hβf , Ef |W |ϕi i|2 · ρ(βf , Ef ). (8.58)
dβf , dEf (Ef − Ei − δE)2 + ~2 Γ2 /4

Desde que |hβf , Ef |W |ϕi i|2 ρ(βf , Ef ) permanece praticamente constante quando Ef varia sobre
um intervalo da ordem de ~Γ, a variação da densidade de probabilidade com relação a Ef é
essencialmente determinada pela função (a lorentziana):
1
(8.59)
(Ef − Ei − δE)2 + ~2 Γ2 /4
e consequentemente, tem a forma mostrada na figura 8.3 a seguir.
dP(βf ,Ef ,t)

dβf ,dEf
~
~Γ = τ
Ei + δE Ef
Figura 8.3: Forma lorentziana, da distribuição de energia dos estados finais do sistema após o seu
decaimento de um estado discreto.
A figura 8.3 mostra a forma da distribuição de energia dos estados finais obtida pelo sistema
após o seu decaimento de um estado discreto. O resultado obtido, foi uma distribuição lorentziana
centrada em Ei + δE (a energia do estado discreto corrigida pelo deslocamento de energia δE,
devido ao acoplamento com o contínuo). Então, têm-se um tempo de vida curto para o estado
discreto, e uma larga distribuição de energia (uma relação de incerteza energia-tempo).
A distribuição de energia (8.59) dos estados finais, possui um máximo em Ef = Ei + δE,
isto é, quando a energia do estado final é igual aquela do estado inicial |ϕi i, corrigida pelo
deslocamento de energia δE.
A forma da distribuição é a de uma lorentziana de largura ~Γ, chamada “largura natural”
do estado |ϕi i. Portanto, surge uma dispersão na energia dos estado finais. A largura ~Γ (isto
é, o tempo de vida curto τ = 1/Γ do estado discreto), significa uma grande dispersão. Mais
precisamente
~
∆Ef = ~Γ = . (8.60)
τ
Note novamente a analogia entre a expressão (8.60) e a relação de incerteza energia-tempo.
Na presença do acoplamento W , o estado |ϕi i pode ser observado somente durante um tempo
finito, da ordem do seu tempo de vida τ . Quando desejamos determinar sua energia, medindo
aquela do estado final do sistema, a incerteza ∆E do resultado não pode ser menor do que ~/τ .


Capítulo 9
Quantização do Campo Eletromagnético
9.1 Introdução
Aqui as equações de Maxwell serão usadas no sistema internacional de unidades SI para
descrever o campo eletromagnético.
9.2 Equações de Maxwell

As equações de Maxwell no sistema MKSA (SI), são constituídas por quatro equações
diferenciais parciais de primeira ordem que relacionam as diversas componentes do campo
elétrico E(r, t) e do campo magnético B(r, t) com a densidade de cargas livres ρ(r, t) e a
densidade de corrente j(r, t) e são dadas por:
∇ · D(r, t) = ρ(r, t) Lei de Gauss (9.1a)
∂D(r, t)
∇ × H(r, t) = j(r, t) + Lei de Ampère-Maxwell (9.1b)
∂t
∂B(r, t)
∇ × E(r, t) = − Lei de Faraday (9.1c)
∂t
∇ · B(r, t) = 0 Ausência de pólos magnéticos livres (9.1d)
na qual para um meio material não dispersivo, as relações constitutivas são
1
D(r, t) = E(r, t) e B(r, t) = µH(r, t) e c= √
0 µ0
= (1 + χ)0 = κ0 e µ = (1 + χm )µ0 = κm µ0 .
215
9.2. Equações de Maxwell
Estas equações formam a base de todos os fenômenos eletromagnéticos clássicos. Combinadas

com a equação da força de Lorentz que descreve o movimento de uma partícula de massa mα e
carga qα , posição rα (t) e velocidade vα (t) em um campo eletromagnético,
d2
Fα = m rα (t) = qα [E(rα (t), t) + vα (t) × B(rα (t), t)] . (9.2)
dt2
e com a segunda lei de Newton, elas fornecem a descrição completa da dinâmica clássica da
interação de partículas carregadas e dos campos eletromagnéticos. Note que a equação (9.2) só
é válida para partículas lentas, ou seja, partículas não relativísticas (vα c).
A partir de (9.1a) e de (9.1b) pode-se mostrar que
∂
ρ(r, t) + ∇ · j(r, t) = 0. (9.3)
∂t
Essa equação, conhecida como equação da continuidade, expressa a conservação global da carga
elétrica ˆ
Q= d3 r ρ(r, t). (9.4)
As expressões de ρ(r, t) e de j(r, t) como uma função das variáveis das partículas são

ρ(r, t) = P q δ [r − r (t)]
α α α
P (9.5)
α qα vα (t)δ [r − rα (t)]
j(r, t) =
Pode-se mostrar que as equações (9.5) satisfazem a equação da continuidade (9.3).

As equações (9.1) e (9.2) formam dois conjuntos de equações acopladas. A evolução dos
campos dependem das partículas por meio das densidades de carga ρ(r, t) e de corrente j(r, t)
respectivamente. O movimento das partículas dependem dos campos E(r, t) e B(r, t). As
equações (9.1) são equações diferenciais parciais de primeira ordem, enquanto as equações (9.2)
são equações diferenciais ordinárias de segunda ordem. Segue então que o estado global do
sistema partícula mais campo, é determinado em um dado instante t0 , fornecendo-se os campos
E(r, t0 ) e B(r, t0 ) em todos os pontos r do espaço e a posição rα (t) e velocidade vα (t) de cada
partícula rotulada pelo índice α, ou seja,
{E(r, t0 ), B(r, t0 ), rα (t), vα (t)}.
É importante notar que nas equações de Maxwell (9.1), r não é uma variável dinâmica como
rα (t), mas um parâmetro contínuo que rotula as variáveis do campo no espaço.
As equações de Maxwell (9.1) só podem ser resolvidas na forma em que estão escritas em
situações simples. Muitas vezes é conveniente introduzir potenciais, obtendo um número menor
de equações de segunda ordem, satisfazendo identicamente a algumas das equações de Maxwell.
Já estamos familiarizados com este conceito na eletrostática e na magnetostática, onde usamos
o potencial escalar ϕ(r, t) e o potencial vetor A(r, t).

9.3. Potenciais vetor e escalar – Invariância de calibre
9.3 Potenciais vetor e escalar – Invariância de calibre

Uma vez que ∇ · B(r, t) = 0, podemos definir B(r, t) em termos de um potencial vetor
A(r, t), da seguinte forma:
B(r, t) = ∇ × A(r, t) (9.6)
Então a lei de Faraday, equação (9.1c), pode ser reescrita como

∂A(r, t)
∇ × E(r, t) + = 0. (9.7)
∂t
Isto significa que a grandeza irrotacional em (9.7) pode ser escrita como o gradiente de uma
função escalar, a saber, o potencial escalar φ(r, t):
∂A(r, t) ∂A(r, t)
E(r, t) + = −∇φ(r, t) ou E(r, t) = −∇φ(r, t) − (9.8)
∂t ∂t
A definição de B(r, t) e de E(r, t) em termos dos potenciais A(r, t) e φ(r, t), de acordo com (9.6)
e (9.8), satisfaz identicamente ás duas equações homogêneas de Maxwell. O comportamento
dinâmico de A(r, t) e de φ(r, t) será determinado pelas duas equações não-homogêneas em (9.1).
Como D(r, t) = E(r, t) então

∂A(r, t) ∂A(r, t)
D(r, t) = −∇φ(r, t) − = − ∇φ(r, t) + , (9.9)
∂t ∂t
desta forma podemos reescrever a lei de Gauss da seguinte forma:
∂ 1
∇2 φ(r, t) + [∇ · A(r, t)] = − ρ(r, t). (9.10)
∂t
Agora iremos reescrever a lei de Ampère-Maxwell usando a eq. (9.8) e o fato de que
H(r, t) = µ1 B(r, t) = µ1 ∇ × A(r, t), desta forma,

∂ ∂A(r, t)
∇ × [∇ × A(r, t)] = µj(r, t) + µ −∇φ(r, t) − (9.11)
∂t ∂t
mas como, ∇ × (∇ × A) = ∇ (∇ · A) − ∇2 A, então
∂ 2 A(r, t)

2 ∂φ(r, t)
∇ A(r, t) − µ − ∇ ∇ · A(r, t) + µ = −µj(r, t) (9.12)
∂t2 ∂t
Agora reduzimos o conjunto das quatro equações de Maxwell a duas equações, as quais
podem ser escritas como
∂ 1
∇2 φ(r, t) + [∇ · A(r, t)] = − ρ(r, t) (9.13a)
∂t
2

∂ A(r, t) ∂φ(r, t)
∇2 A(r, t) − µ − ∇ ∇ · A(r, t) + µ = −µj(r, t) (9.13b)
∂t2 ∂t
Estas equações ainda estão correlacionadas. O desacoplamento de ambas pode ser realizado
explorando o fato da arbitrariedade que está implícita na definição dos potenciais vetor e escalar.
Uma vez que B está definido pela eq. (9.6) em termos de A(r, t), o potencial vetor é arbitrário

9.4. Transformações de Calibre
a menos do gradiente de uma função escalar χ(r, t), que lhe pode ser adicionado sem alterar a
forma de B(r, t). Então B(r, t) fica invariante sob a seguinte transformação de calibre (calibre)
A(r, t) −→ A0 (r, t) = A(r, t) + ∇χ(r, t) (9.14)

Para que o campo elétrico (9.8) permaneça também invariante, o potencial escalar φ(r, t)
deve ser simultaneamente transformado de acordo com
∂χ(r, t)
φ(r, t) −→ φ0 (r, t) = φ(r, t) − . (9.15)
∂t
A liberdade envolvida em (9.14) e em (9.15) significa que podemos escolher um conjunto de
potenciais {A0 (r, t), φ0 (r, t)} de tal modo que as equações (9.10) e (9.12) se desacoplem, e para
que isto ocorra devemos ter que
∂φ0 (r, t) ∂φ(r, t)
∇ · A0 (r, t) + µ = ∇ · A(r, t) + µ = 0. (9.16)
∂t ∂t
o que nos leva a condição extra
∂ 2 χ(r, t)
∇2 χ(r, t) − µ = 0. (9.17)
∂t2
Com isto, o par de equações (9.10) e (9.12) fica desacoplado e se têm duas equações de onda
não-homogêneas, uma para φ(r, t) e outra A(r, t):
∂ 2 φ(r, t) 1
∇2 φ(r, t) − µ 2
= − ρ(r, t) (9.18)
∂t
∂ 2 A(r, t)
∇2 A(r, t) − µ = −µj(r, t) (9.19)
∂t2
As equações (9.18) e (9.19), juntamente com a eq. (9.16), formam um conjunto de equações
equivalentes, sob todos os pontos de vista, às equações de Maxwell.
9.4 Transformações de Calibre

As transformações (9.18) e (9.19) são denominadas transformações de calibre (gauge) e a
invariância sob estas transformações é a invariância de calibre (gauge). A relação (9.16) entre
A(r, t) e φ(r, t) é denominada condição de Lorentz. Para ver que é sempre possível determinar
potenciais que satisfaçam à condição de Lorentz, suponhamos que os potenciais A(r, t) e φ(r, t)
satisfazem a (9.10) e a (9.12) mas não à equação (9.16). Façamos então uma transformação
de calibre para os potenciais A0 (r, t) e φ0 (r, t) e coloquemos a condição de A0 (r, t) e φ0 (r, t)
satisfazendo a condição de Lorentz:
∂φ0 (r, t) ∂φ(r, t) ∂ 2 χ(r, t)
∇ · A0 (r, t) + µ = ∇ · A(r, t) + µ + ∇2 χ(r, t) − µ =0 (9.20)
∂t ∂t ∂t2
Assim, desde que se possa encontrar uma função de calibre χ(r, t) satisfazendo à equação
∂ 2 χ(r, t)

2 ∂φ(r, t)
∇ χ(r, t) − µ = − ∇ · A(r, t) + µ (9.21)
∂t2 ∂t

os novos potenciais A0 (r, t) e φ0 (r, t) satisfarão à condição de Lorentz e também às equações de

onda (9.18) e (9.19).
Mesmo para os potenciais que satisfazem à condição de Lorentz (9.16), ainda persiste um
grau de arbitrariedade. Evidentemente, a transformação de calibre restrita


 A(r, t) −→ A0 (r, t) = A(r, t) + ∇χ(r, t)

(9.22)
 ∂χ(r, t)
−→ φ0 (r, t) = φ(r, t) −

 φ(r, t)
∂t
onde
∂ 2 χ(r, t)
∇2 χ(r, t) − µ =0 (9.23)
∂t2
preserva a condição de Lorentz desde que A(r, t) e φ(r, t) a satisfaçam inicialmente. Todos os
potenciais desta classe restrita pertencem ao chamado calibre de Lorentz.
O calibre de Lorentz é usado comumente pois, em primeiro lugar, leva às equações de onda
(9.18) e (9.19) que tratam A(r, t) e φ(r, t) em pé de igualdade e, em segundo lugar porque é um
conceito independente do sistema de coordenadas escolhido e enquadra-se assim naturalmente
nas considerações da relatividade restrita.
Outro calibre útil para os potenciais é o calibre de Coulomb, de radiação ou transversal. Este
é o calibre em que
∇ · A(r, t) = 0. (9.24)
Dá equação (9.10), vemos que o potencial escalar satisfaz à equação de Poisson,
1
∇2 φ(r, t) = − ρ(r, t) (9.25)

com a solução ˆ
ρ (r0 , t)
φ (r, t) = 0
d3 r0 (9.26)
4π |r − r |
O potencial escalar é exatamente o potencial coulombiano instantâneo, devido à densidade de
carga ρ (r, t). Esta é a origem da denominação calibre de Coulomb.
O potencial vetor satisfaz à equação de onda não-homogênea,
∂ 2 A(r, t) ∂φ(r, t)
∇2 A(r, t) − µ = −µj(r, t) + µ∇ (9.27)
∂t2 ∂t
O termo de corrente que envolve o potencial pode, em princípio, ser calculado a partir da
equação (9.26). Uma vez que ele envolve o operador gradiente, é um termo irrotacional, ou seja,
tem o rotacional igual a zero. Isto sugere que ele possa anular uma parcela correspondente da
densidade de corrente. A densidade de corrente (ou qualquer campo vetorial) pode ser escrita
como a soma de dois termos,
j(r, t) = j` (r, t) + jt (r, t) (9.28)

onde j` (r, t) é a corrente longitudinal ou irrotacional, para a qual ∇ × j` (r, t) = 0, enquanto

jt (r, t) é a corrente transversal ou solenoidal e se tem ∇ · jt (r, t) = 0. Iniciando pela identidade
vetorial,
∇ × [∇ × j(r, t)] = ∇ (∇ · j(r, t)) − ∇2 j(r, t) (9.29)
juntamente com
1
∇ 2
= −4π δ (r − r0 ) , (9.30)
|r − r0 |
pode-se mostrar que j` (r, t) e jt (r, t) podem ser construídas explicitamente a partir de j(r, t),
conforme as expressões (teorema de Helmholtz, ver George Arfken [2, ver pág. 74–78]) :
ˆ
1 ∇0 · j (r0 , t) 3 0
j` (r, t) = − ∇ dr (9.31)
4π |r − r0 |
ˆ
1 ∇0 × j (r0 , t) 3 0
jt (r) = ∇× dr (9.32)
4π |r − r0 |
Com a ajuda da equação da continuidade (9.3) e da equação (9.26), pode-se ver que
∂φ(r, t) ∂ 1
∇ = ∇φ(r, t) = j` (r, t) . (9.33)
∂t ∂t
Portanto, a fonte para a equação de onda de A(r, t) pode ser expressa inteiramente em termos
da corrente transversal (9.32):
∂ 2 A(r, t)
∇2 A(r, t) − µ = −µjt (r, t) (9.34)
∂t2
Esta é, conforme é claro, a origem da denominação calibre transversal. O nome calibre de
radiação provém do fato dos campos de radiação transversais serem dados apenas pelo potencial
vetor, enquanto que por sua vez o potencial de Coulomb instantâneo contribui somente para os
campos a distâncias pequenas. Este calibre é especialmente útil na eletrodinâmica quântica.
Uma descrição quântica dos fótons necessita somente da quantização do potencial vetor.
O Calibre de Coulomb ou transversal é frequentemente usado quando não existem fontes.
Então φ(r, t) = 0, e A(r, t) satisfaz à equação de onda homogênea. Os campos são dados por
∂A(r, t)

 E(r, t) = − ∂t


(9.35)


B(r, t) = ∇ × A(r, t)

De passagem, observamos uma peculiaridade no calibre de Coulomb. Sabe-se que as perturbações

eletromagnéticas propagam-se com uma velocidade finita. Apesar disto, a Eq. (9.26) indica
que o potencial escalar se propaga instantaneamente a todos os pontos do espaço. O potencial
vetor, por outro lado, satisfaz a equação de onda (9.34), com uma velocidade de propagação
√
consequentemente igual a c (c = 1/ 0 µ0 a velocidade da luz). À primeira vista, é difícil
perceber como evitar este comportamento assimétrico dos potenciais, que evidentemente não

9.5. Equações de onda para o espaço livre
pode ser físico. Uma observação é a de que a corrente transversal (9.32) envolve uma integração
sobre todo o espaço.1
9.5 Equações de onda para o espaço livre

Para um espaço completamente vazio, com a fonte de carga ρ(r, t) nula, ou seja, ρ(r, t) = 0
e ∇ · j(r, t) = 0, é sempre possível encontrar uma função de calibre χ(r, t) tal que
∇ · A0 (r, t) = 0 e φ0 (r, t) = 0 (9.36)
para todo r e t. Esse é o calibre de Coulomb.

As transformações de calibre (9.22) e as condições (9.36), conduzem as seguintes equações

 ∂χ(r,t) = φ(r, t)
∂t
(9.37)
∇2 χ(r, t) = −∇ · A(r, t)
A solução explicita para a função de calibre é obtida realizando uma integração no tempo
da primeira equação de (9.37), o que resulta em
ˆ
χ(r, t) = φ(r, t)dt + const. (9.38)
Note que as duas condições ∇ · A0 (r, t) = 0 e φ0 (r, t) = 0 satisfazem automaticamente a condição

de Lorentz (9.16), de modo que as equações de onda (9.18) e (9.19) são mantidas, mas somente
para ρ(r, t) = 0 e ∇ · j(r, t) = 0.
Pode-se verificar a validade das equações (9.37), usando as equações de Maxwell. Para isso,
diferencie a segunda equação de (9.37)com relação ao tempo e insira no resultado a primeira eq.
de (9.37), resultando em
∂A(r, t)
∇2 φ(r, t) + ∇ · = 0. (9.39)
∂t
Porém essa equação só é válida se ρ(r, t) = 0. De fato da equação de Maxwell ∇ · E(r, t) =
ρ(r, t)/0 e da eq. (9.8) segue que

∂A(r, t)
∇ · E(r, t) = ∇ · −∇φ(r, t) −
∂t
∂A(r, t) 1
= −∇2 φ(r, t) − ∇ · = ρ(r, t)
∂t 0
= 0.
Para verificar que ∇ · j(r, t) = 0, vamos tomar o divergente da equação de Maxwell (9.1b), o
que resulta em
∂
∇ · (∇ × H(r, t)) = ∇ · j(r, t) + ∇ · D(r, t),
∂t
1
Ver O. L. Brill e B. Goodman, Am. J. Phys. 35, 832 (1967) com uma discussão detalhada sobre a causalidade
no calibre de Coulomb.

entretanto temos que∇ · D(r, t) = ∇ · E(r, t) = 0 e como o divergente do rotacional de um

campo vetorial qualquer é sempre nulo segue imediatamente que
∇ · j(r, t) = 0.
No calibre de Coulomb, ∇ · A0 (r, t) = 0 e φ0 (r, t) = 0, encontra-se ondas planas transversais

como uma solução para A0 (r, t) e consequentemente para os campos E(r, t) e B(r, t)
Ao considerarmos um espaço vazio, livre de fontes cargas e correntes, ρ(r, t) = 0 e j(r, t) = 0,
√
e o fato de que c = 1/ 0 µ0 , então a equação 9.19 toma a seguinte forma:
1 ∂ 2A
∇2 A − = 0. (9.40)
c2 ∂t2
Para evitar-se divergências, o espaço será dividido em caixas cúbicas de volume L3 e o campo
eletromagnético será tratado dentro destas caixas com condições periódicas de contorno. Como
resultado do tratamento dado aqui, obteremos uma forma para o campo eletromagnético a
qual será dada como a soma de osciladores harmônicos. Devido a periodicidade do sistema o
potencial vetor pode ser escrito como uma expansão em série de Fourier, dado por,
1 X
Ck,α (0)ˆk,α eik·r e−iωk t + Ck,α
∗
(0)ˆ∗k,α e−ik·r eiωk t ,

A(r, t) = √ (9.41)
V k,α
2π
onde ωk = |k|c, k = L
(nx , ny , nz ) e ˆk,α é o vetor polarização.
A energia total do campo eletromagnético é dada por;
ˆ
0
H= d3 r(E2 + c2 B2 ). (9.42)
2 V
Como
∂A ∂A
E2 = · (9.43)
∂t ∂t
e
B2 = (∇ × A) · (∇ × A), (9.44)
então, ou ainda
ˆ
0 3 ∂A ∂A 2
H= dr · + c (∇ × A) · (∇ × A) = HE + HB . (9.45)
2 V ∂t ∂t
Definindo
Ck,α (t) = Ck,α (0)e−iωk t (9.46)
e
1
µk,α = √ ˆk,α eik·r . (9.47)
V
A seguir será calculado o primeiro membro da integral na eq.(9.45), o termo devido ao campo
elétrico:
ˆ
0 3 ∂A ∂A
HE = dr · , (9.48)
2 V ∂t ∂t
ˆ
0 X 3
h
∗ ∗
i
HE = d r µk,α Ċk,α (t) + µk,α Ċk,α (t) ·
2 k,α,k0 ,α0 V
h i
µk0 ,α0 Ċk0 ,α0 (t) + µ∗k0 ,α0 Ċk∗0 ,α0 (t) .

´ 0
Calculando separadamente a integral V µαk · µαk0 d3 r, temos
ˆ ˆ
3 ˆk,α · ˆk0 ,α0 0
µk,α · µk0 ,α0 d r = ei(k+k )·r d3 r,
V
ˆV
µk,α · µk0 ,α0 d3 r = ˆk,α · ˆk0 ,α0 δk,−k0 ,
ˆV
µk,α · µk0 ,α0 d3 r = δαα0 δk,−k0 .
V
Analogamente, temos que ˆ

0
µαk · µαk0 ∗ d3 r = δαα0 δk,k0 .
V
assim a energia devido ao campo elétrico é dada por

0 X h ∗ ∗ ∗ ∗
i
HE = Ċk,α (t)Ċ−k,α (t) + Ċk,α (t)Ċk,α (t) + Ċk,α (t)Ċk,α (t) + Ċk,α (t)Ċ−k,α (t) .
2 k,α
Porém como
Ċk,α (t) = −iωk Ck,α (t), (9.49)
segue então que

0 X 2 ∗ ∗ ∗ ∗

HE = ωk −Ck,α (t)C−k,α (t) + Ck,α (t)Ck,α (t) + Ck,α (t)Ck,α (t) − Ck,α (t)C−k,α (t) .
2 k,α
(9.50)
O termo devido ao campo magnético, do segundo membro de 9.48, é dado por:
ˆ
0 c2
HB = d3 r(∇ × A) · (∇ × A), (9.51)
2 V
ˆ
0 c2 X X ∗
HB = d3 r[Ck,α (t)∇ × µk,α + Ck,α (t)∇ × µ∗k,α ] ·
2 k,α k0 ,α0 V
[Ck0 ,α0 (t)∇ × µk0 ,α0 + Ck∗0 ,α0 (t)∇ × µ∗k0 ,α0 ].
´
Calculando separadamente a integral V
d3 r(∇ × µk,α ) · (∇ × µ∗k0 ,α0 ), temos
ˆ ˆ
1 0
3
d r(∇ × µk,α ) · (∇ × µ∗k0 ,α0 ) d3 r[ik × ˆk,α eik·r ] · [−ik0 × ˆ∗k0 ,α0 e−ik ·r ],
=
V
ˆV V ˆ
3 ∗ 0 ∗ 1 0
d r(∇ × µk,α ) · (∇ × µk0 ,α0 ) = (k × ˆk,α ) · (k × ˆk0 ,α0 ) d3 rei(k−k )·r ,
V V
ˆV
d3 r(∇ × µk,α ) · (∇ × µ∗k0 ,α0 ) = (k × ˆk,α ) · (k0 × ˆ∗k0 ,α0 )δkk0 ,
V
usando as relações (A × B) · (C × D) = (A · C)(B · D) − (A · D)(B · C) e k · ˆk,α = 0, já que,

∇ · A = 0, logo
ˆ
d3 r(∇ × µk,α ) · (∇ × µ∗k0 ,α0 ) = [(k · k0 )(ˆk,α · ˆ∗k0 ,α0 ) − (k · ˆ∗k0 ,α0 )(k · ˆk,α )]δkk0 ,
ˆV
d3 r(∇ × µk,α ) · (∇ × µ∗k0 ,α0 ) = k 2 δkk0 δαα0 .
V

No entanto,
0 c2 X 2 ∗ ∗ ∗ ∗

HB = k Ck,α (t)C−k,α (t) + Ck,α (t)Ck,α (t) + Ck,α (t)Ck,α (t) + Ck,α (t)C−k,α (t) ,
2 k,α
0 X 2 ∗ ∗ ∗ ∗

HE = ωk Ck,α (t)C−k,α (t) + Ck,α (t)Ck,α (t) + Ck,α (t)Ck,α (t) + Ck,α (t)C−k,α (t) . (9.52)
2 k,α
Usando os resultados obtidos para HE , eq. 9.50, e HB , eq. 9.52, e substituindo esses
resultados em 9.45, obtemos que a energia do campo eletromagnético será dado por;
X
∗
H = 20 ωk2 Ck,α (t)Ck,α (t). (9.53)
k,α
Como Ck,α (t) = Ck,α (0)e−iωk t , então vemos que os termos dependentes do tempo devidos as
campos elétricos e magnéticos, se cancelam, como esperado, já que o Hamiltoniano de um sistema
fechado deve se independente do tempos, já que o mesmo é uma constante de movimento.
Dirac [45] ao obter está equação, a reconheceu como sendo a equação do oscilador harmônico,
conforme John S. Townsend [38, section 14.2, pag. 408].
A astúcia de Dirac, deve-se a observação de que Ck,α (t) = Ck,α (0)e−iωk t , logo
C̈k,α (t) = −(ωk2 )Ck,α (t) ⇒ Oscilador Harmônico . (9.54)
Podemos, obter uma forma mais adequada para o Hamiltoniano, definindo novas variáveis;
√ ∗
Qk,α = 0 (Ck,α (t) + Ck,α (t)) (9.55)
e
√ ∗
Pk,α = −iωk 0 (Ck,α (t) − Ck,α (t)). (9.56)
Note, ainda que

Q†k,α = Qk,α e †
Pk,α = Pk,α (9.57)
Temos ainda que as relações inversas são

1 i
Ck,α (t) = √ Qk,α + Pk,α (9.58)
2 0 ωk
e
∗ 1 i
Ck,α (t) = √ Qk,α − Pk,α (9.59)
2 0 ωk
Logo,
2
Pk,α 0 ωk2 ∗
=− (Ck,α (t) − Ck,α (t))2 , (9.60)
2 2
ωk2 Q2k,α 0 ωk2 ∗
= (Ck,α (t) + Ck,α (t))2 . (9.61)
2 2
Então,
1 X 2
Pk,α + ωk2 Q2k,α ,

H= (9.62)
2 k,α

9.6. Quantização do campo eletromagnético
com
√ ∗ ∂H
Q̇k,α = −iωk 0 (Ck,α (t) − Ck,α (t)) = Pk,α = (9.63)
∂Pk,α
e
√ ∗ ∂H
Ṗk,α = −ωk2 0 (Ck,α (t) + Ck,α (t)) = −ωk2 Qk,α = − . (9.64)
∂Qk,α
Portanto, vemos que formalmente o campo eletromagnético pode ser considerado como sendo
um conjunto de osciladores harmônicos independentes. Este fato, é geralmente o ponto de
partida para a dedução do espectro da radiação do corpo negro de Planck. Nessa aproximação,
a densidade de energia eletromagnética é determinada como o número de modos (osciladores)
em um determinado intervalo de frequências multiplicada pela energia média de cada oscilador.
o Ingrediente fundamental na solução clássica da catástrofe do ultravioleta de Rayleigh, a qual
surge do fato de que nesse modelo cada oscilador harmônico contribui com uma energia média
KT . Notem que a quantização é imposta sobre os termos dependentes do tempo do campo.
Note ainda, que as duas variáveis canônicas introduzidas são independentes do tempo.
9.6 Quantização do campo eletromagnético

Agora, estamos preparados para quantizar o campo eletromagnético, e para isso iremos
considerar que Pk,α e Qk,α são operadores canonicamente conjugados que satisfazem as seguintes
relações de comutação
[Qk,α , Qk0 ,α0 ] = [Pk,α , Pk0 ,α0 ] = 0, (9.65)
[Qk,α , Pk0 ,α0 ] = i~δk,k0 δα,α0 . (9.66)
Agora consideremos combinações lineares dePk,α e Qk,α , dadas por
ωk Qk,α + iPk,α
ak,α = √ , (9.67a)
2~ωk
ωk Qk,α − iPk,α
a†k,α = √ , (9.67b)
2~ωk
onde [ak,α , a†k0 ,α0 ] = δkk0 δαα0 e [ak,α , ak0 ,α0 ] = [a†k,α , a†k0 ,α0 ] = 0.
Note que

ωk i
ak,α =√ Qk,α + Pk,α (9.68a)
2~ωk ωk
r
ωk √ 20 ωk
=√ · 2 0 Ck,α (t) = Ck,α (t) (9.68b)
2~ωk ~
Como
1
a†k,α ak,α = (ωk Qk,α − iPk,α )(ωk Qk,α + iPk,α ),
2~ωk
1
a†k,α ak,α = [(ωk Qk,α )2 + (Pk,α )2 + iωk Qk,α Pk,α − iωk Pk,α Qk,α ],
2~ωk
1
a†k,α ak,α = [(ωk Qk,α )2 + (Pk,α )2 − ωk ~],
2~ωk

então,
1 † 1
(ωk Qk,α )2 + (Pk,α )2 =

ak,α ak,α + ~ωk , (9.69)
2 2
logo o operador Hamiltoniano do campo livre é dado por,
X † 1

H= ak,α ak,α + ~ωk . (9.70)
k,α
2
Definindo Nk,α = a†k,α ak,α , temos

X 1

H= Nk,α + ~ωk . (9.71)
k,α
2
Aqui Nk,α é interpretado como o autovetor que possui o seguinte autoestado |nk,α i com um
autovalor dando o número de fótons no estado cujo modo do campo é dado por ν = (k, α). O
fator 1/2 representa a energia de ponto zero de um oscilador Harmônico. Usando a notação
ν = (k, α) para o respectivo modo do campo, o operador número é agora dado por
Nν = a†ν aν (9.72)
e consequentemente
X 1

H= Nν + ~ωk . (9.73)
ν
2
Note que o índice k = |k|, está incluso na soma em ν.
Então nesse ponto, surge a seguinte questão: quais são os vetores de estados que esse operador
atua?
Denotando a energia de um único modo de oscilador ν, associada ao autovetor |nν i, com
nν = 0, 1, 2, . . . são os números quânticos usuais do oscilador, e aqui dizem quantos fótons
estão associados ao modo ν do oscilador. Esses kets podem expandir o espaço de estados Eν
associados com um único modo, o qual é o espaço no qual os operadores Qν e Pν (para um dado
valor de ν) atuam. O ket de todo espaço de estados Eem do campo eletromagnético é dado pelo
produto tensorial dos espaços de estados de cada modo, ou seja,
Y
Eem = ⊗Eν . (9.74)
ν
Os autoestado de H são especificados por um lista infinita de números quânticos
{nν } = {n1 , n2 , n3 , . . . , nν−1 , nν , nν+1 , . . .}
sendo um número para cada modo do campo, seus auto estado são agora escritos como
|{nν }i = |n1 , n2 , . . . , nν , . . .i (9.75)

Y
|n1 , n2 , . . . , nν , . . .i = ⊗ |nν i (9.76)
ν
= |n1 i ⊗ |n2 i ⊗ · · · ⊗ |nν i ⊗ · · · (9.77)

Os operadores de criação e aniquilação atuam da seguinte forma:

√
aν |n1 , n2 , . . . , nν , . . .i = nν |n1 , n2 , . . . , nν − 1, . . .i (9.78)
√
a†ν |n1 , n2 , . . . , nν , . . .i = nν + 1 |n1 , n2 , . . . , nν + 1, . . .i (9.79)
A base {|n1 , n2 , . . . , nν , . . .i} é chamada de base de ocupação de números.

O estado de mais baixa energia de (9.71), o estado fundamental do campo livre, associado
com nν = 0 é chamado de estado de vácuo e é representado pelo ket |0i, ou seja,
|0i = |01 , 02 , . . . , 0ν , . . .i (9.80)
ou ainda usando a notação anterior

|0i = |0k1 ,α1 i ⊗ |0k2 ,α2 i ⊗ |0k3 ,α3 i ⊗ · · · ⊗ 0kj ,αj ⊗ · · · (9.81)
Este estado é tal que para todos os valores de ν = (k, α), temos
ak,α |0i = aν |0i = 0 e h0| a†k,α = h0| a†ν = 0. (9.82)
Aplicando-se sucessivamente o operador de criação sobre o estado de vácuo, pode-se construir

um autoestado qualquer de energia, o qual é
Y 1 nν
|n1 , n2 , . . . , nν , . . .i = √ a†ν |0i (9.83)
ν
nν !
ou ainda
Y 1
†
nk,α
nk1 ,α1 , nk2 ,α2 , . . . , nk
j ,αj
, . . . = p a k,α |0i (9.84)
k,α
n k,α !
Se aplicarmos o operador criação a†k,α em um desses osciladores do estado fundamental,

obtemos
a†kj ,αj |0i = |0k1 ,α1 i ⊗ |0k2 ,α2 i ⊗ · · · ⊗ a†kj ,αj 0kj ,αj ⊗ · · ·

(9.85)

= |0k1 ,α1 i ⊗ |0k2 ,α2 i ⊗ · · · ⊗ 1kj ,αj ⊗ · · · (9.86)
Por simplicidade representamos esse estado por
= a†kj ,αj |0i

1k (9.87)
j ,αj
o que significa que todos os osciladores exceto aquele especificado pelo índice vetorial k e pelo
estado da polarização α estão no estado fundamental.
A energia desse estado é determinada atuando o operador Hamiltoniana nele,

X † 1
H |1k,α i = ~ωk0 ak0 ,α0 ak0 ,α0 + |1k,α i (9.88)
0
k ,α 0
2
chamando
1X
E0 = ~ωk0 (9.89)
2 k0 ,α0

9.7. A energia do vácuo
e observando que
a†k,α ak,α |1k,α i = |1k,α i (9.90)
enquanto
a†k0 ,α0 ak0 ,α0 |1k,α i = 0 Para k 6= k0 ; α 6= α0 (9.91)
segue então
H |1k,α i = (E0 + ~ωk ) |1k,α i (9.92)
Portanto, a energia adicionada ao modo ν = (k, α) do sistema pela ação do operador número
Nk,α = a†k,α ak,α é ~ωk .
9.7 A energia do vácuo

O vácuo é o estado de menor energia do campo eletromagnético e sua energia é dada por
1X
E0 = h0|H|0i = ~ωk = ∞, (9.93)
2 k,α
e infelizmente essa soma é infinita, ou seja, a energia do estado de vácuo é infinita.

A menos que haja algum corte (“cut-off ”) na teoria que limite o número de osciladores com
frequências arbitrariamente altas, esta soma diverge, porque há um número infinito de tais
osciladores. Apesar disso é conveniente tratarmos E0 como se tivesse um valor finito. Veremos
que somente as diferenças em energia é que são relevantes.
A energia de vácuo é dada por uma soma infinita das energias de ponto zero de todos os
osciladores que compõem o campo. No caso de osciladores harmônicos mecânicos com um
número finito de graus de liberdade, a energia do ponto zero é real e fisicamente significativa,
mas aqui no caso do campo eletromagnético é um constrangimento que causa dificuldades na
sua interpretação física. A energia do ponto zero é apenas uma das várias classes de infinitos que
surgem na teoria quântica de campos, e é um dos mais fáceis de eliminar por uma racionalização.
Em uma das abordagens, argumenta-se simplesmente que para a maioria dos processos físicos a
definição da origem da energia é uma questão de convenção, uma vez que é apenas as diferenças
de energia que importam. Adicionando uma constante no Hamiltoniano não afeta as equações de
movimento (tanto as equações de Hamilton clássicas ou as equações de Heisenberg na mecânica
quântica), então devemos ser capazes de jogar fora a energia do ponto zero, uma vez que ela é
apenas uma constante, embora uma constante infinita.
Em outra abordagem, pode-se argumentar que a energia do ponto zero está conectada com
as ambiguidades da quantização da Hamiltonianas clássicas contendo ordenações não triviais
das variáveis canônicas q e p. É verdade que o Hamiltoniano (9.62) não possui produtos do tipo
q · p, mas isso só é verdade para o par de coordenadas canônicas (Qk,α , Pk,α ). Para um outro par
qualquer de coordenadas canônicas não haveria produtos não triviais. Por exemplo, classicamente,
não há diferença entre a∗k,α ak,α e ak,α a∗k,α , mas na mecânica quântica a†k,α ak,α = ak,α a†k,α − 1.
Portanto, se decidirmos quantizar simplesmente substituindo os ak,α e a∗k,α respectivamente
por ak,α e a†k,α o então operador hamiltoniano irá depender do ordenamento clássico dos ak,α e

9.8. Operadores criação e aniquilação
a∗k,α . Mas usando diferentes ordenamentos pode-se obter o Hamiltoniano (9.70), ou um outro
tendo duas vezes a energia do ponto zero, ou um que não tem energia do ponto zero. Sem
usar qualquer processo de racionalização, em geral usa-se a última abordagem, de modo que o
hamiltoniano do campo eletromagnético toma a seguinte forma
X
H= Nk,α ~ωk (9.94)
k,α
e com isso, a energia do estado |. . . , nk,α , . . .i é dada por

!
X
H |. . . , nk,α , . . .i = nk,α ~ωk |. . . , nk,α , . . .i
k,α
ou
X
h. . . , nk,α , . . . |H| . . . , nk,α , . . .i = nk,α ~ωk .
k,α
E para esse caso em particular a energia do vácuo é zero.
9.8 Operadores criação e aniquilação

Das relações de comutação entre os operadores aαk e a†k,α temos que
a†k,α |nk,α i =
p
nk,α + 1 |nk,α + 1i (9.95)
e que
√
ak,α |nk,α i = nk,α |nk,α − 1i (9.96)
Portanto, é natural chamarmos o operador a†k,α de operador de criação de um fóton, já que ele
aumenta por um o número de fótons de um estado. Similarmente chamamos o operador ak,α de
operador aniquilação de um fóton, já que ele reduz em um o número de fótons de um estado.
Pode-se criar um estado com nk,α fótons, cada um com momentum ~k e polarização ˆk,α ,
atuando o operador criação a†k,α nk,α vezes sobre o estado de vácuo, ou seja,
nk,α
†
ak,α
|nk,α i = p |0i (9.97)
nk,α !
9.9 A energia de ponto zero é real?

A mecânica quântica é uma das mais bem testadas teorias da física e a sua correção só pode
ser verificada por comparação com o experimento. A energia de ponto zero [?, ?] é um desses
aspectos e a pergunta que se faz é: Existem consequências físicas observáveis da energia de ponto
zero, que acabou de ser negligenciada? Em um oscilador mecânico, pode-se, em princípio, alterar
a constante da mola, isto é, a frequência do oscilador. Se tomarmos um oscilador harmônico,
inicialmente, em seu estado fundamental, e mudar lentamente a frequência do seu valor inicial
zero, então o trabalho é feito como se o pacote de onda do estado fundamental expandisse

9.9. A energia de ponto zero é real?
Figura 9.1: Duas placas perfeitamente condutoras eletricamente neutras e paralelas entre si são
atraídas uma pela outra, devido a flutuação do vácuo quântico. Efeito previsto teoricamente por
Hendrik B. G. Casimir em 1948 [?] e confirmada experimentalmente por Steven Lamoreaux em 1996 [?]
lentamente. É como o trabalho realizado por um gás quando o volume de seu recipiente é
aumentado. Deste modo, a energia do estado fundamental ~ω/2 pode ser acessada. Há muitas
outras maneiras de demonstrar que a energia de ponto zero de um oscilador mecânico é real.
No caso do campo eletromagnético que não podemos mudar as frequências dos modos, mas
podemos mudar a estrutura dos modos com os condutores que mudam as condições de contorno
satisfeitas pelo campo eletromagnético. Por exemplo, vamos considerar um capacitor de placas
paralelas. Para simplificar considere que as ondas eletromagnéticas do espaço serão modificadas
a partir do que seria no espaço vazio, devido à presença dos condutores [?]. Em particular, as
ondas de luz entre as placas têm uma estrutura de modo semelhante as autofunções de uma
dada energia de uma partícula dentro de uma caixa.
Se o campo electromagnético na presença das placas for quantizado, obtém-se um oscilador
harmônico para cada modo, tal como na ausência das placas, e a energia total de ponto zero
ainda é infinita. Mas verifica-se que é possível fazer a diferença entre a energia infinita do ponto
zero na presença das placas, e aquela da ausência das placas, e que ela faz sentido e o resultado
é finito [?, ?, 25], para maiores detalhes do cálculo veja por exemplo Greiner [?, 14] ou o artigo
original. Ou seja, pode-se entender a diferença entre dois infinitos. Esta diferença pode ser
interpretada como uma mudança da energia do estado fundamental do campo quando as placas
são introduzidos. Acontece que ela depende da distância entre as duas placas [?, ?, 8, 26]. Assim,
obtém-se a previsão de que, como a distância entre as placas é variável, o trabalho tem de ser
feito para compensar a variação na energia de ponto zero. Isto é, deve haver uma força entre as
placas. Este é o chamado efeito Casimir, pois sua existência foi prevista teoricamente pelo físico
holandês Hendrik Brugt Gerhard Casimir em 1948 [?] e confirmada experimentalmente pelo

9.9. A energia de ponto zero é real?
físico norte americano Steven Ken Lamoreaux em 1996 [?]. O efeito Casimir é um dos vários
fenômenos que fornecem provas convincentes para a realidade do vácuo quântico - o equivalente
em mecânica quântica de que, na física clássica, poderia ser descrito como o espaço vazio.
O efeito Casimir foi testado experimentalmente, e os resultados estão de acordo com a teoria.
As experimentos atuais não usam um par de placas metálicas, já que é experimentalmente difícil
mantê-las exatamente paralela, mas a ideia básica é a descrita aqui. Tem havido um interesse
renovado no efeito Casimir, nos últimos anos, por causa de aplicações física em uma escala
nanométrica.
Embora a força de Casimir pareça ser completamente absurda, atualmente ela já é bem
compreendida. Nos velhos tempos da mecânica clássica o vácuo era o que restava quando
esvaziava-se um recipiente de todas as suas partículas e baixava-se sua temperatura até o zero
absoluto. A chegada da mecânica quântica, no entanto, mudou completamente a nossa noção
de um vácuo. Todos os campos - em particular campos electromagnéticos - possuem flutuações.
O vazio não é realmente vazio. Ele está cheio de partículas virtuais, que estão em um estado
contínuo de flutuação. Um par virtual de partícula antipartícula pode ser criado a partir de
vácuo e em seguida aniquilado voltando a vácuo. Estas partículas virtuais existem por um
tempo muito curto ditado pela relação de incerteza de Heisenberg.
∆E · ∆t = ~
Os fótons (os quanta das ondas eletromagnéticas) são as partículas virtuais dominantes nas
flutuações do vácuo, mas outras partículas também são produzidas.
Um vácuo não é simplesmente “nada”, mas é melhor descrito como uma superposição de
muitos estados diferentes do campo eletromagnético. Assim, a criação e subsequente absorção
de fótons pelo vácuo implica que há flutuações do vácuo.
No entanto, as flutuações do vácuo não são uma abstração da mente de um físico. Elas têm
consequências observáveis que pode ser observadas diretamente em experiências realizadas em
uma escala microscópica. Por exemplo, um átomo em um estado excitado não permanecerá
lá por um tempo infinitamente longo, mas vai voltar ao seu estado fundamental, emitindo um
fóton espontaneamente. Este fenômeno é uma consequência das flutuações de vácuo. A força
de Casimir é o mais famoso efeito mecânico de flutuação do vácuo. A força de Casimir surge
entre dois espelhos no vácuo, como uma consequência da pressão de radiação de flutuação do
vácuo [?].
Casimir realizou seu cálculo para uma configuração geométrica em que prepara-se duas
placas perfeitamente condutoras (espelhos), eletricamente neutras e paralelas entre si no vácuo,
conforme ilustrado pela figura 9.1.
Essencialmente o efeito Casimir deve-se:
• a natureza geométrica da configuração das placas;
• ao fato de que o espaço entre as duas placas é diferente do espaço externo a elas, e
consequentemente a flutuação do vácuo é diferente em ambas as regiões.

9.10. Propriedades dos fótons
• ao fato de que a flutuação do vácuo exerce diferentes forças sobre os lados internos e
externo das placas, o que resulta em uma pressão líquida que aproxima as placas.
A força de Casimir e a estatística das partículas
• além dos fótons há outras partículas que também fornecem uma pequena contribuição,
porém somente a força devida aos fótons é mensurável;
• os fótons são bósons pois obedecem a estatística de Bose-Einstein, e todos os bósons assim
como os fótons exercem uma força atrativa enquanto os férmions, partículas que obedecem
a estatística de Fermi-Dirac, exercem uma força repulsiva.
Note que a energia do ponto zero não é apenas uma energia infinita, ela é uma densidade de
energia infinita. Isso é porque está sendo usada uma caixa de normalização, então quando
divide-se o (infinito) da energia de ponto zero pelo volume V da caixa, ainda obtém-se um
resultado infinito. Foi dito anteriormente, que para a maioria dos processos físicos somente as
diferenças de energia é que são importantes, mas há um lugar no qual a quantidade absoluta de
energia é importante, e esse é o caso da gravidade. Como a energia e massa estão relacionadas
por E = mc2 , a energia corresponde a massa que produz campos gravitacionais. Uma densidade
de massa infinita, obviamente, não faz sentido na teoria gravitacional, mas pode-se argumentar
que a soma sobre modos na soma em (9.93) para a energia do ponto zero deve ser interrompida
(cortada) quando o comprimento de onda torna-se comparável ao comprimento de Planck. Isto
fornece uma densidade de energia muito grande, mas finita no espaço [?, ?]. A densidade de
energia é uma componente do tensor de esforços e energia, que é a fonte do campo gravitacional
na relatividade geral. As outras componentes do tensor de esforços e energia associado com o
ponto de zero do campo também pode ser calculado, e elas dão origem a um termo de fonte nas
equações de Einstein para o campo gravitacional que é da forma Λgµν , isto é, eles têm a mesma
forma que o termo cosmológico, onde Λ é a constante cosmológica. Observações recentes dão
um valor numérico pequeno e positivo para a constante cosmológica. Infelizmente, o valor de Λ
obtido a partir da a dinâmica do ponto de zero dos campos quânticos é muito maior do que o
valor observado (algo por um fator da ordem de 10120 ). Ninguém sabe a razão para esta grande
discrepância, mas subsiste a suspeita de que a dinâmica do ponto zero de campos quânticos
têm algo a ver com o termo cosmológica na relatividade geral, e, portanto, com a expansão do
universo.
9.10 Propriedades dos fótons

Viu-se que classicamente a variável normal aν é proporcional a amplitude da onda plana
eletromagnética de modo ν = (k, α). Portanto a quantidade clássica |aν |2 = aν a∗ν é proporcional
a energia do respectivo modo. Porém, no tratamento quântico dado, encontrou-se que a energia
do modo ν = (k, α), a qual é proporcional ao valor esperado do operador número Nν = a†ν aν , é
quantizada em unidades de ~ωk conforme a equação 9.92. Esta é de fato exatamente a mesma

9.11. Operador Momentum do campo e dos fótons
hipótese originalmente proposta por Max Planck que foi desenvolvida por Albert Einstein, a
qual interpretava o estado quântico com o número quântico nν com como aquele contendo nν
fótons, cada com uma energia~ωk .
Foi Max Planck quem propôs que a energia transferida entre a radiação e a matéria deveria
ocorrer em unidade de ~ω. Porém foi Albert Einstein que insistiu que a energia no campo
deveria ser restrita a múltiplos inteiros de ~ω (isto é, a energia em um modo de frequência ω).
Ele também sugeriu que estes quantum de energia deveriam ser associados com partículas, isto
é, partículas de luz. Na época todo mundo achava que Einstein era louco, mas no final, ele
provou estar certo. O termo fóton foi cunhado por Gilbert N. Lewis em 1926 (Veja a origem da
palavra fóton [21]).
Atualmente o fóton é dito ser o quantum da radiação eletromagnética (o que inclui a luz),
dentro do contexto da física de partículas elementares ele é interpretado como a partícula
elementar mediadora da força eletromagnética.
A troca de fótons “virtuais” entre as partículas como os elétrons e os prótons é descrita pela
eletrodinâmica quântica, a qual é a parte mais antiga do Modelo Padrão da física de partículas.
Ele interage com os elétrons e núcleo atômico sendo responsável por muitas das propriedades da
matéria, tais como a existência e estabilidades dos átomos, moléculas, e sólidos.
Assim, temos o início da interpretação de partícula dos estados quânticos que pertencem
ao espaço de estados do campo eletromagnético livre quantizado Eem . Na discussão a seguir,
esta interpretação será gradualmente aperfeiçoada, analisando-se sucessivamente o momentum,
momentum angular e de spin e a estatística destas partículas chamada de fóton. No desen-
volvimento a seguir, sera visto que o formalismo desenvolvido para a quantização do campo
eletromagnético livre incorpora uma descrição via mecânica quântica de um sistema no qual as
partículas podem ser criadas ou destruídas, de modo que o número de partículas é variável. As
partículas em questão são fótons, que podem ser criados em números arbitrários em energias
arbitrariamente baixas, porque eles possuem massa.
9.11 Operador Momentum do campo e dos fótons

Albert Einstein também sugeriu que um fóton de energia ~ω deveria ter um momentum de
~k, no qual a frequência ω e o vetor de onda k estão relacionados pela relação de dispersão
clássica de ondas de luz, ω = c|k|. Agora será analisado o momentum do campo eletromagnético
e do fóton.
Note que no tratamento dado foi adicionado um momentum ao sistema. Embora classicamente
o campo eletromagnético transporte momentum. De fato, a direção do momentum do campo é
a mesma do vetor Poynting ˆ
2
Sp = c 0 d3 r (E × B) (9.98)
V
o qual fornece a energia do campo por unidade de área por unidade de tempo. Ao colocar um
disco negro na frente de uma fonte de luz, tal como ilustrado na fig. 9.2, o disco vai recuar
e aquecerá à medida que absorve momentum e energia do campo. O operador momentum

A)
B) C)
Figura 9.2: Absorção de fótons por um disco negro. A)Um disco negro recua ao absorver fótons. B) e
C) A taxa de rotação aumenta ao absorver fótons circularmente polarizados, seja para a direita |Ri ou
para a esquerda |Li [?].
do campo eletromagnético foi construído para expressar os operadores de campo elétrico e

magnético em termos do potencial vetor, assim o operador momentum é dado por
ˆ ˆ
3 3 ∂A
P = 0 d r (E × B) = 0 dr − × (∇ × A) (9.99)
V V ∂t
Note que classicamente os campos são funções dos coeficientes aν e a∗ν , os quais estão
relacionados aos coeficientes Cν (t) pela equação (9.68b). Agora iremos reescrever os campos em
termos os coeficientes aν e a∗ν , para obtermos os respectivos operadores quânticos. Substituindo
os coeficientes Cν (t) pelos aν nas expressões dos campos obtém-se que
r
~
Ck,α (t) = · ak,α (t) (9.100)
20 ωk
logo o potencial vetor e os campos serão dados por
r
~ X 1
A(r, t) = √ ˆk,α ak,α (t)eik·r + ˆ∗k,α a†k,α (t)e−ik·r , (9.101a)
20 V k,α ωk
r
~ X√
E(r, t) = − ωk iˆk,α ak,α (t)eik·r − iˆ∗k,α a†k,α (t)e−ik·r , (9.101b)
20 V k,α
r
~ X 1 h i
i (k × ˆk,α ) ak,α (t)eik·r − i k × ˆ∗k,α a†k,α (t)e−ik·r

B(r, t) = √ (9.101c)
20 V k,α ωk
Aqui, assim como na teoria clássica de campos, as coordenadas r e o tempo t não são nada
mais do que meros parâmetros dos campos, porém agora os campos são operadores, já que o seu
lado direito é expresso por uma combinação linear dos operadores ak,α (t) e a†k,α (t). Portanto,
agora A(r, t), E(r, t) e B(r, t) são operadores de campo que atuam sobre o espaço de estados do

campo eletromagnético livre quantizado Eem . Eles são os nossos primeiros exemplos de campos
quânticos.
Note que, assim como os campos clássicos são reais, estes campos quânticos são Hermitianos.
Como de costume na mecânica quântica, os operadores hermitianos correspondem a medidas que
podem ser feitas em um sistema físico, e tais medidas estão sujeitas a flutuações estatísticas e
as restrições do princípio da incerteza. Veremos que esses elementos estão presentes na medição
dos campos electromagnéticos quantizados.
Retornando ao momentum, a expressão 9.99 para P é clássica. O campos clássicos E e
B que surgem no integrando de (9.42) podem ser expandidos como combinações lineares dos
coeficientes aν e a∗ν , de acordo com as equações (9.43) e (9.44). Mas quando substituir um aν e
a∗ν por um aν e a†ν , a fim de obter a expressão quantizada para P, surge a questão da ordenação
adequada dos coeficientes clássicos aν e a∗ν . Poder-se-ia seguir simplesmente a ordem dada pelo
produto de E × B, mas isso, como se vê leva a um momentum de ponto zero infinito, bem
como a energia de ponto zero na equação (9.93). Gostaríamos de ter h0|P|0i = 0, portanto,
o momentum do vácuo desapareceria. Isso pode ser feito se na ordem de aν e a∗ν da fórmula
clássica, colocarmos todos os a∗ν à esquerda dos aν e, depois de substituir um aν e a∗ν por um aν
e a†ν . Então, quando o valor esperado do momentum P do vácuo for calculado, haverá sempre
um operador aniquilação atuando a esquerda do ket do vácuo|0i, ou um operador de criação ao
lado direito do bra do vácuo h0|, e o resultado será nulo.
Com um procedimento análogo ao do cálculo da energia, encontra-se que o operador momento
é
X
P = ~k(a†k,α ak,α + ak,α a†k,α ) (9.102)
k,α
X 1 X
P = (Nk,α + )~k = ~k Nk,α (9.103)
k,α
2 k,α
Note que o último termo do operador momentum não contribui porque

X
~k = 0 (9.104)
k,α
pois cada vetor k da soma será cancelado pelo vetor −k. Portanto, o valor esperado do operador
momentum no estado de vácuo é
P |0i = 0. (9.105)
Considerando o efeito de H e P sobre o estado de um único fóton;
Ha†k,α |0i = H |1k,α i = (E0 + ~ωk ) |1k,α i (9.106)
Pa†k,α |0i = P |1k,α i = ~k |1k,α i (9.107)

Portanto, o estado |1k,α i em relação ao estado de vácuo, possuí um momentum adicional ~k e
uma energia adicional ~ωk que são respectivamente, o momentum e a energia do fóton. Como
ωk = |k|c, a energia adicional e o momentum adicional estão relacionados por E = pc = ~|k|c =
~ωk , como deveria ser para uma partícula que se move com a velocidade da luz, ou seja, o fóton.

A massa do fóton é dada por
1
E 2 = m2 c4 + |P|2 c2 m2 = 2 2 2

=⇒ E − |P| c
c4
logo
1
m2 = 2 2

(~ωk ) − (~|k|c) = 0.
c4
9.11.1 Polarização do fóton

O estado do fóton é caracterizada não apenas por seu momentum mas também pelo vetor
polarização ˆk,α . Desde ˆk,α transforma-se como um vetor, a teoria geral do momento angular
nos encoraja-nos a associar a ele uma unidade de momentum angular. Isto é o que se entende
pela afirmação de que o fóton tem um momento angular de spin unitário. Para encontrar as
componentes do spin será considerado inicialmente que
1
ˆk,± = ∓ √ (ˆk,1 ± iˆk,2 ) ,
2
os quais são chamados de vetores de polarização circular. Por uma rotação infinitesimal de δφ
em torno da direção de propagação k, os vetores de polarização circular mudam da seguinte
forma
δφ
δˆk,± = ∓ √ (ˆk,2 ∓ iˆk,1 ) = ∓iδφˆk,± .
2
É por isso que as componentes ˆk,± foram associadas com o spin m = ±1, onde o eixo de
quantização foi escolhido na direção de propagação. Se ˆk,α estivesse ao longo de k, poderíamos
associar m = 0 (desde que k não é alterado por uma rotação infinitesimal em torno de k);
entretanto, o estado m = 0 está ausente na expansão do operador potencial vetor A(r, t) devido
a condição transversalidade k · ˆk,α = 0. Em outras palavras, o spin do fóton ou é paralelo ou
antiparalelo a direção de propagação. Deve-se notar que a ausência do estado m = 0 tem um
significado invariante apenas para uma partícula cuja massa é estritamente zero. Se a massa dos
fótons fosse diferente de zero, poder-se-ia realizar uma transformação de Lorentz, tal que, no
novo referencial do fóton ele estaria em repouso; em tal referencial o spin do fóton é “paralelo a
nada” [33].
A descrição do estado de polarização com ˆk,± tal como vetores de base é denominada a
representação da polarização circular, em contraste com a representação de polarização linear
baseada em ˆk,1 e ˆk,2 . As relações de ortogonalidade para ˆk,± são
ˆk,± · ˆ∗k,± = −ˆk,± · ˆ∗k,∓ = 1

ˆk,± · ˆ∗k,∓ = −ˆk,± · ˆ∗k,± = 0
k · ˆk,± = 0.
Poderia se ter começado com uma expansão de A(r, t) comˆk,± no lugar de ˆk,1 e ˆk,2 . Um
estado de fóton único com polarização circular definida pode ser construído aplicando-se o

operador de criação
1
a†k,± = ∓ √ a†k,1 ± ia‡k,2
2
ao estado de vácuo |0i. Por outro lado, a†k,α |0i, com α = 1, 2 e k = kêz estando na direção z,
esse estado pode ser considerado como uma mistura de 50% dos estado com m = +1 e m = −1.
Como foi dito antes, o rótulo α no estados de um fóton |nk,α i indicam o seu estado de
polarização. Por exemplo, para um fóton viajando na direção k = kêz , o estado de um fóton
|1k,1 i é um fóton com polarizaçãoêx enquanto o estado |1k,2 i indica um estado de um fóton com
polarizaçãoêy . Em particular o estado polarizado circularmente a direita é dado por
1
|Ri = a†k,+ |0i = − √ (|1k,1 i + i |1k,2 i)
2
1 †
= − √ ak,x |0i + ia†k,y |0i
2
enquanto o fóton circularmente polarizado a esquerda é dado por
1
|Li = a†k,− |0i = √ (|1k,1 i − i |1k,2 i)
2
1 † †

= √ ak,x |0i − iak,y |0i
2
Para resumir, o postulado quântico aplicado às variáveis canônicas da radiação oscilante
conduz naturalmente à ideia de que as excitações do campo de radiação da mecânica quântica
podem ser consideradas como partículas de massa zero e spin um. É uma característica geral
da teoria quântica de campos que, com todos os campos que nós associamos uma partícula de
massa definida e spin. Os argumentos que apresentamos podem ser repetidos para a quantização
de outros campos praticamente sem modificações.
Usando a teoria quântica do campo eletromagnético, pode-se verificar que esses estados
correspondem respectivamente aos autoestado de momentum angular +~ e −~, ao longo da
direção do momentum do fóton, verificando que

J·k 1 † † 1 † †
√ ak,x |0i + iak,y |0i = ~ √ ak,x |0i + iak,y |0i
|k| 2 2
e que
J·k 1 †
1 †
† †
√ ak,x |0i − iak,y |0i = −~ √ ak,x |0i − iak,y |0i .
|k| 2 2
Note que o operador momentum angular do campo eletromagnético é dado por
ˆ
J = 0 d3 r r × (E × B) . (9.108)
V
O fóton possui um spin intrínseco de valor um. Dá física clássica sabe-se que há um momento
angular no campo eletromagnético dado pela expressão (9.108). Por exemplo, o disco negro
representado na fig. 9.2 irá começar a girar em torno do seu eixo, se o campo electromagnético
incidente sobre o disco for circularmente polarizado. Mas é claro que esse fenômeno é devido
somente à mecânica quântica desde que seu momento angular é quantizado em unidades de ~.

9.12. Flutuações e relações de incerteza
Devido ao valor do spin do fóton, ele obedece a estatística de Bose-Einstein, qual permite que
diversas partículas compartilhem o mesmo estado, e portanto é um bóson. Isto é confirmado por
(9.97), a qual mostra que há mais do que um fóton com o mesmo momentum ~k e polarização
α no mesmo estado. Esta conexão entre o spin e a estatísticas entrou realmente na teoria na
escolha de que os operadores de criação e aniquilação dos fótons obedecem relações de comutação.
Uma forma alternativa de conectar a mecânica quântica com a teoria de campos, dá-se pelas
relações de anticomutação, a qual limita o número de partículas que podem estar no mesmo
estado de uma partícula.
9.12 Flutuações e relações de incerteza

Note que nem o número de ocupação individual o operador Nν e nem o operador número
total, definido por
X X
N= Nν = a†ν aν (9.109)
ν ν
comutam com A(r, t), E(r, t) e B(r, t), uma vez que os campos são uma soma de operadores de
criação e aniquilação. Portanto, esses observáveis não podem ser determinados simultaneamente
com um grau de precisão arbitrário.
Observáveis correspondentes a operadores que não comutam tem um princípio de incerteza
entre eles. Portanto, não pode-se fixar o número de fótons e conhecer os campos exatamente.
Flutuações no campo ocorrerá mesmo no estado de vácuo, onde sabemos que não há fótons.
É claro que o valor médio do vetor campo eléctrico ou magnético é zero, por simetria. Para
se ter uma ideia sobre o intensidade das flutuações do campo, devemos olhar para o valor
quadrático médio do campo, por exemplo, no estado de vácuo.
Se o número de fótons for aproximadamente fixo, como no caso do estado de vácuo, então deve
existir uma incerteza na intensidade dos campos. Para verificarmos isso considere o operador do
campo elétrico,
r
~ Xp 0 0 0
E(r, t) = − ωk iˆk0 ,α0 ak0 ,α0 (t)eik ·r − a†k0 ,α0 (t)e−ik ·r (9.110)
20 V k0 ,α0
Para um estado |nν i = |nk,α i fixo qualquer temos que:

r
~ωk
hnk,α |E(r, t)|nk,α i = −iˆk,α ×
20 V
hnk,α |ak,α (t)eik·r − a†k,α (t)e−ik·r |nk,α i = 0
pois
hnk,α |ak,α (t)|nk,α i = hnk,α |a†k,α (t)|nk,α i = 0. (9.111)

X ~ωk 0 0
hnν |E · E† |nν i = ˆν 0 · ˆν 00 hnν | (aν 0 (t)eik ·r − a†ν 0 (t)e−ik ·r )× (9.112)
ν 0 ,ν 00
20 V
00 ·r 00
(a†ν 00 (t)e−ik − aν 00 (t)eik ·r ) |nν i (9.113)
X ~ωk0
= hnν |(aν 0 a†ν 0 + a†ν 0 aν 0 )|nν i (9.114)
ν0
20 V
X ~ωk0
= hnν |(2a†ν 0 aν 0 + 1)|nν i (9.115)
ν0
20 V
X ~ωk 1

= nν + δν,ν 0 (9.116)
ν 0
0V 2
Devido ao fator 1/2 vê-se que essa soma é infinita, logo para o estado do vácuo temos que
h0|E · E† |0i − | h0|E|0i |2 = h0|E · E† |0i = ∞. (9.117)
Portanto, nos casos em que os números de ocupação estão fixados, a intensidade dos campos
ficam completamente indeterminados [33]. Esse cálculo é ilustrativo ainda que a resposta seja
infinita. Basicamente, um termo proporcional a aν a†ν primeiro cria um fóton para em seguida
absorvê-lo dando uma contribuição diferente de zero para cada modo de oscilador. Soma-se
infinitos termos, mas devido aos seus infinitos comprimentos de onda infinitamente curtos, a
soma diverge. Mais uma vez, faz sentido em renormalizar a energia máxima.
O efeito dessas flutuações de campo sobre as partículas é mitigado pela mecânica quântica.
Na realidade, qualquer partícula quântica será distribuída ao longo de um volume finito e sua
área média sobre o volume pode fazer com que a partícula experimente uma força.
Por outro lado, uma vez que ao medirmos por um corpo de teste, é a intensidade média do
campo em alguma região do espaço que estamos medindo, portanto pode-se ser mais realista
ao considerar-se o valor médio do operador de campo sobre um ponto, por exemplo, a origem,
definido por ˆ
1
Ē = E d3 r
∆V ∆V
3
no qual ∆V = (∆`) é o volume de um cubo de lado ∆`, que contém o ponto em questão.
Pode-se mostra então que
~c
h0|Ē · Ē|0i ∼ .
(∆`)4
Esse resultado caracteriza as flutuações da intensidade do campo elétrico do vácuo quando não
há fótons presentes. Em geral se o conjunto de números de ocupação for aproximadamente fixo,
então o campo elétrico e o campo magnético não terão um valor preciso, mas apresentarão uma
flutuação em torno de um determinado valor.
Uma outra característica peculiar do campo de radiação quantizado, é que as componentes
dos campos E(r, t) e B(r, t) não necessariamente comutam. Temos por exemplo que
∂
[Ex (r, t), By (r0 , t)] = i~c δ (r − r0 ) .
∂z
Portanto, disso segue que não se pode determinar simultaneamente os campos E(r, t) e B(r, t)
no mesmo ponto do espaço com um certo grau arbitrário de precisão. Porém, é possível mostrar
que 2
t − t0

0 0 2
[Ex (r, t), By (r , t)] = 0 para (r − r ) − 6= 0.
c
Portanto, não há qualquer interferência entre as medidas da intensidade dos campos realizadas
em dois pontos do espaço-tempo, separados por uma distância a qual não pode ser conectada
por um sinal de luz. Esse resultado está em conformidade com o princípio da causalidade da
teoria da relatividade especial.
Sabe-se da óptica clássica que um feixe de luz localizado ou convergente pode ser construído
por uma superposição de várias ondas planas com relações de fase definidas. Por este motivo,
será considerado o operador de fase φk,α associado com um dado modo do campo ν = (k, α), de
tal modo que o observável correspondente é a fase da onda plana em questão, no sentido da
óptica clássica. Isso pode ser feito através das seguinte definições
ak,α = ei(φk,α −ωt) Nk,α ,

p
a†k,α = Nk,α · e−i(φk,α −ωt)

p
p p
na qual o operador Nk,α , satisfaz a propriedade ( Nk,α )2 = Nk,α . O Campo de radiação
p
quantizada pode ser escrito de modo tal que os únicos operadores que surgem são Nk,α e φk,α :
r
1 XX ~ h i
ˆk,α ei(k·r−ωt+φk,α ) Nk,α + Nk,α ˆk,α e−i(k·r−ωt+φk,α ) ,
p p
A(r, t) = √
V k α 20 ωk
o qual, possui um forma conveniente para ser usada na discussão que conecta com a descrição
clássica. As relações de comutação para os operadores ak,α e a†k,α (para um dado modo ν = (k, α))
podem agora ser escritas como para um modo qualquer como
eiφ N e−iφ − N = 1,
eiφ N − N eiφ = eiφ ,
na qual os índices do modo ν = (k, α) foram suprimidos. É fácil provar, expandindo-se cada
exponencial, que cada relação de comutação acima é satisfeita se N φ − φN = i. Isso, nos conduz
a uma nova relação de incerteza para os correspondentes observáveis:
∆N ∆φ & 1.
Por exemplo, se a diferença de fase de duas componentes de uma onda plana é dada
precisamente, então não se pode dizer qual é o número de ocupação associado a cada uma das
componentes da onda.

Capítulo 10
Hamiltoniano de Interação
10.1 Onda Plana Eletromagnética

Uma onda plana eletromagnética, de forma geral tem a seguinte forma,
1 X α ˆα ik·r −iwk t α∗ ˆα −ik·r iwk t

A(r, t) = √ Ck (0)ξk e e + Ck (0)ξk e e ,
V k,α
Ao considerar uma onda plana monocromática com uma frequência wk = ωδk0 ,k e polarização
ξˆα = êz , e vetor de onda k = kêy a expansão do potencial vetor A(x, t) acima tomará a seguinte
k
forma
1
Ckα (0)eiky e−iωt + Ckα∗ (0)e−iky eiωt êz ,

A(r, t) = √
V
a qual é ilustrada na figura 10.1.
Agora, chamando
Ckα (0)
A= √ (10.1)
V
temos então que
A(r, t) = Aeiky e−iωt + A∗ e−iky eiωt êz .

Figura 10.1: Onda eletromagnética plana.
241
10.1. Onda Plana Eletromagnética
Como temos uma onda, então é sempre possível considerar um calibre no qual
U (r, t) =0 (10.2a)
A(r, t) = Aei(ky−ωt) + A∗ e−i(ky−ωt) êz

(10.2b)
note ainda que nesse calibre temos que

∂ i(ky−ωt)
+ A∗ e−i(ky−ωt) = 0,

∇ · A(r, t) = Ae
∂z
portanto estamos usando o calibre de Coulomb.
10.1.1 Campos E e B
Como
∂
E(r, t) = −∇U (r, t) − A(r, t) e B(r, t) = ∇ × A(r, t) (10.3)
∂t
então
E(r, t) =iω Aei(ky−ωt) − A∗ e−i(ky−ωt) êz

(10.4)
B(r, t) =ik Aei(ky−ωt) − A∗ e−i(ky−ωt) êx

(10.5)
Definindo,
1 1
E = iωA e B = ikA com E, B ∈ < (10.6)
2 2
em que E e B são duas quantidades reais tais que
E ω
= = c. (10.7)
B k
temos
1
E(r, t) = E ei(ky−ωt) + e−i(ky−ωt) êz

(10.8)
2
1 i(ky−ωt)
+ e−i(ky−ωt) êx

B(r, t) = B e (10.9)
2
10.1.2 Vetor de Poynting S

Note que Z + Z ∗ = 2<Z e que Z − Z ∗ = 2i=Z portanto, temos que:
E(r, t) =E êz cos(ky − ωt) (10.10)

B(r, t) =Bêx cos(ky − ωt) (10.11)
E aqui, E e B são as amplitudes dos campos elétrico e magnético da onda plana considerada.
O Vetor de Poynting S associado a essa onda plana é:
S(r, t) =0 c2 E(r, t) × B(r, t) (10.12)

S(r, t) =0 cE 2 êy cos2 (ky − ωt) (10.13)
A média temporal deste deste vetor é dada por:

ˆ
1 T 1
S̄ = dt S(r, t) = 0 cE 2 êy (10.14)
T 0 2

10.2. Hamiltoniano de interação para baixas intensidades
10.2 Hamiltoniano de interação para baixas intensidades

interação com o núcleo estático é:
F = −∇V (r) (10.15)
O Hamiltoniano que descreve o movimento de

um elétron de carga q e massa m na presença
A força que atua sobre o elétron devido a da onda plana monocromática é
[P − qA(R, t)]2 q
H= + V (R) + qU (R, t) − S · B (10.16)
2m m
• Os termos qA(R, t) e qU (R, t) vem da interação do elétron com o campo eletromagnético
da onda plana. Note que eles dependem da escolha de calibre, que aqui U (R, t) = 0.
• O termo V (R) representa a interação com o núcleo.
• O termo −(q/m)S · B representa a interação do elétron com o campo magnético oscilante

da onda plana.
Expandindo o Hamiltoniano, lembrando que U (R, t) = 0, obtemos
P · P − q(P · A + A · P) + q 2 A · A q
H= + V (R) − S · B (10.17)
2m m
A diferença entre P · A e A · P pode ser determinada pela ação destes operadores em uma
função de onda arbitrária ψ(x),
(P · A) ψ(r) = −i~∇ · (Aψ) = −i~A · ∇ψ − i~ψ∇ · A.
Desde que ψ(r) é uma função de onda arbitrária, a relação acima pode ser escrita como uma
relação entre operadores:
P · A − A · P = −i~ (∇ · A) , (10.18)
a qual é mantida em qualquer representação, e com isto temos que:
P · A + A · P = 2P · A + i~ (∇ · A)
P · A + A · P = 2A · P − i~ (∇ · A)
Como é sempre possível escolher um potencial vetor A de tal modo que ∇ · A = 0, e esta
escolha de calibre é conhecida como calibre de Coulomb, e ela é feita frequentemente. Note que
para a onda plana representada pelo potencial vetor A(R, t), temos que a relação ∇ · A = 0 é
mantida. Deste modo, a forma geral do hamiltoniano na representação das coordenadas é
P2 q q2 2 q
H= + V (R) − P · A(R, t) + A (R, t) − S · B (10.19)
2m m 2m m
10.3. Luz de Baixa Intensidade
Este Hamiltoniano ainda pode ser escrito como
H = H0 + W (t) (10.20)
no qual o termo devido a interação do elétron com o átomo é

P2
H0 = + V (R) (10.21)
2m
e o termo de interação com a onda plana incidente é
q q2 2 q
W (t) = − P · A(R, t) + A (R, t) − S · B (10.22)
m 2m m
10.3 Luz de Baixa Intensidade

Como a intensidade de uma fonte luz comum é muito baixa, então o feito do termo A2 (R, t)
é negligenciável em relação ao termo diretamente proporcional a A(R, t). Com isso podemos
escrever,
W (t) ' WI (t) + WII (t) (10.23)
em que
q
WI (t) = − P · A(R, t) (10.24)
m
q
WII (t) = − S · B (10.25)
m
Note ainda que, para um estado ligado do elétron, a ordem de magnitude dos
WII (t) (q/m)~kA ~k
' = (10.26)
WI (t) (q/m)pA p
Devido a relação de incerteza para o momentum de um estado ligado do elétron temos que
~
a0 p ' ~ =⇒ ' a0 . (10.27)
p
Como para um átomo temos que a0 ' 0.529 Å e o comprimento de onda λ da onda plana
incidente está relacionado com o seu número de onda por k = 2π/λ. Como λ a0 , temos então
que
WII (t) a0
' 1 (10.28)
WI (t) λ
Portanto, inicialmente considerar somente o termo WI (t), para em seguida considerar também
o termo WII (t).
10.4 Hamiltoniano do Dipolo-Elétrico

Usando a expressão para A(R, t), podemos escrever
q
Pz Aei(kY −ωt) + A∗ e−i(kY −ωt)

WI (t) = − (10.29)
m
10.5. Termo de Dipolo-Elétrico
Figura 10.2: Espectro eletromagnético, com destaque para a região visível.
Figura 10.3: Onda plana visível incidindo sobre o átomo.
Expandindo a exponencial e±ikY em potências de kY ,

1
e±ikY = 1 ± ikY − k 2 Y 2 + . . . (10.30)
2
Como Y é da ordem das dimensões atômica, temos então que
a0
kY ' 1. (10.31)
λ
Portanto, manter somente o termo de ordem zero da expansão, ou seja, o 1 é uma boa aproximação
para WI (t). E esta é a aproximação conhecida como aproximação de dipolo-elétrico. Logo
trocando eikY por 1, e lembrando que A∗ = −A já que A é um imaginário puro, então obtemos
que
q 2iqA
Pz Ae−iωt + A∗ eiωt =

WI (t) = − Pz sen(ωt) (10.32)
m m
λ ' 5000 Å Para luz visível e a0 ' 0.529 Å (10.33)
10.5 Termo de Dipolo-Elétrico

Seja WDE (t) o operador obtido pela troca de eikY por 1, assim
qE
WDE (t) = Pz sen(ωt), (10.34)
mω
10.6. Calibre Alternativo
Este termo é chamado de Hamiltoniano de Dipolo-Elétrico. Portanto a aproximação de dipolo-

elétrico consiste em negligenciar o termo WII (t) em relação a WI (t) e além disso identificamos
WI (t) como WDE (t).
Mostraremos a seguir que se trocarmos W (t) por WDE (t) o elétron irá oscilar como se ele
estivesse submetido a um campo elétrico senoidal uniforme
E(r, t) = E êz cos(ωt), (10.35)
cuja amplitude é aquela do campo elétrico da onda plana incidente na origem O.

Fisicamente isso significa que a função de onda do elétron está muito localizada em torno da
origem O para que o elétron possa sentir a variação espacial do campo elétrico da onda plana
incidente.
Usando o teorema de Ehrenfest, podemos calcular a evolução temporal de hRi (t) com
d hRi 1 hPi qE
= h[R, H0 + WDE ]i = + êz sen(ωt) (10.36)
dt i~ m mω
d hPi 1
= h[P, H0 + WDE ]i = − h∇V (R)i (10.37)
dt i~
Eliminando hPi destas duas equações, obtemos
d2 hRi
m = − h∇V (R)i + qE êz cos(ωt) (10.38)
dt2
Esta expressão diz que o centro do pacote de ondas associado ao elétron move-se como uma
partícula de massa m e carga q a qual está submetida a ação da força central da ligação atômica
e de um campo elétrico uniforme.
10.6 Calibre Alternativo

A expressão obtida para Hamiltoniana de interação de dipolo-elétrico WDE (t) não é usual
para uma partícula de carga q em um campo elétrico uniforme E(r, t) = E êz cos(ωt).
A forma mais usual para esta expressão é a seguinte:
0
WDE (t) = −D · E = −qEZ cos(ωt) (10.39)
na qual D = qR é o momento de dipolo-elétrico associado ao elétron.

0
As expressões para WDE (t) e WDE (t) são equivalentes. Pode-se ir de uma para outra através
de uma transformação de calibre. O calibre usado para obter WDE (t) foi:
U (r, t) =0
E
A(r, t) = êz sen(ky − ωt).
ω
Agora considere a seguinte função escalar
E
χ=z sen(ωt) (10.40)
ω
10.6. Calibre Alternativo
a qual define um outro calibre

∂χ
U 0 (r, t) =U (r, t) − = −zE cos(ωt) (10.41a)
∂t
E
A0 (r, t) =A(r, t) + ∇χ = êz [sen(ky − ωt) + sen(ωt)] . (10.41b)
ω
A aproximação de dipolo-elétrico foi levada em conta trocando ky por 0, logo usando a
mesma aproximação para o potenciais deste novo calibre obtemos:
E
A0 (r, t) ' êz [sen(−ωt) + sen(ωt)] = 0. (10.42)
ω
Para obtermos a Hamiltoniana de interação de dipolo-elétrico, o termo devido a interação do
campo magnético com o spin é negligenciado, então a Hamiltoniana de interação tem a seguinte
forma
[P − qA0 (R, t)]2 q
H0 = + V (R) + qU 0 (R, t) − S · B (10.43)
2m m
P2
= + V (R) + qU 0 (R, t) (10.44)
2m
= H0 + W 0 (t) (10.45)
na qual
W 0 (t) = qU 0 (R, t) = −zqE cos(ωt) = WDE
0
(t). (10.46)
Esta é a Hamiltoniana de interação de dipolo-elétrico usual.
Note que o sistema não é mais descrito pelo mesmo ket quando fazemos uma transfor-
0
mação de calibre. A troca de WDE (t) por WDE (t) deve portanto, ser acompanhada
por uma mudança do vetor de estado, entretanto, o conteúdo físico, realmente
permanece o mesmo.
10.6.1 Elementos de Matriz do Dipolo-Elétrico

Seja
H0 |ϕi i = Ei |ϕi i e H0 |ϕf i = Ef |ϕf i (10.47)
então
qE
hϕf |WDE |ϕi i =sen(ωt) hϕf |Pz |ϕi i (10.48)
mω
Como [R, Pn ] = i~nPn−1 , então, podemos escrever
∂H0 Pz
[Z, H0 ] = i~ = i~ (10.49)
∂Pz m
portanto,
hϕf |[Z, H0 ]|ϕi i = hϕf |ZH0 − H0 Z|ϕi i (10.50)

= −(Ef − Ei ) hϕf |Z|ϕi i (10.51)
i~
= hϕf |Pz |ϕi i . (10.52)
m

10.7. Comentários
Introduzindo a frequência angular de Bohr ωf i = (Ef − Ei )/~, pode-se escrever
hϕf |Pz |ϕi i = imωf i hϕf |Z|ϕi i (10.53)
e consequentemente
ωf i
hϕf |WDE |ϕi i = iq E sen(ωt) hϕf |Z|ϕi i . (10.54)
ω
Portanto, os elementos de matriz de WDE (t) são proporcionais a Z.
10.7 Comentários
• O elemento de matriz hϕf |Z|ϕi i, depende somente de Z, porque o campo elétrico E(r, t),
foi escolhido na direção z.
• Deve-se usar as simetrias dos estados |ϕf i e |ϕi i e não a polarização da luz, para escolher
o sistema de coordenadas. Por exemplo, se um átomo está na presença de um campo
magnético uniforme B(r, t), o eixo mais conveniente para estudar a quantização dos seus
estados estacionários é o eixo paralelo ao campo magnético B(r, t).
• Para um polarização do campo elétrico E(r, t) em uma direção arbitrária, o elemento de

matriz hϕf |WDE |ϕi i será uma combinação linear de X, Y e Z.
10.7.1 Regras de Seleção Para as Transições de Dipolo-Elétrico

Algumas considerações antes de determinarmos as regras de seleção:
• Se hϕf |WDE |ϕi i =

6 0, ou seja, hϕf |Z|ϕi i =
6 0 a transição |ϕi i → |ϕf i é chamada de
transição de dipolo-elétrico. Para estudarmos a transição entre |ϕf i e |ϕi i induzida pela
onda incidente, trocamos W (t) por WDE (t).
• Se hϕf |WDE |ϕi i = 0, devemos levar em conta os termos de mais alta ordem na expansão
de W (t), e com isso as correspondentes transições serão uma transição de dipolo magnético
ou uma transição de quadrupolo elétrico, ou etc . . . .
• Como WDE (t) é muito maior do que os termos subsequentes da expansão em série de W (t)
em a0 /λ, as transições de dipolo elétrico serão as mais intensas.
• A maioria da linhas de transições ópticas emitidas pelos átomos correspondem as transições

de dipolo elétrico.
Considere que as funções de onda na representação |Ri, associadas aos estados |ϕi i e |ϕf i são:

hR | ϕ i = ϕ mi
i ni ,li ,mi (r) = Rni ,li (r)Yli (θ, ϕ)
m
. (10.55)
hR | ϕ i = ϕ
f (r) = R
nf ,lf ,mf (r)Y f (θ, ϕ)
nf ,lf lf

10.8. Acoplamento Spin-Órbita
Como,
r
4π 0
z = r cos θ = rY (θ), (10.56)
3 1
então o elemento de matriz hϕf |Z|ϕi i é proporcional a integral
ˆ
mf ∗
dΩ Ylf (θ, ϕ) Y10 (θ, ϕ) Ylimi (θ, ϕ) = δli ±1,lf δmi ,mf (10.57)
Para maiores detalhes dos possíveis resultados destas integrais, vejam a seção 12.9 do livro
“Mathematical Methods For Physicists” by George B. Arfken and Hans J. Weber. Outras
informações podem ser obtidas na pág 1047 do livro do Cohen-Tannoudji.
Portanto, para haja uma probabilidade finita de transição é necessário que:
∆l = lf − li = ±1 (10.58)
∆m = mf − mi = −1, 0, +1 (10.59)
• Note que Z é um operador ímpar, e portanto, ele só conecta dois estados com paridades
opostas. Já que as paridades dos estados |ϕi i e |ϕf i são definidas pelos índices li e lf , logo
∆l deve ser ímpar, neste caso ∆l = ±1.
• Se escolhermos uma outra polarização, por exemplo, uma paralela ao eixo Ox ou ao eixo
Oy, nesses casos teremos mf = mi ± 1.
• Se houver um acoplamento spin-órbita ξ(r)L · S entre L e S, os estados estacionários do

elétron são rotulados pelos índices l, s, J, m, com J = L + S.
10.8 Acoplamento Spin-Órbita

As regras de seleção da transição por dipolo elétrico podem ser obtidas calculando os
elementos de matriz não nulos de
hlf , sf , Jf , mf |R|li , si , Ji , mi i . (10.60)
Usando as expansão destes vetores da base nos kets |lmi |s, ms i encontramos
∆J = 0, ±1 (10.61)
∆l = ±1 (10.62)
∆mJ = −1, 0, +1 (10.63)
Note ainda que ∆J = 0 não é uma transição proibida, a não ser no caso em que Ji = Jf = 0.
Isso, deve-se ao fato de que J não está relacionado com a paridade do estado no nível específico.

10.9. Hamiltonianas de Dipolo Magnético e Quadrupolo Elétrico
10.9 Hamiltonianas de Dipolo Magnético e Quadrupolo

Elétrico
Agora iremos levar em conta os termos de mais altas ordens na Hamiltoniana de interação,
portanto, W (t) pode ser reescrita como
W (t) = WI (t) + WII (t) = WDE (t) + [WI (t) − WDE (t)] + WII (t), (10.64)
Como já estudamos WDE (t), vimos que

WI (t) − WDE (t) a0 WII (t) a0
' e ' . (10.65)
WDE (t) λ WDE (t) λ
Para calcular o termo WI (t) − WDE (t) simplesmente trocamos e±ikY por e±ikY − 1 '=
±ikY + . . ., logo obtemos que
q
ikAe−ωt + −ikA∗ eωt PZ Y + . . .

WI (t) − WDE (t) = − (10.66)
m
ou usando o fato de que ikA/2 = B, encontramos que
q
WI (t) − WDE (t) = − B cos(ωt)PZ Y + . . . (10.67)
m
Se escrevermos Pz Y na forma:
1 1 1 1
Pz Y = (Pz Y − ZPy ) + (Pz Y + ZPy ) = Lx + (Pz Y + ZPy )
2 2 2 2
obtemos finalmente que
q q
WI (t) − WDE (t) = − Lx B cos(ωt) − [Y Pz + ZPy ]B cos(ωt) + . . . (10.68)
2m 2m
Na expressão para WII (t) é inteiramente justificável trocarmos e±ikY por 1. Portanto,
obtemos termos da ordem de a0 /λ em relação a WI (t), isto é, da mesma ordem de magnitude
de WI (t) − WDE (t), assim
q
WII (t) = − Sx B cos(ωt) + . . . (10.69)
m
Substituindo as eqs. (10.68) e (10.69) na equação (10.64), e agrupando os termos, obtemos
W (t) = WDE (t) + WDM (t) + WQE (t), (10.70)
a qual é uma Hamiltoniana de interação que está levando em contas termos de ordem maior que
a0 /λ. Note, o primeiro termo já é conhecido e é da ordem de a0 /λ, enquanto os outros dois não.
Na expressão anterior para W (t) temos que
qE
WDE (t) = Pz sen(ωt) gauge U (R, t) = 0 (10.71)
m
WDE (t) = −ZqE cos(ωt) gauge A0 (R, t) = 0 (10.72)
q
WDM (t) = − (Lx + 2Sx )B cos(ωt) (10.73)
2m
q
WQE (t) = − [Y Pz + ZPy ]E cos(ωt) (10.74)
2mc
Aqui WDM (t) e WQE (t) são respectivamente as Hamiltonianas de dipolo magnético e de quadru-
polo elétrico, e além disso, são da mesma ordem de magnitude. Note que na expressão para
WQE (t), trocamos B por E/c.

10.10. Regras de seleção
10.9.1 Transições de Dipolo Magnético

O termo WDM (t) representa a interação do momento magnético total do elétron com o
campo magnético oscilante da onda incidente, e as transições induzidas por ele são chamadas de
transições de dipolo magnético.
Agora devemos estabelecer as regras de seleção para termos transições induzidas pelo termo
de dipolo magnético WDM (t) entre os estados |ϕi i e |ϕf i. Para que estas transições ocorram é
necessário que
hϕf |WDM |ϕi i =
6 0 (10.75)
Note que:
• Como nem Lx e nem Sx mudam o número quântico l, temos então que ∆l = 0 para todo l.
• Como Lx muda o autovalor mL de Lz por ±1, então temos que ∆mL = ±1.
• Como Sx muda o autovalor mS de Sz por ±1, então temos que ∆mS = ±1.
• Note ainda que se o campo magnético da onda incidente for paralelo ao eixo Oz, temos
que ∆mL = 0 e ∆mS = 0.
10.10 Regras de seleção

Portanto, as regras de seleção para as transições de dipolo magnético acima citadas podem
ser agrupadas da seguinte forma:
∆l = 0 (10.76)
∆mL = ±1, 0 (10.77)
∆mS = ±1, 0 (10.78)
10.10.0.1 Comentários: Acoplamento spin-órbita
• Na presença de um acoplamento spin-órbita os autoestados de H0 são rotulados pelos

números quânticos l e J. Como Lx e Sx não comutam com J2 , então WDM não pode
conectar estados com o mesmo l, mas com j diferente. Usando as fórmulas para adição de
um momentum angular l com um 1/2, obtemos as seguintes regras de seleção:
∆l = 0 (10.79)
∆J = ±1, 0 (10.80)
∆mL = ±1, 0 (10.81)
• Note ainda que a transição hiperfina F = 0 ↔ F = 1 do estado fundamental do átomo

de hidrogênio é da mesma ordem de magnitude da transição de dipolo magnético, já que
as componentes de S tem elementos de matriz não nulos entre os estados dos níveis F = 1
e o estado |F = 0, mF = 0i.

10.10.1 Transições de Quadrupolo Elétrico

No termo de quadrupolo elétrico dado por
q
WQE (t) = − [Y Pz + ZPy ]E cos(ωt) (10.82)
2mc
podemos reescrever o termo Y Pz + ZPy , da seguinte forma:
Y Pz + ZPy = Y Pz + Py Z (10.83)
m
= {Y [Z, H0 ] + [Y, H0 ]Z} (10.84)
i~
m
= (Y ZH0 − H0 Y Z) (10.85)
i~
Portanto, a Hamiltoniana de interação de quadrupolo elétrico pode ser reescrita como
q
WQE (t) = − (Y ZH0 − H0 Y Z) E cos(ωt) (10.86)
2i~c
Logo, o elemento de matriz é
q
hϕf |WQE |ϕi i = ωf i hϕf |Y Z|ϕi i E cos(ωt) (10.87)
2ic
10.10.2 Análise do termo de quadrupolo elétrico

O termo Y Z que aparece no elemento de matriz hϕf |WQE |ϕi i é uma das componentes do
termo de quadrupolo elétrico do átomo. Além disso, note ainda que
qωf i ωf i ω ωf i
E =q E =q kE (10.88)
c ω c ω
Como o campo elétrico da onda plana incidente é E(r, t) = E êz cos(ky − ωt), então
∂Ez
q = −qkE sen(ky − ωt) (10.89)
∂y
Portanto, o elemento de matriz hϕf |WQE |ϕi i tem a mesma ordem de magnitude de q∂Ez /∂y.
Dessa forma, pode-se interpretar WQE (t) como a interação do momentum de quadru-
polo elétrico do átomo com o gradiente do campo elétrico da onda plana incidente.
10.10.3 Cálculo dos elementos de Matriz

Para obtermos as regras de seleção para as transições de quadrupolo elétrico deve-se notar
que na representação |ri, temos que
r
2π −1
r Y1 (θ, ϕ) − Y11 (θ, ϕ)

x= (10.90)
3
r
2π −1
r Y1 (θ, ϕ) + Y11 (θ, ϕ)

y=i (10.91)
3
r
4π 0
z= rY (θ, ϕ) (10.92)
3 1

e sabemos também que os harmônicos esféricos de ordem 1 são dados por

r
0 3
Y1 (θ, ϕ) = cos θ (10.93)
4π
r
3
Y1±1 (θ, ϕ) = ∓ sen θe±iϕ (10.94)
8π
enquanto os de ordem 2 são dados por
r
5
Y20 (θ, ϕ) = (3cos2 θ − 1) (10.95)
16π
r
15
Y2±1 (θ, ϕ) = ∓ sin θ cos θe±2iϕ (10.96)
8π
r
±2 15
Y2 (θ, ϕ) = sin2 θe±2iϕ (10.97)
32π
Portanto, vemos que o produto Y Z é dado por uma combinação linear de r2 Y21 , ou seja,
Y Z = αr2 [Y2−1 (θ, ϕ) + Y21 (θ, ϕ)] (10.98)
Com isso, no cálculo do elemento de matriz surgiram integrais do tipo

ˆ
m ∗
dΩ Ylf f (θ, ϕ) Y2±1 (θ, ϕ) Ylimi (θ, ϕ) (10.99)
Para maiores detalhes dos possíveis resultados destas integrais, vejam a seção 12.9 do livro
“Mathematical Methods For Physicists” by George B. Arfken and Hans J. Weber. Outras
informações podem ser obtidas na pág 1047 do livro do Cohen-Tannoudji.
10.10.4 Regras de Seleção

A integral anterior só não será nula se
∆l = 0, ±2 e ∆m = ±1. (10.100)
Entretanto, quando consideramos uma onda incidente com polarização arbitrária está última
relação torna-se ∆m = ±2, ±1, 0 e as regras de seleção da transição de quadrupolo elétrico
podem ser escritas como 
∆l = 0, ±2
(10.101)
∆m = 0, ±1, ±2
COMENTÁRIOS
• WDM e WQE são operadores pares, logo conectam somente estados com a mesma paridade.
• Para uma dada transição WDM e WQE nunca competem com a transição WDE , e isso,
facilita a observação das transições de dipolo magnético e de quadrupolo elétrico.

10.11. Excitações Não-Ressonantes
10.10.5 COMENTÁRIOS
• A maioria das transições ocorrem no domínio da micro-ondas ou da rádio-frequência – em
particular as transições por ressonância magnética – são transições por dipolo magnético.
• Para uma transição na qual ∆l = 0 e ∆m = 0, ±1, os dois operadores WDM e WQE tem
simultaneamente elementos de matriz não-nulos.
• Portanto, é possível encontrar uma condição experimental sobre a qual somente transições
de dipolo magnético são induzidas. Neste caso o que precisamos é colocar o átomo, não
na trajetória da onda plana, mas dentro de uma cavidade ressonante ou numa bobina de
rádio-frequência, no ponto em que B é grande e o gradiente de E é negligenciável.
• Para uma transição na qual ∆l = 2, WDM não compete com WQE , e temos uma transição
de quadrupolo elétrico pura. Como um exemplo dessa transição pode-se mencionar a linha
verde do oxigênio atômico (λ = 5577 Å), a qual aparece no espectro da aurora boreal.
• Se levarmos em conta os termos de mais altas ordens da expansão em série da exponencial

e±ikY , obteremos os termos de octopolo elétrico e quadrupolo magnético, e assim por
diante.
10.11 Excitações Não-Ressonantes

• Consideremos o caso em que a frequência ω da onda plana incidente não coincide com
nenhuma das frequências de Bohr associadas com as transições de um estado |ϕi i para
um estado |ϕf i.
• Sobre o efeito desta excitação o átomo adquire um momento de dipolo elétrico hDi (t)
o qual oscila numa frequência angular ω (uma oscilação forçada) e é proporcional a E
quando E é pequeno, regime de resposta linear.
• Iremos comparar os resultados da teoria de perturbação com o modelo de elétron ligado

elasticamente.
• Estes resultados são muito importantes no estudo das propriedades ópitcas dos materiais.
10.12 Modelo Clássico de Elétrons Ligados
10.13 Susceptibilidade Elétrica

O campo elétrico do feixe de luz, faz com que as cargas positivas e negativas se desloquem
em direções opostas induzindo, portanto, uma polarização no meio conforme figura. Portanto, é
possível e natural descrever as constantes ópticas de um meio em termos da sua polarizabilidade.

10.13. Susceptibilidade Elétrica
+ + + + + +
+ + + + + + + +
+ + + + + +
+ + ++
+ +
+ +
d
− −
− −
−− −−
− − − − − −
− − − − − − − −
− − −
− − −
Figura 10.4: Distribuição eletrônica de carga de um átomo, sob a ação de um campo elétrico uniforme.
Portanto, é possível e natural descrever as constantes ópticas de um meio em termos da sua

polarizabilidade.
Em geral, a polarizabilidade, ou o momento de dipolo induzido por unidade de volume,
depende do campo elétrico incidente, da seguinte forma [3, 17, 18, 28]:
P = 0 χE + χ(2) E2 + χ(3) E3 + · · · = 0 χe E

(10.102)
χe = χ + χ(2) + χ(3) + · · ·
Consideraremos que o campo elétrico devido a luz seja pequeno o suficiente, de modo que
somente o primeiro termo, ou seja, o termo linear no campo elétrico seja considerado. χe é a
susceptibilidade do material 0 é a permissividade dielétrica do vácuo (espaço livre).
Na ausência dos efeitos dos portadores livres, as equações de Maxwell mostram que uma
onda eletromagnética se propagará através do material com uma velocidade
c2 c2 c2
v2 = = =
ε /0 1 + χe
em que c é a velocidade da luz no vácuo, ε = /0 = 1 + χe , é a constante dielétrica do meio,

e é a permissividade do sólido. A constante dielétrica ε depende da frequência da onda
eletromagnética. Como já vimos em eletromagnetismo, a constante dielétrica ε é complexa,
portanto, a susceptibilidade também é complexa.
A natureza complexa da permissividade e portanto da susceptibilidade significa que existe
uma diferença de fase entre a polarização induzida e o campo elétrico.

10.14. Interação da Radiação com Elétrons Ligados aos Átomos
r Energia de dissociação
Harmônico
Morse
Energia
n=7 De D0
n=6
n=5
n=4
n=3
n=2
n=1
n=0
re Separação internuclear (r)

Figura 10.5: Potencial de Morse para uma molécula diatômica. Neste ilustra-se o quanto ele se
distância de um potencial Harmônico, e as respectivas alterações nos níveis de energia.
10.14 Interação da Radiação com Elétrons Ligados aos Áto-

mos
As propriedades ópticas dos materiais para energias superiores a 1 eV são determinadas,
principalmente, pelas transições dos elétrons ligados aos átomos. Podemos entender estas
transições com um modelo clássico simples, o qual considera um deslocamento das cargas
elétricas negativas com relação ao núcleo positivo. Este deslocamento gera uma força eletrostática
restauradora levando a um movimento oscilatório do elétron ao redor do núcleo, ou seja, um
oscilador harmônico. Superpomos a esse movimento uma força externa oscilante devida ao
campo elétrico da radiação.
O modelo simplificado consiste de um elétron com massa m e carga −e oscilando em torno
do núcleo e sob ação da força do campo elétrico da radiação. Para um campo elétrico oscilante
com frequência ω, a equação do movimento (F = ma) do elétron é,
2
dx dx 2
m + 2γ + ω0 x = −eE(t), (10.103)
dt2 dt
no qual x é o deslocamento do elétron em relação a sua posição de equilíbrio, ω0 é a frequência

natural do oscilador (movimento elétron-núcleo) e γ é a taxa de amortecimento do movimento.
O campo elétrico é considerado como sendo monocromático com uma frequência ω, isto é,
E(t) = E0 cos(ωt). Entretanto é mais conveniente considerarmos um campo complexo,
E(t) = E(ω)e−iωt (10.104)

10.15. Cálculo Quântico do Momento de Dipolo Induzido
e ao tomarmos a parte real, obtemos o resultado físico. Uma solução de (10.103) é obtida
substituindo x(t) = x(ω)e−iωt na equação acima, obtendo
m ω 2 + i2γω − ω02 x(ω) = −eE(ω)

(10.105)
Essa é a solução complexa de um oscilador amortecido forçado em estado estacionário.

O deslocamento do elétron em relação ao núcleo produz um momento de dipolo elétrico
p = −ex em cada átomo. Em N átomos por unidade de volume, obtemos a polarização resultante
P = −N ex, portanto, temos
N e2 1
P (ω) = −N ex(ω) = 2 2
E(ω). (10.106)
m (ω − ω0 + i2ωγ)
O coeficiente complexo entre P (ω) e E(ω) é definido como sendo a susceptibilidade óptica
ξ(ω). Para um oscilador amortecido, essa susceptibilidade óptica é
N e2

1 1
χ(ω) = − . (10.107)
2m0 ω00 ω − ω0 + iγ ω + ω00 + iγ
0
Aqui q
ω00 = ω02 − γ 2 (10.108)
é a frequência de ressonância que foi renormalizada (deslocada) devido ao termos de amorteci-

mento.
Para uma discussão maior veja:
• Veja capítulo 27, do Ashcroft, a seção de polarizabilidade.
• Para uma discussão um pouco mais profunda, veja capítulo 1 do livro: "Quantum theory of
the Optical and Electronic Properties of Semiconductors" por Hartmut Haug and Stephan
W. Koch, Fourth Edition World Scientific, 2004.
10.15 Cálculo Quântico do Momento de Dipolo Induzido

Calcularemos somente os termos de primeira ordem em E, do vetor de estado |ψ(t)i do
átomo no instante t. O potencial perturbativo é o campo elétrico externo E(t) = E0 e−iωt . Iremos
considerar que no instante t = 0 o átomo se encontrava no estado
|ψ(t = 0)i = |ϕ0 i (10.109)
Como
W (t) = −eZE(t) = −DE(t) (10.110)
então temos que,

Wn0 (t) = − hϕn |D|ϕ0 i E(t) = −Dn0 E(t) (10.111)

A função de onda, corrigida em primeira ordem de perturbação é dada por,

X
|ψ(t)i = e−iE0 t/~ |ϕ0 i + b(1)
n (t)e
−iEn t/~
|ϕn i (10.112)
n6=0
deixando o fator de fase global e−iE0 t/~ em evidência, temos

" #
X
|ψ(t)i = e−iE0 t/~ |ϕ0 i + b(1)
n (t)e
−iωn0 t
|ϕn i (10.113)
n6=0
Aqui ωn0 é a frequência de Bohr, dada por

En − E0
ωn0 = . (10.114)
~
Temos que
ˆt
1 0
b(1)
n (t) = dt0 Wn0 (t0 )eiωn0 t (10.115)
i~
0
(1)
Considerando que o elétron se encontrava no estado |ϕ0 i sem o campo, ou seja, bn (t = −∞) = 0
e que o campo será ligado adiabaticamente, então substituindo a eq. (10.111) na (10.111),
obtemos
ˆt
Dn0 0
b(1)
n (t) =− dt0 E(t0 )eiωn0 t (10.116)
i~
−∞
aqui trocamos o limite inferior de integração para −∞ porque iremos considerar que estamos
ligando o campo elétrico adiabaticamente.
Para resolvermos a integral em (10.116), expressamos o campo elétrico através de sua
transformada de Fourier, ˆ
dω
√ E(ω)e−iωt eγt
E(t) = lim (10.117)
γ→0 2π
Introduzimos o fator de chaveamento adiabático eγt , para assegurar que E(t) → 0 quando
t → −∞. Veremos que o parâmetro de chaveamento γ desempenha o mesmo papel do parâmetro
de amortecimento do oscilador harmônico amortecido clássico. A existência de γ garante que a
susceptibilidade óptica resultante tenha polos somente na metade inferior do plano complexo,
isto é, a causalidade é obedecida. Por uma questão de simplicidade de notação, não iremos
carregar mais o símbolo lim , mas deve ficar entendido que este limite é implícito. Inserindo
γ→0
(10.117) em (10.116) obtemos
ˆ ˆt
Dn0 dω 0
b(1)
n (t) =− √ dt0 E(ω)e−i(ω−ωn0 +iγ)t
i~ 2π
−∞
ˆ
Dn0 dω e−i(ω+ω0n +iγ)t
=− √ E(ω) (10.118)
~ 2π ω + ω0n + iγ
Aplicando o limite γ → 0 só na exponencial, podemos escrever
ˆ
(1) Dn0 dω e−i(ω+ω0n )t
bn (t) = − √ E(ω) (10.119)
~ 2π ω + ω0n + iγ

Substituindo o coeficiente (10.119) na expressão da função de onda (10.113), obtemos

"
X Dn0 ˆ −iωt
#
dω e
|ψ(t)i = e−iE0 t/~ |ϕ0 i − |ϕn i √ E(ω) (10.120)
n6=0
~ 2π ω + ω 0n + iγ
A polarização induzida pelo campo é dada como o valor esperado do valor do operador de
dipolo, ou seja,
P(t) = N hψ(t)|D|ψ(t)i , (10.121)
em que N é a densidade de átomos mutuamente independentes (não-interagentes) no sistema.
Substituindo (10.120) na equação (10.121) e mantendo somente os termos de até primeira
ordem no campo obtemos que
X |Dn0 |2 ˆ dω

E(ω)e−iωt E ∗ (ω)eiωt

P(t) =N hϕ0 |D|ϕ0 i − N √ × + (10.122)
n
~ 2π ω + ω 0n + iγ ω + ω0n − iγ
ˆ
X |Dn0 |2 E(ω)e−iωt E ∗ (ω)eiωt

dω
=N √ × + (10.123)
n
~ 2π ω + ω0n + iγ ω + ω0n − iγ
Como o operador D, tem paridade ímpar, então o elemento de matriz hϕ0 |D|ϕ0 i, é nulo.
Da definição de E(t) temos que
ˆ+∞
dω
E(t) = √ E(ω)eiωt , (10.124)
2π
−∞
mas como o campo elétrico é uma grandeza física, ele é real, ou seja,
ˆ+∞ ˆ+∞
∗ dω dω
E(t) = E (t) =⇒ √ E(ω)eiωt = √ E ∗ (ω)e−iωt (10.125)
2π 2π
−∞ −∞
na última integral, trocando ω → −ω, obtemos

ˆ+∞ ˆ−∞ ˆ+∞
dω −dω ∗ dω
√ E(ω)eiωt = √ E (−ω)eiωt = √ E ∗ (−ω)eiωt (10.126)
2π 2π 2π
−∞ +∞ −∞
logo concluímos que se E(t) é real, então
E(ω) = E ∗ (−ω) (10.127)
Portanto, trocando ω → −ω no segundo termo da (10.122), obtemos que

X |Dn0 |2 ˆ dω
E(ω) E ∗ (−ω)

−iωt
P(t) = −N √ e × − (10.128)
n
~ 2π ω + ω0n + iγ ω − ω0n + iγ
mas como E(ω) = E ∗ (−ω), temos então que

X |Dn0 |2 ˆ dω
1 1
ˆ
dω
−iωt
P(t) = −N √ E(ω)e × − = √ P(ω)e−iωt
n
~ 2π ω + ω0n + iγ ω − ω0n + iγ 2π
(10.129)

10.16. Força do Oscilador
da qual segue imediatamente que,

X |Dn0 |2 1 1

P(ω) = −N − · E(ω). (10.130)
n
~ ω + ω0n + iγ ω − ω0n + iγ
Porém, como P(ω) = χ(ω)E(ω), segue então que a susceptibilidade óptica atômica é dada por

NX 2 1 1
χ(ω) = − |Dn0 | − . (10.131)
~ n ω + ω0n + iγ ω − ω0n + iγ
10.16 Força do Oscilador

Ao compararmos a susceptibilidade óptica atômica, com o resultado do modelo do oscilador
harmônico clássico, vê-se que ambas as expressões possuem uma estrutura similar. Entretanto,
em comparação com o oscilador clássico, o modelo atômico é representado não por, um mas
por muitos osciladores com diferentes frequências de transição ω0n . A susceptibilidade óptica
atômica pode ser escrita como
N e2 X fn0

1 1
χ(ω) = − − , (10.132)
2m n ω0n ω + ω0n + iγ ω − ω0n + iγ
portanto, cada oscilador parcial tem a força de
2mωn0 | hϕn |Z|ϕ0 i |2

fn0 = (10.133)
~
Aqui, usamos o fato de que
|Dn0 |2 = e2 |Zn0 |2 = e2 | hϕn |Z|ϕ0 i |2 . (10.134)
A força de oscilador satisfaz a seguinte regra de soma,

∞
X
fn0 = 1, (10.135)
n=0
a qual é conhecida como regra de soma de Thomas-Reiche-Kuhn. Aqui ωn0 = (En − E0 )/~ é a
frequência de Bohr.
Para verificarmos isso, usaremos a força de oscilador (10.133), para escrever
∞ ∞
X 2m X
fn0 = 2 hϕn |Z|ϕ0 i hϕ0 |Z|ϕn i (En − E0 ) (10.136)
n=0
~ n=0
Usando a equação de Schrödinger
H0 |ϕn i = En |ϕn i (10.137)
podemos escrever
hϕ0 |Z|ϕn i (En − E0 ) = hϕ0 |[Z, H0 ]|ϕn i = − hϕ0 |[H0 , Z]|ϕn i . (10.138)

10.16. Força do Oscilador
Substituindo (10.138) em (10.136) obtemos que

∞ ∞
X 2m X
fn0 = hϕn |Z|ϕ0 i (− hϕ0 |[H0 , Z]|ϕn i) (10.139)
n=0
~2 n=0
∞
2m X
=− 2 hϕ0 |[H0 , Z]|ϕn i hϕn |Z|ϕ0 i
~ n=0
2m
=− hϕ0 |[H0 , Z]Z|ϕ0 i (10.140)
~2
onde usamos a completeza
X
|ϕn i hϕn | = 1. (10.141)
n
Alternativamente temos que
hϕn |Z|ϕ0 i (En − E0 ) = hϕn |[H0 , Z]|ϕ0 i (10.142)
Substituindo (10.142) em (10.136) obtemos que

∞ ∞
X 2m X
fn0 = 2 hϕn |[H0 , Z]|ϕ0 i hϕ0 |Z|ϕn i (10.143)
n=0
~ n=0
∞
2m X
=− hϕ0 |Z|ϕn i hϕn |[H0 , Z]|ϕ0 i
~2 n=0
2m
hϕ0 |Z[H0 , Z]|ϕ0 i
= (10.144)
~2
Agora somando as expressões (10.139) e (10.143), obtemos que
∞
X 2m
2 fn0 = hϕ0 | [Z, [H0 , Z]] |ϕ0 i (10.145)
n=0
~2
Como
[Z, Pzn ] = ni~Pzn , (10.146)
e considerando que
Pz2
H0 = + V (Z) (10.147)
2m
segue imediatamente que
Pz
[H0 , Z] = −i~ , (10.148)
m
logo
i~ ~2
[Z, [H0 , Z]] = −
[Z, Pz ] = (10.149)
m m
Portanto, substituindo (10.149) em (10.145), chega-se em
∞
X
fn0 = 1 (10.150)
n=0
conforme queríamos mostrar.

Essa expressão é a regra de soma das forças de osciladores, a qual mostra que a força total
das transições num átomo podem ser vistas como aquelas de um oscilador que é distribuído
sobre muitos osciladores parciais, cada um tendo uma força fn0 .

10.17. Excitação ressonante. Absorção e emissão induzidas
10.17 Excitação ressonante. Absorção e emissão induzidas

10.17.1 Onda plana monocromática: Transição de probabilidade
Considere um átomo no estado inicial |ϕi i, colocado em um campo eletromagnético cuja
frequência é próxima da frequência de Bohr ωf i .
Vimos que para a aproximação de dipolo que:
ωf i
hϕf |WDE |ϕi i = iq E sen(ωt) hϕf |Z|ϕi i , (10.151)
ω
e da teoria de perturbação dependente do tempo vimos que a probabilidade de transição para
uma perturbação senoidal pode ser escrita como
|Wf i |2
Pif (t; ω) = 2
|A+ (t, ω) + A− (t, ω)|2 (10.152)
4~
na qual
A± (t, ω) = (10.153)
ωf i ± ω
Note que
A± (t, ω) =
ωf i ± ω

i(ωf i ±ω)t/2 sen[(ωf i ± ω)t/2]
= −ie
(ωf i ± ω)/2
Portanto, temos que,
2
2 sen[(ωf i ± ω)t/2]
|A± (t, ω)| = F (t, ω ± ωf i ) = (10.154)
(ωf i ± ω)/2
Absorção Emissão
A probabilidade de transição, para absorção ou emissão, é então dada por
|Wf i |2
Pif (t; ω) = 2
|A± (t, ω)|2 (10.155)
4~
Assim
q 2 ω f i 2
Pif (t; ω) = 2 |hϕf |Z|ϕi i|2 E 2 F (t, ω ± ωf i ) (10.156)
4~ ω
Comentários:

10.18. Largura de Linha da excitação. Probabilidade de transição por unidade de tempo
• A probabilidade de transição depende do calibre escolhido, pois os estados também

dependem da escolha de calibre, isso significa que eles não possuem a mesma interpretação
física em ambos os calibres.
• Para t → ∞, a função de difração F (t, ω ± ωf i ) tende a uma delta δ(ω ± ωf i ) e o fator

(ωf i /ω)2 tende a unidade. Nesse limite obtemos a mesma densidade de probabilidade
Pif (t; ω) em ambos os calibres.
• Para compreendermos esse resultado, considere um pacote de onda muito largo, quase-
monocromático, de extensão espacial finita, em vez de uma onda plana que se estende até o
infinito. Quando t → ∞, o campo E “visto” pelo átomo tende a zero, e a transformação de
calibre associada com a função χ definida em (10.40) tende a unidade. Consequentemente
os kets |ϕ0 i e |ϕf i representam estados que em cada um dos calibres, serão iguais, ou seja,
E E
(g1) (g2)
ϕ0 = ϕ 0 = |ϕ0 i (10.157)
E E
(g1) (g2)
ϕ f = ϕf = |ϕf i . (10.158)
• Obviamente, também é possível considerar a probabilidade de transição entre dois estados

de um sistema atômico com energias bem definidas, para um intervalo de tempo finito.
Nesse caso, os autoestados |ϕ0 i e |ϕf i do Hamiltoniano atômico H0 , dado por
P2
H0 = + V (R), (10.159)
2m
representa somente os estados de um sistema atômico com energias (cinética e potencial)
bem definidas, no calibre (10.41) no qual o potencial vetor A é zero, conforme (10.42), e
P2 /2m representa a energia cinética do sistema. O mesmo estado físico deveria ser repre-
sentado no calibre (10.2) pelos estados e−iqχ(r,t)/~ |ϕ0 i e e−iqχ(r,t)/~ |ϕf i respectivamente.
Para um tempo t finito, os cálculos são simples no calibre (10.41). Desde que no resto,
deste capítulo, trocamos F (t, ω ± ωf i ) por δ(ω ± ωf i ), consideraremos o limite em que
t → ∞, no qual essas dificuldades desaparecem.
10.18 Largura de Linha da excitação. Probabilidade de

transição por unidade de tempo
Na prática, em geral a radiação que atinge o átomo não é monocromática. Denotando por
F(ω)dω o fluxo incidente de energia eletromagnética por unidade de superfície no intervalo
[ω, ω + dω]. A variação de F(ω) com relação a ω é mostrada na figura 10.6. A largura de linha
da excitação é ∆. Se ∆ for infinito, podemos dizer que estamos tratando com um “espectro
largo”.
As diferentes ondas monocromáticas que constituem a radiação incidente, em geral são
incoerentes: elas possuem uma relação de fase bem definida. A probabilidade de total de transição

Figura 10.6: Distribuição espectral do fluxo de energia eletromagnética incidente por unidade de
superfície. ∆ é a largura da distribuição espectral.
P̄if (t), pode ser obtida portanto, pela soma das probabilidades de transições associadas com
cada uma dessas ondas monocromáticas. Portanto, devemos trocar o termo E 2 por 2F(ω)dω/0 c
na expressão (10.156) e integrar sobre ω. Isso, fornece:
ˆ
q2 2
ω 2
fi
P̄if (t) = |hϕf |Z|ϕ i i| dω F(ω)F (t, ω ± ωf i ) (10.160)
20 c~2 ω
Para calcularmos a integral em (10.160), comparamos a largura ∆ da função F(ω) com a

largura 4π/t da função F (t, ω ± ωf i ), e como ∆ 4π/t, então nesse caso, o comportamento de
F (t, ω ± ωf i ) é o mesmo da função δ(ω ± ωf i ). Se t for grande o suficiente para fazer ∆ 4π/t,
enquanto a perturbação permanece pequena o suficiente, para o tratamento perturbativo
continuar válido, podemos considerar que
F (t, ω ± ωf i ) ≈ 2πtδ(ω ± ωf i ), (10.161)
o que resulta em
πq 2
P̄if (t) = 2
|hϕf |Z|ϕi i|2 · F(±ωf i ) · t (10.162)
0 c~
a qual pode ser reescrita na seguinte forma
P̄if (t) = Cif · F(±ωf i ) · t, (10.163)
na qual
4π 2
Cif = |hϕf |Z|ϕi i|2 · α (10.164)
~
e a constante de estrutura fina α, é dada por
q2 1 e2 1
α= · = ≈ . (10.165)
4π0 ~c ~c 137
Este resultado mostra que P̄if (t) aumenta linearmente com o tempo. A probabilidade de
transição por unidade de tempo Wif é portanto, igual a:
Wif = Cif · F(±ωf i ). (10.166)

Neste capítulo, consideramos a caso da radiação se propagando ao longo de uma dada

direção com um estado de polarização bem definido. Fazendo uma média dos coeficientes
Cif sobre todas as direções de propagação e sobre todos os possíveis estados de polarização,
podemos introduzir os coeficientes Bif , análogos aos coeficientes Cif , definindo a probabilidade
de transição por unidade de tempo para um átomo colocado na presença de uma radiação
isotrópica. Os coeficientes Bif (e Bf i ) são nada mais que os coeficientes introduzidos por Einstein
para descrever a absorção (e emissão induzida). Portanto, vimos como a mecânica quântica nos
permite calcular esses coeficientes.


Capítulo 11
Espalhamento
11.1 Introdução
A teoria de espalhamento é essencialmente uma teoria de perturbação independente do

tempo (TPIT) aplicado ao caso de um espectro contínuo. Isso significa que sabemos que há
um autoestado do Hamiltoniano completo para toda a energia possível, E. Assim, o trabalho
de encontrar conjunto completo dos autovalores, que foi uma parte importante da TPIT, não
é necessário aqui. Na teoria de espalhamento, simplesmente escolhe-se um valor qualquer de
energia E, e em seguida, tenta-se encontrar a o autoestado “perturbado”, |ψ(E)i. Por outro
lado, lembre-se que normalmente há vários autoestados degenerados para qualquer energia.
Portanto, a questão torna-se; qual dos presumivelmente infinitos e muitas vezes degenerados
autoestados estamos tentando calcular? A resposta vem de causalidade; nós queremos ser
capazes de especificar completamente a amplitude da corrente de probabilidade vindo de r = ∞,
e depois queremos que a teoria que nos dê a amplitude da correspondente corrente de saída.
A nossa forma de fazer isso é escolher um autoestado não-perturbado que tem a amplitude
de corrente de entrada desejada (não é necessário preocupar-se com a amplitude da corrente
de saída do estado não-perturbado). O segundo passo consiste em garantir que a teoria de
perturbação não irá gerar correntes de entrada adicionais, o que é feito, impondo-se à mão, a
condição da “causalidade”. Como veremos, isso significa que o autoestado resultante completo
terá a amplitude da corrente de entrada desejada. Agora, voltando ao que já é conhecido nesse
ponto, é notório que “resolver” uma equação diferencial parcial requer especificar primeiro as
condições de contorno desejadas, o que é exatamente o que o formalismo teoria de espalhamento
padrão é projetado para fazer.
11.2 O problema do espalhamento
Em geral o problema físico é caracterizado por
267
11.2. O problema do espalhamento
Detector
Feixe incidente
V (r) θ
Alvo Z
O resultado de uma colisão é muito complexo.
11.2.1 Potencial espalhador

Nos processos envolvendo espalhamento, a mecânica clássica prevê corretamente os ângulos
de espalhamento. Iremos considerar somente o espalhamento elástico.
Hipóteses:
• Partículas sem spin;
• Desconsidera-se a estrutura interna tanto das partículas incidentes quanto do alvo;
• O alvo é fino o suficiente de modo que os múltiplos processos de espalhamento internos

podem ser desconsiderados;
• Toda possibilidade de coerência entre as ondas espalhadas pelas diferentes partículas que
constituem o alvo, será desprezada.
• A interação entre as partículas e o alvo será dada por um potencial V (r), em que r = r1 −r2
é a posição relativa das partículas, e além disso usaremos:
1 1 1 m1 m2
= + =⇒ µ= (11.1)
µ m1 m2 m1 + m2
11.2.2 Seção de choque de espalhamento

No espalhamento o problema é caracterizado por

11.3. Espalhamento por estados estacionários: Cálculo da seção de choque
Detector
D
pf δΩf
Feixe incidente
V (r) θ
Alvo Z
11.2.3 Grandezas físicas

• Fi é o fluxo de partículas no feixe incidente, isto é, é o número de partículas por unidade
de tempo que atravessam uma área unitária perpendicular ao eixo de incidência (Oz).
Sua dimensão é: [Fi ] = L−2 T −1 .
Será considerado que o feixe é fraco o suficiente de modo que a interação entre as partículas
do feixe possa ser desprezada.
• dn é o número de partículas espalhadas por unidade de tempo dentro do elemento de

ângulo sólido dΩ. Sua dimensão é: [dn] = T −1 .
dn = Fi σ(θ, ϕ)dΩ, (11.2)
na qual σ(θ, ϕ) é a seção de choque diferencial e a seção de choque total é dada por
ˆ
σ = σ(θ, ϕ)dΩ. (11.3)
11.3 Espalhamento por estados estacionários: Cálculo da

seção de choque
O hamiltoniano do sistema é
H = H0 + V (r) com H0 = P 2 /2µ (11.4)
A equação de Schrödinger que descreve a evolução temporal do sistema é
∂Ψ
i~ = HΨ =⇒ Ψ(r, t) = ϕ(r)e−iEt/~ (11.5)
∂t
11.4. Forma assintótica dos estados estacionários espalhados. Amplitude de espalhamento
na qual
~2 2

Hϕ(r) = Eϕ(r) =⇒ − ∇ + V (r) ϕ(r) = Eϕ(r) (11.6)
2µ
Será considerado que V (r), vai a zero no infinito mais rápido do que 1/r, o que elimina o
potencial coulombiano.
Por conveniência serão definidas as seguintes grandezas
~2 k 2 ~2
E= e V (r) = U (r) (11.7)
2µ 2µ
Portanto, a equação de Schrödinger estacionária é
2
∇ + k 2 − U (r) ϕ(r) = 0

(11.8)
Chamaremos os autoestados do hamiltoniano que satisfaz a condição de estados estacionários

(dif )
espalhados de vk (r). Portanto, ela será sua função de onda.
11.4 Forma assintótica dos estados estacionários espalha-

dos. Amplitude de espalhamento
• Para t → −∞, temos uma partícula livre: eikz ;
• Para t → +∞, temos uma partícula livre: eikz ;

(dif )
• Portanto, a função de onda vk (r), representa o estado estacionário espalhado, associado
a energia E = ~ k /2µ, obtida pela superposição da onda plana incidente eikz e a onda
2 2
espalhada.
11.4.1 Comportamento assintótico da onda espalhada

• Em uma dada direção (θ, ϕ) sua dependência radial é da forma eikr /r. O fator 1/r resulta
do fato de serem três dimensões espaciais:
eikr
∇2 + k 2 eikr 6= 0, ∇2 + k 2

porém = 0. (11.9)
r
Aqui o fator 1/r assegura que o fluxo de probabilidade, que passa através da superfície de
uma esfera, não depende de r.
• Em geral, o espalhamento não é isotrópico, logo a amplitude da onda espalhada irá

depender da direção (θ, ϕ) considerada. Portanto, para r → ∞
(dif ) eikr
vk (r) ∼ eikz + f (θ, ϕ) (11.10)
r→∞ r
Nesta expressão, somente a amplitude de espalhamento f (θ, ϕ) depende do potencial V (r).

11.4.2 Cálculo das seções de choque usando as correntes de probabi-

lidade
A corrente de probabilidade é

1 ∗ ~
J(r) = < ϕ (r) ∇ϕ(r) (11.11)
µ i
A Correntes Incidentes

1 ∗ ~
Ji (r) = < ϕi (r) ∇ϕi (r) mas como ϕi (r) = eikz (11.12)
µ i
temos então que
~k
|Ji (r)| = (11.13)
µ
11.4.3 Corrente espalhada

Como a onda espalhada é expressa em coordenadas esféricas, temos
∂ êθ ∂ êϕ ∂
∇ = êr + + (11.14)
∂r r ∂θ r sen θ ∂ϕ
A onda onda espalhada tem a seguinte forma:
ikr
e
ϕsc (r) = fk (θ, ϕ), (11.15)
r
então, temos
~k 1
(Jd )r = |f (θ, ϕ)|2 , (11.16)
µ r2

~k 1 1 ∗ ∂
(Jd )θ = < fk (θ, ϕ) fk (θ, ϕ) , (11.17)
µ r3 i ∂θ

~k 1 1 ∗ ∂
(Jd )ϕ = < fk (θ, ϕ) fk (θ, ϕ) . (11.18)
µ r3 sen θ i ∂ϕ
Como r é muito grande, os termos (Jd )θ e (Jd )ϕ são desprezados em relação ao termo (Jd )r ,
com isso, temos uma onda espalhada que é praticamente radial.
11.4.4 Expressão para a seção de choque

O feixe incidente é composto por partículas independentes, então temos que o fluxo incidente
é
~k
Fi = C|Ji | = C . (11.19)
µ
O número de partículas que incide sobre o detector por unidade de tempo é proporcional ao
vetor fluxo de corrente Jd que cruza as superfície dS, assim:
~k
dn = CJd · dS = C(Jd )r r2 dΩ = C |f (θ, ϕ)|2 dΩ, (11.20)
µ

(a) (b)
Figura 11.1: Antes da colisão (a), o pacote de ondas incidente está propagando na direção da zona
de influência do potencial. Após a colisão (b), observa-se um pacote de ondas plano e um pacote de
ondas esféricas dispersas pelo potencial (as linhas tracejadas na figura). As ondas planas e espalhadas
interferem na direção frontal de forma destrutiva (conservação da probabilidade total); o detector D é
colocado numa direção lateral e só pode ver as ondas dispersas.
entretanto, como dn = Fi σ(θ, ϕ)dΩ, então identifica-se o termo σ(θ, ϕ) como sendo
σ(θ, ϕ) = |f (θ, ϕ)|2 (11.21)
Portanto, a seção de choque diferencial é igual ao quadrado módulo da amplitude de espalha-

mento.
11.4.5 Interferência entre onda incidente e a espalhada

A interferência entre a onda incidente e a espalhada é evitada, por um posicionamento
adequado do detector, conforme ilustrado na figura 11.1.
11.4.6 A equação integral

Temos que
∇2 + k 2 ϕ(r) = U (r)ϕ(r).

(11.22)
Considere que há uma função G(r) tal que:
∇2 + k 2 G(r) = δ(r).

(11.23)
A função G(r) é chamada função de Green do operador ∇2 + k 2 . Então uma função qualquer
ϕ(r), satisfaz
ˆ
ϕ(r) = ϕ0 (r) + d3 r0 G(|r − r0 |)U (r0 )ϕ(r0 ), (11.24)

na qual ϕ0 (r) é uma solução da equação homogênea
∇2 + k 2 ϕ0 (r) = 0.

(11.25)
Note, portanto que

ˆ
2 2 2
d3 r0 G(|r − r0 |)U (r0 )ϕ(r0 )
2

∇ +k ϕ(r) = ∇ + k (11.26)
ˆ
= d3 r0 δ(r − r0 )U (r0 )ϕ(r0 ) (11.27)
= U (r)ϕ(r). (11.28)
A principal vantagem vem do fato de que escolhendo ϕ0 (r) e G(r) corretamente, pode-
se incorporar na solução o comportamento assintótico desejado. Duas funções de Green
particularmente útil são:
0
0 e±ik|r−r |
G± (r, r ) = . (11.29)
|r − r0 |
Note que uma função de Green da forma G(r, r0 ) = G(|r − r0 |) pode ser obtida, aplicando
uma transformada de Fourier na equação
∇2 + k 2 G(r) = δ(r).

(11.30)
Para isso, introduz-se a função

ˆ
G(r) = d3 q g(q)eiq·r (11.31)
e como a função delta é representada por

ˆ
1
δ(r) = d3 q eiq·r , (11.32)
(2π)3
substituindo estas duas expressões na equação diferencial obtemos que
1 1
g(q) = (11.33)
(2π) k − q 2
3 2
Portanto, na representação de Fourier temos que
ˆ
1 eiq·r
G(r) = d3 q , com d3 q = q 2 dq sen θdθ dϕ. (11.34)
(2π)3 k2 − q2

A função de Green é então
ˆ∞ ˆ2π ˆπ
1 q 2 dq
G(r) = dϕ eiqr cos θ sen θ dθ (11.35)
(2π)3 k2 − q2
0 0 0
ˆ∞ ˆ
−iqr
q 2 dq

1 −1
= eiqr cos θ d(iqr cos θ) (11.36)
(2π)2 k2 − q2 iqr
0 iqr
ˆ∞
q 2 dq

1 −1
e−iqr − eiqr

= (11.37)
(2π)2 k2 − q2 iqr
0
ˆ∞
1 q sen(qr)
= dq (11.38)
2π 2 r k2 − q2
0
ˆ∞
1 d cos(qr)
=− 2 dq (11.39)
2π r dr k2 − q2
0
Note que como a função cos(qr)/(k 2 − q 2 ) é par, logo, podemos estender seu limite de
integração de −∞ até +∞, tomando a metade deste valor, ou seja,
ˆ∞ ˆ+∞
cos(qr) 1 cos(qr)
2 2
dq = dq (11.40)
q −k 2 q2 − k2
0 −∞
logo podemos escrever a função G(r) como
ˆ+∞
1 d cos(qr)
G(r) = 2 dq (11.41)
4π r dr q2 − k2
−∞
Como a função sen(qr)/(k 2 − q 2 ) é ímpar, então
ˆ+∞
sen(qr)
dq = 0. (11.42)
q2 − k2
−∞
Desta forma, podemos escrever a função G(r) em uma forma mais compacta como:
ˆ+∞
1 d eiqr
G(r) = 2 dq (11.43)
4π r dr q2 − k2
−∞
11.4.7 Integral da função de Green

A função de Green
ˆ+∞
1 d eiqr
G(r) = 2 dq (11.44)
4π r dr q2 − k2
−∞

=(q)
−k − i
k + i <(q)
Figura 11.2: Contorno de integração com contento o plano complexo com Im(q) > 0.
não é definida em todo o eixo real, pois ela possui dois polos sobre o mesmo. Para contornar o
problema adiciona-se uma nova variável [1, 4, 6, 35], para retirar o polo do eixo real, assim a
integral toma a seguinte forma
ˆ+∞
1 d eiqr
G(r) = 2 lim dq (11.45)
4π r dr →0 (q + k + i)(q − k − i)
−∞
Note que a função (q + k + i)(q − k − i), possui duas raízes, ou seja, q = ±(k + i). Portanto
o contorno de integração no plano complexo, para o qual Im(q) > 0, conforme ilustrado pela
figura 11.2, mostra que somente o polo q = k + i está contido pelo contorno de integração.
Note então que nesse caso o polo q = −(k + i) foi excluído da integração, assim usando o
teorema de resíduos temos, que o resíduo devido ao polo q = (k + i) é
ˆ+∞
eiqr eiqr

lim dq = lim 2π(q − k − i)
→0 (q + k + i)(q − k − i) →0 (q + k + i)(q − k − i) q=k+i
−∞
2πi πi
= lim ei(k+i)r = eikr (11.46)
→0 2(k + i) k
Neste caso então, a função de Green é

1 d πi ikr 1 ikr
G+ (r) = 2 e =− e (11.47)
4π r dr k 4πr
Portanto temos que a função de Green
1 ikr
G+ (r) = − e . (11.48)
4πr
A integral (11.45) também pode ser feita se usando um outro contorno de integração, o que
contém a parte negativa do eixo imaginário conforme ilustrado pela figura (11.3), e neste o polo
que está dentro do contorno é dado por q = −(k + i).

−k − i =(q)
k + i <(q)
Figura 11.3: Plano complexo contendo a parte negativa do eixo imaginário.
Portanto, a integral
ˆ+∞
1 d eiqr
G(r) = 2 lim dq
4π r dr →0 (q + k − i)(q − k + i)
−∞
pode ser feita tomando-se o contorno ilustrado na Fig. r(11.3), e para esse caso o teorema de
resíduos, devido ao polo q = −(k + i) é
ˆ+∞
eiqr eiqr

lim dq = lim 2π(q + k + i)
→0 (q + k + i)(q − k − i) →0 (q + k + i)(q − k − i) q=−k−i
−∞
2πi πi
= lim − e−i(k+i)r = − e−ikr (11.49)
→0 2(k + i) k
Neste caso então, a função de Green é

1 d πi −ikr 1 −ikr
G− (r) = 2 − e =− e (11.50)
4π r dr k 4πr
Portanto temos que a função de Green
1 −ikr
G− (r) = − e . (11.51)
4πr
Portanto, viu-se que a integral possui dois possíveis valores. Deve-se usar as condições físicas
para definir qual é o resultado que será usado. Note que os dois diferem pelo sinal da exponencial
complexa, ou seja, por uma fase. Logo, juntando os dois resultados anteriores tem-se então que
1 ±ikr
G± (r) = − e . (11.52)
4πr

11.4.8 Laplaciano de G±
Agora que temos o valor da função de Green, podemos calcular o seu laplaciano, ou seja,

±ikr 2 1 1 2 ±ikr 1
2
· ∇ e±ikr

∇ G± (r) = e ∇ − ∇ e +2 ∇ (11.53)
4πr 4πr 4πr
Devemos lembrar que

21
∇ = −4πδ(r) (11.54)
r
e que como
2ik ±ikr
∇2 e±ikr = −k 2 e±ikr ±

e (11.55)
r
r
∇ e±ikr = ±ike±ikr

(11.56)
r
Portanto, após alguma álgebra chega-se em
∇2 G± (r) = −k 2 G± (r) + δ(r). (11.57)
Note que aqui, G+ (r) e G− (r) são respectivamente as funções de Green entrando e saindo
do alvo.
Portanto, a integral de espalhamento têm a seguinte forma
ˆ
(dif ) (dif )
vk (r) =e ikz
+ d3 r G+ (|r − r0 |)vk (r0 ) (11.58)
cuja solução tem o comportamento assintótico correto.

A seguir será analisado o comportamento assintótico desta
função. Para isso, considere um ponto M , muito distante dos vá-
rios pontos P da zona de influência do potencial, cujas dimensões
lineares são da ordem de L, ou seja,
rL e r0 L (11.59)
Desde que o ângulo entre os segmentos M O e M P é muito

pequeno, o comprimento M P , |r − r0 | é aproximadamente igual
a projeção de M P sobre M O, ou seja:
|r − r0 | ' r − êr · r0 (11.60)
na qual êr é um vetor unitário na direção do vetor r. Disto

segue então que para grandes valores de r, ou seja, r 1, a
aproximação a seguir é muito boa,
0
1 eik|r−r | 1 eikr −ikêr ·r0
G+ (|r − r0 |) = − · ∼ − e (11.61)
4π |r − r0 | r→∞ 4π r

Figura 11.4: Relação geométrica entre o vetor de onda incidente e o espalhado. A dependência
angular é vista na figura ao lado.
Antes de prosseguirmos, por uma questão de conveniência

será introduzido o vetor de onda incidente Ki = kêz , que é um vetor de módulo k, direcionado
ao longo do eixo Oz do fixe de modo que:
eikz = eikr cos θ = eiKi ·r (11.62)
e do mesmo modo será definido um vetor Kd = kêr que é um vetor de módulo k, direcionado
ao longo da direção êr definida pelos par de ângulos (θ, ϕ). Este vetor é chamado de vetor de
onda da onda espalhada na direção definida por (θ, ϕ), assim,
Kd = kêr (11.63)
Este é o vetor de onda que define o momentum linear da onda que chega no detector.
Finalmente o vetor de onda de espalhamento ou de transferência K na direção (θ, ϕ) é dado
pela diferença entre Kd e Ki , ou seja,
K = Kd − Ki (11.64)
Note que como os módulos de |Kd | = |Ki | = k, então o triângulo mostrado na figura é
isósceles e deste segue então que o módulo do vetor de onda espalhado é dado por
|K| = K = 2k sen(θ/2) (11.65)
Portanto, usando essas definições a função de Green espalhada (11.61) pode ser reescrita
como
1 eikr −iKd ·r0
G+ (|r − r0 |) = − e (11.66)
4π r
(dif )
Substituindo esse resultado na expressão para vk (r), obtemos
ˆ
(dif ) iKi ·r 1 eikr 0 (dif )
vk (r) ∼ e − d3 r0 e−iKd ·r U (r0 )vk (r0 ) (11.67)
r→∞ 4π r
Esta expressão tem a forma prevista para o comportamento assintótico, já que o integrando não
mais depende de r, somente dos ângulos polares (θ, ϕ). Portanto, podemos, em comparação
com a eq. (11.10), identificar a amplitude de espalhamento como:
ˆ
1 0 (dif )
fk (θ, ϕ) = − d3 r0 e−iKd ·r U (r0 )vk (r0 ) (11.68)
4π

11.5. Aproximação de Born
11.5 Aproximação de Born

A equação integral do espalhamento tem a seguinte forma:
ˆ
(dif ) iKi ·r (dif )
vk (r) =e + d3 r0 G+ (|r − r0 |)U (r0 )vk (r0 ) (11.69)
(dif )
Note que, para determinarmos o valor de vk (r), é necessário que conheçamos ele. Portanto,
para resolver esse problemas iremos adotar um procedimento iterativo, para isso, introduzimos
(dif )
as variáveis r0 → r00 e r → r0 , na expressão anterior para vk (r), obtendo
ˆ
(dif ) iKi ·r0 (dif )
vk (r0 ) =e + d3 r00 G+ (|r0 − r00 |)U (r00 )vk (r00 ) (11.70)
e inserindo a equação (11.70) na (11.69), obtemos que

ˆ ˆ ˆ
(dif ) iKi ·r 3 0 0 0 iKi ·r0 3 0 (dif )
vk (r) =e + d r G+ (|r−r |)U (r )e + dr d3 r00 G+ (|r−r0 |)U (r0 )G+ (|r0 −r00 |)U (r00 )vk (r00 )
(11.71)
Os dois primeiros termos do lado direito da equação (11.71), são conhecidos; somente o terceiro
(dif )
contém a função desconhecida vk (r). Este procedimento pode ser repetido, trocando r0 → r000
e r → r00 , na (11.69) e substituindo o seu resultado em (11.71), o que resulta então em
ˆ
(dif ) iKi ·r 0
vk (r) =e + d3 r0 G+ (|r − r0 |)U (r0 )eiKi ·r +
ˆ ˆ
3 0 00
dr d3 r00 G+ (|r − r0 |)U (r0 )G+ (|r0 − r00 |)U (r00 )eiKi ·r +
ˆ ˆ ˆ
3 0 3 00 (dif )
dr dr d3 r000 G+ (|r − r0 |)U (r0 )G+ (|r0 − r00 |)U (r00 )G+ (|r00 − r000 |)U (r000 )vk (r000 ).
(11.72)
(dif )
na qual os três primeiros termos são conhecidos; a função desconhecida vk (r) foi deslocada
para o quarto termo. Portanto, procedimento anterior fornece a seguinte série,
ˆ
(dif ) iKi ·r 0
vk (r) =e + d3 r0 G+ (|r − r0 |)U (r0 )eiKi ·r +
ˆ ˆ
3 0 00
dr d3 r00 G+ (|r − r0 |)U (r0 )G+ (|r0 − r00 |)U (r00 )eiKi ·r +
ˆ ˆ ˆ
3 0 3 00 000
dr dr d3 r000 G+ (|r − r0 |)U (r0 )G+ (|r0 − r00 |)U (r00 )G+ (|r00 − r000 |)U (r000 )eiKi ·r + · · ·
(11.73)
Essa é a expansão de Born da função de onda de espalhamento estacionário.

(dif )
Se substituirmos a expansão (11.72) de vk (r) na equação (11.68) da amplitude de espa-
lhamento, obtemos a expansão de Born para a amplitude de espalhamento. Em particular se

r
r
r0
r0 Centro espalhador r00 Centro espalhador
(a) (b)
Figura 11.5: Representação esquemática da aproximação de Born: (a) só se considera a onda incidente
e a onda espalhada por uma interação com o potencial. (b) considera-se a onda incidente e as ondas
espalhada por interagir duas vezes o potencial.
nos limitarmos aos termos em primeira ordem em U (r), obtemos que

ˆ
1 0 0
fk (θ, ϕ) = − d3 r0 e−iKd ·r U (r0 )eiKi ·r
4π
ˆ
1 0
=− d3 r0 e−i(Kd −Ki )·r U (r0 )
4π
ˆ
1 0
=− d3 r0 e−iK·r U (r0 ) (11.74)
4π
na qual K é o vetor de onda de espalhamento. Portanto a seção diferencial de choque na
aproximação de Born, está relacionada com uma transformada de Fourier do potencial, como
pode ser visto pelas eqs. (11.7), (11.21) e (11.74), das quais temos
ˆ 2
(B) µ 3 −iK·r

σk (θ, ϕ) = 2 4 d re V (r) (11.75)
4π ~
11.5.1 Interpretação dos termos da expansão de Born

Considere que a zona de influência do potencial, seja um meio espalhador cuja densidade é
proporcional a U (r). A função G+ (r − r0 ), dada pela equação (11.52), representa a amplitude no
ponto r da onda radiada pela fonte pontual localizada em r0 . Consequentemente os dois primeiros
termos de (11.73) descrevem a onda total no ponto r como resultado da superposição da onda
incidente eiKi ·r e um número infinito de ondas provenientes das fontes secundárias induzidas no
meio espalhador pela onda incidente. A amplitude de cada uma dessas ondas é proporcional a
onda incidente eiKi ·r e a densidade do material espalhador U (r0 ), calculada no correspondente
ponto r0 . Essa interpretação lembra o princípio de Huygens na óptica ondulatória.
O terceiro termo de (11.73) pode ser interpretado de modo análogo ao anterior. Considerando
que o meio espalhador se estende sobre uma determinada área, então uma fonte secundária é

excitada não somente pelas ondas incidentes mas, mas também pelas ondas provenientes das
outras fontes secundárias. Se o meio espalhador tiver uma densidade muito baixa (U (r) muito
pequeno), podemos negligenciar a influência das fontes secundárias umas sobre as outras.
Note que a interpretação fornecida para os termos de altas ordens na expansão de Born,
não possui nenhuma relação com os processos de espalhamento múltiplos, que podem ocorrer
num alvo espesso. Aqui estamos tratando com uma partícula espalhada do feixe por uma única
partícula do alvo, enquanto os espalhamentos múltiplos levam em conta as interações sucessivas
da mesma partícula incidente com as várias diferentes partículas do alvo.
Exemplo 11.1. A seguir será calculada a seção de choque diferencial de partículas carregadas
espalhadas por átomos neutros. Considere um átomo com um número atômico Z. Seja %(r) a
densidade de carga eletrônica calculada, por exemplo, no modelo de campo central. Considere
ainda, que o núcleo é pontual, com uma densidade de carga igual a −Zqe δ(r). A energia
potencial de uma partícula de carga q no campo do átomo em um ponto r0 é dada por
ˆ
0 q 1
V (r ) = d3 r00 0 [−Zqe δ(r00 ) + %(r00 )] . (11.76)
4π0 |r − r00 |
Na aproximação de Born a amplitude de espalhamento é dada por
ˆ
1 0 2µ
fk (θ, ϕ) = − d3 r0 e−iK·r 2 V (r0 )
4π ~
ˆ ˆ
µq 3 0 −iK·r0 1
=− 2 2 dr e d3 r00 0 00
[−Zqe δ(r00 ) + %(r00 )] . (11.77)
8π 0 ~ |r − r |
Neste ponto, será mais conveniente trocar a ordem de integração, e realizar primeiro a
integral em d3 r0 . Infelizmente, surge um resultado indefinido, pois a inversão não é permitida
em (11.77). Ainda assim, pode-se superar o problema introduzindo um fator de convergência.
Considere então o fator α > 0 de modo que
ˆ ˆ 0 00
µq 3 0 −iK·r0 e−α|r −r |
fk (θ, ϕ) = − 2 2 lim dr e d3 r00 0 [−Zqe δ(r00 ) + %(r00 )] . (11.78)
8π 0 ~ α→0 |r − r00 |
0 00
A introdução do fator e−α|r −r | não altera o valor da integral quando tomamos o limite α → 0.
Isso ocorrer porque ele difere de 1 somente nas regiões que essencialmente não contribuem para
a integral. Agora a mudança de ordem da integração é permitida e com isso faremos a seguinte
mudança de variável
r0 = u + r00 (11.79)
e com isso podemos escrever
ˆ ˆ −α|r0 −r00 |
µq 3 00 00 00 3 0 −iK·r0 e
fk (θ, ϕ) = − 2 2 d r [−Zqe δ(r ) + %(r )] · lim dr e
8π 0 ~ α→0 |r0 − r00 |
ˆ ˆ −αu−iK·u
µq 3 00 00 00 −iK·r00 3 0 e
=− 2 2 d r [−Zqe δ(r ) + %(r )] e · lim dr
8π 0 ~ α→0 u
A integral acima é dada por:
ˆ −αu−iK·u ˆ 2π ˆ π ˆ ∞
3 0 e
I = lim du = lim dϕ sen θ dθ du e−αu−iK·u (11.80)
α→0 u α→0 0 0 0

como o vetor K, está em uma direção qualquer do espaço e vamos somar sobre todas elas, logo
por uma questão de simplicidade vamos escolher K = Kêz , assim teremos que
ˆ 2π ˆ π ˆ ∞
I = lim dϕ sen θ dθ udu e−αu−iKu cos θ
α→0 0
ˆ 2π ˆ0 ∞ ˆ0 π
= lim dϕ udu e−αu sen θ dθ e−iKu cos θ
α→0 0 0 0
Na última integral do lado direito fazemos a seguinte mudança de variável y = −iKu cos θ, logo
dy = iKu sen θ dθ, assim temos que
ˆ π ˆ iKu
−iKu cos θ 1 1 2
dy ey = eiKu − e−iKu =

sen θ dθ e = sen(Ku). (11.81)
0 iKu −iKu iKu Ku
Portanto, temos que,
ˆ
4π ∞
I = lim du e−αu sen(Ku)
α→0 K 0
ˆ
2π ∞
du e−αu eiKu − e−iKu

= lim
α→0 iK 0
ˆ
2π ∞
du ei(K+iα)u − e−i(Ku−iα)u

= lim
α→0 iK 0
∞
2π ei(K+iα)u e−i(K−iα)u

= lim +
α→0 iK i(K + iα) i(K − iα) 0

2π 1 1
= lim +
α→0 K K + iα K − iα
2π 2K 4π
= lim 2 2
= lim 2
α→0 K K + α α→0 K + α2
Agora tomando o limite em que α → 0, temos, portanto, que o resultado da integral é:

ˆ
e−αu−iK·u 4π 4π
lim d3 u0 = lim 2 2
= 2. (11.82)
α→0 u α→0 α + K K
Portanto, temos que

ˆ
µq 00
fk (θ, ϕ) = − d3 r00 [−Zqe δ(r) + %(r00 )] e−iK·r (11.83)
2π0 ~2 K 2
Esta é então a amplitude de espalhamento de partículas carregadas por átomos neutros na
aproximação de Born.
Para simplificar a expressão (11.83), será considerado, como no modelo de campo central,
que a densidade eletrônica de carga %(r) depende somente de r00 . Nesse caso, podemos escrever
ˆ
00
d3 r00 e−iK·r [−Zqe δ(r00 ) + %(r00 )] = −Zqe + qe F (θ), (11.84)
na qual, F (θ), é chamado de fator de forma atômico, e é uma quantidade adimensional e igual a
ˆ∞
1 4π
F (θ) = dr r%(r) sen(Kr). (11.85)
qe K
0

11.6. Espalhamento por muitos centros idênticos
Como a notação sugere, o fator de forma atômico depende, através de K, somente do ângulo
polar θ, e não de ϕ. De fato, temos de (11.65) que
K = 2k sen(θ/2) .
Em síntese, neste exemplo, mostrou-se que a amplitude de espalhamento devido a simetria

esférica da densidade de carga eletrônica é dada por
µqe q
fk (θ) = [Z − F (θ)] . (11.86)
8π0 ~2 k 2
sen2 (θ/2)
Portanto, a amplitude de espalhamento só depende do ângulo θ. Disso, segue imediatamente
que a seção diferencial de choque é
2
2 µqe q
σ(θ) = |fk (θ)| = [Z − F (θ)] (11.87)
8π0 ~2 k 2 sen2 (θ/2)
A aproximação de Born, onde ela for válida, produz uma seção diferencial de choque em
termos do potencial. Mas em geral, estamos mais interessados no problema inverso. Desejamos
realmente determinar que potencial produz uma determinada seção diferencial de choque, a
qual foi medida. Para vermos, se isso é possível, veja o que ocorre, ao reescrevermos a expressão
(11.77) ˆ
1 2µ
fk (θ, ϕ) = f (K) = − d3 r e−iK·r 2 V (r) (11.88)
4π ~
Aqui a dependência da amplitude de espalhamento em K é mostrada explicitamente.Tomando
a transformada de Fourier inversa de (11.88), encontramos que
ˆ
~2
V (r) = − 2 d3 K eiK·r f (K). (11.89)
4π µ
Para obter V (r), devemos conhecer fk (θ, ϕ), para todos os valores de k, isto é, para todas as
energias E, θ e ϕ. Mas a seção diferencial de choque, a qual é quantidade experimentalmente
mensurável, é igual ao quadrado do módulo da amplitude de espalhamento. Isto significa que
fk (θ, ϕ) pode ser extraída de σ(θ) somente se fk (θ, ϕ) for uma função real. Isso ocorre se
V (−r) = V (r) e, em particular se o potencial é esfericamente simétrico. Note que se f (K)
for pouco conhecida em grandes valores de energias, isto é, para grandes valores de K, não
podemos determinar os detalhes finos de V (r). Este resultado é muito geral. Para determinar
mais detalhes do centro espalhador, deve-se usar partículas com pequenos comprimentos de
onda, isto é, altas energias.
11.6 Espalhamento por muitos centros idênticos

Até o momento, no tratamento dado, o potencial foi associado com um único centro
espalhador. Entretanto, na realidade os experimentais trabalham com um grande número
de centros espalhadores. Para tratar esse problema, considere N centros espalhadores, todos
idênticos, situados nos pontos ri (i = 1, 2, . . . , N ). Consideraremos brevemente o caso em que

os centros espalhadores mudam aleatoriamente suas posições e o caso em que suas posições são
fixas e periódicas.
Considere que o potencial total devido a todos os centros espalhadores, podem ser represen-
tados como
N
X
V (r) = v(r − ri ). (11.90)
i=1
Esta relação é válida, claramente, se os centros espalhadores estiverem longe o suficiente para
que a interação entre eles possa ser negligenciada. Além disso, v(r) representa então o potencial
devido a um único centro espalhador. Se, por outro lado, os centros espalhadores interagirem
entre si, sua estrutura interna pode sofrer pequenas alterações, o que significaria que os centros
não seriam mais exatamente idênticos. A relação (11.90) pode apesar disso, permanecer válida,
sem que v(r) represente o potencial devido a um centro isolado.
Será considerado que as amplitudes de espalhamento são fornecidas corretamente pela
aproximação de Born. Note entretanto que no presente caso, que usamos a aproximação (11.61)
foi usada para obtermos da fórmula de Born, e essa aproximação deve satisfazer as condições
(11.59), isto é r L e kL2 r, na qual k é o número de onda do feixe de onda que incide
(chega) sobre o alvo, L representa as dimensões lineares do ao longo de cada dimensão dos
centros espalhadores do alvo e r, por sua vez, é a distância entre a amostra e o ponto onde
encontra-se o detector. Note ainda, que ambas as desigualdades podem ser válidas se kL 1.
Finalmente, lembre-se que a intensidade do feixe incidente não será atenuada significantemente
na amostra. Portanto, conforme o exposto, a aproximação de Born continua válida e podemos
escrever
ˆ N
1 2µ X
fk (θ, ϕ) = − d 3
r e−iK·r 2 v(r − ri ) (11.91)
4π ~ i=1
Tirando a somatória para fora da integral e introduzindo a seguinte mudança de variável
ρ = r − ri , obtemos
N ˆ
1 X 2µ
fk (θ, ϕ) = − d3 ρ e−iK·(ρ+ri ) 2 v(ρ)
4π i=1 ~
ˆ X N
µ −iK·ρ
= − 3
d ρe v(ρ) · e−iK·ri (11.92)
2π~2 i=1
Portanto, fk (θ, ϕ) é igual a amplitude de espalhamento devido ao potencial v(r), multiplicada

pela soma das exponenciais e−iK·ri .
O primeiro caso que investigaremos é aquele de materiais, cujos centros espalhadores movem-
se constantemente, por exemplo: líquidos e gases. A seção de choque diferencial envolve o
quadrado do módulo da soma de exponenciais complexas, (11.92). Portanto, podemos escrever
2
XN N
X N
X N
X N
X
−iK·ri −iK·ri −iK·(ri −rj )
e = e e iK·rj
= e =N+ e−iK·(ri −rj ) . (11.93)

i=1 i=1 j=1 i,j i6=j
Enquanto o número de centros espalhadores for muito grande, o ambiente de todos os centros
que se encontram afastados dos limites (contornos) da amostra, em média, são os mesmos. Seja

então n(r) a densidade média de centros espalhadores no ponto r com relação a um dado centro.
Então, com isso, pode-se escrever
N
X ˆ
−iK·(ri −rj )
e = N d3 r n(r)e−iK·r , (11.94)
N 1
i6=j
de modo que, definindo ˆ

µ
Fatm (θ) = − 2
d3 ρ e−iK·ρ v(ρ) (11.95)
2π~
então podemos escrever a seção de choque diferencial como
ˆ
2 3 −iK·r
σ(θ, ϕ) = N · |Fatm (θ)| · 1 + d r n(r)e . (11.96)
A seção de choque diferencial é portanto proporcional, a amplitude de espalhamento atômico,

ao número total de centros espalhadores, e está relacionada com a probabilidade com que um
centro espalhador está posicionado com relação a outro, ou seja, a probabilidade de sua posição
relativa.
O segundo caso que será investigado, é o de um cristal perfeito, isto é, um material cujos os
centros espalhadores estão distribuídos sobre uma rede periódica. Seja a, b e c os vetores de
translação fundamentais da rede. Será considerado que o cristal é um paralelepípedo. A posição
dos centros espalhadores é dada na figura 11.6, por
ri = na a + nb b + nc c. (11.97)
Aqui na , nb e nc são números inteiros tais que:
0 ≤ na ≤ Na − 1 , 0 ≤ nb ≤ Nb − 1 , 0 ≤ nc ≤ Nc − 1 . (11.98)
Portanto, o número total de centros espalhadores é N = Na · Nb · Nc . Aqui foi considerado que o

número total centros espalhadores é igual ao número total de átomos. Pode haver vários átomos
associados com cada nodo da rede. O cálculo da soma das exponenciais é fácil, pois não ela é
b
a
Figura 11.6: Vetores de translação de uma rede triangular 2D.
dada pela soma de uma série geométrica. De fato, temos que

N
X N
Xa −1 N
X b −1 N
X c −1
−iK·ri
e = exp [−iK · (na a + nb b + nc c)] (11.99)
i=1 na =0 nb =0 nc =0

Temos que:
S = 1 + ex + e2x + e3x + · · · + e(n−1)x + enx

Sex = ex + e2x + e3x + · · · + e(n−1)x + enx + e(n+1)x
Subtraindo uma equação da outra, encontramos
1 − e(n+1)x
S(ex − 1) = e(n+1)x − 1 =⇒ S= (11.100)
1 − ex
Portanto, usando o resultado (11.100), podemos reescrever (11.99) como
N
1 − e−iNa K·a 1 − e−iNb K·b 1 − e−iNc K·c
X
−iK·ri
e = −iK·a
· (11.101)
i=1
1 − e 1 − e−iK·b 1 − e−iK·c
Temos ainda que
1 − eix = eix/2 (e−ix/2 − eix/2 ) = −2i sen(x/2)eix/2 (11.102)
logo o seu módulo é

1 − eix = −2i sen(x/2)eix/2 = 2 sen(x/2). (11.103)
Portanto, podemos escrever,
2
XN
−iK·ri
e = Fa (K · a)Fb (K · b)Fc (K · c) (11.104)

i=1
em que a função
sen2 ( 12 Nα K · α)
Fα (K · α) = , com α = a, b, c. (11.105)
sen2 ( 12 K · α)
Portanto, a seção de choque diferencial é dada por
ˆ 2
1 3 −iK·ρ 2µ

σ(θ, ϕ) =
d ρe 2
v(ρ) × Fa (K · a)Fb (K · b)Fc (K · c) (11.106)
4π ~
Dado que Nα é grande o suficiente, a função Fα (K · α) mostra um máximo agudo nos
pontos em que K · α um múltiplo inteiro de 2π, ou seja, K · α = 2πqα , com qα = 0, 1, 2, · · · . O
comportamento de Fα (K · α), em torno do seu valor máximo Nα2 , é mostrado no gráfico 11.7. O
intervalo entre dois zeros consecutivos em ambos os lados do máximo central é 4π/Nα . A área
sobre aquele máximo é da ordem de Nα . Portanto, para uma estrutura periódica, a seção de
choque diferencial é apreciável somente nos valores de K para os quais
K · a = 2πqa , K · b = 2πqb , K · c = 2πqc , (11.107)
na qual qa , qb e qc são inteiros. A informação da posição dos máximos de acordo com (11.107),
determina os vetores de translação fundamentais da rede. Por outro lado, a intensidade relativa
dos máximos da seção de choque diferencial depende do primeiro fator no lado direito de (11.106).
Observações das intensidades relativas, produzem informações sobre a forma de v(ρ).
Note que a integral da seção de choque diferencial sobre um dado máximo é proporcional a
N = Na · Nb · Nc , que é o número total de centros espalhadores.

Fator de forma atômico
0.9
0.8
0.7
0.6
0.5
0.4
0.3
0.2
0.1
0
0
Figura 11.7: A função Fα (K · α). Note que o valor máximo de Fα (K · α) é Nα2 .


Capítulo 12
Espalhamento por um potencial central:

Método das ondas parciais
No caso especial de um potencial central V (r), o momentum angular orbital L é uma

constante de movimento. Portanto, existem estados estacionários com momentum angular bem
definido: isto é, autoestados comuns de H, L2 e Lz . Chamaremos as funções de onda associadas
a estes estados de ondas parciais e as designaremos por ϕk,l,m (r). Assim temos que
~2 k 2
Hϕk,l,m (r) = Ek ϕk,l,m (r) = ϕk,l,m (r) (12.1)
2µ
L2 ϕk,l,m (r) = l(l + 1)~2 ϕk,l,m (r) (12.2)
Lz ϕk,l,m (r) = m~ϕk,l,m (r). (12.3)
Como o potencial V (r) influência somente a parte radial da equação de Schrödinger, então a
dependência angular de ϕk,l,m (r) será dada pelos harmônicos esféricos Ylm (θ, ϕ).
Quando r for grande o suficiente, espera-se que as ondas parciais se aproximem das au-
tofunções comuns de H0 , L2 e Lz , na qual H0 é o operador hamiltoniano de uma partícula
livre, e em particular, de uma que possuí um momentum angular bem definido. Neste caso, as
(0)
correspondentes funções de onda ϕk,l,m (r) são ondas esféricas livres: sua dependência angular,
de fato, são aquelas dos harmônicos esféricos, e será visto que a expansão assintótica da sua
função radial é a superposição de uma onda incidente e−iKi ·r e uma onda que sai eiKi ·r com uma
diferença de fase bem determinada.
12.1 Estados estacionários de uma partícula livre
12.1.1 Partícula Livre

O hamiltoniano de uma partícula livre,
P2
H0 = , (12.4)
2µ
289
12.1. Estados estacionários de uma partícula livre
não constitui por si só um C.S.C.O e seus autovalores são infinitamente degenerados. Entretanto,
os 4 observáveis
H0 , Px , Py , Pz (12.5)
formam um C.S.C.O. Seus autoestados comuns são estados estacionários com um momentum
bem definido. Uma partícula livre pode ser considerada como uma partícula num potencial
central nulo, nesse caso os três observáveis
H0 , L2 , Lz (12.6)
formam um C.S.C.O. Seus correspondentes autoestados, serão estado estacionários com momen-
tum angular L bem definido, mais precisamente com L2 e Lz bem definidos.
As bases no espaço de estados definidos pelos operadores de (12.5) e (12.6) são distintas, já
que os operadores P e L são quantidades incompatíveis.
12.1.2 Estados estacionários com momentum bem definido. Ondas

planas
A base {|pi} dos autoestados comuns dos operadores de (12.5) são:
p2
P |pi = p |pi e H0 |pi = |pi . (12.7)
2µ
Portanto, o espectro de H0 é contínuo e inclui o zero. Cada um dos autovalores são infinita-
mente degenerados: para uma energia positiva fixa E existe um número infinito de kets |pi
correspondentes, já que existe um número infinito de vetores ordinários p cujo o módulo satisfaz
p q
|p| = 2µE = p2x + p2y + p2z . (12.8)
As funções de onda associadas ao ket |pi são

3/2
1
hr | pi = eip·r/~ (12.9)
2π~
Introduzindo o vetor de onda k, que caracteriza uma onda plana, como
p
k= (12.10)
~
então podemos definir o ket |ki como
|ki = ~3/2 |pi (12.11)
O kets k são estados estacionários com momentum bem definidos, assim

~2 k2
P |ki = ~k |ki e H0 |ki = |ki . (12.12)
2µ
e eles são ortonormais no senso estendido
hk | k0 i = δ(k − k0 ), (12.13)

12.2. Propriedades físicas das ondas esféricas livres
e formam uma base no espaço de estados

ˆ
d3 k |ki hk| = 1. (12.14)
As funções de onda, são ondas planas normalizadas em todo o espaço

3/2
1
hr | ki = eik·r . (12.15)
2π
12.1.3 Estados estacionários com momentum angular bem definido.

Ondas esféricas livres
As funções
Ede onda associadas com os estados estacionários de momentum angular bem
(0)
definido ϕk,l,m de uma partícula livre, são as ondas esféricas livres, as quais são dadas por
r
D
(0)
E
(0) 2k 2
r ϕk,l,m = ϕk,l,m (r) = jl (kr) Ylm (θ, ϕ) (12.16)
π
na qual as funções jl (ρ), são as funções esféricas de Bessel definidas por:
l
l l 1 d sen(ρ)
jl (ρ) = (−1) ρ . (12.17)
ρ dρ ρ
As ondas esféricas são ortonormais no senso estendido e satisfazem a seguinte relação
D E 2 ˆ∞ ˆ
(0) (0) 0
ϕk,l,m ϕk0 ,l0 ,m0 = kk 0 0 2
jl (kr)jl0 (k r)r dr dΩYlm ∗ (θ, ϕ)Ylm 0
0 (θ, ϕ) = δ(k − k )δl,l0 δm,m0
π
0
(12.18)
e formam uma base no espaço de estados, logo elas também satisfazem a seguinte relação de
completeza
ˆ∞ ∞ X
X +l ED
(0) (0)
dk ϕ
k,l,m ϕk,l,m = 1. (12.19)
0 l=0 m=−l
12.2 Propriedades físicas das ondas esféricas livres

Dependência angular: Ela deve-se completamente aos harmônicos esféricos Ylm (θ, ϕ), os
quais são fixados pelos autovalores de L2 e Lz , ou seja, os índices l e m.
Comportamento próximo da origem: Consideremos umEângulo sólido infinitesimal dΩ0
(0)
em torno da direção (θ0 , ϕ0 ); quando o estado da partícula ϕk,l,m , a probabilidade de encontrar
a partícula nesse ângulo sólido entre r e r + dr é proporcional a
r2 jl2 (kr) |Ylm (θ, ϕ)|2 dr dΩ0 . (12.20)
As funções esféricas de Bessel são dadas por:

l
l l 1 d sin ρ
jl (ρ) = (−1) (ρ) . (12.21)
ρ dρ ρ

Pode-se mostrar que quando ρ se aproxima de zero, ρ → 0, temos que
ρl
jl (ρ) ' . (12.22)
ρ→0 (2l + 1)!!
Esse resultado implica que a probabilidade (12.19) comporta-se como ρ2l+2 próximo da origem;
portanto para l grande, o aumento será lento.
1.4
n=0
n=1
1.2 n=2
n=3
n=4
1
0.8
0.6
0.4
0.2
0
0 5 10 15 20
Figura 12.1: Gráfico das 5 primeiras

funções
E ρ2 jl2 (ρ), fornecendo dependência radial da probabilidade
(0)
de encontrar a partícula no estado ϕk,l,m . Na origem essas funções se comportam como ρ2l+2 , e elas
p
permanecem praticamente iguais a zero tanto quanto ρ < l(l + 1).
A forma das funções ρ2 jl2 (ρ) é mostrada na figura 12.1. Observe que estas funções permanecem
pequenas tanto quanto
p
ρ< l(l + 1) . (12.23)
Portanto, pode-se considerar que a probabilidade (12.19) será praticamente zero para
p
r< l(l + 1)/k . (12.24)
Esse E resultado é fisicamente muito importante, pois ele implica que uma partícula no estado
(0)
ϕk,l,m praticamente não é afetada pelo que ocorre dentro de uma esfera centrada em O de raio
1p
bl (k) = l(l + 1). (12.25)
k

L
Note que na mecânica clássica, uma partícula livre de momen-
tum p e momentum angular L move-se em uma linha reta cuja
b distância b ao ponto O é dada por:
|L|
b= , (12.26)
|p|
que é chamado de parâmetro de impacto da partícula relativa
p p
a origem O. Se |L| for trocado por ~ l(l + 1) e o módulo de
|p| por ~k, obtemos uma expressão para bl (k), a qual pode ser
Figura 12.2: Definição do pa-
interpretada semi-classicamente.
râmetro de impacto de uma par-
Comportamento assintótico: Pode-se mostrar que para
tícula.
r → ∞ temos
1 π
jl (ρ) ' sen ρ − l . (12.27)
ρ→∞ ρ 2
Como sen θ = (eiθ − e−iθ )/2i, logo o comportamento assintótico
das ondas esféricas livres é dado por
r
(0) 2k 2 m e−ikr eilπ/2 − eikr e−ilπ/2
ϕk,l,m (r) ' − Yl (θ, ϕ)
r→∞ πr 2ikr
eilπ/2 2k 2 m

1 −ikr 1 ikr −ilπ
' − Y (θ, ϕ) e − e e (12.28)
r→∞ 2i π l r r
(0)
No infinito, ϕk,l,m (r → ∞) resulta, portanto, na superposição de uma onda chegando e−ikr /r
e uma onda saindo eikr /r, cujas amplitudes diferem por um fator de fase igual lπ.
12.2.1 Expansão de uma onda plana em termos de ondas esféricas

livres
Há duas bases distintas
formadas
E pelos autoestados de H0 : a base {|ki} associada com uma
(0)
onda plana e a base {ϕk,l,m } associada com as ondas esféricas livres. É possível expandir
qualquer ket de uma base em termos dos vetores de estado da outra base.
Considere uma partícula cujo o estado é dado pelo ket |0, 0, ki, o qual está associado com
uma onda plana de vetor de onda k direcionado ao longo do eixo z, ou seja k = kêz , logo o ket
|ki = |0, 0, ki, é dado por
3/2 3/2
1 ikz 1
hk | 0, 0, ki = e = eik·r . (12.29)
2π 2π
O ket |0, 0, ki representa um estado com energia E = ~2 k 2 /2µ bem definida e momentum
|p| = ~k, direcionado ao longo do eixo z. Note porém que como
eikz = eikr cos θ = eik·r , (12.30)
então a onda plana é independente do ângulo ϕ e como a componente Lz do momentum angular

na representação |ri é dada por
~ ∂
Lz = , (12.31)
i ∂ϕ

12.3. Onda parciais no potencial V (r)
então, o ket |0, 0, ki também é um autovetor de Lz , com autovalor zero,

~ ∂ ikr cos θ
Lz |0, 0, ki = 0 ⇐⇒ e =0 (12.32)
i ∂ϕ
Usando a relação de completeza das ondas esféricas livres podemos escrever
ˆ∞ ∞ X
X +l ED E
0 (0) (0)
|0, 0, ki = dk ϕk0 ,l,m ϕk0 ,l,m 0, 0, k (12.33)

0 l=0 m=−l
E
(0)
como Lz |ϕi = ml ~ |ϕi e como |0, 0, ki e ϕk0 ,l,m são dois autoestados de H0 , então eles são
ortogonais se os correspondentes autovalores forem diferentes. Portanto o seu produto escalar
deve ser proporcional a δ(k 0 − k). Similarmente, eles são ambos autoestados de Lz e o seu
produto escalar é proporcional a δm,0 . Portanto a expressão anterior, toma a seguinte forma
D E
(0)
ϕk0 ,l,m 0, 0, k = Ck,l δ(k − k 0 )δl,l0 δm,0 . (12.34)


∞
X E
(0)
|0, 0, ki = Ck,l ϕk,l,0 , (12.35)
l=0
Os coeficientes Ck,l podem ser calculados através da expansão

∞
X
ikz
p
e = il 4π(2l + 1)jl (kr)Yl0 (θ) . (12.36)
l=0
Um estado de momentum linear bem definido, é portanto formado pela superposição dos
estados correspondentes a todos os possíveis momenta angulares.
Note ainda que, como os harmônicos esféricos Yl0 (θ) são proporcionais aos polinômios de
Legendre Pl (cos θ), ou seja, como
r
0 2l + 1
Yl (θ) = Pl (cos θ) , (12.37)
4π
então também podemos escrever
∞
X
eikz = il (2l + 1)jl (kr)Pl (cos θ) . (12.38)
l=0
12.3 Onda parciais no potencial V (r)

Para um potencial central V (r) qualquer, o operador hamiltoniano do problema é
P2
H = H0 + V (r) = + V (r) , (12.39)
2µ
na qual H0 corresponde o hamiltoniano da partícula livre. Portanto, o problema a ser resolvido
é
(H0 + V ) |ϕk,l,0 i = E |ϕk,l,0 i . (12.40)

Figura 12.3: Comportamento do potencial efetivo que entra na equação radial.
Como na representação |ri, temos que as ondas parciais ϕk,l,0 (r) possuem a seguinte forma
1
hr | ϕk,l,0 i = ϕk,l,0 (r) = Rk,l (r) Ylm (θ, ϕ) = uk,l (r) Ylm (θ, ϕ) (12.41)
r
na qual uk,l (r) é a solução da equação radial
~ d2 l(l + 1)~2 ~2 k 2

− + + V (r) uk,l (r) = uk,l (r) , (12.42)
2µ dr2 2µr2 2µ
12.3.1 Condição de Contorno

Na origem temos que:
uk,l (0) = 0. (12.43)
Esse problema é análogo ao de uma partícula de massa µ, sobre a influência de um potencial
efetivo unidimensional Vef (r), como o da figura 12.3, cuja forma é do potencial efetivo Vef (r) é
 2
V (r) + l(l + 1)~ r > 0

Vef (r) = 2µr2 (12.44)
∞

r<0
12.3.2 Equação Radial para r → ∞

Para r → ∞, a equação radial toma a forma
2
d 2
+ k uk,l (r) ' 0 , (12.45)
dr2 r→∞
cuja solução geral é

uk,l (r) ' Aeikr + Be−ikr (12.46)
r→∞
Como uk,l dever satisfazer a condição (12.43), as constantes A e B não podem ser arbitrárias.
No problema unidimensional equivalente, dado pelo potencial da equação (12.44), a condição

(12.43) está relacionada ao fato de que o potencial é infinito para r < 0, e a solução (12.48)
representa a superposição de uma onda plana incidente e−ikr , vindo da direita e de uma onda
plana refletida eikr , propagando da esquerda para a direita. Desde que, não pode haver onda
transmitida, pois V (r) = ∞ para r < 0, a corrente refletida na origem deve ser igual a incidente.
Portanto, vemos que a condição (12.43) implica que, na expressão assintótica (12.48), os valores
das constantes A e B são tais que,
|A| = |B|, (12.47)
e consequentemente, a equação (12.48) toma a forma
uk,l (r) ' |A| eikr + e−ikr eiϕb

(12.48)
r→∞
a qual ainda pode ser reescrita na forma
uk,l (r) ' C sen (kr − βl ) (12.49)

r→∞
Esse mesmo resultado pode ser obtido, observando que para os estados ligados temos que
uk,l ∈ < o que significa então que podemos escrever A = B ∗ = (C/2i)e−iβl , e com isso C ∈ <,
portanto,
C i(kr−βl )
− e−i(kr−βl ) = C sen(kr − βl ).

uk,l (r) ' e (12.50)
r→∞ 2i
A fase βl introduzida, é completamente determinada impondo a continuidade entre a solução
da equação radial e com o seu comportamento assintótico. Assim, como surgiu o fator lπ/2
no comportamento assintótico da onda esférica livre, vamos introduzir o mesmo, fazendo
βl = lπ/2 − δl , na qual δl é o deslocamento de fase. Assim,
π
uk,l (r) ' C sen kr − l + δl (12.51)
r→∞ 2
A quantidade δl definida desse modo, é chamada de deslocamento de fase da onda parcial
ϕk,l,m (r); essa quantidade obviamente depende de k, isto é da energia.
12.3.3 Significado Físico do Deslocamento de Fase

Conforme o exposto, ao considerarmos (12.41) e (12.43), podemos escrever o comportamento
assintótica da onda parcial ϕk,l,0 (r) na seguinte forma:
sen kr − l π2 + δl m

ϕk,l,0 (r) ' C Yl (θ, ϕ)
r→∞ r
e−ikr ei(lπ/2−δl ) − eikr e−i(lπ/2−δl )
' −CYlm (θ, ϕ) (12.52)
r→∞ 2ir
Desse resultado, vê-se que tanto as ondas parciais ϕk,l,0 (r) como as ondas esféricas livres, (12.28),
resultam da superposição de uma onda chegando com uma onda saindo.
Note então que se multiplicarmos o comportamento assintótico da onda parcial acima, (12.52)
pelo fator de fase eiδl e fizermos C = 1, obtemos o mesmo comportamento assintótico da onda

12.4. Seção de choque em termos do deslocamento de fase
esférica livre que chega, (12.28), ou seja,
ϕ̃k,l,0 (r) = eiδl ϕk,l,0 (r) (12.53)

e−ikr eilπ/2 − eikr e−ilπ/2 e2iδl
' −Ylm (θ, ϕ) (12.54)
r→∞ 2ir
ilπ/2

e m 1 −ikr 1 ikr −ilπ 2iδl
' − Y (θ, ϕ) e − e e e (12.55)
r→∞ 2i l r r
Esta expressão pode ser interpretada da seguinte forma: na saída temos a mesma onda que
chega como no caso de uma partícula livre. Quando a onda incidente se aproxima da zona de
influência do potencial ela é mais perturbada por este potencial. Quando ela é refletida, ela
é transformada numa onda que sai, com um deslocamento de fase 2δl acumulado, relativo ao
resultado obtido para uma onda livre saindo, quando o potencial V (r) = 0. O fator e2iδl , o qual
varia com k e l, sumariza o efeito total do potencial sobre uma partícula de momentum angular
l
Portanto, a onda que sai, acumulou um deslocamento de fase de 2δl relativo a onda que
chega, e o fator e2iδl sumariza o efeito do potencial.
12.3.4 Potencial de Alcance Finito

Considere o potencial central V (r), com um alcance r0 finito, ou seja,
V (r) = 0 para r > r0 (12.56)
Como vimos uma onda esférica livre penetra muito pouco numa esfera de raio bl (k), centrada
em O. Então os potenciais de curto alcance como na eq. (12.56) não atuam sobre uma onda
parcial fora do seu alcance, ou seja, se
bl (k) r0 , (12.57)
pois a correspondente onda incidente retorna antes de atingir a zona de influência do potencial
V (r). Portanto, para cada valor de energia há um valor máximo de momentum angular lM , o
qual de acordo com (12.25) é aproximadamente
p
lM (lM + 1) ' kr0 . (12.58)
Os deslocamento de fase só são apreciáveis para valores de l menores ou da ordem de lM .

Para os potenciais de curto alcance e uma baixa energia incidente, o momentum angular
lM é pequeno. Nestes casos pode acontecer que os únicos deslocamentos de fase δl não nulos,
sejam aqueles correspondentes as primeiras ondas parciais: A onda s (l = 0) em baixa energia,
seguida pelas ondas s e p com energias um pouco maiores, etc.
12.4 Seção de choque em termos do deslocamento de fase

O deslocamento de fase caracteriza as modificações, do comportamento assintótico dos estados
estacionários com momentum angular bem definido, causadas pelo potencial. Conhecendo-se o

deslocamento de fase será possível determinar a seção de choque. Para demonstrar isso, deve-se
(dif f )
expressar o estado estacionário vk (r) em termos das ondas parciais, e calcular a amplitude
de espalhamento desta maneira.
12.4.1 Estados estacionários espalhados a partir de ondas parciais

Devemos encontrar uma superposição linear de ondas parciais cujo comportamento assintótico
seja da forma
(dif ) eikr
vk (r) ' eikz + fk (θ, ϕ) (12.59)
r→∞ r
(dif f )
Desde que o estado estacionário é um autoestado do hamiltoniano H, a expansão de vk (r)
2 2
envolve somente ondas parciais tendo a mesma energia ~ k /2µ. Note também que no caso de
um potencial central V (r), o problema de espalhamento que estamos investigando é simétrico
com respeito a uma rotação do feixe incidente em torno do eixo z. Consequentemente, a função
(dif f )
de onda do espalhamento estacionário vk (r) é independente do ângulo azimutal ϕ, então
esta expansão inclui somente ondas parciais para as quais m é zero. Finalmente, temos uma
expressão da forma:
∞
X
(dif )
vk (r) = Cl ϕ̃k,l,0 (r) . (12.60)
l=0
Então o problema consiste em determinar os Cl
12.4.2 Argumento Intuitivo

(dif )
Quando V (r) = 0, a função de onda vk (r) reduz-se a uma onda plana eikz e as ondas
parciais tornam-se ondas esféricas livres, ou seja,
(dif ) (0)
vk (r) → eikz e ϕ̃k,l,0 (r) → ϕk,l,0 (r) . (12.61)
Vimos que
(dif )
• para V (r) 6= 0, vk (r) inclui uma onda divergente e uma onda plana;
(0)
• ϕ̃k,l,0 (r) difere de ϕk,l,0 (r) no seu comportamento assintótico somente pela presença da
onda saindo, a qual tem a mesma dependência radial da onda espalhada. Esse termo da
onda incidente possui o termo do deslocamento de fase.
Portanto, os coeficientes da expansão (12.59) são os mesmo da eq. (12.36), com isso, temos
∞
X
(dif )
p
vk (r) = il 4π(2l + 1)ϕ̃k,l,0 (r) . (12.62)
l=0

12.4.3 Dedução explicita dos termos da expansão

Mostraremos que (12.62) é de fato a expansão correta. Para isso, temos que
∞
X p
il 4π(2l + 1)ϕ̃k,l,0 (r) '
r→∞
l=0
∞
X p e−ikr eilπ/2 − eikr e−ilπ/2 e2iδl
il 4π(2l + 1)Yl0 (θ)
l=0
2ir
Note ainda que:
e2iδl = cos(2δl ) + i sen(2δl )

= 1 − 2sen2 (δl ) + 2i sen(δl ) cos(δl )
= 1 + 2 sen(δl ) [− sen(δl ) + i cos(δl ]
= 1 + 2i sen(δl ) [i sen(δl ) + cos(δl ]
= 1 + 2i sen(δl )eiδl
Substituindo na expressão anterior, obtém-se que
∞
X ∞
X
p p
il 4π(2l + 1)ϕ̃k,l,0 (r) ' il 4π(2l + 1)Yl0 (θ)×
r→∞
l=0 l=0
−ikr ilπ/2
− eikr e−ilπ/2 eikr 1 −ilπ/2 iδl

e e
− · ·e e sen(δl )
2ir r k
Como, vimos r
(0) 2k 2
ϕk,l,m (r) = jl (kr) Ylm (θ, ϕ)
π
∞ ∞ r
ikz
X p X p π (0)
e = il 4π(2l + 1)jl (kr)Yl0 (θ) = il 4π(2l + 1) ϕ (r)
l=0 l=0
2k 2 k,l,m
(0)
Entretanto como a expansão assintótica de ϕk,l,m (r) é dada por
r
(0) 2k 2 0 e−ikr eilπ/2 − eikr e−ilπ/2
ϕk,l,m (r) ' − Y (θ)
r→∞ π l 2ikr
então
∞ r r
X p π 2k 2 m
eikz ' − il 4π(2l + 1) Y (θ, ϕ)×
r→∞
l=0
2k 2 π l
e−ikr eilπ/2 − eikr e−ilπ/2
2ikr
Portanto, o termo eikz é identificado como,
∞
X p e−ikr eilπ/2 − eikr e−ilπ/2
eikz ' − il 4π(2l + 1)Yl0 (θ) .
r→∞
l=0
2ikr

Portanto, a expansão das ondas parciais é:

∞
X p eikr
il 4π(2l + 1)ϕ̃k,l,0 (r) ' eikz + fk (θ) (12.63)
l=0
r→∞ r
na qual usamos o fato de que: e−ilπ/2 = (−i)l = (1/i)l , para escrever

∞
1 Xp
fk (θ) = 4π(2l + 1)eiδl sen(δl )Yl0 (θ) (12.64)
k l=0
12.4.4 Cálculo da Seção de Choque

A seção de choque diferencial de espalhamento [7] é
2
∞
1 X p
σ(θ) = |fk (θ)|2 = 2 4π(2l + 1)eiδl sen(δl )Yl0 (θ) (12.65)

k l=0

e portanto, a seção de choque é dada pela integral sobre todo o ângulo sólido dΩ
ˆ ∞ ∞
1 XX p
σ = dΩ σ(θ) = 2 4π (2l + 1)(2l0 + 1)ei(δl −δl0 ) ×
k l=0 l0 =0
ˆ
sen(δl ) sen(δl0 ) dΩ Yl00 (θ)Yl0 (θ) (12.66)
Como os harmônicos esféricos são ortonormais, obtemos:

∞ ∞
4π X 2
X
σ= 2 (2l + 1)sen (δl ) = σl (12.67)
k l=0 l=0
12.4.5 Comentários
• Os termos resultantes da interferência entre as ondas com diferentes momenta angulares
desaparecem da seção de choque total.
• Para um potencial central V (r) qualquer, a contribuição

4π
(2l + 1)sen2 (δl ) (12.68)
k2
associada a um valor l > 0, tem um limite superior, para uma dada energia de
4π
(2l + 1) (12.69)
k2
12.4.6 Teorema Óptico

Há uma relação simples entre a seção de choque total e a parte imaginária de fk (θ) para
espalhamentos que ocorram na direção do feixe incidente, θ = 0. A parte imaginária de fk (θ) é
∞
1 Xp
Im(fk (θ)) = 4π(2l + 1)sen2 (δl )Yl0 (θ = 0) (12.70)
k l=0

Como r
2l + 1
Yl0 (θ = 0) = , (12.71)
4π
temos então que
4π
σ= · Im(fk (θ)) (12.72)
k
Esta relação é conhecida como teorema óptico.


Capítulo 13
Método das Funções de Green: Resolvente
13.1 Método das funções de Green

Tipicamente o formalismo do espalhamento é descrito do seguinte modo: uma partícula
incidente no estado |ψ0 i é espalhada pelo potencial do centro espalhador V , resultando em
uma onda espalhada representada pelo estado espalhado |ψs i. O estado incidente |ψ0 i é um
autoestado do hamiltoniano H0 , com autovalor E. Isso pode ser expresso matematicamente
como
(E − H0 ) |ψ0 i = 0 (13.1)
A menos que seja especificado de outra forma, o hamiltoniano H0 é aquele de uma partícula
livre,
P2
H0 = (13.2)
2m
e o estado da onda incidente é uma onda plana, ou seja
hr|ψ0 i = ψ0 (r) = eik·r (13.3)
com um espalhamento unidimensional, não é necessário normalizar o estado da onda incidente.

Além disso, o potencial espalhador é considerado localizado ou seja,
lim V (r) = 0. (13.4)

r→∞
O objetivo da teoria de espalhamento é resolver o problema
(E − H0 − V ) |ψi = 0, (13.5)
no qual E > 0, e |ψi são os autoestado do hamiltoniano completo H = H0 + V com energia E.

Note que para cada |ψ0 i há um correspondente |ψi com energia E.
13.1.1 Equação de Lippman-Schwinger

O estado espalhado pode ser definido por
|ψs i = |ψi − |ψ0 i , (13.6)
303
13.1. Método das funções de Green
portanto a equação de Schrödinger pode ser escrita da seguinte forma
(E − H0 ) |ψi = V |ψi , (13.7)
a qual, após substituirmos |ψi = |ψ0 i + |ψs i, ela toma a seguinte forma
(E − H0 ) |ψs i = V |ψi , (13.8)
Operando em ambos os lados com o operador (E − H0 )−1 , obtém-se que
|ψs i = (E − H0 )−1 V |ψi (13.9)
a qual pela adição de |ψ0 i de ambos os lados resulta em
|ψi = |ψ0 i + (E − H0 )−1 V |ψi (13.10)
a qual é conhecida com equação de Lippman-Schwinger.
13.1.2 A função de Green

O resultado anterior, em geral é expresso em uma notação mais compacta pela introdução
do conceito de função de Green, definida como
1
GH (E) = lim (E − H0 + i)−1 = lim . (13.11)
→0 E − H0 + i
→0
Usando essa definição a equação de Lippman-Schwinger, toma a seguinte forma
|ψi = |ψ0 i + G0 V |ψi . (13.12)
A solução da equação de Lippman-Schwinger para |ψi, é formalmente muito simples,
|ψi = (1 − G0 V )−1 |ψ0 i . (13.13)
A seguir, o significado dessa solução será analisado e será feita uma analogia com a expansão de
Born.
13.1.3 Expansão de Born

Um outro modo de resolver a equação de Lippman-Schwinger é por um método iterativo.
Para resolver (13.13) por iteração, reescrevemos a equação como
|ψnova i = |ψ0 i + G0 V |ψvelha i . (13.14)
Inicia-se o processo iterativo com a aproximação de ordem zero, na qual, |ψvelha .i = |ψ0 i e usa-se
a expressão (13.14) para realizar a iteração, da seguinte forma
Ordem: 0 −→ |ψnova i = |ψ0 i

Ordem: 1 −→ |ψnova i = |ψ0 i + G0 V |ψ0 i
Ordem: 2 −→ |ψnova i = (1 + G0 V + G0 V G0 V ) |ψ0 i
.. .. ..
. −→ .=.
Ordem: n −→ |ψnova i = (1 + G0 V + G0 V G0 V + · · · + G0 V · · · G0 V ) |ψ0 i
| {z }
n vezes

Portanto, após um número infinito de iterações, esse procedimento retorna
|ψi = (1 + G0 V + G0 V G0 V + G0 V G0 V G0 V + · · · ) |ψ0 i , (13.15)
a qual é conhecida com expansão de Born.

Em sua forma integral, usando o fato de que
hr|ψi = ψ(r) eque hr| G0 |r0 i = G0 (r, r0 ). (13.16)
ela pode ser escrita como

ˆ
ψ(r) = ψ0 (r) + d3 r1 G0 (r, r1 )V (r1 )ψ0 (r1 )+
ˆ ˆ
d r1 d3 r2 G0 (r, r1 )V (r1 )G0 (r1 , r2 )V (r2 )ψ0 (r2 )+
3
ˆ ˆ ˆ
d r1 d r2 d3 r3 G0 (r, r1 )V (r1 )G0 (r1 , r2 )V (r2 )×
3 3
G0 (r2 , r3 )V (r3 )ψ0 (r3 ) + · · · (13.17)
A função de Green usada, é aquela já encontrada

0
1 e±ik|r−r |
G0 (r, r0 ) = − (13.18)
4π |r − r0 |
Figura 13.1: Interpretação dos termos da expansão de Born.
A representação quântica do espalhamento, como sugerido pela expansão de Born, é a da

propagação livre (descrita por G0 ) pontuada por “colisões” instantâneas, descritos por V . Esta

imagem está em desacordo com a imagem clássica de um movimento suave e contínuo sobre a
“superfície de potencial”. De fato, sabe-se da física de altas energias que todas as interações são
devido à troca de (não conservando a energia) bósons “virtuais”, por exemplo, fótons ou glúons.
A noção de uma inter-partícula “potencial” é, portanto, uma aproximação que negligência o
efeito de retardo, devido à velocidade de propagação finita da partícula mediadora. Esta imagem
quântica sugerida pela série de Born é mais precisa do que a visão clássica, como podemos
pensar em cada “colisão”, como sendo a troca de uma partícula virtual, que é de fato um evento
discreto.
13.1.4 Convergência da série de Born

O método iterativo usado para deduzir a expansão de Born é uma formulação mais compacta
da formulação equivalente da teoria de perturbação. Note que nem sempre a série de Born
converge, havendo casos em que ela diverge. Esse problema mais conhecido como o problema
da renormalização. Foi sugerido incluir um determinado infinito que subtrairia o infinito da
série, fornecendo um resultado fisicamente aceitável.
O objetivo do procedimento de renormalização é adicionar uma pequena correção a cada
termo da série de Born, de modo que ao somarmos todos os termos da série, a soma dessas
correções fornece um infinito que irá cancelar o infinito gerado pelos outros termos da série. Para
vermos como isso funciona, será definido inicialmente os autoestados do operador (1 − G0 V )−1
da seguinte forma
G0 V |ni = zn |ni com zn ∈ C (13.19)
na qual zn é o n-ésimo autovalor complexo de (1 − G0 V )−1 . Será considerado por conveniência

que o espectro autovalores é discreto, porém isso não limita o resultado, que também pode ser
obtido para um espectro contínuo. Nessa base, pode-se expressar o operador G0 V como
X |ni hn|
G0 V = (13.20)
n
1 − zn
Note que a expansão em série (1 − zn )−1 converge somente para |z| < 1. Isso ocorre porque a
expansão da série converge apenas para pontos da expansão distantes da singularidade mais
próxima da função que está sendo expandida. Aqui o ponto de expansão é z = 0 e a singularidade
está em z = 1. Podemos realizar uma expansão em série válida de (1 − G0 V )−1 via
X X |nihn|
(1 − G0 V )−1 = θ(1 − zn )|nihn|(1 + zn + zn2 + · · · ) + θ(|zn | − 1) ,
n n
1 − zn
na qual θ(x) é a função passo. Para o caso em que |zn | > 1, pode-se expandir em série de 1/zn ,
como
1 1 1
=− ·
1 − zn zn 1 − z1n
1
= − · 1 + zn−1 + zn−2 + zn−3 + · · ·

zn

13.2. A matriz de espalhamento T
Essas duas séries podem ser combinadas para fornecer

X ∞
X
(1 − G0 V )−1 = znm + θ(|zn | − 1) −znm + (−zn−m−1 )

|nihn|
n m=0
∞ X
X
|nihn| znm − θ(|zn | − 1)(znm + zn−m−1 )

=
m=0 n
X∞
= [(G0 V )m − Rm ] (13.21)
m=0
na qual o m-ésimo termo de renormalização é dado por

X
Rm = u(|zn | − 1)|nihn|(znm + zn−m−1 ). (13.22)
n
A ideia é, então, que a série renormalizada irá convergir normalmente, então você pode
tomar tantos termos quantos forem necessário para atingir a precisão desejada. É claro que esta
renormalização é difícil na prática, pois os autovalores e autovetores de G0 V normalmente não
são conhecidos, mas estabelece-se então uma prova de princípio da série de Born “renormalizada”.
13.2 A matriz de espalhamento T

A partir da série de Born, viu-se que a onda espalhada |ψs i = |ψi − |ψ0 i é dada por
|ψs i = (G0 V + G0 V G0 V + G0 V G0 V G0 V + · · · ) |ψ0 i (13.23)
Com base na interpretação na interpretação de Born, vê-se que cada termo contém pelo
menos um “evento de espalhamento”. Para cada termo, a onda espalhada, então, propaga-se
livremente para o detector a partir do último ponto de espalhamento. Esta propagação final
livre pode ser fatorada para fora da expressão fornecendo então que
|ψs i = G0 (V + V G0 V + V G0 V G0 V + · · · ) |ψ0 i (13.24)
Então a soma entre parênteses representa simplesmente a história de todas as possíveis maneiras
que a partícula poderia ter feito isso para chegar ao local do evento final do espalhamento. Se
colocarmos tudo isso em uma “caixa preta” contendo essa história, e chamá-la de uma matriz T,
obtém-se que
|ψs i = G0 T |ψ0 i , (13.25)
a qual define a matriz de espalhamento T . Comparando as eqs. (13.9) e (13.23) mostra-se que
|ψs i = G0 V (1 − G0 V )−1 |ψ0 i , (13.26)
T = V (1 − G0 V )−1 (13.27)

13.3. Cálculo da função de Green via o cálculo de resíduos
ou equivalentemente
T = (1 − G0 V )−1 V. (13.28)
Esta equivalência pode ser provada multiplicando ambas as equações a esquerda por (1 − V G0 )
e a direita por (1 − G0 V ), as quais fornecem que V − V G0 V = V − V G0 V .
Ignorando a questão da convergência por enquanto, a expansão em série
(1 − 1A)−1 = 1 + A + A2 + A3 + · · · , (13.29)
fornece que
T = V + V G0 V + V G0 V G0 V + V G0 V G0 V G0 V + · · · (13.30)
Projetando esta equação nos autoestados da posição , resulta nos elementos de matriz da
matriz de espalhamento T no espaço das posições:
ˆ
T (r, r ) = V (r)δ(r − r ) + V (r)G0 (r, r )V (r ) + d3 r00 V (r)G0 (r, r00 )V (r00 )G0 (r00 , r0 )V (r0 ) + · · ·
0 0 0 0
(13.31)
na qual
T (r, r0 ) = hr| T |r0 i e G0 (r, r0 ) = hr| G0 |r0 i . (13.32)
13.3 Cálculo da função de Green via o cálculo de resíduos

Devido G0 = (E − H0 − i), segue que os autoestados de G0 são autoestados de H0 . Portanto,
a função de Green pode ser expressa na base dos autoestados de H0 , por
Xˆ ∞ |E 0 , mi hE 0 , m| X |n, mi hn, m|
G0 = dE 0 + , (13.33)
m Ec E − E 0 + i m,n
E − En + i
na qual Ec é energia limiar do contínuo, a soma em m leva em conta todas as possíveis

degenerescências, e a soma sobre n inclui todos os estados ligados que estejam abaixo do limiar
do contínuo, isto é, En < Ec para ∀n. Agora por simplicidade, será considerado o caso em que
não há degenerescências, nenhum estado ligado, e Ec = 0, assim
ˆ ∞
|E 0 i hE 0 |
G0 = dE 0 . (13.34)
0 E − E 0 + i
Projetando essa função de Green, no autoestados da posição, obtém-se que
ˆ ∞
0 0 hr|E 0 i hE 0 |r0 i
G0 (r, r ) = hr| G0 |r i = dE 0 , (13.35)
0 E − E 0 + i
ou seja, ˆ ∞
0 ψE∗ 0 (r)ψE 0 (r0 )
G0 (r, r ) = dE 0 , (13.36)
0 E − E 0 + i
a qual, se as energias e funções de onda dos autoestados forem conhecidas, pode-se resolver a
integral acima trocando a energia pelo vetor de onda k, e usando uma integração por contorno
para obter uma expressão analítica.

13.3.1 Partícula livre em uma dimensão

Para uma partícula livre em uma dimensão temos que a energia da mesma é dada por
~2 k 2
E= , (13.37)
2m
e que
1
ψE (x) = hx|Ei = √ eikx , (13.38)
2π
logo a expressão (13.36) toma a seguinte forma
ˆ +∞ 0 0
0 1 eik (x−x )
G(x, x ) = dk 0 2 k 02
2π −∞ E − ~2m + i
ˆ +∞ 0 0
m eik (x−x )
0
=− 2 dk 02 . (13.39)
π~ −∞ k − k 2 − i
p
na qual k = 2mE/~2 . Como
√ √
k 02 − k 2 − i = k 0 + k 2 + i k 0 − k 2 + i ,
√ i
i
e note que como 1, segue então que: k 2 + i = k 1 + 2k2
+ ··· = k + 2k
' k + i. Note
que como é um número real e positivo infinitesimalmente pequeno, então para um número
positivo finito qualquer α, ele satisfaz a seguinte relação: α = .
Portanto, diante do exposto, a integral anterior toma a seguinte forma
ˆ +∞ 0 0
0 m 0 eik (x−x )
G(x, x ) = − 2 dk . (13.40)
π~ −∞ (k 0 + k + i) (k 0 − k − i)
Esta integral pode ser resolvida usando o método de integração por contorno, o que significa
que k 0 é estendido sobre o plano complexo via k → kR + ikI , o que conduz a exponencial
0 0 0
eik(x−x ) → eikR (x−x ) e−kI (x−x ) . Como desejamos uma função que vá a zero no infinito, ou seja,
quando |k| → ∞, vê-se então que para x > x0 deve-se fechar a metade superior do plano
complexo, de modo que o contorno inclua somente o polo k 0 = k + i. Para x < x0 , deve-se
então fechar a metade inferior do plano complexo, de modo que o contorno inclua somente o
polo k 0 = −k − i, conforme ilustra figura 13.2.
Usando o teorema do resíduo,
˛
f (z)
dz = ±2πif (z0 ), (13.41)
z − z0
no qual o sinal positivo +, é usado para o contorno de integração percorrido no sentido anti-
horário, e o sinal negativo −, é usado para o contorno de integração percorrido no sentido
horário, disso segue imediatamente que
 0)
eik(x−x
0
− mi ·
~2 k
; x > x0
G(x, x ) = 0) (13.42)
e−ik(x−x
mi
− ·
~2 k
; x < x0

Figura 13.2: Contornos de integração no plano complexo.
Esses resultados podem ser combinados em uma única expressão, mais compacta, assim
0
0 0mi eik|x−x |
G(x, x ) = hx| G0 |x i = − 2 · . (13.43)
~ k
Esta expressão mostra que a corrente está fluindo na direção que vai de x0 para x. Isso, mostra
que a escolha do termo −i nos conduziu a uma corrente que sai do ponto x0 em direção ao
ponto x. Se os termos −i → +i, forem trocados, então será obtida um fluxo de corrente que
chega ao ponto x0 proveniente do ponto x.
13.3.2 Partícula livre em três dimensões

A energia de uma partícula livre em três dimensão é dada por
~2 k2
E= , (13.44)
2m
e a sua função de onda é
1
ψE (r) = hr|Ei = eik·r , (13.45)
(2π)3/2
logo a expressão (13.34) toma a seguinte forma
ˆ ∞
|ki hk|
G0 = G0 = d3 k 2 k2 (13.46)
0 E − ~2m + i
Projetando essa expressão nos autoestados da posição |ri, e fatorizando o denominador

obtém-se que
ˆ 0 0
0 0 2m 3 0 eik ·(r−r )
G0 (r, r ) = hr| G0 |r i = − dk . (13.47)
(2π)3 ~2 (k 0 + k + i) (k 0 − k − i)
Escolhendo o eixo z, ao longo da direção r − r0 , e escolhendo a variável u = cos θ, então pode-se

escrever a expressão anterior como
ˆ +1 ˆ ∞ 0 0
0 2m 02 0 eik |r−r |u
G0 (r, r ) = − du k dk , (13.48)
(2π)2 ~2 −1 0 (k 0 + k + i) (k 0 − k − i)

13.4. Exemplo: Espalhamento por uma função delta 1d
realizando a integração na variável u, obtém-se que

ˆ ∞ 0 0 0 0
0 2m 02 0 eik |r−r | − e−ik |r−r |
G0 (r, r ) = − k dk ,
(2π)2 ~2 0 (k 0 + k + i) (k 0 − k − i) ik 0 |r − r0 |
ˆ ∞ 0 0 0 0
k 02 eik |r−r | e−ik |r−r |

2m 0
=− dk −
(2π)2 ~2 0 ik 0 |r − r0 | (k 0 + k + i) (k 0 − k − i) (k 0 + k + i) (k 0 − k − i)
fazendo k 0 → −k 0 na segunda integral acima, pode-se então reescrever essa expressão como
ˆ ∞ 0 0
0 2m 02 0 eik |r−r |
G0 (r, r ) = − k dk 0 , (13.49)
(2π)2 ~2 −∞ (k + k + i) (k 0 − k − i) ik 0 |r − r0 |
desde que |r − r0 | > 0, pode-se escolher a metade superior do plano complexo como o contorno
de integração, dessa forma, o teorema do resíduo fornece que
0
0 2m 2 eik|r−r |
G0 (r, r ) = − (2πi)k .
(2π)2 ~2 2ik 2 |r − r0 |
Portanto, a expressão final para a função de Green em três dimensões torna-se

0
2m eik|r−r |
G0 (r, r0 ) = G0 (|r − r0 |) = − · . (13.50)
2π~2 |r − r0 |
13.4 Exemplo: Espalhamento por uma função delta 1d

13.4.1 A matriz T de uma função delta 1d
Considere uma partícula livre, a qual em seu movimento unidimensional, incide diretamente
sobre um potencial da forma de uma função delta, V (x) = αδ(x). Para determinar as probabili-
dades de transmissão T e reflexão R, será então necessário resolver o problema de espalhamento.
Inicialmente será calculada a matriz de espalhamento T , dada por 13.31 e usando a função de
Green 13.43, com isso pode-se escrever
ik|x−x0 |
0 0 mi e
T (x, x ) =αδ(x)δ(x − x ) + αδ(x) − 2 · αδ(x0 )+
~ k
ˆ ik|x−x00 | ik|x00 −x0 |
00 mi e 00 mi e
αδ(x) dx − 2 · αδ(x ) − 2 · αδ(x0 ) + · · ·
~ k ~ k
" 2 #
αmi αmi
=αδ(x) δ(x − x0 ) + − 2 δ(x0 ) + − 2 δ(x0 ) + · · ·
~k ~k
Note aqui, que o produto δ(x)δ(x − x0 ) = δ(x)δ(−x0 ) = δ(x)δ(x0 ), pois a delta é uma função
par, logo podemos escrever
" 2 #
0 0 αmi αmi
T (x, x ) = αδ(x)δ(x ) 1 + − 2 + − 2 + ···
~k ~k
αδ(x)δ(x0 )
= (13.51)
1 + i ~αm
2k

13.4. Exemplo: Espalhamento por uma função delta 1d
Agora tem-se condições de se calcular a a onda espalhada dada pela Eq. (13.25). Considerando
que a onda incidente é dada por
ψ0 (x) = eikx , (13.52)
segue então que a onda espalhada será dada por
ˆ ˆ
0
ψs (x) = dx dx00 G(x, x0 )T (x0 , x00 )ψ0 (x00 )
ˆ ˆ ik|x−x0 |
αδ(x0 )δ(x00 ) ikx00

0 00 mi e
= dx dx − 2 · · e
~ k 1 + i ~αm
2k
αmi eik|x|
=− 2 ·
~ k 1 + i ~αm 2k
1
=− ~2 k
eik|x| (13.53)
1 − i αm
Introduzindo o comprimento de espalhamento
~2
a= (13.54)
αm
então pode-se escrever a solução completa como sendo dada |ψi = |ψs i + |ψ0 i, logo
1
ψ(x) = eikx − eik|x| (13.55)
1 − ika
Para x < 0, essa equação toma a seguinte forma
1
ψ(x) = eikx − e−ikx , (13.56)
1 − ika
a partir da qual pode-se identifica a amplitude de reflexão como sendo
1
r=− (13.57)
1 − ika
e como a probabilidade de reflexão R = |r|2 , tem-se então que
1
R = |r|2 = . (13.58)
1 + (ka)2
O ponto de retorno do potencial requer que α → 0, o que corresponde a a → ∞, caso no qual
tem-se que R = 0 como já erá esperado. Para x > 0 encontra-se que
1 ika ikx
ψ(x) = eikx − eikx = e (13.59)
1 − ika 1 − ika
da qual identifica-se imediatamente que a amplitude de transmissão é dada por
ika
t= . (13.60)
1 − ika
E dessa segue que a probabilidade de transmissão é dada então por
(ka)2
T = |t|2 = , (13.61)
1 + (ka)2
a qual vai para 1 quando α → 0, como requerido. Note ainda que T + R = 1, o que satisfaz a
conservação da corrente de probabilidade.

13.5. Resolventes e Funções de Green
13.4.2 Solução direta da equação de Lippman-Schwinger

Na seção anterior, apresentamos um exemplo que ilustrou o uso do formalismo da matriz de
espalhamento T . Para centros espalhadores 1d, constituídos inteiramente por funções delta, o
método de solução mais fácil é via a equação de Lippman-Schwinger dada por (13.12). Projetando
a equação de Lippman-Schwinger, Eq. (13.12), no espaço das posições |xi, obtém se que
hx|ψi = hx|ψ0 i + hxG0 V |ψi (13.62)
Inserindo um projetor entre G0 e V , e usando o fato de que V é diagonal nessa base, então
obtém-se ˆ
ψ(x) = ψ0 (x) + dx0 G0 (x, x0 )V (x0 )ψ(x0 ), (13.63)
que é uma equação integral para ψ(x). Para os casos em que V (x) = αδ(x − x0 ), a integral
pode ser feita, o que resulta em
ψ(x) = ψ0 (x) + αG0 (x, x0 )ψ(x0 ). (13.64)
A quantidade desconhecida ψ(x0 ) pode ser determinada, tomando o caso em que x = x0 , na

equação anterior, o que resulta em
ψ(x0 ) = ψ0 (x0 ) + αG0 (x0 , x0 )ψ(x0 ) (13.65)

ψ0 (x0 )
ψ(x0 ) = . (13.66)
1 − αG0 (x0 , x0 )
Portanto, a solução da equação de Lippman-Schwinger é então dada por
αG0 (x, x0 )ψ0 (x0 )
ψ(x) = ψ0 (x) + . (13.67)
1 − αG0 (x0 , x0 )
Agora usando o fato de que ψ0 (x) = eikx e que G0 (x, x0 ) é dada pela expressão (13.43), a equação
anterior toma a seguinte forma
0
ikx αmi eik|x−x |
ψ(x) = e − 2 ·
~ k 1 + i ~αm 2k
1
= eikx − eik|x| (13.68)
1 − ika
o que recuperou o resultado obtido anteriormente.
13.5 Resolventes e Funções de Green

Já foi considerada a interpretação de uma função de um operador auto-adjunto Q, com um
espectro de autovalores discreto Σ(Q) = {qi ; i = 1, 2, . . .}, e resolução espectral
∞
X
Q= qk |ki hk| , (13.69)
k=1

na qual
Q |ki = qk |ki (13.70)

hk|ji = δkj (13.71)
∞
1=
X
|ki hk| . (13.72)
k=1
Em particular, os autovetores de Q formam um conjunto completo ortonormal.

Se f (q) for uma função qualquer definida em Σ(Q), então define-se
X
f (Q) = f (qk ) |ki hk| . (13.73)
k
Pode-se, então observar que [f (Q), Q] = 0. Se f (q) for definida e limitada em Σ(Q), então
f (Q) será um operador limitado, para o qual a norma de um operador é definida conforme:
kf (Q)kop ≡ sup kf (Q)φk (13.74)

kφk=1
= sup |f (q)| (13.75)

q∈Σ(Q)
< ∞, se f (q)é limitado. (13.76)
Agora define-se a função de um operador G(z), chamada de resolvente de Q, da variável

complexa z, para todos z que não estejam em Σ(Q) por1 :
1
G(z) = , z∈
/ Σ(Q). (13.77)
Q−z
Para qualquer z tal que o operador G(z) seja limitado, têm-se
1
kG(z)kop = sup . (13.78)
k |qk − z|
O resolvente satisfaz as seguintes identidades
X 1 1

G(z) − G(z0 ) = − |ki hk|
q k −z q k − z0
k
X z − z0
= |ki hk|
k
(qk − z)(qk − z0 )
z − z0
=
(Q − z)(Q − z0 )
= (z − z0 )G(z)G(z0 ), (13.79)
G(z0 )
G(z) = , (13.80)
1 + (z0 − z)G(z0 )
e
Q = z + 1/G(z). (13.81)
1
O resolvente é algumas vezes definido com o sinal oposto. Verá-se eventualmente que G(z) também possui
uma motivação em termos da fórmula integral de Cauchy.

Se os autovetores estão escritos como funções de r ∈ R3 (considerando que o espaço de

Hilbert é L2 (R3 )), pode-se representar o resolvente como uma transformação integral das funções
de onda. Isto é, como
1 X |ki hk|
G(z) = = , (13.82)
Q−z k
qk − z
e
hr|ki = φk (r), (13.83)
define-se então
X φk (r)φ∗ (r0 )
0 k
G(r, r ; z) = , (13.84)
k
qk − z
tal que G opera sobre a função de onda da seguinte forma
ˆ
[G(z)ψ] (r) = d3 r0 G(r, r0 ; z)ψ(r0 ). (13.85)
(∞)
Portanto, G(r, r0 ; z) é o chamado kernel da transformação integral. Pode-se ver que essa
correspondência é obtida da seguinte forma: primeiro expanda
X
ψ(r0 ) = ψ` φ` (r0 ). (13.86)
`
obtém-se então que

ˆ X φk (r)φ∗ (r0 ) X
3 0
dr k
ψ` φ` (r0 )
(∞) k
qk − z `
X φk (r) X ˆ
= ψ` d3 r0 φ∗k (r0 )φ` (r0 )
k
qk − z ` (∞)
X ψk φk (r)
= . (13.87)
k
qk − z
Essa é para ser comparada com

X 1 X
[G(z)ψ] (r) = |ki hk| ψ` |`i
k
qk − z `
X ψk φk (r)
= . (13.88)
k
qk − z
Portanto, demonstrou-se a representação como uma transformação integral. Resultados similares

aplicam-se em outros espaços L2 das funções de onda sediadas em L2 (R3 ).
Considere agora a seguinte relação formal:
1
(Q − z)G(z) = (Q − z) = 1. (13.89)
Q−z
Correspondente a esse, operador tem-se:2
(Qr − z)G(r, r0 ; z) = δ(r − r0 ), (13.90)

2
Usa-se o índice r em Q para denotar que, se, por exemplo, Q for um operador diferencial, a diferenciação é
sobre a variável r.

desde que δ(r − r0 ) é o correspondente kernel da identidade 1. Essa função delta é portanto
simbólica da relação: ˆ
(Qr − z) d3 r0 G(r, r; z)ψ(r0 ) = ψ(r), (13.91)
(∞)
para qualquer função contínua ψ(r) em L2 (R3 ) (contínua no case em que Q é um operador
diferencial).
O kernel G(r, r0 ; z) é chamado de Função de Green para o operador (diferencial) Q. Essa
função de Green é o “kernel para um resolvente” (como com o resolvente, a convenção de sinal
não é universal). Ela é a solução da equação diferencial não homogênea, (13.90) para uma fonte
impulsiva, a qual satisfaz as condições de fronteira, desde que ela pode ser expressa em uma
expansão dos vetores da base que satisfazem as condições de fronteira:
∞
0
X φk (r)φ∗ (r0 )
k
G(r, r ; z) = . (13.92)
k=1
qk − z
A partir dessa relação, também pode-se ver a propriedade de simetria:
G(r, r0 ; z)∗ = G(r0 , r; z ∗ ). (13.93)
1
A definição apresentada para G(z) ≡ Q−z
sugere que o resolvente seja uma função analítica
(função de um operador, o qual dever ser avaliado) de z o qual está no complemento do espectro
de autovalores de Q. Para um ponto qualquer z0 ∈
/ Σ(Q), tem-se a seguinte série de potência:
∞
X
G(z) = G(z0 ) [(z − z0 )G(z0 )]n . (13.94)
n=0
Esta série converge na norma dentro de qualquer disco |z − z0 | < ρ o qual não intersepta Σ(Q).
Além disso para n-ésimo termo da série, tem-se que
n
n ρ 1
kG(z0 ) [(z − z0 )G(z0 )] kop ≤ , (13.95)
ρ0 ρ0
para o qual
1
= kG(z0 )kop = distância [z0 , Σ(Q)] . (13.96)
ρ0
Desde que o resolvente é “analítico”, pode-se usar o contorno de integração. Por exemplo, na
13.3 considerou-se que o contorno C4 encerasse um único autovalor q4 não-degenerado.
Fig.Então
ˆ ˆ X ∞
1 1 |ki hk|
G(z) dz = dz (13.97)
2πi C4 2πi C4 k=1 qk − z
ˆ
1 |φ4 i hφ4 |
= dz (13.98)
2πi C4 q4 − z

z − q4
= |φ4 i hφ4 | lim (13.99)
z→q4 q4 − z
= − |φ4 i hφ4 | . (13.100)

. . . . ... . q
4
C4
Figura 13.3: O plano complexo z, com autovalores de Q indicados sobre o eixo. Um contorno é
mostrado encerrando um dos autovalores.
Isto é, ˆ
1
|φ4 i hφ4 | = − G(z) dz. (13.101)
2πi C4
O contorno da integral de G em torno de um autovalor de Q fornece a projeção dentro do

subespaço unidimensional do correspondente autovetor de Q.
Agora considere que o espectro de Q está limitado por baixo, isto é, deve existir um α > −∞
tal que qk > α, ∀k. De interesse particular é o hamiltoniano, o qual possui suas propriedades.
Neste caso, pode-se considerar um contorno o qual encerra todos os autovalores, como ilustrado
na Fig. 13.4:
Ch
h
. . . . . . . .. .
q
1
h
Figura 13.4: Um contorno o qual encerra todo o espectro de autovalores de Q.
Têm-se então que ˆ

1
I=− G(z) dz, (13.102)
2πi C∞
como pode ser provado por um processo limitante, e note que a convergência está toda correta.
Conforme a fórmula integral de Cauchy, pode-se expressar funções analíticas de Q em termos
de integrais de contorno: Seja f (z) uma função que é analítica em uma região a qual contém

C∞ . Então ˆ ˆ
1 f (z) dz 1
f (Q) = =− dzf (z)G(z), (13.103)
2πi C∞ z−Q 2πi C∞
. considerando-se que essa integral converge.

Em particular considere a função f (z) = e−izt :
ˆ ∞
−itQ 1 X
U (t) = e =− G(z)e−izt dz = |ki hk| e−itqk , (13.104)
2πi C∞ k=1
com a restrição de que Im(t) ≤ 0.

A principal aplicação de tudo isso ocorre quando Q = H é o hamiltoniano. Para t real, nesse
caso, U (t) é a transformação de desenvolvimento temporal, ou o operador evolução
temporal. Note que ele satisfaz (considerando que H não possui uma dependência temporal
explícita):
d d
i U (t) = i e−itH = HU (t) (13.105)
dt dt
U (0) = 1.
Deve-se considerar este caso (Q = H) daqui em diante.

O kernel da transformação integral representando U (t) é:
ˆ
0 1
U (r, r ; t) = − dze−itz G(r, r0 ; z) (13.106)
2πi C∞
∞
X
= φk (r)φ∗k (r0 )e−iqk t . (13.107)
k=1
Se conhecemos U (r, r0 ; t) então pode-se resolver a equação de Schrödinger dependente do

tempo dada qualquer função de onda inicial. A correspondente a equação diferencial acima,
Eq. (13.105), tem-se para U (r, r0 ; t):
∞
∂ X
i U (r, r0 ; t) = φk (r)φ∗k (r0 )qk e−iqk t
∂t k=1
∞
X
= Hr φk (r)φ∗k (r0 )e−iqk t
k=1
= Hr U (r, r0 ; t), (13.108)
e a condição inicial
U (r, r0 ; 0) = δ(r − r0 ). (13.109)
Portanto, se ψ(x) é uma função de onda qualquer, então ψ(r; t) é definida por:
ˆ
ψ(r; t) ≡ d3 r0 U (r, r0 ; t)ψ(r0 ) (13.110)
(∞)
satisfazendo a equação de Schrödinger,

∂
i ψ(r; t) = Hr ψ(r; t), (13.111)
∂t
e a condição inicial
ψ(r; 0) = ψ(r). (13.112)
Observa-se que o resolvente da função de Green, e U (t), existem realmente para uma classe
maior de operadores, não apenas aqueles com um espectro pontual puro. Por exemplo, existe o
resolvente para qualquer operador auto-adjunto, que é delimitado por baixo. Em particular,
temos existência para o hamiltoniano de uma partícula livre, com H = P2 /2m. No entanto, em
geral, não podemos, expressar G(z) e U (t) como somas sobre estados, e a função de Green não
pode ser expressa como uma soma sobre os produtos de autofunções. A relação da integral de
contorno: ˆ
0 1
U (r, r ; t) = − dze−itz G(r, r0 ; z) (13.113)
2πi C∞
permanece válida. Recorre-se ao caso com um espectro pontual puro, com somas sobre estados,
a fim de desenvolver o sentimento de como as coisas funcionam sem ficar atolado em problemas
matemáticos.


Capítulo 14
Sistema de Partículas Indistinguíveis
14.1 Formulação do problema

Tanto na apresentação dos postulados da mecânica quântica não-relativística quanto na
discussão realizada sobre o spin do elétron, a atenção voltou-se aos postulados cujo o foco
estava direcionado aos graus de liberdade do spin. Aqui, será mostrado que, na realidade, esses
postulados não são suficientes quando está se tratando com sistemas que contêm muitas partículas
idênticas, já que, neste caso, a sua aplicação leva a ambiguidades nas previsões físicas [7]. Para
eliminar as ambiguidades que surgem, é necessário introduzir um novo postulado, relativo à
descrição da mecânica quântica de sistemas de partículas idênticas.
14.1.1 Partículas idênticas: definição

Duas partículas são ditas serem idênticas se todas as suas propriedades intrínsecas (massa,
spin, carga, etc.) forem exatamente as mesmas: nenhum experimento pode distinguir uma
partícula da outra. Assim, todos os elétrons no universo são idênticos, como são todos os
prótons e todos os átomos de hidrogênio. Por outro lado, um elétron e um pósitron não são
idênticos, uma vez que, apesar de terem a mesma massa e o mesmo spin, eles têm diferentes
cargas eléctricas.
Uma consequência importante, pode ser deduzida a partir desta definição: quando um sistema
físico contém duas partículas idênticas, não há nenhuma modificação das suas propriedades ou
da sua evolução se os papéis desempenhados por estas duas partículas forem trocados.
Note que esta definição é independente das condições experimentais. Mesmo

que, em um determinado experimento, as cargas das partículas não sejam
medidas, um elétron e um pósitron nunca podem ser tratado como partículas
idênticas.
14.1.2 Partículas idênticas em mecânica clássica

Na mecânica clássica, a presença de partículas idênticas em um sistema não gera outros
problemas de natureza particulares. Este caso especial é tratada apenas como caso geral. Cada
321
partícula move-se ao longo de uma trajetória bem definida, o que nos permite distingui-las uma
das outras e “segui-las” ao longo de toda evolução do sistema.
Para tratar esse ponto em maiores detalhes, será considerado um sistema de duas partículas
idênticas. No instante de tempo inicial t0 , o estado físico do sistema é definido especificando-se
a posição e velocidade de cada uma de suas partículas; denotamos estes dados iniciais por r0 , v0
e r00 , v00 . Para descrever este estado físico e calcular a sua evolução temporal, numera-se as
duas partículas: o conjunto r1 (t) e v1 (t) denotam a posição e a velocidade de partícula (1) no
instante de tempo t, enquanto o conjunto r2 (t) e v2 (t), denotam aquelas da partícula (2). Esta
numeração não tem fundamento físico, como seria se estivéssemos lidando com duas partículas
que têm naturezas diferentes. Disso resulta que o estado físico inicial, que acabamos de definir
pode, em teoria, ser descrito por dois “estados matemáticos” diferentes, como podemos definir
por:
r1 (t0 ) = r0 r2 (t0 ) = r00

v1 (t0 ) = v0 v2 (t0 ) = v00
ou
r1 (t0 ) = r00 r2 (t0 ) = r0

v1 (t0 ) = v00 v2 (t0 ) = v0
Agora, será considerada a evolução do sistema. Considere que a solução das equações de
movimento definido pelo primeiro conjunto de condições iniciais acima possa ser escrita como:
r1 (t) = r(t) e r2 (t) = r0 (t) (14.1)
na qual r(t) e r0 (t) são funções de dois vetores. O fato de que as duas partículas são idênticas
implica que o sistema não é alterada se trocarem papéis. Consequentemente, a lagrangiana
L(r1 , v1 ; r2 , v2 ) e o hamiltoniano clássico H(r1 , p1 ; r2 , p2 ) são invariantes sob troca de índices 1
e 2. Segue-se que a solução das equações de movimento correspondentes ao segundo conjunto
de estado inicial acima é:
r1 (t) = r0 (t) e r2 (t) = r(t) (14.2)
na qual as funções de r(t) e r0 (t) são as mesmas que as da eq. 14.2.

As duas possíveis descrições matemáticas do estado físico em consideração, portanto, são
perfeitamente equivalentes, uma vez que elas conduzem às mesmas previsões físicas. A partícula
que começou a partir de r0 , v0 em t0 está em r(t) com a velocidade v(t) = dr/dt no instante
de tempo t, enquanto aquela que iniciou a partir de r00 , v00 está em r0 (t) com a velocidade
v0 (t) = dr0 /dt, conforme ilustra a fig. 14.1. Sob essas condições, tudo o que se precisa fazer é
escolher, no momento inicial, qualquer um dos dois possíveis “Estados matemáticos” e ignorar a

{r0 , v0 } {r(t), v(t)}
{r00 , v00 } {r0 (t), v0 (t)}
Estado Estado no
inicial instante t
Figura 14.1: Posição e velocidade de cada uma das duas partículas no instante inicial t0 e em um
instante de tempo t qualquer.
existência do outro. Tratando assim, o sistema como se as duas partículas fossem, na verdade,
de naturezas diferentes. Os números (1) e (2) com o qual elas foram classificadas arbitrariamente
em t0 , agem nesse caso como propriedades intrínsecas para se distinguir as duas partículas. Uma
vez que cada partícula pode ser seguida passo-a-passo ao longo de sua trajetória (setas na figura
14.1), pode-se determinar as localizações da partícula numerada por (1) e a numerado por (2)
em qualquer momento.
14.1.3 Partículas idênticas na mecânica quântica: as dificuldades de

aplicação dos postulados gerais
É evidente que no caso da mecânica quântica a situação é radicalmente diferente daquela da
mecânica clássica, uma vez que as partículas não têm trajetórias definidas. Mesmo que, em t0 ,
os pacotes de ondas associados a duas partículas idênticas estejam completamente separados
espacialmente, sua evolução temporal subsequente pode misturá-los. Então, nesse caso “perde-se
o controle” das partículas: quando detecta-se uma partícula em uma região do espaço em que
ambas têm uma probabilidade diferente de zero de estar naquela região do espaço, não há
nenhuma maneira de saber se a partícula detectada é a numerada por (1) ou a numerada por (2).
Exceto em casos especiais – por exemplo, quando os dois pacotes de onda nunca se sobrepõem –
a numeração das duas partículas se torna ambígua quando suas posições são medidas, uma vez
que, como veremos, existem vários “caminhos” distintos, que levam o sistema do estado inicial
estado para o estado final encontrado na medição.
Para investigar esse ponto em maiores detalhes, considere por exemplo a seguinte situação:
a colisão entre duas partículas idênticas no referencial do seu centro de massa (Fig. 14.2).
Antes da colisão, temos dois pacotes de onda completamente separados, voltados um para o
outro (conforme Fig. 14.2(a)). Para exemplificar o problema, será denotada por (1) a partícula
proveniente da esquerda e por (2), a da direita. Durante a colisão (conforme Fig. 14.2(b)), os
dois pacotes de onda se sobrepõem. Após a colisão, a região do espaço em que a densidade
de probabilidade das duas partículas é diferente de zero1 parece-se com uma casca esférica,
1
A função de onda de duas partículas depende de seis variáveis (as componentes das coordenadas r e r0 das
duas partículas) e não é facilmente representada em 3 dimensões. A Figura 14.2 é, portanto, muito esquemática:
As regiões sombreadas são aqueles nas quais ambos r e r0 devem pertencer para que a função de onda tenha

(1) (2)
(a) (b) (c)

Figura 14.2: Colisão entre duas partículas no referencial do centro de massa: representação esquemática
da densidade de probabilidade das duas partículas. Antes da colisão (a) os dois pacotes de onda estão
claramente separados e podem ser rotulados. Durante a colisão (b), os dois pacotes de onda se sobrepõem.
Após a colisão (c) a densidade de probabilidade é não nula na região sombreada, cuja a forma é de
uma casca esférica em expansão. Devido as duas partículas serem idênticas, é impossível, quando as
partículas são detectadas no detector D, saber qual pacote de ondas, o (1) ou o (2), está foi medido
pelo detector.
cujo raio aumenta ao longo do tempo (conforme Fig. 14.2(c)). Considere que um detector,
colocado na direção que forma um ângulo θ com a velocidade inicial do pacote de ondas (1),
detecta uma partícula. Então determina-se (devido ao momentum ser conservado na colisão)
que a outra partícula está afastando-se no sentido oposto. No entanto, é impossível saber se a
partícula detectada em D é a inicialmente numerada por (1) ou a numerada por (2). Assim,
existem dois “caminhos” diferentes que poderiam ter levado o sistema, a partir do estado inicial
mostrada na figura 14.2(a), para o estado final encontrado na medição. Estes dois caminhos estão
representados esquematicamente nas figuras 14.3(a) e 14.3(b). Nada permite-nos determinar
qual foi o caminho realmente seguido pela partícula que foi detectada.
Uma dificuldade fundamental, então, surge na mecânica quântica ao utilizar os postulados
já enunciados anteriormente. A fim de calcular a probabilidade de um determinado resultado de
uma medida é necessário conhecer os vetores de estados finais associados a este resultado. Aqui,
existem dois, que correspondem, respectivamente, às figuras 14.3(a) e 14.3(b). Estes dois kets
são distintos (e, além disso, ortogonais). E além disso, eles estão associados a um único estado
físico, uma vez que é impossível imaginar uma medida mais completa que permitisse fazer uma
distinção entre esses dois estados. Sob estas condições, deve-se calcular a probabilidade usando a
trajetória apresentadas na figura 14.3(a) ou 14.3(b) ou ambas? Neste último caso, deve-se levar
em conta a soma das probabilidades associadas a cada caminho, ou a soma de suas amplitudes
de probabilidade (e, neste caso, com qual sinal)? Essas possibilidades diferentes levam, como
veremos mais tarde, na verdade, a previsões diferentes.
A resposta às questões anteriores, será dada posteriormente, após ter se enunciado o postulado
simetrização. Antes de avançar mais, será investigado um outro exemplo que nos ajudará a
valores significativos.

D D
(1) (2)
(1) (1)
(2) (2)
(2) (a) (1) (b)

Figura 14.3: Representação esquemática de dois tipos de “trajetória” as quais o sistema poderia ter
seguido após ter ido do estado inicial ao estado que foi encontrado e medido. Devido as duas partículas
serem idênticas, não se pode determinar a trajetória real seguida pela partícula detectada.
compreender as dificuldades relacionadas com a indistinguibilidade de duas partículas.
14.1.4 Origem das dificuldades: a degenerescência de troca

No exemplo anterior, foram considerados dois pacotes de onda que, inicialmente, não se
sobrepõem, o que nos possibilitou identificar cada um deles arbitrariamente com um número, (1)
ou (2). No entanto, surgiram ambiguidades quando tentou-se determinar o estado matemático
(ou ket) associado a um determinado resultado de uma medida da posição. Na verdade, a mesma
dificuldade surge na escolha do ket matemático utilizado para descrever o estado físico inicial.
Este tipo de dificuldade está relacionada com o conceito de “degenerescência de troca” que
será apresentada a seguir. Para simplificar o raciocínio, primeiro será considerado um exemplo
diferente, de modo estejamos confinados em um espaço de dimensão finita. Em seguida, vamos
generalizar o conceito de troca degenerada, mostrando que ele pode ser generalizado para todos
os sistemas da mecânica quântica que contêm partículas idênticas.
14.1.5 Troca degenerada para um sistema de duas partículas de spin

1/2
Considere um sistema composto por duas partículas de spin 1/2 idênticas, no qual, nos
restringiremos ao estudo dos seus graus de liberdade de spin. Como na seção 14.1.2, será feita
uma distinção entre o estado físico do sistema e sua descrição matemática (o ket no espaço de
estado).

Pareceria natural supor que, após ser realizada uma medida completa de cada um dos
dois spins, o estado físico do sistema total seria então completamente conhecido. Aqui, vamos
considerar que uma das componentes ao longo de Oz é igual a +~/2 e que a do outra é −~/2
(isto é o equivalente para as duas rotações especificadas por r0 , v0 e r00 , v00 na seção 14.1.2).
Para descrever o sistema matematicamente, as partículas serão numeradas: S1 e S2 denotam
então as duas observáveis de spin, e |ε1 , ε2 i (onde ε1 e ε2 pode ser igual a + ou −) é a base
ortonormal do espaço de estado formado pelos auto kets comuns de S1z : (com autovalor ε1 ~/2)
e S2z : (com autovalor ε2 ~/2) .
Assim como na mecânica clássica, dois “estados matemáticos” diferentes podem ser associados
com o mesmo estado físico. Qualquer um dos dois kets ortogonais:
|ε1 = +; ε2 = −i ou |ε1 = −; ε2 = +i (14.3)
pode a priori descrever o estado físico considerado aqui.

Esses dois kets expandem um subespaço bidimensional cujos vetores normalizado são da
forma:
α |+, −i + β |−, +i , (14.4)
com
|α|2 + |β|2 = 1. (14.5)
Pelo princípio da superposição, todos os kets matemáticos da forma (14.4) podem representar o
mesmo estado físico como aqueles da eq. (14.3), no qual tem-se um spin para cima e um para
baixo. Essa é a chamada “troca degenerada”.
As trocas degeneradas criam dificuldades fundamentais, desde que a aplicação dos postulados
da mecânica quântica aos vários kets (14.4) podem conduzir a predições físicas as quais dependem
do ket escolhido. Agora, por exemplo, será determinada a probabilidade de encontrar as
componentes dos dois spins ao longo do eixo Ox, ambas iguais a +~/2. Como já foi visto, tem-se
que
1 1
√ (|ε1 = +i + |ε1 = −i) ⊗ √ (|ε2 = +i + |ε2 = −i) =
2 2
1
[|+, +i + |+, −i + |−, +i + |−, −i] (14.6)
2
Consequentemente, a probabilidade desejada para o vetor de estado (14.3), é igual á:

2
1
(α + β) (14.7)
2
Essas probabilidades dependem dos coeficientes α e β. Isso não é possível, portanto, para
descrever o estado físico em consideração deve-se usar o conjunto dos kets (14.3), ou qualquer
um deles escolhido arbitrariamente. A degenerescência por troca deve ser removida. Isto é,
deve-se indicar sem qualquer ambiguidade qual dos kets (14.3) deve ser usado.

Note que nesse exemplo, a degenerescência por troca surge somente no estado
inicial, desde que escolhe-se o mesmo valor para as componentes dos dois
spins no estado final. No caso geral, (por exemplo, se o resultado da medida
corresponde aos dois diferentes valores de Sx ), a degenerescência por troca
surge tanto no estado inicial quanto no estado final.
14.1.6 Generalização
As dificuldades relacionadas com a troca degenerada surgem no estudo de todos os sistemas
que contêm um número arbitrário de partículas idênticas (N > 1).
Considere, por exemplo, um sistema de três partículas. Com cada uma das três partículas,
tomadas separadamente, estão associadas a um espaço de estado e aos observáveis que atuam
neste espaço. Assim, somos levados a contar as partículas: E(1), E(2) e E(3) indicando os três
espaços de estado de uma partícula, e os correspondentes observáveis serão marcados pelos
mesmos índices. O espaço de estado do sistema de três partícula é dado pelo produto tensorial:
E = E(1) ⊗ E(2) ⊗ E(3) (14.8)
Considere um observável B(1), inicialmente definido em E(1). Considere ainda que B(1),
sozinho constitui um C.S.C.O. em E(1) (ou que B(1) realmente denote vários observáveis os
quais constituem um C.S.C.O. em E(1)). O fato de que as três partículas são idênticas implica
que os observáveis B(2) e B(3) existem e que eles constituem um C.S.C.O. em E(2) e em E(3)
respectivamente. Os observáveis B(1), B(2) e B(3) possuem o mesmo espectro de autovalores
{bn ; n = 1, 2, 3, . . .}. Usando a base a qual define esses três observáveis em E(1), E(2) e em
E(3), pode-se construir, por meio do produto tensorial, uma base ortonormal de E, a qual será
denotada por
{|1 : bi ; 2 : bj ; 3 : bk i ; i, j, k = 1, 2, 3, . . .}. (14.9)
Os kets |1 : bi ; 2 : bj ; 3 : bk i são autovetores comuns da extensão de B(1), B(2) e B(3) em E,

com os respectivos autovalores bi , bj e bk .
Desde que as três partículas são idênticas, não se pode medir B(1) ou B(2) ou B(3), já que
nesse caso a numeração não possui um significado físico. Entretanto, pode-se medir a quantidade
física B, para cada uma das três partículas. Considere que tal medida tenha resultado em três
diferentes autovalores bn , bp e bq . Então surge, uma degenerescência por troca, já que o estado
do sistema após a essa medida pode, a priori, ser representada por qualquer um dos kets do
subespaço E expandido pelos seis vetores de base:
|1 : bn ; 2 : bp ; 3 : bq i , |1 : bq ; 2 : bn ; 3 : bp i , |1 : bp ; 2 : bq ; 3 : bn i ,
|1 : bn ; 2 : bq ; 3 : bp i , |1 : bp ; 2 : bn ; 3 : bq i , |1 : bq ; 2 : bp ; 3 : bn i . (14.10)
Portanto, uma medida completa em cada uma das partículas, não permiti a determinação de
um ket único do espaço de estados do sistema.

14.2. Operadores de permutação
Note que essa indeterminação devido a troca degenerada é, de fato, menos

importante que se dois dos autovalores encontrados forem iguais. Essa
indeterminação desaparece no caso especial no qual os três resultados são
idênticos.
14.2 Operadores de permutação

Antes de enunciar o postulado adicional que permitirá a remoção da indeterminação relaci-
onada à degenerescência de troca, serão estudados alguns operadores, definidos no espaço de
estado total do sistema em consideração, o qual na verdade permuta as várias partículas do
sistema. O uso desses operadores de permutação irá simplificar os cálculos e raciocínio que serão
desenvolvidos posteriormente.
14.2.1 Sistemas de duas partículas
14.2.2 Definição do operador de permutação P21

Considere um sistema composto por duas partículas com o mesmo spin s. Não é necessário
que essas duas partículas sejam idênticas: é suficiente que os seus espaços de estado individuais
sejam isomórficos. Portanto, para evitar os problemas que surgem quando as duas partículas
são idênticas, será considerado que elas não são, e os seguintes números: (1) e (2) com o qual
elas são rotuladas indicam suas naturezas. Por exemplo, (1) irá designar um próton e (2), um
elétron.
Escolhendo a base, |ui i, no estado espaço E(1) das partículas (1). Uma vez que as duas
partículas têm o mesmo spin, E(2) é isomórfico a E(1), e eles podem ser expandidos pela mesma
base. Ao tomar o produto tensorial, constrói-se, no estado espaço E do sistema, a base:
{|1 : ui ; 2 : uj i} (14.11)
Desde que a ordem dos vetores de estado não é importante em um produto tensorial, têm-se
então que
|2 : uj ; 1 : ui i ≡ |1 : ui ; 2 : uj i (14.12)
Entretanto, note que
|1 : uj ; 2 : ui i =
6 |1 : ui ; 2 : uj i se i 6= j (14.13)
O operador permutação P21 , é definido como um operador linear cuja a ação nos vetores da
base é dada por
P21 |1 : ui ; 2 : uj i = |2 : ui ; 1 : uj i = |1 : uj ; 2 : ui i . (14.14)
Sua ação sobre um ket qualquer de E pode ser facilmente obtida pela expansão desse ket na
base (14.11)2 .
2
Pode-se mostrar que o operador P21 da forma em que foi definido, independe da base escolhida.

Exemplo 14.1. Considere uma base formada pelos autoestados comuns do observável posição
R e da componente Sz do spin. Defina a base e escreva a ação do operador P21 sobre essa base.
Solução:
Escolhendo a base formado pelos autoestados comuns ao operador posição R e a componente
Sz do operador de spin S, pode-se escrever
P21 |1 : r1 , 1 ; 2 : r2 , 2 i = |1 : r2 , 2 ; 2 : r1 , 1 i (14.15)
Como qualquer ket |ψi do espaço de estados E pode ser representado por um conjunto de
(2s + 1)2 funções de seis variáveis
Xˆ
|ψi = d3 r1 d3 r2 ψ1 ,2 (r1 , r2 ) |1 : r1 , 1 ; 2 : r2 , 2 i , (14.16)
1 ,2
com
ψ1 ,2 (r1 , r2 ) = h1 : r1 , 1 ; 2 : r2 , 2 | ψi . (14.17)
Portanto, segue então que

Xˆ
P21 |ψi = d3 r1 d3 r2 ψ1 ,2 (r1 , r2 ) |1 : r2 , 2 ; 2 : r1 , 1 i , (14.18)
1 ,2
ao trocarmos o nome das variáveis mudas,
r1 −→ r2 e 1 −→ 2
obtém-se que a a expressão anterior, toma a seguinte forma

Xˆ
P21 |ψi = d3 r1 d3 r2 ψ2 ,1 (r2 , r1 ) |1 : r1 , 1 ; 2 : r2 , 2 i . (14.19)
1 ,2
Consequentemente, as funções
ψ0 1 ,2 (r1 , r2 ) = h1 : r1 , 1 ; 2 : r2 , 2 | P12 |ψi , (14.20)
as quais representam o ket |ψ 0 i = P21 |ψi podem ser obtidas a partir das funções (14.17), as
quais representam o ket |ψi ao se inverter ou trocar o conjunto de índices (r1 , 1 ) por (r2 , 2 ):
ψ0 1 ,2 (r1 , r2 ) = ψ2 ,1 (r2 , r1 ). (14.21)
14.2.3 Propriedades do operador permutação P21

Da definição (14.14), segue imediatamente que
(P21 )2 = P21 P21 = 1, (14.22)
portanto, o operador permutação P21 é o seu próprio inverso.

Pode-se mostrar facilmente que operador permutação P21 é hermitiano, ou seja, que
†
P21 = P21 , (14.23)

e para tal, considere o elemento de matriz de P21 na base {|1 : ui ; 2 : uj i}, o qual é dado por
h1 : ul ; 2 : um | P21 |1 : ui ; 2 : uj i = h1 : ul ; 2 : um | 1 : uj ; 2 : ui i = δl,j δm,i (14.24)
†
Já aqueles do operador P21 são definidos por
†
h1 : ul ; 2 : um | P21 |1 : ui ; 2 : uj i = (h1 : ui ; 2 : uj | P21 |1 : ul ; 2 : um i)∗
= (h1 : ui ; 2 : uj | 1 : um ; 2 : ul i)∗
= δi,m δj,l (14.25)
†
Portanto viu-se que cada elemento de matriz de P21 é idêntico ao de P21 , o que significa que a
relação (14.23) é mantida.
Segue de (14.22) e (14.23) que o operador P21 é unitário, ou seja,
†
P21 P21 †
= P21 P21 = 1. (14.26)
14.2.4 Kets simétricos e antissimétricos: Simetrizar e antissimetrizar

Conforme (14.23), os autovalores de P21 devem ser reais. Desde que, conforme (14.22), seu
quadrado deve ser igual a 1, então seus autovalores são necessariamente +1 e −1. Os autovetores
de P21 associados aos autovalores +1 são chamados de simétricos enquanto aqueles associados
aos autovalores −1 são chamados de antissimétricos

P |ψ i = |ψ i =⇒ |ψs i é um ket simétrico
21 S S
(14.27)
P |ψ i = − |ψ i =⇒ |ψA i é um ket antissimétrico
21 A A
Agora considere os operadores

1 1
S= (1 + P21 ) e A= (1 − P21 ) . (14.28)
2 2
Esses operadores são projetores, e (14.22), segue que
S2 = S e A2 = A (14.29)
†
e do fato de que P21 = P21 , segue então que
S† = S e A† = A. (14.30)
Como S e A são projetores dentro do subespaço ortogonal, conforme a eq. (14.22), temos que
1 2

SA = 1 − P21 + P21 − P21 =0 (14.31)
4
1 2

AS = 1 + P21 − P21 − P21 =0 (14.32)
4
logo
AS = SA = 0 e [A, S] = 0 (14.33)

Esses subespaços são suplementares, já que de (14.28) tem-se que
S + A = 1. (14.34)
Note que os operadores S e A satisfazem a seguinte relação
P21 S = S e P21 A = −A. (14.35)
2
na qual usou-se o fato de que P21 = 1. Da própria definição dos operadores S e A, é óbvio que
[S, P21 ] = [A, P21 ] = 0. (14.36)
Portanto, se |ψi é um ket arbitrário do espaço de estados E, segue então da relação (14.35)
que S |ψi é um ket simétrico e A |ψi é um ket antissimétrico, ou seja, que
P21 S |ψi = S |ψi e P21 A |ψi = −A |ψi . (14.37)
É por isso, que os operadores S e A são chamados respectivamente, de simetrizador e antissi-

metrizador.
Note ainda que ao aplicar o operador simetrizador S e o operador antissimetrizador A ao
ket P21 |ψi, obtém-se que 
SP |ψi = S |ψi
21
(14.38)
AP |ψi = −A |ψi
21
do que segue então que

SP21 = S e AP21 = −A. (14.39)
14.2.5 Transformação de observáveis por permutação

Considere um observável B(1), definido em E(1), cuja base é {|ui i}. Portanto, segue que
†
P21 B(1)P21 |1 : ui ; 2 : uk i = P21 B(1) |1 : uk ; 2 : ui i
= bk P21 |1 : uk ; 2 : ui i
= bk |1 : ui ; 2 : uk i , (14.40)
portanto, dessa forma segue que

†
P21 B(1)P21 = B(2), (14.41)
e analogamente tem-se que

†
P21 B(2)P21 = B(1). (14.42)
No espaço de estados E, há também observáveis tais como B(1) + C(2) ou B(1)C(2), os

quais envolvem ambos os índices simultaneamente. Obviamente, tem-se que
†
P21 [B(1) + C(2)] P21 = B(2) + C(1) (14.43)

14.3. Sistemas contendo um número arbitrário de partículas
e similarmente que
† † †
P21 B(1)C(2)P21 = P21 B(1)P21 P21 C(2)P21 = B(2)C(1). (14.44)
Esses resultados podem ser generalizados para todos os observáveis do tipo B(1) e C(2), sendo
denotado de forma geral pelo operador O(1, 2), assim
†
P21 O(1, 2)P21 = O(2, 1). (14.45)
Um observável Os (1, 2) é dito ser simétrico se:
Os (1, 2) = Os (2, 1). (14.46)
Conforme a relação (14.45), todos os observáveis simétricos satisfazem
P21 O(1, 2) = O(1, 2)P21 , (14.47)
ou seja,
[Os (1, 2), P21 ] = 0, (14.48)
ou seja, observáveis simétricos comutam com o operador permutação.
14.3 Sistemas contendo um número arbitrário de partícu-

las
Em um sistema composto por N partículas com o mesmo spin, pode-se definir N ! operadores
de permutação. Entretanto, para N > 2, a complexidade desses operadores aumenta.
14.3.1 Definição do operador permutação para N = 3.

A base de um sistema composto por 3 partículas idênticas é
{|1 : ui ; 2 : uj ; 3 : uk i} , (14.49)
e nesse caso tem-se seis operadores de permutação:
P123 ; P312 ; P231 ; P132 ; P213 ; P321 . (14.50)
Por definição o operador linear Pnpq atua da seguinte forma:
Pnpq |1 : ui ; 2 : uj ; 3 : uk i = |n : ui ; p : uj ; q : uk i . (14.51)
Considere por exemplo,
P231 |1 : ui ; 2 : uj ; 3 : uk i = |2 : ui ; 3 : uj ; 1 : uk i = |1 : uk ; 2 : ui ; 3 : uj i . (14.52)
Portanto, da definição segue imediatamente que
P123 = 1. (14.53)

14.3.2 Propriedade: o conjunto dos operadores de permutação cons-

tituem um grupo
Pode-se mostrar facilmente para os operadores dados por (14.50) que:
1. O operador P123 é a identidade;
2. O produto de dois operadores de permutação também é um operador de permutação.

Pode-se mostrar que:
P312 P132 = P321 , (14.54)
e para tal note que:
P312 P132 |1 : ui ; 2 : uj ; 3 : uk i = P312 |1 : ui ; 3 : uj ; 2 : uk i

= P312 |1 : ui ; 2 : uk ; 3 : uj i
= |3 : ui ; 1 : uk ; 2 : uj i
= |1 : uk ; 2 : uj ; 3 : ui i
= P321 |1 : ui ; 2 : uj ; 3 : uk i (14.55)
3. Cada operador de permutação possui um inverso que também é um operador de permutação.

Assim, vale as seguintes relações

P −1 = P ; P −1 = P ; P −1 = P Permutações pares
123 123 312 231 231 312
(14.56)
P −1 = P ; P −1 = P ; P −1 = P Permutações ímpares
132 132 213 213 321 321
Note que os operadores de permutação não comutam uns com os outros. Por exemplo,
observe que
P132 P312 = P213 , (14.57)
o que juntamente com (14.54) significa que [P132 , P312 ] 6= 0.
14.3.3 Propriedade: Transposição, a paridade de um operador de

permutação
A transposição é uma permutação que simplesmente troca os papéis de duas das partículas,
sem alterar o das outras partículas. Dos operadores (14.50), os três últimos são os operadores
de transposição. Operadores de transposição são hermitianos, e o seu inverso é ele próprio, de
modo que eles também são unitários. No caso de três partículas eles são dados pela última linha
de (14.56).
Qualquer operador permutação pode ser decomposto em um produto de operadores de trans-
posição. Por exemplo, o segundo operador (14.50) pode ser escrito:
P312 = P132 P213 = P321 P132 = P213 P321 = P132 P213 (P131 )2 = · · · (14.58)

Esta decomposição não é única. No entanto, para uma determinada permutação, pode se
mostrar que a paridade do número de transposições em que ela pode ser “quebrada”, é sempre
o mesmo: e ela é chamada de paridade da permutação. Assim, os três primeiros operadores
(14.50) possuem uma paridade par, e os três últimos, uma paridade ímpar. Para qualquer N ,
sempre há o maior número de permutações até mesmo como ímpares.
14.3.4 Propriedade: Operadores de permutação são unitários

Os operadores de permutação, que são produtos de operadores de transposição, os quais são
todos unitários, são, por conseguinte, também unitários. No entanto, eles não são necessariamente
hermitianos, uma vez que os operadores de transposição geralmente não comutam entre si.
Finalmente, note que o adjunto de um determinado operador de permutação tem a mesma
paridade que a do operador, uma vez que ele é igual ao produto dos mesmos operadores de
transposição, feita na ordem inversa.
14.3.5 Kets Completamente Simétrico ou antissimétricos. Simetriza-

dor e Antissimetrizador
Uma vez que os operadores de permutação não comutam para N > 2, então não é possível
construir uma base formada pelos autovetores comuns desses operadores. No entanto, nota-se
que há kets os quais são simultaneamente autovetores de todos os operadores de permutação.
Denotando-se por Pα um operador permutação arbitrária associado a um sistema de N
partículas com o mesmo spin: α representa uma permutação arbitrária dos N primeiros inteiros.
Um ket |ψS i tal que:
Pα |ψS i = |ψS i , (14.59)
para uma permutação Pα qualquer é dita ser “completamente simétrico”. Similarmente um ket
“completamente antissimétrico” satisfaz
Pα |ψA i = α |ψA i , (14.60)
na qual 
+1 Se Pα for uma permutação par
α = (14.61)
−1 Se Pα for uma permutação ímpar.
O conjunto completo de kets simétricos constituem um subespaço vetorial ES do espaço de
estados E, enquanto o conjunto completo dos kets antissimétricos, constituem um subespaço
vetorial EA .
Considere os operadores de simetrização S e de antissimetrização A definidos por
1 X 1 X
S= Pα e A= α Pα (14.62)
N! α N! α
na qual as soma são realizadas sobre N ! permutações dos N primeiros inteiros, e α é definido
por (14.61). Será mostras que os operadores de simetrização S e de antissimetrização A são

projetores nos subespaços vetoriais ES e EA . Por isso, eles são chamados respectivamente de
simetrizador e antissimetrizador.
Note que os operadores S e A são hermitianos, ou seja,
S = S† e A = A† . (14.63)
Além disso, segue que um operador de permutação arbitrário Pβ , satisfaz as seguinte relações
Pβ S = SPβ = S
(14.64)
Pβ A = APβ = α P
Isso deve-se ao fato de que Pα Pβ também é um operador de permutação, pois
Pα Pβ = Pγ com γ = α β (14.65)
Se para Pβ fixo, variarmos Pα sobre todo o grupo das possíveis permutações, isso resultará que
Pγ será idêntica a uma e somente uma das permutações do grupo, percorrendo todo o grupo de
permutações em uma ordem diferente. Consequentemente, tem-se que
1 X 1 X
Pβ S = Pβ P α = Pγ = S (14.66)
N! α N! γ
1 X 1 X
Pβ A = α Pβ Pα = β γ Pγ = β A (14.67)
N! α N! γ
Um resultado similar é obtido ao multiplicarmos S e A a direita por Pβ .
De (14.64) segue que
S2 = S e A2 = A, (14.68)
além disso, tem-se ainda que
AS = SA = 0. (14.69)
Isso ocorre porque
1 X 1 X
S2 = Pα S = S=S (14.70)
N! α N! α
1 X 1 X 2
A2 = α Pα A = A=A (14.71)
N! α N! α α
Como cada soma inclui N ! termos termos, segue então que
1 X 1 X
AS = α Pα S = S α = 0, (14.72)
N! α N! α
já que a metade dos N ! termos de α é igual a +1, a outra metade é igual −1.
Portanto, os operadores S e A são dois projetores. Eles projetam respectivamente nos
subespaços vetoriais ES e EA , desde que, conforme (14.64), as suas ações sobre um ket |ψi produz
um ket completamente simétrico ou antissimétrico:
Pβ S |ψi = S |ψi
(14.73)
Pβ A |ψi = β A |ψi
Note que:

14.4. Postulado da simetrização
EA
E
ES
Figura 14.4: Este diagramas ilustra que o espaço de estados E não dado só por uma soma direta dos
subespaços ES e EA .
1. O ket completamente simétrico construído pela ação de S sobre Pα |ψi, onde Pα é uma
permutação arbitrária, é o mesmo que aquele obtido do ket |ψi, já que a expressão (14.64)
indica que:
SPα |ψi = S |ψi (14.74)
Como para o correspondente ket completamente antissimétrico , eles diferem no máximo

por seu sinal:
APα |ψi = α A |ψi (14.75)
2. No entanto, note que para N > 2 os simetrizadores e antissimetrizadores não são projetores
dentro de subespaços suplementares. Por exemplo, para N = 3, tem-se que
1
S+A= (P123 + P231 + P312 ) 6= 1, (14.76)
3
ou seja, o espaço de estados não é dado por uma soma direta dos subespaços ES e EA .
14.3.6 Transformação de um observável por permutação

Já foi dito que qualquer operador de permutação de um sistema de N partículas pode ser
decomposto em um produto de operadores de transposição análogos ao operador P21 . Para estes
operadores de transposição, pode-se usar suas propriedades para determinar o comportamento
dos vários observáveis do sistema quando eles são multiplicados pela esquerda por um operador
permutação Pα arbitrário e à direita por Pα† .
Em particular, o observável OS (1, 2, . . . , N ), que é completamente simétrico com respeito
a troca dos índices 1, 2, . . . , N , comutando com todos os operadores de transposição, e, por
conseguinte, com todos os operadores de permutação:
[OS (1, 2, . . . , N ), Pα ] = 0. (14.77)
14.4 Postulado da simetrização

Proposição 14.2. Quando um sistema é composto por várias partículas idênticas, apenas
alguns kets de seu espaço de estado podem descrever os seus estados físicos. Os kets físicos,

14.4. Postulado da simetrização
dependendo da natureza das partículas idênticas, são completamente simétricos ou completamente

antissimétricos com respeito a permutação dessas partículas. Essas partículas para a qual os kets
físicos são simétricas são chamadas de bósons, e aqueles para os quais eles são antissimétricos,
de férmions.
Portanto, o postulado da simetrização limita o espaço de estado para um sistema de partículas

idênticas. Este espaço não é mais, como foi no caso de partículas de diferentes naturezas, o
produto tensorial E dos espaços de estados individuais das partículas que constituem o sistema.
É apenas um subespaço de E, ES ou EA , dependendo se as partículas são bósons ou férmions.
Do ponto de vista deste postulado, as partículas existentes na natureza estão divididas em
duas categorias. Todas as partículas conhecidas atualmente obedecem à seguinte regra empírica:
as partículas de spin semi-inteiros (elétrons, pósitrons, prótons, nêutrons, múons, etc.) são
férmions, e partículas de spin inteiro (fótons, mésons, etc.) são bósons.
Note que, uma vez que esta regra foi verificado para as partículas que são chamados
de “elementares”, ela vale para todas as outras partículas, bem como, para aquelas que são
compostas por estas partículas elementares. Considere um sistema composto por muitas
partículas idênticas. Permutar duas delas é equivalente a permutar ao mesmo tempo todas as
partículas que correspondem a primeira com as correspondentes partículas (necessariamente
idênticas as acima referidas) da segunda. Esta permutação deve deixar o ket que descreve
o estado do sistema inalterado se as partículas em estudo forem formadas apenas de bósons
elementares ou se cada um delas contém um número par de férmions (sem mudança de sinal, ou
um número par de mudanças de sinal); neste caso, as partículas são bósons. Por outro lado,
se as partículas que compõem o sistema contém um número ímpar de férmions elas próprias
são um férmion (um número ímpar de mudança de sinal na permutação). Agora, o spin dessas
partículas compostas é necessariamente inteiro no primeiro caso e semi-inteiro no segundo. Eles,
portanto, obedecem a regra já enunciada. Por exemplo, os núcleos atômicos são conhecidos por
serem composto de nêutrons e prótons, que são férmions de spin (1/2). Consequentemente, os
núcleos cujo número de massa A (o número total de núcleos) é par são bósons, e aqueles cujo
número de massa é ímpar são férmions. Assim, o núcleo do isótopo 3 He de hélio é um férmion,
enquanto que o isótopo de 4 He, é um bóson.
14.4.1 Remoção da degenerescência de troca

A seguir será examinado como este novo postulado remove a degenerescência de troca e as
correspondentes dificuldades.
A análise realizada na seção anterior pode ser resumida da seguinte forma. Considere o ket
|ui como sendo um ket que pode descrever matematicamente um estado físico bem definido de
um sistema contendo N partículas idênticas. Para qualquer operador de permutação Pα , Pα |ui
pode descrever este estado físico, bem como o ket |ui. O mesmo é verdadeiro para qualquer ket
pertencente ao subespaço Eu gerado por |ui e todas as suas permutações Pα |ui. Dependendo
do ket |ui escolhido, a dimensão de Eu pode variar entre 1 e N !. Se esta dimensão for maior do

14.5. Construção de kets físicos
que um, vários de seus kets matemáticos correspondem ao mesmo estado físico: existe então
uma degenerescência de troca.
O postulado da simetrização restringe consideravelmente a classe dos kets matemáticos
capazes de descreverem um estado físico: estes kets devem pertencer ao subespaço ES para
bósons e ao subespaço EA para férmions. As dificuldades relacionadas com a degenerescência
por troca são eliminadas se formos capazes de mostrar que o subespaço Eu , contém um único
ket de ES ou um único ket de EA .
Para isso, usaremos as relações S = SPα um ou A = α APα , mostradas em (14.64). Com
isso, obtém-se:
S |ui = SPα |ui
(14.78)
A |ui = α APα |ui
Essas relações expressam o fato de que as projeções no subespaço ES e no subespaço EA dos
vários kets que expandem Eu , e consequentemente de todos os kets de Eu , são colineares. O
postulado da simetrização indica inequivocamente (a menos de um fator constante) que o ket
de Eu , o qual deve estar associado com o estado físico considerado: S |ui para bósons e A |ui
para férmions. Este ket é chamado o ket físico.
Note que é possível que todos os kets de Eu , tenham uma projeção de zero em EA (ou ES ).
Neste caso, o postulado simetrização exclui o estado físico correspondente. Mais tarde serão
apresentados exemplos de tal situação ao lidar com férmions.
14.5 Construção de kets físicos

14.5.1 A Regra de Construção
A discussão da seção anterior conduz diretamente para a seguinte regra de construção do
ket único (o ket físico) correspondente a um dado estado físico de um sistema de N partículas
idênticas:
1. Numere as partículas de forma arbitrária, e construa o ket |ui correspondente ao estado

físico considerado e ao número dado às partículas.
2. Aplicar S ou A para |ui, dependendo se as partículas idênticas são bósons ou férmions.
3. Normalizar o ket assim obtido.
14.5.2 Aplicação: sistema de duas partículas idênticas

A seguir serão apresentados alguns exemplos simples que ilustram estas regras. A aplicação
em questão será a um sistema composto por duas partículas idênticas. Considere que uma delas
esteja no estado de partícula única normalizado representado pelo ket |ϕi, e que a outra, esteja
no estado normalizado de partícula única representado pelo ket |χi.
Primeiro de tudo, vamos prever o caso em que os dois kets |ϕi e |χi, são distintos. A regra
anterior é aplicada da seguinte forma:

1. Rotula-se com o número 1, por exemplo, a partícula no estado |ϕi e com o número 2 a
partícula no estado |χi, e isso fornece
|ui = |1 : ϕ; 2 : χi (14.79)
2. Simetrizamos |ui se as partículas são bósons:

1
S |ui = [|1 : ϕ; 2 : χi + |1 : χ; 2 : ϕi] . (14.80)
2
Se as partículas forem férmions |ui deve ser antissimetrizado:
1
A |ui = [|1 : ϕ; 2 : χi − |1 : χ; 2 : ϕi] . (14.81)
2
3. Em geral, os kets (14.80) e (14.81) não são normalizados. Se os kets |ϕi e |χi são
ortonormais, é fácil de encontrar a constante de normalização dos kets (14.80) e (14.81).
Nesse caso, para normalizar os kets S |ui e A |ui tudo o que se deve fazer é trocar o fator
√
1/2 por 1/ 2. Portanto, nesse caso o ket normalizado pode ser escrito como
1
|ϕ; χi = √ [|1 : ϕ; 2 : χi + |1 : χ; 2 : ϕi] , (14.82)
2
com = +1 para bósons e = −1 para férmions.
Considere agora o caso em que os estados de partícula única |ϕi e |χi são idênticos,
|ϕi = |χi , (14.83)
então (14.79) tornam-se kets

|ui = |1 : ϕ; 2 : ϕi , (14.84)
e nesse caso |ui já é simétrico. Se as duas partículas forem bóson, o ket (14.84) é então o ket
físico o qual está associado com o estado de dois bósons no mesmo estado individual, o estado
|ϕi. Entretanto, se as duas partículas forem férmions, da eq. (14.82) com = −1, temos
1
|ϕ; ϕi = √ [|1 : ϕ; 2 : ϕi + (−1) · |1 : ϕ; 2 : ϕi] = 0. (14.85)
2
Consequentemente não há kets de EA capaz de descrever o estado físico no qual dois férmions
estão no mesmo estado de partícula única |ϕi. Portanto, tal estado físico é excluído do postulado
da simetrização. Portanto, estabeleceu-se para um caso especial, um resultado fundamental
conhecido como “o princípio de exclusão de Pauli:” dois férmions idênticos não podem estar no
estado de partícula única. Esse resultado tem muitas consequências físicas importantes.
14.5.3 Generalização para um número qualquer de partículas

Antes de generalizarmos essas ideias para um número N qualquer de partículas, vamos
aplicá-las ao caso de três (N = 3) partículas.

Considere que o estado físico do sistema é definido ao especificarmos os estados de partícula

única normalizados |ϕi, |χi e |ωi. O estado |ui o qual entra na regra do parágrafo anterior pode
ser escolhido da seguinte forma
|ui = |1 : ϕ; 2 : χ; 3 : ωi . (14.86)
Os casos de bósons e férmions serão discutidos separadamente.
14.5.3.1 Bósons
A aplicação de S a |ui fornece:

1 X
S |ui = Pα |ui
3! α
1
= [|1 : ϕ; 2 : χ; 3 : ωi + |1 : ω; 2 : ϕ; 3 : χi + |1 : χ; 2 : ω; 3 : ϕi
6
+ [|1 : ϕ; 2 : ω; 3 : χi + |1 : χ; 2 : ϕ; 3 : ωi + |1 : ω; 2 : χ; 3 : ϕi (14.87)
Agora então será o suficiente normalizar o ket.

Inicialmente, será considerado que os três kets |ϕi, |χi e |ωi são ortogonais. Os seis kets
que surgem do lado direito de (14.87) também são ortogonais. Para normalizar (14.87), o que
√
devemos fazer é trocar o fator 1/6 por 1/ 6 .
Se os dois estado |ϕi e |χi coincidem, enquanto continuam ortogonais ao |ωi, consequente-
mente somente os três kets distintos surgem do lado direito de (14.87), ou seja,
1
S |ϕ; ϕ; ωi = [|1 : ϕ; 2 : ϕ; 3 : ωi + |1 : ϕ; 2 : ω; 3 : ϕi + |1 : ω; 2 : ϕ; 3 : ϕi] . (14.88)
3
Finalmente se os três |ϕi, |χi e |ωi forem idênticos, então o ket
|ui = |1 : ϕ; 2 : ϕ; 3 : ϕi (14.89)
já é simétrico e está normalizado.
14.5.4 Férmions
A aplicação de A ao ket |ui fornece
1 X
A |ui = α Pα |1 : ϕ; 2 : χ; 3 : ωi . (14.90)
3! α
Os sinais dos vários termos da soma em (14.90) são determinados pela mesma regra de um
determinante 3 × 3. É por isso é que é conveniente escrever A |ui na forma do determinante de
Slater :
|1 : ϕi |1 : χi |1 : ωi
1
A |ui = |2 : ϕi |2 : χi |2 : ωi (14.91)

3!
|3 : ϕi |3 : χi |3 : ωi

O ket A |ui será nulo se dois estados de partícula única qualquer coincidirem, já que o
determinante é nulo de houverem duas linhas ou colunas iguais. Obteve-se então o princípio de
exclusão de Pauli: o mesmo estado quântico não pode ser ocupado simultaneamente por vários
férmions idênticos.
Finalmente note que se os três kets |ϕi, |χi e |ωi forem ortogonais, então os seis kets que
surgem do lado direito de (14.90) também são ortogonais. Para normalizar (14.90), o que
√
devemos fazer é trocar o fator 3! por 1/ 3! .
Nos casos em que o sistema considerado tiver mais de três partículas idênticas, a situação é
similar a que acaba de ser descrita. Pode-se mostrar que, para N bóson idênticos, é sempre
possível construir o estado físico S |ui a partir dos estados de partícula única |ϕi, |χi, |ωi . . ..
Por outro lado, para os férmions, o ket físico A |ui pode ser escrito na forma de um determinante
de Slater de N × N , e isso, exclui o caso no qual dois estado de partícula única coincidem, o
que significaria que o ket A |ui seria nulo.
14.5.5 Construção de uma base no espaço de estado físico

Considere um sistema de N partículas idênticas. Iniciado com a base {|ui i}, no espaço de
estado de uma única partícula, pode-se construir a base
{|1 : ui ; 2 : uj ; . . . ; N : up i} (14.92)
com um produto tensorial de espaços de estados E. Entretanto, desde que o espaço de estado
do sistema físico não é E, mas em vez disso, um dos subespaços ES ou EA , o problema que surge
é de como determinar uma base no espaço de estado físico.
Pela aplicação de S e/ou A aos vários kets da base (14.92), pode-se obter um conjunto de
vetores que compõem ES e/ou EA . Considere que o ket |ϕi arbitrário deES , por exemplo (o caso
no qual |ϕi pertencem a EA pode ser tratado do mesmo modo), o qual pertence a E, pode ser
expandido na seguinte forma
X
|ϕi = ai,j,...,p |1 : ui ; 2 : uj ; . . . ; N : up i . (14.93)
i,j,...,p
Desde que |ϕi, por hipótese, pertence a ES , temos que S |ϕi = |ϕi, e simplesmente aplicamos
o operador S a ambos os lados de (14.93) para mostrar que ele pode ser expresso como uma
combinação linear de vários kets S |1 : ui ; 2 : uj ; . . . ; N : up i.
Entretanto, deve-se notar que os vários kets S |1 : ui ; 2 : uj ; . . . ; N : up i não são independen-
tes. Para vermos isso, usamos as regras de permutação de várias partículas em um dos kets
|1 : ui ; 2 : uj ; . . . ; N : up i da base inicial (antes da simetrização). Neste novo ket, a aplicação de
S ou A conduzem, conforme as eqs. (14.73), ao mesmo ket de ES ou EA (possivelmente com um
sinal trocado).
Portanto, introduziremos o conceito de número de ocupação: por definição, para o ket
|1 : ui ; 2 : uj ; . . . ; N : up i, o número de ocupação nk do estado de partícula única |uk i é igual ao

número de vezes que o estado |uk i aparece na sequência {|ui i , |uj i , . . . , |up i}, isto é, o número
de partículas no estado |uk i, o que obviamente significa que
X
nk = N. (14.94)
k
Os dois diferentes kets |1 : ui ; 2 : uj ; . . . ; N : up i para o qual os números de ocupação são iguais

podem ser obtidos um do outro pela ação de um operador de simetrização. Consequentemente,
após cada ação o simetrizador S (ou antissimetrizador A), eles fornecem o mesmo estado físico,
o qual denotamos por |n1 , n2 , . . . , nk , . . . , np i:

+

|n1 , n2 , . . . , nk , . . . , np i = cS 1 : u1 ; 2 : u1 ; . . . n1:u1 ; n1+1 : u2 ; . . . ; n1 + n2 : u2 ; . . . (14.95)

| {z } | {z }
n1 partículas no estado |u1 i n2 partículas no estado |u2 i
Para os férmions, S deve ser trocado por A em (14.95) (c é um fator o qual permite a normali-
zação do estado obtido desse modo). Aqui apresentaremos algumas propriedades dos estados
|n1 , n2 , . . . , nk , . . . , np i:

1. O produto escalar de dois kets |n1 , n2 , . . . , nk , . . . , np i e n01 , n02 , . . . , n0k , . . . , n0p é diferente

de zero somente se todos os números de ocupação forem iguais, ou seja, nk = n0k para
todo k. Usando (14.95) e as definições (14.62) de S e A, pode-se obter uma expansão
dos dois kets em consideração na base ortonormal, {|1 : ui ; 2 : uj ; . . . ; N : up i}. Então fica
fácil ver que se os números de ocupação não forem iguais , esses dois kets não podem
simultaneamente ter componentes não nulas no mesmo vetor da base.
2. Se as partículas em investigação forem bósons, os kets |n1 , n2 , . . . , nk , . . . , np i, nos quais

os vários números de ocupação nk são arbitrários, mas satisfazendo (14.94), eles for-
mam uma base ortonormal no espaço de estados físico. Note que para bósons os kets
|n1 , n2 , . . . , nk , . . . , np i definidos por (14.95) nunca são zeros. Para verificar isso, torque S
por sua definição (14.62). Então irá surgir no lado direito de (14.95), vários kets ortogonais
|1 : ui ; 2 : uj ; . . . ; N : up i, todos com coeficientes positivos |n1 , n2 , . . . , nk , . . . , np i, o que
portanto, não podem ser zero.
3. Os kets |n1 , n2 , . . . , nk , . . . , np i formam uma base em ES desde que esses kets que expandem
ES , sejam todos não-zero, e sejam mutuamente ortogonais entre si.
4. Se as partículas em investigação forem férmions, uma base do espaço de estados físico EA é

obtida ao escolher o conjunto dos kets |n1 , n2 , . . . , nk , . . . , np i nos quais todos os números
de ocupação ou são 0 ou 1, novamente satisfazendo (14.94).
5. A prova anterior não é aplicável a férmions por causa dos sinais de menos que surgem
nas permutações ímpares na definição (14.62) de A. Além disso, vimos que dois férmions
idênticos não podem ocupar o mesmo estado quântico individual: se qualquer um dos
números de ocupação é maior do que 1, o vetor definido por (14.95) é igual a zero. Por

14.6. Aplicação dos outros postulados
outro lado, ele nunca é zero, se todos os números de ocupação são iguais a um ou zero,
uma vez que as duas partículas, então, nunca estão no mesmo estado quântico de partícula
única, de modo que os kets |1 : ui ; 2 : uj ; . . . ; N : up i e Pα |1 : ui ; 2 : uj ; . . . ; N : up i são
sempre diferentes e ortogonais. A relação (14.95), por conseguinte, define um ket físico
não-zero neste caso. O resto da prova é o mesmo que para bósons.
14.6 Aplicação dos outros postulados

Resta-nos para mostrar como os postulados gerais da mecânica quântica podem ser apli-
cados à luz do postulado simetrização introduzido anteriormente, e verificar que não surgem
contradições. Mostraremos inicialmente como os processos de medições podem ser descrito com
kets pertencentes somente a ES ou EA , e em seguida que o processo de evolução temporal não
toma um ket |ψ(t)i associado com ao estado do sistema fora deste subespaço. Assim, todo o
formalismo da mecânica quântica pode ser aplicada dentro de ES ou EA .
14.6.1 Postulados de medição

14.6.1.1 Probabilidade de encontrar o sistema em um determinado estado físico
Considere-se uma medição realizada em um sistema de partículas idênticas. O ket |ψ(t)i

descrevendo o estado quântico do sistema antes da medição deve, de acordo com o postulado
simetrização, pertencem a ES ou EA , dependendo se o sistema é formado de bósons ou férmions.
Para aplicar os postulados da mecânica quântica referentes às medições, devemos levar o produto
escalar do ket |ψ(t)i com o ket |ui correspondente ao estado físico do sistema após a medição.
Este ket |ui deve ser construído pela aplicação da regra dada em anteriormente. A amplitude de
probabilidade hu| ψ(t)i, por conseguinte, pode ser expressa em termos de dois vectores, ambos
pertencentes quer à ES ou EA . Posteriormente serão discutidos um certo número de exemplos de
tais cálculos.
Se a medida prevista é uma medição “completa” (obtendo-se, por exemplo, as posições e as
componentes de spin Sz para todas as partículas), o ket físico |ui é único (a menos de um fator
constante). Por outro lado, se a medição é “incompleta” (por exemplo, uma medição apenas de
rotação, ou medição de um rolamento numa única partícula), vários kets físicos ortogonais são
obtidos, e as correspondentes probabilidades deve então ser somadas.
14.6.1.2 Observáveis físicos: invariância de ES e EA
Em certos casos, é possível especificar a medida realizada no sistema de partículas idênticas,

dando a expressão explícita do correspondente observável em termos de R1 , P1 , S1 , R2 , P2 , S2 ,
etc.
Vamos dar alguns exemplos concretos de observáveis que podem ser medidos em um sistema
de três partículas:

• Posição do centro de massa R e, o momentum total P e momentum angular total L:


 R = 31 (R1 + R2 + R3 )
 CM


P = P1 + P2 + P3 (14.96)



L = L1 + L2 + L3
• Energia de repulsão eletrostática
q2

1 1 1
W = + + (14.97)
4πε0 |R1 − R2 | |R2 − R3 | |R3 − R1 |
• Spin total
S = S1 + S2 + S3 (14.98)
É claro a partir dessas expressões que os observáveis associados com as quantidades físicas
consideradas envolvem as diversas partículas de forma simétrica. Esta propriedade importante
segue diretamente do fato de que as partículas são idênticas. Em (14.96), por exemplo, R1 , R2 e
R3 tem o mesmo coeficiente, uma vez que as três partículas têm o mesma massa. É a igualdade
das cargas que está na base da forma simétrica de (14.97). Em geral, uma vez que nenhuma
propriedade física é modificada quando os papéis das N partículas idênticas são permutados,
estas N partículas devem desempenhar um papel simétrico em qualquer observável mensurável.
Matematicamente, o observável G correspondente, que vamos chamar um observável físico, deve
ser invariante sob todas as permutações das N partículas idênticas. Deve-se, portanto, comutar
com todos os operadores de permutação Pα das N partículas:
[G, Pα ] = 0 para Pα (14.99)
Para um sistema de duas partículas idênticas, por exemplo, os observáveis R1 − R2 , o qual

não é invariante sobre o efeito da permutação P21 (R1 − R2 ), pois ela muda o sinal, não é
um observável físico; de fato a medida de R1 − R2 considera que a partícula (1) possa ser
distinguida da partícula (2). Por outro lado, podemos medir a distância entre duas partículas,
p
isto é, (R1 − R2 )2 , a qual é simétrica.
A relação (14.99) implica que ES e EA ambos são invariantes sobre a ação de um observável
físico G. Para mostrar isso, considere que |ψi pertença a EA e que G |ψi também pertença a EA
(a mesma prova se aplica a ES ). O fato de que |ψi pertença a EA significa que:
Pα |ψi = εα |ψi . (14.100)
Agora será calculado Pα G |ψi. Conforme (14.99) e (14.100) temos
Pα G |ψi = GPα |ψi = εα |ψi (14.101)
Desde que a permutação Pα é arbitrária, (14.101) expressa o fato de que G |ψi é completamente
antissimétrico e portanto pertence a EA .

Todas as operações normalmente realizadas sobre um observável – em particular, a determi-

nação dos autovalores e autovetores – podem portanto serem aplicadas a G inteiramente dentro
de um dos subespaços, ES ou EA . Somente os autokets de G pertencentes ao subespaço físico, e
os correspondentes autovalores, são retidos.
Note que:
1. Todos os valores próprios de G que existem no espaço total E não são necessariamente
encontrados se nos restringirmos aos subespaço Es (ou EA ). O efeito do postulado sime-
trização no espectro de um observável simétrico G pode ser, portanto, suprimir certos
autovalores. Por outro lado, ele não adiciona nenhum autovalor novo a esse espectro, uma
vez que, por causa da invariância globalEs (ou EA ) sob a ação de G, qualquer autovetor de
G em Es (ou EA ) também é um autovetor de G em E com o mesmo autovalor.
2. Considere o problema de escrever matematicamente, em termos de observáveis R1 , P1 , S1 ,

etc., os observáveis correspondentes aos diferentes tipos de medição previstas anteriormente.
Esse problema não é sempre simples. Por exemplo, para um sistema de três partículas
idênticas, vamos tentar escrever os observáveis correspondentes à medição simultânea das
três posições em termos de R1 , R2 e R3 . Podemos resolver este problema, considerando
vários observáveis físicos escolhidos de tal forma que podem, utilizando os resultados
obtidos medindo-os, de forma inequívoca deduzir a posição de cada partícula (sem, claro,
ser capaz de associar uma partícula numerados com cada posição). Por exemplo, podemos
escolher o conjunto
X1 + X2 + X3 , X1 X2 + X2 X3 + X3 X1 , X1 X2 X3 (14.102)
(e os observáveis correspondentes para as coordenadas Y e Z). No entanto, este ponto de

vista é bastante formal. Em vez de tentar escrever as expressões para os observáveis em todos
os casos, é mais simples de seguir o método utilizado antes, em que se limita ao uso dos mesmos
autovetores físicos da medição.
14.6.1.3 Postulados da evolução temporal
O hamiltoniano de um sistema de partículas idênticas deve ser um observável físico. Escreve-

remos, por exemplo, o hamiltoniano descrevendo o movimento dos dois elétrons do átomo de
hélio sobre o núcleo, assumido como imóvel:
P21 P2 2e2 2e2 e2

H(1, 2) = + 2 − − + (14.103)
2me 2me R1 R2 |R1 − R2 |
Os dois primeiros termos representam a energia cinética do sistema; eles são simétricos,
porque as duas massas são iguais. Os próximos dois termos são devido à atração do núcleo (cuja
taxa é duas vezes maior do que a do próton). Os elétrons são, obviamente, igualmente afetados
por esta atração. Finalmente, o último termo descreve a interação mútua dos elétrons. Ela
também é simétrica, uma vez que nenhum dos dois elétrons está em uma posição privilegiada.

É claro que este argumento pode ser generalizada para qualquer sistema de partículas idênticas.
Consequentemente, todos os operadores de permutação comutar com o Hamiltoniano do sistema:
[H, Pα ] = 0. (14.104)
Sobre essas condições, se o ket |ψ(t0 )i descrevendo o estado do sistema em um dado instante t0
é um ket físico, o mesmo deve ser verdade para o ket |ψ(t)i obtido de |ψ(t0 )i pela solução da
equação de Schrödinger. De acordo, com a equação de Schrödinger temos:

dt
|ψ(t + dt)i = 1 + H |ψ(t)i . (14.105)
i~
Agora aplicando Pα e usando a relação (14.104):

dt
Pα |ψ(t + dt)i = 1 + H Pα |ψ(t)i . (14.106)
i~
Se o ket |ψ(t)i é um autovetor de Pα , |ψ(t + dt)i também é um autovetor de Pα , com o mesmo
autovalor. Desde que |ψ(t0 )i, por hipótese, é um ket completamente simétrico ou completamente
antissimétrico, essa propriedade é conservada na evolução temporal.
O postulado da simetrização é portanto compatível com os postulados que fornecem a
evolução temporal de um sistema físico: a equação de Schrödinger não remove um ket de Es ou
de EA .
14.6.2 Discussão
Nesta seção final, examinaremos as consequências do postulado simetrização sobre as propri-
edades físicas de sistemas de partículas idênticas. Primeiro de tudo, vamos indicar as diferenças
fundamentais introduzidas pelo princípio de exclusão de Pauli entre os sistemas de férmions
idênticos e sistemas de bósons idênticos. Então, vamos discutir as implicações do postulado
simetrização relativa ao cálculo das probabilidades associadas aos vários processos físicos.
14.6.2.1 Diferença entre bósons e férmions. Princípio de exclusão de Pauli
Na declaração do postulado simetrização, a diferença entre bósons e férmions pode parecer

insignificante. Na verdade, essa simples diferença de sinal na simetria do ket físico tem
consequências extremamente importantes. Como vimos anteriormente o postulado simetrização
não restringe a acessibilidade dos estados individuais a um sistema de bósons idênticos. Por
outro lado, ele exige que os férmions obedeçam o princípio de exclusão de Pauli: dois férmions
idênticos não podem ocupar o mesmo estado quântico.
O princípio de exclusão foi formulado inicialmente, a fim de explicar as propriedades dos
átomos com muitos elétrons. Ele agora pode ser visto para ser mais do que um princípio
aplicável apenas aos elétrons: é uma consequência do postulado simetrização, válida para todos
os sistemas de férmions idênticos. Previsões baseadas neste princípio, que são muitas vezes
espetaculares, têm sido sempre confirmada experimentalmente. Vamos dar alguns exemplos
deles.

14.6.2.2 Estado fundamental de um sistema de partículas idênticas independentes
O hamiltoniano de um sistema de partículas idênticas (bósons ou férmions) é sempre simétrica

com respeito ao permutações destas partículas. Considere um sistema deste tipo em que as
várias partículas são independentes, isto é, não interagem umas com as outras (pelo menos em
uma primeira aproximação). O hamiltoniano correspondente é uma soma de operadores de uma
partícula da forma:
H(1, 2, . . . , N ) = h(1) + h(2) + · · · + h(N ) (14.107)
h(1) é uma função somente dos observáveis associados com a partícula numerada por (1); o fato
de que as partículas serem idênticas (o que implica em um hamiltoniano simétrico H(1, 2, . . . , N ))
impõe que a função h seja a mesma para cada um dos N termos da expressão (14.107). Para
determinar os autoestados e autovalores do hamiltoniano total H(1, 2, . . . , N ) , simplesmente
calculamos os hamiltonianos individuais h(j) no espaço de estados E(j) de uma das partículas:
h(j) |ϕn i = en |ϕn i ; |ϕn i ∈ E(j) (14.108)
Por uma questão de simplicidade, será considerado que o espectro de h(j) é discreto e não
degenerado.
Se considerarmos um sistema físico de bósons idênticos, os autovetores físicos do hamiltoniano
H(1, 2, . . . , N ) pode ser obtido pela simetrização dos produtos tensoriais dos N estados arbitrários
de partícula única |ϕn i:
(S) X
Φn ,n
1 2 ,...,nN
=c Pα |1 : ϕn1 ; 2 : ϕn2 ; . . . ; N : ϕnN i (14.109)
α
na qual a correspondente energia é a soma da N energias individuais:
En1 ,n2 ,...,nN = en1 + en2 + · · · + enN (14.110)
Pode-se mostrar que cada ket que surge no lado direito de (14.109) é um autoket de H com
autovalores dados por (14.110); isso também é verdade para a soma deles.
Em particular, se e1 é o menor autovalor de h(j), e |ϕ1 i é o auto estado associado, o estado
fundamental do sistema é obtido quando os N bósons idênticos estão todos no estado |ϕ1 i. A
energia desse estado fundamental é portanto:
E1,1,...,1 = N e1 (14.111)
e o seu vetor de estado é

E
(S)
1,1,...,1 = |1 : ϕ1 ; 2 : ϕ1 ; . . . ; N : ϕ1 i
ϕ (14.112)
Agora, considere que as N partículas idênticas consideradas são férmions. Não é mais
possível para todas essas N partículas estarem no mesmo estado de partícula única |ϕ1 i. Para

14.7. Estatística quântica
obter o estado fundamental do sistema, o princípio de exclusão de Pauli deve ser levado em
conta. Se as energias individuais en estão arranjadas em ordem crescente:
e1 < e2 < · · · < en−1 < en < en+1 < · · · < eN (14.113)
o estado fundamental do sistema de N férmions idênticos possui a seguinte energia:
E1,2,...,N = e1 + e2 + · · · + en−1 + en + en+1 + · · · + eN (14.114)
e ele é descrito pelo seguinte ket físico normalizado

|1 : ϕ1 i |1 : ϕ2 i ··· |1 : ϕN i

1 |2 : ϕ1 i |2 : ϕ2 i · · · |2 : ϕN i
E
(A)
Φ1,2,...,N = √ .. .. .. .. (14.115)
N! . . . .

|N : ϕ1 i |N : ϕ2 i · · · |N : ϕN i
A maior energia eN dos estados de uma partícula, encontrada no estado fundamental é chamada
de energia de Fermi do sistema.
O princípio de exclusão de Pauli possui um papel muito importante em toda a física na
qual um sistema de muitos elétrons está envolvido, tais como na física atômica e molecular e a
física de estado sólido, e toda aquela em que sistemas com muitos prótons, ou muitos nêutrons
estejam envolvidos.
14.7 Estatística quântica

O objeto de estudo da mecânica estatística são os sistemas compostos por um grande número
de partículas (na maioria dos casos, as interações mútuas entre essas partículas são fracas o
suficientemente de modo que elas podem ser negligenciada numa primeira aproximação). Desde
que o estado microscópico do sistema não é conhecido exatamente, resta-nos, contentarmos
em fornecer uma descrição global por meio de suas propriedades macroscópicas (pressão,
temperatura, densidade, etc.). Um estado macroscópico especial corresponde aquele conjunto
de todos os estados microscópicos. Em seguida, usa-se probabilidades: o peso estatístico de
um estado macroscópico é proporcional ao número de estados microscópicos distintos, que
correspondem a ele, e o sistema, em equilíbrio termodinâmico, está em seu estado macroscópico
mais provável (com todas as restrições que podem ser impostas levadas em conta). Para estudar
as propriedades macroscópicas do sistema, é portanto, essencial determinar quantos estados
microscópicos diferentes possuem certas características e, em particular, uma determinada
energia.
Na mecânica estatística clássica (estatísticas Maxwell-Boltzmann), as N partículas do sistema
são tratados como se fossem de diferentes naturezas, mesmo se elas forem realmente idênticas.
Tal estado microscópico é definido especificando o estado individual de cada uma das partículas.
Dois estados microscópicos são considerados serem diferentes quando estes N estados individuais
são os mesmos, mas a permutação das partículas é diferente.

Na mecânica estatística quântica, o postulado simetrização deve ser levado em conta. Um

estado microscópico de um sistema de partículas idênticas é caracterizada pela enumeração dos
N estados individuais que o compõem, a ordem desses estados, não tem importância alguma,
desde que o seu produto tensorial deve ser simetrizada ou antissimetrizado. A numeração dos
estados microscópicos, portanto, não levam ao mesmo resultado como na mecânica estatística
clássica. Além disso, o princípio de Pauli diferencia radicalmente os sistemas de bósons idênticos
e os sistemas de férmions idênticos: o número de partículas que ocupam um determinado estado
individual não pode exceder um para férmions, enquanto ele pode ter qualquer valor para bósons.
Diferentes propriedades estatísticas resultam: bósons obedecem a estatística de Bose-Einstein e
férmions a estatística de Fermi-Dirac. Esta é a origem dos termos “bóson” e “férmions”.
As propriedades físicas dos sistemas de férmions idênticos e sistemas de bósons idênticos são
muito diferentes. Estas diferenças podem ser observadas, por exemplo, a baixas temperaturas.
As partículas então, tendem a se acumular em cada um dos estados de menor energia, como é
possível para bósons idênticos (este fenômeno é chamado de condensação Bose), enquanto os
férmions idênticos estão sujeitos às restrições do princípio de Pauli. A condensação de Bose está
na origem das propriedades notáveis de fluidez (super) do isótopo de hélio 4 He, enquanto que o
isótopo 3 He, que é um férmion, não possuem as mesmas propriedades.
14.7.1 As consequências da indistinguibilidade da partícula no cálculo

de suas predições físicas
Na mecânica quântica, todas as previsões sobre as propriedades de um sistema são expressos
em termos de amplitudes de probabilidade elementos (produto escalar de dois vetores de estado)
ou dos elementos de matriz de um operador. Então, não é surpreendente que a simetrização ou
antissimetrização de vetores de estado faça com que efeitos especiais de interferência surjam em
sistemas de partículas idênticas. Inicialmente, serão especificados esses efeitos, e, em seguida,
será mostrado como eles desaparecem sob determinadas condições (as partículas do sistema,
embora idênticas, comportam-se como se fossem de naturezas diferentes). Para simplificar
o procedimento, a discussão apresentada estará limitada a sistemas contendo apenas duas
partículas idênticas.
14.7.2 Interferências entre os processos diretos e os de troca

14.7.2.1 As predições relativas a uma medida em um sistema de partículas idên-
ticas: o termo direto e o termo de troca
Considere um sistema composto por duas partículas idênticas, uma das quais é conhecido por
estar no estado individual|ϕi e a outra em |χi. Será considerado que |ϕi e |χi são ortogonais,
de modo que o estado do sistema é descrito pelo ket físico normalizado
1
|ϕ; χi = √ [1 + P21 ] |1 : ϕ; 2 : χi , (14.116)
2

no qual 
+1 se as partículas são bósons
= (14.117)
−1 se as partículas são férmions
Com o sistema nesse estado, considere que se deseje medir em cada uma das duas partículas
a mesma quantidade física B, com a qual os observáveis B(1) e B(2) estão associadas. Por uma
questão de simplicidade, será considerado que o espectro de B é inteiramente discreto e não
degenerado:
B |ui i = bi |ui i (14.118)
Qual é a probabilidade de encontrar certos valores nesta medida (bn para uma das partículas
e bm para a outra)? Partindo da hipótese de que bn e bm são diferentes, de modo que os
correspondentes autovetores |un i e |um i são ortogonais, ou seja, hun | um i = δn,m . Sob estas
condições, o ket físico normalizado definido pelo resultado desta medida pode ser escrito como:
1
|un ; um i = √ [1 + P21 ] |1 : un ; 2 : um i (14.119)
2
o qual fornece a amplitude de probabilidade associada com esse resultado:
1 †
hun ; um | ϕ; χi = h1 : un ; 2 : um | (1 + P21 )(1 + P21 ) |1 : ϕ; 2 : χi , (14.120)
2
†
mas como P21 = P21 e (P21 )2 = 1, segue então que
1 †
(1 + P21 )(1 + P21 ) = 1 + P21 ,
2
o que significa então que
hun ; um | ϕ; χi = h1 : un ; 2 : um | (1 + P21 ) |1 : ϕ; 2 : χi . (14.121)
Deixando que o operador (1 + P21 ), na expressão anterior atue sobre o bra, obtém-se que
hun ; um | ϕ; χi = h1 : un ; 2 : um | 1 : ϕ; 2 : χi + h1 : um ; 2 : un | 1 : ϕ; 2 : χi
= h1 : un | 1 : ϕi h2 : um | 2 : χi + h1 : um | 1 : ϕi h2 : un | 2 : χi
= hun | ϕi hum | χi + hum | ϕi hun | χi (14.122)
A numeração da amplitude de probabilidade desapareceu, e agora se expressa diretamente

em termos de produtos escalares hun | ϕi . . . hun | χi. Além disso, a amplitude de probabilidade
aparece tanto como uma soma (para bósons) ou uma diferença (para férmions) de dois termos,
com a qual podemos associar os diagramas de figuras 14.5(a) e 14.5(b).
Pode-se interpretar o resultado (14.122) da seguinte forma. Os dois kets |ϕi e |χi associados
com o estado inicial podem estar conectados aos dois bras hun | e hum | associados com o vetor
de estado final por dois “caminhos” distintos, representados esquematicamente pelas figuras
14.5(a) e 14.5(b). Com cada um desses caminhos está associado uma amplitude de probabilidade,
hun | ϕi hum | χi ou hum | ϕi hun | χi, e essas duas amplitudes interferem com um sinal + para

hun | |ϕi hun | |ϕi
hum | |χi hum | |χi
(a) (b)
Figura 14.5: Representação esquemática do termo direto e do termo de troca associado com uma
medida realizada em um sistema de duas partículas idênticas. Antes realizar a medida, sabe-se que uma
das partículas está no estado |ϕi e a outra, no estado|χi. O resultado obtido da medida corresponde
a uma situação em que uma partícula se encontra no estado |un i e a outra, no estado |um i. As
duas amplitudes de probabilidade estão associadas com uma das medidas; eles estão representados
esquematicamente pelas figuras (a) e (b). Estas amplitudes interferem com um sinal de + para bósons
e com um sinal − para férmions.
bósons e com um sinal − para férmions. Portanto, obteve-se uma reposta para a indagação
inicial: a probabilidade desejada P(bn ; bm ) é igual ao quadrado do módulo de (14.122):
P(bn ; bm ) = |hun | ϕi hum | χi + hum | ϕi hun | χi|2 (14.123)
O primeiro termo da eq. (14.122), que corresponde ao caminho ilustrado na figura 14.5(a)
é chamado de termo direto, enquanto o segundo termo da eq. (14.122), que corresponde ao
caminho ilustrado na figura 14.5(b) é chamado de termo de troca.
Agora será examinado o que ocorre se duas partículas , em vez de idênticas, forem de
natureza distintas. O estado inicial do sistema é escolhido de modo que
|ψi = |1 : ϕ; 2 : χi (14.124)
Agora, considere um instrumento de medida o qual, embora as duas partículas não sejam
idênticas, ele não consegue distinguir uma da outra. Se el produz os resultados bn e bm , não
se sabe se bn está associado com a partícula (1) ou (2) (por exemplo um sistema composto
por um múon µ− e um elétron e− , o dispositivo de medida pode ser sensível somente as cargas
das partículas, não fornecendo nenhuma informação sobre suas massas). Os dois autoestados
|1 : un ; 2 : um i e |1 : um ; 2 : un i (os quais nesse caso, representam diferentes estados físicos) então
correspondem ao mesmo resultado da medida. Desde que eles sejam ortogonais, deve-se adicionar
as correspondentes probabilidades, o que fornece:
P 0 (bn ; bm ) = |h1 : un ; 2 : um | 1 : ϕ; 2 : χi|2 + |h1 : um ; 2 : un | 1 : ϕ; 2 : χi|2

= |hun | ϕi|2 |hum | χi|2 + |hum | ϕi|2 |hun | χi|2 (14.125)
A comparação da eq. (14.123) com a eq. (14.125), revela claramente as diferenças significantes
nas predições físicas da mecânica quântica dependendo se as partículas em consideração são ou
não idênticas.

Agora considere o caso em os dois estados |un i e |um i são os mesmos. Quando as duas
partículas são férmions, o correspondente estado físico é excluído pelo princípio de Pauli, e
a probabilidade P(bn ; bm ) é igual a zero. Por outro lado, se as duas partículas forem bósons,
tem-se que
|un ; un i = |1 : un ; 2 : un i (14.126)
e consequentemente:
1
hun ; un | ϕ; χi = √ h1 : un ; 2 : umn | (1 + P21 ) |1 : ϕ; 2 : χi
2
√
= 2 hun | ϕi hun | χi (14.127)
a qual fornece:
P(bn ; bn ) = 2 |hun | ϕi hun | χi|2 (14.128)
Ao comparar esse resultado, com o obtido anteriormente para duas partículas distintas,
deve-se trocar o ket |ϕ; χi pelo ket |1 : ϕ; 2 : χi e |un ; un i por |1 : un ; 2 : un i, o que fornece o
seguinte valor para amplitude de probabilidade:
hun | ϕi hun | χi (14.129)
e consequentemente:
P 0 (bn ; bn ) = |hun | ϕi hun | χi|2 (14.130)
Para um sistema contendo N partículas idênticas, em geral, há N ! termos de troca distintos
os quais soma (ou subtraem) na amplitude de probabilidade. Por exemplo, considere um
sistema com três partículas idênticas nos estados individuais |ϕi, |χi, e |ψi e as probabilidade
de determinar, em uma medida, os resultados bn , bm e bq . Os possíveis “caminhos” são ilustrados
na figura (14.6). Existem seis possíveis “caminhos” (todos distintos, se os três autovalores forem
bn , bm e bq diferentes). Alguns sempre contribuem para a amplitude de probabilidade com um
sinal +, enquanto outros com um sinal (+1 para bósons e −1 para férmions).
14.7.3 Exemplo: colisão elástica de duas partículas idênticas

Para entender o significado físico do termo de troca, será examinado um exemplo concreto:
o da colisão elástica de duas partículas idênticas descrita por um referencial no seu centro de
massa. Ao contrário da situação acima descrita, aqui tem-se de levar em conta a evolução do
sistema entre o momento inicial quando ele está no estado |ψi i e o tempo t em que a medida é
realizada. No entanto, como será visto, esta evolução não muda o problema radicalmente, e o
termo de troca entra no problema como antes.
No estado inicial do sistema as duas partículas estão movendo-se diretamente uma sobre
a outra, com os momenta opostos. Escolheu-se o eixo z ao longo da direção desses momenta,
e denotou-se o seu módulo por p. Portanto, uma das partículas possui momentum p1 = pêz
enquanto a outra p2 = −pêz . O ket físico que representa o estado inicial no instante t0 , antes
da colisão, é dado por
1
|ψi i = √ (1 + P21 ) |1 : pêz ; 2 : −pêz i (14.131)
2

hun | |ϕi hun | |ϕi hun | |ϕi
hum | |χi hum | |χi hum | |χi
huq | |ψi huq | |ψi huq | |ψi
+ + +
hun | |ϕi hun | |ϕi hun | |ϕi
hum | |χi hum | |χi hum | |χi
huq | |ψi huq | |ψi huq | |ψi

Figura 14.6: Representação esquemática das seis amplitudes de probabilidade associados com um
sistema de três partículas idênticas. Sabe-se antes realizar a medida que uma partícula está no estado
|ϕi, uma outra, no estado |χi, e a último, no estado |ψi. O resultado obtido corresponde a uma situação
em que uma partícula se encontra no estado |un i, uma outra, no estado |um i, e o último, no estado
|uq i. As seis amplitudes interferem com um sinal que é mostrado abaixo de cada uma ( = +1 para
bósons, = −1 para férmions).
O z O z
Estado inicial Estado final

Figura 14.7: Colisão entre duas partículas idênticas no referencial do centro de massa: estão repre-
sentados os momenta das duas partículas no estado inicial e no estado final, encontrado na medida.
Por uma questão de simplicidade, que o spin das partículas serão ignorados.
A equação de Schrödinger a qual governa a evolução temporal do sistema é linear. Conse-

quentemente, há um operador linear U (t, t0 ), o qual é uma função do hamiltoniano H, tal que o
vetor de estado no instante t é dado por
|ψ(t)i = U (t, t0 ) |ψi i . (14.132)
Em particular, após a colisão, o estado do sistema no instante t1 é representado pelo ket físico:
|ψ(t1 )i = U (t1 , t0 ) |ψi i . (14.133)
Note que, desde que o hamiltoniano H, é simétrico, o operador evolução temporal U (t, t0 ) comuta
com o operador permutação:
[U (t, t0 ), P21 ] = 0. (14.134)

(1) n̂ (2) n̂
(1) z (1) z
(2) (2)
(2) (a) (1) (b)

Figura 14.8: Colisão entre duas partículas idênticas no referencial do centro de massa: representação
esquemática dos processos físicos correspondentes ao termo direta e ao termo de troca. As amplitudes
de espalhamento associados a estes dois processos interferem com um sinal de + para bósons e um sinal
− para férmions.
Agora, será calculada a amplitude de probabilidade do resultado previsto anteriormente, no qual

as partículas são detectadas nas duas direções opostas do eixo On de vetor unitário n̂, conforme
figura 14.7. Denotando o ket físico associado com esse estado final por:
1
|ψf i = √ (1 + P21 ) |1 : pn̂; 2 : −pn̂i . (14.135)
2
A amplitude de probabilidade desejada pode portanto ser reescrita como
hψf | ψ(t1 )i = hψf | U (t1 , t0 ) |ψi i

1
†

= h1 : pn̂; 2 : −pn̂| 1 + P21 U (t1 , t0 ) (1 + P21 ) |1 : pêz ; 2 : −pêz i (14.136)
2
Conforme a eq. 14.134 e as propriedades do operador P21 , pode-se escrever

†
hψf | U (t1 , t0 ) |ψi i = h1 : pn̂; 2 : −pn̂| 1 + P21 U (t1 , t0 ) |1 : pêz ; 2 : −pêz i
= h1 : pn̂; 2 : −pn̂| U (t1 , t0 ) |1 : pêz ; 2 : −pêz i +

+ h1 : −pn̂; 2 : pn̂| U (t1 , t0 ) |1 : pêz ; 2 : −pêz i (14.137)
O termo direto correspondente, por exemplo, ao processo mostrado na figura 14.8(a), e o termo
de troca representado pela 14.8(b). Novamente as amplitudes de probabilidade associadas
com esses dois processos devem ser adicionadas ou subtraídas. Isso faz surgir um termo de
interferência quando o quadrado do módulo da expressão (14.137) é tomado. Note também
que essa expressão é multiplicada por se n̂ for trocado por −n̂, tal que a correspondente
probabilidade é invariante sobre essa troca.

14.7.4 Situação na qual o postulado da simetrização pode ser igno-

rado
Se a aplicação do postulado simetrização fossem sempre indispensável, seria impossível
estudar as propriedades de um sistema que contém um número limitado de partículas, uma vez
que seria necessário levar em conta todas as partículas no universo que são idênticas aquelas do
sistema. Será mostrado que este não é o caso. De fato, sob certas condições especiais, partículas
idênticas se comportam como se fossem realmente diferente, e não é necessário fazer uso do
postulado da simetrização, a fim de obter previsões físicas corretas. Parece natural esperar,
considerando os últimos resultados, que numa situação deste tipo surge sempre que os termos
de troca introduzidos pelo postulado da simetrização são zero. Vamos dar dois exemplos.
14.7.4.1 Partículas idênticas situadas em duas regiões distintas do espaço
Considere duas partículas idênticas, uma das quais está no estado individual |ϕi e outro,
no estado |χi. Para simplificar a notação, será ignorado o spin. Considere que o domínio das
funções de onda que representam os kets |ϕi e |χi são bem separados no espaço:

ϕ(r) = hr| ϕi = 0 se r ∈
/ Dϕ
(14.138)
χ(r) = hr| χi = 0 se r ∈
/ Dχ
na qual os domínios Dϕ e Dχ não se sobrepõem, conforme ilustrado na figura 14.9.
Dϕ Dχ
Figura 14.9: Domínios dos estado iniciais representados pelos os kets |ϕi e |χi.
A situação é semelhante a que surge na mecânica clássica: enquanto a domínios Dϕ e Dχ não

se sobrepõem, cada uma das partículas pode ser "seguida"; Portanto, espera-se que a aplicação
do postulado simetrização seja desnecessária.
Neste caso, pode-se prever o resultado da medida de um observável relacionado com uma
das duas partículas. Tudo o que é preciso é de um dispositivo de medição colocado de modo
que não possa registrar o que acontece no domínio Dϕ ou no domínio Dχ . Se for Dϕ , o domínio
que está excluído desta forma, a medida será com respeito somente a partícula localizada em
Dχ , e vice-versa.
Agora, imagine uma medida com relação as duas partículas simultaneamente, no entanto,
realizada com dois dispositivos de medida distintos, um dos quais não é sensível aos fenômenos
que ocorrem em Dχ , e o outro, para aqueles em Dϕ . Como a probabilidade de se obter um
determinado resultado pode ser calculada? Considere os kets |ui e |vi com sendo os estados
individuais associados, respectivamente, com os resultados dos dois dispositivos de medida. Uma

vez que as duas partículas são idênticas, o postulado simetrização deve, em teoria, ter sido
levado em conta. Na amplitude de probabilidade associada com o resultado da medida, o termo
direto é então hu| ϕi hv| χi, e o termo de troca é hu| χi hv| ϕi. Agora, a disposição espacial dos
dispositivos de medida implicam que:

v(r) = hr| vi = 0 se r ∈ Dϕ
(14.139)
u(r) = hr| ui = 0 se r ∈ Dχ
Conforme as eqs. (14.138) e (14.139), as funções de onda u(r) e χ(r) não se sobrepõem e nem
v(r) e ϕ(r), logo
hu| χi = hv| ϕi = 0. (14.140)
Dϕ u(r) Dχ v(r)
Figura 14.10: Domínios dos estado finais representados pelos os kets |ui e |vi.
O termo troca é portanto zero. Consequentemente, não é necessário, nesta situação, para
usar o postulado simetrização. Obtém-se o resultado desejado pelo raciocínio direto no qual trata
as partículas como se elas fossem de diferentes naturezas, rotulando, por exemplo, a do domínio
Dϕ com o número 1, e a situada em Dχ com o número 2. Antes da medida, o estado do sistema
é então descrito pelo ket |1 : ϕ; 2 : χi, e com o resultado previsto da medida está associada com
o |1 : u; 2 : vi. Seu produto escalar fornece a amplitude de probabilidade hu| ϕi hv| χi. Este
argumento mostra que a existência de partículas idênticas não impede o estudo separado de
sistemas de acesso restrito, composto por um pequeno número de partículas.
Observação 14.3. No estado inicial escolhida, as duas partículas situam-se em duas regiões
distintas de espaço. Além disso, nós definimos o estado do sistema, especificando dois estados
individuais. Podemos nos perguntar se, após o sistema ter evoluído, ainda é possível estudar
uma das duas partículas e ignorar a outra. Para que este seja o caso, é necessário, não só
que as duas partículas permanecem em duas regiões distintas de espaço, mas também que não
interagem. Se as partículas são idênticas ou não, uma interação sempre introduz a correlação
entre elas, e não é mais possível descrever cada um delas por um vetor de estado.
14.7.4.2 Partículas que podem ser identificadas pela direção de seus spins
Considere uma colisão elástica entre duas partículas idênticas de spin 1/2 (por exemplo
elétrons), considerando que as interações dependentes do spin podem ser desprezadas, de modo
que os estados de spin das duas partículas são conservados durante a colisão. Se estes estados de
spin são inicialmente ortogonais, eles nos permitem distinguir entre as duas partículas em todos
os momentos, como se eles não fossem idênticos; consequentemente, o postulado simetrização,
novamente não tem nenhum efeito aqui.

14.8. O caráter simétrico dos estados de um sistema de muitas partículas idênticas
O z O z
Estado inicial Estado final

Figura 14.11: Colisão entre duas idênticas de spin 1/2 partículas no referencial do centro de massa:
Uma representação esquemática dos momentos e spins das duas partículas no estado inicial e no estado
final encontrado na medida. Se as interações entre as duas partículas são independentes do spin, a
orientação dos spins não se altera durante a colisão. Quando as duas partículas não estão no mesmo
estado de spin antes da colisão (o caso da figura), é possível determinar o “caminho” seguido pelo
sistema até chegar a um determinado estado final. Por exemplo, o único processo de espalhamento
que leva para o estado final da figura da direita e que tem uma amplitude diferente de zero é do tipo
mostrado na figura 14.8(a).
Pode-se mostrar isso, conforme cálculos anteriores, e para tal considere por exemplo, que o
estado inicial é dado pelo seguinte ket físico
1
|ψi i = √ (1 − P21 ) |1 : pêz , +; 2 : −pêz , −i (14.141)
2
no qual os sinais + e − adicionados após cada momentum, indica o sinal da componente do
spin ao longo do eixo particular escolhido. O estado final, o qual está sendo considerado na
figura 14.11 será descrito por
1
|ψf i = √ (1 + P21 ) |1 : pn̂, +; 2 : −pn̂, −i (14.142)
2
Sobre essas condições, somente o primeiro termo de (14.137) é diferente de zero, desde que o
segundo pode ser escrito como
h1 : −pn̂, −; 2 : pn̂, +| U (t1 , t0 ) |1 : pêz , +; 2 : −pêz , −i (14.143)
Este é o elemento da matriz de um operador independente do spin (por hipótese) entre dois
kets cujos estados de spin são ortogonais; ele é portanto zero. Para obter o mesmo resultado
se tratássemos as duas partículas diretamente como se elas fossem diferentes, ou seja, se não
antissimetrizássemos os kets iniciais e finais, e se associássemos ao índice 1 com o estado de
spin |+i e com o índice 2 com o estado de spin |−i. É claro que, isso não é mais possível, se o
operador de evolução U , isto é, o hamiltoniano H do sistema, for dependente do spin.
14.8 O caráter simétrico dos estados de um sistema de mui-

tas partículas idênticas
Sabe-se da mecânica quântica que todo operador o qual comuta com o operador hamiltoniano
H possui as mesmas propriedades de simetria do operador H, e que além disso ele poderá

ser diagonalizado simultaneamente com H. Isto significa que os autoestados de H podem ser
construídas de tal modo que eles também são autofunções dos operadores simétricos. Não é
difícil encontrar operadores simétricos os quais pertencem à classe de invariância do hamiltoniano
com respeito a mudança de enumeração das partículas. Eles são operadores do tipo Pik , os quais
trocam as coordenadas ri pelas coordenadas rk do vetor de estado ,
Pik |1 : r1 ; . . . ; i : ri ; . . . ; k : rk ; . . . ; n : rn i = |1 : r1 ; . . . ; i : rk ; . . . ; k : ri ; . . . ; n : rn i (14.144)
Se a Hamiltoniana é invariante com respeito a troca de enumeração de todas as partículas,

segue que
[H, Pik ] = 0 para todos i, k = 1, 2, . . . , n com i 6= k. (14.145)
Os autoestados de Pik satisfazem3
Pik |1 : r1 ; . . . ; i : ri ; . . . ; k : rk ; . . . ; n : rn i = λ |1 : r1 ; . . . ; i : ri ; . . . ; k : rk ; . . . ; n : rn i
|1 : r1 ; . . . ; i : rk ; . . . ; k : ri ; . . . ; n : rn i = λ |1 : r1 ; . . . ; i : ri ; . . . ; k : rk ; . . . ; n : rn i
(14.146)
onde λ são os possíveis autovalores do operador Pik . Se aplicarmos uma vez mais o operador
Pik à equação (14.146), encontraremos
Pik2 |1 : r1 ; . . . ; i : ri ; . . . ; k : rk ; . . . ; n : rn i ≡ |1 : r1 ; . . . ; i : ri ; . . . ; k : rk ; . . . ; n : rn i
= λ2 |1 : r1 ; . . . ; i : ri ; . . . ; k : rk ; . . . ; n :(14.147)
rn i
isto é, os autovalores reais λ, tem de satisfazer a seguinte equação λ2 = 1. Portanto o operador Pik
pode ter somente os autovalores λ = ±1. Sobre a troca das coordenadas ri e rk , as autofunções
de Pik podem portanto ou permanecer a mesma (λ = +1, funções de onda simétricas), ou mudar
o seu sinal (λ = −1, funções de onda antissimétricas). Uma generalização do operador de dupla
troca é o operador permutação P , o qual gera uma permutação arbitrária dos índices:
P |1 : r1 ; . . . ; i : ri ; . . . ; k : rk ; . . . ; n : rn i = |P (1) : r1 ; . . . ; P (i) : ri ; . . . ; P (k) : rk ; . . . ; P (n) : rn i

(14.148)
onde P (1), . . . , P (n) é uma permutação dos números 1, 2, . . . , n (na realidade temos um operador
individual para cada permutação, mas usualmente iremos falar no operador permutação). Se a
3
Se Ψ é um auto-estado de de Pik , então:
[H, Pik ] Ψ = 0 =⇒ HPik Ψ − Pik HΨ = 0

HPik Ψ = Pik HΨ =⇒ HΨ(k, i) = Pik λΨ(i, k)
Λ0 Ψ(k, i) = λΨ(k, i) =⇒ λ0 = λ
Como λ0 = λ, então as partículas são indistinguíveis.

Hamiltoniana comuta com todos os Pik , ou equivalentemente, com o operador permutação, os

autoestados da energia podem ser construídos de tal modo que eles serão ou completamente
simétricos ou completamente antissimétricos sobre uma troca de duas coordenadas arbitrárias
(ou, número de partículas, respectivamente).
Por uma questão de simplicidade, para representar o estado se um sistema de muitas
partículas, com seus respectivos spin σ, usaremos a seguinte notação, compacta:
|1 : r1 , σ 1 ; . . . ; i : ri , σ i ; . . . ; n : rn , σ n i = |x1 , . . . , xi , . . . , xn i
a qual significa que,
|1 : r1 , σ 1 ; . . . ; i : rn , σ n ; . . . ; n : ri , σ i i = |x1 , . . . , xn , . . . , xi i .
Se iniciarmos com autoestados da energia |x1 ; . . . ; xi ; . . . ; xk ; . . . ; xn i arbitrários, que não

possuem um caráter de simetria bem definido, podemos obter um estado completamente simétrico

(ΨS ) ou completamente antissimétrica (ΨA ) via
S X
Ψ = A P |x1 , x2 , . . . , xn i (14.149)
P
A X
Ψ = B (−1)P P |x1 , x2 , . . . , xn i . (14.150)
P
Aqui somamos sobre todas as permutações P (1), . . . , P (n) dos índices 1, 2, . . . , n. O sinal (−1)P
na equação (14.150) é definido por
(
+1 Se o número de permutações for par
(−1)P = (14.151)
−1 Se o número de permutação for ímpar

Isto assegura que o ket ΨA permanecerá antissimétrico sobre a troca de dois índices. A
notação par e ímpar se referem ao número de pares de trocas necessárias para obtermos uma
certa permutação. Os fatores A e B podem ser determinados pela normalização dos respectivos
estados.
É um fato experimental que a natureza só pode ser descrita corretamente por funções de onda
que tenham simetrias bem definidas. Além disso, como a experiência nos ensina, na natureza os
autovalores λ sempre tem o mesmo valor para cada espécie de partícula. Em outras palavras,
na natureza existem obviamente duas espécies de partículas: partículas que são descritas por
funções de onda simétricas e que são chamadas de bósons, e partículas que são descritas por
funções de onda antissimétricas e que são chamadas de férmions.
Exatamente como no caso clássico, sistemas de partículas não interagentes são simples de se
tratar na mecânica quântica, desde que o correspondente hamiltoniano possa ser separada em
uma soma de operadores de uma partícula:
n
X
S
H (x1 , x2 , . . . , xn, p1 , p2 , . . . , pn ) = h (xi, pi ) . (14.152)
i=1

Se o problema de autovalores do operador h (xi, pi )
hφk (x) = εk φk (x) (14.153)
for resolvido, podemos construir a função de onda total a partir das funções de onda de
uma-partícula φk (x). A função de onda mais simples do hamiltoniano (14.152) é
n
Y
ΨE
k1 ,...,kn (x1 , x2 , . . . , xn ) = φki (xi ) . (14.154)
i=1
Aqui denotamos o número quântico dos estados ocupados por um índice. A função de onda
tem o seguinte autovalor energia
n
X
E= εki . (14.155)
i=1
O produto das funções de onda (14.154) pode ser escrito em uma maneira mais clara usando a
notação de Dirac, usando os vetores de estados bra e o ket. O vetor de estado da função de
onda de muitas partículas pode ser caracterizado pelos números quânticos dos estados ocupados.
Ele é o produto direto dos vetores de estado de uma partícula:
|k1 , k2 , . . . , kn i = |k1 i ⊗ |k2 i ⊗ · · · ⊗ |kn i . (14.156)
O espaço de Hilbert correspondente é a soma direta dos espaços de uma partícula. A equação
(14.156) significa que a partícula no 1 está no estado quântico k1 , a partícula no 2 está no estado
quântico k2 , etc. O conjugado hermitiano deste vetor de estado é
hk1 , k2 , . . . , kn | = hk1 | ⊗ hk2 | ⊗ · · · ⊗ hkn | . (14.157)
Nas equações (14.156) e (14.157) devemos sempre ter o cuidado de ordenar os números quânticos,
pois estamos assumindo que as partículas são distinguíveis, portanto é importante sabermos
qual partícula ocupa um determinado estado. Os vetores de estado são ortonormalizados
hk10 , k20 , . . . , kn0 | k1 , k2 , . . . , kn i = hk10 | k1 i hk20 | k2 i · · · hkn0 | kn i

(14.158)
= δ (k10 − k1 ) · · · δ (kn0 − kn )
e completos
X
|k1 , k2 , . . . , kn i hk1 , k2 , . . . , kn | = 1. (14.159)
k1 ,k2 ,...,kn
se este for o caso para os estados de uma partícula. Uma função de onda arbitrária (par para
sistemas interagentes) pode portanto ser expandida em termos de |k1 , k2 , . . . , kn i. Para números
quânticos discretos, a função-δ nas equações (14.158) devem ser interpretadas como símbolos de
Kronecker. A função de onda (14.154) segue como a representação dos vetores de estado na
representação das coordenadas

ΨE
k1 ,...,kn (x1 , x2 , . . . , xn ) = hx1 , x2 , . . . , xn | k1 , k2 , . . . , kn i
= hx1 | k1 i hx2 | k2 i · · · hxn | kn i

= φk1 (x1 ) φk2 (x2 ) · · · φkn (xn ) . (14.160)
Esta função de onda não tem uma simetria bem definida, desde que as trocas de duas coordenadas
(ou equivalentemente, de dois números quânticos) conduz a funções de onda completamente
diferentes. Por outro lado, a Hamiltoniana (14.152) comuta com o operador permutação, e
portanto podemos construir também autofunções com um caráter de simetria bem definido:
X
ΨS,E
k1 ,...,kn (x1 , x2 , . . . , xn ) = N orm. P φk1 (x1 ) φk2 (x2 ) · · · φkn (xn ) , (14.161)
P
1 X
ΨA,E
k1 ,...,kn (x1 , x2 , . . . , xn ) = √ (−1)P P φk1 (x1 ) · · · φkn (xn ) . (14.162)
n! P
Aqui somamos sobre todas as permutações P (1), . . . , P (n) de 1, 2, . . . , n nos argumentos das
funções de onda de uma-partícula φkn (xn ). Além disso, devemos notar que é irrelevante se
estamos permutando os índices das coordenadas ou dos números quânticos. A função de onda
antissimétrica (14.214), a qual descreve os férmions, pode ser interpretada com um determinante,

φ (x ) · · · φ (x )
k1 1 k1 n
A,E 1 .
.. . .. .
..

Ψk1 ,...,kn (x1 , x2 , . . . , xn ) = √ . (14.163)
n!

φkn (x1 ) · · · φkn (xn )
Este determinante também é chamado de determinante de Slater. Aqui o conhecido princípio de
exclusão de Pauli para férmions torna-se imediatamente óbvio, o qual nos diz que dois férmions
iguais não pode ocupar o mesmo estado quântico de uma partícula. Se este for o caso, dois dos
números quânticos k1 , k2 , . . . , kn poderiam ser iguais, e portanto duas linhas do determinante
seriam idênticas, desta forma a função de onda ΨA,E
k1 ,...,kn (x1 , x2 , . . . , xn ) seria automaticamente
nula.
Em contraste com os férmions, muitos bósons podem ocupar arbitrariamente o mesmo
estado de uma partícula. Este fato, torna a normalização da função de onda simétrica mais
complicada. Realmente ela depende de quantos dos números quânticos k1 , k2 , . . . , kn são iguais.
Se por exemplo, o estado k1 está ocupado por n1 bósons, k2 por n2 bósons, etc., onde de fato o
P
número total de bósons do sistema é dado por N = i ni , então a norma da equação (14.212) é
1
N orm. = √ . (14.164)
N ! n1 ! n2 ! · · · nn !
Esta expressão torna-se mais clara se considerarmos que existem ao todo N ! permutações, além
disso ni permutações mútuas do mesmo número quântico conduzem ao mesmo termo na soma
que aparece na equação (14.212), portanto devemos multiplicar as N ! permutações pelas ni
permutações mútuas para obtermos o número total de permutações possíveis, obtendo desta
forma o coeficiente de normalização.

Exemplo 14.4. Normalização da função de onda simétrica de duas partículas

Calcularemos a normalização da função de onda simétrica de duas partículas
ΨS (x1 , x2 ) = φk1 (x1 ) φk2 (x2 ) + φk1 (x2 ) φk2 (x1 )
∗
Ψ (x1 , x2 ) ΨS (x1 , x2 ) = [φ∗k1 (x1 ) φ∗k2 (x2 ) + φ∗k1 (x2 ) φ∗k2 (x1 )] ×
S
[φk1 (x1 ) φk2 (x2 ) + φk1 (x2 ) φk2 (x1 )]

= φ∗k1 (x1 ) φ∗k2 (x2 ) φk1 (x1 ) φk2 (x2 )
+φ∗k1 (x1 ) φ∗k2 (x2 ) φk1 (x2 ) φk2 (x1 )
+φ∗k1 (x2 ) φ∗k2 (x1 ) φk1 (x1 ) φk2 (x2 )
+φ∗k1 (x2 ) φ∗k2 (x1 ) φk1 (x2 ) φk2 (x1 )
Se φk1 e φk2 forem ortogonais, o segundo e o terceiro termo se anulam quando integrarmos

sobre as coordenadas, e desta forma encontraremos que ΨS ΨS = 2. Se, entretanto, ambas as
partículas ocuparem o mesmo estado φk1 , os termos mistos também contribuem, e obteremos

que ΨS ΨS = 4. Ambos os casos são descritos pela norma (14.216). No primeiro caso temos:
√ √
N = 2, n1 = 1, n2 = 1 e a norma N orm. = 1/ N ! n1 ! n2 ! = 1/ 2. No segundo caso temos:
√ √
N = 2, n1 = 2, n2 = 0 e a norma N orm. = 1/ N ! n1 ! n2 ! = 1/ 4.
As Funções de onda antissimétricas e simétricas também podem ser escritas mais claramente
na notação de Dirac,
1 X
|k1 , k2 , . . . , kn iA = √ (−1)P P |k1 , k2 , . . . , kn i
n! P
1 X
(−1)P

= √ kP (1) , kP (2) , . . . , kP (n) (14.165)
n! P
1 X
|k1 , k2 , . . . , kn iS = √ P |k1 , k2 , . . . , kn i
n!S P
1 X
= √ kP (1) , kP (2) , . . . , kP (n) . (14.166)
n!S P
Aqui o fator S −1/2 representa a normalização adicional, se vários dos k1 , k2 , . . . , kn são iguais.
Podemos provar facilmente, com a ajuda das equações (14.217) e (14.166), que as funções de
onda antissimetrizadas e simetrizadas tem um caráter simétrico bem definido:
A
P |k1 , k2 , . . . , kn iA = kP (1) , kP (2) , . . . , kP (n) = (−1)P |k1 , k2 , . . . , kn iA

(14.167)
S
P |k1 , k2 , . . . , kn iS = kP (1) , kP (2) , . . . , kP (n) = (+1) |k1 , k2 , . . . , kn iS

(14.168)
elas são ortonormalizadas

hk10 , k20 , . . . , kn0 | k1 , k2 , . . . , kn iA =

A
1 X X 0 A
(−1)P (−1)P A kP0 0 (1) , . . . , kP0 0 (n) kP (1) , . . . , kP (n)

= (14.169)
n! P P0
X
(−1)P hk10 , k20 , . . . , kn0 | kP (1) , kP (2) , . . . , kP (n)

= (14.170)
P
X
(−1)P δ k10 − kP (1) δ k20 − kP (2) · · · δ kn0 − kP (n)

= (14.171)
P
Aqui, exploramos o fato de que a somatória dupla sobre todas as permutações é igual a n! vezes
uma única soma sobre todas as permutações, como podemos nos convencer rapidamente com o
seguinte exemplo, para n = 2. Desde que o lado direito não se anula, se qualquer permutação
de {k1 , k2 , . . . , kn } for igual a {k10 , k20 , . . . , kn0 }, dois estados os quais diferem somente pela ordem
dos números quânticos são considerados diferentes (ortonormais).
Para um vetor de estado simétrico, analogamente temos,
1 X
S
hk10 , . . . , kn0 | k1 , . . . , kn iS = √ δ k10 − kP (1) · · · δ kn0 − kP (n)

(14.172)
SS 0 P
Observemos que o fator adicional é um fator novamente necessário, se vários números
quânticos são idênticos. As funções de onda seguem novamente como representações das
coordenadas dos vetores de estado
1 A
ΨA
k1 ,...,kn (x1 , . . . , xn ) = √ hx1 , . . . , xn | k1 , . . . , kn iA
n!
1 X
= √ (−1)P P φk1 (x1 ) · · · φkn (xn ) (14.173)
n! P
1
ΨSk1 ,...,kn (x1 , . . . , xn ) = √ S hx1 , . . . , xn | k1 , . . . , kn iS
n!
1 X
= √ P φk1 (x1 ) · · · φkn (xn ) . (14.174)
N ! n1 ! · · · nn ! P
Os vetores de estado (14.217) e (14.166) formam um sistema completo em ambos os espaços par-
ciais dos estados antissimetrizados e simetrizados. Uma função de onda arbitrária (normalmente
para sistemas interagentes) podem ser expandidas em termos destas funções:
1 X
|k1 , k2 , . . . , kn iA A
hk1 , k2 , . . . , kn | = 1A (14.175)
n! k ,k ,...,k
1 2 n
1 X
|k1 , k2 , . . . , kn iS S
hk1 , k2 , . . . , kn | = 1S . (14.176)
n! k ,k ,...,k
1 2 n
Aqui, 1A e 1S são operadores unitários em ambos os espaços parciais.

Os fatores adicionais (n!)−1/2 nas equações (14.223) e (14.174) fornecem a normalização

de acordo com as equações (14.212) e (14.214). Por outro lado, estes fatores cancelam-se nas
equações (14.217) e (14.166), desde que temos duas somatórias sobre todas as permutações. Uma
das somas pode ser trocada por um fator n!, o qual cancela os dois fatores (n!)−1/2 provenientes
das equações (14.217) e (14.166). Um fator adicional (n!)−1 é necessário nas equações (14.229)
e (14.230). Nominalmente se os números quânticos {k1 , k2 , . . . , kn } variam sobre todos os
possíveis valores independentemente um do outro, há conjuntos {k10 , k20 , . . . , kn0 } nas somatórias
que aparecem nas equações (14.229) e (14.230) os quais diferem somente pelo ordenamento
dos números quânticos, mas os quais correspondem ao mesmo microestado. Portanto, cada
microestado é contado n! vezes nas somas que aparecem nas equações (14.229) e (14.230).
Agora provaremos que 1A de fato atua como um operador unitário no espaço de estados
antissimétricos. E para isto, mostraremos que
1A |k1 , k2 , . . . , kn iA =
1 X A
= |k10 , k20 , . . . , kn0 i A
hk10 , k20 , . . . , kn0 | k1 , k2 , . . . , kn iA
n! 0 0 0
k1 ,k2 ,...,kn
1 X A
X
|k10 , k20 , . . . , kn0 i (−1)P δ k10 − kP (1) · · · δ kn0 − kP (n)

=
n!
k10 ,k20 ,...,kn
0 P
1 X A 1 X
(−1)P kP (1) , kP (2) , . . . , kP (n) = |k1 , k2 , . . . , kn iA

=
n! P n! P
= |k1 , k2 , . . . , kn iA (14.177)
onde as relações (14.221) e (14.218) foram usadas. A prova para bósons é análoga; somente, na
segunda linha da equação (14.177) devemos ter o cuidado de
X S 1 X X
kP (1) , . . . , kP (n) S
|k10 , . . . , kn0 i √ δ k10 − kP (1) · · · δ kn0 − kP (n) =

k10 ,...,kn
0 SS 0 P P
(14.178)
Aqui o fator adicional da normalização é novamente necessário, se vários números quânticos são
idênticos.
A antissimetrização e a simetrização dos estados também tem consequências nas possíveis
quantidades observáveis do sistema. Por exemplo, agora o cálculo quântico de valores esperados
de observáveis que de algum modo marcam uma partícula específica, não é mais sensível a
especificação da partícula. Também não é mais possível especificar a densidade de probabilidade
de encontrar a partícula no 2 na posição x1 . Agora temos somente uma densidade de probabilidade
de encontrar qualquer uma das n partículas na posição x1 . Isto significa também que todos os
observáveis O de um sistema de partículas indistinguíveis tem de ser invariante com respeito a
troca da enumeração das partículas:
[O, P ] = 0 (14.179)

14.9. Formalismo do Espaço de Hilbert
Os elementos de matriz antissimetrizados e simetrizados de um observável arbitrário pode ser

calculado a partir dos elementos de matriz com os produtos de estados:
hk10 , k20 , . . . , kn0 | O |k1 , k2 , . . . , kn iA =

A
1 X X 0 A
(−1)P A kP0 0 (1) , . . . , kP0 0 (n) O kP (1) , . . . , kP (n)

(−1)P

= (14.180)
n! P P0
X
(−1)P hk10 , k20 , . . . , kn0 | O kP (1) , kP (2) , . . . , kP (n)

= (14.181)
P
e analogamente para os elementos de matriz simétricos, com
ˆ
hk10 , . . . , kn0 | O |k1 , . . . , kn i = d3 x1 · · · d3 xn φ∗k10 (x1 ) · · · φ∗kn0 (xn ) O φk1 (x1 ) · · · φkn (xn )
(14.182)
O cálculo do traço dos operadores segue a seguinte regra (prescrição):
1 X
Tr O = S,A
hk1 , k2 , . . . , kn | O |k1 , k2 , . . . , kn iS,A (14.183)
n! k ,k ,...,k
1 2 n
desde que agora qualquer dois estados os quais difiram somente por uma permutação dos
números quânticos não devem ser contados como diferentes.
O caráter simétrico da função de onda também tem consequências importantes na termo-
dinâmica e nas propriedades estatísticas de um sistema. Portanto, falamos em estatística de
Bose-Einstein para bósons e estatística de Fermi-Dirac para Férmions. Se um sistema consiste de
várias espécies de partículas distinguíveis, a função de onda total será somente antissimetrizada
ou simetrizada, com respeito a troca de duas partículas idênticas. Então os vetores de base totais
são produtos de vetores de estados antissimetrizados ou simetrizados. Se todas as partículas
são consideradas como sendo distinguíveis, o produto de estados (14.156) pode ser usado. Este
é o caso limite da estatística clássica de Maxwell-Boltzman. Em muitos casos o produto de
estados (14.156) também pode ser usado como uma aproximação para um sistema de partículas
idênticas (indistinguíveis).
14.9 Formalismo do Espaço de Hilbert

Inicialmente consideraremos um espaço de estados descrevendo uma única partícula, seja ela um
bóson ou um férmion, e a partir daí construiremos o estado de múltiplas partículas de acordo
com os métodos padrões [10, Ver seção 6.7, pág. 167] [10, Ver seção 6.7, pág. 167].
Trataremos simultaneamente o caso de Bose-Einstein e o de Fermi-Dirac, distinguindo eles
pelo número ξ;
(
+1 Para bósons
ξ= (14.184)
−1 Para férmions

Consideraremos inicialmente o caso de partículas distinguíveis. Se |ψ1 i , . . . , |ψn i são estados

de uma partícula, então
|ψi = |ψ1 i |ψ2 i . . . |ψn i (14.185)
descreve o estado de n-partículas com a i-ésima partícula no estado |ψi i. Seja |ϕ1 i , |ϕ2 i , . . . |ϕn i
outros possíveis estados de uma partícula, logo o estado
|ϕi = |ϕ1 i |ϕ2 i . . . |ϕn i (14.186)
descreve o estado de n-partículas com a i-ésima partícula no estado |ϕi i. Então podemos escrever
hϕ| ψi = (hϕ1 | hϕ2 | . . . hϕn |) (|ψ1 i |ψ2 i . . . |ψn i)

= hϕ1 | ψ1 i hϕ2 | ψ2 i · · · hϕn | ψn i (14.187)
o que define o produto interno hϕ| ψi. O espaço de Hilbert descrevendo o sistema de n-partículas
é aquele expandido por todos os tensores de n-ésimo-rank com a forma da eq. (14.185).
O estado no qual a i-ésima partícula está localizada no ponto xi é |x1 i |x2 i . . . |xn i. Como
cada xi percorre todo o espaço, os estados resultantes formam um conjunto completo ortonormal
para o espaço de n-partículas (ignorando o spin e outras variáveis):
(hx1 | hx2 | . . . hxn |) (|y1 i |y2 i . . . |yn i) = hx1 | y1 i hx2 | y2 i · · · hxn | yn i

= δ (x1 − y1 ) δ (x2 − y2 ) . . . δ (xn − yn ) (14.188)
ˆ ˆ ˆ
dx1 dx2 · · · dxn (|x1 i |x2 i . . . |xn i) (hx1 | hx2 | . . . hxn |) = 1. (14.189)
Usando esta base podemos expressar o estado de n-partículas na representação de coordenadas

como:
ψ (x1 , x2 , . . . , xn ) = (hx1 | hx2 | . . . hxn |) |ψi

= hx1 | ψ1 i hx2 | ψ2 i · · · hxn | ψn i .
= ψ (x1 ) ψ (x2 ) · · · ψ (xn ) (14.190)
Agora iremos considerar partículas indistinguíveis. Assumiremos que as partículas obedecem

a estatística de Fermi-Dirac ou de Bose-Einstein, o que significa que devemos antissimetrizar ou
simetrizar, respectivamente os estados obtidos na eq. (14.185). Portanto definimos
1 X p
|ψ1 i |ψ2 i . . . |ψn i = √ ξ ψP (1) ψP (2) . . . ψP (n) , (14.191)
n! p

onde P percorre todas as permutações dos n objetos. Muitas vezes será mais conveniente
escrever |ψ1 , ψ2 , . . . , ψn i em vez de |ψ1 i |ψ2 i . . . |ψn i, e o lado direito da equação acima (14.191)
na forma de determinante, desta forma

|ψ1 i |ψ2 i · · · |ψn i

1 |ψ1 i |ψ2 i · · · |ψn i

|ψ1 , ψ2 . . . , ψn i = √ . .. .. .. , (14.192)
n! .. . . .

|ψ1 i |ψ2 i · · · |ψn i ξ
onde se ξ = −1, caso de Fermi temos um determinante que é conhecido como determinante de
Slater e se ξ = 1, caso de Bose-Einstein temos um permanente, isto ficará claro posteriormente.
O espaço de estado das n-partículas é aquele expandido por todos os produtos da forma da
eq. (14.191). Note que |ψ1 i |ψ2 i . . . |ψn i dado por (14.191) é totalmente simétrico no caso de
Bose-Einstein e totalmente antissimétrico no caso de Fermi-Dirac, como deve ser.
EXEMPLO: Seja |ai e |bi os dois estados de uma partícula única.
Se ξ = 1 (bósons), então:
1
|ai |bi = |a, bi = √ (|ai |bi + |bi |ai) ,
2
√
|ai |ai = |a, ai = 2 |ai |ai .
Se ξ = −1 (férmions), então:
1
|ai |bi = |a, bi = √ (|ai |bi − |bi |ai) ,
2
|ai |ai = |a, ai = 0.
Portanto, temos o resultado esperado de que dois férmions não podem estar no mesmo estado,
satisfazendo o princípio de exclusão de Pauli.
Qual é o produto interno de dois estados de n-partículas? A resposta é dada pelo seguinte
teorema:

hϕ | ψ i · · · hϕ | ψ i
1 1 1 n
.
.. . .. .
..

hϕ1 , ϕ2 , . . . , ϕn |ψ1 , ψ2 . . . , ψn i = ,
(14.193)

hϕn | ψ1 i · · · hϕn | ψn i
ξ
onde, para qualquer matriz A = (Aij ) de n × n,
X
|A|ξ = ξ P A1P (1) · · · AnP (n) . (14.194)
P
Isto é, |A|− é o determinante de A, e |A|+ é o chamado permanente de A.

Prova:

hϕ1 , ϕ2 , . . . , ϕn |ψ1 , ψ2 . . . , ψn i =
1 XX P Q
= ξ ξ hϕP (1) |hϕP (2) | . . . hϕP (n) | |ψQ(1) i|ψQ(2) i . . . |ψQ(n) i
n! P Q
1 XX P Q

hϕ1 , ϕ2 , . . . , ϕn |ψ1 , ψ2 . . . , ψn i = ξ ξ ϕP (1) ψQ(1) · · · ϕP (n) ψQ(n)
n! P Q
Exemplo: Seja hϕ2 | ψ3 i hϕ3 | ψ1 i hϕ1 | ψ2 i, então:
P (1) = 2 Q(1) = 3 P −1 (1) = 3

P (2) = 3 Q(2) = 2 P −1 (2) = 1
P (3) = 1 Q(3) = 1 P −1 (3) = 2
QP −1 (1) = Q(3) = 2 = P (1) P P −1 (1) = P (3) = 1

QP −1 (2) = Q(1) = 3 = P (2) e P P −1 (2) = P (1) = 2
QP −1 (3) = Q(2) = 1 = P (3) P P −1 (3) = P (2) = 3
assim,
hϕ1 , ϕ2 , . . . , ϕn |ψ1 , ψ2 . . . , ψn i =
1 XX P Q

= ξ ξ ϕP P −1 (1) ψQP −1 (1) · · · ϕP P −1 (n) ψQP −1 (n)
n! P Q
1 XX P Q
hϕ1 , ϕ2 , . . . , ϕn |ψ1 , ψ2 . . . , ψn i = ξ ξ hϕ1 |ψQP −1 (1) i · · · hϕn |ψQP −1 (n) i
n! P Q
−1 −1
OBS: Como P e Q representam o número de trocas no sistema então: ξ P = ξ P e ξQξP =
QP −1 Q+P Q−P
ξ , o que é equivalente a ξ ou ξ , já que ξ = ±1.
Seja R = QP −1 , assim
1 XX R
hϕ1 , ϕ2 , . . . , ϕn |ψ1 , ψ2 . . . , ψn i = ξ hϕ1 |ψR(1) i · · · hϕn |ψR(n) i
n! P R
X
= ξ R hϕ1 |ψR(1) i · · · hϕn |ψR(n) i
R
hϕ | ψ i · · · hϕ | ψ i
1 1 1 n
.. . .. .
..

=
. ,

hϕn | ψ1 i · · · hϕn | ψn i
ξ
o qual é o resultado desejado.

14.10. O Problema da Normalização
14.10 O Problema da Normalização

Suponha que {|1i , |2i , |3i , . . .}, seja um conjunto completo de estados ortonormais, ou seja:
X
hα| βi = δα,β ; |αi hα| = 1. (14.195)
α
Um conjunto de estados de n-partículas consiste de |α1 , α2 , . . . , αn i, onde α1 ≤ α2 ≤ · · · ≤ αn

no caso de Bose, e α1 < α2 < · · · < αn no caso de Fermi. Estes estados são ortogonais uns em
relação aos outros, mas nem sempre normalizados. Pode-se mostrar usando (14.193), que para
um conjunto completo ortonormal de estados, estes estados podem ser escritos como
|α1 , α2 , . . . , αn i ; (α1 < α2 < · · · < αn ) Para Férmions
|α1 , α2 , . . . , αn i
√ ; (α1 ≤ α2 ≤ · · · ≤ αn ) Para Bósons.
n1 !n2 ! · · · nn !
onde nα é o número de vezes que α ocorre na sequência α1 , α2 , . . . , αn (para os férmions nα = 0
ou nα = 1). Na expressão acima para os Férmions, temos que (α1 < α2 < · · · < αn ), esta é
uma convenção a qual se deve ao fato de que se trocarmos duas partí culas de posição como no
seguinte caso |α1 , α3 , α2 , . . . , αn i, e desde que as partículas são idênticas este estado obviamente
representa o estado |α1 , α2 , α3 , . . . , αn i, mas pela equação (14.192) eles diferem por um sinal,
o que vem a ser uma ambiguidade. Para remover esta ambiguidade, sempre escrevemos o
estado |α1 , α2 , α3 , . . . , αn i na ordem padrão dada por α1 < α2 < · · · < αn , desta forma não
escreveremos o estado |α1 , α3 , α2 , . . . , αn i mas e sim o |α1 , α2 , α3 , . . . , αn i.
Para estes casos, a relação de completeza pode ser escrita na seguinte forma conveniente:
1 X X
··· |α1 , α2 , α3 , . . . , αn i hα1 , α2 , α3 , . . . , αn | = 1. (14.196)
n! α α
1 n
Aqui o intervalo de cada de cada αi é irrestrito, a duplicação de estados é levada em conta no

termo 1/n! e pela normalização. No caso dos Férmions, os termos com αi não distintos são
realmente zero. O 1 no lado direito da equação (14.196) significa o operador unidade no espaço
de estados de n-partículas (devidamente simetrizado). A equação (14.196) pode ser verificada
aplicando ao lado esquerdo o estado |β1 , β2 , β3 , . . . , βn i e usando as equações (14.193) e (14.194).
O caso n = 0 necessita de uma explicação. O estado de zero-partícula é um tensor de rank
(ordem) zero, isto é, um escalar (número complexo). Eles formam um espaço unidimensional, de
quem todos os elementos são proporcionais ao número 1. O estado 1 será denotado por |vácuoi
ou algumas por |0i, será chamado de estado de vácuo. Os estados de zero-partícula são portanto
estendidos pelo estado |vácuoi.
Construímos para cada n um espaço de Hilbert que descreve um sistema de n-partículas;
portanto temos uma sequência infinita de espaços. Em muitos processos o número de partículas
não é constante: as partículas podem ser criadas e destruídas. Para descrever tais processos
precisamos de um espaço de Hilbert que contenha estados de número de partículas variando.

14.10. O Problema da Normalização
Para obtermos um tal espaço simplesmente combinamos todos os espaços de n-partículas em

um grande espaço o qual podemos chamar de espaço de múltiplas-partículas. Um estado geral
no espaço de múltiplas-partículas é da seguinte forma:

|Ψi = Ψ(0) + Ψ(1) + Ψ(2) + Ψ(3) + · · ·

(14.197)

onde Ψ(n) é um estado de n-partículas.
Definimos estados de diferentes números de partículas como sendo ortogonais uns aos outros,
então se |ϕi é um outro estado de múltiplas-partículas e é expresso do mesmo modo que a
equação (14.197), então

hϕ |Ψi ≡ ϕ(0) Ψ(0) + ϕ(1) Ψ(1) + ϕ(2) Ψ(2) + · · · .

(14.198)
Se {|ϕi} é um conjunto completo de estados ortogonais, então a equação (14.195) é satisfeita,

então usando as equações (14.193), (14.195) e (14.198) podemos sumarizar a ortogonalidade por

α1 β1 · · · δα1 βn
δ

. .. ..
hα1 , α2 , . . . , αn |β1 , β2 . . . , βm i = δn,m .. . .
(14.199)

δαn β1 · · · δαn βn
ξ
A partir da equação (14.196) temos também a relação de completeza
∞
X 1 X X
··· |α1 , α2 , α3 , . . . , αn i hα1 , α2 , α3 , . . . , αn | = 1. (14.200)
n=0
n! α α
1 n
Nesta equação ”1 ” significa o operador unidade em todo o espaço de múltiplas-partículas.

Como um exemplo, suponha que descrevemos os estados na representação das coordenadas.
O estado |x1 , x2 , . . . , xn i (não normalizado) descreve uma situação na qual existe uma partícula
em cada ponto x1 , x2 , . . . , xn . Então as equações (14.199) e (14.200) tornam-se

δ (x − y ) · · · δ (x − y )
1 1 1 n
.. . . ..
hx1 , x2 , . . . , xn |y1 , y2 , . . . , ym i = δn,m
. . . ,
(14.201)

δ (xn − y1 ) · · · δ (xn − yn )
ξ
∞ ˆ ˆ ˆ
X 1
dx1 dx2 · · · dxn |x1 , x2 , . . . , xn i hx1 , x2 , . . . , xn | = 1. (14.202)
n=0
n!
Podemos expandir um estado arbitrário de múltiplas-partículas |Ψi como segue, usando a
equação (14.202):
∞ ˆ ˆ ˆ
X 1
|Ψi = dx1 dx2 · · · dxn |x1 , x2 , . . . , ~xn i Ψ(n) (x1 , x2 , . . . , xn ) . (14.203)
n=0
n!
Aqui

14.11. Operadores de Criação e de Destruição
Ψ(n) (x1 , x2 , . . . , xn ) = hx1 , x2 , . . . , xn | Ψi (14.204)
é (se |Ψi estiver normalizado) a amplitude para o estado |Ψi ter n partículas, uma em cada posição
xi . Note que Ψ(n) (x1 , x2 , . . . , xn ) é simétrica ou antissimétrica de acordo com a estatística das
partículas. Note também que se |Ψi é um estado de n-partículas e é da forma |Ψ1 , Ψ2 , . . . , Ψn i,
onde cada |Ψi i é um estado de uma-partícula, então
Ψ(m) (x1 , x2 , . . . , xn ) = 0 a menos que m = n;

Ψ (x ) · · · Ψ (x )
1 1 1 n
(n)
.
.. . .. .
..

Ψ (x1 , x2 , . . . , xn ) = ,
(14.205)

Ψn (x1 ) · · · Ψn (xn )
ξ
onde Ψi (xj ) = hxj | Ψi i. A equação (14.205) provém das equações (14.204) e (14.193). No caso
de Fermi o determinante é chamado de determinante de Slater.
14.11 Operadores de Criação e de Destruição

Agora estamos prontos para definir os operadores de criação e de destruição. Estes operadores
são fundamentais por duas razões; primeiro construímos o estado de múltiplas-partículas de
tal modo que podemos descrever a mudança do número de partículas, e precisamos de algum
operador que possa efetuar esta mudança, e segundo outros operadores tais como a energia total
irão ser simplificados expressivamente em termos dos operadores de criação e de destruição.
Seja |ϕi um estado qualquer de uma partícula. Definiremos a† (ϕ) como sendo um operador
linear que satisfaz a seguinte relação
a† (ϕ) |ψ1 , ψ2 . . . , ψn i = |ϕ, ψ1 , ψ2 . . . , ψn i (14.206)
para qualquer estado de n-partícula |ψ1 , ψ2 . . . , ψn i. Para n = 0, isto deve ser entendido como
a† (ϕ) |vácuoi = |ϕi. Chamamos a† (ϕ) de operador de criação para o estado |ϕi, e seu adjunto
a (ϕ) de operador de destruição.
Um operador de criação converte claramente um estado de n-partículas em um estado de
(n+1)-partículas. É fácil ver que um operador de destruição leva um estado de n-partículas em
um estado de (n-1)-partículas e que ele aniquila o estado de vácuo. Para encontrarmos o efeito
de a (ϕ) em um estado de n-partículas |ψ1 , ψ2 . . . , ψn i multiplicamos a esquerda por um estado
arbitrário de (n-1)-partículas hχ1 , χ2 , . . . , χn−1 |. Assim

hχ1 , χ2 , . . . , χn−1 | a (ϕ) |ψ1 , ψ2 . . . , ψn i = hψ1 , ψ2 . . . , ψn | a† (ϕ) |χ1 , χ2 , . . . , χn−1 i∗

= hψ1 , ψ2 . . . , ψn | ϕ, χ1 , χ2 , . . . , χn−1 i∗
∗
hψ | ϕi hψ | χ i · · · hψ | χ i
1 1 1 1 n−1
.
.. .
.. .
..

= ···

hψn | ϕi hψ1 | χ1 i · · · hψn | χn−1 i
ξ
 ∗ 
hψ | ϕi ··· · · · hψ1 | χn−1 i 

n
 1 
. ..
X 
= ξ k hψk | ϕi .. (sem ψk) · · · .


 k=1

hψn | ϕi ··· · · · hψn | χn−1 i


ξ
aqui fizemos uma expansão por menores.
hχ1 , χ2 , . . . , χn−1 | a (ϕ) |ψ1 , ψ2 . . . , ψn i =

Xn
= ξ k hψk | ϕi∗ hψ1 , . . . , ψk−1 , ψk+1 , . . . , ψn | χ1 , χ2 , . . . , χn−1 i∗
k=1
n
X
= ξ k hϕ| ψk i hχ1 , χ2 , . . . , χn−1 | ψ1 , . . . , ψk−1 , ψk+1 , . . . , ψn i
k=1
Devido ao fato de hχ1 , χ2 , . . . , χn−1 | ser arbitrário, temos finalmente que
n
X
a(ϕ)|ψ1 , ψ2 , . . ., ψn i = ξ k−1 hϕ|ψk i| ψ1 , . . . , ψk−1 , ψk+1 , . . . , ψn i. (14.207)
k=1
Portanto o operador destruição remove o estado |ψi i, um por vez, deixando uma soma de estados
de (n-1)-partículas.
As equações (14.206) e (14.207) descrevem a ação dos operadores de criação e de destruição
em estados de muitas partículas. Dá (14.206) temos
a† (ϕ2 )a† (ϕ1 )| ψ1 , ψ2 , . . . , ψn i = | ϕ2 , ϕ1 , ψ1 , ψ2 , . . . , ψn i

ξa† (ϕ1 )a† (ϕ2 )| ψ1 , ψ2 , . . . , ψn i = | ϕ2 , ϕ1 , ψ1 , ψ2 , . . . , ψn i
a† (ϕ2 )a† (ϕ1 ) − ξa† (ϕ1 )a† (ϕ2 ) | ψ1 , ψ2 , . . . , ψn i = 0

a† (ϕ2 )a† (ϕ1 ) = ξa† (ϕ1 )a† (ϕ2 ) (14.208)
portanto,
(
ξ=1 =⇒ Comutador
a† (ϕ2 ), a† (ϕ1 ) ξ = 0

(14.209)
ξ = −1 =⇒ Anticomutador

Tomando o adjunto de (14.208) obtemos,
a(ϕ1 )a(ϕ2 ) = ξa(ϕ2 )a(ϕ1 ) (14.210)
portanto,
(
ξ=1 =⇒ Comutador
[a(ϕ1 ), a(ϕ2 )]ξ = 0 (14.211)
ξ = −1 =⇒ Anticomutador
Agora o que desejamos saber é: a(ϕ1 ), a† (ϕ2 ) ξ =? Inicialmente devemos calcular

a(ϕ1 )a† (ϕ2 )| ψ1 , ψ2 , . . . , ψn i = a(ϕ1 )| ϕ2 , ψ1 , ψ2 , . . . , ψn i

n
X
= hϕ1 |ϕ2 i| ψ1 , ψ2 , . . . , ψn i + ξ k−1 hϕ1 |ψk i| ϕ2 , ψ1 , . . . , ψk−1 , ψk+1 , . . . , ψn i (14.212)
k=1
Então,
n
X
†
a (ϕ2 )a(ϕ1 )| ψ1 , . . . , ψn i = ξ k−1 hϕ1 |ψk ia† (ϕ2 )|ψ1 , . . . , ψk−1 , ψk+1 , . . . , ψn i(14.213)
k=1
n
X
= ξ k−1 hϕ1 |ψk i|ϕ2 , ψ1 , . . . , ψk−1 , ψk+1 , . . . , ψn i (14.214)
k=1
multiplicando a eq. (14.214) por ξ e subtraindo o resultado da eq. (14.212), obtemos que
a(ϕ1 )a† (ϕ2 ) − ξa† (ϕ2 )a(ϕ1 ) = hϕ1 |ϕ2 i

a(ϕ1 ), a† (ϕ2 ) ξ = hϕ1 |ϕ2 i

(14.215)
As relações (14.208), (14.210) e (14.215) são relações de comutação fundamentais para os

operadores de criação e de destruição.
As relações que acabamos de deduzir (14.208), (14.210) e (14.215) geralmente são colocadas
em termos de uma base ortonormal, e é o que iremos fazer agora. Seja {|αi} = {|1i, |2i, . . .} um
conjunto completo ortonormal de estados de uma-partícula. É usual deixar aα = a(α). Então
desde que hα|βi = δα,β , temos
h i
aα , a†β = δα,β . (14.216)
ξ
Consideraremos os casos de Bose e de Fermi separadamente.

14.11.1 Caso de Bose

Seja
|1, . . . , 1, 2, . . . , 2, . . . , 3, . . .i
|n1 , n2 , . . .i = √ (14.217)
n1 !n2 !n3 ! · · ·
onde nα é o número de vezes que α aparece no ket da direita. Então o estado |n1 , n2 , . . .i, onde
cada nα = 0, 1, 2, . . ., forma uma base para todo o espaço de múltiplas-partículas. Das eqs.
(14.206), (14.207) e (14.217), encontra-se que:
√
a†α |n1 , n2 , . . . , nα , . . .i = nα + 1|n1 , n2 , . . . , nα + 1, . . .i (14.218)
√
aα |n1 , n2 , . . . , nα , . . .i = nα |n1 , n2 , . . . , nα − 1, . . .i (14.219)
As relações de comutação são:
h i h i
[aα , aβ ] = 0; a†α , a†β = 0; aα , a†β = δα,β . (14.220)
O operador número de partículas no estado |αi é
Nα = a†α aα (14.221)
14.11.2 Caso de Fermi

Usando a notação |α1 , α2 , . . . , αn i, temos
a†α |α1 , α2 , . . . , αn i = | α, α1 , α2 , . . . , αn i (14.222)
n
X
aα |α1 , α2 , . . . , αn i = (−1)k−1 δα,αk | α1 , . . . , αk−1 , αk+1 , . . . , αn i (14.223)
k=1
Poderíamos também usar a notação de número de ocupação
|n1 , n2 , . . .i = |α1 , α2 , . . .i

onde α1 < α2 < . . ., e nα é o número de vezes que α ocorre (nα = 0 ou 1) nesta seqüência. Se
nα = 0, então a†α muda ele para 1, e por sua vez aα aniquila o estado. Se nα = 1, então aα muda
ele para zero e a†α por sua vez aniquila o estado (devido ao princípio de exclusão de Pauli). Há
também fatores ±1 envolvidos, dependendo dos estados que estão ocupados.
Note que a(ϕ)2 = a† (ϕ)2 = 0 para qualquer estado de uma-partícula |ϕi. Esta declaração
segue das equações (14.208) e (14.210) (com ξ = −1 e ϕ1 = ϕ2 = ϕ), e também é equivalente ao
fato de que dois férmions não podem estar no mesmo estado, isto é, |ϕ, ϕi = 0.
Também podemos deduzir as equações (14.222) e (14.223) diretamente das relações de
anticomutação
h i h i
[aα , aβ ]+ = 0; a†α , a†β = 0; aα , a†β = δα,β . (14.224)
+ +
Para o caso de Fermi, não há uma razão a prior para postularmos as relações de anticomutação
acima. Devemos lembrar que para o caso de osciladores harmônicos, que é similar a este,
as correspondentes regras de comutação seguem do procedimento de quantização canônica.
Podemos considerar as relações de anticomutação acima como provenientes dos postulados de
anti-simetrização para férmions.
Retornaremos ao caso geral onde as equações de (14.206) até (14.215) se aplicam. Uma
das vantagens de se deduzir elas em uma forma geral é que não nos restringimos a uma base
particular de estados. Suponha que usemos a base dos autoestados do momentum, |pi . Devido
ao fato de
hp|p0 i = δ (p − p0 )
a(p), a† (p0 ) −ξ = δ (p − p0 ) ,

[a(p), a(p0 )]−ξ = a† (p), a† (p0 ) −ξ = 0.

A partir do estado de vácuo podemos construir outros estados por
|p1 , p2 , . . . , pn i = a† (p1 )a† (p2 ) · · · a† (pn ) |V ácuoi .
Se usarmos uma base de autoestados da posição |xi, então hx|x0 i = δ (x − x0 ),
a(x), a† (x0 ) −ξ = δ (x − x0 ) ,

|x1 , x2 , . . . , xn i = a† (x1 )a† (x2 ) · · · a† (xn ) |V ácuoi .
Se usarmos uma base de energia dos autoestados do átomo de hidrogênio |nlmi, então
a(nlm), a† (n0 l0 m0 ) −ξ = δn,n0 δl,l0 δm,m0 , e assim por diante.

Como fazer os operadores de criação e destruição mudarem quando fazemos uma mudança
de base? Esta questão é facilmente respondida notando que se

|χi = α |ψi + β |ϕi ,
então
a† (χ) = αa† (ψ) + βa† (ϕ)

(14.225)
∗ ∗
a(χ) = α a(ψ) + β a(ϕ).
Isto significa que os operadores de criação se transformam como kets, enquanto os operadores
de destruição se transformam como bras (devido hχ| = α∗ hψ| + β ∗ hϕ|). A equação (14.225) pode
ser rapidamente generalizada em séries infinitas e integrais. Agora por exemplo, se trocarmos a
partir da representação do momentum, tal que
ˆ ˆ
3 d3 x
|pi = d x |xi hx| pi = 3/2
|xi eip·x/~ ,
(2π~)
ˆ ˆ
d3 p
|xi = |pi hp| xi = 3/2
|pi e−ip·x/~ ,
(2π~)
os operadores de criação estão relacionados por
ˆ
d3 x
†
a (p) = 3/2
a† (x) eip·x/~ ,
(2π~)
(14.226)
ˆ 3
dp
a† (x) = 3/2
a† (p) e−ip·x/~ .
(2π~)
Para relacionar os operadores de destruição a(p) e a(x), devemos tomar o Hermitiano adjunto
de (14.226), obtendo:
ˆ
d3 x
a(p) = 3/2
a(x) e−ip·x/~ ,
(2π~)
(14.227)
ˆ 3
dp
a(x) = a(p) eip·x/~ .
(2π~)3/2
Devemos proceder de forma similar para qualquer outra mudança de base. Por exemplo, suponha
que temos um conjunto completo de estados ortonormais |αi, e que as funções de onda destes
seja hx|αi = uα (x), então
ˆ ˆ
3
|αi = d x |xihx|αi = d3 x |xi uα (x)
X X
|xi = |αihα|xi = |αiu†α (x)
α α
logo,

14.12. Operadores de uma-partícula no formalismo da segunda quantização
ˆ
†
a (α) = d3 x a† (x)uα (x)
(14.228)
X
†
†
a (x) = a (α)u†α (x)
α
14.12 Operadores de uma-partícula no formalismo da se-

gunda quantização
Suponha que A(1) é um operador que atua somente em estados de uma partícula. Queremos
encontrar um operador A que represente a soma de A(1) sobre todos os estados de uma partícula.
Isto é, para qualquer estado de n-partículas
|ψi = |ψ1 , ψ2 , . . . , ψn i = |ψ1 i |ψ2 i . . . |ψn i (14.229)
queremos que A|ψi satisfaça,
A|ψi = A(1) |ψ1 i |ψ2 i . . . |ψn i +

|ψ1 i A(1) |ψ2 i . . . |ψn i + · · ·
|ψ1 i |ψ2 i . . . A(1) |ψn i . (14.230)
Para vermos o significado disto, suponhamos que cada |ψi i seja um autoestado de A(1) com
autovalor ai . então a equação (14.230) implica que
A|ψi = (a1 + a2 + . . . + an )|ψi (14.231)
Desejamos encontrar uma maneira geral de determinarmos o operador A. Para isto, con-
sideremos inicialmente o caso especial em que: A(1) = |αihβ|. Neste caso a equação (14.230)
torna-se
A|ψi = hβ|ψ1 i| α, ψ1 , ψ2 , . . . , ψn i +
hβ|ψ2 i| ψ1 , α, ψ3 , . . . , ψn i + · · ·
hβ|ψn i| ψ1 , ψ2 , . . . , ψn−1 , αi. (14.232)
Olhando para a equação (14.214) podemos ver que quando ϕ2 = α e ϕ1 = β temos

n
X
†
a (α)a(β)|ψi = ξ k−1 hβ|ψk i| α, ψ1 , . . . , ψk−1 , ψk+1 , . . . , ψn i (14.233)
k=1
Mas
ξ k−1 | α, ψ1 , . . . , ψk−1 , ψk+1 , . . . , ψn i = |ψ1 , . . . , ψk−1 , α, ψk+1 , . . . , ψn i (14.234)
devido a propriedade de simetria do estado de n-partícula. Usando esta equação na equação

(14.233) e comparando ela com a equação (14.232), encontramos que
A = a† (α)a(β) quando A(1) = |αihβ|. (14.235)
A generalização da equação (14.235) para um operador de uma-partícula A(1) arbitrário é

imediata. Escolhemos uma base completa qualquer de estados de uma-partícula |αi e escrevemos
X X (1)
A(1) = |αihα|A(1) |βihβ| = |αiAα,β hβ|, (14.236)
α,β α,β
onde
(1)
Aα,β = hα|A(1) |βi. (14.237)
Uma base completa tem as seguintes propriedades:
 X


 |αihα| = 1
 α
Base Completa (14.238)



 hα|βi = δα,β .
Devido a linearidade dos operadores e da equação (14.236), podemos ver que
X (1)
A= a† (α) Aα,β a(β) (14.239)
α,β
Para encontrarmos o operador A, basta lembrarmos que ele deve satisfazer a eq. (14.230).
X (1)
Novamente devemos considerar o caso em que A(1) = |αiAα,β hβ|, neste caso a equação
α,β
(14.232) pode ser reescrita como

Xn (1)
A|ψi = |αiAα,β hβ|ψ1 i|ψ2 , ψ3 , . . . , ψn i+ (14.240)
α,β
(1)
|ψ1 i|αiAα,β hβ|ψ2 i|ψ3 , ψ4 , . . . , ψn i + · · ·
o
(1)
|ψ1 , ψ2 , . . . , ψn−1 i|αiAα,β hβ|ψn i . (14.241)
Xn (1)
A|ψi = |αiAα,β hβ|ψ1 i|ψ2 , ψ3 , . . . , ψn i+
α,β
(1)
|ψ1 , αiAα,β hβ|ψ2 i|ψ3 , ψ4 , . . . , ψn i + · · ·
o
(1)
|ψ1 , ψ2 , . . . , ψn−1 , αiAα,β hβ|ψn i .
(1)
considerando que Aα,β |ψi i = ai |Ψi i, então a equação acima pode ser reescrita como
X (1)
A|ψi = a† (α) Aα,β a(β)|ψi (14.242)
α,β
portanto a forma geral para o operador A é
X (1)
X (1)
A= a† (α) Aα,β a(β) quando A(1) = |αi Aα,β hβ| (14.243)
α,β α,β
Para ilustrar o uso deste procedimento, agora iremos escrever alguns operadores como
exemplos do formalismo da segunda quantização, nas seguintes bases completas:
 X


 |αihα| = 1
 α



 hα|βi = δα,β .
 ˆ
d3 x|xihx| = 1






hx|x 0 i = δ (x − x 0 ) .


 ˆ
d3 p |pihp| = 1






hp|p0 i = δ (p − p0 ) .



14.12.1 Operador Número

O operador número que atua sobre os estados de uma partícula é A(1) = 1, enquanto o operador
número que atua sobre os estados de n-partículas é A = N . Desta forma, para a base (14.244),
temos
(1)
Aα,β = hα|A(1) |βi = hα|1|βi = δα,β .
X (1)
X X
A= a† (α) Aα,β a(β) = a† (α) δα,β a(β) = a† (α) a(α) = N
α,β α,β α
(1)
Para verificarmos que o operador A(1) = 1, basta substituirmos Aα,β = δα,β , em (14.243),
assim
X (1)
X X
A(1) = |αi Aα,β hβ| = |αi δα,β hβ| = |αihα| = 1.
α,β α,β α
Agora iremos encontrar o operador A = N , na base das coordenadas (14.245), assim
(1)
Ax,x0 = hx|A(1) |x0 i = hx|1|x0 i = δ (x − x0 )
ˆ ˆ
3 0 (1)
N = dx d3 x |xiAx,x0 hx0 |
ˆ ˆ
3 0
= d3 x a† (x)δ (x − x0 ) a(x0 )
dx
ˆ ˆ
†
= d xa (x) a(x) = d3 xρ (x) ,
3
onde ρ (x) = a† (x) a(x), é o operador densidade de partículas.

De maneira análoga iremos encontrar que o operador A = N , na base do momentum (14.246),
desta forma:
(1)
Ap,p0 = hp|A(1) |p0 i = hp|1|p0 i = δ (p − p0 )
ˆ ˆ ˆ
3 0 (1) 0
N= 3
d p d p |pi Ap,p0 hp | = d3 p a† (p) a(p)
14.12.2 Operador Momentum

O operador momentum que atua sobre os estados de uma partícula é A(1) = p = ~k, enquanto
P
o operador momentum que atua sobre os estados de n-partículas é A = P = pi . Desta forma,
i
para a base dos k (14.244), temos
(1)
Ak,k0 = hk|A(1) |k0 i = hk|~k|k0 i = ~kδk,k0 . (14.247)

X (1)
X (1)
P = |ki Ak,k0 hk0 | = a† (k) Ak,k0 a(k0 )
k,k0 k,k0
X X
= a† (k) ~k δk,k0 a(k0 ) = ~k a† (k)a(k)
k,k0 ~k
Agora iremos usar a base das posições (14.245), assim
(1)
Ax,x 0 = hx|A(1) |x0 i = hx|p|x 0 i
como,
1 1
hx|pi = 3/2
eip·x / ~ e hp|xi = e−ip·x / ~ (14.248)
(2π~) (2π~)3/2
então
ˆ
0
hx|p|x i = hx|p0 ihp0 |p|x0 id3 p0
¨
= hx|p0 ihp0 |p|p00 ihp00 |x0 id3 p0 d3 p00
e usando o fato de que,
b |p0 i = p0 |p0 i
p e hp|p0 i = δ (p − p0 ) ,
b é o operador momentum e p0 é o autovalor do operador p

(onde usamos a seguinte notação, p b
atuando sobre o autoestado |p0 i) podemos escrever,
¨
0
hx|p|x i = hx|p0 i p00 δ (p0 − p00 ) hp00 |x0 i d3 p0 d3 p00
ˆ ˆ
0 0 0 0 3 0 eip·x / ~ 0 0 0 3 0
= hx|p i p hp |x i d p = p hp |x i d p
(2π~)3/2
ˆ ip·x / ~ ˆ
0 e 0 0 3 0 ~ eip·x / ~
= p 3/2
hp |x i d p = ∇ x 3/2
hp0 |x0 i d3 p0
(2π~) i (2π~)
ˆ ˆ
~ 0 0 0 3 0 ~
= ∇x hx|p i hp |x i d p = ∇x hx| |p ihp | d p |x0 i
0 0 3 0
i i
~ ~
= ∇x hx|x0 i = ∇x δ (x − x0 )
i i
Desta forma, temos que:
(1) ~
Ax,x0 = hx|A(1) |x0 i = hx|p|x0 i = ∇x δ (x − x0 ) ,
i
portanto,

ˆ ˆ
(1)
P = d3 x d3 x0 |xi Ax,x0 hx0 |
ˆ ˆ
~
= d3 x d3 x0 a† (x) ∇x δ (x − x0 ) a(x0 )
i
ˆ
~
= d3 x a† (x) ∇x a(x)
i
14.12.3 Operador Energia Cinética

De maneira análoga ao operador momentum, encontraremos que o operador energia cinética
é dado por:
ˆ
~2
T =− d3 x a† (x) ∇2x a(x).
2m
Na representação do momentum temos que
(1)
Ap,p0 = hp|A(1) |p0 i = hp|p|p0 i = p δ (p − p0 )
logo,
ˆ ˆ ˆ
3 0 (1) 0
P= 3
d p d p |pi Ap,p0 hp | = d3 p p a† (p) a(p)
e o operador energia cinética de forma análoga pode ser escrito como

ˆ
1
T = d3 p p 2 a† (p) a(p)
2m
14.12.4 Operador Energia Potencial

O operador energia potencial que atua sobre os estados de uma partícula é A(1) = v(x), enquanto
P
o operador energia potencial que atua sobre os estados de n-partículas é A = V = v(xi ).
i
Desta forma, para a base dos x (14.245), temos
(1)
Ax,x0 = hx|A(1) |x0 i = hx|v(x)|x0 i = v(x) δ (x − x0 )
ˆ ˆ
(1)
V = d3 x d3 x0 |xi Ax,x0 hx0 | (14.249)
ˆ ˆ
= d3 x d3 x0 |xi v(x) δ (x − x0 ) hx0 |
ˆ ˆ
†
= d x a (x) v(x) a(x) = d3 x v(x) ρ(x) .
3
Esta é a expressão para a energia potencial na representação das coordenadas. Agora iremos
encontrar a uma expressão na representação do momentum, e para isto:

(1)
Ak,k0 = hk|A(1) |k0 i = hk|v(x)|k0 i
ˆ ˆ
= d3 x d3 x0 hk |xi hx| v(x) |x0 i hx0 | k0 i
ˆ ˆ
= d3 x d3 x0 hk |xi v(x) δ (x − x0 ) hx0 | k0 i
ˆ
= d3 x v(x) hk |xi hx| k0 i.
Como,
1 1 0
hk |xi = √ e−ik·x , então, hx| k0 i = √ eik ·x ,
Ω Ω
assim,
ˆ
(1) 1 0
Ak,k0 = d3 x v(x) e−i(k−k )·x = Ṽ (k − k0 ).
Ω
Desta forma temos que:
X (1)
X
V = |ki Ak,k0 hk0 | = a†k Ṽ (k − k0 ) ak0
k,k0 k,k0
chamando q = k − k0 , temos que,
X
V = Ṽ (q) a†k+q ak
k,q
Na representação do momentum temos: p, p0 k, k0
(1)
Ap,p0 = hp|A(1) |p0 i = hp|v(x)|p0 i
ˆ ˆ
= d3 x d3 x0 hp |xi hx| v(x) |x0 i hx0 | p0 i
ˆ ˆ
= d3 x d3 x0 hp |xi v(x) δ (x − x0 ) hx0 | p0 i
ˆ
= d3 x v(x) hp |xi hx| p0 i.
Usando a expressão (14.248) para a representação do momentum na representação da posição e

vic-versa, podemos escrever a equação acima como
ˆ
(1) 1 0
Ap,p0 = d3 x v(x) e−i(p−p )·x = Ṽ (p − p0 ).
(2π~)3
ˆ ˆ
(1)
V = d3 p d3 p0 |pi Ap,p0 hp0 |
ˆ ˆ
= d3 p d3 p0 Ṽ (p − p0 ) a† (p) a(p)

chamando q = p − p0 , então
ˆ ˆ
V = d3 p d3 q Ṽ (q) a† (p + q) a(p).
O termo Ṽ (q) a† (p + q) a(p) aniquila uma partícula de momento p e recria ele com um
momento p + q, onde Ṽ (q) é a amplitude deste processo vir a ocorrer.
Suponhamos que a Hamiltoniana para uma única partícula seja,
p2
H (1) =
+ V (x) , (14.250)
2m
portanto na representação das coordenadas temos que
ˆ
∇2

3 †
H= d x a (x) − + v(x) a(x) (14.251)
2m
e na representação do momentum temos
ˆ ˆ ˆ
p2 †
H= 3
dp a (p) a(p) + d3 p d3 q Ṽ (q) a† (p + q) a(p). (14.252)
2m
Agora, se usarmos uma base de autoestados |αi de H (1) , de tal modo que
hα| H (1) |βi = Eα δα,β
então,
X
H= Eα a†α aα , (14.253)
α
a qual é a Hamiltoniana que temos para fônons com Eα = ~ωα .

Todas estas expressões para H podem ser deduzidas umas das outras usando as equações
(14.227) e (14.228) as quais relacionam a† (x) e a† (p). Mas muitas vezes é mais simples obtermos
tais expressões diretamente da Hamiltoniana de uma partícula, como fizemos nesta seção.
A densidade de partículas (isto é, o número por unidade de volume) no ponto x dada pelo
operador
ρ (x) = a† (x) a(x) (14.254)
(o qual corresponde ao operador de uma partícula |xi hx|). Portanto o operador número de
partículas pode ser escrito como
ˆ
N= d3 x ρ (x)
e da mesma forma a energia potencial (14.249) pode ser escrita como

ˆ
V = d3 x v(x) ρ (x) .
Esta última equação representa a integral da energia potencial mediada pela densidade.

Referências Bibliográficas
[1] Mark J. Ablowitz and Athanssios S. Fokas. Complex Variables: Introduction and Applicati-
ons. Cambridge Texts in Applied Mathematics. Cambridge University Press, 1997.
[2] George Brown Arfken. Mathematical Methods for Physicists. Academic Press, Inc, 3 edition,
1985.
[3] Neil W. Ashcroft and N. David Mermin. Solid State Physics. Saunders College, Philadelphia,
1976.
[4] Geraldo Severo de Souza Ávila. Variáeis complexas e aplicações. LTC, Rio de Janeiro (RJ,
3 edition, 2008.
[5] Supriyo Bandyopadhyay and Marc Cahay. An Introduction to Spintronics. CRC Press INC,
2008.
[6] Ruel Vance Churchill. Variáveis Complexas e suas Aplicações. McGraw-Hill, 1975.
[7] Claude Cohen-Tannoudji, Bernard Diu, and Frank Laloe. Quantum Mechanics (2 Vol. Set).
Wiley-Interscience, 2006.
[8] Diego Dalvit, Peter Milonni, David Roberts, and Felipe Rosa, editors. Casimir Physics,
volume 834 of Lecture Notes in Physics. Springer-Verlag, June 2011. doi:10.1007/
978-3-642-20288-9.
[9] C. G. Darwin. The wave equations of the electron. Proceedings of the Royal Society of
London. Series A, Containing Papers of a Mathematical and Physical Character, 118(780):pp.
654–680, 1928. URL: http://www.jstor.org/stable/94929.
[10] Richard P. Feynman. Statistical Mechanics (Frontiers in Physics). Perseus Books, 1964.
[11] Walter Greiner. Classical Electrodynamics. Theoretical Physics. Springer-Verlag, first

edition, 1998.
[12] Walter Greiner Joachim Reinhardt. Field Quantization. Theoretical Physics. Springer-
Verlag, first edition, 1996.
[13] Walter Greiner Joachim Reinhardt. Quantum Electrodynamics. Theoretical Physics.

Springer-Verlag, third edition, 2003.
[14] Walter Greiner. Quantum Mechanics: Special Chapters. Theoretical Physics. Springer-
Verlag, first edition, 1998.
[15] David Jeffrey Griffiths. Eletrodinâmica. Pearson Addison Wesley Brasil, 3 edition, 2011.
[16] David Jeffrey Griffiths. Mecânica Quântica. Pearson Addison Wesley Brasil, 2 edition,
2011.

[17] Giuseppe Grosso and Giuseppe Pastori Parravicini. Solid state physics. Academic Press,
San Diego, 2000.
[18] Hartmut Haug and Stephan W. Koch. Quantum Theory Of The Optical And Electronic
Properties Of Semiconductors. World Scientific, Singapore River Edge, NJ, 4 edition, 2004.
[19] C. Itzykson and J.-B. Zuber. Quantum Field Theory. McGraw-Hill, 1980.
[20] John David Jackson. Classical Electrodynamics. John Wiley & Sons, Inc., 3rd ed. edition,
1999.
[21] H. Kragh. Photon: New light on an old name. ArXiv e-prints, January 2014. arXiv:
1401.0293.
[22] Lev Davídovitch Landau and L. M. Lifshitz. Quantum Mechanics, Third Edition:
Non-Relativistic Theory (Volume 3). Butterworth-Heinemann, 1981. URL: http://www.
amazon.com/Quantum-Mechanics-Third-Edition-Non-Relativistic/dp/0750635398%
3FSubscriptionId%3D0JYN1NVW651KCA56C102%26tag%3Dtechkie-20%26linkCode%
3Dxm2%26camp%3D2025%26creative%3D165953%26creativeASIN%3D0750635398.
[23] A. N. Matveev. Electricidad y magnetism. Editorial Mir, 1988.
[24] David H. McIntyre. Quantum Mechanics. Pearson Education, Limited, 2012.
[25] Peter W. Milonni. The Quantum Vacuum: An Introduction to Quantum Electrodynamics.

Academic Press, 1 edition, November 1993. URL: http://www.amazon.com/exec/obidos/
ASIN/0124980805/wwwcampusboocom587-20.
[26] Kimball A. Milton. The Casimir Effect: Physical Manifestations of Zero-Point Energy.
World Scientific Pub Co Inc, October 2001.
[27] Herch Moysés Nussenzveig. Física Básica: Eletromagnetismo, volume 3. Editora Edgard
Blücher, 1 edition, 1997.
[28] Shaul Mukamel. Principles of Nonlinear Optical Spectroscopy. Number 6 in Oxford series
in Optical and Imaging Sciences. Oxford University Press, New York u.a, 1995.
[29] Leslie L. Foldy and Siegfried A. Wouthuysen. On the dirac theory of spin 1/2 particles and
its non-relativistic limit. Phys. Rev., 78:29–36, Apr 1950. doi:10.1103/PhysRev.78.29.
[30] Edward Mills Purcell and David J. Morin. Electricity and Magnetism. Cambridge University
Press, 3 edition, 2013.
[31] John R. Reitz, Frederick J. Milford, and Robert W. Christy. Fundamentos da teoria
eletromagnética. Editora Campus, 3 edition, 1982.
[32] M. E. Rose. Relativistic Electron Theory. John Wiley, 1961.

[33] Jun John Sakurai. Advanced Quantum Mechanics. Addison-Wesley Series in Advanced
Physics. Addison Wesley PublAddison Wesley, Inc., 1987.
[34] Franz Schwabl. Advanced Quantum Mechanics. Springer-Verlag, 1999.
[35] R. Shankar. Principles Of Quantum Mechanics. Springer, 2nd edition, 1994.
[36] Paul Strange. Relativistic Quantum Mechanics: With Applications in Condensed Matter
and Atomic Physics. Cambridge University Press, 1998.
[37] Sin-Itiro Tomonaga. The story of spin. The University of Chicago Press, Ltd., London,
1997.
[38] John S. Townsend. A Modern Approach To Quantum Mechanics. University Science Books,
2 edition, 2000.
Introduction to Tensor Calculus for General relativity. MIT. URL: http://gen.lib.rus.
ec/book/index.php?md5=39972FE5814E97D719E56C560C0D966C.
[39] Bretislav Friedrich and Dudley Herschbach. Stern and gerlach: How a bad cigar helped
reorient atomic physics. Physics Today, pages 53–59, 12 2003. Um excelente artigo que
conta a historia real do experimento de Stern-Gerlach.
[40] Samuel Abraham Goudsmit. The discovery of the electron spin. Electronic, 1971. URL:
http://lorentz.leidenuniv.nl/history/spin/goudsmit.html.
[41] Andreas Trabesinger. Physics is set spinning. Nature, 3 2008.
[42] Nature milestones spin. http://www.nature.com/milestones/milespin/index.html, 2008.

The Milestones are a series of specially written articles, highlighting the most influential
discoveries in the field of ’spin’ since 1896. Nature Milestones in Spin also includes a
Collection of relevant articles and an online-only Library of papers and reviews from
Nature Publishing Group. This seris has a free access. URL: http://www.nature.com/
milestones/milespin/index.html.
[43] P. A. M. Dirac. The quantum theory of the electron. part ii. Proceedings of the Royal
Society A: Mathematical, Physical and Engineering Sciences, 118(779):351–361, Mar 1928.
URL: http://dx.doi.org/10.1098/rspa.1928.0056, doi:10.1098/rspa.1928.0056.
[44] P. A. M. Dirac. The quantum theory of the electron. Proceedings of the Royal Society
A: Mathematical, Physical and Engineering Sciences, 117(778):610–624, Feb 1928. URL:
http://dx.doi.org/10.1098/rspa.1928.0023, doi:10.1098/rspa.1928.0023.
[45] P. A. M. Dirac. The quantum theory of the emission and absorption of radiation. Proceedings
of the Royal Society A: Mathematical, Physical and Engineering Sciences, 114(767):243–
265, Mar 1927. URL: http://dx.doi.org/10.1098/rspa.1927.0039, doi:10.1098/rspa.
1927.0039.

Mecanica Quantica II

Enviado por

Dados do documento

Descrição original:

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Mecanica Quantica II

Enviado por

Direitos autorais:

Formatos disponíveis

NOTAS DE AULAS

Prof.: Dr. Salviano A. Leão

Goiânia 29 de outubro de 2018

3 Adição de Momenta Angulares 23

Prof. Salviano A. Leão ii

3.10.2 Relações de Recorrência . . . . . . . . . . . . . . . . . . . . . . . . . . . 59

5 Teoria de Perturbação Independente do Tempo 77

Prof. Salviano A. Leão iii

5.4.3 Potencial perturbativo de ordem X 3 . . . . . . . . . . . . . . . . . . . . 96

6 A Estrutura Fina e Hiperfina do Átomo de Hidrogênio 117

Prof. Salviano A. Leão iv

6.8.2 O Wf não conecta as subcamadas 2s com as 2p . . . . . . . . . . . . . . 140

7 Teoria de Perturbação Dependente do Tempo 167

Prof. Salviano A. Leão v

7.7 Representação de Schrödinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179

8 Decaimento de um estado discreto acoplado ressonantemente a um contínuo

9 Quantização do Campo Eletromagnético 215

Prof. Salviano A. Leão vi

9.5 Equações de onda para o espaço livre . . . . . . . . . . . . . . . . . . . . . . . . 221

10 Hamiltoniano de Interação 241

Prof. Salviano A. Leão vii

12 Espalhamento por um potencial central: Método das ondas parciais 289

Prof. Salviano A. Leão viii

13 Método das Funções de Green: Resolvente 303

14 Sistema de Partículas Indistinguíveis 321

Prof. Salviano A. Leão ix

14.5 Construção de kets físicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338

Prof. Salviano A. Leão x

1.1 O que é um Spin?

Propriedade Símbolo Valor Unidade

Solution 1.2. O momentum angular é dado por:

na qual vs é a velocidade superficial do elétron e re é o raio clássico do elétron ou raio de Lorentz

1.1.1 Natureza Quântica do Spin

Prof. Salviano A. Leão 2

a qual corresponde a cada um dos possíveis valores de mL para um dado l.

Prof. Salviano A. Leão 3

1.1.1.1 Sistema de partículas

1.2 Momentum angular intrínseco: spin

Esta propriedade das partículas elementares é especificamente de natureza quântica (ela

Prof. Salviano A. Leão 4

• O spin de uma partícula, é medido como o momentum angular orbital, em unidades de ~

• Para partículas possuidoras de spin, a descrição do estado mediante a função de onda

1.3 Evidências experimentais do spin do elétron

• As propriedades magnéticas de inúmeras substâncias, particularmente os metais ferromag-

• A estrutura fina das linhas espectrais na física atômica.

• O experimento de Stern-Gerlach [37, 39, 41, 42]. A experiência de Stern-Gerlach foi

1.4 Descrição quântica: os postulados de Pauli

Prof. Salviano A. Leão 5

i) O operador de spin S é um momentum angular intrínseco, e portanto, satisfaz a mesma

[Sx , Sy ] = i~Sz ; [Sz , Sx ] = i~Sy ; [Sy , Sz ] = i~Sx . (1.6)

[Sα , Sβ ] = i~α,β,γ Sγ com α, β, γ = x, y, z. (1.7)

Prof. Salviano A. Leão 6

ii) Os operadores de spin atuam atuam em um novo espaço, o espaço de estados Es , no

S2 |s, mi = s(s + 1)~2 |s, mi (1.8)

De acordo com a teoria do momentum angular, desenvolvida anteriormente, sambemos

iii) O espaço de estados E da partícula em questão é dado pelo produto tensorial de Er

1.5 Partículas de spin s = 1/2: propriedades especiais

e vale também a completeza

Prof. Salviano A. Leão 7

O estado de spin mais geral é descrito por um vetor arbitrário de Es

|χi = c+ |+i + c− |−i , (1.14)

em que c+ e c− são números complexos.

sobre os vetores da base |+i e |−i é dada por

[Sα , Sβ ] = i~α,β,γ Sγ com α, β, γ = x, y, z. (1.7)

[σx , σy ] = 2iσz ou [σα , σβ ] = α,β,γ 2iσγ (1.23)

em que α,β,γ é o tensor de Levi-Civita. Temos ainda que

σα σβ = iα,β,γ σγ + δα,β I. (1.25)

[Sx , Sy ] = i~Sz ou [Sα , Sβ ] = i~Sγ α,β,γ (1.32)