Você está na página 1de 398

NOTAS DE AULAS

MECÂNICA QUÂNTICA II

Prof.: Dr. Salviano A. Leão

Goiânia 29 de outubro de 2018


Sumário

Capa . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 0
Sumário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . i

1 Spin 1
1.1 O que é um Spin? . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 1
1.1.1 Natureza Quântica do Spin . . . . . . . . . . . . . . . . . . . . . . . . . 2
1.1.1.1 Sistema de partículas . . . . . . . . . . . . . . . . . . . . . . . . 4
1.2 Momentum angular intrínseco: spin . . . . . . . . . . . . . . . . . . . . . . . . . 4
1.3 Evidências experimentais do spin do elétron . . . . . . . . . . . . . . . . . . . . 5
1.4 Descrição quântica: os postulados de Pauli . . . . . . . . . . . . . . . . . . . . . 5
1.4.1 Postulados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.5 Partículas de spin s = 1/2: propriedades especiais . . . . . . . . . . . . . . . . . 7
1.5.1 Matrizes de Pauli . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 8
1.5.2 Propriedades do operador de spin S . . . . . . . . . . . . . . . . . . . . . 9
1.6 Partícula de spin 1/2: Descrição não-relativística . . . . . . . . . . . . . . . . . . 10
1.6.1 Observáveis e vetores de estado . . . . . . . . . . . . . . . . . . . . . . . 10
1.6.2 Representação {|r, εi} . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10
1.6.3 Operadores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6.3.1 Operadores de spin . . . . . . . . . . . . . . . . . . . . . . . . . 12
1.6.3.2 Operadores Orbitais . . . . . . . . . . . . . . . . . . . . . . . . 13
1.6.3.3 Operadores mistos . . . . . . . . . . . . . . . . . . . . . . . . . 14
1.7 Cálculo de probabilidades de uma medição física . . . . . . . . . . . . . . . . . . 15
1.7.1 Medindo a componente Sx . . . . . . . . . . . . . . . . . . . . . . . . . . 15

2 Spin - Rotação 17
2.1 Operadores de rotação para uma partícula de spin 1/2 . . . . . . . . . . . . . . . 17
2.1.1 Momentum angular total . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.2 Produto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 17
2.1.3 Rotação do estado de spin . . . . . . . . . . . . . . . . . . . . . . . . . . 18
2.1.4 Operador associado com uma rotação de 2π . . . . . . . . . . . . . . . . 18
2.1.5 Natureza vetorial versus rotação . . . . . . . . . . . . . . . . . . . . . . . 20
2.1.6 Rotação de um spinor com duas componentes . . . . . . . . . . . . . . . 21

i
Sumário

3 Adição de Momenta Angulares 23


3.1 Adição de Momenta Angulares: Caso clássico . . . . . . . . . . . . . . . . . . . 23
3.1.1 Lei Fundamental da Dinâmica das Rotações . . . . . . . . . . . . . . . . 25
3.1.2 Conservação do Momentum Angular: Simetrias e as leis de conservação . 27
3.2 Momentum Angular Na Mecânica Quântica . . . . . . . . . . . . . . . . . . . . 28
3.2.1 Considerações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 29
3.2.2 Momentum angular total de duas partículas . . . . . . . . . . . . . . . . 30
3.2.3 Base em termos de Jz e J2 . . . . . . . . . . . . . . . . . . . . . . . . . . 31
3.3 Adição de dois Spin 1/2: Método elementar . . . . . . . . . . . . . . . . . . . . 31
3.3.1 Formulação do problema: Espaço de estados . . . . . . . . . . . . . . . . 31
3.3.2 O Espaço de Estados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 32
3.3.3 O Spin Total S: Relações de comutação . . . . . . . . . . . . . . . . . . 32
3.3.4 Mudança de base a ser realizada . . . . . . . . . . . . . . . . . . . . . . . 34
3.3.5 Os autovalores de Sz e o seus graus de degenerescência . . . . . . . . . . 35
3.3.6 Diagonalização de S2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
2
3.3.6.1 Cálculo dos elementos de matriz de S . . . . . . . . . . . . . . 36
2
3.3.6.2 Matriz S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 36
3.3.6.3 Autovalores e autovetores de S2 . . . . . . . . . . . . . . . . . . 37
3.3.7 Resultado: estados tripletos e singletos . . . . . . . . . . . . . . . . . . . 39
3.3.8 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
3.4 Revisão da teoria do momentum angular . . . . . . . . . . . . . . . . . . . . . . 40
3.5 Propriedades do subespaço E(k, j) . . . . . . . . . . . . . . . . . . . . . . . . . . 40
3.6 Espaço de estados de dois momenta angulares . . . . . . . . . . . . . . . . . . . 40
3.6.1 Momentum angular total: Relações de comutação . . . . . . . . . . . . . 41
3.6.2 Mudança de base a ser realizada . . . . . . . . . . . . . . . . . . . . . . . 43
2
3.7 Autovalores de J e Jz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
3.7.1 Caso especial: Dois spins 1/2 . . . . . . . . . . . . . . . . . . . . . . . . 45
3.7.2 Autovalores de Jz e o seu grau de degenerescência . . . . . . . . . . . . . 46
3.7.3 Degenerescência de Jz . . . . . . . . . . . . . . . . . . . . . . . . . . . . 46
3.7.4 Autovalores de J 2 : primeira forma . . . . . . . . . . . . . . . . . . . . . 48
2
3.7.5 Autovalores de J : segunda forma . . . . . . . . . . . . . . . . . . . . . . 49
3.8 Autovetores comuns de J2 e Jz . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
3.8.1 Caso especial spin 1/2 . . . . . . . . . . . . . . . . . . . . . . . . . . . . 51
3.8.2 Duas partículas de spin 1/2: O subespaço E(S = 1) . . . . . . . . . . . . 51
3.8.3 O estado |S = 0, M = 0i . . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.9 Caso geral, com j1 e j2 arbitrários . . . . . . . . . . . . . . . . . . . . . . . . . . 52
3.9.1 O subespaço E(J = j1 + j2 ) . . . . . . . . . . . . . . . . . . . . . . . . . 53
3.9.2 Os outros subespaços E(j) . . . . . . . . . . . . . . . . . . . . . . . . . . 54
3.10 Coeficientes de Clebsch-Gordan . . . . . . . . . . . . . . . . . . . . . . . . . . . 57
3.10.1 Relações de Ortogonalidade . . . . . . . . . . . . . . . . . . . . . . . . . 58

Prof. Salviano A. Leão ii


Sumário

3.10.2 Relações de Recorrência . . . . . . . . . . . . . . . . . . . . . . . . . . . 59


3.10.3 Convenção de Fase . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61
3.10.4 Os coeficientes hj1 , j2 ; m1 , m2 | J, Ji: fase do ket |J, Ji . . . . . . . . . . . 61
3.10.5 Outros Coeficientes de Clebsch-Gordan . . . . . . . . . . . . . . . . . . . 62
3.10.6 Algumas relações úteis . . . . . . . . . . . . . . . . . . . . . . . . . . . . 62
3.10.6.1 Os Sinais de alguns coeficientes . . . . . . . . . . . . . . . . . . 62
3.10.6.2 Mudança de ordem de j1 e j2 . . . . . . . . . . . . . . . . . . . 63

4 Teorema de Wigner-Eckart 65
4.1 Operadores escalares . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.2 Operadores vetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
4.2.1 Definição dos operadores vetores . . . . . . . . . . . . . . . . . . . . . . . 66
4.3 O teorema de Wigner-Eckart para operadores vetores . . . . . . . . . . . . . . . 67
4.3.1 Elementos de matriz não-nulos de V na base padrão . . . . . . . . . . . 67
4.3.2 Proporcionalidade entre os elementos de matriz J e V dentro de um
subespaço E(k, j) . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 68
4.3.2.1 Elementos de matriz de V+ e V− . . . . . . . . . . . . . . . . . 68
4.3.2.2 Elementos de matriz de Vz . . . . . . . . . . . . . . . . . . . . . 69
4.3.2.3 Generalização para uma componente arbitrária de V . . . . . . 70
4.3.2.4 Cálculo da constante de proporcionalidade: O teorema da projeção 70
4.3.2.5 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . 71
4.4 Aplicação: Cálculo do fator de Landé gj de um nível atômico . . . . . . . . . . . 72
4.4.1 Degenerescência rotacional: Multípletos . . . . . . . . . . . . . . . . . . . 73
4.4.2 Remoção da degenerescência por um campo magnético . . . . . . . . . . 73

5 Teoria de Perturbação Independente do Tempo 77


5.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77
5.2 Método de Rayleigh-Schrödinger: Formulação do Problema . . . . . . . . . . . . 78
5.2.1 Autovetores . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 81
5.3 Correções para um nível não-degenerado . . . . . . . . . . . . . . . . . . . . . . 82
5.3.1 Correção de primeira ordem . . . . . . . . . . . . . . . . . . . . . . . . . 83
5.3.1.1 Correção em primeira ordem na energia . . . . . . . . . . . . . 83
5.3.1.2 Correção em primeira ordem do autovetor . . . . . . . . . . . . 84
5.3.2 Correção de Segunda Ordem: energia . . . . . . . . . . . . . . . . . . . . 86
5.3.3 Correção de Segunda Ordem: autovetor . . . . . . . . . . . . . . . . . . . 88
(2)
5.3.4 Limite superior de En . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
5.4 Aplicações . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 92
5.4.1 Oscilador harmônico com perturbação linear: V (X) = ~ωX . . . . . . . 92
5.4.1.1 Solução exata . . . . . . . . . . . . . . . . . . . . . . . . . . . . 93
5.4.1.2 Solução perturbativa . . . . . . . . . . . . . . . . . . . . . . . . 94
5.4.2 Potencial perturbativo quadrático . . . . . . . . . . . . . . . . . . . . . . 95

Prof. Salviano A. Leão iii


Sumário

5.4.3 Potencial perturbativo de ordem X 3 . . . . . . . . . . . . . . . . . . . . 96


5.5 O Caso de Autovalores Degenerados . . . . . . . . . . . . . . . . . . . . . . . . . 97
5.6 Teoria de Perturbação de Wigner-Brillouin . . . . . . . . . . . . . . . . . . . . . 99
5.7 O método variacional . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 102
5.7.1 Propriedades do estado fundamental do sistema . . . . . . . . . . . . . . 103
5.7.2 Generalização: O teorema de Ritz . . . . . . . . . . . . . . . . . . . . . . 103
5.7.3 Exemplo: oscilador harmônico unidimensional . . . . . . . . . . . . . . . 104
5.7.3.1 Estado fundamental . . . . . . . . . . . . . . . . . . . . . . . . 104
5.7.3.2 Primeiro estado excitado . . . . . . . . . . . . . . . . . . . . . . 107
5.7.3.3 Estado fundamental: Funções de onda racionais . . . . . . . . . 108
5.7.4 Átomo de Hélio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 110

6 A Estrutura Fina e Hiperfina do Átomo de Hidrogênio 117


6.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 117
6.2 O Hamiltoniano não perturbado . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
6.3 Correções adicionais ao hamiltoniano do átomo de hidrogênio . . . . . . . . . . . 120
6.3.1 O Hamiltoniano da estrutura fina . . . . . . . . . . . . . . . . . . . . . . 120
6.4 Interpretação dos vários termos do hamiltoniano H . . . . . . . . . . . . . . . . 120
6.4.1 Termo Wmv da variação da massa com a velocidade . . . . . . . . . . . . 121
6.4.2 Termo Wso : Acoplamento spin-órbita . . . . . . . . . . . . . . . . . . . . 121
6.4.3 O termo de Darwin . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 123
6.4.4 Hamiltoniano da estrutura fina . . . . . . . . . . . . . . . . . . . . . . . 127
6.5 A interação hiperfina . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 127
6.5.1 O spin do próton e seu momento magnético . . . . . . . . . . . . . . . . 128
6.5.2 O hamiltoniano magnético hiperfino . . . . . . . . . . . . . . . . . . . . . 129
6.5.3 Forma detalhada do hamiltoniano hiperfino . . . . . . . . . . . . . . . . 130
6.5.4 Acoplamento do momento magnético do próton com momentum angular
orbital do elétron . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 130
6.5.5 Acoplamento com o spin do elétron . . . . . . . . . . . . . . . . . . . . . 133
6.5.6 Campo magnético associado ao próton . . . . . . . . . . . . . . . . . . . 133
6.5.7 Termo de dipolo magnético . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.5.8 Termo de contato de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . 136
6.6 O hamiltoniano completo da estrutura hiperfina . . . . . . . . . . . . . . . . . . 137
6.6.1 Interpretação dos vários termos de Whf . . . . . . . . . . . . . . . . . . . 137
6.6.2 Ordem de magnitude de Whf . . . . . . . . . . . . . . . . . . . . . . . . 138
6.7 A estrutura fina do nível n = 2 . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
6.7.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
6.7.1.1 Degenerescência do nível n = 2 . . . . . . . . . . . . . . . . . . 139
6.7.2 O hamiltoniano perturbativo . . . . . . . . . . . . . . . . . . . . . . . . . 139
6.8 Representação matricial da estrutura fina Wf no nível n = 2 . . . . . . . . . . . 140
6.8.1 O Wf não atua nas variáveis de spin do próton . . . . . . . . . . . . . . . 140

Prof. Salviano A. Leão iv


Sumário

6.8.2 O Wf não conecta as subcamadas 2s com as 2p . . . . . . . . . . . . . . 140


6.8.3 Representação matricial de Wf na subcamada 2s . . . . . . . . . . . . . 142
6.8.4 Representação matricial de Wf na subcamada 2p . . . . . . . . . . . . . 142
6.8.4.1 Termos Wmv e WD . . . . . . . . . . . . . . . . . . . . . . . . . 142
6.8.4.2 Termo Wso . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 143
6.9 Resultados: A estrutura fina do nível n = 2. . . . . . . . . . . . . . . . . . . . . 144
6.9.1 Notação espectroscópica . . . . . . . . . . . . . . . . . . . . . . . . . . . 144
6.9.2 Posição dos níveis 2s1/2 ; 2p1/2 ; 2p3/2 . . . . . . . . . . . . . . . . . . . . 145
6.10 A estrutura hiperfina do nível n = 1 . . . . . . . . . . . . . . . . . . . . . . . . . 146
6.10.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . 146
6.10.1.1 A degenerescência do nível 1s . . . . . . . . . . . . . . . . . . . 146
6.10.1.2 O nível 1s não possui estrutura fina . . . . . . . . . . . . . . . . 147
6.10.2 Representação matricial de Whf no nível 1s . . . . . . . . . . . . . . . . 147
6.10.2.1 O termo de contato WD . . . . . . . . . . . . . . . . . . . . . . 147
6.10.3 Autoestados e autovalores do termo de contato . . . . . . . . . . . . . . 148
6.10.4 Estrutura hiperfina do nível 1s . . . . . . . . . . . . . . . . . . . . . . . 149
6.10.5 A importância da estrutura hiperfina do nível 1s . . . . . . . . . . . . . . 151
6.11 Efeito Zeeman da estrutura hiperfina do estado fundamental 1s . . . . . . . . . 151
6.11.1 A perturbação vista pelo nível 1s . . . . . . . . . . . . . . . . . . . . . . 152
6.11.2 Diferentes domínios de intensidade do campo magnético . . . . . . . . . 153
6.11.3 Efeito Zeeman no regime de campos fracos . . . . . . . . . . . . . . . . . 153
6.11.4 Representação matricial de Sz na base {|F ; mF i} . . . . . . . . . . . . . 153
6.11.5 Campo fraco: Autoestados e autovalores . . . . . . . . . . . . . . . . . . 155
6.11.6 A frequência de Bohr e as evoluções de hF i e hSi . . . . . . . . . . . . . 156
6.11.7 Efeito do campo magnético forte . . . . . . . . . . . . . . . . . . . . . . 158
6.11.7.1 Efeitos do termo hiperfino Whf considerado como uma perturbação159
6.11.8 A frequência de Bohr envolvida na evolução de Sz . . . . . . . . . . . . . 161
6.12 Efeito Stark . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 162
6.12.1 Efeito Stark no nível 1s . . . . . . . . . . . . . . . . . . . . . . . . . . . 163
6.12.2 Polarizabilidade do estado 1s . . . . . . . . . . . . . . . . . . . . . . . . 163
6.12.3 Efeito Stark para o nível n = 2 . . . . . . . . . . . . . . . . . . . . . . . 164

7 Teoria de Perturbação Dependente do Tempo 167


7.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 167
7.2 Probabilidade de transição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 169
7.2.1 Separando as contribuições temporais . . . . . . . . . . . . . . . . . . . . 170
7.3 Equações perturbativas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 171
7.3.1 Função de onda . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 172
7.4 Probabilidade de transição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 173
7.5 Perturbação súbita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 175
7.6 Perturbação adiabática . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 176

Prof. Salviano A. Leão v


Sumário

7.7 Representação de Schrödinger . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179


7.8 Representação de Heisenberg . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
7.9 Representação de interação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 180
7.10 Caso especial: Perturbação constante ou senoidal . . . . . . . . . . . . . . . . . 181
7.11 Perturbação senoidal acoplando dois estados discretos: o fenômeno da ressonância183
7.11.1 Relação de incerteza Energia-Tempo e a largura de linha da ressonância . 186
7.12 Limites do cálculo de primeira-ordem . . . . . . . . . . . . . . . . . . . . . . . . 187
7.13 Sistema de dois níveis discretos . . . . . . . . . . . . . . . . . . . . . . . . . . . 187
7.13.1 Condição de ressonância . . . . . . . . . . . . . . . . . . . . . . . . . . . 188
7.13.2 Evolução temporal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 190
7.13.3 Aproximação secular . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 192
7.14 Acoplamento com o contínuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 193
7.15 Integração sobre um contínuo de estados finais: Densidade de Estados . . . . . . 194
7.16 Caso geral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 195
7.17 Regra de ouro de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 196
7.18 Função delta de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 197
7.19 Perturbação constante: condições . . . . . . . . . . . . . . . . . . . . . . . . . . 197
7.20 Regra de ouro de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
7.21 Perturbação Senoidal . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 198
7.22 Exemplo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199

8 Decaimento de um estado discreto acoplado ressonantemente a um contínuo


de estados finais 201
8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 201
8.2 Descrição do modelo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 202
8.2.1 Hipóteses sobre o acoplamento W . . . . . . . . . . . . . . . . . . . . . . 203
8.2.2 Resultados da teoria de perturbação de primeira ordem . . . . . . . . . . 203
8.2.3 Equação Integro-diferencial equivalente à Equação de Schrödinger . . . . 205
8.3 Aproximação para tempos curtos: Relação com a teoria de perturbação em
primeira ordem . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 207
8.4 Segunda aproximação para resolver a equação de Schrödinger . . . . . . . . . . . 208
8.5 Análise dos resultados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 210
8.5.1 Tempo de vida do estado discreto . . . . . . . . . . . . . . . . . . . . . . 210
8.6 O deslocamento discreto do estado devido ao acoplamento com o contínuo . . . 211
8.7 Distribuição de energia dos estados finais . . . . . . . . . . . . . . . . . . . . . . 212

9 Quantização do Campo Eletromagnético 215


9.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
9.2 Equações de Maxwell . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 215
9.3 Potenciais vetor e escalar – Invariância de calibre . . . . . . . . . . . . . . . . . 217
9.4 Transformações de Calibre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 218

Prof. Salviano A. Leão vi


Sumário

9.5 Equações de onda para o espaço livre . . . . . . . . . . . . . . . . . . . . . . . . 221


9.6 Quantização do campo eletromagnético . . . . . . . . . . . . . . . . . . . . . . . 225
9.7 A energia do vácuo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 228
9.8 Operadores criação e aniquilação . . . . . . . . . . . . . . . . . . . . . . . . . . 229
9.9 A energia de ponto zero é real? . . . . . . . . . . . . . . . . . . . . . . . . . . . 229
9.10 Propriedades dos fótons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 232
9.11 Operador Momentum do campo e dos fótons . . . . . . . . . . . . . . . . . . . . 233
9.11.1 Polarização do fóton . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 236
9.12 Flutuações e relações de incerteza . . . . . . . . . . . . . . . . . . . . . . . . . . 238

10 Hamiltoniano de Interação 241


10.1 Onda Plana Eletromagnética . . . . . . . . . . . . . . . . . . . . . . . . . . . . 241
10.1.1 Campos E e B . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
10.1.2 Vetor de Poynting S . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 242
10.2 Hamiltoniano de interação para baixas intensidades . . . . . . . . . . . . . . . . 243
10.3 Luz de Baixa Intensidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
10.4 Hamiltoniano do Dipolo-Elétrico . . . . . . . . . . . . . . . . . . . . . . . . . . . 244
10.5 Termo de Dipolo-Elétrico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 245
10.6 Calibre Alternativo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 246
10.6.1 Elementos de Matriz do Dipolo-Elétrico . . . . . . . . . . . . . . . . . . . 247
10.7 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 248
10.7.1 Regras de Seleção Para as Transições de Dipolo-Elétrico . . . . . . . . . 248
10.8 Acoplamento Spin-Órbita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 249
10.9 Hamiltonianas de Dipolo Magnético e Quadrupolo Elétrico . . . . . . . . . . . . 250
10.9.1 Transições de Dipolo Magnético . . . . . . . . . . . . . . . . . . . . . . . 251
10.10Regras de seleção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 251
10.10.0.1 Comentários: Acoplamento spin-órbita . . . . . . . . . . . . . . 251
10.10.1 Transições de Quadrupolo Elétrico . . . . . . . . . . . . . . . . . . . . . 252
10.10.2 Análise do termo de quadrupolo elétrico . . . . . . . . . . . . . . . . . . 252
10.10.3 Cálculo dos elementos de Matriz . . . . . . . . . . . . . . . . . . . . . . . 252
10.10.4 Regras de Seleção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 253
10.10.5 COMENTÁRIOS . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
10.11Excitações Não-Ressonantes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
10.12Modelo Clássico de Elétrons Ligados . . . . . . . . . . . . . . . . . . . . . . . . 254
10.13Susceptibilidade Elétrica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 254
10.14Interação da Radiação com Elétrons Ligados aos Átomos . . . . . . . . . . . . . 256
10.15Cálculo Quântico do Momento de Dipolo Induzido . . . . . . . . . . . . . . . . . 257
10.16Força do Oscilador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 260
10.17Excitação ressonante. Absorção e emissão induzidas . . . . . . . . . . . . . . . . 262
10.17.1 Onda plana monocromática: Transição de probabilidade . . . . . . . . . 262
10.18Largura de Linha da excitação. Probabilidade de transição por unidade de tempo 263

Prof. Salviano A. Leão vii


Sumário

11 Espalhamento 267
11.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
11.2 O problema do espalhamento . . . . . . . . . . . . . . . . . . . . . . . . . . . . 267
11.2.1 Potencial espalhador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 268
11.2.2 Seção de choque de espalhamento . . . . . . . . . . . . . . . . . . . . . . 268
11.2.3 Grandezas físicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 269
11.3 Espalhamento por estados estacionários: Cálculo da seção de choque . . . . . . . 269
11.4 Forma assintótica dos estados estacionários espalhados. Amplitude de espalhamento270
11.4.1 Comportamento assintótico da onda espalhada . . . . . . . . . . . . . . . 270
11.4.2 Cálculo das seções de choque usando as correntes de probabilidade . . . . 271
11.4.3 Corrente espalhada . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 271
11.4.4 Expressão para a seção de choque . . . . . . . . . . . . . . . . . . . . . . 271
11.4.5 Interferência entre onda incidente e a espalhada . . . . . . . . . . . . . . 272
11.4.6 A equação integral . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 272
11.4.7 Integral da função de Green . . . . . . . . . . . . . . . . . . . . . . . . . 274
11.4.8 Laplaciano de G± . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 277
11.5 Aproximação de Born . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 279
11.5.1 Interpretação dos termos da expansão de Born . . . . . . . . . . . . . . . 280
11.6 Espalhamento por muitos centros idênticos . . . . . . . . . . . . . . . . . . . . . 283

12 Espalhamento por um potencial central: Método das ondas parciais 289


12.1 Estados estacionários de uma partícula livre . . . . . . . . . . . . . . . . . . . . 289
12.1.1 Partícula Livre . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 289
12.1.2 Estados estacionários com momentum bem definido. Ondas planas . . . . 290
12.1.3 Estados estacionários com momentum angular bem definido. Ondas
esféricas livres . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 291
12.2 Propriedades físicas das ondas esféricas livres . . . . . . . . . . . . . . . . . . . . 291
12.2.1 Expansão de uma onda plana em termos de ondas esféricas livres . . . . 293
12.3 Onda parciais no potencial V (r) . . . . . . . . . . . . . . . . . . . . . . . . . . . 294
12.3.1 Condição de Contorno . . . . . . . . . . . . . . . . . . . . . . . . . . . . 295
12.3.2 Equação Radial para r → ∞ . . . . . . . . . . . . . . . . . . . . . . . . . 295
12.3.3 Significado Físico do Deslocamento de Fase . . . . . . . . . . . . . . . . . 296
12.3.4 Potencial de Alcance Finito . . . . . . . . . . . . . . . . . . . . . . . . . 297
12.4 Seção de choque em termos do deslocamento de fase . . . . . . . . . . . . . . . . 297
12.4.1 Estados estacionários espalhados a partir de ondas parciais . . . . . . . . 298
12.4.2 Argumento Intuitivo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 298
12.4.3 Dedução explicita dos termos da expansão . . . . . . . . . . . . . . . . . 299
12.4.4 Cálculo da Seção de Choque . . . . . . . . . . . . . . . . . . . . . . . . . 300
12.4.5 Comentários . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
12.4.6 Teorema Óptico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 300

Prof. Salviano A. Leão viii


Sumário

13 Método das Funções de Green: Resolvente 303


13.1 Método das funções de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . 303
13.1.1 Equação de Lippman-Schwinger . . . . . . . . . . . . . . . . . . . . . . . 303
13.1.2 A função de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
13.1.3 Expansão de Born . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 304
13.1.4 Convergência da série de Born . . . . . . . . . . . . . . . . . . . . . . . . 306
13.2 A matriz de espalhamento T . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 307
13.3 Cálculo da função de Green via o cálculo de resíduos . . . . . . . . . . . . . . . 308
13.3.1 Partícula livre em uma dimensão . . . . . . . . . . . . . . . . . . . . . . 309
13.3.2 Partícula livre em três dimensões . . . . . . . . . . . . . . . . . . . . . . 310
13.4 Exemplo: Espalhamento por uma função delta 1d . . . . . . . . . . . . . . . . . 311
13.4.1 A matriz T de uma função delta 1d . . . . . . . . . . . . . . . . . . . . . 311
13.4.2 Solução direta da equação de Lippman-Schwinger . . . . . . . . . . . . . 313
13.5 Resolventes e Funções de Green . . . . . . . . . . . . . . . . . . . . . . . . . . . 313

14 Sistema de Partículas Indistinguíveis 321


14.1 Formulação do problema . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 321
14.1.1 Partículas idênticas: definição . . . . . . . . . . . . . . . . . . . . . . . . 321
14.1.2 Partículas idênticas em mecânica clássica . . . . . . . . . . . . . . . . . . 321
14.1.3 Partículas idênticas na mecânica quântica: as dificuldades de aplicação
dos postulados gerais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 323
14.1.4 Origem das dificuldades: a degenerescência de troca . . . . . . . . . . . . 325
14.1.5 Troca degenerada para um sistema de duas partículas de spin 1/2 . . . . 325
14.1.6 Generalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 327
14.2 Operadores de permutação . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 328
14.2.1 Sistemas de duas partículas . . . . . . . . . . . . . . . . . . . . . . . . . 328
14.2.2 Definição do operador de permutação P21 . . . . . . . . . . . . . . . . . . 328
14.2.3 Propriedades do operador permutação P21 . . . . . . . . . . . . . . . . . 329
14.2.4 Kets simétricos e antissimétricos: Simetrizar e antissimetrizar . . . . . . 330
14.2.5 Transformação de observáveis por permutação . . . . . . . . . . . . . . . 331
14.3 Sistemas contendo um número arbitrário de partículas . . . . . . . . . . . . . . . 332
14.3.1 Definição do operador permutação para N = 3. . . . . . . . . . . . . . . 332
14.3.2 Propriedade: o conjunto dos operadores de permutação constituem um
grupo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 333
14.3.3 Propriedade: Transposição, a paridade de um operador de permutação . 333
14.3.4 Propriedade: Operadores de permutação são unitários . . . . . . . . . . . 334
14.3.5 Kets Completamente Simétrico ou antissimétricos. Simetrizador e Antis-
simetrizador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 334
14.3.6 Transformação de um observável por permutação . . . . . . . . . . . . . 336
14.4 Postulado da simetrização . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 336
14.4.1 Remoção da degenerescência de troca . . . . . . . . . . . . . . . . . . . . 337

Prof. Salviano A. Leão ix


Sumário

14.5 Construção de kets físicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 338


14.5.1 A Regra de Construção . . . . . . . . . . . . . . . . . . . . . . . . . . . 338
14.5.2 Aplicação: sistema de duas partículas idênticas . . . . . . . . . . . . . . 338
14.5.3 Generalização para um número qualquer de partículas . . . . . . . . . . . 339
14.5.3.1 Bósons . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
14.5.4 Férmions . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 340
14.5.5 Construção de uma base no espaço de estado físico . . . . . . . . . . . . 341
14.6 Aplicação dos outros postulados . . . . . . . . . . . . . . . . . . . . . . . . . . . 343
14.6.1 Postulados de medição . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343
14.6.1.1 Probabilidade de encontrar o sistema em um determinado estado
físico . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 343
14.6.1.2 Observáveis físicos: invariância de ES e EA . . . . . . . . . . . . 343
14.6.1.3 Postulados da evolução temporal . . . . . . . . . . . . . . . . . 345
14.6.2 Discussão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 346
14.6.2.1 Diferença entre bósons e férmions. Princípio de exclusão de Pauli346
14.6.2.2 Estado fundamental de um sistema de partículas idênticas inde-
pendentes . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 347
14.7 Estatística quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 348
14.7.1 As consequências da indistinguibilidade da partícula no cálculo de suas
predições físicas . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 349
14.7.2 Interferências entre os processos diretos e os de troca . . . . . . . . . . . 349
14.7.2.1 As predições relativas a uma medida em um sistema de partículas
idênticas: o termo direto e o termo de troca . . . . . . . . . . . 349
14.7.3 Exemplo: colisão elástica de duas partículas idênticas . . . . . . . . . . . 352
14.7.4 Situação na qual o postulado da simetrização pode ser ignorado . . . . . 355
14.7.4.1 Partículas idênticas situadas em duas regiões distintas do espaço 355
14.7.4.2 Partículas que podem ser identificadas pela direção de seus spins 356
14.8 O caráter simétrico dos estados de um sistema de muitas partículas idênticas . . 357
14.9 Formalismo do Espaço de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . 365
14.10O Problema da Normalização . . . . . . . . . . . . . . . . . . . . . . . . . . . . 369
14.11Operadores de Criação e de Destruição . . . . . . . . . . . . . . . . . . . . . . . 371
14.11.1 Caso de Bose . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
14.11.2 Caso de Fermi . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 374
14.12Operadores de uma-partícula no formalismo da segunda quantização . . . . . . . 377
14.12.1 Operador Número . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380
14.12.2 Operador Momentum . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 380
14.12.3 Operador Energia Cinética . . . . . . . . . . . . . . . . . . . . . . . . . . 382
14.12.4 Operador Energia Potencial . . . . . . . . . . . . . . . . . . . . . . . . . 382

Prof. Salviano A. Leão x


Chapter 1

Spin

1.1 O que é um Spin?


Viu-se que tratar o elétron como sendo uma partícula que possui três graus de liberdade
associados, os quais são as suas três coordenadas espaciais (x, y, z), e que é caracterizado
quanticamente por uma função de onda ψ(x, y, z), a qual depende apenas das coordenadas
cartesianas (x, y, z) é insuficiente. Essa abordagem já foi usada em diversos sistemas produzindo
bons resultados. Entretanto, como foi visto, o elétron é melhor caracterizado como sendo uma
partícula que possui as seguintes propriedade intrínsecas: massa, carga e o spin. A ordem de
grandezas desses parâmetros que caracterizam o elétron são apresentados na tabela a seguir.

Propriedade Símbolo Valor Unidade


Massa me 9, 11 × 10−31 kg
− −19
Carga e −1, 602 × 10 C
Spin S ± 12 ~ J·s

Apesar do spin possuir as mesmas dimensões de momentum angular, ele deve ser considerado
como uma propriedade intrínseca do elétron sem análogo clássico, ou seja, um “momentum
angular intrínseco”. Note que toda e qualquer tentativa de fazer uma analogia clássica traz mais
problemas do que benefícios para a compreensão deste conceito.

Example 1.1. Mostre que no modelo clássico que trata o elétron como uma pequena bolinha
que gira em torno de um eixo próprio, a velocidade superficial do elétron tem de ser mais de
60 vezes a velocidade da luz, para produzir um momentum angular de (1/2)~. Por isso, esse
modelo não é adequado.

Solution 1.2. O momentum angular é dado por:

1
L = Iω = me vs re = ~,
2
1
1.1. O que é um Spin?

+ =

Figure 1.1: Modelo clássico para o elétron, o qual o trata-o por uma pequena bolinha que gira com
uma velocidade angular ω em torno do seu eixo.

na qual vs é a velocidade superficial do elétron e re é o raio clássico do elétron ou raio de Lorentz


e é dado por [27, Ver pág. 83, na seção Energia própria de uma carga puntiforme]1 :
e2 1 me e2
  2
1 ~
re = 2
= 2
,
4πε0 me c 4πε0 ~ m2e c2
1
= · (αa0 )2 = α2 a0
a0
= 2.8179403267(27) × 10−15 m

na qual usou-se o fato de que o raio de Bohr cujo valor é a0 = 0.52917724924 × 10−10 m também
é expresso por:
~2 4π0 ~2
a0 = (CGS) e a0 = (M KSA) (1.1)
me e2 me e 2
e que em termos da contante de estrutura fina α = 1/137, 035989561 ele também pode ser
expresso por
~ ~
a0 = (CGS) e a0 = (M KSA) (1.2)
αme c αme c

e2 1
α= = (M KSA)
4πε0 ~c 137, 035989561
Então temos que
~ 1 ~ c 1 c 1
vs = = 2
= αa0 2 = c ≈ 68, 52 · c
2me re 2 m e c α a0 2 α a0 2α
Portanto, a velocidade superficial é da ordem de 68 vezes a velocidade da luz.

1.1.1 Natureza Quântica do Spin


A mais comum das analogias clássicas do spin, é aquela na qual ele é associado ao momentum
angular intrínseco de uma bolinha girando em torno do seu eixo. Entretanto, como viu-se no
exemplo anterior tal analogia é muito grosseira e insatisfatória, e além disso ela deixa de explicar
algumas de suas propriedade, dentre elas, o fato dele ser quantizado.
1
Para obter o raio clássico do elétron, o mesmo é tratado com um partícula pontual uma vez que sua carga é
a elementar e ela não é divisível. No cálculo da autoenergia de uma esfera carregada surge um fator 3/5, o qual
é ignorado aqui devido a natureza elementar da carga do elétron.

Prof. Salviano A. Leão 2


1.1. O que é um Spin?

S N

e−
e−

N S
m = + 21 m = − 12
Figure 1.2: A analogia do momentum angular intrínseco de uma bolinha girando em torno do seu
eixo com o spin é insatisfatória.

A existência do spin está na inclusa mecânica quântica relativística, elaborada por Dirac
[43, 44]. Na equação de Schrödinger, o spin foi incorporado de forma a parte ao formalismo da
mecânica quântica de Schrödinger por Wolfgang Pauli.
De acordo com Landau [22], a lei de conservação do momentum angular, tanto na mecânica
clássica quanto na mecânica quântica, é uma consequência direta da isotropia espacial em
um sistema fechado, e isso, é uma evidência direta da relação entre o momentum angular e
as propriedades de simetria com relação as rotações. Na mecânica quântica, essas relações
de simetria com relação as rotações constituem a essência do conceito de momentum angular
de uma partícula, já que a sua definição clássica, como o produto vetorial r × p, perde seu
significado direto pois não se pode medir simultaneamente a posição e o momentum.
Foi mostrado que as relações de comutação do momentum angular orbital de uma partícula
podem ser vistas como uma consequência da estrutura não-comutativa do grupo de rotações
geométricas. Estabeleceu-se também que os números quânticos l e mL determinam a dependência
angular da função de onda de uma partícula, e portanto, todas as suas propriedades de simetria
com relação às rotações. A conservação do momentum angular, de forma geral, estabelece
a lei de transformação dos autoestados do momentum angular nas rotações do sistema de
coordenadas.
Para um sistema de partículas, os autoestados do momentum angular |l, mL i, com os valores
específicos do momentum angular l e de sua projeção m, não serão alterados apenas no caso de
rotações do sistema de coordenadas em torno do eixo Oz. Qualquer rotação que mude a direção
do eixo z terá como consequência que a projeção do momentum angular sobre o eixo Oz não
será mais um valor bem determinado. Pois no novo sistema de coordenadas, os autoestados
|l, m0L i em geral se transformam em uma superposição dos 2l + 1 autoestados |l, mL i da seguinte
forma,
i
X
|l, m0L i = CL,τ e− ~ L·û |l, τ i (1.3)
τ

a qual corresponde a cada um dos possíveis valores de mL para um dado l.


Nas rotações do sistema de coordenadas os 2l + 1 autoestados |l, mL i transformam-se

Prof. Salviano A. Leão 3


1.2. Momentum angular intrínseco: spin

em combinações lineares uns nos outros. A lei que governa essas transformações, isto é, os
coeficientes Cl,τ da superposição dos autoestados (como funções do ângulo de rotação do sistema
de coordenadas), é determinada completamente ao especificarmos o valor de l. Desse modo,
o momentum angular adquire o significado de um número quântico, o qual classifica o estado
do sistema de acordo com suas propriedades de transformação sobre uma rotação do eixo de
coordenadas do sistema.
Note que esse aspecto do conceito de momentum angular na mecânica quântica é particu-
larmente importante porque ele não está diretamente relacionado com a dependência angular
explicita dos autoestados do sistema, (as funções de onda): a lei de transformação mútua desses
autoestados pode ser expressa de modo independente, sem se fazer referência a essa dependência
angular.

1.1.1.1 Sistema de partículas

Consideremos uma partícula composta, como por exemplo um núcleo atômico, o qual está
em repouso como um todo (ou seja seu CM está em repouso) e encontra-se em um estado interno
bem definido. Além disso, ela tem uma energia interna e um momentum angular de magnitude
l, devido ao movimento das partículas que compõem o núcleo. Esse momentum angular pode
ter 2l + 1 diferentes orientações no espaço.
Nota
Portanto, ao considerarmos o movimento de uma partícula complexa
como um todo devemos, além de suas coordenadas, atribuir a ela uma
variável discreta: a projeção do seu momentum angular interno sobre
uma direção qualquer do espaço.

1.2 Momentum angular intrínseco: spin


Portanto, após uma reflexão sobre os argumentos precedentes a respeito do conceito de
momentum angular, pode-se concluir que as questões que surgem a respeito de sua origem
não são mais essenciais, e com isso chegamos naturalmente ao conceito de momentum angular
intrínseco, o qual deve ser atribuído a uma partícula independente do fato dela ser composta ou
elementar.
Nota
Deste modo, na mecânica quântica deve-se atribuir à partícula el-
ementar um momentum angular intrínseco, não relacionado ao seu
movimento espacial.

Esta propriedade das partículas elementares é especificamente de natureza quântica (ela


desaparece na passagem em que tomamos o limite ~ → 0), e portanto, em princípio ela não tem
uma interpretação clássica (um análogo clássico).

Prof. Salviano A. Leão 4


1.3. Evidências experimentais do spin do elétron

Nota
O momentum angular intrínseco de uma partícula é chamado de spin da
partícula, em distinção ao momentum angular da partícula associado
ao movimento da partícula no espaço, denominado de, momentum
angular orbital.

Quanto a partícula em si, tanto faz se a partícula concebida é elementar ou composta, o que
importa é que ela se comporta como uma partícula elementar no fenômeno em questão (por
exemplo, o núcleo atômico).
Quanto ao spin da partícula temos:

• O spin de uma partícula, é medido como o momentum angular orbital, em unidades de ~


e será denotado por s.

• Para partículas possuidoras de spin, a descrição do estado mediante a função de onda


deve determinar não somente as probabilidades das suas diversas posições no espaço, mas
ainda as probabilidades das diversas orientações possíveis de seu spin. Portanto, a função
de onda deve depender não só das três variáveis contínuas, isto é, das coordenadas da
partícula, mas também de uma variável de spin discreta que determina o valor da projeção
do spin sobre uma direção escolhida no espaço (o eixo Oz) e que só pode ter um número
limitado de valores discretos, os quais denotaremos por σ.

1.3 Evidências experimentais do spin do elétron


Há numerosas demonstrações experimentais da existência do spin do elétron, entre elas
pode-se destacar:

• As propriedades magnéticas de inúmeras substâncias, particularmente os metais ferromag-


néticos, só podem ser explicados se o spin for levado em conta.

• A estrutura fina das linhas espectrais na física atômica.

• O efeito Zeeman.

• O experimento de Stern-Gerlach [37, 39, 41, 42]. A experiência de Stern-Gerlach foi


realizada em Frankfurt, Alemanha em 1922 por Otto Stern e Walther Gerlach.

1.4 Descrição quântica: os postulados de Pauli


Em 1924, Wolfgang Pauli propôs um novo grau de liberdade quântico [37, 42], para explicar
as inconsistências entre o espectro molecular observado e os desenvolvimentos da mecânica
quântica. Ele formulou o Princípio de exclusão, talvez seu mais importante trabalho, que

Prof. Salviano A. Leão 5


1.4. Descrição quântica: os postulados de Pauli

estabelece que nenhuma partícula (por exemplo, os elétrons) pode existir no mesmo estado
quântico.
Em 1925 George Eugene Uhlenbeck e Samuel Abraham Goudsmit [37, 40], para explicarem
os resultado experimentais do experimento realizado por Stern-Gerlach em 1922, propuseram a
seguinte hipótese: o elétron possui um momentum angular intrínseco chamado spin, identificaram
o grau de liberdade extra do elétron proposto por Pauli como sendo o spin. Além disso, para
interpretar corretamente os resultados experimentais propuseram que o momentum magnético
MS associado a este momentum angular intrínseco S fosse dado por
µB µB
M S = gs S e ML = gl L (1.4)
~ ~
Note que o coeficiente de proporcionalidade entre o momentum angular de spin S e o seu
momento magnético é duas vezes aquele para o momentum angular orbital L, ou seja,
α
gs = 2(1 + + · · · ) = 2, 0 × 1, 001159657(4) = 2.0023193043617(15) e gl = 1, 0 (1.5)

Nesse caso diz-se que:

Nota
A razão giromagnética do spin é duas vezes a razão giromagnética
orbital.

Em 1927, Wolfgang Pauli [5, 37] enunciou mais precisamente essa declaração e forneceu
uma descrição quântica para o spin, a qual era válida no limite não-relativístico. Seu trabalho
influenciou Paul A.M. Dirac na descoberta da equação de Dirac para o elétron relativístico.

1.4.1 Postulados
Para uma partícula como o elétron, associamos respectivamente a sua posição r e ao seu
momentum linear p, os observáveis R e P que atuam no espaço de estados Er , o qual é isomórfico
ao espaço das funções de onda F.
Todas quantidades físicas são funções das variáveis fundamentais r e p, e a regra de
quantização nos permite associarmos a elas observáveis que atuam no espaço de estados Er .
Agora iremos chamá-lo de o espaço de estados orbital Er .
A essas variáveis orbitais adicionaremos as variáveis de spin, as quais satisfazem os seguintes
postulados:

i) O operador de spin S é um momentum angular intrínseco, e portanto, satisfaz a mesma


álgebra. Isso significa que suas três componentes são observáveis que satisfazem as
seguintes relações de comutação:

[Sx , Sy ] = i~Sz ; [Sz , Sx ] = i~Sy ; [Sy , Sz ] = i~Sx . (1.6)

[Sα , Sβ ] = i~α,β,γ Sγ com α, β, γ = x, y, z. (1.7)

Prof. Salviano A. Leão 6


1.5. Partículas de spin s = 1/2: propriedades especiais

ii) Os operadores de spin atuam atuam em um novo espaço, o espaço de estados Es , no


qual S2 e Sz constituem um conjunto completo de observáveis que comutam entre
si, um C.S.C.O. Portanto, o espaço de estados Es é expandido pelo conjunto de
autoestados |s, mi comuns à S2 e Sz , com

S2 |s, mi = s(s + 1)~2 |s, mi (1.8)


Sz |s, mi = m~ |s, mi (1.9)

De acordo com a teoria do momentum angular, desenvolvida anteriormente, sambemos


que s deve ser um inteiro ou um semi-inteiro, e além disso que m = −s, −s+1, . . . , s−
1, s.
Quando uma dada partícula é caracterizada por um único valor de s: diz-se que ela
possui um spin s e portanto o seu espaço de estado de spin Es é sempre de dimensão
finita (2s+1), e todos os estados de spin são autovetores de S2 com o mesmo autovalor
s(s + 1)~2 .

iii) O espaço de estados E da partícula em questão é dado pelo produto tensorial de Er


por Es :
Er ⊗ Es .
Portanto, todos os observáveis de spin comutam com todos os observáveis orbital.
Exceto para o caso particular em que s = 0, não é o suficiente especificarmos um ket
de Er para caracterizar um estado de uma partícula.

iv) O elétron é uma partícula de spin 1/2, (s = 1/2) e o seu momento magnético intrínseco
é dado por:
µB
MS = 2 S. (1.10)
~
Portanto, para o elétron o espaço Es é bidimensional.

1.5 Partículas de spin s = 1/2: propriedades especiais


O espaço de estados do spin Es é bidimensional. Considerando uma base ortonormal
{|+i , |−i} dos autoestados comuns de S2 e Sz que satisfazem:
3
S2 |±i = ~2 |±i (1.11a)
4
1
Sz |±i = ± ~ |±i (1.11b)
2
e além disso, da ortonormalização temos

h+ | −i = 0; h+ | +i = h− | −i = 1, (1.12)

e vale também a completeza


|+i h+| + |−i h−| = 1. (1.13)

Prof. Salviano A. Leão 7


1.5. Partículas de spin s = 1/2: propriedades especiais

O estado de spin mais geral é descrito por um vetor arbitrário de Es

|χi = c+ |+i + c− |−i , (1.14)

em que c+ e c− são números complexos.


De acordo com (1.11a), todos os kets de Es são autovetores de S2 com o mesmo autovalor
3~/4, logo S2 deve ser proporcional ao operador identidade 1 de Es , ou seja,
!
3 3 1 0
S2 = ~2 1 ou S2 = ~2 (1.15)
4 4 0 1

Como S é por definição um momentum angular, ele possui todas as propriedades gerais de
um operador momentum angular. Portanto, a ação do operador

S± = Sx ± iSy (1.16)

sobre os vetores da base |+i e |−i é dada por

S+ |+i = 0 |+i S+ |−i = ~ |+i (1.17a)


S− |+i = ~ |−i S− |−i = 0 (1.17b)

Qualquer operador atuando em Es pode ser representado, na base {|+i , |−i} por uma matriz
2 × 2.

1.5.1 Matrizes de Pauli


A matriz S, pode ser escrita em termos das matrizes de Pauli σ, da seguinte forma
~
S= σ (1.18)
2
com suas componentes sendo dadas por
~ ~ ~
Sx = σx , Sy = σy , Sz = σz . (1.19)
2 2 2
e as matrizes de Pauli são:
! ! !
0 1 0 −i 1 0
σx = , σy = , σz = . (1.20)
1 0 i 0 0 −1

As matrizes de Pauli possuem as seguintes propriedades:

σx2 = σy2 = σz2 = 1, (1.21)

σx σy + σy σx = 0, σy σz + σz σy = 0, σz σx + σx σz = 0, (1.22)

[σx , σy ] = 2iσz ou [σα , σβ ] = α,β,γ 2iσγ (1.23)

Prof. Salviano A. Leão 8


1.5. Partículas de spin s = 1/2: propriedades especiais

em que α,β,γ é o tensor de Levi-Civita. Temos ainda que

σx σy = iσz , σy σz = iσx , σz σx = iσy (1.24)

Essas relações anteriores podem ser escritas em uma forma mais compacta, como

σα σβ = iα,β,γ σγ + δα,β I. (1.25)

Temos ainda que


Tr σx = Tr σy = Tr σz = 0, (1.26)

Det σx = Det σy = Det σz = −1. (1.27)

Nota
Qualquer matriz 2 × 2 pode ser escrita como uma combinação linear,
com coeficientes complexos, das três matrizes de Pauli e da matriz
identidade.

Para as matrizes de Pauli, vale a seguinte propriedade:

(σ · A)(σ · B) = A · B + iσ · (A × B) (1.28)

em que A e B são dois vetores arbitrários, ou dois vetores operadores cujas três componentes
comutam com aquelas do spin S, ou seja,

[Ai , Sj ] = 0 i, j = x, y, z. (1.29a)
[Bi , Sj ] = 0 i, j = x, y, z. (1.29b)
[Ai , Bj ] = 0 i, j = x, y, z. (1.29c)

Se A e B não comutarem entre si, a identidade permanece válida se A e B aparecerem na


mesma ordem em ambos os lados da identidade.

1.5.2 Propriedades do operador de spin S


Destas propriedades seguem imediatamente que

~2
Sx2 = Sy2 = Sz2 = , (1.30)
4
Sx Sy + Sy Sx = 0, Sy Sz + Sz Sy = 0, Sz Sx + Sx Sz = 0, (1.31)

[Sx , Sy ] = i~Sz ou [Sα , Sβ ] = i~Sγ α,β,γ (1.32)


i i i
Sx Sy = ~Sz , Sy Sz = ~Sx , Sz Sx = ~Sy (1.33)
2 2 2
S+2 = S−2 = 0 (1.34)

Prof. Salviano A. Leão 9


1.6. Partícula de spin 1/2: Descrição não-relativística

1.6 Partícula de spin 1/2: Descrição não-relativística


1.6.1 Observáveis e vetores de estado
Quando todos os graus de liberdade são levados em conta, o estado quântico de um elétron
é caracterizado por um ket pertencente ao espaço E o qual é um produto tensorial de Er por Es .
Entre os vários C.S.C.O podemos escolher qualquer um dos seguintes:

{X, Y, Z, S2 , Sz }
{Px , Py , Pz , S2 , Sz }
{H, L2 , Lz , S2 , Sz }

Note que como todos os kets de E são autovetores de S2 com o mesmo autovalor, então pode-se
omitir S2 desse conjunto de observáveis.
Usando o primeiro conjunto, e usaremos como base de E uma na qual o ket |ri = |x, y, zi ∈ Er
e a outra |εi ∈ Es , logo podemos escrever

|r, εi ≡ |x, y, z, εi = |ri ⊗ |εi (1.35)

Por definição temos o vetor |r, εi é um autovetor comum de X, Y , Z, S2 , Sz :

X |r, εi = x |r, εi (1.36a)


Y |r, εi = y |r, εi (1.36b)
Z |r, εi = z |r, εi (1.36c)
3
S2 |r, εi = ~2 |r, εi (1.36d)
4
~
Sz |r, εi = ε |r, εi (1.36e)
2
Temos ainda que:
hr0 , ε0 | r, εi = δε0 ,ε δ(r0 − r) (1.37)

e a relação de completeza
Xˆ ˆ ˆ
d r |r, εi hr, ε| = d r |r, +i hr, +| + d3 r |r, −i hr, −| = 1
3 3
(1.38)
ε

1.6.2 Representação {|r, εi}


Qualquer vetor de estado |ψi pode ser expandido na base {|r, εi}, e para isso, basta usar a
completeza da seguinte forma

|ψi = d3 r |r, εi hr, ε | ψi (1.39)
ε

O vetor de estado |ψi pode ser representado por uma função de onda

hr, ε | ψi = ψε (r), (1.40)

Prof. Salviano A. Leão 10


1.6. Partícula de spin 1/2: Descrição não-relativística

a qual depende dos três índices contínuos x, y e z e do índice discreto ε (+ ou −).


Para caracterizarmos completamente o estado de um elétron, será necessário especificarmos
as duas funções de onda das variáveis espaciais, ou seja,

ψ+ (r) = hr, + | ψi e ψ− (r) = hr, − | ψi . (1.41)

Essas duas funções, geralmente são escritas na forma de um spinor de duas componentes
!
ψ+ (r)
[ψ](r) = (1.42)
ψ− (r)

O bra hψ| associado ao ket |ψi é dado pelo adjunto de (1.39):



hψ| = d3 r hψ | r, εi hr, ε| (1.43)
ε

o qual, pode ser reescrito como



hψ| = d3 r ψε∗ (r) hr, ε| . (1.44)
ε

∗ ∗
Portanto, o bra hψ| é representado pelas duas funções ψ+ (r) e ψ− (r), as quais podem ser
reescritas na forma de um spinor

[ψ † ](r) = (ψ+
∗ ∗
(r) ψ− (r)). (1.45)

Com essa notação, produto escalar de dois vetores de estado |ψi e |ϕi pode ser escrito como:

hψ | ϕi = d3 r hψ | r, εi hr, ε | ϕi
ˆε
∗ ∗
= d3 r [ψ+ (r)ϕ+ (r) + ψ− (r)ϕ− (r)] (1.46)

o qual ainda pode ser escrito como


ˆ
hψ | ϕi = d3 r [ψ]† (r)[ϕ](r). (1.47)

A normalização do ket |ψi é dada por


ˆ ˆ

hψ | ψi = d r [ψ] (r)[ψ](r) = d3 r [|ψ+ (r)|2 + |ψ− (r)|2 ] = 1
3
(1.48)

Entre os vetores de E, alguns são produtos tensoriais de um ket de Er por um ket de Es .


Considere por exemplo, o caso em que o vetor de estado é do seguinte tipo:

|ψi = |ϕi ⊗ |χi , (1.49)

em que ˆ
|ϕi = d3 r ϕ(r) |ri ∈ Er (1.50)

|χi = c+ |+i + c− |−i ∈ Es (1.51)

Prof. Salviano A. Leão 11


1.6. Partícula de spin 1/2: Descrição não-relativística

logo, o spinor associado a ele toma a seguinte forma:


! !
ϕ(r)c+ c+
[ψ](r) = = ϕ(r) . (1.52)
ϕ(r)c− c−

Esse resultado, deve-se a definição do produto escalar em E, e neste caso temos:

ψ+ (r) = hr, + | ψi = hr | ϕi h+ | χi = ϕ(r)c+ (1.53a)


ψ− (r) = hr, − | ψi = hr | ϕi h− | χi = ϕ(r)c− (1.53b)

O quadrado da norma de |ψi é então dado por:


ˆ
2 2
hψ | ψi = hϕ | ϕi hχ | χi = (|c+ | + |c− | ) d3 r |ϕ(r)|2 (1.54)

1.6.3 Operadores
Seja A um operador tal que

A |ψi = |ψ 0 i com |ψi , |ψ 0 i ∈ E (1.55)

usando a completeza (1.38), podemos reescrever (1.55) como


XXˆ ˆ
0
|ψ i = 3
dr d3 r0 |r0 , ε0 i hr0 , ε0 | A | r, εi hr, ε | ψi (1.56)
ε ε0

Agora vamos obter cada elemento do spinor. Primeiro vamos projetar o ket |ψ 0 i em |r, +i, assim

0 0
ψ+ (r) = hr, + | ψ i = d3 r hr, + | A | r, εi hr, ε | ψi (1.57)
ε

e projetando em |r, −i, obtemos



0 0
ψ− (r) = hr, + | ψ i = d3 r hr, − | A | r, εi hr, ε | ψi (1.58)
ε

Portanto, de acordo com os resultados anteriores |ψi e |ψ 0 i podem ser representados por um
spinor de duas componentes [ψ](r) e [ψ 0 ](r).
Agora mostraremos que podemos associar com o operador A uma matriz 〚A〛 2 × 2, tal que

[ψ 0 ](r) = 〚A〛[ψ](r) (1.59)

em que os elementos de matriz, em geral, permanecem operadores diferenciais em relação a


variável r.

1.6.3.1 Operadores de spin

Esses foram definidos inicialmente em Es , portanto, eles atuam somente sobre o índice ε dos
vetores da base |r, εi. Considere por exemplo o caso da ação do operador S+ sobre um vetor
|ψi, resultando em |ψ 0 i: ˆ
0
|ψ i = ~ d3 r ψ− (r) |r, +i . (1.60)

Prof. Salviano A. Leão 12


1.6. Partícula de spin 1/2: Descrição não-relativística

Note que o operador S+ aniquila todos os kets |r, +i e transforma os kets |r, −i em ~ |r, +i.
As componentes de |ψ 0 i na base {|r, εi} são:

hr, + | ψ 0 i = ψ+
0
(r) = ~ψ− (r) (1.61)
hr, − | ψ 0 i = ψ−
0
(r) = 0. (1.62)

Portanto, o spinor representando |ψ 0 i é


!
ψ− (r)
[ψ 0 ](r) = ~ (1.63)
0

Esse é de fato o resultado obtido ao multiplicarmos a matriz do spinor por


!
~ 0 1
〚S+ 〛 = (σx + iσy ) = ~ . (1.64)
2 0 0

pois,

[ψ 0 ](r) = 〚S+ 〛[ψ](r)


! !
0 1 ψ+ (r)
=~
0 0 ψ− (r)
!
ψ− (r)
=~
0

1.6.3.2 Operadores Orbitais

Ao contrário dos operadores de spin, os operadores orbitais sempre deixam inalterados o


índice ε dos vetores da base |r, εi: suas matrizes 2 × 2 associadas no termo de spin são sempre
proporcionais a matriz identidade. Entretanto eles atuam sobre a dependência em r do spinor,
da mesma forma como atuam sobre uma função de onda ordinária.
Considere por exemplo o caso da ação dos operadores X e Px sobre um vetor de estado |ψi,
resultando respectivamente em |ψ 0 i e |ψ 00 i:

|ψ 0 i = X |ψi e |ψ 00 i = Px |ψi , (1.65)

logo suas componentes na base {|r, εi} são respectivamente

ψε0 (r) = hr, ε | X | ψi = xψε (r) (1.66a)


~ ∂
ψε00 (r) = hr, ε | Px | ψi = ψε (r) (1.66b)
i ∂x
Os spinores [ψ 0 ](r) e [ψ 00 ](r) foram obtidos do spinor [ψ](r) por meio das matrizes 2 × 2:
 
! ∂
x 0 ~ 0 
〚X〛 = e 〚Px 〛 =  ∂x ∂  . (1.67)
0 x i 0
∂x

Prof. Salviano A. Leão 13


1.6. Partícula de spin 1/2: Descrição não-relativística

Note que, ! ! !
x 0 ψ+ (r) ψ+ (r)
[ψ 0 ](r) = 〚X〛[ψ](r) = =x (1.68)
0 x ψ− (r) ψ− (r)
e que  
∂ ! !
~ 0  ψ+ (r) ~ ∂ ψ+ (r)
[ψ 00 ](r) = 〚Px 〛[ψ](r) =  ∂x = (1.69)

i ∂  ψ (r) i ∂x ψ− (r)
0 −
∂x

1.6.3.3 Operadores mistos

A forma mais geral de um operador atuar em E é representada, em uma notação matricial,


por uma matriz 2 × 2 cujos elementos são operadores diferenciais com relação a variável r. Por
exemplo,
~ ∂
 
~ 0
〚Lz Sz 〛 =  i ∂ϕ (1.70)

2 ~ ∂ 
0 −
i ∂ϕ
ou
~
〚S · P〛 = (σx Px + σy Py + σz Pz )
2
∂ ∂ ∂
 
2
~  − i
= ∂z ∂x ∂y 
∂ ∂ ∂ 
2i +i −
∂x ∂y ∂z

Notas

• A representação spinorial na base {|r, εi} é análoga a representação na base {|ri} de Er .


O elemento de matriz hψ | A | ϕi para um operador A qualquer de E é dado por
ˆ
hψ | A | ϕi = d3 r [ψ]† (r)〚A〛[ϕ](r) (1.71)

na qual, 〚A〛 designa uma matriz 2 × 2 a qual representa o operador A.

• Obviamente que há também a representação {|p, εi} cujos vetores da base são autovetores
comuns do C.S.C.O {Px , Py , Pz , S2 , Sz }. A definição do produto escalar em E produz:

1
hr, ε | p, ε0 i = hr | pi hε | ε0 i = eip·r/~ δε,ε0 (1.72)
(2π~)3/2

Nessa representação, temos !


ψ̄+ (p)
[ψ̄](p) = (1.73)
ψ̄− (p)
com
ψ̄+ (p) = hp, + | ψi e ψ̄− (p) = hp, − | ψi (1.74)

Prof. Salviano A. Leão 14


1.7. Cálculo de probabilidades de uma medição física

Ainda pode-se escrever ψ̄ε (p) como



ψ̄ε (p) = hp, ε | ψi = d3 r hp, ε | r, ε0 i hr, ε0 | ψi
ε0
ˆ
1
= d3 r eip·r/~ ψε (r).
(2π~)3/2

1.7 Cálculo de probabilidades de uma medição física


Considere um elétron, descrito pelo estado |ψi normalizado cujas componentes são ψ+ (r) e
ψ− (r), que medimos simultaneamente sua posição e a componente ao longo do eixo Oz do seu
spin. Desde que, X, Y , Z e Sz constituem um C.S.C.O, há um único vetor de estado o qual
corresponde a um dado resultado: x, y, z e ±~/2.
A probabilidade d3 P(r, +) do elétron ser encontrado no elemento de volume infinitesimal
d3 r em torno do ponto r(x, y, z) com o seu spin para cima (Sz = +~/2) é igual a:

d3 P(r, +) = |hr, + | ψi|2 d3 r = |ψ+ (r)|2 d3 r (1.75)

e analogamente para o spin para baixo (Sz = −~/2), temos

d3 P(r, −) = |hr, − | ψi|2 d3 r = |ψ− (r)|2 d3 r (1.76)

1.7.1 Medindo a componente Sx


Considere um elétron, descrito pelo estado |ψi normalizado cujas componentes são ψ+ (r)
e ψ− (r), que medimos simultaneamente sua posição e a componente ao longo do eixo Ox
do seu spin. Desde que, X, Y , Z e Sz constituem um C.S.C.O, o resultado de uma medida
{x, y, z, ±~/2}, corresponde há um único vetor de estado o qual é dado por:
1
|ri |±ix = √ [|r, +i ± |r, −i] (1.77)
2

A probabilidade d3 P(r, +) do elétron ser encontrado no elemento de volume infinitesimal


d3 r em torno do ponto r(x, y, z) com o seu spin para cima (Sx = +~/2) é igual a:
2
1 1
d P(r, +) = √ [hr, + | ψi + hr, − | ψi] × d3 r = |ψ+ (r) + ψ− (r)|2 d3 r
3
2 2

e analogamente para o spin para baixo (Sx = −~/2), temos


2
1 1
d P(r, −) = √ [hr, + | ψi − hr, − | ψi] × d3 r = |ψ+ (r) − ψ− (r)|2 d3 r
3
2 2

Prof. Salviano A. Leão 15


1.7. Cálculo de probabilidades de uma medição física

Prof. Salviano A. Leão 16


Capítulo 2

Spin - Rotação

2.1 Operadores de rotação para uma partícula de spin 1/2


2.1.1 Momentum angular total
Uma partícula de spin 1/2, possui um momentum angular orbital L e um momentum angular
de spin S. O momentum angular total J é definido como a soma dos dois momenta angular:

J=L+S (2.1)

Aqui os operadores R, P e S são observáveis vetoriais.


No espaço de estado da partícula em questão, o operador de rotação Rû (α) está associado
com a rotação geométrica Rû (α) através de um ângulo α em torno do vetor unitário û por:
i
Rû (α) = e− ~ αJ·û (2.2)

em que J é o momentum angular total.

2.1.2 Produto tensorial


Desde que L atua somente em Er e S em Es (o que significa, que todas as componentes de L
comutam com as de S), podemos escrever o operador rotação Rû (α) na forma de um produto
tensorial:
Rû (α) = (r) Rû (α) ⊗ (S) Rû (α) (2.3)
no qual
i i
(r)
Rû (α) = e− ~ αL·û e (S)
Rû (α) = e− ~ αS·û (2.4)
são os operadores de rotação associados com Rû (α) em Er e em Es respectivamente.
Portanto, se realizarmos uma rotação Rû (α) sobre uma partícula de spin 1/2, cujo estado é
representado pelo produto tensorial,

|ψi = |ϕi ⊗ |χi com |ϕi ∈ Er e |χi ∈ Es . (2.5)

seu estado após a rotação será

|ψ 0 i = Rû (α) |ψi =


(r)
Rû (α) |ϕi ⊗ (S) Rû (α) |χi
  
(2.6)

17
2.1. Operadores de rotação para uma partícula de spin 1/2

2.1.3 Rotação do estado de spin


Como S = ~2 σ, então o operador de rotação toma a forma:
i α
(S)
Rû (α) = e− ~ αS·û = e−i 2 σ·û (2.7)

Para fazermos isso, usamos a definição de um operador exponencial:


α 1  α 2 1  α n
(S)
Rû (α) = 1 − i σ · û + −i (σ · û)2 + . . . + −i (σ · û)n + . . . (2.8)
2 2! 2 n! 2
Agora usando a identidade,

(σ · A)(σ · B) = A · B + iσ · (A × B) (2.9)

e fazendo A = B = û vê-se que


(σ · û)2 = û2 = 1 (2.10)

o que nos leva à 


1 Se n par
(σ · û)n = (2.11)
σ · û Se n ímpar

Portanto, se agruparmos os termos pares e ímpares da expansão anterior

(−1)p  α 2p
 
(S) 1  α 2
Rû (α) = 1 − + ... + + ...
2! 2 (2p)! 2
(−1)p  α 2p+1
 
α 1  α 3
− iσ · û − + ... + + ...
2 3! 2 (2p + 1)! 2

ou seja,
α α
(S)
Rû (α) = cos − iσ · û sen (2.12)
2 2
(S)
Posto dessa forma, agora é fácil calcular a ação do operador Rû (α) sobre um estado de spin
qualquer.
(1/2)
Usando essa expressão, podemos escrever a matriz de rotação Rû (α) explicitamente na
base {|+i , |−i}, como
!
(1/2) cos α2 − iuz sen α2 (−iux − uy ) sen α2
Rû (α) = (2.13)
(−iux + uy ) sen α2 cos α2 + iuz sen α2

2.1.4 Operador associado com uma rotação de 2π


Para um ângulo de rotação α = 2π, a rotação geométrica Rû (α) coincidi, se o vetor û for
unitário, com a rotação identidade. Entretanto, se fizermos α = 2π na eq. (2.12), vemos que:

(S) (S)
Rû (0) = 1 e com Rû (2π) = −1 (2.14)

Portanto, o operador associado com uma rotação de 2π não é o operador identidade, mas o
negativo desse operador. Logo, as leis de transformação de grupo, são conservadas somente

Prof. Salviano A. Leão 18


2.1. Operadores de rotação para uma partícula de spin 1/2

localmente na correspondência entre as rotações geométricas e os operadores de rotação em Es .


Ou seja, somente as leis de transformações infinitesimais são conservadas. Isso , deve-se ao valor
semi-inteiro do momentum angular de spin da partícula em questão.
Da eq. (1.15), vê-se que:
(S)
Rû (4π) = 1

somente uma rotação de 4π é igual a unidade. Isso seria equivalente a estar sobre a superfície
de uma Fita de Möebius.

Figura 2.1: Analogia da invariância por rotação de 4π do spin, (S) R (4π) = 1, com a fita de Möebius.

O fato de que o estado de spin muda o sinal durante uma rotação através de um ângulo de
2π não é perturbador, já que os dois vetores de estado diferem somente por um fator de fase
global, tendo as mesmas propriedades físicas. É mais importante estudarmos e compreendermos
como um observável se transforma durante uma rotação como essa.
Considere os autovetor |χn i é submetido a uma rotação tal que

|χ0n i = (S) Rû (α) |χn i (2.15)

e que além disso, ele é uma autovetor do operador A, assim

A |χn i = an |χn i (2.16)

então como deve ser o operador A0 tal que

A0 |χ0n i = an |χ0n i . (2.17)

Substituindo a eq. (2.15) na (2.17), e multiplicando o resultado obtido, a esquerda de ambos os


lados da igualdade, por (S)
Rû† (α) e usando o fato de que os operadores de rotação são unitários,
obtém-se que

(S)
Rû† (α)A0(S) Rû (α) |χn i = an (S) Rû† (α)(S) Rû (α) |χn i = an |χn i (2.18)

da qual, comparando com a (2.16), podemos concluir que

A =(S) Rû† (α)A0(S) Rû (α) (2.19)

Prof. Salviano A. Leão 19


2.1. Operadores de rotação para uma partícula de spin 1/2

ou ainda que
A =(S) Rû† (α)A0(S) Rû (α) (2.20)

ou ainda
A0 =(S) Rû (α)A(S) Rû† (α). (2.21)

Desta última expressão segue então que:

A0 =(S) Rû (2π)A (S) Rû† (2π) = A (2.22)

Esse resultado é totalmente satisfatório, já que uma rotação através de 2π não pode modificar
o dispositivo de medida de A. Portanto, o espectro de A0 deve permanecer o mesmo de A.
Note que já mostramos anteriormente que

(r)
Rû (2π) = 1 (2.23)

portanto, temos que no espaço de estado global E = Er ⊗ Es , assim com em Es que

Rû (2π) = (r) Rû (2π) ⊗ (S) Rû (2π) = −1 (2.24)

2.1.5 Natureza vetorial versus rotação


Considere o estado de spin |χi arbitrário. Mostramos
que, a menos de um fator de fase global, há dois ângulos z
θ e ϕ tais que |χi pode ser reescrito como:

θ θ v = êz
|χi = e−iϕ/2 cos |+i + eiϕ/2 sen |−i (2.25)
2 2
v0
o que significa que |χi é um autovetor associado com o u
autovalor +~/2 da componente S · v do spin S ao longo
θ
do vetor unitário v definido pelos ângulos polares θ e ϕ.
Chamaremos de v0 o resultado da transformação de
v pela rotação em questão. Desde que S é um observá-
vel vetorial, o estado |χ0 i após a rotação deve ser um
ϕ
autovetor com um autovalor de +~/2, da componente y
0 0
S · v do spin S ao longo do vetor unitário v :

|χi = |+iv =⇒ |χ0 i = R |χi ∝ |+iv0 (2.26) x


Figura 2.2: Rotação de um vetor em
com torno de um eixo.
0
v = Rv (2.27)

Aqui iremos simplesmente fazer uma verificação desse resultado, para um caso bem específico.
Portanto, considere o caso em que o vetor v é um vetor unitário ao longo do do eixo Oz , ou
seja, ele é dado por v = êz e que por sua vez o vetor v0 é um vetor unitário arbitrário, com
ângulos polares θ e ϕ.

Prof. Salviano A. Leão 20


2.1. Operadores de rotação para uma partícula de spin 1/2

O vetor v0 é obtido a partir do vetor v = êz por uma rotação através de um ângulo θ em
torno do vetor unitário û, o qual é fixado pelos ângulos polares:
π π
θû = e ϕû = ϕ + (2.28)
2 2
Portanto, devemos mostrar que:

(S)
Rû (θ) |+i ∝ |+iv0 (2.29)

As componentes cartesianas do vetor û são:

ux = − sen ϕ ; uy = cos ϕ ; uz = 0, (2.30)

(S)
então o operador Rû (θ) pode ser escrito, usando a eq. (2.12) como

(S) θ θ
Rû (θ) = cos − iσ · û sen (2.31)
2 2
θ θ
= cos − i (−σx sen ϕ + σy cos ϕ) sen (2.32)
2 2
θ 1 θ
σ+ e−iϕ − σ− eiϕ sen

= cos − (2.33)
2 2 2
com
σ± = σx ± iσy (2.34)

Entretanto como
σ+ |+i = 0 e que σ− |+i = 2 |−i (2.35)
(S)
então, o resultado da transformação do |+i pelo operador Rû (θ) é:

(S) θ θ
Rû (θ) |+i = cos |+i + eiϕ sen |−i (2.36)
2 2
O qual, a menos de um fator de fase, é o ket |+iv0 :

(S)
Rû (θ) |+i = eiϕ/2 |+iv0 (2.37)

2.1.6 Rotação de um spinor com duas componentes


Para um partícula de spin 1/2 cujo estado é representado pelo ket |ψi do espaço de estado
E = Er ⊗ Es . O ket |ψi pode ser representado pelo spinor [ψ](r), de componentes

ψε (r) = hr, ε| ψi . (2.38)

Se realizarmos uma rotação geométrica arbitrária R sobre esta partícula, seu estado torna-se:

|ψ 0 i = R |ψi (2.39)

com
R =(r) R ⊗ (S)
R (2.40)

Prof. Salviano A. Leão 21


2.1. Operadores de rotação para uma partícula de spin 1/2

é em E o operador associado com a rotação geométrica R. Como é o spinor [ψ 0 ](r), o qual


corresponde ao estado |ψ 0 i obtido do spinor [ψ](r) ?
Note que como
ψε0 (r) = hr, ε| ψ 0 i = hr, ε| R |ψi (2.41)

ao inserirmos uma completeza relativa a base {|r0 , ε0 i} entre R e |ψi, obtemos:



0
ψε (r) = d3 r0 hr, ε| R |r0 , ε0 i hr0 , ε0 | ψi . (2.42)
ε0

Agora, desde que os vetores da base {|r, εi} são dados por um produto tensorial, então os
elementos de matriz do operador R nessa base pode ser decomposto na seguinte forma:

hr, ε| R |r0 , ε0 i = hr|(r) R |r0 i hε|(S) R |ε0 i (2.43)

como já sabemos que:

hr|(r) R |r0 i = R−1 r r0 i = δ r0 − (R−1 r)



 
(2.44)

e introduzindo a notação
(1/2)
hε|(S) R |ε0 i = Rε,ε0 (2.45)

temos que
(1/2)
ψε0 (r) = Rε,ε0 ψε0 (R−1 r)
P
(2.46)
ε0

Mais explicitamente, temos


! (1/2) (1/2)
! !
0
ψ+ (r) R+,+ R+,− ψ+ (R−1 r)
0
= (1/2) (1/2) (2.47)
ψ− (r) R−,+ R−,− ψ− (R−1 r)

Prof. Salviano A. Leão 22


Capítulo 3

Adição de Momenta Angulares

3.1 Adição de Momenta Angulares: Caso clássico


Considere um sistema formado por um número n qualquer de partículas, e seja mi a massa
da partícula i (i = 1, 2, . . . , n), cujos vetores posição e velocidade em relação a uma dada origem
O no instante t são respectivamente ri (t) e vi (t). O momentum angular total do sistema em
relação a origem O do sistema de coordenadas é

r4 r5

ri
r1 r
r2 3
y

x
Figura 3.1: Aqui temos um sistema composto por n partículas, e cada uma com o vetor posição ri e
velocidade vi dados em relação a origem do sistema de coordenadas.

n
X n
X
L= ri ×pi = mi ri ×vi (3.1)
i=1 i=1

Em geral, como no caso de uma partícula, L depende do ponto O em relação ao qual é


tomado. Para o momentum linear total P do sistema obtém-se uma simplificação considerável

23
3.1. Adição de Momenta Angulares: Caso clássico

nas equações do sistema, ao tomar-se a origem O do sistema de coordenadas no centro de massa


(CM) do sistema de partículas, cujo vetor posição R é dado por

n
1 X m1 r1 + m2 r2 + · · · + mn rn
R= mi ri = (3.2)
M i=1 m1 + m2 + · · · + mn

Se r0i e vi0 são os vetores posição e velocidade da partícula i em relação ao CM, temos então que

n
X
ri = r0i + R =⇒ mi r0i = 0, (3.3)
i=1

n
X n
X
vi = vi0 + V =⇒ mi vi0 = p0i = 0, (3.4)
i=1 i=1

n
X dR
P=V mi = M V = M , (3.5)
i=1
dt

na qual V é a velocidade do CM. A eq. (3.4) significa que o momentum linear do movimento
interno, ou seja, o momentum resultante em relação ao CM, se anula. Já a eq. (3.5) nos diz que
o CM move-se como se o momentum total P do sistema estivesse concentrado todo nele.
Para ver o que ocorre com o momentum angular total L, basta substituir (3.3) e (3.4) em
(3.1):
n
X
L = mi (r0i + R) × (vi0 + V)
i=1
n n
!
X X
= mi r0i × vi0 + R× mi vi0 +
i=1 i=1
n
! n
X X
mi r0i ×V+ mi R × V
i=1 i=1

Usando (3.3) e (3.4), obtemos


L = L0 + R×P, (3.6)

em que,
n
X n
X
0
L = mi r0i × vi0 = r0i × p0i (3.7)
i=1 i=1

é o momentum angular total do sistema em relação ao CM e R×P é o momentum angular do


CM em relação a O, considerado como se o momentum total P do sistema estivesse concentrado
nele.
Note que,

• chamamos de L0 o momentum angular interno do sistema e R×P de momentum angular


externo.

Prof. Salviano A. Leão 24


3.1. Adição de Momenta Angulares: Caso clássico

• se o CM do sistema de partículas está em repouso (P = 0), temos

L = L0 (CM em Repouso) (3.8)

o que é independente da escolha do ponto de referência O, pois corresponde ao momentum


angular interno.

• ao contrário do momentum linear do movimento interno (relativo ao CM), que sempre


se anula (cf. eq. (3.4)), o momentum angular L0 do movimento interno em geral não se
anula.

3.1.1 Lei Fundamental da Dinâmica das Rotações


O análogo da segunda lei de Newton para rotações, a lei fundamental da dinâmica das
rotações para uma partícula é

dL
τ = r×F = , em que L = r×p, (3.9)
dt

a qual, iremos aplicar a um sistema de muitas partículas.


Derivando (3.1) com relação ao tempo obtemos que
n
! n n
dL d X X dri X dvi
= mi ri × vi = mi × vi + mi ri × ,
dt dt i=1 i=1
dt i=1
dt

logo
n n
dL X dvi X
= mi ri × = mi ri × ai . (3.10)
dt i=1
dt i=1

Se o referencial é inercial, podemos aplicar a segunda lei de Newton a partícula i, escrevendo

n
X
mi ai = FExt.
i + Fij (i = 1, 2, . . . , N ) (3.11)
j=1
j6=i

na qual Fij é a força interna sobre a partícula i devido a partícula j.


Substituindo (3.11) em (3.10) obtemos,
n n n n n n
dL X XX X XX
= ri ×FExt.
i + r i ×F i,j = τ Ext.
i + ri ×Fij (3.12)
dt i=1 i=1 j=1 i=1 i=1 j=1
j6=i j6=i

A dupla somatória em (3.12) pode ser escrita como,


n X
n n n
X 1X X
ri ×Fi,j = [ri ×Fi,j + rj ×Fj,i ] (3.13)
i=1 j=1
2 i=1 j=1
j6=i j6=i

Prof. Salviano A. Leão 25


3.1. Adição de Momenta Angulares: Caso clássico

mi Fij

rij = ri − rj
ri
Fji

O rj mj
Figura 3.2: Força de interação entre duas partículas de massas mi e mj , cuja a linha de ação está
dirigida segundo a linha que une as duas partículas.

da terceira lei de Newton temos que Fi,j = −Fj,i , logo


n X
n n n
X 1X X
ri ×Fij = (ri − rj )×Fij (3.14)
i=1 j=1
2 i=1 j=1
j6=i j6=i

Considerando que as forças internas de interação entre partículas são tais que sua linha de
ação está dirigida segundo a linha que une as duas partículas, ou seja, Fij é paralela ao vetor
(ri − rj ) o que implica (ri − rj )×Fij = 0, então
n X
n n n
X 1X X
ri ×Fij = (ri − rj )×Fij = 0 (3.15)
i=1 j=1
2 i=1 j=1
j6=i j6=i

Logo, o resultante interno dos torques internos do sistema é nulo. Este resultado permanece
válido em condições mais gerais, sem que seja preciso fazer a hipótese acima sobre a linha de
ação das forças de interação.
Substituindo (3.15) em (3.12), obtemos
n n
dL X X
= ri ×FExt.
i = τiExt. = τ Ext. (3.16)
dt i=1 i=1

que é a lei fundamental da dinâmica das rotações para um sistema de partículas: a taxa de
variação com o tempo do momento angular total do sistema em relação a um ponto O (num
referencial inercial) é igual à resultante de todos os torques externos em relação a O que atuam
sobre o sistema.
A restrição a um referencial inercial decorre de termos usado a 2a¯ lei de Newton em (3.11).
O referencial do CM não é necessariamente inercial: se a resultante das forças externas não se
anula, o CM tem uma aceleração A dada por
dP
= M A = FExt. (3.17)
dt
Apesar disto, vamos mostrar que (3.16) permanece válida quando referida ao CM, mesmo que
ele esteja acelerado. Para isto voltemos à (3.10), que vale em qualquer referencial, e apliquemo-la
ao referencial do CM: n n
dL0 X 0 dvi0 X
= mi ri × = mi r0i × a0i . (3.18)
dt i=1
dt i=1

Prof. Salviano A. Leão 26


3.1. Adição de Momenta Angulares: Caso clássico

Se ai é a aceleração da partícula i num referencial inercial, dada por (3.11), temos, por (3.4),

ai = a0i + A, (3.19)

de modo que a eq. (3.18) pode ser reescrita como


n n
!
dL0 X X
= mi r0i × ai − mi r0i ×A
dt i=1 i=1
n n
!
X X
= r0i ×(mi ai ) − mi r0i ×A
i=1 i=1

usando (3.3) e (3.11), podemos reescrever a equação anterior como


n n n
dL0 X 0 XX
= ri ×FExt.
i + r0i ×Fi,j (3.20)
dt i=1 i=1 j=1
j6=i

Note que o último termo de (3.20) se anula pelo mesmo argumento empregado para obter a eq.
(3.16). Portanto, por (3.3), r0i − r0j = ri − rj , de modo que a demonstração permanece válida.
Obtemos então n n
dL0 X 0 X Ext.
= ri ×FExt.
i = τi0 Ext. = τ 0 (3.21)
dt i=1 i=1

em que τ 0Ext. é a resultante dos torques externos em relação ao CM. Vemos portanto que a eq.
(3.16) permanece válida com relação ao CM, mesmo que este esteja acelerado.

3.1.2 Conservação do Momentum Angular: Simetrias e as leis de


conservação
A lei de conservação do momentum angular para qualquer sistema de partículas decorre da
eq. (3.16), assim
τ 0Ext. = 0 ⇐⇒ L = L0 = constante (3.22)

ou seja, se a resultante dos torques externos em relação a um dado ponto se anula, então o
momentum angular do sistema em relação a esse ponto se conserva.
Os principais resultados vistos foram:

• Quando o τ 0Ext. = 0 na ausência de forças externas, ou seja, para um sistema isolado;


neste caso, como o torque é nulo em relação a qualquer ponto do espaço, o momentum
angular em relação a qualquer ponto se conserva.

• A eq. (3.22) é uma lei de conservação vetorial. Isto significa que a conservação de L
implica na:

– conservação de seu módulo, direção e sentido.


– que ela se aplica separadamente a cada componente.

Prof. Salviano A. Leão 27


3.2. Momentum Angular Na Mecânica Quântica

• Se uma dada componente do torque resultante se anula, a componente correspondente do


momento angular total se conserva, independentemente do que se sucede com as demais.

Sabe-se da mecânica clássica que as lei de conservação do momentum angular está a uma
simetria espacial, ou seja, com a isotropia espacial. Portanto, em um sistema físico cujo o espaço
é isotrópico o momentum angular do sistema é conservado.

3.2 Momentum Angular Na Mecânica Quântica


Agora veremos como tratar um sistema de partículas na mecânica quântica. Considere o
caso de duas partículas não-interagentes, cujo o Hamiltoniano do sistema na representação
{|r1 , r2 i} é:
~2 2
H0 = H1 + H2 com Hi = − ∇ + V (Ri ) i = 1, 2 (3.23)
2µi i
em que para cada partícula i temos que, µi é sua massa, Ri é o operador posição, V (Ri ) é o
potencial central sob o qual ela está submetida e ∇i é o operador Laplaciano atuando sobre
suas coordenadas.
Ao estudarmos momentum angular, foi deixado como exercício demostrar os seguintes
comutadores:
[Lk , Pj ] = i~kjn Pn e [Lk , Rj ] = i~kjn Rn (3.24)
e que
Lk , P2 = Lk , R2 = [Lk , R · P] = 0.
   
(3.25)
Como o comutador  
1 Rj
, Pj = −i~ , (3.26)
Rn Rn+2
segue então que
 
1
, Lj = 0. (3.27)
Rn
Dessas relações de comutação segue-se imediatamente, que as três componentes do operador
Li comuta com Hi , ou seja,

[Li , Hi ] = 0 com i = 1, 2 (3.28)

portanto, cada uma das três componentes Li do operador momentum angular L são constantes
do movimento.
Agora considere o caso clássico em que as duas partículas interagem e que a correspondente
energia potencial da interação U (r1 , r2 ) depende somente da distância entre elas, ou seja,

U (r1 , r2 ) = U (|r1 − r2 |) (3.29)

no qual
p
|r1 − r2 | = (x1 − x2 )2 + (y1 − y2 )2 + (z1 − z2 )2 . (3.30)

Prof. Salviano A. Leão 28


3.2. Momentum Angular Na Mecânica Quântica

Nesse caso, o Hamiltoniano do sistema é dado por

H = H1 + H2 + U (|R1 − R2 |) = H0 + U (|R1 − R2 |). (3.31)

Portanto, agora temos que o comutador de Li com H reduz-se a forma

[Li , H] = [Li , U (|R1 − R2 |)]. (3.32)

o qual em geral é diferente de zero. Note que para a componente Liz , em coordenadas cartesianas
temos:  
~ ∂U ∂U
[Liz , H] = [Liz , U (|R1 − R2 |)] = xi − yi . (3.33)
i ∂yi ∂xi
Em geral temos que

[Li , H] 6= 0 e [Liz , H] = [Liz , U (|R1 − R2 |)] 6= 0, (3.34)

logo Li não é mais uma constante de movimento.


Por outro lado, as componentes do operador momentum angular total L,

L = L1 + L2 (3.35)

são constantes do movimento, pois, note por exemplo que

[Lz , H] = [L1z + L2z , H] = [L1z + L2z , U (|R1 − R2 |)]


 
~ ∂U ∂U ∂U ∂U
= x1 − y1 + x2 − y2 ,
i ∂y1 ∂x1 ∂y2 ∂x2

porém como na representação das coordenadas U = U (|r1 − r2 |) = U (r), temos que

∂U ∂U ∂r ∂U x1 − x2
= =
∂x1 ∂r ∂x1 ∂r r
∂U ∂U ∂r ∂U x1 − x2
= =− .
∂x2 ∂r ∂x2 ∂r r
Portanto,
 
~ ∂U y1 − y2 x1 − x2 y1 − y2 x1 − x2
[Lz , H] = x1 − y1 − x2 + y2
i ∂r r r r r
~ 1 ∂U
= [(x1 − x2 )(y1 − y2 ) − (y1 − y2 )(x1 − x2 )]
i r ∂r
= 0. (3.36)

Portanto, pode-se concluir que as componentes do momentum angular total são constantes do
movimento.

3.2.1 Considerações
Note que:

Prof. Salviano A. Leão 29


3.2. Momentum Angular Na Mecânica Quântica

1. Até o momento não mencionamos o spin das partículas.

2. Se considerarmos uma partícula com spin s num campo de força central U (R), cujo
Hamiltoniano é H e o seu momentum angular orbital é L, temos que

[L, H] = 0; [S, H] = 0 e [L, S] = 0. (3.37)

Posteriormente, veremos que ao introduzirmos correções relativísticas no Hamiltoniano da


partícula, surgirá um termo chamado acoplamento spin-órbita cuja a forma é a seguinte,

Hso (r) = ξ(R)L · S. (3.38)

Nessa expressão ξ(R) é uma função conhecida e de uma única variável, o operador R.
Ao introduzirmos essa correção, devido ao acoplamento spin-órbita, na Hamiltoniana H do
sistema, vemos que os operadores L e S não comutam mais com o Hamiltoniano H.
Por exemplo, observe que,

[Lz , Hso ] = ξ(r)[Lz , Lx Sx + Ly Sy + Lz Sz ]


= ξ(r) ([Lz , Lx ]Sx + [Lz , Ly ]Sy ))
= i~ξ(r) (Ly Sx − Lx Sy )) (3.39)

e de modo similar que

[Sz , Hso ] = ξ(r)[Sz , Lx Sx + Ly Sy + Lz Sz ]


= ξ(r) (Lx [Sz , Sx ] + Ly [Sz , Sy ]))
= i~ξ(r) (Lx Sy − Ly Sx )) (3.40)

Definindo operador momentum angular total da partícula como sendo

J = L + S, (3.41)

vemos que
[Jz , H] = [Lz + Sz , H] = 0. (3.42)

Logo como as componentes do operador J comutam com o Hamiltoniano, então ele é uma
constante do movimento.

3.2.2 Momentum angular total de duas partículas


Considere agora o caso de duas partículas com spin de momentum angular total J = J1 + J2 ,
para o qual temos que

[J1 , H] 6= 0; [J2 , H] 6= 0; e [J1 , J2 ] = 0. (3.43)

[J21 , H] 6= 0; [J22 , H] 6= 0; e [J21 , J22 ] = 0. (3.44)

Prof. Salviano A. Leão 30


3.3. Adição de dois Spin 1/2: Método elementar

Portanto, escolher os operadores J1z , J21 , J2z e J22 como C.S.C.O não é uma boa escolha apesar
de formarem uma base de autovetores comuns. Note que nem J1 e nem J2 são constantes do
movimento, porém o operador
J = J1 + J2 , (3.45)

é uma constante de movimento, pois

[J, H] = 0 e [J2 , H] = 0. (3.46)

Portanto, usando a base formada pelos autovetores comuns dos operadores J1z , J21 , J2z e J22 ,
tentaremos construir uma nova base formado pelos autovetores comuns dos operadores de Jz e
J2 , ou seja,

{J1z , J21 , J2z , J22 } =⇒ {Jz , J2 }

3.2.3 Base em termos de Jz e J2


Quanto a essa nova base podemos concluir que:

• Para determinar os estados estacionários do sistema, isto é, os autoestados de H, é mais


simples diagonalizar a matriz que representa H nessa nova base.

• Como [Jz , H] = [J2 , H] = 0, a matriz H pode ser ser dividida em blocos associados aos
auto-subespaços dos vários conjuntos de autovalores de Jz e J2 .

• A estrutura da matriz H é mais simples nessa base do que na base dos autovetores comuns
de J1z , J21 , J2z e J22 , já que em geral nem J1z e nem J2z comutam com H.

3.3 Adição de dois Spin 1/2: Método elementar

3.3.1 Formulação do problema: Espaço de estados


Considere um sistema composto por duas partículas de spin s = 1/2 (por exemplo, elétrons
ou átomos de prata em seu estado fundamental), para o qual o spin será o único grau de
liberdade da partícula. Seja S1 e S2 os operadores de spin das duas partículas, para os quais
temos
S2i |si , mi i = ~2 si (si + 1) |si , mi i com (i = 1, 2) (3.47)

e
Siz |si , mi i = ~mi |si , mi i com (i = 1, 2). (3.48)

O espaço de estado desse sistema, será constituído pelo produto tensorial do espaço de estado
de cada partícula, assim
|s1 , m1 ; s2 , m2 i ≡ |s1 , m1 i ⊗ |s2 , m2 i (3.49)

Prof. Salviano A. Leão 31


3.3. Adição de dois Spin 1/2: Método elementar

Agora, para não carregarmos a notação usaremos a seguinte notação:

|ε1 i = |s1 , m1 i |ε2 i = |s2 , m2 i (3.50)

|ε1 , ε2 i = |s1 , m1 ; s2 , m2 i = |s1 , m1 i ⊗ |s2 , m2 i (3.51)

3.3.2 O Espaço de Estados


Para sistema como o descrito acima, o seu espaço de estados já foi definido, e de acordo com
o que foi visto, ele é um espaço quadridimensional, resultante do produto tensorial dos dois
espaço de estado de spin de cada partícula.
A base ortonormal para esse espaço será:

{|ε1 , ε2 i} = {|+, +i , |+, −i , |−, +i , |−, −i} (3.52)

Note que o spin da cada partícula pode ser si = 1/2, logo o spin total será s = 0, 1. Nessa
notação os possíveis valores para ε1 e ε2 são:

ε1 = ±1 e ε2 = ±1 (3.53)

Esses vetores são os autoestados dos quatro observáveis:

{S21 , S22 , S1z , S2z } (3.54)

para os quais temos que


3
S21 |ε1 , ε2 i = S22 |ε1 , ε2 i = ~2 |ε1 , ε2 i (3.55)
4
1 1
S1z |ε1 , ε2 i = ε1 ~ |ε1 , ε2 i e S2z |ε1 , ε2 i = ε2 ~ |ε1 , ε2 i (3.56)
2 2
Portanto, S21 , S22 , S1z e S2z formam um C.S.C.O. Note que os dois primeiros observáveis são
realmente múltiplos do operador identidade, e o conjunto de operadores restante permanecerá
completamente regular se eles dois forem omitidos.

3.3.3 O Spin Total S: Relações de comutação


Definimos o spin total S do sistema como sendo

S = S1 + S2 (3.57)

Sabendo que tanto S1 quanto S2 são momenta angulares regulares, mostrar que S também o é,
é simples. Basta mostrar que suas componentes satisfazem as mesmas relações de comutação
que S1 e S2 .
Devemos lembrar que:

k = 1, 2
[S1 , S2 ] = 0 e [Skα , Skβ ] = i~α,β,γ Skγ com
α, β, γ = x, y, z.

Prof. Salviano A. Leão 32


3.3. Adição de dois Spin 1/2: Método elementar

Para isso, considere o comutador

[Sα , Sβ ] = [S1α + S2α , S1β + S2β ] com α, β, γ = x, y, z.


= [S1α , S1β ] + [S2α , S2β ]
= i~α,β,γ S1γ + i~α,β,γ S2γ
= i~α,β,γ Sγ

O operador S2 é dado por

S2 = (S1 + S2 )2 = S21 + S22 + 2S1 · S2 (3.58)

já que [S1 , S2 ] = 0. O produto escalar S1 · S2 pode ser expresso em termos das componentes dos
respectivos operadores,
S1 · S2 = S1x S2x + S1y S2y + S1z S2z (3.59)
mas como 
S
kx = 21 (Sk+ + Sk− )
Sk± = Skx ± iSky (3.60)
1
S
ky = 2i
(Sk+ − Sk− )
então podemos escrever
1
S1 · S2 = [(S1+ + S1− )(S2+ + S2− ) − (S1+ − S1− )(S2+ − S2− )] +
4
S1z S2z
1
= [S1+ S2+ + S1+ S2− + S1− S2+ + S1− S2− −
4
S1+ S2+ + S1+ S2− + S1− S2+ − S1− S2− ] + S1z S2z
1
= (S1+ S2− + S1− S2+ ) + S1z S2z
2
Portanto, podemos escrever

S2 = (S1 + S2 )2 = S21 + S22 + 2S1z S2z + S1+ S2− + S1− S2+ (3.61)

Note que como,


[S1 , S21 ] = [S2 , S22 ] = [S21 , S22 ] = [S1 , S2 ] = 0. (3.62)
logo temos que

[Sz , S21 ] =0 [Sz , S22 ]=0 
[S2 , S21 ] =0 2 2
[S , S2 ] = 0 (3.63)

[Sz , S1z ] = 0 [Sz , S2z ] = 0

Além disso, S2 não comuta com S1z e nem com S2z , assim

[S2 , S1z ] = [S21 + S22 + 2S1 · S2 , S1z ]


= 2[S1 · S2 , S1z ]
= 2[S1x S2x + S1y S2y + S1z S2z , S1z ]
= 2 ([S1x , S1z ]S2x + [S1y , S1z ]S2y + [S1z , S1z ]S2z )
= 2i~ (−S1y S2x + S1x S2y ) (3.64)

Prof. Salviano A. Leão 33


3.3. Adição de dois Spin 1/2: Método elementar

Analogamente temos que,

[S2 , S2z ] = [S21 + S22 + 2S1 · S2 , S2z ]


= 2[S1 · S2 , S2z ]
= 2[S1x S2x + S1y S2y + S1z S2z , S2z ]
= 2 (S1x [S2x , S2z ] + S1y [S2y , S2z ] + S1z [S2z , S2z ])
= 2i~ (−S1x S2y + S1y S2x ) (3.65)

Note, portanto que como Sz = S1z + S2z , então

[S2 , Sz ] = [S2 , S1z + S2z ]


= [S2 , S1z ] + [S2 , S2z ]
= 2i~ (−S1y S2x + S1x S2y − S1x S2y + S1y S2x )
= 0. (3.66)

Note que S2 não comuta nem com S1z e nem com S2z , porém ele comuta com Sz = S1z + S2z ,
que é a soma dos dois.

3.3.4 Mudança de base a ser realizada


A base
{|ε1 , ε2 i} = {|+, +i , |+, −i , |−, +i , |−, −i} (3.67)

como vimos é composta pelos autovetores comuns do C.S.C.O:

{S21 , S22 , S1z , S2z } (3.68)

Foi mostrado que os quatro observáveis,

{S21 , S22 , S2 , Sz } (3.69)

comutam, portanto eles também formam um C.S.C.O.


Ao adicionarmos duas partículas de spin S1 e S2 , levando em conta somente o grau de
liberdade de spin, podemos construir um base ortonormal baseada no conjunto de observáveis
(3.69). O vetores de estado dessa base será

{|S, M i}, (3.70)

na qual os autovalores de S21 e S22 permanecem intrinsecamente os mesmos. Portanto, os vetores


|S, M i , satisfazem as seguintes relações

3


 S21 |S, M i = S22 |S, M i = ~2 |S, M i

 4
2 2
S |S, M i = S(S + 1)~ |S, M i (3.71)



Sz |S, M i = M ~ |S, M i

Prof. Salviano A. Leão 34


3.3. Adição de dois Spin 1/2: Método elementar

Sabemos que S é um momentum angular, consequentemente S deve ser um número inteiro


ou semi-inteiro, e além disso M deve variar de −S até S com um passo unitário.
Agora o problema é encontrar quais os valores que S e M podem ter para podermos expressar
os vetores |S, M i em termos daqueles da base conhecida |ε1 , ε2 i.

3.3.5 Os autovalores de Sz e o seus graus de degenerescência


Como os observáveis S21 e S22 são facilmente tratados, pois possuem sempre o mesmo autovalor,
logo todos os vetores da base {|S, M i} serão autovetores deles.
Como Sz comuta com os quatro observáveis {S21 , S21 , S1z , S2z }, então os vetores da base
|ε1 , ε2 i serão automaticamente autovetores de Sz . Assim
1
Sz |ε1 , ε2 i = (S1z + S2z ) |ε1 , ε2 i = (ε1 + ε2 )~ |ε1 , ε2 i (3.72)
2
portanto |ε1 , ε2 i é um autoestado de Sz com autovalor:
1
M = (ε1 + ε2 ) (3.73)
2
Desde que ε1 = ±1 e ε2 = ±1, segue que os possíveis valores de M são: M = −1, 0, 1,.
Note que os valores M = 1 e M = −1 não são degenerados. Somente um único autovetor
corresponde a cada um deles.
1 1
Sz |+, +i = ( + )~ |+, +i = ~ |+, +i
2 2 (3.74)
1 1
Sz |−, −i = (− − )~ |−, −i = −~ |−, −i
2 2
Porém, M = 0 é duplamente degenerado, logo
1 1
Sz |+, −i = ( − )~ |+, −i = 0
2 2 (3.75)
1 1
Sz |−, +i = (− + )~ |−, +i = 0.
2 2
Portanto, qualquer combinação linear desses dois vetores é um autoestado de Sz com autovalor
0.
Esses resultados aparecem claramente na representação matricial de Sz na base |ε1 , ε2 i
 
h+, +|Sz |+, +i h+, +|Sz |+, −i h+, +|Sz |−, +i h+, +|Sz |−, −i
 
h+, −|Sz |+, +i h+, −|Sz |+, −i h+, −|Sz |−, +i h+, −|Sz |−, −i
(Sz ) = ~ 
h−, +|S |+, +i h−, +|S |+, −i h−, +|S |−, +i h−, +|S |−, −i
 (3.76)
 z z z z 
h−, −|Sz |+, +i h−, −|Sz |+, −i h−, −|Sz |−, +i h−, −|Sz |−, −i
 
1 0 0 0
 
0 0 0 0 
(Sz ) = ~ 
  (3.77)
 0 0 0 0 

0 0 0 −1

Prof. Salviano A. Leão 35


3.3. Adição de dois Spin 1/2: Método elementar

3.3.6 Diagonalização de S2
Tudo que resta a ser feito é diagonalizar a matriz que representa S2 na base |ε1 , ε2 i. Já
sabemos que ela não é diagonal.

3.3.6.1 Cálculo dos elementos de matriz de S2

Usaremos seguinte expressão:

S2 = S21 + S22 + 2S1z S2z + S1+ S2− + S1− S2+ (3.78)

e além disso, usaremos o fato de que:

S+ |+i = 0 |+i S+ |−i = ~ |+i


(3.79)
S− |+i = ~ |−i S− |−i = 0

Logo,
 
2 3 2 3 2 1
S |+, +i = ~ + ~ |+, +i + ~2 |+, +i = 2~2 |+, +i
4 4 2
 
2 3 2 3 2 1
S |+, −i = ~ + ~ |+, −i − ~2 |+, −i + ~2 |−, +i = ~2 (|+, −i + |−, +i) .
4 4 2
  (3.80)
2 3 2 3 2 1
S |−, +i = ~ + ~ |−, +i − ~2 |−+i + ~2 |+, −i = ~2 (|−, +i + |+, −i) .
4 4 2
 
2 3 2 3 2 1
S |−, −i = ~ + ~ |−, −i + ~2 |−, −i = 2~2 |−, −i
4 4 2

3.3.6.2 Matriz S2

 
h+, +|S2 |+, +i h+, +|S2 |+, −i h+, +|S2 |−, +i h+, +|S2 |−, −i
2 2 2 2
 
 h+, −|S |+, +i h+, −|S |+, −i h+, −|S |−, +i h+, −|S |−, −i 
(S2 ) = ~ 
h−, +|S2 |+, +i h−, +|S2 |+, −i h−, +|S2 |−, +i h−, +|S2 |−, −i
 (3.81)
 
2 2 2 2
h−, −|S |+, +i h−, −|S |+, −i h−, −|S |−, +i h−, −|S |−, −i
 
2 0 0 0
 
2 2
 0 1 1 0 
(S ) = ~ 
 0 1 1 0

 (3.82)
 
0 0 0 2
Comentários:

• Os zeros já eram esperados, pois os autovetores |+, +i e |−, −i não possuem autovalores
degenerados para Sz .

• Como S2 comuta com Sz , ela portanto, terá elementos de matriz não-nulos somente entre
os autovetores de Sz associados com o mesmo autovalor, ou seja, os degenerados.

Prof. Salviano A. Leão 36


3.3. Adição de dois Spin 1/2: Método elementar

3.3.6.3 Autovalores e autovetores de S2

A matriz (S2 ) pode ser dividida em três submatrizes, como mostradas, sendo duas delas
unidimensionais, pois os vetores |+, +i e |−, −i são autovetores de S2 , e ambos possuem o
mesmo autovalor 2~2 .
Para encontrarmos os outros dois autovetores de (S2 ), devemos diagonalizar a submatriz
2 × 2: !
1 1
(S2 )0 = ~2 (3.83)
1 1
a qual representa S2 no subespaço bidimensional expandido pelos vetores |+, −i e |−, +i, isto é,
o subespaço de Sz correspondendo aos autovalores com M = 0. Os autovalores da submatriz
(3.83) são obtidos resolvendo a equação (S2 )0 |ψiλ = ~2 λ |ψiλ , ou na forma matricial
! ! !
1 − λ 1 a 1 − λ 1
~2 = 0 =⇒ det =0 (3.84)
1 1−λ b 1 1−λ

Resolvendo a equação característica, obtemos que



0
(1 − λ)2 − 1 = 0 =⇒ λ= (3.85)
2

Portanto, os autovalores de S2 são 0 e 2~2 . Bom agora devemos encontrar seus respectivos
autovetores. Para isso Considere inicialmente o caso em que λ = 0, para o qual

|ψiλ=0 = a |+, −i + b |−, +i e S2 |ψi = ~2 λ |ψi (3.86)

logo, na forma matricial temos


! ! ! !
1−λ 1 a 1 1 a
~2 =0 ou =0 (3.87)
1 1−λ b 1 1 b

Essa equação fornece duas equações idênticas

a+b=0 =⇒ a = −b (3.88)

Nesse caso, precisamos de uma condição extra, que é o fato de hψ | ψi = 1, ou seja, a normalização
de |ψi. Essa condição leva a
|a|2 + |b|2 = 1 (3.89)

Usando o fato de que a = −b, na equação anterior, obtemos que


1 1
a= √ e b = −√ (3.90)
2 2
Portanto,
1
|ψiλ=0 = √ (|+, −i − |−, +i) Autovalor 0 (3.91)
2

Prof. Salviano A. Leão 37


3.3. Adição de dois Spin 1/2: Método elementar

Note que, este também é um autovetor Sz = S1z + S2z com autovalor,

1
Sz |ψiλ=0 = √ (Sz |+, −i − Sz |−, +i)
2
 
1 1 1 1 1
= √ + ~ |+, −i − ~ |+, −i + ~ |−, +i − ~ |−, +i
2 2 2 2 2
=0. (3.92)

Então o autovalor de Sz desse autovetor é zero.


Para λ = 2 temos que

|ψiλ=2 = a |+, −i + b |−, +i e S2 |ψi = ~2 λ |ψi (3.93)

logo, na forma matricial temos


! ! ! !
1−λ 1 a −1 1 a
~2 =0 ou =0 (3.94)
1 1−λ b 1 −1 b

Essa equação fornece duas equações idênticas

a−b=0 =⇒ a=b (3.95)

Com a normalização |a|2 + |b|2 = 1, e o fato de que a = b, temos

1 1
a= √ e b= √ (3.96)
2 2

Portanto,
1
|ψiλ=2 = √ (|+, −i + |−, +i) Autovalor 2~2 (3.97)
2
Note que, este também é um autovetor Sz = S1z + S2z e que o seu autovalor é dado por

1
Sz |ψiλ=2 = √ (Sz |+, −i + Sz |−, +i)
2
 
1 1 1 1 1
=√ ~ |+, −i − ~ |+, −i − ~ |−, +i + ~ |−, +i
2 2 2 2 2
= 0. (3.98)

Então o autovalor de Sz desse autovetor é também é zero.


Nota

• O operador S2 possui somente dois autovalores distintos: 0 e 2~2 .

• O autovalor 0 de S2 é não-degenerado.

• O autovalor 2~2 de S2 é triplamente degenerado.

Prof. Salviano A. Leão 38


3.3. Adição de dois Spin 1/2: Método elementar

3.3.7 Resultado: estados tripletos e singletos


Obtivemos todo o espectro de autovalores de S2 e Sz , e como na base {|S, M i} temos

S2 |S, M i = S(S + 1)~2 |S, M i ; Sz |S, M i = M ~ |S, M i (3.99)

então temos que S(S + 1) = 0 o que significa S = 0 ou S(S + 1) = 2 o que significa S = 1. O


valor S = 0 está associado com um único vetor da base |ε1 , ε2 i, que também é um autovetor
de Sz , com autovalor M = 0. Já que ele é uma combinação linear de |+, −i e |−, +i, podemos
chamá-lo na base {|S, M i} de |0, 0i, assim
1
|0, 0i = √ (|+, −i − |−, +i) (3.100)
2
e os outros três vetores para S = 1 e com diferentes valores de M são:

|1, 1i = |+, +i
1
|1, 0i = √ (|+, −i + |−, +i) (3.101)
2
|1, −1i = |−, −i

Pode-se mostrar facilmente que,

• os quatro vetores |S, M i anteriores formam uma base ortonormal. Ao especificarmos os


valores de S e M , selecionamos um único vetor de estado dessa base.

• que S2 e Sz constituem um C.S.C.O. no qual poderia ser incluído os operadores S21 e S22 ,
embora não seja necessário.

Quando adicionamos dois spins 1/2 (s1 = s2 = 1/2) o número quântico S que caracteriza os
autovalores S(S + 1)~2 dos autovetores |S, M i do observável S2 , pode ter dois valores: 0 ou 1.
Com cada um desses valores de S está associado uma família de (2S + 1) vetores de estado
ortogonais (três para S = 1 e um S = 0) correspondendo aos (2S + 1) valores de M , os quais
são compatíveis com S.

3.3.8 Comentários
1. A família dos três vetores |S = 1, M i, com M = −1, 0, 1, constitui os estados tripletos,
enquanto o vetor |S = 0, M = 0i é chamado de um estado singleto.

2. Os estados tripletos são simétricos com relação a troca de dois spin, enquanto o estado
singleto é anti-simétrico. Isso significa que se cada vetor |ε1 , ε2 i for trocado pelo vetor
|ε2 , ε1 i, os estados tripletos na base {|SM i} permanecerão invariantes enquanto, o estado
singleto irá trocar de sinal.

Prof. Salviano A. Leão 39


3.4. Revisão da teoria do momentum angular

3.4 Revisão da teoria do momentum angular


Considere um espaço de estados E, composto pelos autovetores comuns a J2 e Jz , com uma
base {|k, j, mi}, tal que
J2 |k, j, mi = j(j + 1)~2 |k, j, mi
(3.102)
Jz |k, j, mi = m~ |k, j, mi .
Vimos que os operadores J± = Jz ± iJy , atuam sobre os vetores |k, j, mi da seguinte forma
p
J± |k, j, mi = j(j + 1) − m(m ± 1)~ |k, j, m ± 1i . (3.103)

Seja E(k, j) o espaço de estado vetorial expandido pelo conjunto de vetores da base padrão
a qual corresponde aos valores de k e j fixos. Existem (2j + 1) desses vetores, e de acordo com
(3.102) e com (3.103) eles podem ser transformados uns nos outros pela ação dos operadores
J2 , Jz , J+ e J− . Esse espaço de estado pode ser considerado como sendo uma soma direta dos
subespaços ortogonais E(k, j) os quais possuem as seguintes propriedades:

3.5 Propriedades do subespaço E(k, j)


1. E(k, j) é um subespaço (2j + 1)–dimensional.

2. E(k, j) é globalmente invariante sobre a ação de J2 , Jz , J+ e J− , em geral de uma função


qualquer da forma F (J).

3. Os operadores J2 , Jz , J+ , J− e F (J) possuem elementos de matriz não nulos somente


dentro de cada subespaço E(k, j).

4. Dentro de um subespaço E(k, j), os elementos de matriz de uma função qualquer F (J) de
J são independentes de k.

3.6 Espaço de estados de dois momenta angulares


Considere um sistema constituído pela união de dois sistemas, cujos espaços de estados E1 (k, j)
e E2 (k, j), são conhecidos. Esse espaços de estados são dado pela base padrão {|kα , jα , mα i}
composta pelos autovetores comuns dos operadores J2α e Jαz , em que α = (1, 2). Temos que

J2α |kα , jα , mα i = jα (jα + 1)~2 |kα , jα , mα i


Jαz |kα , jα , mα i = mα ~ |kα , jα , mα i (3.104)
p
Jα± |kα , jα , mα i = jα (jα + 1) − mα (mα ± 1)~ |kα , jα , mα ± 1i .

com α = (1, 2).


O espaço de estado do sistema global é dado pelo produto tensorial

E = E1 ⊗ E2 (3.105)

Prof. Salviano A. Leão 40


3.6. Espaço de estados de dois momenta angulares

e nessa base os vetores de estado são

|k1 , k2 ; j1 , j2 ; m1 , m2 i = |k1 , j1 , m1 i ⊗ |k2 , j2 , m2 i . (3.106)

Os espaços de estado E1 e E2 podem ser considerados como sendo a soma direta dos subespaços
E1 (k1 , j1 ) e E2 (k2 , j2 ), os quais possuem as propriedades relatadas anteriormente. Assim
X X
E1 = E1 (k1 , j1 ) e E2 = E2 (k2 , j2 ), (3.107)
⊕ ⊕

e consequentemente
X
E= E(k1 , k2 ; j1 , j2 ), com E(k1 , k2 ; j1 , j2 ) = E1 (k1 , j1 ) ⊗ E2 (k2 , j2 ).

A dimensão do subespaço E(k1 , k2 ; j1 , j2 ) é portanto

(2j1 + 1) × (2j2 + 1). (3.108)

Esse subespaço é globalmente invariante sobre a ação de uma função qualquer de J1 e J2 .

3.6.1 Momentum angular total: Relações de comutação


O momentum angular total do sistema em consideração é

J = J 1 + J2 (3.109)

Como os operadores J1 e J2 são momenta angulares regulares, pois satisfazem todas as relações
de comutação que caracterizam um momentum angular. Agora mostraremos que J também é
um momentum angular, pois suas componentes satisfazem as mesmas relações de comutação
que J1 e J2 .
Como J1 e J2 comutam com J21 e J22 , então J também irá comutar com eles,

k = 1, 2
[J1 , J2 ] = 0 e [Jkα , Jkβ ] = i~α,β,γ Jkγ com
α, β, γ = x, y, z.

[J1 , J21 ] = [J2 , J22 ] = 0 [J2 , J21 ] = [J1 , J22 ] = 0 (3.110)

[J, J21 ] = [J, J22 ] = 0 (3.111)

E além disso temos que o comutador

[Jα , Jβ ] = [J1α + J2α , J1β + J2β ] com α, β, γ = x, y, z.


= [J1α , J1β ] + [J2α , J2β ]
= i~α,β,γ J1γ + i~α,β,γ J2γ
= i~α,β,γ Jγ

Prof. Salviano A. Leão 41


3.6. Espaço de estados de dois momenta angulares

Em particular, J2 e Jz comutam com J21 e J22 :

[Jz , J21 ] = [Jz , J22 ] = 0 (3.112)


= [J2 , J22 ] = 0. (3.113)

Além disso, J1z e J2z , obviamente comutam com Jz :

[J1z , Jz ] = [J2z , Jz ] = 0, (3.114)

mas não com J2 , já que esse operador pode ser escrito em termos de J1 e J2 na forma:

J2 = (J1 + J2 )2 = J21 + J22 + 2J1 · J2 . (3.115)

Como [J1 , J2 ] = 0. O produto escalar J1 · J2 pode ser expresso em termos das componentes
dos respectivos operadores,

J1 · J2 = J1x J2x + J1y J2y + J1z J2z (3.116)

mas como 
J
kx = 21 (Jk+ + Jk− )
Jk± = Jkx ± iJky (3.117)
1
J
ky = 2i
(Jk+ − Jk− )
então podemos escrever

1
J1 · J2 = [(J1+ + J1− )(J2+ + J2− ) − (J1+ − J1− )(J2+ − J2− )] + J1z J2z
4
1
= [J1+ J2+ + J1+ J2− + J1− J2+ + J1− J2− −
4
J1+ J2+ + J1+ J2− + J1− J2+ − J1− J2− ] + J1z J2z
1
= (J1+ J2− + J1− J2+ ) + J1z J2z
2
Portanto, podemos escrever

J2 = (J1 + J2 )2 = J21 + J22 + 2J1z J2z + J1+ J2− + J1− J2+ (3.118)

Como,

[J1 , J21 ] = 0 [J2 , J22 ] = 0


=0 [J1 , J2 ] = 0.

logo temos que

[Jz , J21 ] = [Jz , J22 ] = 0


= [J2 , J22 ] = 0
= [Jz , J2z ] = 0.

Prof. Salviano A. Leão 42


3.6. Espaço de estados de dois momenta angulares

Além disso, J2 não comuta com J1z e nem com J2z , assim

[J2 , J1z ] = [J21 + J22 + 2J1 · J2 , J1z ]


= 2[J1 · J2 , J1z ]
= 2[J1x J2x + J1y J2y + J1z J2z , J1z ]
= 2 ([J1x , J1z ]J2x + [J1y , J1z ]J2y + [J1z , J1z ]J2z )
= 2i~ (−J1y J2x + J1x J2y )

Analogamente temos que,

[J2 , J2z ] = [J21 + J22 + 2J1 · J2 , J2z ]


= 2[J1 · J2 , J2z ]
= 2[J1x J2x + J1y J2y + J1z J2z , J2z ]
= 2 (J1x [J2x , J2z ] + J1y [J2y , J2z ] + J1z [J2z , J2z ])
= 2i~ (−J1x J2y + J1y J2x )

Portanto, como Jz = J1z + J2z , segue que

[J2 , Jz ] = [J2 , J1z + J2z ]


= [J2 , J1z ] + [J2 , J2z ]
= 2i~ (−J1y J2x + J1x J2y − J1x J2y + J1y J2x )
=0

Note que J2 não comuta nem com J1z e nem com J2z , porém ele comuta com Jz = J1z + J2z ,
que é a soma dos dois.

3.6.2 Mudança de base a ser realizada


Um vetor |k1 , k2 ; j1 , j2 ; m1 , m2 i é um autoestado simultâneo dos observáveis

{J21 , J22 , J1z , J2z } (3.119)

com os respectivos autovalores

J21 |k1 , k2 ; j1 , j2 ; m1 , m2 i = j1 (j1 + 1)~2 |k1 , k2 ; j1 , j2 ; m1 , m2 i (3.120)


J22 |k1 , k2 ; j1 , j2 ; m1 , m2 i = j2 (j2 + 1)~2 |k1 , k2 ; j1 , j2 ; m1 , m2 i (3.121)
J1z |k1 , k2 ; j1 , j2 ; m1 , m2 i = m1 ~ |k1 , k2 ; j1 , j2 ; m1 , m2 i (3.122)
J2z |k1 , k2 ; j1 , j2 ; m1 , m2 i = m2 ~ |k1 , k2 ; j1 , j2 ; m1 , m2 i (3.123)

Mostrou-se que essa base é muito boa para estudarmos os momenta angulares individuais J1
e J2 de dois subsistemas.
Foi mostrado que os quatro observáveis,

{J21 , J22 , J2 , Jz } (3.124)

Prof. Salviano A. Leão 43


3.6. Espaço de estados de dois momenta angulares
 
 

 ··· 

 
 
 
 
 
 

 ··· 

 
 
 
 
 
 
 
 

 ··· 

 
 . .. .. ..
...

 .
 . . . .


 
 
 
 
···
Figura 3.3: Ilustra a forma da matriz Jz e J2 , que são blocos diagonais.

também comutam, portanto eles também formam um C.S.C.O.


Agora encontraremos um sistema ortonormal de autovetores comuns desses observáveis: essa
nova base será bem adaptada ao estudo do momentum angular total de um sistema. Essa base é
diferente da anterior, pois J2 não comuta com J1z e nem com J2z .
Deve-se ressaltar que:

• O subespaço E(k1 , k2 ; j1 , j2 ) é globalmente invariante sobre a ação de um operador qualquer


o qual é uma função de J1 e J2 , e portanto sobre a ação de uma função qualquer do
momentum angular total J.

• As matrizes que representam J2 e Jz no subespaço E(k1 , k2 ; j1 , j2 ) são bloco diagonais;

• Para diagonalizar o sistema, devemos diagonalizar em cada subespaço o bloco de uma


submatriz de dimensão (2j1 + 1) × (2j2 + 1), o que consiste em uma mudança de base,
específica para cada bloco, ou seja, em cada subespaço E(k1 , k2 ; j1 , j2 ).

• Os elementos de matriz na base {|k1 , k2 ; j1 , j2 ; m1 , m2 i} de uma função qualquer de J1 e


J2 são independentes de k1 e k2 , disso segue, J2 e Jz também são independentes de k1 e
k2 .

• Portanto, o problema da diagonalização de J2 e Jz é o mesmo dentro de todos os subespaços


E(k1 , k2 ; j1 , j2 ) os quais corresponde ao mesmo valor de j1 e j2 .

• Por isso, diz-se que adiciona-se os momenta angulares j1 e j2 , sem especificarmos os outros
números quânticos.

Prof. Salviano A. Leão 44


3.7. Autovalores de J 2 e Jz

• Então para simplificar a notação, de agora em diante omitiremos os índices k1 e k2 . Assim

E(j1 , j2 ) ≡ E(k1 , k2 ; j1 , j2 ) (3.125)


|j1 , j2 ; m1 , m2 i ≡ |k1 , k2 ; j1 , j2 ; m1 , m2 i (3.126)

Como o subespaço E(j1 , j2 ) é globalmente invariante sobre a ação de um operador qualquer,


o qual é uma função do momentum angular total J, então E(j1 , j2 ) é uma soma direta dos
subespaços ortogonais E(k, J), cada um dos quais são globalmente invariante sobre a ação dos
operadores J21 , Jz , J+ e J− :
X
E(j1 , j2 ) = E(k, J), (3.127)

Portanto, agora ficamos com dois problemas:

1. Dado j1 e j2 , quais são os valores de J que aparecem em (3.127), e quantos são os


subespaços distintos E(k, J) que estão associados com cada um deles?

2. Como podemos expandir os autovetores de J21 e Jz pertencentes a E(j1 , j2 ) sobre a base


{|j1 , j2 ; m1 , m2 i}?

3.7 Autovalores de J 2 e Jz

3.7.1 Caso especial: Dois spins 1/2


Iremos por um questão de simplicidade considerar inicialmente o caso em que os espaços
de estados E1 e E2 , constituem o subespaço de cada uma das partículas de spin 1/2, assim
E = E1 ⊗ E2 = E(j1 , j2 ), com j1 = j2 = 1/2. Por se tratar de spin, em vez de j, chamaremos de
S, portanto temos que

S = 0 ⇒ M =0
S = j1 + j2 = 1 =⇒ (3.128)
S = 1 ⇒ M = −1, 0, 1

Nesse caso temos que:

• O espaço de estados E = E(1/2, 1/2) deve ser uma soma direta dos subespaços E(k, S) de
(2S + 1)-dimensão.

• Cada um desses subespaços contém um e somente um autovetor de Sz , correspondendo a


cada um dos valores de M tal que |M | ≤ S.

• Os autovalores de Sz , M = ±1, são não-degenerados enquanto M = 0, ele é duplamente


degenerado.

Prof. Salviano A. Leão 45


3.7. Autovalores de J 2 e Jz

3.7.2 Autovalores de Jz e o seu grau de degenerescência


O subespaço E(j1 , j2 ) tem dimensão (2j1 + 1) × (2j2 + 1). Aqui iremos considerar que,

j1 ≥ j2 .

Os vetores |j1 , j2 ; m1 , m2 i são autoestados de Jz , com

Jz |j1 , j2 ; m1 , m2 i = (J1z + J2z ) |j1 , j2 ; m1 , m2 i (3.129)


= (m1 + m2 )~ |j1 , j2 ; m1 , m2 i (3.130)
= M ~ |j1 , j2 ; m1 , m2 i (3.131)

e os correspondentes autovalores M ~ são tais que

M = m1 + m2 . (3.132)

Consequentemente M pode ser qualquer um dos seguintes valores:

M = j1 + j2 , j1 + j2 − 1, j1 + j2 − 2, . . . , −(j1 + j2 ) + 2, −(j1 + j2 ) + 1, −(j1 + j2 )

Usaremos um procedimento geométrico para encontrar a degenerescência gj1 ,j2 (M ).


A cada vetor |j1 , j2 ; m1 , m2 i, associamos em um diagrama bidimensional os pontos cuja
abcissa é m1 e cuja ordenada é m2 .

• Todos esses pontos estão situados dentro, ou sobre os lados de um retângulo cujo os cantos
são: (j1 , j2 ), (j1 , −j2 ), (−j1 , −j2 ) e (−j1 , j2 ).

• Na figura 3.4 representamos os 15 pontos associados com os vetores da base no caso em


que j1 = 2 e j2 = 1.

• Todos os pontos situados sobre a mesma linha pontilha vermelha correspondem aos mesmos
valores de M = m1 + m2 .

• O número de tais pontos é portanto, igual a degenerescência gj1 ,j2 (M ) deste valor de M .

3.7.3 Degenerescência de Jz
Quanto a degenerescência de Jz , note que:

gj1 ,j2 (j1 + j2 ) = 1 na figura gj1 ,j2 (3) = gj1 ,j2 (−3) = 1 (3.133)

enquanto para

gj1 ,j2 (j1 + j2 − 1) = 2 na figura gj1 ,j2 (2) = gj1 ,j2 (−2) = 2
gj1 ,j2 (j1 + j2 − 2) = 3 na figura gj1 ,j2 (1) = gj1 ,j2 (−1) = 3
gj1 ,j2 (j1 + j2 − 3) = 3 na figura gj1 ,j2 (0) = 3

Prof. Salviano A. Leão 46


3.7. Autovalores de J 2 e Jz

m2

(-2,1) (-1,1) (0,1) (1,1) (2,1)

M
M

M
=

=
=

=

2
m1

0
1

1
(-2,0) (-1,0) (0,0) (1,0) (2,0)
M
=

2

(-2,-1) (-1,-1) (0,-1) (1,-1) (2,-1)

Figura 3.4: Par de possíveis valores (m1 , m2 ) para os kets |j1 , j2 ; m1 , m2 i. Aqui j1 = 2 e j2 = 1.
Os pontos associados com um dado valor de M = m1 + m2 estão situados sobre uma linha reta de
inclinação −1 (linha pontilhada vermelha).

g2,1 (M )

M
0

−3 −2 −1 0 1 2 3
Figura 3.5: Valores do grau de degenerescência gj1 ,j2 (M ) como uma função de M . Aqui j1 = 2 e
j2 = 1. Os graus de degenerescência gj1 ,j2 (M ) são obtidos simplesmente pela contagem do número de
pontos sobre as correspondentes linhas pontilhadas vermelhas da figura 3.4.

Prof. Salviano A. Leão 47


3.7. Autovalores de J 2 e Jz

3.7.4 Autovalores de J 2 : primeira forma


Note que, quanto a valor de M temos que:

• se j1 e j2 forem ambos semi-inteiros ou ambos inteiros, então J = j1 + j2 será inteiro, e


portanto M será um inteiro.

• Se j1 ou j2 for semi-inteiros e o outro inteiro, então J = j1 + j2 será semi-inteiro, e portanto


M será um semi-inteiro.

• O valor máximo alcançado por M foi j1 + j2 , e nenhum dos valores de J, maiores do que
j1 + j2 são encontrados em E(j1 , j2 ) e portanto não aparecem na soma direta,
X
E(j1 , j2 ) = E(k, j). (3.134)

• Como o valor de J = j1 + j2 , está associado a um subespaço invariante, desde que


M = j1 + j2 exista, e somente um, desde que M = j1 + j2 não seja degenerado. Nesse sub-
espaço E(J = j1 +j2 ), há um e somente um vetor o qual corresponde a M = M = j1 +j2 −1;
porém esse valor de M é duplamente degenerado em E(j1 , j2 ); portanto, J = j1 + j2 − 1
também ocorre, e a ele corresponde um único sub-espaço invariante E(J = j1 + j2 − 1).

• Como o valor de J = j1 + j2 e M = J = j1 + j2 , está associado a um e somente um


subespaço invariante E(J = j1 + j2 ), pois a degenerescência gj1 ,j2 (j1 + j2 ) = 1.

• Para J = j1 + j2 − 1, o valor de M é duplamente degenerado, em E(j1 , j2 ), portanto,


J = j1 + j2 − 1 ocorre e corresponde a um único subespaço invariante E(J = j1 + j2 − 1).

Classicamente o comprimento da soma de dois vetores satisfazem a seguinte desigualdade:

|J1 − J2 | ≤ |J1 + J2 | ≤ |J1 + J2 | = J1 + J2 (3.135)

Com Jz = J1z + J2z , temos então que M = m1 + m2 e como os valores máximos de m1 e m2


são respectivamente j1 e j2 então o valor máximo de Mmax = m1max + m2max = j1 + j2 e como
|M | ≤ J, então podemos concluir que Jmax = j1 + j2 .
Para determinar o valor mínimo de J (Jmin ), usaremos o fato de que há (2j1 + 1) × (2j2 + 1)
kets |J, M i. Para cada valor de J há (2j + 1) autoestados |J, M i, então temos que;

JX
max

(2j + 1) = (2j1 + 1) × (2j2 + 1) (3.136)


j=Jmin

Note que a soma dos termos de uma progressão aritmética é dada por
nf
X (nf − ni + 1) · (anf + ani )
ai = , (3.137)
i=ni
2

Prof. Salviano A. Leão 48


3.7. Autovalores de J 2 e Jz

J2
J2

J2
J1 +

2
J1 + J
J2

−J2 J1 J1
J1

2
J1 + J
J2
J1 −
Alinhamento qualquer Alinhamento com Alinhamento com
soma máxima soma mínima
Figura 3.6: Classicamente os valores mínimo e máximo de soma de dois vetores, satisfazem a
desigualdade do triângulo: |J1 − J2 | ≤ |J1 + J2 | ≤ J1 + J2 .

logo, usando este fato, podemos escrever


1
(Jmax − Jmin + 1) · (2Jmax + 1 + 2Jmin + 1) = (2j1 + 1) × (2j2 + 1)
2
[(Jmax + 1) − Jmin ] · [(Jmax + 1) + Jmin ] = 4j1 j2 + 2j1 + 2j2 + 1
(Jmax + 1)2 − Jmin
2
= 4j1 j2 + 2j1 + 2j2 + 1
2 2
Jmax + 2Jmax + 1 − Jmin = 4j1 j2 + 2j1 + 2j2 + 1
(j1 + j2 )2 + 2j1 + 2j2 − Jmin
2
= 4j1 j2 + 2j1 + 2j2
j12 + j22 + 2j1 j2 − Jmin
2
= 4j1 j2
j12 + j22 − 2j1 j2 = Jmin
2

(j1 − j2 )2 = Jmin
2

como J ≥ 0, então segue imediatamente que

Jmin = |j1 − j2 |. (3.138)

Portanto, temos que


|j1 − j2 | ≤ J ≤ j1 + j2 . (3.139)

3.7.5 Autovalores de J 2 : segunda forma


O resultado, também pode ser obtido, ao percebermos que de forma geral, podemos denotar
por pj1 ,j2 (J) o número de subespaços E(k, J) de E(j1 , j2 ) associados com um dado valor de J,

Prof. Salviano A. Leão 49


3.8. Autovetores comuns de J2 e Jz

isto é, o número de diferentes valores de k para esse valor de J, mantendo-se fixo os valores de
j1 e j2 . Note que há uma relação muito próxima entre os pj1 ,j2 (J) e os gj1 ,j2 (M ). Considere o
particular de M . Para ele corresponder a um e somente um vetor em cada sub-espaço E(k, J)
tal que J ≥ |M |. O seu grau de degenerescência gj1 ,j2 (M ) em E(j1 , j2 ), pode portanto ser escrito
como:

gj1 ,j2 (M ) =pj1 ,j2 (J = |M |) + pj1 ,j2 (J = |M | + 1)+


pj1 ,j2 (J = |M | + 2) + · · ·

Invertendo ela, obtemos pj1 ,j2 (J) em função de gj1 ,j2 (M ), assim

pj1 ,j2 (J) = gj1 ,j2 (M = J) − gj1 ,j2 (M = J + 1) (3.140)


= gj1 ,j2 (M = −J) − gj1 ,j2 (M = −J − 1) (3.141)

Temos que,
pj1 ,j2 (J) = 0 para J > j1 + j2 (3.142)
já que gj1 ,j2 (M ) é zero para |M | > j1 + j2 . Além disso, para J = j1 + j2 e M = J = j1 + j2 ,
temos

pj1 ,j2 (J) = gj1 ,j2 (M ) = 1


pj1 ,j2 (J − 1) = gj1 ,j2 (M − 1) − gj1 ,j2 (M ) = 1
pj1 ,j2 (J − 2) = gj1 ,j2 (M − 2) − gj1 ,j2 (M − 1) = 1

Portanto, iterativamente encontramos que

pj1 ,j2 (J = j1 + j2 ) = pj1 ,j2 (J = j1 + j2 − 1) = pj1 ,j2 (J = j1 + j2 − 2)


= · · · = pj1 ,j2 (J = j1 − j2 ) = 1

e finalmente, para o limite inferior temos:

pj1 ,j2 (J) = 0 para J < j1 − j2 (3.143)

Portanto, para valores fixos de j1 e j2 , isto é, dentro do subespaço E(j1 , j2 ) , os autovalores de


J2 são tais que
J = j1 + j2 , j1 + j2 − 1, j1 + j2 − 2, . . . , |j1 − j2 |. (3.144)

3.8 Autovetores comuns de J2 e Jz


Designaremos por |J, M i os autovetores comuns de J2 e Jz pertencentes ao espaço de estados
E(j1 , j2 ) e

J2k |J, M i = jk (jk + 1)~2 |J, M i k = 1, 2 (3.145)


J2 |J, M i = J(J + 1)~2 |J, M i (3.146)
Jz |J, M i = M ~ |J, M i (3.147)

Prof. Salviano A. Leão 50


3.8. Autovetores comuns de J2 e Jz

3.8.1 Caso especial spin 1/2

Antes de apresentarmos os resultados gerais, apresentaremos o caso particular de duas


partículas de spin 1/2, em valem todos os resultados estabelecidos para a base {|S, M i}. Nesse
caso temos:
S = S1 + S2 e Sz = S1z + S2z (3.148)

S2 |S, M i = S(S + 1)~2 |S, M i (3.149)


Sz |S, M i = M ~ |S, M i (3.150)

Aqui S = 1 e M = 1, 0, −1.

3.8.2 Duas partículas de spin 1/2: O subespaço E(S = 1)

O ket |+, +i é, no espaço de estado E(1/2, 1/2), o único autovetor de Sz associado com o
valor M = 1. Como [S2 , Sz ] = 0 e o valor M = 1 é não-degenerado, então o ket |+, +i deve
ser um autovetor de S2 . Assim |S = 1, M = 1i = |1, 1i, e portanto podemos escolher a fase do
vetor |1, 1i de modo que
|1, 1i = |+, +i . (3.151)

Agora é fácil encontrarmos os outros estados do tripleto, pois da teoria do momentum angular
sabemos que:
p
S± |S, M i = S(S + 1) − M (M ± 1)~ |S, M ± 1i , (3.152)

logo
p
S− |1, 1i = 1(1 + 1) − 1(1 − 1)~ |1, 1 − 1i

= ~ 2 |1, 0i

Consequentemente,
1
|1, 0i = √ S− |1, 1i (3.153)
~ 2

Para calcular |1, 0i explicitamente na base {|ε1 , ε2 i} é suficiente lembrar que S− = S1− + S2− ,
logo temos que

1
|1, 0i = √ (S1− + S2− ) |+, +i
~ 2
1
= √ [~ |−, +i + ~ |+, −i]
~ 2
1
= √ [|−, +i + |+, −i]
2

Prof. Salviano A. Leão 51


3.9. Caso geral, com j1 e j2 arbitrários

Finalmente, podemos aplicar novamente S− em |1, 0i, isto é,


1
|1, −1i = √ S− |1, 0i
~ 2
1
= √ (S1− + S2− ) [|−, +i + |+, −i]
~ 2
1 1
= √ √ [|−, +i + |+, −i]
~ 2 2
1
= [~ |−, −i + ~ |−, −i] = |−, −i
2~

3.8.3 O estado |S = 0, M = 0i
De fato, esse último resultado poderia ter sido obtido diretamente usando um argumento
análogo ao aplicado para |+, +i.
O único vetor do subespaço E(S = 0), o vetor |S = 0, M = 0i, é determinado a menos de
um fator constante, pela condição de que ele deve ser ortogonal aos três vetores |S = 1, M i, os
quais acabamos de construir.
Desde que ele é ortogonal a |1, 1i = |+, +i e |1, −1i = |−, −i, portanto |0, 0i deve ser uma
combinação linear dos kets |+, −i e |−, +i, assim

|0, 0i = α |+, −i + β |−, +i (3.154)

o qual será normalizado se


h0, 0 | 0, 0i = |α|2 + |β|2 = 1 (3.155)

agora usaremos o fato de que:


1
h1, 0 | 0, 0i = 0 =⇒ √ (α + β) = 0. (3.156)
2
Portanto, temos que
1
α = −β = √ eiδ (3.157)
2
em que δ é um número real qualquer. Escolhemos δ = 0 o que fornece
1
|0, 0i = √ [|+, −i − |−, +i] (3.158)
2
Dessa forma, calculamos os quatro vetores |S, M i sem ter escrito explicitamente a matriz
que representa S2 na base {|ε1 , ε2 i} .

3.9 Caso geral, com j1 e j2 arbitrários


Mostramos que a decomposição de E(j1 , j2 ) em uma soma direta dos subespaços invariantes
E(J) é:
E(j1 , j2 ) = E(j1 + j2 ) ⊕ E(j1 + j2 − 1) · · · ⊕ E(|j1 − j2 |). (3.159)

Agora veremos como determinar os vetores |J, M i que expandem esses subespaços.

Prof. Salviano A. Leão 52


3.9. Caso geral, com j1 e j2 arbitrários

3.9.1 O subespaço E(J = j1 + j2 )


Para esse caso temos que:

• O ket |j1 , j2 ; m1 = j1 , m2 = j2 i é, em E(J = j1 + j2 ), o único vetor de Jz associado com


M = j1 + j2 .

• Desde que J2 comuta com Jz e o valor M = j1 +j2 é não degenerado, então |j1 , j2 ; m1 = j1 , m2 = j2 i
também deve ser um autovetor de J2 .

• De acordo com (3.159), o correspondente valor de J só pode ser J = j1 + j2 .

Então, escolhendo o fator de fase adequadamente, temos

|J = j1 + j2 ; M = j1 + j2 i = |j1 , j2 ; m1 = j1 , m2 = j2 i
= |j1 + j2 ; j1 + j2 i
= |j1 , j2 ; j1 , j2 i .

Aplicações repetidas do operador J− sobre este vetor de estado, fornece toda a família de
vetores |J, M i, para os quais J = j1 + j2 . Portanto, de (3.103) temos, que
p
J± |k, j, mi = ~ j(j + 1) − m(m ± 1) |k, j, m ± 1i . (3.160)

logo
p
J− |j1 + j2 ; j1 + j2 i = ~ 2(j1 + j2 ) |j1 + j2 ; j1 + j2 − 1i (3.161)
então
1
|j1 + j2 ; j1 + j2 − 1i = p J− |j1 + j2 ; j1 + j2 i . (3.162)
~ 2(j1 + j2 )
Agora aplicando J− = J1− + J2− ao vetor |j1 + j2 ; j1 + j2 i, obtemos que
1
|j1 + j2 ; j1 + j2 − 1i = p J− |j1 + j2 ; j1 + j2 i
~ 2(j1 + j2 )
1
= p (J1− + J2− ) |j1 , j2 ; j1 , j2 i
~ 2(j1 + j2 )
1 hp p i
= p ~ 2j1 |j1 , j2 ; j1 − 1, j2 i + 2j2 |j1 , j2 ; j1 , j2 − 1i
~ 2(j1 + j2 )
isto é
s s
j1 j2
|j1 + j2 ; j1 + j2 − 1i = |j1 , j2 ; j1 − 1, j2 i + |j1 , j2 ; j1 , j2 − 1i (3.163)
j1 + j2 j1 + j2
De fato, obtivemos uma combinação linear dos dois vetores bases os quais corresponde a
M = j1 + j2 − 1, e essa combinação está normalizada diretamente. Pois
j1
hj1 + j2 ; j1 + j2 − 1 | j1 + j2 ; j1 + j2 − 1i = hj1 , j2 ; j1 − 1, j2 | j1 , j2 ; j1 − 1, j2 i + (3.164)
j1 + j2
j2
hj1 , j2 ; j1 , j2 − 1 | j1 , j2 ; j1 , j2 − 1i (3.165)
j1 + j2
j1 j2
= + = 1. (3.166)
j1 + j2 j1 + j2

Prof. Salviano A. Leão 53


3.9. Caso geral, com j1 e j2 arbitrários

Ao repetirmos o procedimento anterior, podemos construir o ket |j1 + j2 ; j1 + j2 − 2i pela


aplicação de J− em ambos os lados de (3.163). Para o lado direito devemos usar a forma
J− = J1− + J2− . Com isso
1
|j1 + j2 ; j1 + j2 − 2i = p J− |j1 + j2 ; j1 + j2 − 1i ,
~ 4(j1 + j2 ) − 2
logo,
1
|j1 + j2 ; j1 + j2 − 2i = p J− |j1 + j2 ; j1 + j2 − 1i
~ 4(j1 + j2 ) − 2
1
= p (J1− + J2− ) |j1 + j2 ; j1 + j2 − 1i
~ 4(j1 + j2 − 1) − 2
1
= p (J1− + J2− ) ×
~ 4(j1 + j2 ) − 2
"s s #
j1 j2
|j1 , j2 ; j1 − 1, j2 i + |j1 , j2 ; j1 , j2 − 1i
j1 + j2 j1 + j2
"s
1 j1 p
= p ~ 4j1 − 2 |j1 , j2 ; j1 − 2, j2 i
~ 4(j1 + j2 ) − 2 j1 + j2
s #
j2 p
4j2 − 2 |j1 , j2 ; j1 , j2 − 2i
j1 + j2

isto é
s
j1 (2j1 − 1)
|j1 + j2 ; j1 + j2 − 2i = |j1 , j2 ; j1 − 2, j2 i +
(j1 + j2 )[2(j1 + j2 ) − 1]
s
j2 (2j2 − 1)
|j1 , j2 ; j1 , j2 − 2i . (3.167)
(j1 + j2 )[2(j1 + j2 ) − 1]

Fazendo aplicações sucessivas de J− , somos capazes de calcular os primeiros 2(j1 + j2 ) + 1


vetores da base de {|J, M i}, a qual corresponde a J = j1 + j2 e M = j1 + j2 , j1 + j2 −
1, . . . , −(j1 + j2 ) e além disso podemos expandir o subespaço E(J = j1 + j2 ) de E(j1 , j2 ).
Repetindo o procedimento, podemos calcular

|j1 + j2 ; j1 + j2 − 3i
|j1 + j2 ; j1 + j2 − 4i
..
.
|j1 + j2 ; −(j1 + j2 )i

3.9.2 Os outros subespaços E(j)


Agora considere o subespaço ζ(j1 + j2 ), o suplementar de E(j1 + j2 ) em E(j1 , j2 ). De acordo
com (3.159), ζ(j1 + j2 ) pode ser quebrado em

ζ(j1 + j2 ) = E(j1 + j2 − 1) ⊕ E(j1 + j2 − 2) · · · ⊕ E(|j1 − j2 |). (3.168)

Prof. Salviano A. Leão 54


3.9. Caso geral, com j1 e j2 arbitrários

com,
J = j1 + j2 − 1 e M = j1 + j2 − 1 (3.169)
Portanto, podemos usar um raciocínio análogo ao anterior.
Uma forma de ver o procedimento como um todo é lembrar que:

|j1 − j2 | ≤ J ≤ j1 + j2

J M

j1 + j2 j1 + j2 j1 + j2 − 1 j1 + j2 − 2 ··· 1 0 -1 ··· −(j1 + j2 − 2) −(j1 + j2 − 1) −(j1 + j2 )


j1 + j2 − 1 j1 + j2 − 1 j1 + j2 − 2 ··· 1 0 -1 ··· −(j1 + j2 − 2) −(j1 + j2 − 1)
j1 + j2 − 2 j1 + j2 − 2 ··· 1 0 -1 ··· −(j1 + j2 − 2)
..
.
|j1 − j2 | 0

Note que a partir de J = j1 + j2 − 1, esse estado é duplamente degenerado em Jz , o próximo


J = j1 + j2 − 2 é triplamente degenerado em Jz , e assim por diante. Lembre-se que após aplicar
o operador J− em todos os estados de J = j1 + j2 , o próximo passo é iniciar com o estado
|J = j1 + j2 − 1, M = j1 + j2 − 1i, porém este estado não é conhecido, mas sabe-se que ele deve
ser uma combinação linear dos estado com M = j1 + j2 − 1 , assim

|j1 + j2 − 1, j1 + j2 − 1i = α |j1 , j2 ; j1 , j2 − 1i + β |j1 , j2 ; j1 − 1, j2 i .


Em ζ(j1 + j2 ), o grau de degenerescência gj0 1 ,j2 (M ) de um dado valor de M é menor do que
gj1 ,j2 (M ) por um fator de um, desde que E(j1 + j2 ) possui um e somente um vetor associado
com este valor de M :
gj0 1 ,j2 (M ) = gj1 ,j2 (M ) − 1 (3.170)
Isso significa que não há mais M = j1 +j2 em ζ(j1 +j2 ), e que o novo valor máximo M = j1 +j2 −1
é não degenerado. Disso pode-se concluir que o vetor correspondente deve ser proporcional ao
ket |J = j1 + j2 − 1, M = j1 + j2 − 1i.
Esse vetor pode ser expandido na base {|j1 , j2 ; m1 , m2 i} como:

|j1 + j2 − 1, j1 + j2 − 1i = α |j1 , j2 ; j1 , j2 − 1i + β |j1 , j2 ; j1 − 1, j2 i

ao impormos a normalização para esse vetor, encontramos que

|α|2 + |β|2 = 1. (3.171)

Além disso, esse vetor deve ser ortogonal ao vetor |j1 + j2 , j1 + j2 − 1i o qual pertence a E(j1 +j2 ),
e é dado por (3.163). Portanto,

hj1 + j2 , j1 + j2 − 1 | j1 + j2 − 1, j1 + j2 − 1i = 0 (3.172)
s s
j1 j2
α +β =0 (3.173)
j1 + j2 j1 + j2

Prof. Salviano A. Leão 55


3.9. Caso geral, com j1 e j2 arbitrários

logo s
j2
α=− β (3.174)
j1
Substituindo, na expressão da normalização obtemos que:
 
2 j1
|α| 1 + =1 (3.175)
j2

A menos de um fator de fase, podemos determinar α e β, escolhendo α com sendo real e positivo,
obtemos que s s
j1 j2
α= =⇒ β=− (3.176)
j1 + j2 j1 + j2
Com isso temos
s s
j1 j2
|j1 + j2 − 1; j1 + j2 − 1i = |j1 , j2 ; j1 , j2 − 1i − |j1 , j2 ; j1 − 1, j2 i (3.177)
j1 + j2 j1 + j2

Este vetor é o primeiro da nova família, caracterizada por J = j1 + j2 − 1.


Os outros vetores podem ser obtidos por aplicações sucessivas de J− sobre esse vetor. Temos
que
1
|j1 + j2 − 1; j1 + j2 − 2i = p J− |j1 + j2 − 1; j1 + j2 − 1i (3.178)
~ 2(j1 + j2 − 1)

Aqui basta aplicar J− = J1− +J2− , sobre esse estado para obtermos os outros 2(j1 +j2 −1)+1
vetores |J, M i correspondentes a

J = j1 + j2 − 1 e M = j1 + j2 − 1, j1 + j2 − 2, . . . , −(j1 + j2 − 1)

os quais expandem o subespaço E(j1 + j2 − 1).


Agora considere o espaço ζ(j1 + j2 , j1 + j2 − 1), o suplemento da soma direta E(j1 + j2 ) ⊕
E(j1 + j2 − 1) em E(j1 , j2 ):

ζ(j1 + j2 , j1 + j2 − 1) = E(j1 + j2 − 2) ⊕ E(j1 + j2 − 3) ⊕ · · · ⊕ E(|j1 − j2 |).

Em ζ(j1 + j2 , j1 + j2 − 1), a degenerescência de cada valor de M é novamente decrescida por


com relação aquela que tinha em ζ(j1 +j2 ). Em particular o valor máximo agora é M = j1 +j2 −2,
e ele é não degenerado. O correspondente vetor deve ser portanto,

|J = j1 + j2 − 2; M = j1 + j2 − 2i . (3.179)

Para calcularmos ele na base {|j1 , j2 ; m1 , m2 i} é suficiente notarmos que ele deve ser dado pela
seguinte combinação linear:

|j1 + j2 − 2; j1 + j2 − 2i =α |j1 , j2 ; j1 , j2 − 2i + β |j1 , j2 ; j1 − 1, j2 − 1i + (3.180)


γ |j1 , j2 ; j1 − 2, j2 i (3.181)

Prof. Salviano A. Leão 56


3.10. Coeficientes de Clebsch-Gordan

Os coeficientes dessa combinação, devido a condição de normalização, satisfazem a seguinte


relação:
|α|2 + |β|2 + |γ|2 = 1. (3.182)

Além disso ele deve ser ortogonal ao seguintes vetores:

hj1 + j2 ; j1 + j2 − 2 | j1 + j2 − 2; j1 + j2 − 2i = 0 (3.183)
hj1 + j2 − 1; j1 + j2 − 2 | j1 + j2 − 2; j1 + j2 − 2i = 0, (3.184)

os quais, após a realização dos passos anteriores já são conhecidos.


Esse procedimento deve ser repetido até exaurirmos todos os valores de M ≥ |j1 − j2 |.

3.10 Coeficientes de Clebsch-Gordan


Em cada espaço E(j1 , j2 ), os autovetores de J2 e Jz são combinações lineares dos vetores da
base inicial {|j1 , j2 ; m1 , m2 i}:
j1 j2
X X
|J, M i = |j1 , j2 ; m1 , m2 i hj1 , j2 ; m1 , m2 | J, M i . (3.185)
m1 =−j1 m2 =−j2

Os coeficientes hj1 , j2 ; m1 , m2 | J, M i dessa expansão são chamados de coeficientes de Clebsch-


Gordan.
Não há uma expressão geral para os coeficientes de Clebsch-Gordan, entretanto o procedi-
mento apresentado anteriormente nos permite obtermos todos os coeficientes.
Para determinarmos os coeficientes de Clebsch-Gordan unicamente, devemos escolher algumas
fases. Essa escolha ocorre de modo a garantir que os coeficientes de Clebsch-Gordan sejam
sempre reais.
Vimos anteriormente que os coeficientes C só serão diferentes de zero se,

M = m1 + m2
|j1 − j2 | ≤ J ≤ j1 + j2 . (3.186)

A expressão (3.186) é chamada de desigualdade do triângulo, pois pode-se formar um


triângulo com três segmentos de linhas de comprimentos j1 , j2 e J, conforme ilustra a figura.
Note que os lados do triângulo obedecem a seguintes desigualdades:

|j1 − j2 | ≤J ≤ j1 + j2 (3.187)
|J − j1 | ≤j2 ≤ J + j1 (3.188)
|J − j2 | ≤j1 ≤ J + j2 . (3.189)

Além disso, as propriedades gerais dos momenta angulares impõe que o ket |J, M i, e portanto,
os coeficientes hj1 , j2 ; m1 , m2 | J, M i existam somente se M tiver um dos seguintes valores:

M = J, J − 1, . . . , −(J − 1), −J (3.190)

Prof. Salviano A. Leão 57


3.10. Coeficientes de Clebsch-Gordan

Desiguladade do triângulo
J
J2 |J1 − J2 | ≤ J ≤ J1 + J2

|J − J1 | ≤ J2 ≤ J + J1

|J − J2 | ≤ J1 ≤ J + J2
J1
Figura 3.7: Regra de seleção do triângulo: o coeficiente hj1 , j2 ; m1 , m2 | J, M i pode ser diferente de
zero somente se for possível forma um triângulo com os três segmentos de reta de comprimentos j1 , j2 e
J.

e necessário ainda que


m1 = j1 , j1 − 1, . . . , −(j1 − 1), −j1 (3.191a)

m2 = j2 , j2 − 1, . . . , −(j2 − 1), −j2 (3.191b)

Se esse não for o caso, os coeficientes de Clebsch-Gordan não são definidos. Entretanto, no que
segue, será conveniente considerar que eles existem para todos os valores de m1 , m2 e M , mas
que os coeficientes serão nulos se um deles não satisfazer as condições (3.191) anteriores.
Desde que os vetores |J, M i também formam uma base ortonormal do espaço E(j1 , j2 ),
podemos expressar um vetor |j1 , j2 ; m1 , m2 i em termos dos vetores |J, M i como

j1 +j2 J
X X
|j1 , j2 ; m1 , m2 i = |J, M i hJ, M | j1 , j2 ; m1 , m2 i . (3.192)
J=|j1 −j2 | M =−J

Desde que escolhemos todos os fatores de fase para os coeficientes de Clebsch-Gordan de modo
que eles fossem reais, então segue que:

hJ, M | j1 , j2 ; m1 , m2 i = hj1 , j2 ; m1 , m2 | J, M i . (3.193)

Portanto, os coeficientes de Clebsch-Gordan nos permite tanto expressar os vetores da base


{|j1 , j2 ; m1 , m2 i} em termos dos vetores da base {|J, M i}, quanto o contrário.

3.10.1 Relações de Ortogonalidade


Ao inserirmos a relação de completeza:
j1 j2
X X
|j1 , j2 ; m1 , m2 i hj1 , j2 ; m1 , m2 | = 1 (3.194)
m1 =−j1 m2 =−j2

na relação de ortogonalidade dos kets |J, M i:

hJ, M | J 0 , M 0 i = δJ,J 0 δM,M 0 (3.195)

Prof. Salviano A. Leão 58


3.10. Coeficientes de Clebsch-Gordan

nos obtemos
j1 j2
X X
hJ, M | j1 , j2 ; m1 , m2 i hj1 , j2 ; m1 , m2 | J 0 , M 0 i = δJ,J 0 δM,M 0
m1 =−j1 m2 =−j2

Se levarmos em conta que esse coeficientes são reais, pode-se escrever,


j1 j2
X X
hj1 , j2 ; m1 , m2 | J, M i hj1 , j2 ; m1 , m2 | J 0 , M 0 i = δJ,J 0 δM,M 0
m1 =−j1 m2 =−j2

Essa é a primeira relação de ortogonalidade dos coeficientes de Clebsch-Gordan.


Similarmente, se inserirmos a relação de completeza
j1 +j2 J
X X
|J, M i hJ, M | = 1 (3.196)
J=|j1 −j2 | M =−J

na relação de ortogonalidade

hj1 , j2 ; m1 , m2 | j1 , j2 ; m01 , m02 i = δm1 ,m01 δm2 ,m02 (3.197)

obtemos
j1 +j2 J
X X
hj1 , j2 ; m1 , m2 | J, M i hJ, M | j1 , j2 ; m01 , m02 i = δm1 ,m01 δm2 ,m02 ,
J=|j1 −j2 | M =−J

agora levando-se em conta que esses coeficientes são reais, temos


j1 +j2 J
X X
hj1 , j2 ; m1 , m2 | J, M i hj1 , j2 ; m01 , m02 | J, M i = δm1 ,m01 δm2 ,m02 ,
J=|j1 −j2 | M =−J

3.10.2 Relações de Recorrência


Desde que os kets |j1 , j2 ; m1 , m2 i formam uma base, temos:
p
J1± |j1 , j2 ; m1 , m2 i = ~ j1 (j1 + 1) − m1 (m1 ± 1) |j1 , j2 ; m1 ± 1, m2 i
p
J2± |j1 , j2 ; m1 , m2 i = ~ j2 (j2 + 1) − m2 (m2 ± 1) |j1 , j2 ; m1 , m2 ± 1i

Similarmente, por construção os kets |J, M i satisfazem:


p
J± |J, M i = J(J + 1) − M (M ± 1)~ |J, M ± 1i . (3.198)

Portanto, podemos aplicar o operador J− a expressão (3.185). Desde que J− = J1− + J2− ,
obtemos (se M > −J):

p
J(J + 1) − M (M − 1) |J, M − 1i =
j1 j2
X X
hj1 , j2 ; m01 , m02 | J, M i ×
1 m0 =−j1 m0 =−j2
2
hp
j1 (j1 + 1) − m01 (m01 − 1) |j1 , j2 ; m01 − 1, m02 i +
p i
j2 (j2 + 1) − m02 (m02 − 1) |j1 , j2 ; m01 , m02 − 1i (3.199)

Prof. Salviano A. Leão 59


3.10. Coeficientes de Clebsch-Gordan

Multiplicando a esquerda essa expressão pelo bra hj1 , j2 ; m1 , m2 |, e usando o fato de que:

hj1 , j2 ; m1 , m2 | j1 , j2 ; m01 − 1, m02 i = δm1 ,m01 −1 δm2 ,m02 (3.200)

e
hj1 , j2 ; m1 , m2 | j1 , j2 ; m01 , m02 − 1i = δm1 ,m01 δm2 ,m02 −1 (3.201)
com isso obtemos que:
p
J(J + 1) − M (M − 1) hj1 , j2 ; m1 , m2 | J, M − 1i =
p
j1 (j1 + 1) − m1 (m1 + 1) hj1 , j2 ; m1 + 1, m2 | J, M i +
p
j2 (j2 + 1) − m2 (m2 + 1) hj1 , j2 ; m1 , m2 + 1| J, M i (3.202)

Se o valor de M for igual a −J, então temos que J− |J, −Ji = 0, e a relação (3.202) permanece
válida, e devemos notar que:

0 se |M | > J,
hj1 , j2 ; m1 , m2 | J, M i = (3.203)
Diferente de zero se |M | ≤ J.

Da relação (3.202) para M = −J, temos que:


s
j2 (j2 + 1) − m2 (m2 + 1)
hj1 , j2 ; m1 + 1, m2 | J, −Ji = − hj1 , j2 ; m1 , m2 + 1| J, −Ji . (3.204)
j1 (j1 + 1) − m1 (m1 + 1)

Analogamente, podemos aplicar o operador J+ a expressão (3.185). Desde que J+ = J1+ +J2+ ,
obtemos (se M < J):
p
J(J + 1) − M (M + 1) |J, M + 1i =
j1 j2
X X
hj1 , j2 ; m01 , m02 | J, M i ×
m0 =−j1 m0 =−j2
1 2
hp
j1 (j1 + 1) − m01 (m01 + 1) |j1 , j2 ; m01 + 1, m02 i +
p i
j2 (j2 + 1) − m02 (m02 + 1) |j1 , j2 ; m01 , m02 + 1i (3.205)

Multiplicando a esquerda essa expressão pelo bra hj1 , j2 ; m1 , m2 |, e usando o fato de que:

hj1 , j2 ; m1 , m2 | j1 , j2 ; m01 + 1, m02 i = δm1 ,m01 +1 δm2 ,m02 (3.206)

e
hj1 , j2 ; m1 , m2 | j1 , j2 ; m01 , m02 + 1i = δm1 ,m01 δm2 ,m02 +1 (3.207)
com isso obtemos que:
p
J(J + 1) − M (M + 1) hj1 , j2 ; m1 , m2 | J, M + 1i =
p
j1 (j1 + 1) − m1 (m1 − 1) hj1 , j2 ; m1 − 1, m2 | J, M i +
p
j2 (j2 + 1) − m2 (m2 − 1) hj1 , j2 ; m1 , m2 − 1| J, M i (3.208)

Prof. Salviano A. Leão 60


3.10. Coeficientes de Clebsch-Gordan

Se o valor de M for igual a J, então temos que J+ |J, Ji = 0, e a relação (3.208) permanece
válida, e devemos notar que:

0 se |M | > J,
hj1 , j2 ; m1 , m2 | J, M i = (3.209)
Diferente de zero se |M | ≤ J.

Da relação (3.208) para M = J, temos que:


s
j2 (j2 + 1) − m2 (m2 − 1)
hj1 , j2 ; m1 − 1, m2 | J, Ji = − hj1 , j2 ; m1 , m2 − 1| J, Ji . (3.210)
j1 (j1 + 1) − m1 (m1 − 1)

3.10.3 Convenção de Fase


As relações (3.202) e (3.208), são relações de recorrência para calcularmos os coeficientes de
Clebsch-Gordan.
A expressão (3.202) fixa a fase relativa dos kets |J, M i associados com o mesmo valor
de J. Entretanto, devemos fixar a fase de todos os coeficientes de Clebsch-Gordan, asso-
ciados aos kets |J, M i. Para isso, iremos investigar algumas propriedades dos coeficientes
hj1 , j2 ; m1 , m2 − 1| J, Ji.

3.10.4 Os coeficientes hj1 , j2 ; m1 , m2 | J, Ji: fase do ket |J, Ji


No coeficiente hj1 , j2 ; m1 , m2 | J, Ji, o valor máximo de m1 é m1 = j1 , e nesse caso m2 = J −j1 .
Ao decrescermos o valor de m1 por um, aumentamos o valor de m2 de um até m2 atingir seu
valor máximo m2 = −j2 e m1 o seu valor mínimo m1 = J − j2 , cujo módulo deve ser menor
que j1 . Portanto, podem haver (j1 + j2 − J + 1) coeficientes de Clebsch-Gordan não nulos
hj1 , j2 ; m1 , m2 | J, Ji. Agora iremos mostrar que nunca serão nulos, para isso considere a relação
(3.210) quando M = J, na qual
s
j2 (j2 + 1) − m2 (m2 − 1)
hj1 , j2 ; m1 − 1, m2 | J, Ji = − hj1 , j2 ; m1 , m2 − 1| J, Ji , (3.211)
j1 (j1 + 1) − m1 (m1 − 1)

o radical do lado direito nunca será zero, e nem infinito. Portanto, se o coeficiente hj1 , j2 ; m1 , J − m1 | J, Ji
for zero, então todos os outros coeficientes que o sucede também serão nulos. Mas isso não é
possível, pois o ket |J, Ji é normalizado e diferente de zero. Portanto, todos os coeficientes são
diferentes de zero.
Em particular se o coeficiente hj1 , j2 ; j1 , J − j1 | J, Ji, para o qual m1 tem o seu valor máximo,
for não nulo, então para fixarmos a fase do ket |J, Ji requeremos que esse coeficiente satisfaça a
seguinte condição:

hj1 , j2 ; j1 , J − j1 | J, Ji Seja um número real e positivo. (3.212)

e da relação (3.210), segue então que todos os coeficientes

(−1)j1 −m1 × hj1 , j2 ; m1 , J − m1 | J, Ji

Prof. Salviano A. Leão 61


3.10. Coeficientes de Clebsch-Gordan

devem ser reais e o o fator (−1)j1 −m1 fornece o seu sinal.


Note que a convenção da fase escolhida para o ket |J, Ji fornece para os dois momenta
angulares J1 e J2 regras assimétricas. Ela realmente depende da ordem na qual os números
quânticos j1 e j2 estão arranjados nos coeficientes de Clebsch-Gordan: se a ordem de j1 e j2 for
permutada, a fase do ket |J, Ji é fixada pela condição

hj1 , j2 ; j2 , J − j2 | J, Ji Seja um número real e positivo. (3.213)

a qual não é necessariamente equivalente, a priori, a (3.212) [(3.212) e (3.213) podem definir
diferentes fases para o ket |J, Ji].

3.10.5 Outros Coeficientes de Clebsch-Gordan


A relação (3.202), nos permite expressarmos em termos de hj1 , j2 ; m1 , m2 | J, Ji, todos os
coeficientes hj1 , j2 ; m1 , m2 | J, J − 1i, e então todos os coeficientes hj1 , j2 ; m1 , m2 | J, J − 2i, etc.
Essa relação, na qual nenhum número imaginário é envolvido, impõe que todos os coeficientes
de Clebsch-Gordan sejam reais:

hj1 , j2 ; m1 , m2 | J, M i∗ = hj1 , j2 ; m1 , m2 | J, M i (3.214)

a qual também pode ser escrita na forma

hj1 , j2 ; m1 , m2 | J, M i = hJ, M | j1 , j2 ; m1 , m2 i (3.215)

Portanto, para M 6= J, os sinais dos coeficiente hj1 , j2 ; m1 , m2 | J, M i não obedecem nenhuma


regra simples.

3.10.6 Algumas relações úteis


Aqui forneceremos algumas relações que complementam as fornecidas nas seções anteriores.
Para prova-las, iniciaremos fazendo uma análise dos sinais de um certo número de coeficientes
de Clebsch-Gordan.

3.10.6.1 Os Sinais de alguns coeficientes

Os coeficientes hj1 , j2 ; m1 , m2 | j1 + j2 , M i: A convenção (3.212) impõe que o coeficiente

hj1 , j2 ; j1 , j2 | j1 + j2 , j1 + j2 i

seja real e positivo, e além disso, que ele seja igual a 1. Fazendo M = J = j1 + j2 em (3.202),
vemos então que os coeficientes hj1 , j2 ; m1 , m2 | j1 + j2 , j1 + j2 − 1i são positivos. Por recorrência
então é fácil provar que
hj1 , j2 ; m1 , m2 | j1 + j2 , M i ≥ 0. (3.216)

Prof. Salviano A. Leão 62


3.10. Coeficientes de Clebsch-Gordan

Os coeficientes nos quais m1 tem seu valor máximo: Considere o coeficiente hj1 , j2 ; m1 , m2 | J, M i.
Em princípio o valor máximo de m1 = j1 . Entretanto, temos que m2 = M − j1 , o que de acordo
com (3.191b) é possível somente se M − j1 ≥ −j2 , isto é

M ≥ j1 − j2 (3.217)

Se, por outro lado


M ≤ j1 − j2 (3.218)

o valor máximo de m1 corresponde ao valor mínimo de m2 (m2 = −j2 ) e é portanto igual a


m1 = M + j2 .
A seguir mostraremos que todos os coeficientes de Clebsch-Gordan para os quais m1 tem o
seu valor máximo, são positivos e não-nulos. Para tal, seja m1 = j1 em (3.202), assim
p p
J(J + 1) − M (M − 1) hj1 , j2 ; j1 , m2 | J, M − 1i = j2 (j2 + 1) − m2 (m2 + 1) hj1 , j2 ; j1 , m2 + 1| J, M i
(3.219)
Usando essa relação, um argumento por recorrência iniciando com (3.212) mostra que todos
os coeficientes hj1 , j2 ; j1 , M − j1 | J, M i são positivos (e não-nulos se M satisfaz a eq. (3.217)).
Analogamente, fazendo m2 = −j2 em (3.208), podemos provar que todos os coeficientes
hj1 , j2 ; M + j2 , −j2 | J, M i são positivos, se M satisfaz (3.218).

Os coeficientes hj1 , j2 ; m1 , m2 | J, Ji e hj1 , j2 ; m1 , m2 | J, −Ji: Vimos anteriormente que o


sinal de hj1 , j2 ; m1 , m2 | J, Ji é (−1)j1 −m1 . Em particular o sinal de hj1 , j2 ; J − j2 , j2 | J, Ji é
(−1)j1 +j2 −J , ou seja,

hj1 , j2 ; J − j2 , j2 | J, Ji = (−1)j1 +j2 −J |hj1 , j2 ; J − j2 , j2 | J, Ji| (3.220)

Para determinarmos o sinal de hj1 , j2 ; m1 , m2 | J, −Ji, podemos fazer M = −J em (3.202),


cujo lado esquerdo vai então a zero. Portanto, vemos que o sinal de hj1 , j2 ; m1 , m2 | J, −Ji
muda se m1 ou (m2 ) variar por ±1. Desde que, de acordo com os resultados anteriores,
hj1 , j2 ; j2 − J, −j2 | J, −Ji é positivo, segue que o sinal de hj1 , j2 ; m1 , m2 | J, −Ji é (−1)m2 +j2 , e
em particular: o sinal de hj1 , j2 ; −j1 , −J + j1 | J, −Ji é (−1)j1 +j2 −J , ou seja,

hj1 , j2 ; −j1 , −J + j1 | J, −Ji = (−1)j1 +j2 −J |hj1 , j2 ; −j1 , −J + j1 | J, −Ji| (3.221)

3.10.6.2 Mudança de ordem de j1 e j2

Com a convenção escolhida a fase do ket |J, Ji depende da ordem na qual os dois momenta
angulares j1 e j2 estão arranjados nos coeficientes de Clebsch-Gordan. Se eles estão na ordem
j1 , j2 a componente do ket |J, Ji ao longo do ket |j1 , j2 ; j1 , J − j1 i é positiva, o que significa que
o sinal da componente ao longo do ket |j1 , j2 ; J − j2 , j2 i é (−1)j1 +j2 −J como indicado por (3.220).
Por outro lado, se escolhermos a ordem j2 , j1 a relação (3.213) mostra que a última componente
é positiva. Portanto, se invertermos j1 e j2 o ket |J, Ji será multiplicado por (−1)j1 +j2 −J . O
mesmo é verdade para os kets |J, M i, os quais são construídos a partir do ket |J, Ji pela ação

Prof. Salviano A. Leão 63


3.10. Coeficientes de Clebsch-Gordan

de J− de tal modo que a ordem de j1 e j2 não tem efeito algum. Finalmente a troca da ordem
de j1 e j2 conduz a relação:

hj2 , j1 ; m2 , m1 | J, M i = (−1)j1 +j2 −J hj1 , j2 ; m1 , m2 | J, M i .

Prof. Salviano A. Leão 64


Capítulo 4

Teorema de Wigner-Eckart

4.1 Operadores escalares


Um operador A é dito ser um operador escalar quando ele comuta com o momentum angular
J do sistema em estudo, ou seja, [A, J] = [A, J2 ] = 0. Uma propriedade importante deste
operador é que na base padrão {|k, j, mi} os elementos de matriz não nulos hk, j, m|A|k 0 , j 0 , m0 i,
do operador escalar, devem satisfazer a condição j = j 0 e m = m0 ; além disso, este elemento não
depende de m, logo
hk, j, m|A|k 0 , j 0 , m0 i = aj (k, k 0 )δj,j 0 δm,m0 (4.1)

Se fixarmos os valores de k e j, teremos (2j+1) kets |k, j, mi com m = −j, −j+1, . . . , j−1, j,
portanto temos uma matriz (2j + 1) × (2j + 1), a qual é diagonal com todos os elementos iguais,
ou seja,
hk, j, m|A|k, j, m0 i = a(k, j)δm,m0 (4.2)

Considerando um outro operador escalar B com as mesmas propriedades do operador A,


vê-se que eles são proporcionais, logo, denotando por P (k, j) o projetor do subespaço E(k, j), os
quais são fixos, podemos escrever

P (k, j)BP (k, j) = λ(k, j)P (k, j)AP (k, j), (4.3)

na qual o projetor do subespaço E(k, j) é dado por


j
X
P (k, j) = |k, j, mi hk, j, m| . (4.4)
m=−j

A seguir iremos estudar os operadores vetores que possuem propriedades análogas aos
operadores escalares.

4.2 Operadores vetores


Se V e W são dois operadores vetores, veremos que seus elementos de matrizes obedecem a
determinadas regras de seleção. Além disso, mostraremos que ao restringirmos os operadores V

65
4.2. Operadores vetores

e W ao subespaço E(k, j), então os seus elementos de matrizes serão proporcionais, ou seja,

P (k, j)WP (k, j) = µ(k, j)P (k, j)VP (k, j). (4.5)

Este resultado constitui o teorema de Wigner-Eckart para os operadores vetores.

4.2.1 Definição dos operadores vetores


Seja V um vetor observável, cujas componentes Vx , Vy e Vz em um sistema de referências
ortonormal Oxyz, satisfaz as seguintes relações de comutação

[Jx , Vx ] = 0 [Jy , Vx ] = −i~Vz [Jz , Vx ] = i~Vy (4.6a)


[Jx , Vy ] = i~Vz [Jy , Vy ] = 0 [Jz , Vy ] = −i~Vx (4.6b)
[Jx , Vz ] = −i~Vy [Jy , Vz ] = i~Vx [Jz , Vz ] = 0. (4.6c)

então V é dito ser um operador vetor.


Exemplo 4.1. Trocando V por J em (4.6), obtemos as relações de comutação que definem o
momentum angular J.
Exemplo 4.2. Para uma partícula sem spin, cujo espaço de estado é Er , temos que J = L, logo
é imediato mostrar que R e P são operadores vetores pois:

[Lx , X] = [Y Pz − ZPy , X] = 0 (4.7a)


[Lx , Y ] = [Y Pz − ZPy , Y ] = −[ZPy , Y ] = i~Z (4.7b)
[Lx , Z] = [Y Pz − ZPy , Z] = [Y Pz , Z] = −i~Y (4.7c)

[Lx , Px ] = [Y Pz − ZPy , Px ] = 0 (4.8a)


[Lx , Py ] = [Y Pz − ZPy , Py ] = [Y Pz , Py ] = i~Pz (4.8b)
[Lx , Pz ] = [Y Pz − ZPy , Pz ] = −Py [Z, Pz ] = −i~Py . (4.8c)

Exemplo 4.3. Para uma partícula de spin S, cujo espaço de estado é Er ⊗ Es , J = L + S.


Neste caso os operadores L, S, R e P são vetores. Se levarmos em conta o fato de que todos os
operadores de spin, os quais atuam somente em Es , comutam com os operadores orbitais, os
quais atuam somente em Er , a prova destas propriedade seguem imediatamente dos exemplos
4.1 e 4.2.
Já os operadores do tipo L2 , L · S, etc, não são vetores, mas escalares. Outros operadores
vetores poderiam ser construídos, por exemplo:

R × S; (L · S) P; etc. (4.9)

Exemplo 4.4. Considere um sistema W formado pela união de dois sistemas W1 e W2 , no qual
W1 está no espaço de estados E1 e W2 está no espaço de estados E2 . Se V1 é um operador que
atua somente em E1 , e se este operador é vetor, então a extensão de V1 em E1 ⊗ E2 também é
um vetor. Por exemplo, para um sistema de dois elétrons, os operadores L1 , R1 , S2 , etc, são
vetores.

Prof. Salviano A. Leão 66


4.3. O teorema de Wigner-Eckart para operadores vetores

4.3 O teorema de Wigner-Eckart para operadores vetores

4.3.1 Elementos de matriz não-nulos de V na base padrão


Seja

V± = Vx ± iVy (4.10a)
J± = Jx ± iJy (4.10b)

então

[Jx , V± ] = [Jx , Vx ] ± i[Jx , Vy ] = 0 ± i(i~Vz ) = ∓~Vz (4.11a)


[Jy , V± ] = [Jy , Vx ] ± i[Jy , Vy ] = −i~Vz + 0 = −i~Vz (4.11b)
[Jz , V± ] = [Jz , Vx ] ± i[Jz , Vy ] = i~Vy ± i(−i~Vx ) = ±~V± (4.11c)

e segue que

[J+ , V+ ] = 0 [J− , V+ ] = −2~Vz (4.12a)


[J+ , V− ] = 2~Vz [J− , V− ] = 0. (4.12b)

Note que como [Jz , Vz ] = 0 e como Jz |k, j, mi = m~ |k, j, mi, então

hk, j, m|Vz |k 0 , j 0 , m0 i = vz (k, k 0 , j, j 0 )δm,m0 . (4.13)

Agora vamos calcular o elemento de matriz hk, j, m|V± |k 0 , j 0 , m0 i, e para isso usaremos o fato
de que:
[Jz , V± ] = ±~V± =⇒ Jz V± = V± Jz ± ~V± , (4.14)

logo

Jz (V± |k 0 , j 0 , m0 i) = V± Jz |k 0 , j 0 , m0 i ± ~V± |k 0 , j 0 , m0 i
Jz (V± |k 0 , j 0 , m0 i) = (m0 ± 1)~ (V± |k 0 , j 0 , m0 i) (4.15)

Essa relação indica que V± |k 0 , j 0 , m0 i é um autovetor de Jz com autovalor (m0 ± 1)~, logo
XX
V± |k 0 , j 0 , m0 i = Ck,j |k, j, m0 ± 1i . (4.16)
k j

Portanto, dois autovetores do operador hermitiano Jz associados a diferentes autovalores são


ortogonais, segue que o produto escalar hk, j, m|V± |k 0 , j 0 , m0 i é zero se m 6= m0 ± 1.
Em síntese obtivemos as seguintes regras de seleção para os elementos de matriz de V:

Vz =⇒ ∆m = m − m0 = 0 (4.17a)
V+ =⇒ ∆m = m − m0 = +1 (4.17b)
V− =⇒ ∆m = m − m0 = −1. (4.17c)

Prof. Salviano A. Leão 67


4.3. O teorema de Wigner-Eckart para operadores vetores

4.3.2 Proporcionalidade entre os elementos de matriz J e V dentro


de um subespaço E(k, j)
4.3.2.1 Elementos de matriz de V+ e V−

Como [J+ , V+ ] = 0, então temos que

hk, j, m + 2|J+ V+ |k, j, mi = hk, j, m + 2|V+ J+ |k, j, mi . (4.18)

Inserindo na expressão (4.18), entre os operadores J+ e V+ a completeza


X
|k 0 , l0 , m0 ihk 0 , l0 , m0 | = 1, (4.19)
k0 ,l0 ,m0

temos
X
hk, j, m + 2|J+ |k 0 , j 0 , m0 i hk 0 , j 0 , m0 |V+ |k, j, mi =
k0 ,l0 ,m0
X
hk, j, m + 2|V+ |k 0 , j 0 , m0 i hk 0 , j 0 , m0 |J+ |k, j, mi . (4.20)
k0 ,l0 ,m0

que após realizar a soma, temos

hk, j, m + 2|J+ |k, j, m + 1i hk, j, m + 1|V+ |k, j, mi =


hk, j, m + 2|V+ |k, j, m + 1i hk, j, m + 1|J+ |k, j, mi . (4.21)

a qual ainda pode ser escrita na seguinte forma


hk, j, m + 1|V+ |k, j, mi hk, j, m + 2|V+ |k, j, m + 1i
= (4.22)
hk, j, m + 1|J+ |k, j, mi hk, j, m + 2|J+ |k, j, m + 1i
Como os bras e os kets nesta expressão existem se j − 2 ≥ m ≥ −j, pode-se mostrar
imediatamente que nenhum dos denominadores vai a zero. Para m = −j, −j +1, . . . , j −3, j −2,
temos
hk, j, −j + 1|V+ |k, j, −ji hk, j, −j + 2|V+ |k, j, −j + 1i
= =
hk, j, −j + 1|J+ |k, j, −ji hk, j, −j + 2|J+ |k, j, −j + 1i
hk, j, j|V+ |k, j, j − 1i
...,= = α+ (k, j). (4.23)
hk, j, j|J+ |k, j, j − 1i
na qual o coeficiente α+ (k, j) é a razão entre estes elementos de matriz. Note que α+ (k, j)
depende somente dos índices k e j e não depende do índice m. Portanto, da relação (4.23),
podemos concluir que

hk, j, m|V+ |k, j, m0 i = α+ (k, j) hk, j, m|J+ |k, j, m0 i δm0 ,m−1 , (4.24)

o que relaciona os elementos de matriz dos operadores V+ e J+ .


Um procedimento análogo ao anterior, nos permite escrever a seguinte relação

hk, j, m|V− |k, j, m0 i = α− (k, j) hk, j, m|J− |k, j, m0 i δm0 ,m+1 , (4.25)

a qual relaciona os elementos de matriz dos operadores V− e J− .

Prof. Salviano A. Leão 68


4.3. O teorema de Wigner-Eckart para operadores vetores

4.3.2.2 Elementos de matriz de Vz

Para relacionar os elementos de matriz de Vz e Jz , usamos a relação de comutação [J− , V+ ] =


−2~Vz para calcular o seguinte elemento de matriz

hk, j, m|[J− , V+ ]|k, j, mi = −2~ hk, j, m|Vz |k, j, mi , (4.26)

expandindo o comutador, temos

− 2~ hk, j, m|Vz |k, j, mi = hk, j, m|(J− V+ − V+ J− )|k, j, mi . (4.27)

Inserindo a completeza (4.19) entre os operadores J− e V+ obtemos que


X
−2~ hk, j, m|Vz |k, j, mi = hk, j, m|J− |k 0 , l0 , m0 i hk 0 , l0 , m0 |V+ |k, j, mi − (4.28)
k0 ,l0 ,m0
X
hk, j, m|V+ |k 0 , l0 , m0 i hk 0 , l0 , m0 |J− |k, j, mi
k0 ,l0 ,m0

= hk, j, m|J− |k, l, m + 1i hk, l, m + 1|V+ |k, j, mi −


hk, j, m|V+ |k, l, m − 1i hk, l, m − 1|J− |k, j, mi
p
=~ j(j + 1) − m(m + 1) hk, j, m + 1|V+ |k, j, mi −
p
~ j(j + 1) − m(m − 1) hk, j, m|V+ |k, j, m − 1i (4.29)

Usando a relação (4.24), podemos reescrever a expressão (4.28) como


1 np
hk, j, m|Vz |k, j, mi = − α+ (k, j) j(j + 1) − m(m + 1) hk, j, m + 1|J+ |k, j, mi − (4.30)
2 o
p
j(j + 1) − m(m − 1) hk, j, m|J+ |k, j, m − 1i
1
= − α+ (k, j) {j(j + 1) − m(m + 1) − j(j + 1) + m(m − 1)}
2
=m~α+ (k, j) (4.31)

Similarmente, usando a relação de comutação [J+ , V− ] = 2~Vz para calcular o seguinte


elemento de matriz

hk, j, m|[J+ , V− ]|k, j, mi = 2~ hk, j, m|Vz |k, j, mi , (4.32)

obtemos que
hk, j, m|Vz |k, j, mi = m~α− (k, j) (4.33)
Da igualdade das relações (4.30) e (4.33), temos que

α+ (k, j) = α− (k, j) = α(k, j). (4.34)

E com isso temos então que

hk, j, m|Vz |k, j, m0 i = α(k, j) hk, j, m|Jz |k, j, m0 i (4.35a)


hk, j, m|V+ |k, j, m0 i = α(k, j) hk, j, m|J+ |k, j, m0 i (4.35b)
hk, j, m|V− |k, j, m0 i = α(k, j) hk, j, m|J− |k, j, m0 i (4.35c)

Prof. Salviano A. Leão 69


4.3. O teorema de Wigner-Eckart para operadores vetores

4.3.2.3 Generalização para uma componente arbitrária de V

Como qualquer uma das componentes do vetor V, pode ser escrita como uma combinação
linear de Vz , V+ e V− , ou seja
1 1
Vx = (V+ + V− ) e Vy = (V+ − V− ) . (4.36)
2 2i
Portanto, podemos escrever de forma geral que

hk, j, m|V|k, j, m0 i = α(k, j) hk, j, m|J|k, j, m0 i , (4.37)

portanto, dentro do espaço de estados E(k, j), todos os elementos de matriz de V são proporcio-
nais aqueles de J. Esse resultado expressa o teorema de Wigner-Eckart, para um caso especial.
Introduzindo as “restrições” de V e J em E(k, j), podemos escrever:

P (k, j)VP (k, j) = α(k, j)P (k, j)JP (k, j) (4.38)

Note que,
X
P (k, j) = |k, j, mi hk, j, m| (4.39)
m
logo

P 2 (k, j) = P (k, j)P (k, j)


XX
= |k, j, mi hk, j, m | k, j, m0 i hk, j, m0 |
m m0
X
= |k, j, mi hk, j, m|
m

= P (k, j).

4.3.2.4 Cálculo da constante de proporcionalidade: O teorema da projeção

É fácil ver que:


[Jz , P (k, j)] = 0 e [J± , P (k, j)] = 0, (4.40)
e como
1 1
J= (J+ + J− ) êx + (J+ − J− ) êy + Jz êz (4.41)
2 2i
então segue imediatamente que
[J, P (k, j)] = 0. (4.42)
Considere o operador J·V, e sua restrição a E(k, j) é P (k, j)J·VP (k, j). Como P (k, j)VP (k, j) =
α(k, j)P (k, j)JP (k, j), segue então que

P (k, j)J · VP (k, j) = J · (P (k, j)VP (k, j))


= J · [α(k, j)P (k, j)JP (k, j)]
= α(k, j)P (k, j)J2 P (k, j)
= α(k, j) (JP (k, j))2
= α(k, j)J2 P (k, j)
= j(j + 1)~2 α(k, j)P (k, j)

Prof. Salviano A. Leão 70


4.3. O teorema de Wigner-Eckart para operadores vetores

Assim
P (k, j)J · VP (k, j) = j(j + 1)~2 α(k, j)P (k, j) (4.43)
A restrição ao espaço E(k, j) do operador J · V é portanto igual ao operador identidade
multiplicado por j(j + 1)~2 α(k, j). Portanto, se |ψik,j denota um estado normalizado e arbitrário
pertencente ao subespaço E(k, j), o valor médio hJ · Vik,j de J · V é independente do ket |ψk,j i
escolhido, desde que:

hJ · Vik,j = hψk,j |J · V|ψk,j i = α(k, j)j(j + 1)~2 . (4.44)

Note ainda que:


hJ · Jik,j = hJ2 ik,j = j(j + 1)~2 . (4.45)

j
Logo substituindo estes resultados em (4.38),
obtemos:
hJ · Vik,j
P (k, j)VP (k, j) = P (k, j)JP (k, j)
j(j + 1)~2
hJ · Vik,j
= P (k, j)JP (k, j)
hJ2 ik,j
(4.46)
Vk ou ainda
V V=
hJ · Vik,j
J =
hJ · Vik,j
J. (4.47)
hJ2 ik,j j(j + 1)~2
Figura 4.1: Aqui mostramos a projeção de V
sobre j. Este resultado é chamado de “teorema da pro-
jeção”. Deste modo, todo o sistema físico, no qual
tratamos com estados pertencentes ao mesmo su-
bespaço E(k, j), podemos considerar que todos os operadores vetores são proporcionais a J.

Interpretação clássica Se j denota o momentum angular total de um sistema físico qualquer


isolado, todas as quantidades físicas atreladas ao sistema giram em torno de j, que é um vetor
constante. Em particular, para uma quantidade vetorial V, tudo o que sobra após uma média
temporal é sua projeção Vq em j, isto é, um vetor paralelo a j, dado por
j·V
Vq = j. (4.48)
j2

4.3.2.5 Comentários

1. Não pode ser deduzido de (4.47) que, no espaço de estados total (a soma direta de
todos os subespaços E(k, j)), V e J são proporcionais. Deve-se notar que a constante de
proporcionalidade α(k, j) ou hJ · Vik,j depende do subespaço E(k, j)) escolhido. Além
disso, qualquer operador vetor V pode possuir elementos de matriz não-nulos entre os
kets pertencentes a diferentes subespaços E(k, j)), enquanto os correspondentes elementos
de J são sempre zero.

Prof. Salviano A. Leão 71


4.4. Aplicação: Cálculo do fator de Landé gj de um nível atômico

2. Considere um segundo operador vetor W. Assim como V a sua restrição em E(k, j) é que
ele é proporcional a J. Portanto, dentro de um subespaço E(k, j), todos os operadores
vetores são proporcionais.

Entretanto, para calcular o coeficiente de proporcionalidade entre V e W, não podemos


simplesmente trocar J por W em (4.47). Na prova da relação (4.47), usamos o fato de
que J comuta com P (k, j), o que não é geral no caso de W. Para calcular este coeficiente
de proporcionalidade corretamente, devemos notar que, dentro do subespaço E(k, j):

hJ · Wik,j hJ2 ik,j


W= J ou J= W. (4.49)
hJ2 ik,j hJ · Wik,j

isolando J na expressão acima e substituindo na expressão para V obtemos

hJ · Vik,j
V= W (4.50)
hJ · Wik,j

4.4 Aplicação: Cálculo do fator de Landé gj de um nível


atômico
Aplicaremos o teorema de Wigner-Eckart para calcular os efeitos do campo magnético B sobre
os níveis de energia de um átomo. Veremos que o uso do teorema simplifica consideravelmente os
cálculos, e nos permite prever que, de modo geral, o campo magnético remove degenerescências,
causando o aparecimento de níveis de energia equidistantes (em primeira ordem do campo
magnético B). A diferença de energia entre estes níveis é proporcional a B e a constante gj (o
fator de Landé) o qual será calculado.
Seja L, o momentum angular orbital total dos elétrons de um átomo, ou seja,
X
L= Li (4.51)
i

e S, o seu momentum angular de spin


X
S= Si (4.52)
i

então o momentum angular interno total do átomo é:

J = L + S. (4.53)

Seja H0 o hamiltoniano do átomo na ausência de campo magnético, e ele satisfaz as seguintes


relações de comutação:

[H0 , J] = [H0 , J2 ] = [H0 , L2 ] = [H0 , S2 ] = [H0 , Jz ] = 0. (4.54)

Prof. Salviano A. Leão 72


4.4. Aplicação: Cálculo do fator de Landé gj de um nível atômico

Consideremos, então que H0 , L2 , S2 , J2 e Jz formam um conjunto completo de operadores


que comutam entre-si, formando uma base completa {|E0 , L, S, J, M i} cujos operadores são:

H0 |E0 , L, S, J, M i = E0 |E0 , L, S, J, M i (4.55)


L2 |E0 , L, S, J, M i = L(L + 1)~2 |E0 , L, S, J, M i (4.56)
S2 |E0 , L, S, J, M i = S(S + 1)~2 |E0 , L, S, J, M i (4.57)
J2 |E0 , L, S, J, M i = J(J + 1)~2 |E0 , L, S, J, M i (4.58)
Jz |E0 , L, S, J, M i = M ~ |E0 , L, S, J, M i . (4.59)

Esta hipótese é válida para um certo número de átomos leves para os quais o acoplamento
do momentum angular é do tipo L · S. Entretanto, para os átomos que possuem um outro
tipo de acoplamento este não é mais o caso. Cálculos baseados no teorema de Wigner-Eckart,
similares aos que faremos aqui, podem ser feitos, e a ideia física central permanecerá a mesma.
Por questão de simplicidade consideraremos que L e S são bons números quânticos, para os
sistemas atômicos que iremos estudar.

4.4.1 Degenerescência rotacional: Multípletos


Considere o ket J± |E0 , L, S, J, M i, como J± comuta com L2 , S2 , J2 e Jz então ele também
comuta com H0 ; portanto J± |E0 , L, S, J, M i é um autovetor de H0 com autovalor E0 . Além
disso

p
J± |E0 , L, S, J, M i = ~ J(J + 1) − M (M ± 1) |E0 , L, S, J, M ± 1i (4.60)

A degenerescência essencial

−J ≤M ≤J =⇒ (2J + 1)-vezes degenerado (4.61)

Este é um multípleto.

4.4.2 Remoção da degenerescência por um campo magnético


Na presença de um campo magnético B = Bêz , temos

H = H0 + H1 , (4.62)

com
H1 = ωL (Lz + 2Sz ) (4.63)

(o fator 2 antes de Sz , surge da razão giromagnética do spin do elétron). A frequência angular


de “Larmor” ωL do elétron é definida em termos de sua massa m e de sua carga q por:

−qB µB q~
ωL = = − B, com µB = . (4.64)
2m ~ 2m
Prof. Salviano A. Leão 73
4.4. Aplicação: Cálculo do fator de Landé gj de um nível atômico

Para calcularmos os efeitos do campo magnético sobre os níveis de energia do átomo,


consideraremos somente os elementos de matriz de H1 dentro do subespaço E(E0 , L, S, J)
associado ao multípleto em estudo.
No subespaço E(E0 , L, S, J), de acordo com o teorema da projeção temos:

hJ · Li hJ · Si
L= J e S= J (4.65)
J(J + 1)~2 J(J + 1)~2

em que hJ · Li e hJ · Si são os valores médios dos operadores J · L e J · S, nos estado do sistema


pertencentes a E(E0 , L, S, J).
Assim, como
1 2
L · J = L · (L + S) = L2 + J − L2 − S2

(4.66a)
2
2 1 2
J − L2 − S2

S · J = S · (L + S) = S + (4.66b)
2
segue então que

~2
hL · Ji = L(L + 1)~2 + (J(J + 1) − L(L + 1) − S(S + 1)) (4.67a)
2
~2
hS · Ji = S(S + 1)~2 + (J(J + 1) − L(L + 1) − S(S + 1)) (4.67b)
2
Substituindo as equações (4.67) em (4.65), e o resultado em (4.63), obtemos que

H1 = gj ωL Jz (4.68)

na qual o fator de Landé gj é

3 S(S + 1) − L(L + 1)
gj = + . (4.69)
2 2J(J + 1)

A relação (4.68) implica que os autoestados de H1 no subespaço E(E0 , L, S, J) são simples-


mente os vetores base |E0 , L, S, J, M i com autovalores

E1 (M ) = gj M ~ωL . (4.70)

Portanto, vimos que o campo magnético remove a degenerescência dos multípletos.

Prof. Salviano A. Leão 74


4.4. Aplicação: Cálculo do fator de Landé gj de um nível atômico

M
E
+ 52

+ 32

+ 12
5
 E0
J= 2 − 12

− 32

− 52
Figura 4.2: Diagrama de energia mostrando a remoção das (2J + 1) degenerescências de um multipleto
(aqui J = 5/2) por um campo magnético B. A distância entre dois níveis de energias adjacentes são
proporcionais ao campo B e ao fator de Landé gJ .

Prof. Salviano A. Leão 75


4.4. Aplicação: Cálculo do fator de Landé gj de um nível atômico

Prof. Salviano A. Leão 76


Capítulo 5

Teoria de Perturbação Independente do


Tempo

5.1 Introdução
A mecânica quântica de sistemas físicos conservativos, isto é, de sistemas cujos hamiltonianos
não dependem explicitamente do tempo, está baseada na equação autovalores do operador
hamiltoniano, ou seja, na equação de Schrödinger. Para ambos, o oscilador harmônico e o
átomo de hidrogênio, suas respectivas equações de autovalores possuem uma solução analítica
exata, e devido essa sua simplicidade eles são dois importantes modelos de sistemas físicos,
com diversas aplicações. Note que na mecânica quântica, obter a solução exata de um sistema
físico é um fato raro e há somente um pequeno número de sistemas físicos em que isso ocorre.
Em geral, a equação de autovalores é complicada o suficiente para que sejamos capazes de
encontrar suas soluções analíticas. Por exemplo, não é conhecida uma forma de tratar átomos
de muitos elétrons, exatamente, mesmo o mais simples deles o átomo de hélio. Além disso, o
modelo teórico do átomo de hidrogênio o qual possui uma solução analítica leva em conta apenas
a interação eletrostática entre o próton e o elétron; quando correções relativistas (tal como
forças magnéticas) são adicionados a esta interação principal, a equação obtida para o átomo de
hidrogênio não pode ser resolvida analiticamente. Em tais casos, frequentemente recorre-se a
uma solução numérica para o problema, a qual dependendo do tamanho do sistema, poderá ou
não ser resolvida numericamente devido ao esforço computacional. No entanto, existem métodos
de aproximação que em certos casos, nos permitem obter soluções analiticamente aproximados
da equação de autovalores básica. O estudo a seguir será voltado para um destes métodos mais
conhecidos como “teoria de perturbação estacionária”. Posteriormente, avançaremos mais um
pouco e iremos estudar a “teoria de perturbação dependente do tempo”, a qual será usada para
tratar sistemas cujos hamiltonianos contém termos dependentes explicitamente do tempo.
A teoria de perturbação estacionária é muito usada na mecânica quântica, uma vez que
ela corresponde muito bem à abordagem usual dada aos problemas físicos. Ao estudar um
fenômeno ou um sistema físico, começa-se por isolar os efeitos principais que são responsáveis
pelas principais características deste fenômeno ou este sistema. Quando forem compreendidas,

77
5.2. Método de Rayleigh-Schrödinger: Formulação do Problema

tenta-se explicar os detalhes “finos”, levando em conta os efeitos menos importantes que foram
negligenciadas na primeira aproximação. É no tratamento destes efeitos secundários que
geralmente usa-se uma teoria de perturbação. Posteriormente, será visto a relevância da teoria
de perturbação na física atômica: ela nos permitirá calcular, no caso do átomo de hidrogênio, as
correções relativistas. Da mesma forma, o tratamento que será dado ao átomo de hélio, indica
como teoria de perturbação permite que átomos de muitos elétrons sejam tratados. Inúmeras
outras aplicações da teoria de perturbação são dadas.

5.2 Método de Rayleigh-Schrödinger: Formulação do Pro-


blema
Aqui serão tratados os problemas que não podem ser resolvidos exatamente, o que significa
que deve-se recorrer a algum tipo de aproximação ou método aproximado. Dentre os métodos
disponíveis para tal, encontra-se a família dos métodos de perturbativos. Esses métodos em
geral, iniciam determinando um sistema não perturbado que seja exatamente solúvel e mais
próximo possível do problema em questão. O hamiltoniano de interação H é expresso como uma
soma de duas partes: a primeira parte corresponde ao hamiltoniano do sistema não perturbado
H0 , cuja solução é conhecida, enquanto a segunda parte é dada pelo novo termo de interação
W , assim o hamiltoniano do sistema é dado por

H = H0 + W.

Dessa forma, o problema é resolvido essencialmente como uma série de potências na força deste
termo de interação.
Portanto, a teoria de perturbação independente do tempo é aplicável quando o problema de
autovalores tem a seguinte forma

H |ψn i = (H0 + W ) |ψn i = En |ψn i (5.1)

na qual H0 e W são operadores lineares hermitianos e W pode ser considerado como uma
perturbação de H0 . Considere por exemplo o caso em que W = λV , no qual λ é um pequeno
parâmetro, λ  1, e nesse caso, W  H0 , ou seja,

W = λV Para λ  1. λ ∈ R (5.2)

Além disso, será considerado que os autovalores e autovetores de H0 são conhecidos. O operador
H0 , o qual é independente do tempo é chamado de hamiltoniano não-perturbado, enquanto o
operador W é conhecido como perturbação. Se W for independente do tempo, diz-se que a
perturbação é estacionária. O problema agora é encontrar as modificações nos níveis de energia
de H0 introduzidas pela perturbação W .
A solução conhecida do problema não-perturbado é

H0 ϕ(i)
n = E (0) (i)
n ϕn , (5.3)

Prof. Salviano A. Leão 78


5.2. Método de Rayleigh-Schrödinger: Formulação do Problema

E(λ)
E40

E30

E20

E10 λ
λ1
Figura 5.1: Variação dos autovalores de E(λ) do hamiltoniano H(λ) = H0 + λV com relação a
λ. Cada curva corresponde a um autoestado de H(λ). Para λ = 0, obtém-se o espectro de H0 .
Aqui os autovalores de H0 , E30 e E40 são duplamente degenerados. A perturbação W = λV remove a
degenerescência de E30 mas não de E40 . Além disso, para λ = λ1 surge uma degenerescência adicional.

E
(0) (i)
a qual possui um espectro de energia En
discreto. Note que o conjunto de vetores ϕn
formam uma base ortonormal no espaço de estados, ou seja,

gn

(i) (j) XX (i)
(i)
ϕm ϕn = δm,n δi,j com ϕn ϕn = 1. (5.4)
n i=1
E
(i) (0)
Aqui, os índice i dos vetores de estado ϕn permite, no caso de autovalores degenerados En ,
que haja uma distinção entre os vários vetores de estado da base ortonormal.
Quanto ao problema perturbado, é razoável considerar que seus autovetores e seus autovalores
diferem apenas ligeiramente dos valores não-perturbados. Além disso, pode-se representar por
|ψn i e En o par característico (um par característico é a função característica
do E autovetor |ψn i
(i) (0)
com o seu correspondente autovalor En ) de H = H0 + W , que se reduz a ϕn e En , quando
λ → 0, pois W é proporcional a um pequeno parâmetro λ (ou seja, W = λV ) e nesse caso

H(λ) = H0 + λV, (5.5)

então

H(λ) |ψn (λ)i = (H0 + λV ) |ψn (λ)i = En (λ) |ψn (λ)i (5.6)

mas com a condição de que


lim H(λ) = H0 ; lim E(λ) = En(0) ; lim |ψn (λ)i = ϕ(i)
n (5.7)
λ→0 λ→0 λ→0

na qual a contribuição de W desaparece. Entretanto, para usar uma método perturbativo


deve-se ter em conta que

Prof. Salviano A. Leão 79


5.2. Método de Rayleigh-Schrödinger: Formulação do Problema

Nota
Usar uma teoria de perturbação só faz sentido se o problema em questão
for suficientemente semelhante ao problema original cujas soluções são
conhecidas exatamente.

O método de perturbação depende de obtenção das soluções como uma série de potências
em λ. A hipótese central é que essas séries de potências sejam convergentes e que as soluções
sejam funções suaves e contínuas do parâmetro λ, para que se possa obter a solução necessária
no caso em que λ = 1.
No que segue, será considerado
que E os níveis não perturbados são não degenerados o que
(0) (0)
significa que uma única função ψn está associada ao autovalor En e que portanto, En e
|ψn (λ)i podem ser expandidos em uma série de potências infinita em λ (uma “série perturbativa”),
da seguinte forma

X
En = En(0) +λ 1
En(1) +λ2
En(2) + ... = λi En(i) (5.8)
i=0


X

|ψn i = ψn(0) + λ ψn(1) + λ2 ψn(2) + . . . = λi ψn(i)

(5.9)
i=0

Note que, essa é uma condição fundamental para a solução do problema.


Substituindo (5.8) e (5.9) em (5.6), obtém-se
"∞ # "∞ #" ∞ #
X X X
λk ψn(k) = λk En(k) λj ψn(j) ,

(H0 + λV ) (5.10)
k=0 k=0 j=0

e ao expandirmos ambos os lados da igualdade encontra-se que



H0 ψn(0) + λ H0 ψn(1) + V ψn(0) + λ2 H0 ψn(2) + V ψn(1) + . . . =
 

En(0) ψn(0) + λ En(0) ψn(1) + En(1) ψn(0) + λ2 En(0) ψn(2) + En(1) ψn(1) + En(2) ψn(0) + . . .
 

(5.11)

Agora impõe-se que essa equação seja satisfeita para um λ qualquer pequeno e arbitrário. Ao
movermos todos os termos do lado direito para o lado esquerdo, a série acima toma a seguinte
forma
A + λB + λ2 C + · · · = 0. (5.12)

A validade da série acima para um valor qualquer de λ  1, implica que

A = B = C = · · · = 0.

Com isso, separa-se em ambos os lados da igualdade em (5.11) os termos que tem a mesma
ordem de grandeza em λ, o que resulta em

• Ordem zero em λ:

H0 − En(0) ψn(0) = 0;

(5.13)

Prof. Salviano A. Leão 80


5.2. Método de Rayleigh-Schrödinger: Formulação do Problema

• Primeira ordem em λ:
 
H0 − En(0) ψn(1) + V − En(1) ψn(0) = 0;

(5.14)

• Segunda ordem em λ:
 
H0 − En(0) ψn(2) + V − En(1) ψn(1) − En(2) ψn(0) = 0

(5.15)

• j-ésima ordem em λ:
 
H0 − En(0) ψn(j) + V − En(1) ψn(j−1) − En(2) ψn(j−2) − · · · − En(j) ψn(0) = 0

(5.16)

E
(i)
Essas equações podem ser escritas em termos dos autovetores conhecidos ϕn e do autovalores
(0)
conhecidos En , entretanto, paraE isso, deve-se calcular o produto escalar destas equações com
(i)
os vetores não-perturbados ϕn e usar os resultados da aproximação de ordem (k − 1) para
calcular os de ordem k, como veremos a seguir.

5.2.1 Autovetores
Antes de prosseguirmos, devemos lembrar que a equação de autovalores (5.6) define |ψn (λ)i
a menos de um fator constante, o qual é definido ao escolhermos sua norma
D e fase:
impõe-se
E que
(0)
|ψn (λ)i seja normalizado e que sua fase seja tal que o produto escalar ψn ψ(λ) seja real.
E
(0)
Para a ordem zero, isso implica que o vetor de estado ψn deve ser normalizado,

ψn(0) ψn(0) = 1.


(5.17)

Entretanto, sua fase ainda permanece arbitrária. Na aproximação de primeira ordem, temos que

ψn(0) + λ ψn(1) ψn(0) + λ ψn(1) + O(λ2 )



hψn (λ)| ψn (λ)i =

= ψn(0) ψn(0) + λ ψn(1) ψn(0) + ψn(0) ψn(1) + O(λ2 )




(5.18)

na qual o símbolo O(λn ) significa termos da ordem de λn ou mais alta. Usando o fato de que
|ψn (λ)i deve ser normalizado e (5.17), encontra-se que


ψn(1) ψn(0) + ψn(0) ψn(1) = 0,



λ
D E
(0) (1)
mas como o produto escalar ψn ψn pode ser um número complexo, e na expressão acima
soma-se um número com seu complexo conjugado, logo isso implica que


< ψn(1) ψn(0) = < ψn(0) ψn(1) = 0,



(5.19)
D E
(1) (0)
logo pode-se dizer que ψn ψn = ic, com c ∈ R, esse elemento de matriz é um número
imaginário puro.

Prof. Salviano A. Leão 81


5.3. Correções para um nível não-degenerado

De modo análogo, para a aproximação de segunda ordem temos que



ψn(0) + λ ψn(1) + λ2 ψn(2) ψn(0) + λ ψn(1) + λ2 ψn(2) + O(λ3 )




hψn (λ)| ψn (λ)i =

= ψn(0) ψn(0) + λ ψn(1) ψn(0) + ψn(0) ψn(1) +





λ2 ψn(2) ψn(0) + ψn(1) ψn(1) + ψn(0) ψn(2) + O(λ3 )




(5.20)

Usando o fato de que |ψn (λ)i deve ser normalizado e as equações (5.17) e (5.19), encontra-se
que

λ2 ψn(2) ψn(0) + ψn(1) ψn(1) + ψn(0) ψn(2) = 0,




D E
(0) (2)
mas com um raciocínio análogo ao caso anterior, pode-se concluir que produto escalar ψn ψn 6=
0 e possui uma parte real não nula, a qual é dada por
1

ψn(2) ψn(0) = < ψn(0) ψn(2) = − ψn(1) ψn(1) .



< (5.21)
2
Com argumentos análogos aos anteriores, para a aproximação de ordem k chega-se ao seguinte
resultado,

ψn(k) ψn(0) = < ψn(0) ψn(k)



<
1 
(k−1) (1)
(k−2) (2)
= − ψn ψn + ψn ψn + · · ·
2

+ ψn(2) ψn(k−2) + ψn(1) ψn(k−1) .


(5.22)
E
(0)
Note, que a equação (5.13) expressa o fato de ψn é um autovetor de H0 com autovalor
(0) (0)
En , portanto o autovalor En pertence ao espectro de H0 . Esse resultado já era esperado, já
que cada autovalor de H(λ), quando λ → 0, deve se aproximar do valor de uma das energias
(0)
não-perturbadas En .

5.3 Correções para um nível não-degenerado


(0)
Agora será considerado o caso de um autovalor En não-degenerado do hamiltoniano não
perturbado H0 . Associado a esse autovalor está o autovetor |ϕn i, o qual é único a não ser
por um fator de fase constante. Determinaremos as modificações introduzidas, na energia não
perturbada e no seu correspondente autovetor, pela adição da perturbação W ao hamiltoniano
H0 do sistema.
Para isso, serão usadas as equações perturbativas que vão da equação (5.13) até (5.16), assim
como as condições que vão da equação (5.17) até (5.22). Para o autovalor de H(λ) o qual se
(0) (0)
aproxima
Ede En quando λ → 0, tem-se que En (λ) = En oE que, de acordo com (5.13) implica
(0) (0)
que ψn deve ser proporcional a |ϕn i. Os vetores ψn e |ϕn i são ambos normalizados e
nesse caso, escolhe-se uma fase adequada de modo que
(0)
ψn = |ϕn i . (5.23)

Portanto, quando λ → 0, obtém-se o estado não perturbado |ϕn i com a mesma fase.

Prof. Salviano A. Leão 82


5.3. Correções para um nível não-degenerado

Chamando de En (λ) os autovalores de H(λ) os quais, quando λ → 0, se aproxima do


(0)
autovalor En de H0 . Será considerado que λ é pequeno o suficiente de modo que esse autovalor
permaneça não-degenerado, isto é, haverá um único autovetor |ψn (λ)i correspondente a ele. A
seguir serão calculados os primeiros termos da expansão de En (λ) e |ψn (λ)i em potências de λ.

5.3.1 Correção de primeira ordem


A seguir serão obtidas as correções em primeira ordem tanto para os autovalores, a energia,
quanto para o autovetores, as funções de onda. Ao limitarmos a correção somente aos termos
de primeira ordem em λ, e usando (5.23), pode-se escrever que

|ψn i ∼ En ∼

= |ϕn i + λ ψn(1) = En(0) + λEn(1) .

e (5.24)

5.3.1.1 Correção em primeira ordem na energia

Dá equação (5.14), tem-se que:


 
H0 − En(0) ψn(1) + V − En(1) ψn(0) = 0

E
(0)
Projetando essa equação sobre o vetor |ϕn i = ψn , obtém-se

(0)
ψn H0 − En(0) ψn(1) + ψn(0) V − En(1) ψn(0) = 0


(5.25)

Note que devido a condição (5.19), o primeiro termo da equação acima é nulo, pois como H0
é um operador hermitiano, então

D
ψn H0 ψn(1) = H0† ψn(0) ψn(1) = En(0) ψn(0) ψn(1) ,

(0)

(5.26)

logo,

ψn(0) H0 − En(0) ψn(1) = En(0) − En(0) ψn(0) ψn(1) = 0,



portanto, chega-se em

En(1) = ψn(0) V ψn(0) = hϕn | V | ϕn i .


(5.27)

A seguinte notação para os elementos de matriz



Vnn = ψn(0) V ψn(0) = hϕn | V | ϕn i ,


(5.28)

é muito comum, e será usada de agora em diante.


(0)
No caso de um estado não degenerado com energia En , o autovalor En (λ) de H o qual
(0)
corresponde em primeira ordem a energia En pode ser escrito, em primeira ordem de perturbação,
com W = λV , como

E(λ) = En(0) + Wnn + O(λ2 ) = En(0) + hϕn | λV | ϕn i + O(λ2 ). (5.29)

Prof. Salviano A. Leão 83


5.3. Correções para um nível não-degenerado

Nota
A correção em primeira ordem, para uma energia não degenerada
(0)
En , é simplesmente igual a sua soma com o valor médio Wnn do
termo perturbativo W no estado não perturbado |ϕn i, ou seja, En =
(0)
En + Wnn .

5.3.1.2 Correção em primeira ordem do autovetor

A seguir serão calculadas as correções de primeira ordem dos autovetores não perturbados.
Note que a projeção (5.25) não exauri toda a informação contida em (5.14) e que além disso, a
hipótese que está sendo usada é a de que somente o autoestado |ϕn i de H0 é não degenerado,
porém nada sabemos sobre os seus outros autoestados, portanto, será considerado E que eles podem
(i)
ser degenerados, assim, um autovetor qualquer de H0 será referido como ϕ` , com ` 6= n, onde
o índice i = 1, . . . , g` , representa a degenerescência deste nível de energia. Será considerado que
o conjunto dos autovetores não-perturbados de H0 constitui uma base ortonormal completa
conforme
E(5.4), o que significa que ele pode ser usado como base para nosso espaço de estados e
(1)
que ψn pode ser escrito como uma superposição linear dos autovetores não-perturbados,

gm
(1) X X
(j) (j)

ψn = Bnm ϕm , (5.30)
m j=1

em que a soma pode ser finita ou infinita,


dependendo
E da natureza do espaço de estados. Logo
(i)
o produto interno dessa expressão, com ϕ` fornece

D gm
E XX D gm
E XX
(i) (1) (j) (i) (j) (j) (i)
ϕ` ψn = Bnm ϕ` ϕm = Bnm δ`m δi,j = Bn` com n 6= `
m j=1 m j=1

E E
(0) (i)
Lembrando-se que |ϕn i = ψn , ao projetar o ket ϕ` em (5.14), obtém-se que

D E D E
(i) (0) (1) (i) (1)
ϕ` H0 − En ψn + ϕ` V − En ϕn = 0,

substituindo (5.30) nessa expressão tem-se que

gm D E D E gm D D E
XX (i) (i)
XX (i)
(i)
(j) (j) (0) (j)
ϕ` ϕ(j) (1)

Bnm ϕ` H0 ϕm + ϕ` V ϕn = En Bnm +E ϕ ` ϕn .

m n
m j=1 m j=1

E (5.31)
(i)
Como os autovalores são não-degenerados, os autovetores ϕm são ortogonais entre si, de
maneira que

D E D E
(i) (i)
ϕ` ϕ(j)
m = δ`m δi,j ϕ` ϕn = 0 (pois n 6= ` ), (5.32)

isso reduz a nossa equação à seguinte forma

Prof. Salviano A. Leão 84


5.3. Correções para um nível não-degenerado

D E
(0) (i) (i) (i)
E` Bn` + ϕ` V ϕn = En(0) Bn` (` 6= n).

D E
(i)
A quantidade V`n = ϕ` V ϕn é chamada de elemento matriz do operador V entre os

(i)
vetores (estados) indexados por ` e por n. Isolando Bn` tem-se

(i) V`n
Bn` = (0) (0)
(` 6= n). (5.33)
En − E`
E
(1)
Portanto, pode-se escrever o autovetor ψn como
D E
g (i)
ϕ` V ϕn E

(1) X X̀ (i)
ψn = ϕ` (5.34)
(0) (0)
`6=n i=1 En − E`

consequentemente, para a primeira ordem de perturbação W = λV , o autovetor |ψn (λ)i de H


correspondendo ao estado não perturbado |ϕn i pode ser escrito como
D E
g (i)
ϕ` V ϕn (i)
E
X X̀
|ψn (λ)i = |ϕn i + (0) (0)
ϕ` + O(λ2 ). (5.35)
`6=n i=1 En − E`
E
(1)
A expressão (5.33) determina todos os coeficientes no termo de correção ψn , exceto
um, ou seja, o coeficiente Bnn . Para obter alguma informação sobre BnnE, será usadaE uma
condição adicional. Exigiremos que os autovetores aproximados |ψn i ∼
(0) (1)
= ψn + λ ψn sejam

normalizados, pelo menos em primeira ordem.


Em geral, ao tomar o produto interno de |ψm i e |ψn i, tem-se que

hψm |ψn i ∼

(0) (0)
(0) (1)
(1) (0)
(1) (1) 2
= ψm ψn + λ ψm ψn + λ ψm ψn + ψm ψn λ

hψm |ψn i ∼

(0) (0)
(0) (1)
(1) (0)
= ψm ψn + ψm ψn + ψm ψn
D E
(0) (0)
conservando somente os termos de primeira ordem. Se m = 6 n, então ψm n = 0 e os dois
ψ
(i) (i) (i)
termos restantes se reduzirão a Bnm + Bmn , que se anulam devido à fórmula para Bnm e devido
ao fato de que V é um operador hermitiano, então

(0)
† (0) (0)
(0) (0)
(0) (0) ∗ ∗
Vnm = ψn(0) V ψm

= V ψn ψm = V ψn ψm = ψm V ψn = Vmn . (5.36)

Por conseguinte, os autovetores perturbados permanecem ortogonais entre si. Fazendo m = n


(i)
e exigindo que hψn |ψn i = 1 nessa aproximação, então obtém-se a seguinte condição sobre Bnm

hψn | ψn i ∼

= ψn(0) ψn(0) + ψn(0) ψn(1) + ψn(1) ψn(0)



gm gm
1∼
XX
(0) (0) X X
(0) (0)
(i) (i)
=1+ Bnm ψn ψm +
Bnm ψm ψn
m i=1 m i=1

Prof. Salviano A. Leão 85


5.3. Correções para um nível não-degenerado


Bnn + Bnn = 0. (5.37)

Para os espaços de estados os quais sejam espaços reais, esta condição exigirá imediatamente
que Bnn = 0. Por outro lado, se o espaço for complexo, pode-se afirmar somente que <(Bnn ) = 0,
enquanto que Im(Bnn ) permanece indeterminado. Neste ponto, deve-se ressaltar que: um
autovetor complexo, mesmo de módulo unitário, não é de nenhuma maneira único, pois pode
ainda ser multiplicado por um fator de fase eiα com fase real α arbitrária. Se escolhermos
arbitrariamente, como Bnn , um certo número imaginário puro Bnn = iδ, onde δ é real e de
primeira ordem, então o autovetor perturbado será
gm

(0) (0) X X
(i) (0)

|ψn i = ψn + iδ ψn +
Bnm ψm . (5.38)
m6=n i=1
E
(0)
No entanto, isto pode ser simplesmente interpretado como se o vetor não-perturbado ψn
(iδ)2
tenha sido pré multiplicado por eiδ , pois eiδ = 1 + iδ + 2!
+ . . ..
Com isso, pode-se escrever, em primeira ordem que

eiδ ψn(0) ∼
(0)
= ψn + iδ ψn(0) .

E E
(0) (0)
É evidente que eiδ ψn é sempre aceitável, em vez de simplesmente ψn , como sendo o
(i)
vetor original não-perturbado, e isso equivale à escolha de Bnm = 0, na teoria de perturbação de
primeira ordem.
Sobre o fator de fase eiδ , pode-se salientar que sempre que forem usados espaços de estados
complexos na mecânica quântica, as quantidades fisicamente mensuráveis serão do tipo hψ| O |ψi,
onde O é um operador. Essas quantidades não são afetadas pelo fator de fase.
Então, o autovetor e o seu respectivo autovalor são dados por

X Wmn (0)
|ψn i = ψn(0) + (0) (0)
· ψm (5.39)
m6=n En − Em

En = En(0) + Wnn (5.40)

5.3.2 Correção de Segunda Ordem: energia


Começando com a equação de ordem zero, vemos que está trivialmente satisfeita. A equação
de primeira ordem é exatamente a mesma da seção precedente. Efetuando as mesmas operações
que antes, temos ainda as fórmulas

Vmn
En(1) = Vnn (i)
Bnm = (0) (0)
(m 6= n).
En − Em
No entanto, devemos rever as afirmativas feitas sobre os coeficientes Bnn , pois estes eram limi-
tados a aproximações de primeira ordem. Se desejarmos utilizar uma condição de normalização
de segunda ordem, deveremos primeiro investigar as correções de segunda ordem.

Prof. Salviano A. Leão 86


5.3. Correções para um nível não-degenerado
E
(0)
O produto interno da equação de segunda ordem (5.15) com ψn é determinado ao
E
(0)
considerar o fato de que H0 é hermitiano e que é ψn normalizado, ou seja


(0)
(0) (0)
ψn H0 ψn(2) = En(0) ψn(0) ψn(2)


e ψn ψn = 1

então


(0)
ψn H0 ψn(2) + ψn(0) V ψn(1) = En(0) ψn(0) ψn(2) +En(1) ψn(0) ψn(1) +En(2) ψn(0) ψn(0) , (5.41)




Logo obtém-se que


En(0) ψn(0) ψn(2) + ψn(0) V ψn(1) = En(0) ψn(0) ψn(2) + En(1) ψn(0) ψn(1) + En(2)





(0) (1)
ψn V ψn = En(1) ψn(0) ψn(1) + En(2)


(5.42)

Ao usarmos a expansão (5.30), as relações de ortonormalização (5.32) e o resultado de


(1)
primeira ordem En = Vnn a equação (5.27), a expressão (5.42) transforma-se na seguinte
relação

gm
XX
(i)
Vnm Bnm = En(1) Bnn + En(2) (5.43)
m i=1

Observe que os termos contendo Bnn se cancelam, e a equação fornece

gm
X X
En(2) = (i)
Bnm Vnm
m6=n i=1

ou, explicitamente, substituindo (5.33), teremosVnm

D ED E D E 2
gm (i) (i) gm ϕ(i) W ϕ
ϕn W ϕm ϕm W ϕn

X Vnm Vmn X X X X m n
En(2) = (0) (0)
= (0) (0)
= (0) (0)
,
m6=n En − Em m6=n i=1 En − Em m6=n i=1 En − Em
(5.44)
(2)
A correção de segunda
E daEenergia En , é obtida através da realização de um somatório
ordem E
(0) (j) (0)
por todos os estados ψm = ϕm com m 6= n, como indicado em (5.44). Os estados ψm
sobre a qual o somatório é realizado muitas vezes são chamados de estados “intermediários”. A
partir do somatório de (5.44), é comum interpretar cada termo desta soma como uma sucessão
de duas transições de primeira
Eordem, ponderada pela diferença em energia do denominador
(0) (0) (0)
En − Em , entre o estado ψn que o sistema sai e propaga-se, ou seja, “visita todos os estado
E E
(0) (0)
intermediário ψm possíveis e, em seguida, retorna” para o estado inicial ψn . Também
pode-se observar a partir de (5.44) que, se o nível n que estamos estudando corresponde ao
(0) (0)
estado fundamental do sistema, então a diferença de energia do denominador En − Em < 0

Prof. Salviano A. Leão 87


5.3. Correções para um nível não-degenerado

(2)
para m 6= n, portanto, nesse caso, a correção de segunda ordem na energia En é sempre
negativo, para qualquer perturbação W .
Portanto a energia total corrigida em até segunda ordem é
D E 2
gm ϕ(i) W ϕ
X X m n
En (λ) = En(0) + hϕn | W | ϕn i + (0) (0)
. (5.45)
m6=n i=1 En − Em

5.3.3 Correção de Segunda Ordem: autovetor


Agora
seráE calculado os autovetores em até segunda
Eordem, ou seja, o termo de segunda
(2) (i)
ordem ψn . Vamos inciar projetando (5.15) no ket ϕ` , com ` 6= n, o que resulta em

D E D E D E D E D E
(i) (i) (i) (i) (i)
ϕ` H0 ψn(2) + ϕ` V ψn(1) = En(0) ϕ` ψn(2) + En(1) ϕ` ψn(1) + En(2) ϕ` ψn(0)

E (5.46)
(2)
Expandido o termo de segunda ordem ψn em função dos autovalores não-perturbados,
obtém-se
gm
(2) X X
(j) (j)

ψn = Cnm ϕm . (5.47)
m j=1
E
(0)
Substituindo as expansões (5.47) e (5.30) em (5.46), e usando o fato de que ψn = |ϕn i é um
autovetor não degenerado, isso resulta em

gm D E gm D E gm D E
XX (i) (j) X X (j) (i)
XX (i) (j)
(j) (j) (0) (j)
Cnm ϕ` H0 ϕm + Bnm ϕ` V ϕm = En Cnm ϕ` ϕm +

m j=1 m j=1 m j=1
gm D E D E
XX (i) (j) (i)
En(1) (j)
Bnm (2)
ϕ` ϕm + En ϕ` ϕn
m j=1
D E
(i)
Note que como ` 6= n, então devido a ortogonalidade ϕ` ϕn = 0. Assim

gm
(0) (i)
XX (i) (i)
(j)
E` Cn` + Bnm V`m = En(0) Cn` + En(1) Bn` .
m j=1
(i)
Como Cnm ainda está indeterminado, separamos este termo na soma sobre m; usamos as
fórmulas de primeira ordem para obter

(0) (i)
X (i)
(En(0) − E` )Cn` = V`n Bnn + V`m Bnm − En(1) Bn` ,
m6=n
(1) (i)
mas de (5.27) temos que En = Vnn , e usando o valor encontrado para os coeficientes Bn` de
primeira ordem (5.33), logo pode-se reescrever a expressão anterior como

(0) (i)
X V`m Vmn V`n Vnn
(En(0) − E` )Cn` = V`n Bnn + (0) (0)
− (0) (0)
,
m6=n En − Em En − E`

Prof. Salviano A. Leão 88


5.3. Correções para um nível não-degenerado

logo

(i) V`n X V`n Vmn V`n Vnn


Cn` = (0)
B +
(0) nn (0) (0) (0) (0)
− (0) (0)
(5.48)
En − E` m6=n (En − E` ) · (En − Em ) (En − E ` )2

(i)
Vemos que os coeficientes Cn` não ficam completamente determinados antes de acharmos
(i)
Bnn . O coeficiente Cnn também permanece indeterminado. Essa é a informação máxima que
pode ser obtida, até segunda ordem, da equação original de autovalores. Voltando agora a
atenção para os problemas de ortogonalidade e de normalização. Se tomarmos, em geral, o
produto interno de |ψm i e de |ψn i, como representado pela série

(0) (1) (2) X


+ λ2 ψm λk ψm
(k)

|ψm i = ψm + λ ψm + ··· =
k

obteremos termos de diferentes ordens na expressão de hψm |ψn i = δmn , conforme os resultados
obtidos de (5.17) à (5.22), do que ao exigirmos que hψm | ψn i = δmn segue então para cada
ordem que
ordem zero:

(0) (0)
ψm ψn = δmn

primeira ordem:



(0) (1)

(1) (0)
ψm ψn + ψm ψn = 0

segunda ordem:


(0) (2)
(1) (1)
(2) (0)
ψm ψn + ψm ψn + ψm ψn = 0,

Segue-se então, que os termos de qualquer ordem dada devem anular-se identicamente, e
não faz diferença se m 6= n ou m = n. Usando a expansão

(1) X (0)
ψn = Bnm ψm ,
m

a equação de primeira ordem fornece imediatamente


Bnm + Bnm =0 (m e n quaisquer)

6 n, esta relação se satisfaz automaticamente; se m = n, obtemos Re {Bnn } = 0 como


Se m =
condição.
De maneira semelhante, usando também a expansão de segunda ordem
(2) X (0)
ψn = Cnm ψm ,
m

a equação de segunda ordem impõe que

Prof. Salviano A. Leão 89


5.3. Correções para um nível não-degenerado

X
(0) (0) E X X ∗ D
(0) (0)
E X

D
(0)

Cmi ψi ψn(0) = 0,

Cni ψm ψi + Bmi Bnj ψi ψj +
i i j i

da qual segue imediatamente

X
∗ ∗
Cnm + Cmn + Bm` Bn` = 0. (5.49)
`

Se usarmos as expressões obtidas para Bnm e Cnm , é possível mostrar que esta relação é
satisfeita para m 6= n, não interessa qual seja Bnn . Para o caso m = n, obtemos, no entanto, a
condição

1X
|Bn` |2
 (2)
Re Cnn =− (5.50)
2 `
E E
im (0) (0)
Como na teoria de primeira ordem, pode-se considerar o vetor e ψn , em vez de ψn ,
como autovetor não-perturbado temos

δ2
eim ψn(0) = ψn(0) + iδ ψn(0) − ψn(0) + . . .

2!
É evidente que, se fizermos δ = Im {Bnn } + Im {Cnn }, podemos incorporar as partes imaginárias
de Bnn e Cnn no fator de fase arbitrário eiδ . Isso é equivalente a escolher Im {Bnn } = Im {Cnn } = 0
nos cálculos das perturbações.
Por conseguinte, pode-se reunir os resultados da teoria de segunda ordem no seguinte conjunto
de fórmulas:

Vmn
En(1) = Vnn Bnn = 0 (i)
Bnm = (0) (0)
(m 6= n)
(En − Em )
X Vnm Vmn 1 X (i) 2
En(2) = , Cnn = − B ,
m6=n
(0)
En − Em
(0) 2 m,i nm

(i)
X Vm` V`n Vmn Vnn
Cnm =   − 2 (m 6= n).
(0) (0) (0) (0) (0) (0)
`6=n En − Em En − E` En − Em

Mas como

(2) X (0) (0)


ψn = Cnm ψm + Cnn ψm
`6=n

 
(2) X X Vm` V`n Vmn Vnn  (0) 1 X |Vmn |2 (0)
ψn =   − 2 ψm − 2 ψm

2
 (0) (0) (0) (0)
   
(0) (0) (0) (0)
m6=n `6=n En − Em En − E` En − Em m En − Em

(0) (0)
Seja agora ωnm = (En − Em )/~.

Prof. Salviano A. Leão 90


5.3. Correções para um nível não-degenerado

" #
(2) X X Vm` V`n V V
mn nn (0) 1 X |Vmn |2 (0)
ψn =

− 2ω2
ψ m − 2ω2
ψm (5.51)
~ nm ωn` ~ nm 2 m
~ nm
m6=n `6=n

X Vnm Vmn
En(2) = (5.52)
m6=n
~ωnm

Portanto a energia em até segunda ordem é


D E 2
(i)
gm
X X ϕm W ϕn

En (λ) = En(0) + hϕn | W | ϕn i + (0) (0)
(5.53)
m6=n i=1 En − Em

Este tipo de análise pode ser levado a ordens mais altas. Na prática, no entanto, a maior parte
dos cálculos se limita à primeira e segunda ordens. Além das complexidades computacionais,
o ponto é que, se os resultados de segunda ordem não forem suficientemente exatas, então a
validade geral (convergência) da série perturbada ficará geralmente duvidosa.

(2)
5.3.4 Limite superior de En
Ao limitar a expansão da energia em primeira ordem em λ poderá se obter uma ideia
aproximada do erro envolvido ao avaliar o termo de segunda ordem.
(2)
Considere expressão (5.52) para En . Ela contém uma soma (a qual geralmente é infinita)
cujos termos do numerador são positivo ou zero. Denota-se por ∆E o valor absoluto da diferença
(0)
entre a energia En , do nível a ser estudado e aquela do nível mais próximo. Para todo n,
tem-se obviamente que:

|En(0) − Em
(0)
| ≥ ∆E
(2)
Essa expressão fornece um limite superior para o valor absoluto de En :

En ≤ 1
(2) X X
2
ϕ(i)
m V ϕn

∆E i m6=n

a qual pode ser reescrita como

En ≤ 1
(2) X X

(i)
ϕn V ϕ(i)
m ϕm V ϕn
∆E i m6=n
* " # +
1 X X
ϕ(i)


(i)

≤ ϕn V ϕ V ϕn (5.54)

m m
∆E
i m6=n

O operador que aparece dentro dos colchetes é diferente do operador identidade somente
devido ao projetor sobre o estado |ϕn i, uma vez que a base de estados não perturbados satisfaz
a relação de completeza:
m = 1.
X X

|ϕn ihϕn | + ϕ(i)
m ϕ(i)
i m6=n

Prof. Salviano A. Leão 91


5.4. Aplicações

Portanto a desigualdade (5.54), toma a seguinte forma

En ≤ 1 hϕn | V [1 − |ϕn ihϕn |] V | ϕn i


(2)
∆E
1 
2
ϕn V ϕn − (hϕn | V | ϕn i)2

≤ (5.55)
∆E

Multiplicando ambos os lados de (5.55) por λ2 , obtém-se um limite superior para o termo de
segunda ordem na expansão de En (λ), na seguinte forma:

λ En ≤ 1 (4W )2
2 (2)
∆E

na qual 4W é o desvio quadrático médio da perturbação W não estado não perturbado |ϕn i.
Esta indica a ordem de magnitude do erro cometido ao levar em conta somente a correção em
primeira ordem.

5.4 Aplicações
Nessa seção apresentaremos alguns exemplos de aplicação da teoria de perturbação não
degenerado ao problema do oscilador harmônico unidimensional

P2 1
H0 = + mω 2 X 2 , (5.56)
2m 2

com
1
H0 |ni = En(0) |ni , com En(0) = (n + )~ω (5.57)
2
e esse será o hamiltoniano do sistema não perturbado. A seguir serão analisadas alguns potenciais
perturbadores a esse problema.

5.4.1 Oscilador harmônico com perturbação linear: V (X) = ~ωX


Considere o seguinte potencial perturbativo
r

W (X) = λ~ω X̃, com X̃ = X (5.58)
~

o que significa que o hamiltoniano do sistema é dado agora por

P2 1
H = H0 + W = + mω 2 X 2 + λ~ω X̃. (5.59)
2m 2

Em particular esse sistema possui uma solução exata. A seguir resolveremos exatamente o
problema e em seguida aplicaremos o método perturbativo para determinar novas as energias
do sistema.

Prof. Salviano A. Leão 92


5.4. Aplicações

5.4.1.1 Solução exata

Esse problema é equivalente ao de uma partícula de massa m e carga q, movendo-se em um


potencial harmônico, do tipo (5.56), a qual é submetida a um campo elétrico uniforme E = E êx ,
o que significa que operador hamiltoniano da partícula toma a seguinte forma

P2 1
H = H0 − qEX = + mω 2 X 2 − qEX. (5.60)
2m 2
Note que os hamiltonianos (5.59) e(5.60) possuem a mesma forma, e sua equivalência é
obtida fazendo-se

r

−qEX = λ~ω X =⇒ qE = −λω m~ω
~

O hamiltoniano (5.59) desse sistema, pode ser manipulado de forma que


r
P2 1 2 2 mω P2 1
H= + mω X + λ~ω X= + mω 2 X 2 + λω m~ωX
2m 2 ~ 2m 2
r !
P2 1 ~
= + mω 2 X 2 + 2λ X
2m 2 mω
 r r !2  r !2
2
P 1 ~ ~ 1 ~
= + mω 2 X 2 + 2λ X+ λ  − mω 2 λ
2m 2 mω mω 2 mω
" r #2
P2 1 ~ 1
= + mω 2 X + λ − λ2 ~ω. (5.61)
2m 2 mω 2

Definindo r
~ 1
X0 = λ ; e U0 = λ2 ~ω, (5.62)
mω 2
então, fazendo uma mudança de variável

Z = X + X0 e E 0 = E − U0 (5.63)

então teremos
Pz2 1
H= + mω 2 Z 2 − U0 = H0z − U0 . (5.64)
2m 2
Logo, como  
1
H0z |ϕn,z i = En,z |ϕn,z i = ~ω n + |ϕn,z i (5.65)
2
e [H, H0z ] = 0, então os autovetores de H0z também são autovetores de H e com autovalores
   
1
H |ϕn,z i = En |ϕn,z i = ~ω n + − U0 |ϕn,z i . (5.66)
2

Portanto, as energias desse sistema são


 
1 1
En = n + ~ω − λ2 ~ω, (5.67)
2 2

Prof. Salviano A. Leão 93


5.4. Aplicações

Note que se os autovetores de H0z são dados pelos kets |ϕn,z i = |ϕn i então os autovetores de
H serão dados pelos kets |ψn i, os quais estão relacionados por

hx | ψn i = ψn (x) ⇐⇒ hz | ϕn,z i = hx − x0 | ϕn,z i = ϕn (x − x0 ),

ou seja, os dois são equivalente, porém suas origens estão deslocadas, ou seja, ψn (x) = ϕn (x−x0 ),
assim como vimos os dois autoestados estão relacionados um com outro por meio do operador
translação espacial, dado por
− √λ (a† −a)
|ψn i = U (λ) |ϕn i , com U (λ) = e 2 .

Uma expansão limitada de U (λ) fornece o seguinte resultado


 
λ †
|ψn i = 1 − √ (a − a) + · · · |ϕn i
2
r r
n+1 n
= |ϕn i − λ |ϕn+1 i + λ |ϕn−1 i + · · · (5.68)
2 2

5.4.1.2 Solução perturbativa



Trocando X̃ por (a† + a)/ 2 em (5.58), obtém-se que

W = λ √ (a† + a). (5.69)
2
Dá expressão acima vê-se que o termo perturbativo W , mistura o estado |ϕn i somente com
os estados |ϕn−1 i e |ϕn+1 i. Portanto, os únicos elementos de matriz não nulos de W , que
contribuem para a expansão perturbativa são

 hϕ | W | ϕm i =0 para |m − n| =
6 1
 n

 q
n+1 (5.70)
hϕn+1 | W | ϕn i =λ 2




hϕ pn
|W |ϕ i
n−1 n =λ 2

Portanto, a correção na energia em segunda ordem de perturbação pode ser escrita como
X |hϕm | W | ϕn i|2
(0)
En = En + hϕn | W | ϕn i + (0) (0)
+ ··· (5.71)
m6=n En − Em
Substituindo os elementos de matriz (5.70) em (5.71), obtém-se
(n + 1)λ2 nλ2
En = En(0) + 0 − ~ω + ~ω + · · ·
  2 2
1 1
= n+ ~ω − λ2 ~ω + · · · (5.72)
2 2
Isso, mostra que a correção perturbativa em segunda ordem para a energia coincide com o
resultado exato. Já a correção em primeira ordem para os autoestados fornece
X Wmn (0)
|ψn i = ψn(0) + (0) (0)
· ψm (5.73)
m6=n En − Em
r r
n+1 n
= |ϕn i − λ |ϕn+1 i + λ |ϕn−1 i + · · · , (5.74)
2 2
a qual também coincide com a expansão em série, em primeira ordem, do resultado exato.

Prof. Salviano A. Leão 94


5.4. Aplicações

5.4.2 Potencial perturbativo quadrático


Considere agora o seguinte potencial perturbativo
1 1
W (X) = ρ~ω X̃ 2 = ρmω 2 X 2 , (5.75)
2 2
portanto agora o hamiltoniano do sistema será dado por
P2 1
H = H0 + W = + mω 2 (1 + ρ)X 2 , (5.76)
2m 2
o que por uma questão de simplicidade introduz-se a frequência

ω 02 = (1 + ρ)ω 2 , (5.77)

logo a solução exata do problema é imediata e seus autovalores são dados por
   
1 0 1 p
En = n + ~ω = n + 1 + ρ~ω. (5.78)
2 2
Expandindo essa solução em série, para ρ  1, obtém-se
   
1 1 1 2
En = n + ~ω 1 + ρ − ρ + · · · (5.79)
2 2 8
Como
1 1
X̃ = √ (a† + a) =⇒ W (X) = ρ~ω(a† + a)(a† + a) (5.80)
2 4
o qual ainda pode ser escrito como
1
W (X) = ρ~ω(a† + a)(a† + a)
4
1
= ρ~ω a†2 + a2 + a† a + aa†

4
1
= ρ~ω a†2 + a2 + 2N + 1 ,

(5.81)
4
na qual N é o operador número dado por N = a† a = aa† − 1. Portanto os únicos elementos de
matriz não nulos para esse termo são

= 12 ρ n + 12 ~ω

hϕn | W | ϕn i


 p
hϕn+2 | W | ϕn i = 14 ρ (n + 1) (n + 2)~ω (5.82)

 p
hϕ 1
n−2 | W | ϕn i = 4 ρ n (n − 1)~ω.

Note ainda que


En0 − Em
0
= (n − m)~ω, (5.83)
logo, a correção na energia em segunda ordem de perturbação pode ser escrita como
 
0 1 1 1 ~ω 1 ~ω
En = En + ρ n + ~ω − ρ2 (n + 1) (n + 2) + ρ2 n (n − 1) + ···
2 2 16 2 16 2
ρ2
     
1 1 ρ 1
= n+ ~ω + n + ~ω · − n + ~ω · + ···
2 2 2 2 8
   
1 1 1 2
= n+ ~ω 1 + ρ − ρ + · · · . (5.84)
2 2 8
Esse resultado, coincide com a expansão do resultado exato.

Prof. Salviano A. Leão 95


5.4. Aplicações

5.4.3 Potencial perturbativo de ordem X 3


Considere agora o seguinte potencial perturbativo

W (X) = σ~ω X̃ 3 (5.85)

o qual em termos dos operadores de criação e aniquilação pode se reescrito como



2
W (X) = σ~ω(a† + a)(a† + a)(a† + a)
√4
2
σ~ω a†2 + a2 + 2N + 1 (a† + a)

=
4
o que após alguma álgebra, chega em

2
σ~ω a†3 + a3 + 3N a† + 3(N + 1)a
 
W (X) = (5.86)
4
Os elementos de matriz não nulos para esse termo são

n+1 3/2



hϕn+1 | W | ϕn i = 3σ 2


n 3/2
 
hϕn−1 | W | ϕn i

= 3σ ~ω
2
q (5.87)


hϕn+3 | W | ϕn i = σ (n+3)(n+2)(n+1)
8


 q
= σ n(n−1)(n−2)

hϕ
n−3 | W | ϕn i 8
~ω.
e as diferenças em energia são

En0 − En±3
0
= ∓3~ω e En0 − En±1
0
= ∓~ω.

Portanto, a correção na energia em segunda ordem de perturbação pode ser escrita como

σ 2 n (n − 1) (n − 2) σ 2 (n + 3)(n + 2) (n + 1)
 
1
En = n + ~ω + · ~ω − · ~ω+
2 3 8 3 8
n3 (n + 1)3
3σ 2 ~ω − 9σ 2 ~ω + · · ·
8 8
a qual ainda pode ser reescrita na forma compacta
   2
1 15 2 1 7
En = n + ~ω − σ n + ~ω − σ 2 ~ω + · · · (5.88)
2 4 2 4

Nesse caso, o efeito de W é baixar os níveis de energia, conforme indica o sinal de σ. A


diferença entre dois níveis adjacentes é dada por
 
15 2
En − En−1 = 1 − σ n ~ω (5.89)
2

Essa diferença de energia não é mais independente de n, como no caso do oscilador harmônico.
Nesse caso as energias do estados não são mais equidistantes, a medida em que n cresce a a
diferença em energia diminui, conforme mostrado ilustrativamente na figura 5.2.

Prof. Salviano A. Leão 96


5.5. O Caso de Autovalores Degenerados

n+2

n+1

n−1

n−2

Figura 5.2: Níveis de energia de H0 , linhas pontilhadas, e de H, linhas sólidas. Sobre o efeito da
perturbação W , cada nível de H0 é baixado, e os n maiores possuem um deslocamento maior.

Substituindo as relações (5.87) na expansão (5.73), obtém-se que

X Wmn (0)
|ψn i = ψn(0) + (0) (0)
· ψm
m6=n En − Em
 3/2
n+1  n 3/2
= |ϕn i − 3σ |ϕn+1 i + 3σ |ϕn−1 i
2 2
r r
σ (n + 3)(n + 2) (n + 1) σ n (n − 1) (n − 2)
− |ϕn+3 i + |ϕn−3 i + · · ·
3 8 3 8
Portanto, sobre o efeito da perturbação W , o estado |ϕn i é misturado com os estados |ϕn+1 i,
|ϕn−1 i, |ϕn+3 i e |ϕn−3 i.

5.5 O Caso de Autovalores Degenerados


Não é de nenhuma maneira raro que o tratamento do problema de autovalores

(H0 + V ) |ψi = E |ψi ,

por métodos perturbativos, faça surgir uma dificuldade fundamental. Quando o problema de
autovalores não-perturbado


H0 ψn(0) = En(0) ψn(0)

exibe degenerescência; ou seja, alguns (ou todos) dos autovalores estão associados a mais de um
autovetor. A dificuldade provém de que não conhecemos o autovetor não-perturbado a que se

Prof. Salviano A. Leão 97


5.5. O Caso de Autovalores Degenerados

reduz o perturbado, se a perturbação for reduzida a zero. Como uma tal informação é vital em
qualquer teoria perturbativa, nossa primeira missão será investigar este problema.
(0)
Concentremos nossa atenção em um certo autovalor En que supomos ter degenerescência
de ordem gn , isto é, possui gn autovetores linearmente independentes. Qualquer combinação
linear destes é também um autovetor, de maneira que estamos tratando de todo um subespaço
g-dimensional de autovetores. Neste subespaço, podemos sempre selecionar uma base ortonormal,
composta dos vetores

|ψkn i (kn = 1, 2, 3, . . . , gn ) (5.90)


(0)
observe que todos estes vetores pertencem ao autovetor En , assim

H0 |ψkn i = En(0) |ψkn i (kn = 1, 2, 3, . . . , gn ). (5.91)


(0)
Ora, se um autovetor perturbado com energia E se reduz a um outro com energia En , então
seu autovetor |ϕi deverá reduzir-se a algum vetor de nosso subespaço. Como anteriormente
escreveremos

En (λ) = En(0) + λEn(1) + λ2 En(2) + . . .


|ϕi = ϕ(0) + λ ϕ(1) + λ2 ϕ(2) + . . .

(5.92)

É importante perceber que ϕ(0) não necessita ser um dos vetores |ψkn i, mas tem de ser
uma combinação linear deles:

gn
(0) X
ϕ = λkn Ckn |ψkn i , (5.93)
kn =1

e desejamos encontrar o conjunto de coeficiente Ckn . Como antes λ é um pequeno parâmetro,


tal que, 0 < λ ≤ 1.
Como antes, escrevemos a equação perturbada exata


X ∞ ∞
(i) X i (i)
X (j)
(H0 + λV ) ϕ = λ En ϕ (5.94)
i=0 i=0 j=0

e separamos as ordens de perturbação,


ordem zero:


H0 ϕ(0) (0) (0)

n = E n ϕ ;

primeira ordem:


H0 ϕ(1) + V ϕ(0) = En(0) ϕ(1) + En(1) ϕ(0) ;

segunda ordem:

Prof. Salviano A. Leão 98


5.6. Teoria de Perturbação de Wigner-Brillouin


H0 ϕ(2) + V ϕ(1) = En(0) ϕ(2) + En(1) ϕ(1) + En(2) ϕ(0) .

Enquanto que a equação de ordem zero é automaticamente satisfeita, podemos obter alguma
informação da equação de primeira ordem, formando os produtos internos com vetores |ψkn i.

Não importa o que seja ϕ(1) , temos

ψkn Hϕ(1) = H † ψkn ϕ(1) = En(0) ψkn ϕ(1) ,







pois H0 é hermitiano. Expressando ϕ(0) como
gn
(0) X
ϕ = C` |ψ` i , (5.95)
`=1

obtemos as seguintes g equações, correspondendo a cada valor de k:


g
X
C` hψk | V | ψ` i = En(1) Ck k = (1, 2, . . . , g) (5.96)
`=1

Como as quantidades Vk` = hψk | V | ψ` i podem ser calculadas, estamos em face de um


sistema de g equações algébricas em g incógnitas C1 .C2 , . . . , Cg . Estas equações são homogêneas
e do tipo de autovetores; exibimos isso explicitamente:
g g
X X
C` Vk` − En(1) · Ck = (Vk` − En(1) δk` )C` = 0
`=1 `=1

(1)
   
V11 − En V12 ··· V1g C1
(1)
V21 V22 − En ··· V2g C2
   
   
.. .. .. · .. =0 (5.97)
..


 . . . .
 
  .


(1)
Vg1 Vg2 · · · Vgg − En Cg
Este sistema de equações lineares homogêneas com respeito as quantidades C` tem soluções
diferentes de zero se o determinante dos coeficientes das incógnitas anula-se. Obtemos assim a
equação

V11 − En(1)

V12 ··· V1g

(1)
V21 V22 − En ··· V2g


.. .. .. =0 (5.98)
..


. . . .


(1)

Vg1 Vg2 · · · Vgg − En

det Vk` − En(1) δk` = 0. (5.99)

5.6 Teoria de Perturbação de Wigner-Brillouin


Teoria de perturbação de estados ligados se aplica aos estados ligados de sistemas perturbados,
para os quais os níveis de energia são discretos e separados uns dos outros. O sistema também

Prof. Salviano A. Leão 99


5.6. Teoria de Perturbação de Wigner-Brillouin

pode ter um espectro contínuo, mas o interesse está direcionado aos estados discretos. Os efeitos
de perturbações nos estados do espectro contínuo, ou nos estados discretos dentro do contínuo,
requerem diferentes técnicas, tais como a teoria de perturbação dependente do tempo.
A versão da teoria de perturbação de estado limite que você provavelmente está familiarizado
com é chamado de teoria de perturbação de Rayleigh-Schrödinger. Nessa seção, iniciaremos
com uma variação da teoria de perturbação de Rayleigh-Schrödinger, chamada de teoria de
perturbação de Brillouin-Wigner. A teoria Brillouin-Wigner é mais simples e menos confusa
para derivar do que a teoria de Rayleigh-Schrödinger, e também dá respostas mais precisas em
muitas circunstâncias. A sua desvantagem é que os níveis de energia desconhecidos são dados
apenas implicitamente, em termos das soluções de equações não lineares. Mas se as fórmulas
explícitas para os níveis de energia são desejadas, é fácil de expandir as soluções em potências
do parâmetro de perturbação, após o que os resultados da teoria de Rayleigh-Schrödinger são
recuperados.
Aqui o problema colocado é o mesmo da teoria de perturbação de Rayleigh-Schrödinger, ou
seja, dado o seguinte problema de autovalores

(H0 + W ) |ψi = H |ψi = E |ψi

o qual deve ser resolvido. Porém, agora ele será reescrito na seguinte forma

(E − H0 ) |ψi = W |ψi . (5.100)

Considere que os autoestados de H0 são tais que



H0 ϕ(i)
n = En(0) ϕ(i)
n

com
n ihϕn | = 1.

(i) (j) X
ϕn ϕm = δm,n δi,j e |ϕ(i) (i)
(5.101)
i,n

Agora serão introduzidos os projetores definidos por


gk
XX (i) (i)
P = |ϕ(i) (i)
n ihϕn | e Q= |ϕk ihϕk |, (5.102)
k6=n i=1

os quais satisfazem a seguinte relação

P +Q=1 =⇒ Q=1−P (5.103)

Viu-se anteriormente que era possível expandir o ket |ψi da seguinte forma
X
|ψi = ψ (0) + λ ψ (1) + λ2 ψ (2) + · · · = λi ψ (i) .

i


Considerando λ = 1 e que ψ (0) ψ (0) = 1, viu-se que

(0)
(i)
ψ ψ = ϕn ψ = 1.

Prof. Salviano A. Leão 100


5.6. Teoria de Perturbação de Wigner-Brillouin

Como pode-se escrever que

|ψi = 1 |ψi = (P + Q) |ψi = P |ψi + Q |ψi , (5.104)

porém como

(i) (i)
P |ψi = ϕ(i)
n ϕn ψ = ϕn , (5.105)
portanto, tem-se que

|ψi = ϕ(i)
n + Q |ψi (5.106)
Note que
[H0 , Q] = 0, (5.107)
então de (5.100) e(5.107) pode-se escrever

Q (E − H0 ) |ψi = (E − H0 ) Q |ψi = QW |ψi ,

da qual segue imediatamente que

Q |ψi = (E − H0 )−1 QW |ψi (5.108)

Agora, substituindo a equação (5.108) em (5.106) obtém-se que



|ψi = ϕ(i)
n + RW |ψi (5.109)

na qual foi introduzido um novo operador R, definido por


1 1
R = (E − H0 )−1 Q = Q = Q (E − H0 )−1 = Q . (5.110)
E − H0 E − H0
A equação (5.109) é resolvida por um processo iterativo, no qual substitui-se ela nela mesma.
Mais explicitamente tem-se que:

• Primeira iteração:
+ RW ϕn(i) + (RW )2 |ψi

|ψi = ϕ(i)
n

• Segunda iteração:

+ (RW )2 ϕn(i) + (RW )3 |ψi



|ψi = ϕ(i)
n + RW ϕ(i)
n

• k-ésima iteração

+ (RW )2 ϕ(i) + (RW )3 ϕ(i) + · · · + (RW )k+1 |ψi .



|ψi = ϕ(i)
n + RW ϕ(i)
n n n

Portanto, a série infinita é

+ (RW )2 ϕ(i) + (RW )3 ϕ(i) + · · · + (RW )k+1 ϕn(i) + · · · (5.111)



|ψi = ϕ(i)
n + RW ϕ(i)
n n n

Somando essa série infinita, obtém-se


1
|ψi = (1 − RW )−1 ϕ(i)
(i)
n = ϕ (5.112)
1 − RW n

Prof. Salviano A. Leão 101


5.7. O método variacional

Portanto, essa é a solução formal exata do problema.


E
(i)
Para obter a energia, projeta-se (5.100) em ϕn e como resultado tem-se que

E − E0 = ϕ(i) E = E0 + ϕ(i)

n
W ψ =⇒ n
W ψ (5.113)

Ao substituir (5.111) em (5.113), obtém-se a seguinte série de potências


(i)
(i)
E = E0 + ϕ(i) W ϕn + ϕn W RW ϕn(i) + ϕn(i) W RW RW ϕ(i)



n n + ··· (5.114)

mas com a representação espectral do operador R é


gk gk (i) (i)
1 XX (i) (i)
XX |ϕk ihϕk |
R= |ϕk ihϕk | = (0)
(5.115)
E − H0 k6=n i=1 k6=n i=1 E − Ek

então o resultado da substituição de (5.115) em (5.114) é uma forma mais familiar para a
expansão da energia em uma série perturbativa, ou seja, obtém-se que
D ED E
(i) (j) (j) (i)
(i) X ϕn W ϕk ϕk W ϕn
E = En(0) + ϕ(i)

n
W ϕn + +
(0)
j,k6=n E − Ek
D ED ED E
(i) (j) (j) (`) (`) (i)
X X ϕ n W ϕk ϕk W ϕm ϕ m W ϕn
   + · · · (5.116)
(0) (0)
j,k6=n `,m6=n E − E k E − E m

Note que a energia desconhecida E, aparece no denominador do lado direito; portanto, essa
não é uma expressão explicita para a energia E. Para calcular a energia com precisão em até
(0)
terceira ordem, nesse caso basta trocar E por seu valor de ordem zero, ou seja, E = En no
denominador do termo de Dterceira
ordem
E de (5.116); mas deve-se usar o valor da correção de
(i) (i)
primeira ordem E = E0 + ϕn W ϕn , no denominador do termo de segunda ordem.
Um modo mais prático de calcular a energia E a partir da expressão (5.116) é inicialmente
fazer uma estimativa para E, a qual deve ser substituída em todos os denominadores e a série
deve ser somada numericamente, e o novo valor obtido para a energia E deve ser reintroduzido
na série , até se obter um valor convergido para a energia E com
 a precisão
−1 desejada.
(0)
Se realizarmos uma expansão formal de todos os fatores de E − En do lado direito de
(5.116) em uma série de potência da força da perturbação, recupera-se a série perturbativa de
Rayleigh-Schrödinger. Em todas as ordens além da segunda, ela irá conter muito mais termos
do que (5.116), então ela é menos conveniente de se lidar do que a série (5.116), do formalismo
perturbativo de Wigner-Brillouin.

5.7 O método variacional


Existem muitas aplicações dos métodos variacionais para encontrar um extremo útil. Esta
é a essência do “método variacional”. Como forma de encontrar soluções aproximadas para a
equação de Schrödinger, uma abordagem comum é adivinhar uma forma aproximada de uma

Prof. Salviano A. Leão 102


5.7. O método variacional

solução, parametrizado de alguma forma. Os parâmetros são variadas até que seja encontrado
um extremo. Esta abordagem será ilustrada com exemplos.
Considere o seguinte problema de autovalores

H |ϕn i = En |ϕn i , com n = 0, 1, 2, . . . (5.117)

Embora o operador hamiltoniano H seja conhecido, não necessariamente os seus autovalores En


e os seus correspondentes autovetores |ϕn i são conhecidos.

5.7.1 Propriedades do estado fundamental do sistema


Para um vetor de estado |ψi qualquer tem-se que

hψ | H | ψi
hHiψ = ≥ E0 . (5.118)
hψ | ψi

Note que, o vetor de estado |ψi, pode ser expandido na base do autovetores de H, assim
X
|ψi = Cn |ϕn i , (5.119)
n

do que segue imediatamente que


X X
hψ | H | ψi = |Cn |2 En ≥ E0 |Cn |2 . (5.120)
n n

Aqui foi considerado que o vetor de estado |ψi é normalizado, ou seja,


X
hψ | ψi = |Cn |2 = 1. (5.121)
n

Com isso, tem-se que


X
hψ | H | ψi = |Cn |2 En ≥ E0 (5.122)
n

5.7.2 Generalização: O teorema de Ritz


Considere que

hψ | H | ψi
hHiψ = , (5.123)
hψ | ψi
nesse caso, o hHiψ é um funcional do vetor de estado |ψi. Portanto, pode-se calcular o incremento
δ hHiψ , quando |ψi → |ψi + δ |ψi, com δ |ψi = |δψi sendo infinitesimalmente pequena.
Reescrevendo a expressão (5.123) na seguinte forma

hHiψ hψ | ψi = hψ | H | ψi , (5.124)

ao fazer uma variação infinitesimal δ |ψi no vetor de estado |ψi, essa expressão toma a forma

δ hHiψ hψ | ψi + hHiψ [hδψ | ψi + hψ | δψi] = hδψ | H | ψi + hψ | H | δψi ,

Prof. Salviano A. Leão 103


5.7. O método variacional

e como hHiψ é um número, segue que


D E D E
hψ | ψi δ hHiψ = ψ H − hHiψ δψ + δψ H − hHiψ ψ .

Após uma cuidadosa análise dessa expressão, pode-se concluir que hHiψ será estacionário se

δ hHiψ = 0,

o que significa que


D E D E
ψ H − hHiψ δψ + δψ H − hHiψ ψ = 0.

Considere ainda que,


 
|ϕi = H − hHiψ |ψi ,

logo
hϕ | δψi + hδψ | ϕi = 0.

Essa relação deve ser satisfeita para qualquer valor infinitesimal do ket |ψi , em particular para

|δψi = δλ |ϕi ,

do que segue imediatamente que


2 hϕ | ϕi δλ = 0.

Então hϕ | ϕi = 0, o que nesse caso significa que |ϕi = 0, ou seja,


 
|ϕi = 0 =⇒ H − hHiψ |ψi = 0,

logo
H |ψi = hHiψ |ψi .

Portanto, o valor médio de hHiψ será estacionário se e somente se o vetor de estado |ψi
correspondente a ele, for um autovetor de H, e os valores estacionários de hHiψ forem autovalores
de H.

5.7.3 Exemplo: oscilador harmônico unidimensional


5.7.3.1 Estado fundamental

A seguir será usado o método variacional para determinar a energia do estado fundamental
de um oscilador harmônico unidimensional, cujo o hamiltoniano é

~2 d2 1
H=− 2
+ mω 2 x2 ,
2m dx 2
usando a seguinte função tentativa
2
ψα (x) = e−αx com α > 0.

Prof. Salviano A. Leão 104


5.7. O método variacional

Tem-se que ˆ +∞
2
hψα | ψα i = dx e−2αx
−∞
e que
ˆ +∞
~ 2 d2
 
−αx2 1 2
hψα | H | ψα i = dx e − 2
+ mω x e−αx
2 2
−∞ 2m dx 2
ˆ +∞
~2 d
 
−αx2 −αx2
= dx e − (−2αx) e +
−∞ 2m dx
ˆ +∞
1 2
dx mω 2 x2 e−2αx
−∞ 2
Chamando a primeira integral do lado direito de I1 , tem-se
ˆ +∞
~2 d
 
−αx2 −αx2
I1 = dx e − (−2αx) e ,
−∞ 2m dx
usando a integração por partes, na qual
ˆ ˆ
udv = uv − vdu,

com 
2 2


 u = e−αx du = −2αxe−αx dx

  
~2 ~2
 2 2
dv = d
αxe−αx dx v= αxe−αx

dx m m

logo +∞ ˆ
~2 −2αx2 ~2 2 +∞ 2
dx x2 e−2αx

I1 = αxe +2 α
m
−∞ m −∞
| {z }
=0
assim ˆ +∞
~2 α2 2
I1 = 2 dx x2 e−2αx .
m −∞
Dessa forma, tem-se que
ˆ +∞
~2 α2 1

2
Hαα = hψα | H | ψα i = 2 + mω 2 dx x2 e−2αx .
m 2 −∞

Note ainda que ˆ ˆ +∞


+∞
1 d
2 −2αx2 2
dx x e =− dx e−2αx
−∞ 2 dα −∞
e que a integral gaussiana. A seguir mostraremos algumas propriedades da integral gaussiana
definida por
ˆ +∞
2
In (α) = dx xn e−2αx (5.125)
−∞

Note que para n ímpar o integrando, da integral (5.125), é uma função ímpar, portanto, nesse
caso a integral é nula, esse resultado pode ser expresso da seguinte forma
ˆ +∞
2
I2n+1 (α) = dx x2n+1 e−2αx = 0 para n = 0, 1, 2, 3, . . .
−∞

Prof. Salviano A. Leão 105


5.7. O método variacional

Já para n par na integral (5.125), é integral possui um valor não nulo.


Sabe-se que
ˆ +∞ ˆ +∞
r r
0 −2αx2 −2αx2 π π −1/2
I0 (α) = dx x e = dx e = hψα | ψα i = = α .
−∞ −∞ 2α 2
Diferenciando ambos os lados da expressão anterior em relação α, obtém-se que
r
dI0 (α) 1 π −3/2 1
=− α = − I0 (α), (5.126)
dα 2 2 2α
portanto,
ˆ +∞
2 1 dI0 (α) 1
I2 (α) = dx x2 e−2αx = − = I0 (α). =⇒ 4αI2 (α)−I0 (α) = 0. (5.127)
−∞ 2 dα 4α
Temos ainda que
ˆ +∞  
1 d 2 −2αx2 1 dI2 (α) 1 d 1
I4 (α) = dx x e =− =− I0 (α)
2 dα −∞ 2 dα 2 dα 4α
1 1 1 1 dI0 (α)
= 2
I0 (α) −
8α  8 α dα
11 1 1
= + I0 (α)
8 α α 2α
3 1
= I0 (α) (5.128)
16 α2
Da qual segue que
3 1 31
I4 (α) = I0 (α) ou I4 (α) = I2 (α) (5.129)
16 α2 4α
Assim
 2 2 
1 ~α 1 2 dI0 (α)
Hαα = hψα | H | ψα i = − 2 + mω
2 m 2 dα
 2 2 
1 ~α 1
= 2 + mω 2 I0 (α)
4α m 2
 2 
~α 1 21
= + mω hψα | ψα i .
2m 8 α
Consequentemente, tem-se
hψα | H | ψα i
hHiψα = = hHiψα (α)
hψα | ψα i
~2 α 1 1
hHiψα (α) = + mω 2 .
2m 8 α
O mínimo dessa função, ocorre quando
~2

d 1 1
hHiψα (α) = − mω 2 2 = 0,
dα α0 2m 8 α0
logo
1 mω
α0 = .
2 ~
Portanto, para α = α0 tem-se que
1
hHiψα (α0 ) = ~ω.
2
Essa é a energia do estado fundamental do oscilador harmônico unidimensional.

Prof. Salviano A. Leão 106


5.7. O método variacional

5.7.3.2 Primeiro estado excitado

A energia do primeiro estado excitado também pode ser estimada, e para isso, basta escolher
uma função de onda que seja ortogonal a ψα0 (x) = hx | |ψα0 ii. Com esse intuito escolhe-se a
seguinte função de onda tentativa

2
ψα (x) = xe−αx com α > 0.

Assim,
ˆ +∞
2 1
hψα | ψα i = dx x2 e−2αx = I2 (α) = I0 (α)
−∞ 4α
e ˆ +∞
~2 d2
 
−αx2 1 2
hψα | H | ψα i = dx xe − 2
+ mω x xe−αx .
2 2
−∞ 2m dx 2
Chamando de I1 , a primeira integral do lado direito
ˆ +∞
~2 d
 
−αx2 2
 −αx2
I1 = dx xe − 1 − 2αx e ,
−∞ 2m dx

integrando ela por partes, com



2 2


 u = xe−αx du = (1 − 2αx2 )e−αx dx

 h i
dv = − ~2 d (1 − 2αx2 ) e−αx2 dx 2
 2
v = − 2m
~
(1 − 2αx2 ) e−αx

2m dx

logo
ˆ +∞
~2  −2αx2 +∞ ~2

2 2
I1 = − 2
x 1 − 2αx e + dx 1 − 2αx2 e−2αx
2m
−∞ 2m −∞
| {z }
=0

assim
ˆ +∞
~2 2 2
I1 = dx 1 − 2αx2 e−2αx
2m −∞
ˆ +∞
~2 2
dx 1 − 4αx2 + 4α2 x4 e−2αx

=
2m −∞
~2 
I0 (α) − 4αI2 (α) + 4α2 I4 (α)

=
2m

Dessa forma, tem-se que


ˆ +∞
~2
 
2 2 1 2
1 − 2αx + mω x e−2αx
2 4

Hαα = hψα | H | ψα i = dx
−∞ 2m 2
2 
~ 1
I0 (α) − 4αI2 (α) + 4α2 I4 (α) + mω 2 I4 (α).

=
2m 2

Prof. Salviano A. Leão 107


5.7. O método variacional

Mas de (5.127), 4αI2 (α) − I0 (α) = 0, segue que

2~2 α2 1
hψα | H | ψα i = I4 (α) + mω 2 I4 (α),
 m2 2 2 
2~ α 1
= + mω 2 I4 (α)
m 2
2
1 m2 ω 2
 
2~ 2
= α + I4 (α)
m 4 ~2
2~2 2  mω 2
 
= α + I4 (α)
m 2~

mas de (5.129), tem-se que I4 (α) = (3/4α)I2 (α), segue então que

3~2
  mω 2 1 
hψα | H | ψα i = α+ I2 (α).
2m 2~ α

Logo pode-se escrever


hψα | H | ψα i
hHiψα = = hHiψα (α)
hψα | ψα i

3~2  mω 2 1  3~2 α 3

1
hHiψα (α) = α+ = + mω 2 .
2m 2~ α 2m 8 α

O mínimo dessa função, ocorre quando

3~2 3

d 1
hHiψα (α) =
− mω 2 2 = 0,
dα α0 2m 8 α0

logo
1 mω
α0 = .
2 ~
Portanto, para α = α0 tem-se que

3~2  mω 2 1  3~2

3
hHiψα (α0 ) = α0 + = α0 = ~ω.
2m 2~ α0 m 2

Essa é a energia correta do primeiro estado excitado do oscilador harmônico unidimensional.

5.7.3.3 Estado fundamental: Funções de onda racionais

A seguir será estimada a energia do estado fundamental do oscilador harmônico unidimensi-


onal, usando para tal uma função de onda tentativa, da seguinte forma

1
ψα (x) = , com a > 0.
x2 + a

Nesse caso tem-se que


ˆ +∞
1 π
hψα | ψα i = dx 2 = 3/2 .
−∞ (x2 + a) 2a

Prof. Salviano A. Leão 108


5.7. O método variacional

Observação 5.1. A integral


ˆ +∞
1
I= dx ,
−∞ (x2 + a)2

pode ser calculada fazendo-se a seguinte substituição

√ √
x= a tg(θ) =⇒ dx = a sec2 (θ)dθ,

logo

√ ˆ +π/2 ˆ +π/2
a sec2 θ 1
I= dθ = 3/2 cos2 θdθ
a2 −π/2 sec4 θ a −π/2
ˆ +π/2
1 1
= 3/2
[1 + cos 2θ] dθ
a −π/2 2
 +π/2
1 1
= θ + sen 2θ
2a3/2 2 −π/2
π
=
2a3/2

Como o hamiltoniano do sistema é dado por

~2 d2 1
H=− 2
+ mω 2 x2 ,
2m dx 2

e
~2 d x2
 
2x 1
Hψα = − − + mω 2 2 ,
2m dx (x + a)2
2 2 x +a

logo
ˆ +∞
~2 d x2
   
1 2x 1 2
hψα | H | ψα i = dx 2 − − + mω 2 .
−∞ x +a 2m dx (x2 + a)2 2 x +a

A primeira integral do lado direito, pode ser feita por partes, assim

ˆ +∞
+∞ 2 ˆ +∞
~2 ~2
 
1 d x x ~ 2x
I1 = dx 2 = · + · dx ,
m −∞ x + a dx (x + a)2
2 3
m (x + a) −∞ m −∞
2 (x + a)4
2

logo
ˆ +∞ ˆ +∞
2~2 2x 1 x2
hψα | H | ψα i = · dx 4 + mω 2 dx .
m −∞ (x2 + a) 2 −∞ (x2 + a)2

Para resolver as integrais a seguir, usa-se a seguinte transformação

√ √
x= a tg(θ) =⇒ dx = a sec2 (θ)dθ,

Prof. Salviano A. Leão 109


5.7. O método variacional

assim
√ ˆ √ ˆ +π/2 2
2~2 a a +π/2 tg2 θ · sec2 θ 1 2 a a tg θ · sec2 θ
hψα | H | ψα i = · 4 dθ + mω · dθ
m a −π/2 sec8 θ 2 a2 −π/2 sec4 θ
ˆ +π/2 ˆ +π/2
2~2 sen2 θ 1 2 1
= dθ + mω · 1/2 sen2 θ dθ
ma5/2 −π/2 sec4 θ 2 a −π/2
2 ˆ +π/2 2 ˆ +π/2
2~ (2 sen θ · cos θ) 2 1 2 1
= cos θ dθ + mω · 1/2 (1 − cos(2θ)) dθ
ma5/2 −π/2 4 4 a −π/2
ˆ +π/2
~2 1 1
= 5/2
sen2 (2θ) (1 + cos(2θ)) dθ + mω 2 · 1/2 [π − 0]
4ma −π/2 4 a
" ˆ ˆ #
~2 1 +π/2 1 +π/2 1 π
= 5/2
(1 − cos(4θ))dθ + sen (2θ)d(sen(2θ)) + mω 2 · 1/2
2
4ma 2 −π/2 2 −π/2 4 a
~2 π 1 π
= · 3/2 + mω 2 · 1/2
8ma 2a 4  a
1 ~ 1 π
= · + mω 2 a · 3/2 .
4 ma 2 2a
Portanto,

hψα | H | ψα i 1 ~2 1
hHiψα = = hHiψα (a) = · + mω 2 a.
hψα | ψα i 4 ma 2
O mínimo da função hHiψα (a) é obtido, derivando-se ela em relação a variável a e igualando-se
o resultado a zero, assim
1 ~2
 
d 1 2
hHiψα (a)
= − · + mω = 0,
da a=a0 4 ma2 2 a=a0

logo √
2 ~
a0 = · .
2 mω
Consequentemente

2
hHiψα (a0 ) = · ~ω
2
Esse valor se desvia do resultado exato por

hHiψα (a0 ) − 21 · ~ω 2−1
≈ ≈ 0.2 =⇒ 20%
~ω 2

5.7.4 Átomo de Hélio


A seguir o método variacional será usado para determinar a energia do estado fundamental
do átomo de Hélio. Note que ao escolher a função de onda tentativa, deve-se ter em mente o
seguinte objetivo: deve-se escolher uma função tentativa que esteja muito próxima do estado
exato do sistema desejado, para obter-se um bom valor médio para a energia hEi do estado
desejado. Para o estado fundamental do átomo de hélio uma boa escolha é o estado fundamental
do átomo de hidrogênio, dado por
 3/2
1 Z
hr | 1, 0, 0i1s =√ e−Zr/a0 ,
π a0

Prof. Salviano A. Leão 110


5.7. O método variacional

e a função de onda tentativa para o estado fundamental do átomo de hélio

|ψ0 i = |1, 0, 0i1 ⊗ |1, 0, 0i2 ,

na qual os índices 1 e 2 referem-se aos dois elétrons.


Para calcularmos hEi = hψ0 | H | ψ0 i, é conveniente agrupar os termos do hamiltoniano da
seguinte forma
P21 P2 Ze2 Ze2 e2
H= + 2 − − +
2m 2me |R1 | |R2 | |R1 − R2 |
" e # " #
P21 Z̃e2 P22 Z̃e2 (Z̃ − Z)e2 (Z̃ − Z)e2 e2
= − + − + + +
2me |R1 | 2me |R2 | |R1 | |R2 | |R1 − R2 |

aqui introduziu-se o número atômico efetivo Z̃ que é o parâmetro o qual irá minimizar a
energia. Aqui o movimento do núcleo está sendo negligenciado, me é a massa do elétron e a
seguinte convenção foi adotada

q2
e2 = ; R1 = |R1 |; R2 = |R2 |; e R12 = |R1 − R2 |.
4π0
Para obtermos uma boa “função de onda tentativa”, note que, se o termo de interação e2 /R12
não estiver presente, a função de onda do estado fundamental por será dada simplesmente
pelo produto de duas funções de onda do estado fundamental do átomo de hidrogênio, com as
respectivas funções R1 e R2 :

Z̃ 3 − aZ̃ (r1 +r2 ) 4π0 ~2 ~2


hr1 , r2 | ψ0 i = ψ0 (r1 , r2 ) = e 0 , a0 = = . (5.130)
πa30 me q 2 me e2
Não há um motivo pelo qual possa-se esperar que o termo e2 /R12 seja especialmente “pequeno”
comparado com os outros termos, então uma aproximação via teoria de perturbação pode não
funcionar bem aqui. Entretanto, a função de onda acima será usada no método variacional,
e usaremos o Z̃ como sendo o parâmetro variacional do problema, para obtermos um limite
superior para a energia do estado fundamental do átomo de hélio.
É necessário calcular o valor esperado de H. A energia cinética de um elétron é:

ˆ ˆ
P2 Z̃ 3 −Z̃r1 /a0 P21 −Z̃r1 /a0 Z̃ 3
hψ0 | 1 |ψ0 i = 3
d (r1 ) 3 e e × d3 (r2 ) 3 e−2Z̃r2 /a0
2me (∞) πa0 2me (∞) πa0
ˆ +∞
Z̃ 3 ~2 1 ∂ 2  −Z̃r1 /a0 
 
2 −Z̃r1 /a0
= −4π · 3 · r1 e r1 e dr1 × 1
πa0 2me 0 r1 ∂r12
ˆ +∞ " ! #
4Z̃ 3 ~2 1 ∂ Z̃
=− · · r12 e−Z̃r1 /a0 1 − r1 e−Z̃r1 /a0
a0 2me a20 0 r1 ∂r1 a0
ˆ +∞ " ! #
4Z̃ 3 Z̃ Z̃ Z̃ −Z̃r1 /a0
=− · Ry · r1 e−Z̃r1 /a0 − − 1 − r1 e
a0 0 a0 a0 a0
ˆ +∞ !
4Z̃ 4 Z̃
= 2 · Ry · r1 2 − r1 e−2Z̃r1 /a0
a0 0 a0

Prof. Salviano A. Leão 111


5.7. O método variacional

Como, foi visto anteriormente que as integrais


ˆ ∞  k+1
k −pr/a0 a0
I(k, p) = r e dr = k! ·
0 p

logo
" #
P21 4Z̃ 4 Z̃
hψ0 | |ψ0 i = 2 · Ry · 2I(1, 2Z̃) − I(2, 2Z̃)
2me a0 a0
"    3 #
2
4Z̃ 4 a0 Z̃ a0
= 2 · Ry · 2 − 2
a0 2Z̃ a0 2Z̃
2
4Z̃ 4
 
a0
= 2 · Ry · [2 − 1]
a0 2Z̃
= Z̃ 2 · Ry

Aqui Ry é o Rydberg efetivo, que é dado por

e2 ~2 me e4 1 1 ~c
Ry = = 2
= 2
= α 2 m e c2 = α .
2a0 2me a0 2~ 2 2 a0

A constante de estrutura fina α é dada por

e2 q2 1 ∼ 1
α= = · =
~c 4π0 ~c 137, 036

Em termos da constante de estrutura fina, o raio de Bohr pode ser reescrito como

~ ~ ~ 1 ~
a0 = · 2 = = · ·
me e αme c α me c

Portanto,
P21 P2
hψ0 | + 2 |ψ0 i = 2Z̃ 2 Ry = Z̃ 2 α2 me c2 . (5.131)
2me 2me
Similarmente tem-se que,
ˆ ˆ
Z̃e2 Z̃ 3 Z̃e2 −Z̃r1 /a0 Z̃ 3 −2Z̃r2 /a0
hψ0 | − |ψ0 i = − d (r1 ) 3 e−Z̃r1 /a0
3
e × d3 (r2 ) e
|R1 | (∞) πa0 |R1 | (∞) πa30
ˆ ∞
Z̃ 4 e2
= −8 2 · · r1 e−2Z̃r1 /a0 dr1
a0 2a0 0
 2
Z̃ 4 a0
= −8 2 · Ry ·
a0 2Z̃
= −2Z̃ 2 Ry

Portanto, temos que calcular

Prof. Salviano A. Leão 112


5.7. O método variacional

ˆ ˆ
(Z̃ − Z)e2 Z̃ 3 (Z̃ − Z)e2 −Z̃r1 /a0 Z̃ 3 −2Z̃r2 /a0
hψ0 | |ψ0 i = d (r1 ) 3 e−Z̃r1 /a0
3
e × d3 (r2 ) e
|R1 | (∞) πa0 |R1 | (∞) πa30
ˆ ∞
Z̃ 3 (Z̃ − Z) e2
=8 · · r1 e−2Z̃r1 /a0 dr1
a20 2a0 0
 2
Z̃ 3 (Z̃ − Z) a0
=8 2
· Ry ·
a0 2Z̃
= 2Z̃(Z̃ − Z) · Ry

" #
P21 Z̃e2 P22 Z̃e2
hψ0 | − + − |ψ0 i = 2Z̃ 2 Ry − 4Z̃ 2 Ry = −2Z̃ 2 Ry (5.132)
2me |R1 | 2me |R2 |
" #
(Z̃ − Z)e2 (Z̃ − Z)e2
hψ0 | + |ψ0 i = 4Z̃(Z̃ − Z) · Ry (5.133)
|R1 | |R2 |
Portanto, falta calcular a “energia de interação” entre os dois elétrons, para a função de onda
tentativa:
ˆ ˆ !2
− 2aZ̃ (r1 +r2 )
e2 Z̃ 3 e 0
hψ0 | |ψ0 i = e2 3 3
d (r1 )d (r2 ) . (5.134)
R12 (∞) (∞) πa30 |r1 − r2 |
A seguir será feita uma integral, a qual será muito útil .

Teorema 5.2. Seja u, v, e w três números reais positivos (os quais também podem ser zero).
Então

ˆ
0 exp(−u|y − x| − v|y − x0 |)
I(u, v; x, x ) ≡ d3 (y)
(∞) |y − x||y − x0 |
4π e−v∆ − e−u∆

= , (5.135)
∆(u2 − v 2 )

na qual ∆ ≡ |x − x0 |.

ˆ ˆ
3 exp(−u|x| − v|y| − w|x − y|)
J(u, v, w) ≡ d (x) d3 (y)
(∞) (∞) |x||y||x − y|
2
(4π)
= . (5.136)
(u + v)(v + w)(w + u)

Demonstração. A seguir é mostrado com determinar tal integral


Inicialmente considere que z = y − x, e que |z| = r. Então a seguinte troca de variáveis
pode ser feita
d3 (y) → d3 (z) = r2 drd cos θdφ. (5.137)

Para simplificar a integração sobre os ângulos, considere, sem perdas de generalidade, que um
dos eixos do sistema está direcionado ao longo do vetor x − x0 :

|y − x0 | = |z + x − x0 | = r2 + ∆2 + 2r∆ cos θ. (5.138)

Prof. Salviano A. Leão 113


5.7. O método variacional

Portanto,
ˆ ∞ ˆ 1

exp(−v r2 + ∆2 + 2r∆ cos θ)
I(u, v; x, x0 ) = 2π re−ur dr d cos θ √ . (5.139)
0 −1 r2 + ∆2 + 2r∆ cos θ

A integração sobrecos θ resulta


ˆ ∞

0
dre−ur e−v|r−∆| − e−v(r+∆) .
 
I(u, v; x, x ) = (5.140)
v∆ 0

Finalmente, integrando sobre r obtém-se


−v∆ −u∆

4π e − e
I(u, v; x, x0 ) = . (5.141)
∆(u2 − v 2 )

Seja x = |x|, y = |y|, logo escreva


ˆ ∞ ˆ ∞ ˆ 1
2 2
J(u, v, w) = 4π x dx 2π
y dy d cos θ (5.142)
0 0 −1
p
exp(−ux − vy − w x2 + y 2 − 2xy cos θ)
p .
xy x2 + y 2 − 2xy cos θ

A integração procede similarmente a acima.

Aplicando agora esse teorema ao nosso problema, temos


!2 ˆ ˆ − 2aZ̃ (|x|+|y|)
e2 Z̃ 3 e 0
hψ| |ψi = e2 3
d (x)d (y) 3
R12 πa30 (∞) (∞) |x − y|
!2
2 Z̃ 3
= e ∂u ∂v J(u = 2Z̃/a0 , v = 2Z̃/a0 , 0) (5.143)
πa30
5
= Z̃Ry. (5.144)
4

Portanto,
 
5 2
hψ| H |ψi = −2Z̃ + 4Z̃(Z̃ − Z) + Z̃ · Ry.
4
 
5
= 2Z̃ 2 − 4Z̃Z + Z̃ · Ry
4

Para determinar o mínimo, deve-se


 
∂ 5 5
hψ| H |ψi = 4Z̃ − 4Z + · Ry = 0 =⇒ Z̃ = Z − ,
∂ Z̃ 4 16

mas como Z = 2, então segue que

5 27
Z̃ = 2 − = .
16 16
Prof. Salviano A. Leão 114
5.7. O método variacional

Portanto, o mínimo está em Z̃ = 27/16. Logo


 
5
hψ| H |ψimin |Z̃=27/16 = 2Z̃(Z̃ − 2Z) + Z̃ · Ry
4
 
5
= Z̃ 2(Z̃ − 2Z) + · Ry
4
 
27 27 5
= 2( − 4) + · Ry
16 16 4
= −77.04 eV.

Experimentalmente, a energia do estado fundamental do átomo de hélio, da primeira e segunda


energias de ionização, é
E0 = −(24.59 + 54.41) = −79.00 eV. (5.145)

O valor obtido pelo método variacional com a função tentativa do átomo de hidrogênio está
2.5% acima do resultado experimental. Cálculos variacionais mais cuidadosos, com melhores
funções tentativa, fornecem valores mais próximos do resultado experimental. Note que o melhor
valor obtido para o número atômico efetivo foi Z̃ = 27/16 em vez de Z̃ = Z = 2. Isso sugere
5
que o núcleo blinda um elétron em relação ao outro, o que reduz a carga efetiva para 16
e.

Prof. Salviano A. Leão 115


5.7. O método variacional

Prof. Salviano A. Leão 116


Capítulo 6

A Estrutura Fina e Hiperfina do Átomo


de Hidrogênio

6.1 Introdução

Aqui será considerada a estrutura fina do átomo de hidrogênio e de átomos hidrogenoides


assim como do alcalinos1 , o que diz respeito aos efeitos relativísticos e de spin sobre a dinâmica do
elétron. Ambos efeitos são da mesma ordem de grandeza, e devem ser tratados em conjunto em
qualquer tratamento realista da estrutura atômica. De fato, o spin em si pode ser visto como um
fenômeno fundamentalmente relativístico, embora em aplicações de baixa energia ele geralmente
é tratado dentro de uma estrutura nominalmente não-relativística pela inclusão de termos extras
na equação de Schrödinger. Esta será a abordagem dada aqui, na qual os termos da estrutura
fina serão tratados como perturbações impostas ao modelo eletrostático simples usado na solução
do átomo de hidrogênio. Os termos de estrutura fina são responsáveis por efeitos relativísticos
da ordem de (v/c)2 , e tem o efeito de ampliar o espaço de Hilbert com a inclusão dos graus de
liberdade de spin, e consequentemente com a introdução de novos números quânticos, deslocando
e abrindo a degenerescência dos níveis de energia do modelo eletrostático. Em particular o
deslocamento dos níveis de energia significa que as linhas espectrais que aparecem com sendo
um estado singleto em baixa resolução tornam-se multípletos espaçados em alta resolução e vem
daí o termo “estrutura fina”. A estrutura fina era conhecida experimentalmente muito antes
de ter sido alcançada uma compreensão teórica adequada, e foi uma importante força motriz
no desenvolvimento teórico em determinada fase da história da física atômica. Além de seu
interesse intrínseco e importância na física atômica, a estrutura fina é interessante como uma
janela sobre mecânica quântica relativística.

1
Os metais alcalinos apresentam configuração eletrônica terminada em ns1 . O único elétron existente na
camada de valência está relativamente afastado do núcleo, e protegido pela camada interna preenchida. Por isso
esse elétron pode ser removido com facilidade. Em contraste, os elétrons internos estão próximos ao núcleo, mais
firmemente ligados, sendo muito difícil removê-los. Por isso, esse modelo funciona bem.

117
6.2. O Hamiltoniano não perturbado

6.2 O Hamiltoniano não perturbado


As forças mais importantes no modelo atômico são as forças eletrostáticas de Coulomb, as
quais foram levadas em conta na solução do átomo de hidrogênio. O sistema não perturbado
é um átomo de um único elétron, o átomo de hidrogênio, os hidrogenoides e alcalinos, cujo
Hamiltoniano tem a seguinte forma geral
P2
H0 = + V (R), (6.1)

na qual o primeiro termo representa a energia cinética do átomo no referencial do centro de
massa, e µ é a massa reduzida do sistema elétron-núcleo. Já o segundo termo,
q2 1 e2
V (R) = − =− (6.2)
4π0 R R
representa a interação eletrostática entre o elétron e o próton, e q, com q < 0, é a carga do
elétron.
A expressão (6.1) é uma aproximação, pois ela não leva em conta efeitos relativísticos. Além
disso, todos os efeitos magnéticos relacionados ao spin do elétron são ignorados, assim como, o
spin do próton e suas correspondentes interações magnéticas. Esses termos são de fato muito
pequenos, porém com a precisão obtida nos experimentos de espectroscopia, torna possível
observarmos efeitos que não estão incluídos no Hamiltoniano (6.1). Portanto, essas correções
podem ser levadas em conta, ao escrevermos o Hamiltoniano do átomo de hidrogênio na forma:

H = H0 + W, (6.3)

em que o termo H0 é dado por (6.1) e W representa todos os termos negligenciados. Desde que
W é muito menor que H0 é possível calcularmos seus efeitos sobre a energia total do átomo
de hidrogênio, usando a teoria de perturbação independente do tempo. Mostraremos que as
correções perturbativas devido ao termo W , podem ser separadas em duas categorias, devido ao
valor da correção na energia, as quais são:

1. Estrutura fina do átomo de hidrogênio;

2. Estrutura hiperfina do átomo de hidrogênio.

As correções devido aos efeitos relativísticos do átomo de hidrogênio são pequenas, pois de
acordo com o modelo de Bohr, temos
q2 1 mv 2 1 2 1 q2 1
Fe = Fc =⇒ = =⇒ mv = · (6.4)
4π0 r r 2 2 4π0 r
porém da conservação da energia temos
1 q2 1 q2 1
E = T + U = mv 2 − =⇒ E=− . (6.5)
2 4π0 r 8π0 r
Definindo
q2
e2 = (6.6)
4π0

Prof. Salviano A. Leão 118


6.2. O Hamiltoniano não perturbado

temos que
e2
E=−
, (6.7)
2r
usando a regra de quantização do momentum angular de Bohr temos
nh n~
L = mvr = = n~, n = 1, 2, 3, . . . =⇒ mv = (6.8)
2π r
portanto, desta segue que
n2 ~22
mv = (6.9)
mr2
Comparando (6.4) com (6.9), obtemos que
1 2 n2 ~2 e2
mv = = (6.10)
2 2mr2 2r
logo,
n2 ~2
r= =⇒ rn = n2 a0 (6.11)
me2
na qual o raio de Bohr efetivo a0 é dado por
~2
a0 = = 0, 5 Å (6.12)
me2
então
e2 1 Ry
En = − · , =⇒ En = − (6.13)
2a0 n2 n2
na qual Ry é o Rydberg efetivo, que é dado por

e2 ~2 me4
Ry = = = (6.14)
2a0 2ma20 2~2
A constante de estrutura fina α é dada por
e2 ∼ 1
α= = (6.15)
~c 137, 036
Em termos da constante de estrutura fina, o raio de Bohr pode ser reescrito como
~ ~ ~ 1 ~
a0 = · 2 = = · · (6.16)
m e αmc α mc
enquanto o Rydberg efetivo pode se escrito como
1 e4 1 1 ~c
Ry = m 2 = α2 mc2 = α . (6.17)
2 ~ 2 2 a0
A velocidade da n-ésima órbita do átomo de hidrogênio é dada por
1 ~ 1
L = mvn rn = n~ =⇒ mvn n2 a0 = n~ =⇒ vn = · = · αc
n ma0 n
logo pode-se escrever
v  α
n
=. (6.18)
c n
Portanto, desta vê-se que a velocidade do elétron, na primeira órbita do átomo de hidrogênio
é bem menor do que a velocidade da luz c, logo fica evidente que as correções relativísticas para
a energia do estado fundamental do átomo de hidrogênio são pequenas.

Prof. Salviano A. Leão 119


6.3. Correções adicionais ao hamiltoniano do átomo de hidrogênio

6.3 Correções adicionais ao hamiltoniano do átomo de hi-


drogênio
Inicialmente vamos partir da equação de Dirac relativística para o átomo de hidrogênio
no regime fracamente relativístico. Nesse caso, será feita uma expansão para determinar uma
expressão para o hamiltoniano das correções perturbativas W . Posteriormente, será identificado
cada termo, e apresentada uma interpretação para o mesmo.

6.3.1 O Hamiltoniano da estrutura fina

A equação de Dirac é o modo mais rigoroso de se obter uma expressão para as correções
relativísticas. Considere a equação de Dirac de um elétron interagindo com um próton via um
potencial coulombiano V (R). No limite em que o sistema é fracamente relativístico, como é o
caso do átomo de hidrogênio, ao expandirmos a equação de Dirac em uma série de potências em
(v/c), obtém-se que

P2 P4 1 1 dV (R) ~2
H = me c2 + + V (R) − + · L · S + ∇2 V (R) + · · · (6.19)
2me 8m3e c² 2m2e c² R dR 8m2e c²

na qual têm-se que:

E0 = me c2 =⇒ Energia de repouso do elétron (6.20a)


P2
H0 = + V (R) =⇒ Hamiltoniano clássico do átomo de hidrogênio (6.20b)
2me
P4
Wmv = − 3 =⇒ Variação da massa com a velocidade (6.20c)
8me c²
1 1 dV (R)
Wso = 2
· L·S =⇒ Acoplamento spin-órbita (6.20d)
2me c² R dR
~2
WD = ∇2 V (R) =⇒ Termo de Darwin (6.20e)
8m2e c²

Deve-se ressaltar que é possível resolver a equação de Dirac para um elétron, num potencial
coulombiano. Entretanto a abordagem via teoria de perturbação nos permiti identificar e
compreender o significado físico das várias interações existentes dentro do átomo.

6.4 Interpretação dos vários termos do hamiltoniano H


Nesta seção será fornecida uma interpretação física para cada um dos três novos termos que
surgem ao expandirmos a equação de Dirac em uma série de potências em (v/c) [7, 24]. Os dois
primeiros de (6.19) possuem uma interpretação direta.

Prof. Salviano A. Leão 120


6.4. Interpretação dos vários termos do hamiltoniano H

6.4.1 Termo Wmv da variação da massa com a velocidade


Origem Física

Ao expandirmos a expressão da energia total relativística de uma partícula, dada por


s  2
p
2 2 2 2 p
E = (me c ) + (Pc) = me c 1 + , (6.21)
me c

em uma série de potências do termo |p|/me c2 , obtemos que


s 2
1 p2 1 p4

p
1+ =1+ − − ···
me c 2 m2e c2 8 m4e c4

e com isso pode-se escrever

p2 1 p4
E = me c2 + − + ··· (6.22)
2me 8 m3e c2

Nessa expressão tem-se a energia de repouso do elétron E0 = me c2 e a sua energia cinética


p2 /2me . Por sua vez o terceiro termo dessa expansão, −p4 /8m3e c2 representa a primeira correção
na energia devido a variação da massa com a velocidade.

Ordem de magnitude

Para estimarmos a ordem de magnitude da correção Wmv , será calculada a ordem de


magnitude da razão Wmv /H0 , e para isso será considerado que H0 ' P2 /2me , assim
1 p4 2
P2

Wmv 8 m3e c2 1  v 2 1 2 1 1
' = = = α = = 1, 3 × 10−5 (6.23)
H0 P2 4m2e c2 4 c 4 4 137, 036
2me
Portanto, como H0 ' 13, 6 eV, segue então que Wmv ' 0, 18 meV.

6.4.2 Termo Wso : Acoplamento spin-órbita


Origem física

O termo devido ao acoplamento spin-órbita possui a seguinte forma

HSO = −Ms · B0 ,

na qual, MS é o momento magnético do elétron e B0 é o campo magnético visto pelo elétron no


seu referencial (esse referencial é indicado pelo linha nos campos, para maiores detalhes sobre as
transformações dos campos veja o livro do Purcell [30, Ver capítulo 5] e do Matveev [23, Parágrafo
2
Lembre-se que
n(n − 1) 2 n(n − 1)(n − 2) 3
(1 + x)n = 1 + nx + x + x + ···
2! 3!

Prof. Salviano A. Leão 121


6.4. Interpretação dos vários termos do hamiltoniano H

11, pág 77]). No caso do átomo de hidrogênio, esse campo magnético pode ser compreendido
como sendo devido a carga positiva do núcleo, a qual no referencial do elétron ela orbitá o
elétron, gerando uma corrente. No caso dos átomos alcalinos, o elétrons do caroço também
estão orbitando o elétron de valência, vistos no referencial do elétron de valência, e também
contribuem para o campo magnético naquele referencial.
Em um outro ponto de vista, o campo magnético B0 pode ser visto como o campo magnético
que surge quando faz-se uma transformação de Lorentz do campo eletrostático no referencial do
núcleo (referencial do laboratório) para o referencial do elétron. Será considerado que não há um
campo magnético no referencial do laboratório. Entretanto, se o núcleo possui um spin diferente
de zero, então ele produz campo de dipolo magnético, o qual é o responsável pela interação
hiperfina. Mas quando presente, esse campo de dipolo é muito menor do que o campo magnético
B0 responsável pelos efeitos da interação spin-órbita, assim aqui ele é ignorado. Portanto, usando
as expressões sem linha E e B para os campos no referencial do laboratório temos que
 
V 1 dV (r)
E = −∇ =− êr e B=0
q q dr

na qual
e2 r
V (r) = − e êr = .
r |r|
Agora, como o elétron move-se com uma velocidade v = p/me no campo eletrostático E
criado pelo próton. De acordo com a relatividade especial, no referencial do elétron, o elétron
percebe um campo magnético B0 , o qual é dado por [31, ver seção 8.1, pág. 163]

1
B0 = − v × E. (6.24)
c2
Como o elétron possui um momento magnético intrínseco,
q
Ms = S, (6.25)
me

ele interage com o campo magnético B0 , e sua correspondente energia de interação é dada por

W 0 = −Ms · B0 . (6.26)

O campo eletrostático E é dado por

e2
 
V 1 dV (r) r
E = −∇ =− , com V (r) = −
q q dr |r| r

logo o campo magnético B0 pode ser escrito como

1 1 dV (r) p
B0 = × r,
qc2 r dr me

mas como o operador momentum angular é dado por

L = R × P = −P × R,

Prof. Salviano A. Leão 122


6.4. Interpretação dos vários termos do hamiltoniano H

segue então que


1 1 dV (r)
B0 = − L (6.27)
qme c2 r dr
Portanto, a interação W 0 dada por (6.26), toma a seguinte forma

1 1 dV (R) e2 1
W0 = L · S = L·S (6.28)
qme c2 R dR m2e c² R3

Portanto, a menos de um fator 1/2, encontramos os termos que constituem o acoplamento


spin-órbita Wso . Esse fator 1/2 deve-se a precessão de Thomas, para a qual o movimento
do elétron em torno do próton é circular e não retilíneo, para detalhes consulte o livro do
Jackson [20, seção 11.5, pág 364]. O termo Wso representa a interação do momento magnético
do spin do elétron com o campo magnético “percebido, sentido” pelo elétron, devido ao seu
movimento no campo eletrostático do próton.

Ordem de magnitude

Desde que os momenta angulares L e S são da ordem de ~, temos que,

e2 ~2 e2 ~2 2 e2 ~2 2
Wso ' 2 3
' 2 3
= · · 2
= · Ry · Ry, (6.29)
2me c² R 2me c² a0 me c² 2a0 2me a0 me c²

considerando que H0 ' e2 /2a0 , então tem-se que

Wso 2 1
' · α2 me c2 = α2 ' 7, 30 × 10−6 . (6.30)
H0 me c² 2

6.4.3 O termo de Darwin


Sir Charles Galton Darwin (1887-1962), físico britânico, neto do biólogo Charles Darwin, foi
um dos primeiros, a trabalhar com os níveis de energia exatos do hidrogênio de acordo com a
equação de Dirac e desse modo descobriu o termo que leva o seu nome para a correção fina da
energia do estado fundamental do hidrogênio [9], o qual é dado por

~2
WD (r) = 2 2
∇2r V (r).
8me c

O termo Darwin pode ser obtido a partir de uma aproximação de baixa energia da equação
de Dirac do elétron em um campo central. Uma maneira elegante de executar esta tarefa é
por meio da transformação Foldy-Wouthuysen [29] ou usando a aproximação de Pauli para a
equação de Dirac [32–34, 36]. A mesma aproximação leva também aos outros termos detectados
na estrutura fina átomo de hidrogênio, incluindo o termo spin-órbita.

Origem física

Diferentemente dos outros dois termos da estrutura fina, o Wmv e o Wso , este termo não é
fácil de se interpretar, pois de modo grosseiro pode-se dizer que ele descreve uma certa não
localidade na interação do elétron com o campo eletrostático descrito pelo potencial coulombiano

Prof. Salviano A. Leão 123


6.4. Interpretação dos vários termos do hamiltoniano H

Figura 6.1: Ilustração do movimento tremido do elétron, conhecido como “Zitterbewegung”, cujo
origem vem do alemão “zittern” que significa tremer e “Bewegung” que significa movimento. Este é um
movimento oscilatório extremamente rápido realizado pelo elétron.

V (R). Esta última contribuição para a estrutura fina é conhecida com termo de Darwin s surge
do movimento “tremido” do elétron, conhecido como “Zitterbewegung”, no qual é equivalente a
um pequena “perturbação” no potencial sentido pelo elétron.
No caso convencional, há uma dedução alternativa simples, a qual é baseada no fato de que um
pacote de ondas formado pela soluções da equação de Dirac realizam um movimento oscilatório
muito rápido com uma amplitude da ordem de δr ≈ λc := ~/(mc), na qual λc é o comprimento
de onda de Compton. Esse é o chamado ’Zitterbewegung’ (movimento tremido) resulta da
interferência das componentes de energia positiva e negativa dos pacotes de onda [19, 32, 33, 36].
Na média, a partícula sente portanto um potencial um pouco alargado sobre uma região da
ordem de δr, em vez de seu valor em r. A mudança média resultante na energia é facilmente
estimada como sendo [19, 32, 33]

hδV (r)i = hV (r + δr) − V (r)i


* +
X ∂V 1X ∂ 2V
= δri + δri δrj + ...
i
∂ri 2 ij ∂ri ∂rj
1 ~2
≈ (δr)2 ∇2r V (r) ≈ ∇2 V (r)
6 6m2 c2 r
na qual considerou-se que as flutuações não possuem uma direção preferencial no espaço. O
potencial médio resultante hδV (r)i está acima daquele do termo convencional de Darwin WD (r)
por um fator numérico de 6/8.
Na equação de Dirac, a interação entre o elétron e o campo elétrico coulombiano do núcleo é
“local”, pois ela só depende do valor do campo na posição r do elétron. Porém, na aproximação
não-relativística, na qual faz-se uma expansão da equação de Dirac em série de Taylor em termos
de (v/c), que fornece para as duas componentes do spinor, como resultado, uma equação cuja
descrição do estado do elétron, que trata a interação do elétron com o campo elétrico de forma
não local.

Prof. Salviano A. Leão 124


6.4. Interpretação dos vários termos do hamiltoniano H

Se colocarmos um elétron dentro de uma caixa de largura


L, então, pelo princípio da incerteza o momentum do elétron p = mc L
poderá ter valores da ordem de ~/L. Se L for pequeno o
suficiente, pode-se tornar este momentum tão grande quanto
se deseja, tendo até mesmo valores relativísticos. Tomando L
L
então o momentum p = me c, para o qual os efeitos relativís- Figura 6.2: Caixa com um elétron
ticos são significativos, e resolvendo para ∆x = L o princípio com um momentum linear p = me c.
de incerteza ∆p · ∆x = ~, obtém-se que

~ ~
L = λc = = (6.31)
∆p me c
na qual foi introduzida a constante λc , conhecida como comprimento de onda de Compton.
Esta constante, define uma escala de tamanhos em que os efeitos relativísticos e quânticos
tornam-se importantes para distâncias menores do que esta escala de tamanho. Esta escala de
comprimento pode ser definida para qualquer partícula, entretanto, para o elétron ela é

λc = αa0 = 3, 0 × 10−13 m

em que α é a constante de estrutura fina e a0 é o raio de Bohr. O comprimento de onda de


Compton do elétron é da ordem 1/137 vezes o tamanho do átomo de hidrogênio. Note que este
tamanho ainda é da ordem de 102 maior que o raio nuclear, o qual é da ordem de 10−15 m,
então os efeitos quânticos e relativísticos são importantes dentro do núcleo.
Se um elétron está confinado a uma distância da ordem do comprimento de onda Compton,
então, o correspondente momentum devido ao princípio da incerteza implica em uma energia
comparável à mc2 , a energia de repouso do elétron. Então, processos, tais como criação de pares
tornam-se possível, ou seja, a reação,

e− → e− + e− + e+ , (6.32)

na qual, e− representa um elétron e e+ representa um pósitron.


Tais reações, de fato, não ocorrem dentro de um átomo, porque não há energia suficiente
(é necessário no mínimo de 2mc2 ) para criar um par elétron-pósitron. Mas os estados que
contêm dois elétrons e um pósitron aparecem virtualmente, ou seja, por um período de tempo
curto o suficiente para que a violação da conservação da energia não possa ser notada (isto é,
algumas vezes menor do que ~/2mc2 ). Por outro lado, tais estados virtuais aparecem na teoria
de perturbação quando se soma sobre todos os “estados intermediários”, os quais surgem, em
última análise a partir de uma relação de completeza.
O par elétron-pósitron criado conforme a eq. (6.32), sobrevive por um curto intervalo de
tempo da ordem de ∆t = ~/me c2 , então viajando em uma velocidade comparável a velocidade
da luz, as partículas percorrem uma distância da ordem de λc = ~/me c, antes de se aniquilarem
e sumirem novamente. O efeito pode ser visto como um borrão, uma mancha, na posição
atômica do elétron através de uma distância da ordem λc .

Prof. Salviano A. Leão 125


6.4. Interpretação dos vários termos do hamiltoniano H

Para modelar esse efeito, considere a função de distribuição f (r) a qual representa esse
borrão, ou incerteza, na posição atômica do elétron. Essa função é normalizada de modo que
ˆ
d3 r f (r) = 1. (6.33)

Então a energia efetiva da interação do elétron com com um potencial eletrostático V (r) na
posição r0 não é V (r0 ), mas em vez disso
ˆ
hV (r)i = d3 r f (r − r0 )V (r)

Considerando que V (r) varie lentamente na escala de variação de f (r − r0 ), então nesse caso,
pode-se expandir V (r) em um série de Taylor em torno do ponto r0 , obtendo que
ˆ
∂ 2 V (r0 )
 
3 1
hV (r + r0 )i = d r f (r) V (r0 ) + (r − r0 ) · ∇V (r0 ) + (ri − r0i )(rj − r0j ) + ···
2 ∂ri ∂rj
(6.34)
Devido a normalização dada por (6.33), o primeiro termo da expressão anterior, V (r0 ), a
expressão usual para a energia potencial de um elétron na posição r0 . Considerando que a
distribuição f (r) é invariante por rotação, ou seja, f (r) = f (r), em que r = |r|, então o termo
devido a primeira correção é nulo. Para estimar o segundo termo, será considerado que a função
de distribuição f (r) do alargamento é gaussiana, ou seja, que
1 2 /λ2
f (r) = e−r c ,
π 3/2 λ3c
para a qual o comprimento do alargamento é o comprimento de onda de Compton. Fazendo a
integral para o segundo termo, encontra-se que
ˆ ˆ
1 2 /λ2 1
d3 r (ri − r0i )(rj − r0j )f (r − r0 ) = d3 r ri rj e−r c = λ2c δi,j .
π 3/2 λ3c 2
Usando esse resultado, obtém-se que a correção na energia é dada por
1
∆E = hV (r + r0 ) − V (r0 )i = λ2c ∇2 V (r).
6
A expressão acima é idêntica ao termo de Darwin, a menos do fator 1/6 cujo fator valor
correto é 1/8, assim
1 1 ~2
WD = λ2c ∇V (r) = ∇2 V (r). (6.35)
8 8 m2e c2

Ordem de Magnitude
O termo de Darwin é dado pela equação (6.35), porém como no casos dos átomos tipo
hidrogenoides, a energia potencial eletrostático é dada por
q2 e2
V (R) = − =− ,
4π0 R R
e para esse caso tem-se que
 
2 1 2 2
∇ V (R) = −e ∇ = 4πe2 δ(R),
R

Prof. Salviano A. Leão 126


6.5. A interação hiperfina

e disso segue imediatamente que


π~2 e2
WD = δ(R). (6.36)
2m2e c2
Portanto, no estado atômico ψ(r) = hr | ψi, o valor esperado desse termo é dado por

π~2 e2
hWD i = |ψ(0)|2 ,
2m2e c2
note ainda que,
~2 e2 ~2 1 e2 1
2 2
= 2
· 2
· · 2a30 = α2 Ry · 2a30
2me c 2me a0 me c 2a0 2
logo
hWD i = πα2 Ry · a30 |ψ(0)|2

e como para estados do tipo s tem-se que |ψs (0)|2 ' a30 , que é o valor da função de onda na
origem. Logo esse termo irá fornecer uma contribuição não nula somente para o estados atômicos
do tipo s, pois somente para esses estados temos |ψs (0)|2 6= 0. Portanto, para os estados do tipo
s, tem-se que
hWD is ' πα2 Ry

ou seja,
hWD is
' πα2
Ry

6.4.4 Hamiltoniano da estrutura fina


Portanto, agora é possível escrever o Hamiltoniano completo que fornece a correção em
energia chamada de estrutura fina, ou seja,

Wef = Wmv + Wso + WD ,

pois todos os seus termos fornecem uma correção para a energia da mesma ordem.

6.5 A interação hiperfina


Basicamente, a interação hiperfina é aquela que ocorre entre e os momenta nucleares e os
campos eletromagnéticos atômicos de origem externa ao núcleo, ou seja, é a interação entre o
spin nuclear e os campos eletromagnéticos das partículas carregadas ao seu redor.
O núcleo de um átomo contém cargas localizadas e distribuições de corrente, que produzem
campos elétricos e magnéticos que podem ser decompostos em campos multipolares, como na
eletrostática clássica ou na magnetostática. O primeiro dos momentos multipolares, o monopolo
elétrico, é o campo eletrostático de Coulomb que mantém os elétrons em suas órbitas e produz a
estrutura grosseira do átomo. Os momentos multipolares de ordem superior produzem pequenas
correções na estrutura atômica que são geralmente conhecidas como efeitos hiperfinos.
A terminologia “hiperfina” refere-se à escala de energia desses efeitos, que é menor que aquela
da estrutura fina. Entretanto, a física dos efeitos hiperfinos é completamente diferente daquela

Prof. Salviano A. Leão 127


6.5. A interação hiperfina

da estrutura fina. Na prática, os efeitos hiperfinos mais importantes são aqueles devidos aos
campos de dipolo magnético e quadrupolo elétrico do núcleo. Momentos multipolares mais
elevados do núcleo são importantes na física nuclear, mas não costumam ser na física atômica.
Aqui trataremos os efeitos hiperfinos em átomos, concentrando-nos principalmente no campo
de dipolo magnético no caso do átomo de hidrogênio. Como veremos, efeitos hiperfinos ligam a
dinâmica do elétron atômico à do núcleo, ampliando assim o espaço de Hilbert, introduzindo
novos números quânticos e deslocando e abrindo a degenerescência dos níveis de energia.
Apesar das pequenas escalas de energia envolvidas, os efeitos hiperfinos são muito importantes
em aplicações que vão da física atômica à astrofísica. Por exemplo, a transição radiativa entre
os dois níveis hiperfinos do estado fundamental do átomo de hidrogênio produz a linha de 21
centímetros que desempenha um papel importante na radioastronomia.
Por outro exemplo, os relógios atômicos utilizam frequentemente como oscilador básico uma
transição hiperfina no estado fundamental dos átomos alcalinos pesados, rubídio ou césio. A
reprodutibilidade da frequência dessas transições é tão grande que a segunda é agora definida em
133
termos da transição hiperfina no átomo Cs, ou seja, a segunda é definida como 9.192.631.770
períodos do fóton emitido neste transição, exatamente. Relógios atômicos atuais baseados em
transições hiperfinas de césio têm atualmente uma precisão da ordem de uma parte em 1015 .
Mais recentemente, foram inventados “relógios ópticos” que usam transições na faixa ótica de
frequências. Algumas delas têm precisão aproximando-se de uma parte em 1018 .
O GPS (sistema de posicionamento global) se baseia em sinais temporais de rádio emitidos
por satélites, contendo relógios atômicos, em elevadas órbita terrestre. A fim de alcançar a
precisão desejada das medições de posição na Terra, é necessário levar em conta os efeitos da
relatividade geral e especial na análise dos sinais de tempo. A relatividade especial entra por
causa da dilatação do tempo dos relógios movendo-se em suas órbitas e da relatividade geral
devido à diferença no potencial gravitacional entre o relógio em órbita e o receptor na superfície
da Terra (este é o desvio gravitacional para o vermelho).
A seguir será determinada uma expressão para essa interação.

6.5.1 O spin do próton e seu momento magnético


Aqui o próton será considerado como sendo uma partícula pontual de massa mp e carga
qp = −q, e o seu spin, assim como o elétron, é |I| = 1/2. Portanto, para o próton tem-se que

mp = 1836me ; qp = −q e |I| = |s| = 1/2. (6.37)

Ao spin I do próton, associa-se um momento magnético MI dado por

I
MI = gp µn , (6.38)
~
na qual, µn é o magnéton nuclear de Bohr, dado por

qp ~
µn = , (6.39)
2mp

Prof. Salviano A. Leão 128


6.5. A interação hiperfina

MS
E(r)
MI qe

Zqp

Figura 6.3: Representação esquemática dos momentos magnéticos nuclear e eletrônico.

e gp é a razão giromagnética do próton, dada por

gp = 5, 585. (6.40)

Note ainda que


µn qp ~ 2me me 1
= · = = . (6.41)
µB 2mp q~ mp 1836
Portanto, embora as expressões para os momenta angulares do próton e do elétron sejam
idênticas, o magnetismo nuclear, devido as diferença entre as massas do elétron e do próton, é
muito menor do que o eletrônico. Portanto, as interações magnéticas devido ao spin do próton
são muito fracas.

6.5.2 O hamiltoniano magnético hiperfino


Como o próton possui spin e momento magnético, então em seu movimento em torno do
núcleo, o elétron percebe um campo eletrostático e um campo magnético criado pelo próton,
os quais são descrito pelo potencial escalar VI (r) e pelo potencial vetor AI (r), portanto, o
hamiltoniano do elétron no campo do próton é
[P − qAI (R)]2
H= + UI (R) − MS · BI , (6.42)
2me
no qual o momento magnético eletrônico é
 
S
MS = 2µB
~
e o campo magnético BI é dado por

BI (R) = ∇ × AI (R). (6.43)

O potencial eletrostático VI (R), para o qual o hamiltoniano do átomo de hidrogênio é dado


por
P2 P2
H0 = + qVI (R) = + UI (R), (6.44)
2me 2me
resulta da superposição linear de várias contribuições, sendo que cada uma delas está associada
a um dos momento de dipolo do núcleo.
Para um núcleo arbitrário deve-se considerar:

Prof. Salviano A. Leão 129


6.5. A interação hiperfina

1. A energia potencial de um núcleo de carga total Zq (momento de dipolo de ordem zero) é

Zq 2
U0 (r) = qV0 (r) = − . (6.45)
4π0 r

2. O termo de quadrupolo elétrico do núcleo [7, ver complemento EX , pág. 1058] (de
segunda ordem) adiciona um termo ao potencial V0 (r), o qual produz um dos termos
do hamiltoniano hiperfino, o qual é chamado de termo de quadrupolo elétrico. No caso
do átomo de hidrogênio, ele é zero, já que o próton, cujo spin I é |I| = 1/2, não possui
momento de quadrupolo elétrico.

3. Os momentos de multipolos elétricos [7, ver complemento EX , pág. 1058], de ordem


k = 2, 4, 6, . . ., os quais teoricamente são tantos quanto k ≤ 2|I|, para o próton, todos eles
são zero.

Portanto para o átomo de hidrogênio o potencial V0 (r), é realmente o potencial percebido pelo
elétron.
Agora serão considerados os termos que surge do potencial vetor AI (R). Pelas mesmas
razões anteriores não se pode ter multipolos magnéticos de ordem superior a primeira. Assim o
potencial vetor, para o momento de dipolo magnético MI do próton é dado por [31, seção 8.6,
pág. 177]
µ0 M I × R
AI (R) = · (6.46)
4π R3
Portanto, ao substituir (6.46) em (6.42) e mantendo somente os termos lineares em AI (R),
obtém-se que o hamiltoniano do átomo de hidrogênio com as correções hiperfinas

H = H0 + Whf , (6.47)

no qual H0 é dado por (6.44) e o hamiltoniano hiperfino é dado então por


 
q S
Whf =− [P · AI (R) + AI (R) · P] − 2µB · ∇ × AI (R) (6.48)
2me ~

6.5.3 Forma detalhada do hamiltoniano hiperfino


Inicialmente será descrito o acoplamento com o momento magnético do próton.

6.5.4 Acoplamento do momento magnético do próton com momentum


angular orbital do elétron
Vamos iniciar, pelo primeiro termo de (6.48), Whf , para o qual temos que
 
µ0 MI × R MI × R
P · AI (R) + AI (R) · P = P· + ·P . (6.49)
4π R3 R3

Prof. Salviano A. Leão 130


6.5. A interação hiperfina

Como as componentes de MI comutam com os operadores R e P, ou seja, [R, MI ] = [P, MI ] = 0,


tem-se então que

P · (MI × R) = Pm êm · êi (MI )j Rk ijk


= Pi (MI )j Rk ijk
= (MI )j Pi Rk ijk
= (MI )j Pi Rk (−jik )
= (MI )j Rk Pi (+jki )
= (MI )m êm · êj Rk Pi jki
= MI · (R × P)
= MI · L

temos ainda que

(MI × R) · P = ijk (MI )j Rk êi · êm Pm


= ijk Pi (MI )j Rk
= (−jik ) (MI )j Pi Rk
= jki (MI )j Rk Pi
= (MI )m êm · êj jki Rk Pi
= MI · (R × P)
= MI · L

Portanto, em síntese viu-se que: P · (MI × R) = (MI × R) · P = MI · L.


A seguir será mostrado que [L, F (R)] = 0, e para isso, deve-se lembrar que

Rl 0
[Pl , F (R)] = −i~ F (R),
R
e com isso temos

[L, F (R)] = ijk êi [Rj Pk , F (R)]


= ijk êi Rj [Pk , F (R)]
i~
= − F 0 (R)ijk êi Rj Rk
R
= 0. (6.50)

Note ainda que o resultado anterior ainda pode ser escrito como

1
[L, F (rR)] = −i~ F 0 (R)R × R = 0.
R
Disso segue imediatamente que
[L, R−n ] = 0,

Prof. Salviano A. Leão 131


6.5. A interação hiperfina

L
v

MI
qe

Zqp

BL
Figura 6.4: Momentum angular orbital e o campo magnético no núcleo devido a rotação do elétron
em torno do núcleo.

e portanto,
1 1 1 MI · L
(MI × R) · P = MI · L = P · (MI × R) =
R³ R³ R³ R³
Portanto, o termo da correção hiperfina, devido a interação com o momentum angular orbital
do elétron é
L µ0 q MI · L µ0 MI · (L/~)
Whf =− 2 = − 2µB (6.51)
4π 2me R³ 4π R³
Esse termo corresponde ao acoplamento entre o momentum magnético nuclear MI e o campo
magnéticoBL criado pela corrente associada ao movimento de rotação do elétron em torno do
núcleo é dado por
µ0 qL
BL (r) = , (6.52)
4π me r3
e portanto, a correção hiperfina pode ser reescrita como

L
Whf = −MI · BL (R). (6.53)

conforme ilustra a figura.


L
Note, que o campo magnéticoBL que surge em Whf decai com 1/R3 , o que ainda assim não
introduz uma singularidade na origem, para ver isso, pois considere por exemplo, o seguinte


elemento de matriz ϕk,l,m W L ϕk0 ,l0 ,m0 para o átomo de hidrogênio. Na representação R
hf
tem-se que
hR | ϕk,l,m i = Rk,l (r)Ylm (θ, ϕ),

para a qual na origem, tem-se que

lim Rk,l (r) w crl .


r→0

Prof. Salviano A. Leão 132


6.5. A interação hiperfina

Na integração o elemento de volume d3 r = r2 dr sen θ dθ dϕ, logo o comportamento do elemento


de matriz na origem será da ordem de

0 0
rl+l +2−3 = rl+l −1 .

Além disso, presença do operador hermitiano L significa que o elemento de matriz é zero quando
l ou l0 for zero. Temos então que esse termo permanecerá finito na origem quando

0
l + l0 ≥ 2 e rl+l −1 6= ∞ .

Entretanto, de forma geral para esse elemento de matriz, como o operador o L pode ser
escrito como
1 1
L = (L+ + L− )êx + (L+ − L− )êy + Lz êz ,
2 2i
tem-se então que
hϕk,l,m | Lx | ϕk0 ,l0 ,m0 i ∝ δk,k0 δl,l0 (δm,m0 +1 + δm,m0 −1 )

hϕk,l,m | Ly | ϕk0 ,l0 ,m0 i ∝ δk,k0 δl,l0 (δm,m0 +1 − δm,m0 −1 )

hϕk,l,m | Lz | ϕk0 ,l0 ,m0 i ∝ m0 ~δk,k0 δl,l0 δm,m0 .

6.5.5 Acoplamento com o spin do elétron


Mostrou-se na seção anterior a relevância das singularidades na origem devido ao potencial
vetor dado por (6.46). Note que o último termo de (6.48), contém essa singularidade na origem,
e para evitar problemas com essa singularidade, o próton será considerado como sendo uma
partícula de raio finito, e somente na expressão final será tomado o limite no qual o raio do
próton vai a zero. Além disso, do ponto de vista físico , sabe-se que o próton possui uma certa
extensão espacial e seu magnetismo se estende sobre um certo volume do espaço. Porém, as
dimensões do próton são muito menores do que o raio de Bohr a0 . Isso, justifica o fato de que
no final do tratamento que será dado ao próton, ele possa ser novamente considerado com uma
partícula pontual.

6.5.6 Campo magnético associado ao próton


Considere o próton com sendo uma pequena esfera de raio ρ0 e que possui um campo
magnético interno uniforme dado por

Bi = Bi êz ,

e consequentemente um momento magnético MI . Portanto, a distribuição de magnetismo no


interior do próton cria em pontos a uma distância r do seu centro um campo magnético B.
Nessas condições as componentes de B são dadas pelo eletromagnetismo clássico (para maiores

Prof. Salviano A. Leão 133


6.5. A interação hiperfina

z
MI Bi

x
Figura 6.5: Estrutura interna de um próton

detalhes sobre o campo de um dipolo magnético consulte por exemplo o livro do Greiner [11, págs.
209-211], o do Griffiths [15, Exemplo 5.13] ou o do Jackson [20, Seção 5.6]) para r  ρ0 por

µ0 xz
Bxdip = 3MI 5
4π r
µ0 yz
Bydip = 3MI 5 (6.54)
4π r
µ0 3z 2 − r2
Bzdip = MI
4π r5

Essa expressão é válida mesmo para valores de r somente um pouco maiores do que ρ0 . Como
o próton possui spin 1/2, ele não possui momentos de multipolos elétricos de ordens maiores
do que 1. Portanto, o campo magnético fora é o de um dipolo magnético. Dentro do próton o
campo magnético é uniforme e é paralelo ao momento magnético MI .

Tem-se que
˛ ˆ ˆ
B · dS = B · dS + lim B · dS = 0,
xy R→∞ ∩

e como
ˆ
1
lim B · dS = 0, pois lim B(R) → .
R→∞ ∩ R→∞ R3

ˆ ˆ ˆ
B · dS = Bint · dS + Bext · dS = 0.
xy • }

Prof. Salviano A. Leão 134


6.5. A interação hiperfina

Entretanto, tem se que


ˆ ˆ ∞
Bext · dS = 2π rdrBz (z = 0)
} ρ0
ˆ ∞  2
3z − r2

µ0
= 2π MI rdr
4π r5
ˆ ∞
ρ0 z=0
µ0 MI
=− r−2 dr
2 ρ0
µ0 2π
= − MI ·
4π ρ0

Portanto, tem-se que


µ0 2π
Φxy
ext (ρ0 ) = − MI · .
4π ρ0
Já para o campo interno, como ele é uniforme, segue imediatamente que
ˆ
xy
Φint (ρ0 ) = Bint · dS = πρ20 · Bint .

Entretanto, como
Φxy xy
int (ρ0 ) + Φext (ρ0 ) = 0,

tem-se
µ0 2π µ0 2
πρ20 · Bint − MI · =0 =⇒ Bint = MI · 3 .
4π ρ0 4π ρ0
Portanto, tem-se agora o campo magnético
z gerado pelo próton em todos os pontos do
espaço, o qual pode ser escrito como

BI (r) = Bint + Bdip


ext (r),

R
ou ainda,

Bint (r) = µ0 MI · 23 êz para r ≤ ρ0
y BI (r) =
I 4π ρ0
Bext (r) = Bdip (r) para r > ρ0
I ext
x (6.55)
dip
Figura 6.6: Próton de raio ρ0 no interior de um no qual, o termo Bext (r), é dado pela expressão
hemisfério esférico de raio R, com R  ρ0 . (6.54).
Agora pode-se escrever o termo do hamil-
toniano hiperfino que estava faltando, como
 
L S
Whf = Whf − 2µB · BI (R), (6.56)
~

o qual, devido ao campo magnético interno do próton pode ser reescrito como

L dip c
Whf = Whf + Whf + Whf , (6.57)

Prof. Salviano A. Leão 135


6.5. A interação hiperfina

para o qual temos que


 
dip S
Whf = −2µB · Bdip
ext (r) Termo de dipolo (6.58)
~
 
c S
Whf = −2µB · Bint
I (r) Termo de contato (6.59)
~
esses dois termos são conhecidos respectivamente, devido a sua origem, por termo de dipolo e
de contato.

6.5.7 Termo de dipolo magnético


A forma explicita do termo de dipolo magnético é obtida ao substituirmos (6.54) em (6.58)
o que resulta em
dip 2µB
Sx Bxdip + Sy Bydip + Sz Bzdip ,

Whf =−
~
a qual toma a seguinte forma
 
dip µ0 2µB xSx + ySy + zSz Sz
Whf =− · · 3zx − MI ,
4π ~ R5 R³
como MI = MI êz , então
 
dip µ0 2µB 1 (S · R) (R · MI )
Whf = · · S · MI − 3 . (6.60)
4π ~ R3 R2
Essa é a expressão final para o hamiltoniano da interação dipolo-dipolo entre os dois momentos
magnéticos MI e MS dados por
   
S I
MS = 2µB e MI = gp µn . (6.61)
~ ~
De fato, a expressão (6.54) para o campo magnético criado pelo próton só é valida no limite em
que |r|  ρ0 e a expressão (6.60) para a interação de dipolo, deveria ser aplicada somente na
parte da função de onda que satisfaz essa condição. Entretanto, quando ρ0 → 0, a expressão
(6.60) não apresenta singularidade na origem, portanto a mesma é válida em todo o espaço.

6.5.8 Termo de contato de Fermi


Ao substituir o campo interno da expressão (6.55) na (6.59), obtém-se a contribuição do
campo interno do próton para o hamiltoniano da interação hiperfina Whf . Essa operação tem
c
como resultado o operador Whf , o qual é chamado de termo de contato de Fermi, e cujos
elementos de matriz na base {|ϕk,l,m, i} são
˚
ϕk0 ,l0 ,m0 ,0 = − µ0 · 2µB MI · h | Sz | 0 i 2 d3 rϕ∗k,l,m (r = 0)ϕk0 ,l0 ,m0 (r = 0).

c
ϕk,l,m, Whf
4π ~ ρ30 r≤ρ0

Quando ρ0 → 0, o volume de integração é 4πρ30 /3, o qual também se aproxima de zero, logo

ϕk0 ,l0 ,m0 ,0 = − µ0 · 2µB MI · h | Sz | 0 i 8π · ϕ∗k,l,m (r = 0)ϕk0 ,l0 ,m0 (r = 0). (6.62)

c
ϕk,l,m, Whf
4π ~ 3
Prof. Salviano A. Leão 136
6.6. O hamiltoniano completo da estrutura hiperfina

Portanto, o termo de contato pode ser escrito em uma forma mais compacta como,

c µ0 2µB 8π
Whf =− · · · MI · Ms δ(R) (6.63)
4π ~ 3

Note que embora o volume contendo o campo magnético interno vai a zero quando ρ0 → 0, o
c
valor de Whf permanece finito, j que o campo interno se aproxima do infinito com 1/ρ30 .
Deve-se ressaltar que em (6.63) que o operador δ(R) é simplesmente o projetor

δ(R) = |r = 0ihr = 0|.

Observe ainda, que o elemento de matriz dado por (6.62), só será diferente de zero se l = l0 = 0.
Esta é a condição necessária para que ϕ∗k,l,m (r = 0) e ϕk0 ,l0 ,m0 (r = 0) sejam diferentes de zero na
origem. Portanto, o termo de contato de Fermi só dará contribuições não nulas para os estados
do tipo s.

6.6 O hamiltoniano completo da estrutura hiperfina


O operador que fornece o hamiltoniano da interação hiperfina, é obtido somando-se os
L dip c
operadores Whf , Whf e Whf , assim

L dip c
Whf = Whf + Whf + Whf . (6.64)

Usando o fato de que o momento magnético do próton é dado por (6.61), então podemos escrever
a equação (6.64) como

 
µ0 2µB µn gp I · L (S · R) (I · R) I · S 8π
Whf =− · +3 − 3 + · I · Sδ(R) , (6.65)
4π ~2 R³ R5 R 3
na qual
   
q~ q~ I S R
µB = ; µn = − ; MI = gp µn ; MS = 2µB ; n̂ = r̂ = . (6.66)
2me 2Mp ~ ~ R

o que leva a expressão (6.65), a tomar a seguinte forma


 
µ0 q (L · MI ) 3(MS · n̂)(MI · n̂) − MS · MI 8π
Whf = − · + + · MI · Ms δ(R) . (6.67)
4π me R 3 R3 3

6.6.1 Interpretação dos vários termos de Whf


1. O primeiro termo de Whf representa a interação do momento magnético nuclear MI com
o campo magnético
µ0 qL
BLI (r) = , (6.68)
4π me r3
criado na região onde encontra-se o próton, pela rotação da carga eletrônica em torno do
núcleo.

Prof. Salviano A. Leão 137


6.6. O hamiltoniano completo da estrutura hiperfina

2. O segundo termo de (6.67), representa a interação dipolo-dipolo entre os momentos


magnéticos nuclear e eletrônico: a interação do momento magnético do spin do elétron
com o campo magnético criado por MI , ou vice-versa.

3. O último termo de (6.67) é o chamado termo de contato de Fermi, e surge devido a


singularidade, em r = 0, do campo criado pelo momento magnético do próton. De fato, o
próton não é uma partícula pontual. O termo de contato descreve a interação do momento
magnético do spin do elétron com o campo magnético existente no interior do próton. A
função “delta” expressa o fato de que o termo de contato existe, e como o seu nome indica,
somente quando há uma superposição das funções de onda do elétron e do próton.

6.6.2 Ordem de magnitude de Whf


A expressão (6.65) pode ser reescrita da seguinte forma

(2I · n̂) (S · n̂) (2I) · S 8π R3


 
µ0 µB µn gp (2I) · L
Whf =− · +3 − + · (2I · S) δ(R) ,
4π R³ ~2 ~2 ~2 3 ~2

Considerando que gp /4 ≈ 1, pode-se mostrar que a ordem de magnitude dos dois primeiros
termos é dada por
q 2 ~2 1 µ0 1 q 2 µ0 0 ~2
· · = · · · ,
me Mp R3 4π Mp 4π0 me a30

mas como Mp = 1836me e e2 = q 2 /4π0 , segue

q 2 ~2 1 µ0 1 e2 2 ~2
· 3· = · · · ·2
me Mp R 4π 1836 2a0 me c2 2me a20
1 2
= · Ry · · Ry · 2
1836 me c2
2 · Ry 2Ry
= · ,
1836 me c2

mas como
e2 ~2 1 2Ry
Ry = = 2
= m e c2 α 2 =⇒ α2 = ,
2a0 2me a0 2 m e c2
portanto, tem-se que
Whf 2α2
≈ .
Ry 1836

Mas como
e2 ~2 Whf 1
Wso ≈ · =⇒ ≈ .
m2e c2 R3 Wso 1836

Portanto, vê-se que os termos de Whf são da ordem de 2000 vezes menores do que os termos de
Wso .

Prof. Salviano A. Leão 138


6.7. A estrutura fina do nível n = 2

6.7 A estrutura fina do nível n = 2


6.7.1 Formulação do problema
6.7.1.1 Degenerescência do nível n = 2

Como a energia do átomo de hidrogênio, depende somente do número quântico n, através da


relação
Ry 1 1
En = − 2
= − µc2 2 .
n 2 n
Segue que para o nível n = 2, tem-se

Nível n l ml ms Número de estados gn


2s 2 0 0 ±1/2 1 2
2p 2 1 -1,0,1 ±1/2 3 6

Ao considerar o spin do próton, a degenerescência dos estados mudam e tabela anterior toma
a forma,

Nível n l ml ms mI Número de estados gn


2s 2 0 0 ±1/2 ±1/2 1 4
2p 2 1 -1,0,1 ±1/2 ±1/2 3 12

e portanto, uma possível base ortonormal para tratar problemas referentes ao nível n = 2 é:

1. Subcamada 2s:
 
n = 2; l = 0; ml = 0; ms = ± 1 ; mI = ± 1

=⇒ Dimensão: 4
2 2

2. Subcamada 2p :
 
n = 2; l = 1; ml = −1, 0, 1; ms = ± 1 ; mI = ± 1

=⇒ Dimensão: 12
2 2

Portanto, o nível n = 2, possui uma degenerescência total de 16.


Logo, para calcular o efeito de uma perturbação W , sobre o nível n = 2, será necessário
diagonalizar uma matriz de 16 × 16. Para o caso específico do nível 2s, deverá se levada em
conta as restrições imposta ao nível, na matriz perturbativa W. Os autovalores dessa matriz
fornecem as correções em primeira ordem da energia e os correspondentes autoestados, são os
autoestados do hamiltoniano de ordem zero.

6.7.2 O hamiltoniano perturbativo


No tratamento dado a seguir, será considerado que não há nenhum campo externo atuando
sobre o átomo em questão. A diferença W , entre o hamiltoniano exato H e o hamiltoniano H0 ,
contém os termos da estrutura fina

Wf = Wmv + Wso + WD ,

Prof. Salviano A. Leão 139


6.8. Representação matricial da estrutura fina Wf no nível n = 2

e os termos da estrutura hiperfina

L dip c
Whf = Whf + Whf + Whf ,

assim
W = Wf + Whf .

Porém como os termos que compõem Wf são da ordem de 2000 vezes maiores do que aqueles
que compõem Whf , então inicialmente serão descritos os efeitos das interações finas dadas por
Wf .

6.8 Representação matricial da estrutura fina Wf no nível


n=2
As propriedades do hamiltoniano Wf , vistas até o momento, permite que se mostre que a
matriz Wf , a qual representa o hamiltoniano Wf no nível n = 2, possui dimensão 16×16, e que a
mesma pode ser separada em uma série de blocos de submatrizes quadradas de dimensões menores.
Como a matriz Wf é constituída por diversas submatrizes, isso simplifica consideravelmente a
tarefa de determinar seus autovalores e autovetores.

6.8.1 O Wf não atua nas variáveis de spin do próton


Como no hamiltoniano Wf não há nenhum termo o qual dependa do spin I do próton, segue
imediatamente que o spin do próton pode ser ignorado, ao se investigar os efeitos da estrutura
fina, porém deve-se lembrar de multiplicar por 2, todos os graus de degenerescência obtidos.
Portanto, a dimensão da matriz a ser diagonalizada vai de 16 × 16 para 8 × 8.

6.8.2 O Wf não conecta as subcamadas 2s com as 2p


Inicialmente será necessário mostrar que L2 comuta com Wf , ou seja, que [L2 , Wf ] = 0.
Entretanto, note que para tal é necessário mostrar que:

1. o operador L2 comuta com as componentes de L, ou seja, que

[L2 , Lx ] = [L2 , Ly ] = [L2 , Lz ] = 0,

o qual já é bem conhecido e foi mostrado anteriormente.

2. o operador L2 comuta com o operador posição R, o que é imediado pois o operador L2


atua somente sobre as variáveis angulares, e além disso, foi mostrado que

[L, f (R)] = 0 =⇒ [L2 , R] = 0.

Prof. Salviano A. Leão 140


6.8. Representação matricial da estrutura fina Wf no nível n = 2

3. que o operador L2 comuta com os operadores de spin

[L2 , S] = [L2 , I] = 0,

o que é óbvio da definição dos spins.

4. que o operador L2 comuta com o operador P2 , ou seja

[L2 , P2 ] = 0.

Para tal note que

[L2 , P2 ] = [L2i , P2 ] =
= Li [Li , P2 ] + [Li , P2 ]Li

portanto, para tal, basta mostrar que [Li , P2 ] = 0. Assim, como L = R × P, então
Lα = Rβ Pγ εαβγ = Rβ Pγ − Rγ Pβ , logo

[Lα , P2 ] = [Rβ Pγ − Rγ Pβ , Pα Pα ] = [Rβ , Pβ Pβ ]Pγ − [Rγ , Pγ Pγ ]Pβ


= 2[Rβ , Pβ ]Pβ Pγ − 2[Rγ , Pγ ]Pγ Pβ = 0.

Portanto agora viu-se que [L2 , Wf ] = 0, e como

Wf = Wmv + Wso + WD

e
P4 1 1 dV (R) ~2
Wmv = − ; c= · L · S; WD (R) = ∇2 V (R),
8m3e c² 2
2me c² R dR 8m2e c2 r
então pode-se concluir que

[L2 , Wmv ] = [L2 , Wso ] = [L2 , WD ] = 0.

Os estados 2s e 2p são autoestados de L2 com diferentes autovalores (0 e 2~2 ). Portanto, o


hamiltonianoWf o qual comuta com L2 , não possui elementos de matriz que conecta o estados
2s com estados 2p. Dessa forma, a matriz 8 × 8 que representa o hamiltoniano Wf no nível
n = 2 pode ser dividida em uma submatriz 2 × 2 relativa aos elementos de matriz dos estados 2s
e em uma submatriz 6 × 6 relativa aos elementos de matriz dos estados 2p. Portanto, a matriz
Wf toma a seguinte forma
 




2×2 0 



2s
 
 
 
(Wf )n=2 = (6.69)
 

 
 




0 6×6




 
2p

Prof. Salviano A. Leão 141


6.8. Representação matricial da estrutura fina Wf no nível n = 2

As propriedades precedentes podem ser consideradas como sendo consequências do fato de


que o hamiltoniano Wf é par. Sobre uma reflexão, R vai em −R, trocar P em −P, L em L e S
em S. Logo, é fácil ver que Wf permanece invariante. Entretanto, Wf não tem elementos de
matriz entre os estados 2s e 2p, os quais possuem paridade opostas.

6.8.3 Representação matricial de Wf na subcamada 2s


A dimensão 2 do subespaço 2s é resultante dos dois possíveis valores de ms = ±1/2 de Sz ,
ao ignorar o próton.
Como Wmv e WD não dependem de S, as matrizes que representam esses dois operadores no
subespaço 2s, são portanto múltiplas da matiz unidade (ou seja, são diagonais), com coeficientes
de proporcionalidades iguais, respectivamente, aos elementos de matriz puramente orbital:
P4
 

n = 2; l = 0; ml = 0 − 3 2 n = 2; l = 0; ml = 0

8me c
e
~2
 

n = 2; l = 0; ml = 0 − 2 2 ∇V (R) n = 2; l = 0; ml = 0 .

8m c e
Como conhecemos as autofunções de H0 , o cálculo desses elementos de matriz, não represen-
tam uma dificuldade, logo os seus resultados são
13 13 2
hWmv i2s = − me c2 α4 hWmv i2s = − α Ry
128 64
1 1
hWD i2s = me c2 α4 hWD i2s = α2 Ry
16 8
Finalmente, o cálculo do elemento de matriz de Wso envolve elementos de matrizes “angulares”
da forma
hl = 0; ml = 0 | Lx,y,z | l = 0; ml = 0i ,
os quais são zero porque o valor l = 0 do número quântico l, anula todos. Portanto,

hWso i2s = 0.

Portanto,
5 5
hWf i2s = hWmv i2s + hWD i2s + hWso i2s = − me c2 α4 = − α2 Ry
128 64

6.8.4 Representação matricial de Wf na subcamada 2p


6.8.4.1 Termos Wmv e WD

Devido aos mesmos argumentos da seção anterior, tem-se que


7 7 2
hWmv i2p = − me c2 α4 = − α Ry e hWD i2p = 0.
384 192
Note que hWD i2p = 0, reflete o fato de que WD é proporcional a função δ(R) e pode ter um
valor não nulo somente na origem, ou seja, para estado tipo s, entretanto, para aqueles com
l ≥ 1, a função de onda é zero na origem.

Prof. Salviano A. Leão 142


6.8. Representação matricial da estrutura fina Wf no nível n = 2

6.8.4.2 Termo Wso

Para obter esse, deve-se calcular diversos elementos de matriz da seguinte forma
D E
0 0
n = 2; l = 1; s = 1/2; ml ; ms ξ(R)L · S n = 2; l = 1; s = 1/2; ml ; ms ,

com
e2 1
ξ(R) = 2 2
· 3
2me c R
Na representação {|ri} pode-se separar a parte radial do elemento de matriz, da parte angular
e de spin, o que resulta em
D E
0 0
ξ2p n = 2; l = 1; s = 1/2; ml ; ms L · S n = 2; l = 1; s = 1/2; ml ; ms ,

na qual ξ2p é um número, dado pela integral radial


ˆ ∞
e2 1
ξ2p = |R21 (r)|2 r2 dr.
2m2e c2 0 r 3

Como a função radial R21 (r) é conhecida, então após o cálculo da integral obtemos
   
1 1 2 4 1 1 2
ξ2p = 2 me c α = 2 α Ry .
~ 48 ~ 24

Com isso, eliminou-se a dependência das variáveis radiais, sobrando uma dependência das
variáveis angulares e de spin. Portanto, o problema reduz-se a diagonalizar o operador L · S.
Para representar o operador ξ2p L · S por uma matriz, várias bases diferentes podem ser
escolhidas:

i) Primeira escolha, base: {|l = 1; s = 1/2; ml ; ms i}, construída a partir dos autoestados comuns
dos operadores L2 , S2 , Lz e Sz .

ii) Segunda escolha, base: {|l = 1; s = 1/2; J; mJ i}, construída a partir dos autoestados comuns
dos operadores L2 , S2 , J2 e Jz na qual

J=L+S

é o momentum angular total do sistema. Como l = 1 e s = 1/2, então Jmax = 1+1/2 = 3/2
e Jmin = 1 − 1/2 = 1/2.

Note que a segunda base é melhor adaptada ao problema do que a primeira, o que nos interessa,
já que o termo ξ2p L · S é diagonal na segunda base. Para evidenciar isso, observe que

1 2
J2 = (L + S)2 = L2 + S2 + 2L · S J − L2 − S2 ,

=⇒ L·S=
2
assim
1
ξ2p L · S = ξ2p J2 − L2 − S2 .

2
Prof. Salviano A. Leão 143
6.9. Resultados: A estrutura fina do nível n = 2.

Como cada vetor de estado da segunda base também é um autoestado de L2 , S2 e J2 , tem-se


que
~2
 
3
ξ2p L · S |l = 1; s = 1/2; J; mJ i = ξ2p J(J + 1) − 2 − |l = 1; s = 1/2; J; mJ i .
2 4
Como os autovalores do termo ξ2p L · S dependem somente de J e não de mJ , então para
~2 ~2
 
3 15 3 1 1
J = Jmax = ξ2p −2− = ξ2p = me c2 α4 = α2 Ry
2 2 4 4 2 96 48
2
 
1 ~ 3 3 1 1
J = Jmin = ξ2p −2− = −~2 ξ2p = − me c2 α4 = − α2 Ry
2 2 4 4 48 24
A degenerescência sêxtupla do nível 2p foi parcialmente removida pelo ermo Wso . Obteve-se
uma degenerescência quadrupla correspondente ao nível J = Jmax = 3/2 e uma degenerescência
dupla correspondente ao nível J = Jmin = 1/2. A degenerescência (2J + 1) associada a cada
estado J, é uma degenerescência essencial relacionada a invariância por rotação de Wf . Note
que
3 3 1 1 3
J= =⇒ mJ = − , − , ,
2 2 2 2 2
1 1 1
J= =⇒ mJ = − , .
2 2 2

Comentários

i) No subespaço 2s (l = 0, s = 1/2). J pode tomar somente um valor, o J = 0 + 1/2 = 1/2.

ii) No subespaço 2p (l = 1, s = 1/2). J pode tomar somente um valor, o J = 1 + 1/2 = 3/2.


Nesse subespaço Wmv e WD são representados por múltiplos da matriz identidade. Essa
propriedade permanece válida em qualquer base desde que a matriz unitária seja invariante
a uma mudança de base.

6.9 Resultados: A estrutura fina do nível n = 2.


6.9.1 Notação espectroscópica
Serão usados a seguir os números quânticos: n, l, s, J. O número quântico J deve-se ao fato
do termoWso depender dele.
Para o nível 2s tem-se J = 1/2 e para o nível 2p tem-se que J = 1/2 ou J = 3/2. O nível
associado com o conjunto de valores n, l, J é geralmente denotado pela adição do índice J ao
símbolo (n, l) representando a subcamada na notação espectroscópica: nlJ , com

l 0 1 2 3 4
Símbolo s p d f g

Portanto, para o nível n = 2 do átomo de hidrogênio tem-se o seguintes níveis:

2s1/2 ; 2p1/2 ; 2p3/2 .

Prof. Salviano A. Leão 144


6.9. Resultados: A estrutura fina do nível n = 2.

6.9.2 Posição dos níveis 2s1/2 ; 2p1/2 ; 2p3/2


A seguir os resultados anteriores serão reagrupados, para as energias dos níveis 2s1/2 , 2p1/2 e
2p3/2 , com relação a energia não perturbada do nível n = 2 do átomo de hidrogênio, a qual é
dada por
Ry µc2 α2 1
En = − = − =⇒ E 2 = − Ry.
n2 2n2 4
Conforme o resultado anterior, o nível 2s1/2 é diminuído pela seguinte quantidade
5 2 2 4 5
hWf i2s1/2 = hWmv i2s1/2 + hWD i2s1/2 + hWso i2s1/2 = − me c α = − α2 Ry
128 64
Temos que o nível 2p1/2 é diminuído de

hWf i2p1/2 = hWmv i2p1/2 + hWD i2p1/2 + hWso i2p1/2


 
7 2 1 2
=− α Ry + 0 + − α Ry
192 24
5 2
= − α Ry.
64
Portanto, mostrou-se que os níveis 2s1/2 e 2p1/2 possuem a mesma energia, de acordo com a
correção usada até o momento. Esta degenerescência deve ser considerada com acidental, oposta
a degenerescência essencial (2J + 1) de cada nível J.
Finalmente, para o nível 2p3/2 , a correção é

hWf i2p3/2 = hWmv i2p3/2 + hWD i2p3/2 + hWso i2p3/2


 
7 2 1 2
=− α Ry + 0 + α Ry
192 48
1
= − α2 Ry.
64

Comentários

i) Somente o acoplamento spin-órbita é o responsável pela separação entre os níveis 2p1/2 e


2p3/2 , já que os termos Wmv e WD deslocam o nível 2p com um todo.

ii) O átomo de hidrogênio agora pode ir do estado 2p para o 1s emitindo um fóton Lyman
∝ (λ = 1216 Å).
4 1
∆E2p3/2 −2s1/2 = E2p3/2 − E2s1/2 = me c2 α4 = α2 Ry
128 16

n=2
∆E0
2p3/2
5∆E0 5∆E0
1 2
∆E0 = 64 α Ry
2s1/2 2p1/2
Nota: o Lamb-shift remove a degenerescência dos níveis 2s1/2 e 2p1/2

Prof. Salviano A. Leão 145


6.10. A estrutura hiperfina do nível n = 1

iii) Viu-se que os dois níveis com o mesmo J possuem a mesma energia. Esse resultado não
é meramente verdade somente para as correções de primeira ordem do termo Wf : ele
permanece válido em todas as ordens de correção. A solução exata da equação de Dirac,
fornece para um nível de energia caracterizado pelos números quânticos n, l, s, e J o
seguinte valor
 r !−2 −1/2
1 1
En,j = me c2 1 + α2 n−J + + (J + )2 − α2 
2 2

Essa energia depende somente de J e não de l. Ao expandir a expressão acima para a


energia da equação de Dirac, em potências de α, obtém-se que
 
1 1 1 1 n 3
En,j = me c − me c2 α2 2 − me c2 4
2
1 − α4 + · · ·
2 n 2 n J+ 2
4

O primeiro termo é a energia de repouso do elétron. O segundo termo é a energia do


átomo de hidrogênio. O terceiro termo fornece as correções Wf em primeira ordem.

iv) As flutuações do vácuo (do campo eletromagnético do vácuo) removem a degenerescência


2s1/2 e 2p1/2 , e este efeito é conhecido por Lamb-shift.

6.10 A estrutura hiperfina do nível n = 1


A seguir serão estudados os efeitos da correção Whf na estrutura de níveis de energia 2s1/2 ,
2p1/2 e 2p3/2 , para determinarmos se a interação do próton com spin I causa o surgimento de
uma estrutura hiperfina em cada um dos níveis de energia. Entretanto, como Wf não remove
a degenerescência do estado fundamental 1s, iniciaremos investigando o efeito da correção
hiperfina sobre esse estado. os resultados obtidos para esse caso especial podem ser facilmente
generalizados para os níveis 2s1/2 , 2p1/2 e 2p3/2 .

6.10.1 Formulação do problema


6.10.1.1 A degenerescência do nível 1s

Para o nível 1s não há degenerescência orbital (l = 0). Entretanto, as componentes Sz e Iz


de S e I ainda podem tomar dois valores a saber: ±1/2, ou seja

1 1
ms = ± e mI = ± .
2 2

Portanto, a degenerescência do nível 1s é 4, e nesse caso, uma possível base é dada vetor de
estado  
1
n = 1; l = 0; ml = 0; ms = ± ; mI = ± 1
.
2 2

Prof. Salviano A. Leão 146


6.10. A estrutura hiperfina do nível n = 1

6.10.1.2 O nível 1s não possui estrutura fina

Mostrou-se que Wf não remove a degenerescência do nível 1s. Pois, os termos Wmv e WD
não atuam nos números quânticos mS e mI e são representados no subespaço 1s por múltiplos
da matriz identidade, dadas por
5
hWmv i1s = − α2 Ry e hWD i1s = α2 Ry.
4
Finalmente o cálculo do elemento de matriz do termo Wso envolve elementos de matriz
angulares do tipo
hl = 0; ml = 0 | Lx,y,z | l = 0; ml = 0i ,

o que é obviamente zero, pois l = 0, portanto

hWso i1s = 0.

Portanto, a correção fina de primeira ordem do nível 1s é

hWf i1s = hWmv i1s + hWD i1s + hWso i1s


5
= − α2 Ry + α2 Ry + 0
4
1
= − α2 Ry.
4
Essa correção não abre a degenerescência do nível 1s. Como l = 0 e s = 1/2, logo J = 1/2.
Portanto, como a correção fina Wf não levanta a degenerescência do nível 1s, a seguir será
investigado os efeitos da correção hiperfina sobre o nível 1s.

6.10.2 Representação matricial de Whf no nível 1s


O hamiltoniano da correção hiperfina é dado por
 
µ0 q (L · MI ) 3(MS · n̂)(MI · n̂) − MS · MI 8π
Whf = − · + + · MI · Ms δ(R) .
4π me R 3 R3 3
Note que os dois primeiros termos não contribuem para o nível 1s, por argumentos similares
aqueles da correção Wso para o qual hWso i1s = 0.

6.10.2.1 O termo de contato WD

Os elementos de matriz do último termo de Whf , isto é, o termo de contato de Fermi, são da
forma
 
0 0 2µ 0
n = 1; l = 0; ml = 0; /2; ms ; mI − · MI · Ms δ(R) n = 1; l = 0; ml = 0; ms ; mI .
3
Passando para a representação das coordenadas {|ri}, pode-se separar a parte orbital e de
spin desse elemento de matriz e reescrevê-lo na seguinte forma
D 0 0 E
A ms ; mI I · S ms ; mI ,

Prof. Salviano A. Leão 147


6.10. A estrutura hiperfina do nível n = 1

no qual A é um número dado por

q2 gp
A= · hn = 1; l = 0; ml = 0 | δ(R) | n = 1; l = 0; ml = 0i
30 c2 me Mp
q2 gp 1
= · · |R10 (0)|2 ,
30 c2 me Mp 4π
mas como
2 ~ λ
R10 (r) = q · e−r/a0 ; com a∗0 = = ,
3 αµc α
(a∗0 )

~ me Mp me a∗ e2 q2 1
a0 = ; µ= ; γ =1+ = 0; α= = ·
αme c me + Mp Mp a0 ~c 4π0 ~c
e2 ~2 1
Ry = = 2
= me c2 α2
2a0 2me a0 2
então, como a∗0 = γa0 , segue que

q2 gp 1 4
A= 2
· · · ∗ 3
30 c me Mp 4π (a0 )
4 q2 1 gp 1
= · · 2
· · 3 3
3 4π0 me c Mp γ a0
4 e2 1 2 gp 1
= · · 3· · ·
3 2a0 γ me c Mp a20 2

4 2 gp 1 1
= ·α · · ·
3 Mp a20 γ 3
4 2 gp m2e c2 α2 1
= ·α · · · 3
3 Mp ~2 γ
 −3
4 me 2 4 1 me
= · gp · · me c α · 2 · 1 +
3 Mp ~ Mp
2
 −3
4 me α me
= · gp · · 2Ry · 2 · 1 +
3 Mp ~ Mp

As variáveis orbital desaparecem devido a normalização, e portanto, sobra somente o problema


dos dois spin 1/2, S e I acoplados por por uma interação da forma

Whf c = AI · S,

na qual A é uma constante.

6.10.3 Autoestados e autovalores do termo de contato


Para representar o operador Whf c = AI·S, deve-se considerar somente a base {|s = 1/2; I = 1/2; ms ; mI i}
formada pelos autovetores comuns aos operadores S2 , I2 , Sz e Iz . Pode-se introduzir o momentum
angular total F, dado por

F = J + I = L + S + I = 0 + S + I = S + I,

Prof. Salviano A. Leão 148


6.10. A estrutura hiperfina do nível n = 1

e usar a base
{|s = 1/2; I = 1/2; F ; mF i} ,

formada pelos autovetores comuns aos operadores S2 , I2 , F2 e Fz . Desde que, s = I = 1/2, F


pode tomar apenas dois valores F = 0 e F = 1.
Note que a base {|F ; mF i} é mais adequada do que a {|ms ; mI i} para estudar o operador
Whf c = AI · S, pois na base {|F ; mF i} ele é representado por uma matriz diagonal,
1
Whf c = AI · S = A F2 − I2 − S2 .

2
Segue imediatamente que o estado |F ; mF i é autoestado do operador Whf c = AI · S:
1
AI · S |F ; mF i = A [F (F + 1) − I(I + 1) − S(S + 1)] ,
2
como os autovalores do operador Whf c = AI · S, dependem somente de F e não de mF , eles são
dados então por
 
1 3 3 3
Para F = 0 A 0− − =− A com (mF = 0)
2 4 4 4
 
1 3 3 1
Para F = 1 A 2− − =+ A com (mF = −1, 0, 1).
2 4 4 4
Portanto, a degenerescência quadrupla do nível 1s é parcialmente removida pela correção
hiperfina Whf c = AI · S. Obteve-se uma degenerescência tripla para F = 1 e um nível não
degenerado para F = 0. A degenerescência (2F + 1) de F = 1 é essencial e está relacionada a
invariância de Whf sobre uma rotação do sistema total.

6.10.4 Estrutura hiperfina do nível 1s


Sobre o efeito de Wf , a energia do nível 1s, é diminuída por uma quantidade me c2 α4 /8 =
(α2 /4)Ry com relação ao valor −µc2 α2 /2, ou seja,

E1s = E1 + hWf i1s + hWhf i1s



2 2
µc α 1 − 3 A~2 Para F = 0
2 4 4
E1s =− − me c α +
2 8 + 1 A~2 Para F = 1
4

O termo A~2 é muitas vezes chamado de a estrutura hiperfina do estado fundamental.

Comentários

Similarmente a correção Whf abre a degenerescência de cada umas das estruturas finas dos
níveis 2s1/2 , 2p1/2 e 2p3/2 em uma série de níveis hiperfinos, correspondendo a todos os valores
de F separados por uma unidade incluída entre Fmax = J + I e Fmin = |J − I|. Para os níveis
2s1/2 e 2p1/2 tem-se que J = 1/2, portanto F terá os somente dois valores, F = 1 e F = 0.
Entretanto para o nível 2p3/2 , J = 3/2 e consequentemente F = 2 e F = 1.

Prof. Salviano A. Leão 149


6.10. A estrutura hiperfina do nível n = 1

1s
E1

− 18 mec2α4 F =1
+ 14 A~2
1s1/2
A~2 − 3 A~2
4

F =0
Figura 6.7: Representação levantamento da degenerescência do nível 1s pelas correções finas e
hiperfinas. A figura não está em escala.

F =2
∆E = 23, 7 MHz
2p3/2 F =1

∆E2p3/2 −2p1/2 = 10.969, 1 MHz

F =1
2s1/2 ∆E = 177, 56 MHz

F =0
∆E = 1057, 8 MHz
F =1
2p1/2 ∆E = 59, 19 MHz
F =0
Figura 6.8: Representação levantamento da degenerescência do nível 2s pelas correções finas e
hiperfinas. A figura não está em escala.

Prof. Salviano A. Leão 150


6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s

6.10.5 A importância da estrutura hiperfina do nível 1s


A estrutura hiperfina do átomo de hidrogênio é conhecida experimentalmente com alta
precisão. Ela uma grandeza física conhecida com um número elevado de algarismos significativos,
ou seja,
A~2
= 1.420.405.751, 768 ± 0, 001 Hz

Tal elevado grau de precisão experimental tornou-se possível com o desenvolvimento do
“maser de hidrogênio” em 1963. O princípio de tal dispositivo é, esquematicamente, o seguinte:
átomos de hidrogênio, são previamente selecionados (por uma seleção magnética do tipo Stern-
Gerlach) escolhendo-se aqueles cujo nível de energia seja superior ao nível hiperfino com F = 1,
são armazenados em uma célula de vidro. Este constitui um meio de amplificação para a
frequência hiperfina
E(F = 1) − E(F = 0)
ν= .
h
Se a célula é colocada em uma cavidade sintonizada na frequência hiperfina, e se as perdas da
cavidade são o suficientemente pequenas para o ganho ser maior do que as perdas, o sistema
torna-se instável e pode oscilar: obtém-se um “oscilador atômico” (um maser ). A frequência do
oscilador é muito estável e de grande pureza espectral. A sua medição resulta diretamente no
valor da abertura hiperfina, expressa em Hz.
Note-se, finalmente, que os átomos de hidrogênio no espaço interestelar são detectados em
radioastronomia pela radiação que emitem espontaneamente quando eles caem do nível hiperfino
F = 1 para o nível hiperfino F = 0 do estado fundamental (esta transição corresponde a um
comprimento de onda de 21 cm). A maioria das informações que possuímos sobre nuvens
interestelares de hidrogênio é fornecido pelo estudo dessa linha 21 cm.

6.11 Efeito Zeeman da estrutura hiperfina do estado fun-


damental 1s
Considere um átomo na presença de um campo magnético estático B = B0 êz , o qual interage
com os vários momentos magnéticos presentes no átomo: o momento magnético orbital ML , de
spin do elétron MS e o nuclear MI , dados por
qL qge S qS qgp I
ML = ; MS = ' ; MI = − .
2me 2me me 2Mp
O hamiltoniano Zeeman WZ o qual descreve a interação do átomo com o campo magnético é

Wz = −B · (ML + MS + MI ) = ω0 (Lz + 2Sz ) + ωn Iz ,

no qual, as frequências ω0 e ωn são definidas por


q qgp
ω0 = − B0 e ωn = − B0 .
2me 2Mp
Entretanto, como Mp  me isso significa que: |ω0 |  |ωn |.

Prof. Salviano A. Leão 151


6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s

Comentários

Rigorosamente, Wz contém um outro termo, o qual é quadrático em B0 , o termo diamagnético.


Esse termo não atua nas variáveis eletrônicas e de spin, ele simplesmente desloca o nível 1s
como um todo. Além disso, ele é muito menor do que Wz .

6.11.1 A perturbação vista pelo nível 1s


A seguir será estudado o efeito de Wz no estado fundamental 1s do átomo de hidrogênio (no
caso do nível n = 2 é um pouco mais complicado, pois mesmo em um campo magnético zero,
este nível possui tanto uma estrutura fina quanto uma hiperfina, enquanto que o nível n = 1
tem apenas uma estrutura hiperfina: o princípio de cálculo é, no entanto o mesmo). Mesmo
com os campos magnéticos mais fortes que podem ser produzidos em laboratório, Wz é muito
menor do que a distância entre o nível 1s e os outros níveis: consequentemente, o seu efeito
pode ser tratada pela teoria de perturbação.
O efeito de um campo magnético sobre um nível de energia atômica é chamado de “efeito
Zeeman”. Quando B0 é representado no eixo x e as energias dos diferentes subníveis que ele cria
estão representados graficamente no eixo y, um diagrama de Zeeman é obtido.
Se B0 for o suficientemente forte, o hamiltoniano Zeeman Wz pode ser da mesma ordem de
grandeza que o hamiltoniano hiperfino Whf , ou mesmo maior. Por outro lado, se B0 for muito
fraco, Wz  Whf . Portanto, em geral, não é possível estabelecer a importância relativa de Wz e
Whf . Para obter as energias dos vários subníveis, (Wz + Whf ) devem ser diagonalizadas dentro
do nível n = 1.
Foi mostrado anteriormente que a restrição da correção hiperfina Whf para o nível n = 1,
deve se colocada na forma Whf = AI · S. Usando a expressão obtida para Wz , vê-se que nesse
caso será necessário calcular o seguinte elemento de matriz
D E
0 0
n = 1; l = 0; ml = 0; /2; ms ; mI ω0 (Lz + 2Sz ) + ωn Iz n = 1; l = 0; ml = 0; ms ; mI .

A contribuição de ω0 Lz é nula já que l = ml = 0. Como o termo 2ω0 Sz + ωn Iz atua somente


nas variáveis de spin, segue que

hn = 1; l = 0; ml = 0 | n = 1; l = 0; ml = 0i = 1,

devido a normalização. Portanto, pode-se ignorar os números quânticos n, l e ml e diagonalizar


o operador
Whf −p = AI · S + 2ω0 Sz + ωn Iz , (6.70)

o qual atua somente sobre o grau de liberdade do spin. Para diagonalizar esse operador, pode-se
usar tanto a base {|ms ; mI i} quanto a base {|F ; mF i}.
Como Iz e Sz são da mesma ordem e ω0  ωn , então em uma primeira aproximação o termo
ωn Iz pode ser desprezado com relação ao termo 2ω0 Sz . Assim a perturbação sentida pelo nível
1s é
Whf −p = AI · S + 2ω0 Sz . (6.71)

Prof. Salviano A. Leão 152


6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s

6.11.2 Diferentes domínios de intensidade do campo magnético


Ao variar-se continuamente o campo magnético B0 , modifica-se a magnitude do termo 2ω0 Sz ,
o que significa que o sistema está em um dos seguintes regimes:

1. Campos fracos:~ω0  A~²

2. Campos fortes: ~ω0  A~²

3. Campos intermediários: ~ω0 ' A~²

Posteriormente será mostrado que é possível diagonalizar exatamente o operador Wp , entre-


tanto, inicialmente será aplicado um tratamento perturbativo ao problema, como um exemplo
particularmente simples da teoria de perturbação. No caso de (1), vamos tratar o termo 2ω0 Sz
como uma perturbação com relação ao termo AI · S. Por outro lado, no caso (2), vamos tratar
o termo AI · S como uma perturbação com relação ao termo 2ω0 Sz . A diagonalização exata
do conjunto dos dois operadores, é indispensável no caso (3), permitindo uma verificação dos
resultados anteriores.

6.11.3 Efeito Zeeman no regime de campos fracos


Os autovalores e autoestados do termo AI · S, já foram determinados na seção anterior.
Viu-se que para esse caso, na base {|F ; mF i}, tem-se que:

1. Um nível com uma degenerescência tripla: {|F = 1; mF = −1, 0, 1i}. Nesse caso, tem-se
que
1
AI · S |F = 1; mF = −1, 0, 1i = A~2 |F = 1; mF = −1, 0, 1i
4
2. Um nível não degenerado: {|F = 0; mF = 0i}. Nesse caso, tem-se que
3
AI · S |F = 0; mF = 0i = − A~2 |F = 0; mF = 0i .
4

Como o termo 2ω0 Sz será tratado como uma perturbação em relação ao termo AI · S, deve-se
diagonalizar separadamente as duas matrizes representando o termo 2ω0 Sz nos dois níveis, a
saber F = 1 e F = 0, correspondentes aos dois autovalores distintos do termo AI · S.

6.11.4 Representação matricial de Sz na base {|F ; mF i}


Como F = S + I, com ms = ±1/2 e mI = ±1/2, e para um estado tripleto viu-se que

|F = 1; mF = 1i = |ms = 1/2; mI = 1/2i


1
|F = 1; mF = 0i = √ (|ms = 1/2; mI = −1/2i + |ms = −1/2; mI = 1/2i)
2
|F = 1; mF = −1i = |ms = −1/2; mI = −1/2i
1
|F = 0; mF = 0i = √ (|ms = 1/2; mI = −1/2i − |ms = −1/2; mI = 1/2i)
2

Prof. Salviano A. Leão 153


6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s

Portanto, tem-se que


~
Sz |F = 1; mF = 1i = |F = 1; mF = 1i
2
~
Sz |F = 1; mF = 0i = |F = 0; mF = 0i
2
~
Sz |F = 1; mF = −1i = − |F = 1; mF = −1i
2
~
Sz |F = 0; mF = 0i = |F = 1; mF = 0i
2
Segue então que a representação matricial de Sz na base {|F ; mF i} com os vetores de estado na
ordem |1, 1i, |1, 0i, |1, −1i e |0, 0i é

|1, 1i |1, 0i |1, −1i |0, 0i


 
1 0 0 0 |1, 1i
~
(Sz ) =
 
 0 0 0 1  |1, 0i (6.72)
2 
 0

 |1, −1i
 0 -1 0 
0 1 0 0 |0, 0i

Comentário

Note que Fz = Sz + Iz e que Fz |F ; mF i = ~mF |F ; mF i logo sua representação matricial na


base {|F ; mF i} é

|1, 1i |1, 0i |1, −1i |0, 0i


 
1 0 0 0 |1, 1i
~
(Fz ) =
 
 0 0 0 0  |1, 0i (6.73)
2 
 0

 |1, −1i
 0 -1 0 
0 0 0 0 |0, 0i
Note que Fz não é proporcional a Sz , já que Fz é diagonal e Sz não.
Entretanto se nos restringirmos somente ao subespaço F = 1, as duas matrizes são proporci-
onais. Do teorema de Wigner-Eckart, se P1 é o projetor em F = 1, temos
1
P1 Sz P1 = P1 Fz P1
2
É relativamente simples mostrar que existe essa mesma relação para Sx e Fx e Sy e Fy .
Há um caso especial do teorema de Wigner-Eckart de acordo com o qual, em um dado
subespaço do momentum angular total, todas as matrizes as quais representam um vetor
operador são proporcionais. Está claro neste exemplo, que essa proporcionalidade existe somente
para operadores restritos a um dado auto-subespaço do momentum angular total, e não para o
operador como um todo.
Além disso, o coeficiente de proporcionalidade, o fator 1/2, que aparece, pode ser obtido
imediatamente a partir do teorema da projeção: de acordo com o qual tem-se que
hF · SiF =1 F (F + 1) + S(S + 1) − I(I + 1) 1 1
= = para I=S= .
hF2 iF =1 2F (F + 1) 2 2

Prof. Salviano A. Leão 154


6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s

pois
F · S = (I + S) · S = S2 + I · S,

mas
1 2
F2 = S2 + I2 + 2I · S F − S2 − I2

=⇒ I·S=
2
logo
1 1 1 1 2
F · S = F2 + S2 − I2 = F + S2 − I2

2 2 2 2
e como
F2 |F ; mF i = F (F + 1)~2 |F ; mF i .

6.11.5 Campo fraco: Autoestados e autovalores


Portanto, para o nível F = 1, a matriz que representa 2ω0 Sz é
 
1 0 0
(2ω0 Sz ) = ~ω0 0 0 0 
 

0 0 −1

Já para o nível F = 0, a matriz reduz-se a zero. Assim

Autoestado Autovalor
1
|F = 1; mF = 1i ←→ 4
A~2 + ~ω0
1
|F = 1; mF = 0i ←→ 4
A~2 +0 (6.74)
1
|F = 1; mF = −1i ←→ 4
A~2 − ~ω0

|F = 0; mF = 0i ←→ − 34 A~2 + 0

Na figura 6.9, no eixo x temos ~ω0 e no eixo y as energias dos quatro subníveis Zeeman
(Zeeman diagrama). Em um campo de zero, temos os dois níveis hiperfinos, F =1 e F = 0.
Quando o campo B0 é ligado, o subnível |F = 0; mF = 0i, o qual não é degenerado, inicia na
horizontal; como para o nível de F = 1, a sua degenerescência tripla é completamente remo-
vida: três subníveis são obtidos equidistantes, variando linearmente com ~ω0 , com inclinações
respectivamente de 1, 0, -1.

O tratamento dado anteriormente é válido enquanto a diferença ~ω0 entre dois subníveis
Zeeman adjacentes do nível F = 1 permanecer menor que a diferença em campo zero, entre os
níveis F = 1 e F = 0, a estrutura hiperfina.

Prof. Salviano A. Leão 155


6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s

E
mF = 1

F =1 mF = 0
mF = −1
A~2

F =0 mF = 0

~ω0
Figura 6.9: Diagrama Zeeman para campos magnéticos fracos do nível 1s do átomo de hidrogênio.
O nível hiperfino F = 1, se desdobra em 3 níveis equidistantes, cada um dos quais com um número
quântico mF bem definido. O nível F = 0, não se altera.

Comentários

O teorema de Wigner-Eckart, mencionado anteriormente, possibilita mostrar que em um


dado nível F do momentum angular total, o hamiltoniano Zeeman

Hz = ω0 (Lz + 2Sz )

é representado por uma matriz proporcional a Fz . Portanto, podemos escrever, denotando por
PF o projetor para o nível F :

PF [ω0 (Lz + 2Sz )] PF = gF ω0 PF Fz PF ,

na qual gF é o chamado fator de Landé do estado F . No caso tratado anteriormente, temos que
gF =1 = 1.

6.11.6 A frequência de Bohr e as evoluções de hF i e hSi


Em um campo magnético zero, F = I + S é uma constante de movimento. I e S realizam um
movimento de precessão em torno do F resultante, com uma velocidade angular proporcional a
constante de acoplamento A entre I e S. Se além disso, o sistema está na presença de um campo
magnético fraco B = B0 êz paralelo ao eixo z, então em adição ao movimento de precessão
rápido, de frequência ω, de I e S em torno do F surge um movimento de precessão lento de
frequência Ω, de F em torno de torno do campo magnético, na direção z, denominada precessão
de Larmor, cuja a frequência Ω é conhecida como frequência de Larmor. Para campos fracos,
tem-se que ω  Ω e nesse caso tem-se que ω ∝ A, a constante da estrutura hiperfina.
Portanto, Fz é uma constante de movimento, enquanto Sz possui uma parte estática, que é
a projeção no eixo z da componente de S paralela a F, e uma outra parte a qual é modulada
pela frequência de precessão hiperfina, a projeção no eixo z da componente de S perpendicular
a F, a qual precessa em torno de F. Portanto, conforme ilustrado na figura 6.10, tem-se

Prof. Salviano A. Leão 156


6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s

Sz = Sz(Est.) + Sz(Din) (t)

analogamente
Iz = Iz(Est.) + Iz(Din) (t)

e como Fz é constante, isso significa que

Sz(Din) (t) + Iz(Din) (t) = cte.

z
Vamos comparar esses resultados semiclássicos
B
com os da teoria quântica apresentadas anterior-
mente nesta seção. Para fazer isso, temos que
considerar a evolução no tempo dos valores médios
hFz i e hSz i. O valor médio hGi (t) de uma grandeza
Ω física G contém uma série de componentes que os-
cilam nas várias frequências de Bohr (E − E 0 )/h do
I sistema. Além disso, uma determinada frequência
de Bohr aparece em hGi (t) apenas se o elemento
Sz (t) de matriz de G entre os estados correspondentes
ω
para as duas energias for diferente de zero. Note
F que,
d 1 ∂
Sz hGi (t) = h[G, H]i + hGi (t)
S dt i~ ∂t
e
XX
Figura 6.10: Modelo vetorial do movimento |ψ(t)i = Cn,τ (t0 ) e−iEn (t−t0 )/~ |ϕn,τ i ,
dos vetores F, I e S. Os vetores I e S pre- n τ

cessam rapidamente em torno de F sobre o portanto


efeito do acoplamento hiperfino, enquanto F XX

precessa mais lentamente em torno do fraco hGi (t) = Cm,Γ (t0 ) · Cn,τ (t0 )
n,m τ,Γ
campo magnético aplicado.
× hϕm,Γ | G | ϕn,τ i e−i(Em −En )(t−t0 )/~

No problema que nos interessa aqui, os autoestados do hamiltoniano de campo fraco são os
estados |F ; mF i. Agora, considere duas matrizes (6.72) e (6.73) que representam Sz e Fz nesta
base. Desde Fz tem apenas elementos de matriz diagonais, nenhuma frequência Bohr diferente
de zero pode aparecer em hFz i (t): hFz i é, por conseguinte, estático, pois

hFz i (t) = ~ |C1,1 |2 − |C1,−1 |2 .




Por outro lado, Sz tem, não só os elementos de matriz diagonal (com o qual está associada
uma componente estático de hSz i), mas também um elemento não-diagonal entre os estados

Prof. Salviano A. Leão 157


6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s

|F = 1; mF = 0i e |F = 0; mF = 0i, cuja diferença de energia é A~2 , de acordo com a tabela


(6.74) (ou a figura 6.10). Disso resulta que hSz i tem, além da sua componente estática, uma
componente modulada pela frequência angular A~, ou seja,

~  ~ ∗
|B1,1 |2 − |B1,−1 |2 + B0,0 B1,0 e−iA~(t−t0 ) + B1,0

B0,0 e+iA~(t−t0 ) .

hSz i (t) =
2 2
(Est.) (Din)
= Sz + Sz (t).

Este resultado recorda o obtido utilizando o modelo vetorial do átomo. Um paralelo poderia
ser estabelecido entre a evolução de hFx i, hSx i, hFy i e hSy i e aquele das projeções dos vetores
F e S da figura 6.10 em Ox e Oy. Entretanto, o movimento de hFi e hSi não coincide
perfeitamente com aquele do momentum angular clássico. Em particular, o módulo de hSi não
6 hSi2 .
é necessariamente constante, pois na mecânica quântica tem-se que hS2 i =

Comentários

Uma relação pode ser estabelecida entre a teoria de perturbação e o modelo vetorial do átomo.
A influência de um campo fraco B0 nos níveis F = 1 e F = 0 pode ser obtido através da retenção
no hamiltoniano Zeeman Hz = 2ω0 Sz apenas dos elementos de matriz dos níveis F = 1 e F = 0
, “esquecendo” o elemento matriz de Sz entre |F = 1; mF = 0i e |F = 0; mF = 0i. Procedendo
deste modo, também “esquecemos” a componente modulada de hSz i, que é proporcional a este
elemento da matriz. Nós, portanto, manter apenas a componente de hSi paralela ao hFi.
Agora, isso é precisamente o que fazemos no modelo vetorial do átomo quando queremos
avaliar a energia de interação com o campo B0 . Em um campo fraco, F precessiona muito mais
lentamente em torno deB do que S o faz em torno de F. A interação de B com a componente
de S perpendicular a F, portanto, em média, não tem nenhum efeito; somente a projeção de S
para F é que conta. É assim, por exemplo, que é calculado o fator de Landé.

6.11.7 Efeito do campo magnético forte


Para estudar os efeitos de um campo magnético forte, o termo Zeeman Hz = 2ω0 Sz deverá
ser diagonalizado na base {|F ; mF i} , pois o mesmo é diagonal na base {|mS ; mI i}, pois

Hz |mS ; mI i = 2ω0 Sz |mS ; mI i = 2~ω0 ms |mS ; mI i ,

mas como ms = ±1/2, segue que

Hz |mS ; mI i = ±~ω0 |mS ; mI i .

Logo como mI = ±1/2, então cada um dos autoestados de Hz é duplamente degenerado.


Assim, 
2ω S |+; ±i = +~ω |+; ±i
0 z 0
2ω S |−; ±i = −~ω |−; ±i
0 z 0

Prof. Salviano A. Leão 158


6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s

6.11.7.1 Efeitos do termo hiperfino Whf considerado como uma perturbação

As correções em primeira ordem em A podem ser obtidas diagonalizando as restrições do


operador AI · S ao subespaços {|+, ±i} e{|−; ±i} correspondendo aos dois autovalores diferentes
de Hz = 2ω0 Sz .
Note que, em cada um desses subespaços, os dois vetores bases |+, +i e |+, −i ou |−, +i e
|−, −i também são autovetores de Fz , mas não correspondem ao mesmo valor de mF = mS + mI .
Desde que o operador Whf = AI · S = 21 A (F2 − S2 − I2 ) comuta com Fz , ou seja,
 
1 2 2 2

[Fz , Whf ] = Fz , A F − S − I = 0,
2
ele não possui elementos de matriz entre os estados |+, +i e |+, −i ou entre os estados |−, +i e
|−, −i, ou seja,
   
1 2 2

2
1 2 2

2
+, + A F − S − I +, − = −, − A F − S − I −, + = 0.

2 2
As duas matrizes representando o operador AI · S nos dois subespaços {|+, ±i} e{|−; ±i}, são
então diagonais, e os seus autovalores são então os elementos diagonais de

hWhf i = hmS ; mI | AI · S | mS ; mI i ,

as quais também podem ser reescritas usando a relação

I · S = Ix Sx + Iy Sy + Iz Sz .

Entretanto a a relação anterior pode ser reescrita em uma forma mais simples, e para tal
lembre-se que
1 1
Sx = (S+ + S− ) e Sy = (S+ − S− ) ,
2 2i
logo
1 1
Ix Sx + Iy Sy = (S+ + S− ) (I+ + I− ) − (S+ − S− ) (I+ − I− )
4 4
1
= (I+ S− + I− S+ ) ,
2
assim,
1
I·S=
(I+ S− + I− S+ ) + Iz Sz . (6.75)
2
Portanto o hamiltoniano da interação hiperfina toma a seguinte forma,
 
1
Whf = AI · S = A Iz Sz + (I+ S− + I− S+ ) . (6.76)
2
Desta relação, é imediato ver que os únicos elementos de matriz não nulos são os diagonais, ou
seja,

hmS ; mI | AI · S | mS ; mI i = A hmS ; mI | Iz Sz | mS ; mI i
= A~2 mS mI .

Prof. Salviano A. Leão 159


6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s

E
|εS , εI i |+, +i

|+, −i

F =1

A~2
|−, −i
F =0
|−, +i

~ω0
Figura 6.11: Diagrama Zeeman para o regime de campo forte, do estado fundamental, o nível 1s, do
átomo de hidrogênio. Para cada orientação do spin eletrônico (εS = + ou εS = − ), obtém duas linha
retas paralelas, separadas por uma energia A~2 /2, cada uma correspondendo as diferentes orientações
do spin do próton(εI = + ou εI = − ).

Para H = Hz + Whf , ao tratarmo o termo Whf como uma perturbação de Hz , a energia do


sistema corrigida em primeira ordem de perturbação será dada por

Autoestado Autovalor corrigido


|+, +i ←→ ~ω0 + 41 A~2

|+, −i ←→ ~ω0 − 14 A~2 (6.77)

|−, +i ←→ −~ω0 − 41 A~2

|−, −i ←→ −~ω0 + 14 A~2 + 0

Na figura 6.11, as curvas de linha sólida no lado direito (para ~ω0  A~2 ) representam os
níveis de energia em regime de campo forte: obtemos duas linhas retas paralelas de inclinação
+1, separados por uma energia A~2 /2, e duas linhas retas paralelas de inclinação −1, também
separadas por A~2 /2. O tratamento de perturbativo apresentadas nesta seção e, por conseguinte,
na anterior fornecem os comportamentos assintóticos para o campo forte e fraco, a tangente na
origem dos níveis de energia.
O forte campo desdobra os dois estados |+, +i e |+, −i ou |−, +i e |−, −i em A~2 /2, pode
ser interpretado do seguinte modo. Vimos que apenas o termo Iz Sz da expressão (6.76) para
I · S está envolvido em um regime de campo forte, quando o acoplamento hiperfino é tratado
como uma perturbação do termo Zeeman. O hamiltoniano de campo forte total (6.71), portanto,
pode ser escrito:  
1
Whf = 2ω0 Sz + AIz Sz = 2 ω0 + AIz Sz
2
É como se o spin eletrônico “visse” além do campo externo B = B0 êz um pequeno campo

Prof. Salviano A. Leão 160


6.11. Efeito Zeeman da estrutura hiperfina do estado fundamental 1s

interno menor, resultante do acoplamento hiperfino entre I e S e que tem dois valores possíveis,
dependendo se o spin nuclear está para cima ou baixa. Este campo adiciona ou subtrai de
B = B0 êz e é responsável pela diferença de energia entre os estados |+, +i e |+, −i ou entre
|−, +i e |−, −i.

6.11.8 A frequência de Bohr envolvida na evolução de Sz


Em um campo forte, o acoplamento de Zeeman
z de S com B é mais importante do que o acopla-
mento hiperfino de S com I. Se começarmos por
B
negligenciar este acoplamento hiperfino, o modelo
vetorial do átomo prevê que S irá precessionar
(muito rapidamente desde que |B| é grande) sobre
a direção Oz de B (I permanece imóvel, uma vez
Ω que foi considerado que ωn , era negligenciável).
Expressão (6.75) para o acoplamento hiperfino
permanece válida para vetores clássicos. Por causa
da precessão muito rápida de S, os termos S+ e S−
oscilam muito rapidamente, e em média sem efeito,
S
de modo que apenas o termo Iz Sz conta. O efeito do
acoplamento hiperfino é, portanto, o de adicionar
um campo pequeno paralelo à Oz e proporcional à
Iz , o que acelera ou retarda a precessão de S sobre
Oz, dependendo do sinal de Iz . O modelo vetorial
I
do átomo prevê assim que Sz será estático em um
campo forte.
Figura 6.12: O movimento do spin S no mo- Vamos mostrar que a teoria quântica fornece
delo vetorial do átomo no regime de campo um resultado análogo para o valor médio hSz i do
forte. O spin S precessiona rapidamente em observável Sz . Em um campo forte, os estados de
torno do campo B. Aqui é negligenciado am- energia bem definidas são, como vimos, os estados
bos os acoplamentos do spin nuclear I com o |m , m i. Agora, nesta base, o operador S tem so-
S I z
campo B e o acoplamento hiperfino entre I e
mente elementos de matriz diagonais. Frequências
S, de modo que I permanece estático.
de Bohr diferente de zero, portanto, podem surgir
em hSz i que, consequentemente, é uma quantidade estática ao contrário de sua contrapartida o
campo fraco.

Efeito Zeeman para campos intermediários


Os estados |F, mF i são autoestados de Whf = AI · S, então nessa base o operador Whf é
diagonal. Note que,
H = Hz + Whf = 2ω0 Sz + AI · S,

Prof. Salviano A. Leão 161


6.12. Efeito Stark

e nesse caso
1
Whf = A F2 − S2 − I2 .

2
Temos que para F = 0, mF = 0 e para F = 1, mF = −1, 0, 1, logo a base {|F, mF i} =
{|0, 0i , |1, −1i , |1, 0i , |1, 1i}. Nessa base, como

1 ~2
A F2 − S2 − I2 |F, mF i = A [F (F + 1) − s(s + 1) − I(I + 1)] ,

2 2
então o elemento diagonal do termo Whf para F = 0 é −3A~2 /4 e para F = 1 é A~2 /4
Mostrou-se que nessa base a matriz que representa o operador Sz é dada por (6.72), portanto
nessa base, a matriz hamiltoniana do sistema é dada por

|1, 1i |1, −1i |1, 0i |0, 0i


 
1
~ω0 + 4
A~2 0 0 0 |1, 1i
( H) =  ~ω0 − 41 A~2
 
0 0 0  |1, −1i (6.78)
 
1

 0 0 4
A~2 ~ω0  |1, 0i

0 0 ~ω0 − 34 A~2 |0, 0i
A matriz H pode ser separada em dois blocos 2 × 2. O primeiro bloco já é diagonal e seus
autovalores são
1
E1 = ~ω0 + A~2 =⇒ |1, 1i ⇐⇒ |+, +i
4
1
E2 = ~ω0 − A~2 =⇒ |1, −1i ⇐⇒ |−, −i
4
Já a matriz que compõem o segundo bloco é dada por
!
1
A~2 ~ω0
(H)b2 = 4
~ω0 − 34 A~2

e ao diagonalizarmos ela obtemos a seguinte equação


   
1 2 3 2
A~ − E · − A~ − E − (~ω0 )2 = 0,
4 4
cujas raízes são respectivamente
s 2
1 1 2
E3 = − A~2 + A~ + ~2 ω02
4 2
s 2
1 1 2
E4 = − A~2 − A~ + ~2 ω02
4 2

6.12 Efeito Stark


Considere sobre o átomo de hidrogênio atue o campo elétrico E = E êz , logo novo termo do
hamiltoniano do sistema é
WS = −qE · R = −qEz.

Prof. Salviano A. Leão 162


6.12. Efeito Stark

mF
E1
E
+1 E3
0

1
4
A~2 ~ω0
(F = 1)

−1
− 34 A~2
(F = 0)
E2
0
E4
Figura 6.13: Diagrama Zeeman para um campo arbitrário do nível 1s do átomo de hidrogênio. Nesse
caso, o número quântico mF é um bom número quântico para qualquer valor do campo aplicado. As
duas linhas retas (cheias) de inclinação, correspondem aos valores de mF = ±1, assim como as outras
duas curvas correspondem a mF = 0. As linhas tracejada correspondem ao comportamento assintótico,
para campos altos, das duas curvas correspondente aos níveis de energia E3 e E4 .

Esse é o termo que descreve a interação de dipolo elétrico qR do átomo com o campo elétrico
E = E êz . Considerando que H0  WS , então será possível dar um tratamento perturbativo ao
termo WS . Nesse caso como nem o hamiltoniano H0 e nem WS atuam nas variáveis de spin,
então os números quânticos mS e mI serão ignorados.

6.12.1 Efeito Stark no nível 1s


A correção perturbativa para a energia, em primeira ordem é
(1)
E1s = hWS i1s = −qE hn = 1, l = 0, mL = 0 | Z | n = 1, l = 0, mL = 0i = 0,

pois Z é uma função ímpar. Já o próximo termo da correção perturbativa é

(2)
X X X |h1, 0, 0 | Z | n, l, mL i|2 Ry
2 2
E1s =q E , com En = − .
n6=1 l mL
E1 − En n2

Como E1 − En < 0 sempre, e como haverá casos em que Z |n, l, mL i será uma função par, então
(2)
pode-se concluir que E1s < 0.

6.12.2 Polarizabilidade do estado 1s


(1)
Viu-se que E1s = hWS i1s = −q h1, 0, 0 | R | 1, 0, 0i · E = 0, devido a paridade das funções de
onda e consequentemente do integrando do elemento de matriz, entretanto na presença de um
campo elétrico o estado fundamental do átomo não é mais dado pelo |1, 0, 0i e sim por
X X X |hn, l, mL | Z | 1, 0, 0i|
|ψ0 i = |1, 0, 0i − qE |n, l, mL i + · · ·
n6=1 l mL
E1 − En

Prof. Salviano A. Leão 163


6.12. Efeito Stark

portanto, a correção em primeira ordem é

XXX 1
hWs iψ0 = hψ0 | qR | ψ0 i = −q 2 E ×
n6=1 l mL
E1 − En

[h1, 0, 0 | R | n, l, mL i hn, l, mL | Z | 1, 0, 0i + h1, 0, 0 | Z | n, l, mL i hn, l, mL | R | 1, 0, 0i] .

Ao escrever os operadores X e Y em termos dos harmônicos esféricos, pode-se mostrar que

hψ0 | qX | ψ0 i = hψ0 | qY | ψ0 i = 0.

X X X |hn, l, mL | Z | 1, 0, 0i|2
hψ0 | qZ | ψ0 i = −2q 2 E .
n6=1 l mL
E1 − En

O campo elétrico induz um momento de dipolo elétrico p = qE, para o qual tem-se

dp
P= = χ0 E.
dv
O coeficiente de proporcionalidade χ entre o momento de dipolo elétrico induzido p e o campo
elétrico E, é chamado de susceptibilidade elétrica linear. Portanto, com essas definições, pode-se
escrever
X X X |hn, l, mL | Z | 1, 0, 0i|2
2
χ1s = hψ0 | χ | ψ0 i = −2q .
n6=1 l mL
E1 − En

6.12.3 Efeito Stark para o nível n = 2


Para o nível n = 2, a base é {|2, 0, 0i , |2, 1, 1i , |2, 1, 0i , |2, 1, −1i}. Quanto a paridade dos
estados dessa base temos



 |2, 1, 1i

Par = {|2, 0, 0i e Ímpar = |2, 1, 0i


|2, 1, −1i

Como a perturbação WS é uma função ímpar, segue-se que

h2, 0, 0 | WS | 2, 0, 0i = h2, 1, m0 | WS | 2, 1, mi = 0, com m0 = m = −1, 0, 1.

Portanto, os únicos elementos de matriz não nulos são os h2, 1, m | WS | 2, 0, 0i =


6 0, assim como
WS = −qEZ = −qER cos θ e como o harmônico esférico Y10 (θ) é dado por
r r
3 4π 0
Y10 (θ) = cos θ =⇒ cos θ = Y (θ),
4π 3 1

Portanto, nos cálculos do elementos de matriz da série perturbativa, teremos integrais da


forma ˆ
Y1m∗ (Ω)Y10 (Ω)Y00 (Ω) dΩ

Prof. Salviano A. Leão 164


6.12. Efeito Stark

e desde que, Y00 (Ω) = 1/ 4π = cte, logo as integrais dessa forma serão proporcionais ao produto
de Y10 (Ω) por Y1m∗ (Ω) e portanto essas integrais serão não nulas somente se m = 0. Temos ainda
a relação de ortogonalidade entre o harmônicos esféricos dada por
ˆ
0
dΩ Y`m∗ (Ω)Y`m
0 (Ω) = δ`,`0 δm,m0

Note ainda que, desde que Y10 (Ω), R2,0 (r) e R1,0 (r) são funções reais, então pode-se concluir
que o elemento de matriz
h2, 1, m = 0 | WS | 2, 0, 0i ∈ <,

assim considerando que


h2, 1, 0 | WS | 2, 0, 0i = γE,

tem-se então que a matriz do termo WS no nível 2s é dada por

|2, 1, 1i |2, 1, −1i |2, 1, 0i |2, 0, 0i


 
0 0 0 0 |2, 1, 1i
(WS )n=2
 
=  0 0 0 0  |2, 1, −1i (6.79)
 
 0 0 0 γ  |2, 1, 0i
 
0 0 γ 0 |2, 0, 0i
Assim em primeira ordem, as correções perturbativas dos autoestados no nível n = 2 são
dadas por

Autoestado Correção
|2, 1, 1i ←→ 0
|2, 1, −1i ←→ 0 (6.80)
√1 (|2, 1, 10i + |2, 0, 0i) ←→ γE
2
√1 (|2, 1, 10i − |2, 0, 0i) ←→ −γE
2

Portanto, o campo elétrico remove parcialmente a degenerescência do nível n = 2, com um


deslocamento linear com o módulo E do campo elétrico.

Prof. Salviano A. Leão 165


6.12. Efeito Stark

Prof. Salviano A. Leão 166


Capítulo 7

Teoria de Perturbação Dependente do


Tempo

Até o momento foram consideradas somente situações estáticas (exceto na discussão dos
postulados da mecânica quântica, na qual surge surge o colapso do vetor de estado para um
dos estados do sistema ao realizarmos uma medição). Chegou o momento de discutirmos a
dependência temporal do vetor de estado, o que requer um novo princípio. A equação de
Schrödinger dependente do tempo resultante é resolvida exatamente para os casos simples, como
o do spin, e usando uma teoria de perturbação. A noção de probabilidade de transição produz
um significado físico para os elementos de matriz não-diagonal do potencial perturbados, como
vimos estudarmos os sistemas de dois níveis, o que nos permite apresentar a relação de incerteza
energia-tempo junto com o conceito de tempo de vida.
Devemos ressaltar o fato de que na mecânica quântica o tempo é tomado como sendo um
parâmetro, e não um observável. Embora haja um operador evolução temporal, não há um
operador tempo ou algo do tipo.

7.1 Formulação do problema


Considere um sistema físico descrito pelo operador hamiltoniano H0 , que satisfaz a seguinte
equação de autovalores:
H0 |ϕn i = En |ϕn i . (7.1)

Por simplicidade, considere que o espectro de H0 é discreto e não degenerado, e que H0 é


independente do tempo.
No instante t = 0 aplica-se uma perturbação dependente do tempo ao sistema de forma que
o hamiltoniano do sistema agora é dada por

H(t) = H0 + W (t) com W (t) = λV (t), (7.2)

na qual λ é um parâmetro real adimensional muito menor do que um (λ  1) e V (t) é um


observável da mesma ordem de magnitude de H0 e zero para t < 0.

167
7.1. Formulação do problema

No tratamento dado ao problema, considera-se que o sistema encontra-se inicialmente no


estado estacionário |ϕi i, um autoestado de H0 com autovalor Ei . Iniciando em ti = 0, quando
a perturbação é aplicada ou ligada, o sistema evolui, pois o estado |ϕi i não é um autoestado
do hamiltoniano perturbado H(t). Investigaremos como o sistema evolui do instante t = 0,
de um autoestado inicial |ϕi i para um autoestado final |ϕf i de H0 no instante t, e com que
probabilidade Pif (t) isso ocorre. Com isso, pretende-se compreender como ocorrem as transições
entre dois estados quaisquer do sistema não perturbado, induzidas pelo potencial perturbativo
W (t).
A evolução temporal do sistema entre os instantes ti = 0 e tf = t é dada por

d |ψ(t)i
i~ = [H0 + λV (t)] |ψ(t)i , (7.3)
dt

e a sua solução, com a condição inicial

|ψ(t = 0)i = |ϕi i , (7.4)

é única. A probabilidade Pif (t) desejada pode ser escrita como

Pif (t) = | hϕi | ψ(t)i |2

O problema posto acima consiste em encontrar a solução de (7.3) que corresponde à condição
inicial (7.4). No entanto, em geral tal problema não é rigorosamente solúvel. É por isso que
recorre-se aos métodos aproximados para obtermos informações a respeito do sistema. Será
mostrado que se o parâmetro λ for pequeno o suficiente, a solução|ψ(t)i pode ser encontrada
na forma de uma expansão de série de potência limitada em λ. Assim, calcula-se o |ψ(t)i
explicitamente em primeira ordem em λ, assim como a probabilidade correspondente. As
expressões gerais obtidas serão aplicadas ao estudo do caso especial, aquele em que a perturbação
é uma função sinusoidal do tempo ou uma constante, como é o caso da interação de um átomo
com uma onda eletromagnética. Este é um exemplo do fenômeno de ressonância. Duas situações
serão consideradas: aquela em que o espectro de H0 é discreto, e então aquele em que o estado
inicial |ϕi i é acoplado a um contínuo de estados finais. Neste último caso, obteremos uma
importante expressão conhecida como “regra de ouro de Fermi ”.
Os resultados obtidos ao discutirmos um sistema de dois níveis, cujos estados são|ϕ1 i e
|ϕ2 i, inicialmente no estado|ϕ1 i, era submetido no instante de tempo t = 0 a uma perturbação
constante W , podem ser considerados uma caso particular do que será investigado no que se
segue. A probabilidade P12 (t) poderá então ser calculada exatamente, o que leva à fórmula de
Rabi.
O problema que será tratado aqui é muito mais geral. Será considerado um sistema com um
número arbitrário de níveis de energia e uma perturbação W (t) que é uma função arbitrária do
tempo. Isso explica por que, em geral obtém-se apenas uma solução aproximada.

Prof. Salviano A. Leão 168


7.2. Probabilidade de transição

7.2 Probabilidade de transição


Para compreendermos de forma clara que tipo de informação física pode ser extraída
das amplitudes de transição precedentes, será feita uma distinção entre os diferentes casos,
dependendo se os estados iniciais |ϕi i e finais |ϕf i, do processo pertencem ao espectro discreto
ou contínuo do hamiltoniano não perturbado H0 . Para cada um desses casos, a dependência do
tempo que a mecânica quântica prevê para os elementos da matriz do operador de evolução
será investigada, e será mostrado como é possível conectar as amplitudes de transição com
quantidades físicas mensuráveis, tais como mudanças de nível, tempos de vidas, seções choques
transversais, etc. Tais ideias gerais serão úteis para analisar os processos físicos a serem vistos
posteriormente.
A probabilidade Pif (t) do sistema no instante t estar no estado |ψ(t)i = |ϕf i, diferente de
|ψ(t = 0)i = |ϕi i, o estado em que ele se encontrava em t = 0, é dada por

Pif (t) = |hϕf | ψ(t)i|2 (7.5)

Escolhendo então a representação {|ϕn i}, o ket |ψ(t)i ao ser expandido na base {|ϕn i} toma
a seguinte forma:
X
|ψ(t)i = Cn (t) |ϕn i , (7.6)
n
com
Cn (t) = hϕn | ψ(t)i . (7.7)

Nessa base, é costume definir

Vnk (t) = hϕn |V (t)|ϕk i (7.8)

como o elemento de matriz do observável V (t). Note que nessa base o hamiltoniano H0 é
representado pela matriz diagonal

hϕn |H0 |ϕk i = En δnk . (7.9)

Para uma base completa, vale a relação de completeza,


X
|ϕk i hϕk | = 1. (7.10)
k

Substituindo (7.6) em (7.3), obtém-se


X dCk (t) X
i~ |ϕk i = [H0 + λV (t)] Ck (t) |ϕk i .
k
dt k

Tomando o produto interno da equação acima com o bra hϕn |, resulta em


X dCk (t) X
i~ hϕn | ϕk i = Ck (t) hϕn |H0 + λV (t)|ϕk i
k
dt k

Prof. Salviano A. Leão 169


7.2. Probabilidade de transição

Portanto, pode-se escrever a evolução temporal dos coeficientes Cn (t) como

d X
i~ Cn (t) = En Cn (t) + λVnk (t)Ck (t). (7.11)
dt k

Note que o resultado anterior é constituído por um conjunto de equações diferenciais de primeira
ordem acopladas. A princípio ao resolver o sistema (7.11), a solução desejada |ψ(t)i seria
encontrada, pois todos os coeficientes Cn (t) seriam conhecidos. O que acopla o conjunto de
equações (7.11) é somente a perturbação W (t) = λV (t), a qual relaciona a evolução temporal
de um coeficiente Cn (t) qualquer com todos os outros coeficientes Ck (t) por meio dos elementos
de matriz Vnk (t) dados por (7.8).

7.2.1 Separando as contribuições temporais


Para V (t) = 0, a solução da equação (7.11) é

Cn (t) = bn e−iEn t/~ , (7.12)

na qual bn é uma constante que depende das condições iniciais.


Se o acoplamento for muito pequeno, como no caso em que λ  1 e V (t) 6= 0 e nesse
caso W (t)  1, é natural esperar que os valores dos coeficientes Cn (t) da equação (7.11) não
sejam muito diferentes dos valores fornecidos pela equação (7.12). Então para esse caso será
considerada a seguinte solução tentativa para a equação (7.11),

Cn (t) = bn (t)e−iEn t/~ , (7.13)

na qual os coeficientes bn (t) devem variar muito pouco com o tempo. Com isso, separa-se os
termos que variam letamente daqueles que variam rapidamente.
Substituindo (7.13) em (7.11), obtemos

d X
i~e−iEn t/~ bn (t) + En bn (t)e−iEn t/~ = En bn (t)e−iEn t/~ λVnk (t)bk (t)e−iEk t/~ (7.14)
dt k

Multiplicando ambos os lados da equação acima por e+iEn t/~ , e introduzindo a frequência angular
de Bohr
En − Ek
ωnk = (7.15)
~
relacionada ao par de estados com energias En e Ek . Com isso, obtém-se que

d X
i~ bn (t) = λ eiωnk t Vnk (t)bk (t) (7.16)
dt k

a qual fornece a evolução temporal dos coeficientes bn (t).

Prof. Salviano A. Leão 170


7.3. Equações perturbativas

7.3 Equações perturbativas


Note que o sistema de equações (7.16) corresponde rigorosamente a equação de Schrödinger
dependente do tempo. Em geral, não sabemos como resolver esse sistema de equações exatamente.
Por isso, para tentar encontrar uma solução para esse sistema, será usado o fato de λ  1, o
que permite que se faça uma expansão de cada coeficiente bn (t) em série de potências em λ da
seguinte forma:

bn (t) = b(0) (1) 2 (2)


n (t) + λbn (t) + λ bn (t) + · · · (7.17)
Aqui não será analisada a convergência da série, entretanto, espera-se que sua convergência seja
rápida já que λ é muito pequeno.
Substituindo essa expansão em (7.16), obtém-se a seguinte equação
 
d (0) d (1) 2 d (2)
X
i~ bn (t) + λ bn (t) + λ bn (t) + · · · = λ eiωnk t Vnk (t)×
dt dt dt
hk i
(0) (1) 2 (2)
bk (t) + λbk (t) + λ bk (t) + · · · (7.18)
Agora, junta-se em ambos os lados da igualdade todos os termos de mesma potência no parâmetro
λ, e com isso obtemos uma série de potência da seguinte forma a0 + a1 λ + a2 λ2 + a3 λ3 + · · · +
an λn + · · · = 0. A única forma dessa equação ser satisfeita é igualando cada um dos coeficientes
de λ a zero, o que resulta no seguinte sistema de equações

d (0)
i~ b (t) = 0
dt n
d X (0)
i~ b(1)
n (t) = eiωnk t Vnk (t)bk (t)
dt k
d X (1)
i~ b(2)
n (t) = eiωnk t Vnk (t)bk (t)
dt k
.. ..
. = .
d (r) X (r−1)
i~ bn (t) = eiωnk t Vnk (t)bk (t)
dt k

A solução deste sistema de equações é obtida considerando que para t ≤ 0 o sistema encontrava-se
no estado |ϕi i. Nesse casso todos os coeficientes bn (t) são nulos exceto bi (t) = bi = cte. Portanto
temos que:
b(0)
n (t = 0) = δni e b(r)
n (t = 0) = 0 se r > 1 (7.19)
Portanto da correção de ordem zero temos que
b(0)
n (t) = δni (7.20)
Ao substituir o resultado da correção de ordem zero na correspondente equação para a
correção de primeira ordem obtém-se que
d X
i~ b(1) (t) = eiωnk t Vnk (t)δki = eiωni t Vni (t), (7.21)
dt n k

Prof. Salviano A. Leão 171


7.3. Equações perturbativas

cuja solução é
ˆt
1 0
b(1)
n (t) = eiωni t Vni (t0 )dt0 (7.22)
i~
0
Substituindo o resultado da correção em primeira ordem na expressão para a correção em
segunda ordem, resulta na seguinte equação
ˆt
d X 1 0
i~ b(2)
n (t) = eiωnk t Vnk (t) eiωki t Vki (t0 )dt0 (7.23)
dt k
i~
0

para a qual a solução é imediata, e é dada por

Xˆ ˆt0
t
1 0 00
b(2)
n (t) = dt0 eiωnk t Vnk (t0 ) dt00 eiωki t Vki (t00 ) (7.24)
(i~)2 k 0 0
(q)
Analogamente para o coeficiente bn (t) tem-se que

Xˆ ˆt0 ˆ
t tq−1
1
b(q)
n (t) = dt0 eiωnk t0 Vnk (t0 ) dt1 eiωki t1 Vki (t1 ) . . . dtq eiωki tq Vki (tq ).
(i~)q k
0 0 0

Portanto, com essa abordagem, em princípio conseguimos resolver o problema, pois obtivemos
(q)
expressões fechadas para os coeficientes bn (t) .
Considerando somente as correções até primeira ordem, podemos escrever
ˆt
1 0
bn (t) = δni + eiωni t Vni (t0 )dt0 ,
i~
0

da qual nota-se que os cálculos em primeira ordem são confiáveis se |bn (t)|  1 com n 6= i. Se
essa condição for violada, os resultados obtidos se tornam inconsistentes.

7.3.1 Função de onda


Agora será interessante recuperarmos a forma funcional da função de onda o ket |ψ(t)i.
Para isso substitui-se os coeficientes (7.20), (7.22) e (7.24) na expressão (7.17), o que resulta na
seguinte expressão
ˆt 2 Xˆ
t ˆt0
λ 0 λ 0 00
bn (t) = δni + eiωni t Vni (t0 )dt0 + dt0 eiωnk t Vnk (t0 ) dt00 eiωki t Vki (t00 )+· · · (7.25)
i~ (i~)2 k
0 0 0

Substituindo (7.25) em (7.13) e o resultado em (7.6), obtém-se

X e−iEn t/~ ˆ
t
0
|ψ(t)i = e−iEi t/~ |ϕi i + eiωni t Wni (t0 )dt0 |ϕn i +
n
i~
0

X e−iEn t/~ ˆ ˆt0


t
t0 00
dt0 eiωnk Wnk (t0 ) dt00 eiωki t Wki (t00 ) |ϕn i + · · · (7.26)
n,k
(i~)2
0 0

Prof. Salviano A. Leão 172


7.4. Probabilidade de transição

Aqui trocamos W (t) = λV (t).


Esta equação ainda pode ser reescrita em uma forma mais compacta, como

ˆt

δn,i + 1 0
X
−iEn t/~
|ψ(t)i = e eiωni t Wni (t0 )dt0 +
n
i~
0
ˆt ˆt0

X 1 0 00
dt0 eiωnk t Wnk (t0 ) dt00 eiωki t Wki (t00 ) + · · ·  |ϕn i (7.27)
k
(i~)2
0 0

a qual tem uma forma similar a série de Dyson. Formalmente, a série Dyson é a solução para
a equação de Schrödinger para os elementos da matriz do operador de evolução temporal na
representação de interação, como veremos.

7.4 Probabilidade de transição


Define-se a probabilidade de transição, ou a probabilidade de que o sistema no instante inicial
(t = 0) estivesse no estado |ψ(t = 0)i = |ϕi i e após uma evolução temporal seja encontrado no
instante t no estado final |ψ(t)i = |ϕf i o qual é diferente daquele do instante inicial, como

Pif (t) = |hϕf | ψ(t)i|2 = |Cf (t)|2 = |bf (t)|2 (7.28)

na qual
(0) (1) (2)
bf (t) = bf (t) + λbf (t) + λ2 bf (t) + · · · (7.29)

Agora então será considerado que os estados iniciais |ϕi i e finais |ϕf i são diferentes e que eles são
autoestados de H0 . Dessa forma está-se tratando somente com a transição, entre dois estados
estacionários distintos de H0 , induzida pela perturbação W (t) = λV (t). Considerando ainda
somente as correções em primeira ordem, pode-se escrever

(1)
Pif (t) = λ2 |bf (t)|2 , (7.30)

usando a expressão (7.22) e o fato de que W (t) = λV (t) temos


(7.1)
ˆ
t 2

1 iωf i t0 0 0

Pif (t) = 2 e Wf i (t )dt (7.31)
~
0

Considere uma função W̃if (t0 ), a qual é zero para t0 < 0 e para t0 > t, e igual a Wif (t0 )
no intervalo 0 ≤ t0 ≤ t, conforme ilustrado na figura 7.1, ou seja, estamos usando a chamada
aproximação súbita. A função W̃if (t0 ) é o elemento de matriz da perturbação “vista/sentida”
pelo sistema entre os instantes t = 0 e o instante t em que é realizada a medição, quando tenta-se
inferir o estado em que o sistema se encontra. O resultado (7.31) mostra que a probabilidade
de transição Pif (t) é proporcional ao módulo ao quadrado da transformada de Fourier da

Prof. Salviano A. Leão 173


7.4. Probabilidade de transição

W̃if (t0 )

t0
0 t

Figura 7.1: Representação da variação da função W̃if (t0 ) com relação a t0 . Note que W̃if (t0 ) coincide
com Wif (t0 ) no intervalo 0 ≤ t0 ≤ t, e vai a zero fora desse intervalo. É a transformada de Fourier de
W̃if (t0 ) que entra na probabilidade de transição Pif (t) de mais baixa ordem.

perturbação realmente “vista/sentida” pelo sistema W̃if (t0 ). Essa transformada de Fourier é
calculada na frequência angular de Bohr associada com a transição em consideração.
A seguir, será considerado o caso de um oscilador harmônico unidimensional que encontra-se
no estado fundamental |0i do hamiltoniano não perturbado H0 no instante t = −∞. Considere
que a perturbação
2 /τ 2
V (t) = −eEXe−t , (7.32)

atua sobre o sistema no intervalo de tempo t = −∞ até t = +∞. Qual é a probabilidade de


que o oscilador esteja no estado |ni no instante t = +∞? Para n 6= 0, temos que

ˆ+∞
1 2 2
bn (t = ∞) = (−eE)einωt hn|X|0i e−t /τ dt,
i~
−∞

e desde que
 1/2
~
X= (a + a† ).
2mω
Dá relação acima, é óbvio que somente o termo b1 (t = ∞) 6= 0, pois a† |0i = |1i. Portanto,
pode-se escrever
 1/2 ˆ+∞  1/2 √
ieE ~ −t2 /τ 2 iωt ieE ~ 2 2
b1 (t = ∞) = e e dt = πτ 2 e−ω τ /4 .
~ 2mω ~ 2mω
−∞

Logo a probabilidade de transição de 0 → 1, ou seja, P0→1 é

e2 E 2 πτ 2 −ω2 τ 2 /4
P0→1 = |b1 (t = ∞)|2 = e . (7.33)
2m~ω
Prof. Salviano A. Leão 174
7.5. Perturbação súbita

7.5 Perturbação súbita


Considere um sistema cujo hamiltoniano muda abruptamente durante um pequeno intervalo
de tempo ε. Qual é a mudança no vetor de estado quando ε > 0? Pode-se encontrar a resposta
sem recorrer à teoria da perturbação. Assumindo que a mudança ocorreu em torno de t = 0, ao
integrar a equação de Schrödinger entre t = −ε/2 e t = +ε/2, obtemos
ˆ
+ε/2
1
|ψ(ε/2)i − |ψ(−ε/2)i = H(t0 ) |ψ(t0 )i dt0 . (7.34)
i~
−ε/2

Desde que o integrando do lado direito é finito, a integral é da ordem de ε. No limite em que
ε → 0, obtém-se que |ψ(ε/2)i = |ψ(−ε/2)i, ou seja,

|ψantes i = |ψdepois i . (7.35)

Uma mudança instantânea em H não produz mudanças instantâneas no vetor de estado |ψi.
Agora o limite ε → 0 não é físico. A utilidade do resultado acima reside no fato de que é uma
excelente aproximação se H mudar durante um curto intervalo de tempo que é muito pequeno
em comparação com a escala de tempo natural do sistema. Este último pode ser estimado
semiclassicamente. Para o presente, vamos considerar o caso de um oscilador ao qual é aplicada
a perturbação Eq. (7.32). É claro que qualquer que seja a escala de tempo deste sistema,
a mudança no vetor de estado |ψi deve desaparecer quando τ , a largura do pulso gaussiano,
desaparecer. Isto significa, em particular, que o sistema inicialmente no estado fundamental
deve permanecer lá após o pulso, ou seja, a probabilidade de transição 0 → 1 deve desaparecer.
Sendo este um resultado exato, esperamos que se a probabilidade de transição for calculada de
forma perturbativa, ela deve desaparecer para qualquer ordem dada. (Isto é o mesmo que dizer
que, se uma função analítica se desvanece de forma idêntica, o mesmo acontece com todo termo
em sua expansão de Taylor.) Voltando à probabilidade de primeira ordem para 0 → 1 na Eq.
(7.32), vemos que, de fato, ela desaparece à medida que tende a zero.
Um problema mais realista, em que ε é fixo, envolve um elétron 1s ligado a um núcleo de
carga Z que sofre um decaimento β emitindo um elétron relativístico e mudando sua carga para
(Z + 1). O tempo que o elétron emitido leva para sair da camada n = 1 é

τ ' a0 /Zc, (7.36)

enquanto o tempo característico para o elétron 1s é


a0

tamanho do estado Z a0
T ' −
' = 2 (7.37)
velocidade do e Zαc Z αc
tal que
τ
= Zα (7.38)
T
Para Z pequeno, pode-se aplicar uma aproximação súbita e concluir que o estado do elétron
atômico é o mesmo imediatamente antes e após o decaimento β. De fato, esse estado não é um
autoestado da carga (Z + 1) do íon, mas em vez disso, uma superposição de tais estados.

Prof. Salviano A. Leão 175


7.6. Perturbação adiabática

7.6 Perturbação adiabática


Agora será considerado um sistema cujo hamiltoniano H(t) muda muito lentamente com o
tempo, passando de H(0) para H(τ ) em um dado instante de tempo τ . Se o sistema iniciar
em t = 0 em um autoestado |n(0)i de H(0), onde ele irá terminará no tempo τ ? O teorema
adiabático afirma que, se a taxa de mudança de H for lenta o suficiente, o sistema terminará no
autoestado correspondente |n(τ )i de Н(τ ). Em vez de derivar o teorema e a definição precisa
de “lento o suficiente”, serão considerados alguns exemplos ilustrativos. Na mecânica quântica,
a aproximação adiabática é expresso na forma de um teorema, conhecido como “Teorema
adiabático” [16, Capítulo 10, pág. 271]. Considere que o Hamiltoniano mude gradualmente de
um determinada forma inicial H(0) para certa forma final H(τ ). O teorema adiabático afirma
que se, inicialmente, a partícula está no n-ésimo autoestado de H(0), ela será levada (por meio
da equação de Schrödinger) ao n-ésimo autoestado de H(τ ). (Considere que o espectro seja
discreto e não degenerado no decorrer da transição de H(0) a H(τ ), e que, portanto, não exista
ambiguidade sobre a ordenação dos estados; essas condições podem ser suavizadas em função de
um procedimento apropriado para o “acompanhamento”" das autofunções, mas não será tratado
aqui.)
Por exemplo, considere uma partícula no estado fundamental de um poço quântico quadrático
infinito de comprimento L(0). Para esse caso a sua função de onda é dada por
s  
2 π
ψi (x) = sen x .
L(0) L(0)
Se sua parede da direita iniciar-se a mover com velocidade constante para direita, para um
comprimento L(τ ), o teorema adiabático dirá que a partícula acabará no estado fundamental
do poço quântico quadrático infinito de comprimento L(τ ), cuja função de onda é dada por
s  
2 π
ψi (x) = sen x
L(τ ) L(τ )
a menos de um fator de fase. Note que, diferentemente do caso da teoria de perturbação
independente do tempo, aqui estamos lidando com uma grande mudança no hamiltoniano, pois
o poço pode estar saindo de um comprimento ` para 2`. Nesse caso, deve-se garantir somente
que a mudança ocorra lentamente. Observe que a energia do sistema não é conservada: pois
quem move a parede é que estará extraindo energia do sistema. Em contrapartida, se a expansão
do poço for abrupta (súbita) o estado resultante ainda será ψi (x), o qual é dado por uma
combinação linear dos autoestados do novo hamiltoniano.
Se o poço se expandir lentamente para um comprimento L(τ ), o teorema nos diz que uma
partícula que estava no n-ésimo estado do opço de comprimento L(0) agora estará no n-ésimo
estado do poço de comprimento L(τ ). Mas o que significa o termo “lentamente”?
Existem duas maneiras de estimar isso. O primeiro é um método semiclássico e é o seguinte.
O momento da partícula é da ordem (a menos de fatores da ordem da unidade como π, n, etc.)
~
p' (7.39)
L
Prof. Salviano A. Leão 176
7.6. Perturbação adiabática

e o temos gasto para realizar uma oscilação completa é da ordem de


v mL mL2
T ' = ' (7.40)
L p ~
Pode-se dizer que a expansão ou contração é lenta se a fração de mudança no comprimento do
poço por ciclo for muito menor do que a unidade
|∆L|por ciclo |dL/dt| mL2 /~

mL dL
' =  1. (7.41)
L L ~ dt
Essa expressão também pode ser reescrita como
vparedes
 1. (7.42)
vpartícula
A segunda aproximação é menos intuitiva e ela estima T como
1
T ' (7.43)
ωmin
na qual ωmin é a menor frequência das transições entre um estado inicial i e qualquer estado
final acessível f . Ela é menor do que
(0) (0)
Ef − Ei
ωf i = . (7.44)
~
Nesse caso, desde que
n2 ~2 π 2
En(0) = , (7.45)
2mL2
as diferenças de energia são da ordem de ~2 /mL2 e

1 mL2
T ' ' (7.46)
ωmin ~
a qual coincide com a eq. (7.40). Esse resultado é até certo modo esperado, pois também
podemos reescrever o T da eq. (7.40) da seguinte forma

mL2 1 1
T ' ' (0) ∼ (7.47)
~ Ei /~ ωi
(0)
Portanto, T na eq. (7.40) também é dado por ∼ ~/Ei , enquanto T na eq. (7.46) é ∼
(0) (0)
~/|Ej − Ei |min . Desde que os níveis de energia de um sistema quântico são todos da mesma
ordem de magnitude (pode-se dizer que são da ordem do Rydberg ou ~ω), as energias e as
diferenças de energia são da mesma ordem de magnitude e as duas estimativas para T são
equivalentes, a não ser que os níveis de energia estejam muito proximamente degenerados. Nesse
caso, ele é da ordem de T ∼ 1/ωmin o que é verdadeiro, para expor a instabilidade de sistemas
degenerados ou proximamente degenerados. A seguir, para ilustrar apresentamos um exemplo
dessa situação.
Considere mais um exemplo do teorema adiabático, um oscilador submetido a perturbação
2 /τ 2
V (t) = −eEXe−t (7.48)

Prof. Salviano A. Leão 177


7.6. Perturbação adiabática

entre os instantes −∞ ≤ t ≤ ∞. Espera-se que se τ , o qual mede o tempo que V (t) leva para ir
de 0 até seu valor máximo, tender a infinito, a mudança no sistema será adiabática. portanto,
se um sistema inicia no estado fundamental de H(−∞) = H0 em t = −∞, ele irá terminar
no estado fundamental de H(∞) = H(−∞) = H0 . A expressão em primeira ordem (7.46),
para P0→1 conforme seu valor esperado e desaparece exponencialmente quando ωτ → ∞. A
expressão obtida nos diz que para valores de τ grandes isso significa que:

ωτ  1, τ  1/ω (7.49)

Isso é o que se espera de uma estimativa semiclássica ou estimando que T ∼ 1/ωmin e a condição
τ  T.
O teorema adiabático sugere um modo de recuperarmos os resultados da teoria de perturbação
independente do tempo a partir da teoria dependente do tempo. Considere um hamiltoniano
H(t) o qual muda continuamente de H0 em t = −∞ para H0 + W em t = 0:

H(t) = H0 + W et/τ , −∞ ≤ t ≤ 0 (7.50)

Quando τ , aumenta o tempo na exponencial, vai para infinito, o teorema adiabático assegura

que um autoestado n(0) de H0 em t = −∞ ira evoluir para os autoestados |ni de H no instante
t = 0. Se calcularmos o estado em t = 0 para uma dada ordem a teoria perturbação dependente
do tempo e tomar τ → ∞, iremos obter uma expressão independente do tempo para o estado
|ni daquela ordem. Para a primeira ordem, temos que a projeção do estado em t = 0 ao longo

do m(0) com m 6= n é

ˆ0
1
bm (t) = hm(0) |W |n(0) i et/τ eiωmn t dt
i~
−∞

1 hm(0) |W |n(0) i
= (7.51)
i~ 1/τ + iωmn

Se tomarmos o limite em que τ → ∞, obtemos um resultado familiar


hm(0) |W |n(0) i
m(0) n =

(0) (0)
(7.52)
En − Em
De fato, o τ → ∞ é trocado por um valor grande de τ . A equação (7.51) nos diz que um valor
grande de τ significa que: ele é definido por

|1/τ |  |ωmin |

ou
τ  1/ωmin . (7.53)

Portanto viu-se que T ' 1/ωmin é de fato uma medição confiável da escala de tempo natural do
sistema. Em particular, se o sistema for degenerado (ou próximo disso), T → ∞ e ele torna-se
impossível, na prática, para mudar o estado do sistema adiabaticamente.

Prof. Salviano A. Leão 178


7.7. Representação de Schrödinger

Vamos encerrar a discussão sobre a aproximação adiabática, observando sua similaridade


com a aproximação WKB. A primeiro nos diz que se o hamiltoniano muda com o tempo de

H0 para H0 + W , o autoestado n(0) evolui suavemente para sua contrapartida o |ni no limite
em que τ /T → ∞, em que τ é a duração na qual o hamiltoniano muda e T é a escala natural
de tempo do sistema. Este último nos diz que se o potencial muda no espaço de V0 para V1 ,
p
uma onda plana de momentum p0 = 2m(E − V0 ) evolui suavemente para uma onda plana de
p
momentum p1 = 2m(E − V1 ) no limite em que L/λ → ∞, no qual L é o comprimento sobre
o qual o potencial V muda e λ = 2π~/p é a escala de comprimento natural do sistema.

7.7 Representação de Schrödinger


Na representação de Schrödinger os estados evoluem no tempo de acordo com

|ψS (t)i = US (t, t0 ) |ψS (t0 )i , (7.54)

na qual
US (t, t0 ) = e−iH(t−t0 )/~ (7.55)
é o operador evolução temporal na representação de Schrödinger, quando o Hamiltoniano H
do sistema é independente do tempo. Mas quando ele depende do tempo o operador evolução
temporal satisfaz a seguinte equação

i~ U (t, t0 ) = H(t)U (t, t0 ). (7.56)
∂t
Na representação de Schrödinger o valor esperado do operador OS , hOS i = hψS (t)|OS |ψS (t)i é
dado por
d 1 ∂OS
hOS i = h[OS , H(t)]i + h i (7.57)
dt i~ ∂t
no caso em que OS não depende explicitamente do tempo temos
d 1
hOS i = h[OS , H(t)]i (7.58)
dt i~

7.8 Representação de Heisenberg


Na representação de Heisenberg, os estados são constantes no tempo, assim

|ψH i = US† (t, t0 ) |ψS (t)i = US† (t, t0 )US (t, t0 ) |ψS (t0 )i = |ψS (t0 )i (7.59)

Note que US† (t, t0 )US (t, t0 ) = US (t, t0 )US† (t, t0 ) = 1, pois ele é unitário. Naturalmente temos que

|ψS (t)i = US (t, t0 ) |ψH i = US (t, t0 ) |ψS (t0 )i (7.60)

O valor esperado do operador OS (t), pode ser escrito como

hψS (t)|OS (t)|ψS (t)i = hψS (t0 )|US† (t, t0 )OS (t)US (t, t0 )|ψS (t0 )i (7.61)
= hψH |US† (t, t0 )OS (t)US (t, t0 )|ψH i (7.62)

Prof. Salviano A. Leão 179


7.9. Representação de interação

da qual usando o fato de que

hψS (t)|OS (t)|ψS (t)i = hψH |OH (t)|ψH i (7.63)

tiramos que
OH (t) = US† (t, t0 )OS (t)US (t, t0 ) (7.64)
Portanto, vê-se que OH (t) irá depender do tempo, mesmo que o operador OS (t) = OS não
dependa do tempo.
Note então que
   
d d † † d
OH (t) = U (t, t0 ) OS (t)US (t, t0 ) + US (t, t0 ) OS (t) US (t, t0 )+
dt dt S dt
 
† d
US (t, t0 )OS (t) US (t, t0 )
dt
 
1 † † d
= − US (t, t0 )HS (t)OS (t)US (t, t0 ) + US (t, t0 ) OS (t) US (t, t0 )+
i~ dt
1
US† (t, t0 )OS (t) HS (t)US (t, t0 )
i~  
1 † † † d
= − US (t, t0 )HS (t)US (t, t0 )US (t, t0 )OS (t)US (t, t0 ) + US (t, t0 ) OS (t) US (t, t0 )+
i~ dt
1 †
US (t, t0 )OS (t)US (t, t0 )US† (t, t0 )H(t)US (t, t0 )
i~

 
d 1 1 d
OH (t) = − HH (t)OH (t) + OH (t)HH (t) + US† (t, t0 ) OS (t) US (t, t0 )
dt i~ i~ dt
 
1 d
= [OH (t), HH (t)] + OS (t)
i~ dt H

Esta ainda pode ser escrita como,


 
d d
i~ OH (t) = [OH (t), HH (t)] + i~ OS (t) (7.65)
dt dt H

7.9 Representação de interação


Agora estamos prontos para uma representação intermediária, na qual tanto o vetor de estado
quanto os operadores evoluem no tempo. Iremos considerar um sistema físico caracterizado pela
Hamiltoniana H0 (t) e cujo operador evolução temporal U0 (t, t0 ) satisfaz a seguinte equação

i~ U0 (t, t0 ) = H0 (t)U0 (t, t0 ) com U0 (t0 , t0 ) = 1, (7.66)
∂t
Considere que o sistema é perturbado e sua Hamiltoniana torna-se

H(t) = H0 (t) + W (t) (7.67)

Define-se o vetor de estado |ψI (t)i como

|ψI (t)i = U0† (t, t0 ) |ψS (t)i (7.68)

Prof. Salviano A. Leão 180


7.10. Caso especial: Perturbação constante ou senoidal

Temos então que


 
d d † d
|ψI (t)i = U0 (t, t0 ) |ψS (t)i + U0† (t, t0 ) |ψS (t)i
dt dt dt
mas como
d
i~ |ψS (t)i = [H0 (t) + W (t)] |ψS (t)i (7.69)
dt
logo,
 
d 1 † 1
|ψI (t)i = − U0 (t, t0 )H0 (t) |ψS (t)i + U0† (t, t0 ) [H0 (t) + W (t)] |ψS (t)i
dt i~ i~
1 †
= U0 (t, t0 )W (t) |ψS (t)i
i~
1
= U0† (t, t0 )W (t)U0 (t, t0 )U0† (t, t0 ) |ψS (t)i
i~
1
= WI (t) |ψI (t)i
i~
Aqui, introduzimos a seguinte regra de transformação

WI (t) = U0† (t, t0 )W (t)U0 (t, t0 ). (7.70)

Portanto, na representação de interação, a evolução temporal do vetor de estado é dada pela


seguinte equação
d 1
|ψI (t)i = WI (t) |ψI (t)i , (7.71)
dt i~
cuja solução formal fornece a evolução temporal do vetor de estado |ψI (t)i
A evolução temporal do vetor de estado |ψI (t)i é
ˆt
1
|ψI (t)i = |ψI (t0 )i + dt0 WI (t0 ) |ψI (t0 )i (7.72)
i~
t0

Uma série interativa pode ser obtida, substituindo em |ψI (t0 )i o resultado acima, assim

ˆt ˆt0
 
1 1
|ψI (t)i = |ψI (t0 )i + dt WI (t0 ) |ψI (t0 )i + dt00 WI (t00 ) |ψI (t00 )i (7.73)
i~ i~
t0 t0

Interagindo assim sucessivamente obtemos a seguinte série

ˆt ˆt ˆt0
 
1 1
|ψI (t)i = 1 + dt0 WI (t0 ) + dt0 WI (t0 ) dt00 WI (t00 ) + · · ·  |ψI (t0 )i (7.74)
i~ (i~)2
t0 t0 t0

7.10 Caso especial: Perturbação constante ou senoidal


Considere que
V (t) = V cos(ωt) ou V (t) = V sen(ωt) (7.75)

em que V é um observável independente do tempo e ω uma frequência angular constante.

Prof. Salviano A. Leão 181


7.10. Caso especial: Perturbação constante ou senoidal

Para o caso em que V (t) = V cos(ωt), temos

Vf i iωt
Vf i (t) = Vf i cos(ωt) = (e + e−iωt ) (7.76)
2
logo

ˆt
Vf i 0 0
b(1)
n (t) = dt0 (ei(ωni +ω)t + ei(ωni −ω)t )
2i~
0
Vf i 1 − ei(ωni +ω)t 1 − ei(ωni −ω)t
 
=− + (7.77)
2~ ωni + ω ωni − ω

e de acordo com (7.31), e lembrando que W (t) = λV (t) podemos escrever


2
|Wf i |2 1 − ei(ωf i +ω)t 1 − ei(ωf i −ω)t

Pif (t) = + . (7.78)
4~2 ωf i + ω ωf i − ω

Note que V (t) = V cos(ωt), torna-se uma constante independente do tempo no caso em que
ω = 0. Nesse caso, a probabilidade de transição Pif (t) induzida por uma perturbação constante
é dada por

|Wf i |2
Pif (t) = |1 − eiωf i t |2
~2 ωf2i
|Wf i |2
= 2 2
|(1 − cos(ωf i t)) − i sen(ωf i t)|2
~ ωf i
|Wf i |2 
= 2 2 (1 − cos(ωf i t))2 + sen2 (ωf i t)

~ ωf i
|Wf i |2 |Wf i |2
= [1 − 2 cos(ω fi t) + 1] = 2 [1 − cos(ωf i t)]
~2 ωf2i ~2 ωf2i
2
|Wf i |2 4sen2 (ωf i t/2) |Wf i |2 sen(ωf i t/2)

= =
~2 ωf2i ~2 ωf i /2

com isso temos 2


|Wf i |2 sen(ωf i t/2)

Pif (t) = (7.79)
~2 ωf i /2
Portanto, podemos escrever

|Wf i |2
Pif (t) = F (t, ωf i ), (7.80)
~2
em que
 2
sen(ωf i t/2)
F (t, ωf i ) = (7.81)
ωf i /2
Para V (t) = V sen(ωt), o elemento de matriz Vf i (t) é dado por

Vf i iωt
Vf i (t) = Vf i sen(ωt) = (e − e−iωt ) (7.82)
2i
Prof. Salviano A. Leão 182
7.11. Perturbação senoidal acoplando dois estados discretos: o fenômeno da ressonância

logo
ˆt
Vf i 0 0
b(1)
n (t) =− dt0 (ei(ωni +ω)t − ei(ωni −ω)t )
2~
0
Vf i 1 − ei(ωni +ω)t 1 − ei(ωni −ω)t
 
= − (7.83)
2i~ ωni + ω ωni − ω

Portanto, de acordo com (7.31), e lembrando que W (t) = λV (t) temos

|Wf i |2 1 − ei(ωf i +ω)t 1 − ei(ωf i −ω)t 2



2 (1)
Pif (t) = λ |bf (t)|2 = ωf i + ω − ωf i − ω .
(7.84)
4~2

Para compreendermos o conteúdo físico das equações (7.80) e (7.84), analisaremos dois casos:

1. Probabilidade: os estados |ϕi i e |ϕf i são dois níveis discretos. Neste caso Pif (t; ω) ou
Pif (t) representa realmente uma probabilidade de transição a qual pode ser medida.

2. Densidade de Probabilidade: o estado |ϕi i é um nível discreto e |ϕf i pertence a


um contínuo de estado finais. Neste caso estamos tratando com uma densidade de
probabilidade (a quantidade física realmente mensurável envolve uma somatória sobre
todos os estados finais).

7.11 Perturbação senoidal acoplando dois estados discre-


tos: o fenômeno da ressonância
Aqui surgirá o fenômeno de ressonância, evidenciando a natureza ressonante da probabilidade
de transição.
Considere que o tempo é fixo em Pif (t), assim

Pif (t; ω) = Pif (ω) (7.85)

Vimos que a probabilidade de transição para uma perturbação senoidal pode ser escrita
como
|Wf i |2
Pif (t; ω) = |A+ (t, ω) + A− (t, ω)|2 (7.86)
4~2
na qual
1 − ei(ωf i ±ω)t
A± (t, ω) = (7.87)
ωf i ± ω
Note que

1 − ei(ωf i ±ω)t
A± (t, ω) =
ωf i ± ω
 
i(ωf i ±ω)t/2 sen[(ωf i ± ω)t/2]
= −ie
(ωf i ± ω)/2
Agora vamos analisar como é o comportamento desta função.

Prof. Salviano A. Leão 183


7.11. Perturbação senoidal acoplando dois estados discretos: o fenômeno da ressonância

Note que para ω ' ωf i , temos que



0 ≤ |A (t, ω)| ≤ t
+
ω ' ωf i =⇒ (7.88)
|A (t, ω)| =t

logo Pif (t; ωf i ) é máximo.


Já para ω ' −ωf i , temos que

0 ≤ |A (t, ω)| ≤ t

ω ' −ωf i =⇒ (7.89)
|A (t, ω)| =t
+

logo nesse caso Pif (t; −ωf i ) também é máximo.


Portanto, irá ocorrer um fenômeno da ressonância quando a frequência angular ω do potencial
perturbador coincidir com a frequência angular de Bohr ωf i = (Ef − Ei )/~ associada aos estados
|ϕi i e |ϕf i. Se ω > 0 então as duas condições de ressonância ocorrem para ωf i > 0 e ωf i < 0
conforme ilustra a figura abaixo.

Ef Ei
|ϕf i |ϕi i

ω ≈ ωf i > 0
ω ≈ −ωf i < 0
Ei Ef
|ϕi i |ϕf i

Absorção A− (t, ω) Emissão A+ (t, ω)


Figura 7.2: As figuras ilustram as disposições relativas das energias Ei e Ef , associadas aso estados
|ϕi i e |ϕf i. No processo de absorção, temos que Ei < Ef e ocorre a transição |ϕi i → |ϕf i, via a
absorção de um fóton de energia ~ω = Ef − Ei . Já no processo de emissão temos que Ei > Ef e ocorre
a transição |ϕi i → |ϕf i, via a emissão de um fóton de energia ~ω = Ei − Ef .

Portanto é natural chamarmos

• A− (t, ω) −→ Termo ressonante

• A+ (t, ω) −→ Termo anti-ressonante

Consideremos agora o caso em que

|ω − ωf i |  |ωf i | ou seja ω ' ωf i (7.90)

Note das expressões para A± (t, ω) que

A+ (t, ω) = A− (t, −ω) (7.91)

logo as contribuições de A± (t, ω) são simétricas em relação à origem.

Prof. Salviano A. Leão 184


7.11. Perturbação senoidal acoplando dois estados discretos: o fenômeno da ressonância

Pif (t,ω)

A+ (t, ω) A− (t, ω)

0.8

∆ω ∆ω
0.6

0.4

0.2

−ωf i 0 ωf i
ω
Figura 7.3: Variação, com relação a ω da probabilidade de transição de primeira ordem Pif (t; ω),
associada com uma perturbação senoidal de frequência angular ω; com t fixo. Quando ω ' ωf i , surge
uma ressonância cuja intensidade é proporcional a t2 e cuja largura é inversamente proporcional a t.

Temos do gráfico que


2|ωf i |  ∆ω (7.92)
Temos então que para ω > 0, a contribuição do termo anti-ressonante A+ (t, ω) é desprezível
para a probabilidade de transição Pif (t; ω), portanto para esse caso podemos escrever
|Wf i |2
Pif (t) = F (t; ω − ωf i ), (7.93)
4~2
na qual  2
sen[(ω − ωf i )t/2]
F (t; ω − ωf i ) = (7.94)
(ω − ωf i )/2
Esta probabilidade de transição apresenta um máximo em ω = ωf i , quando ela tem o valor
|Wf i |2 t2
Pif (t) = (7.95)
4~2
Como dois zeros consecutivos da função sen(θ) ocorrem num intervalo de ∆θ = 2π, diante disso,
observe que os primeiros zeros de Pif (t) ocorrem em
ω − ωf i 2π 4π
| |= =⇒ ∆ω = (7.96)
2 t t
Note que para ω > 0, a probabilidade de transição varia de acordo com
|Wf i |2 t2
0 ≤ Pif (t; ω) ≤ (7.97)
~2 (ω − ωf i )2
e essa variação da probabilidade de transição é similar a um padrão de interferência.

Prof. Salviano A. Leão 185


7.11. Perturbação senoidal acoplando dois estados discretos: o fenômeno da ressonância

7.11.1 Relação de incerteza Energia-Tempo e a largura de linha da


ressonância
A largura de linha ou largura da ressonância ∆ω pode ser definida aproximadamente como
a distância entre os dois primeiros zeros da probabilidade de transição Pif (t; ω), ou seja,


∆ω = (7.98)
t

Note que o segundo pico de Pif (t; ω) ocorre quando



(ω − ωf i )t 3π
= , (7.99)
2 2

logo o segundo maior valor da probabilidade de transição será

|Wf i |2 t2
Pif (t; (ω − ωf i )t = 3π = (7.100)
9π 2 ~2

A razão entre o segundo e o primeiro máximo da probabilidade de transição é


(2max)
Pif |Wf i |2 t2 4~2 4
(1max)
= 2 2
· 2 2
= 2 ≈ 0.05 (7.101)
Pif 9π ~ |Wf i | t 9π

Portanto, a probabilidade do segundo máximo é da ordem de 95% menor do que a do primeiro.


Para medirmos a diferença de energia Ef − Ei = ~ωf i de um sistema, aplicamos uma
perturbação senoidal de frequência angular ω, e variamos ela até encontrar a ressonância. Se a
perturbação atua durante um intervalo de tempo t, a incerteza ∆E no valor Ef − Ei será da
ordem de
~
∆E = ~∆ω ' . (7.102)
t
Portanto, o produto t∆E não pode ser menor do que ~. Este resultado assemelha-se à relação
de incerteza energia-tempo, embora aqui t não represente um intervalo de tempo característico
da evolução livre do sistema, mas sim um intervalo imposto externamente.
Note que a condição de ressonância é válida se

2|ωf i |  ∆ω, (7.103)

e usando o fato de que ∆ω ' 4π/t, temos

1 1
t ' (7.104)
|ωf i | ω

Portanto, a probabilidade de transição Pif (t; ω) dada por (7.93), só será válida se a perturbação
senoidal atuar durante um intervalo de tempo t, o qual é grande comparado com 1/ω. O
significado físico de tal condição é:

Prof. Salviano A. Leão 186


7.12. Limites do cálculo de primeira-ordem

Nota
Durante o intervalo de tempo [0, t], a perturbação deve realizar nu-
merosas oscilações para se mostrar ao sistema como uma perturbação
senoidal. Porém, se t for pequeno comparado com 1/ω, a perturbação
não teria tempo para oscilar e seria equivalente a uma perturbação que
varia linearmente no tempo.

Para uma perturbação constante, a condição (7.104) nunca será satisfeita, já que ω = 0.

7.12 Limites do cálculo de primeira-ordem


Na ressonância a probabilidade de transição é

|Wf i |2 t2
Pif (t; ω) = (7.105)
4~2

então em intervalos de tempos o suficientemente longos, ou seja, t → ∞, esta função vai para
infinito, o que é um absurdo, já que uma probabilidade nunca pode ser maior do que um.
Portanto, para a aproximação de primeira ordem ser válida na ressonância, a probabilidade em
(7.105) deve ser menor do que um, isto é,

~
t (7.106)
|Wf i |

7.13 Sistema de dois níveis discretos


Considere um sistema de dois níveis submetido a uma perturbação que varia senoidalmente
com o tempo
O método aproximado só é válido para intervalos de tempos tais que:

~
t
|Wf i |

Então para tempos maiores temos uma possibilidade seria: Determinar uma solução em
mais altas ordens perturbativas, ou seja,

(1) (2)
Pif (t; ω) = |λbf (t) + λ2 bf (t) + · · · |2 .

Entretanto tal procedimento implica em um cálculo extremamente longo e cansativo.


Portanto será usada uma forma alternativa mais rápida e simples para resolver o problema.
Neste procedimento, ajustamos o método aproximado a natureza ressonante do problema

Prof. Salviano A. Leão 187


7.13. Sistema de dois níveis discretos

7.13.1 Condição de ressonância


A condição de ressonância ω ' ω21 implica que somente os dois estado discretos |ϕ1 i e
|ϕ2 i estão efetivamente acoplados pela perturbação W (t). Desde que, inicialmente o sistema
encontra-se no estado inicial |ϕ1 i então b1 (0) = 1. Portanto a amplitude de probabilidade b2 (t)
de encontrar o sistema em um instante t qualquer no estado |ϕ2 i é apreciável.

|ψ2 i E2
|ϕ2 i E2



W (t)
|ϕ1 i E1

|ψ1 i E1

Temos então que:


H(t) = H0 + W (t),
com
H0 |ϕi i = Ei |ϕi i , i = 1, 2 e |ψ(0)i = |ϕ1 i
e com a probabilidade é dada por

P12 (t; ω) = | hϕ1 | ψ(t)i |2 .

Agora o Hamiltoniano do sistema pode ser reescrito como

H = E1 |ϕ1 ihϕ1 | + E2 |ϕ2 ihϕ2 | + |ϕ1 i W12 hϕ2 | + |ϕ2 i W21 hϕ1 |

ou na forma matricial como !


E1 W12
H=
W21 E2

mas como W12 = W21 = W e−iφ . Esse Hamiltoniano ainda pode ser reescrito na seguinte forma
mais adequada ! !
1 0 ∆ W12
H=E· +
0 1 W21 −∆
com
E1 + E2 E1 − E2
E= e ∆=
2 2
Então agora pode-se escrever a matriz hamiltoniana H como

H = E1 + ∆ · K
na qual 1 é a matriz identidade e a matriz K é dada por
!
1 e−iφ tg(2θ)
K=
eiφ tg(2θ) −1

Prof. Salviano A. Leão 188


7.13. Sistema de dois níveis discretos

para a qual foi introduzida a notação

W
tg(2θ) =
∆E
com
0 ≤ θ ≤ π/2.

Para resolver o problema deve-se diagonalizar a matriz K. Inicialmente obtém-se seu


autovalores resolvendo a equação secular

det[K − λ1] = 0 =⇒ −(1 − λ2 ) − tg2 (2θ) = 0,

logo as raízes são λ± = ± sec(2θ) e com isso as energias são dadas por

E1 = E − ∆ sec(2θ) e E2 = E + ∆ sec(2θ)

A expressões da energia em função dos parâmetros iniciais são


1 1p
E1 = (E1 + E2 ) − (E1 + E2 )2 + 4|W12 |2
2 2
e
1 1p
E2 = (E1 + E2 ) + (E1 + E2 )2 + 4|W12 |2
2 2
Agora é necessário determinar os autoestados do Hamiltoniano, e para tal temos que

H |ψi i = Ei |ψi i

para os quais, a diagonalização da matriz K e consequentemente a matriz H, fornecem

|ψ1 i = cos(θ)e−iφ/2 |ϕ1 i + sen(θ)eiφ/2 |ϕ2 i (7.107)


|ψ2 i = − sen(θ)e−iφ/2 |ϕ1 i + cos(θ)eiφ/2 |ϕ2 i (7.108)

Note que desde que os vetores de estados |ϕi i são ortonormais, ou seja

hϕi | ϕj i = δi,j

então os vetores de estado |ψi i também são ortonormais, ou seja,

hψi | ψj i = δi,j

Todos os efeitos interessantes, surgem do fato de que a perturbação W possui elementos de



matriz não-diagonais W12 = W21 (se W12 = 0, os autovetores de H são os mesmos de H0 , e os
novos autovalores serão simplesmente E1 = E1 e E2 = E2 ).

Acoplamento Fraco: |W |/|∆  1, nesse caso temos θ ≈ 0 e que

|ψ1 i → |ϕ1 i e |ψ2 i → |ϕ2 i

Prof. Salviano A. Leão 189


7.13. Sistema de dois níveis discretos

Acoplamento Forte: |W |/|∆  1, nesse caso temos θ → π/4 e os estados da base {|ψ1 i , |ψ2 i}
tornam-se indistinguíveis.
Agora o autoestados do sistema são combinações simétricas e anti-simétricas dos estados
da base {|ϕ1 i , |ϕ2 i} ou seja:

1
|ψ1 i = √ (|ϕ1 i − |ϕ2 i)
2
1
|ψ2 i = √ (|ϕ1 i + |ϕ2 i)
2

O sinal do parâmetro ∆ indica quem é simétrico e quem é anti-simétrico. Pois para ∆ < 0,
temos que θ → −π/4, enquanto que para ∆ > 0, temos que θ → +π/4.

E −E

E1
E1

2|W | ∆

E2
E2

7.13.2 Evolução temporal


O operador evolução temporal do sistema é dado por

U (t, t0 ) = e−iH(t−t0 )/~

mas como
H(t) = |ψ1 i E1 hψ1 | + |ψ2 i E2 hψ2 |

segue imediatamente que

U (t, t0 ) = |ψ1 i e−iω1 (t−t0 ) hψ1 | + |ψ2 i e−iω2 (t−t0 ) hψ2 |

na qual
Ei
ωi = .
~
Desde que no instante t = 0, temos que

|ψ(0)i = |ϕ1 i

Prof. Salviano A. Leão 190


7.13. Sistema de dois níveis discretos

a probabilidade de em um instante t qualquer, o sistema se encontrar no estado |ϕ2 i é

P21 (t; ω) = | hϕ2 | ψ(t)i |2 = | hϕ2 |U (t, 0)|ϕ1 i |2

Mas como

hϕ2 |U (t, t0 )|ϕ1 i = hϕ2 | ψ1 i e−iω1 (t−t0 ) hψ1 | ϕ1 i +


hϕ2 | ψ2 i e−iω2 (t−t0 ) hψ2 | ϕ1 i

e como

hϕ1 | ψ2 i = − sen(θ)e−iφ/2 hϕ1 | ψ1 i = cos(θ)e−iφ/2


hϕ2 | ψ2 i = cos(θ)eiφ/2 hϕ2 | ψ1 i = sen(θ)eiφ/2

segue então que

hϕ2 |U (t, t0 )|ϕ1 i = −eiφ cos(θ) sen(θ)e−iω1 (t−t0 ) + eiφ cos(θ) sen(θ)e−iω2 (t−t0 )
= eiφ cos(θ) sen(θ) e−iω2 (t−t0 ) − e−iω1 (t−t0 )
 

Mas como,

e−iα − e−iβ = e−iα 1 − e−i(β−α)




= e−iα e−i(β−α)/2 ei(β−α)/2 − e−i(β−α)/2



 
−i(α+β)/2 β−α
= 2i e sen
2
 
−i(α+β)/2 α−β
= −2i e sen
2
Segue então que
 
ω2 − ω1

hϕ2 |U (t, t0 )|ϕ1 i = ie sen(2θ) sen (t − t0 ) e−i(ω1 +ω2 )(t−t0 )/2 (7.109)
2
Introduzindo a frequência de Rabi ΩR , como
ω2 − ω1 E2 − E 1
ΩR = =
2 2~
a qual ainda pode ser escrita como
1p 2
ΩR = ∆ + |W12 |2
~
e notando que
|W12 |2
sen2 (2θ) =
∆2 + |W12 |2
podemos escrever que:

hϕ2 |U (t, t0 )|ϕ1 i = ieiφ sen(2θ) sen (ΩR (t − t0 )) e−i(ω1 +ω2 )(t−t0 )/2 (7.110)

portanto a probabilidade é dada por


|W12 |2
P21 (t; ω) = 2 2
sen2 (ΩR t)
∆ + |W12 |

Prof. Salviano A. Leão 191


7.13. Sistema de dois níveis discretos

P21 (t; ω)

t
T 2T 3T 4T 5T 6T

7.13.3 Aproximação secular


Nesta aproximação voltamos nossa atenção as equações acopladas
dbn (t) X iωnk t
i~ = e Wnk (t)bk (t)
dt k

levando em conta que a perturbação é senoidal pode-se escrever


1
|Wif | eiωt − e−iωt

Wif (t) = |Wif | sen(ωt) =
2i
Como estamos tratando com um sistema de dois níveis, então temos
d 1  iωt
e − e−iωt |W11 |b1 (t)+

i~ b1 (t) =
dt 2i
− e−i(ω+ω12 )t |W12 |b2 (t)
 i(ω−ω12 )t 
e
d 1  i(ω+ω21 )t
− e−i(ω−ω21 )t |W21 |b1 (t)+

i~ b2 (t) = e
dt 2i
e − e−iωt |W22 |b2 (t)
 iωt 

Note que os termos proporcionais a e±i(ω−ω21 )t , oscilam lentamente quando ω ≈ ω21 enquanto os
termos proporcionais a e±iωt e e±i(ω+ω21 )t oscilam muito rapidamente.
Usando a aproximação secular, a qual consiste em negligenciar os termos que oscilam
rapidamente em detrimento daqueles que oscilam lentamente, em virtude disso os termos que
permanecem são chamados de termos “seculares”.
Note ainda que b1 (t) e b2 (t) variam muito pouco com o tempo. Portanto, nessa aproximação
a evolução temporal dos coeficientes b1 (t) e b2 (t) é dada por:
d 1
b1 (t) = − ei(ω−ω12 )t |W12 |b2 (t)
dt 2~
d 1 −i(ω−ω12 )t
b2 (t) = e |W21 |b1 (t)
dt 2~

Prof. Salviano A. Leão 192


7.14. Acoplamento com o contínuo

Esse conjunto de equações é desacoplado ao derivarmos novamente em relação ao tempo


cada equação. Esse procedimento resulta em
d2
 
1 i(ω−ω12 )t d
b1 (t) = − e |W12 | i(ω − ω12 )b2 (t) + b2 (t)
dt2 2~ dt
d2
 
1 −i(ω−ω12 )t d
b2 (t) = e |W21 | −i(ω − ω12 )b1 (t) + b1 (t)
dt2 2~ dt
Substituindo as expressões anteriores para as derivadas primeira nesse conjunto, ele toma a
seguinte forma:
d2 i(ω − ω12 ) i(ω−ω12 )t 1
2
b1 (t) = − e |W12 |b2 (t) − 2 |W12 |2 b1 (t)
dt 2~ 4~
d2 i(ω − ω12 ) −i(ω−ω12 )t 1
2
b2 (t) = − e |W21 |b1 (t) − 2 |W12 |2 b2 (t)
dt 2~ 4~
Usando a condição de ressonância, na qual ω ≈ ω12 , o conjunto de equações acopladas toma
a seguinte forma
d2 1
b1 (t) = − |W12 |2 b1 (t)
dt2 4~2
d2 1
b2 (t) = − |W12 |2 b2 (t)
dt2 4~2
Definindo,
|W12 |
ΩR = ,
2~
então a solução das equações diferenciais acima, com as condições iniciais

b1 (0) = 1 e b2 (0) = 0,

são respectivamente

b1 (t) = cos(ΩR t)
b2 (t) = B sen(ΩR t),

Agora é necessário determinar a constante B.


No regime de ressonância temos que
d 1
b2 (t) = |W21 |b1 (t)
dt 2~
1
BΩR cos(ΩR t) = |W21 | cos(ΩR t)
2~
|W21 |
B= B = 1.
2~ΩR
Portanto a probabilidade de encontrar o sistema no estado |ψ2 i (t) em um dado instante de
t na aproximação secular é dada por

P21 (t; ω = ω12 ) = sen2 (ΩR t).

7.14 Acoplamento com o contínuo

Prof. Salviano A. Leão 193


7.15. Integração sobre um contínuo de estados finais: Densidade de Estados

Estados:

|ϕf i • Estado inicial, discreto: |ϕi i

• Estado final, contínuo: |ϕf i

Energias:
|ϕi i
• Estado inicial, discreto: Ei

• Estado final, contínuo: Ef

Qual é a probabilidade de que no instante t,


encontremos o sistema no estado |ϕf i?

De acordo com os postulados da mecânica quântica | hϕf | ψ(t)i |2 é uma densidade de


probabilidade e devemos integrar, “somar”, as densidades de probabilidade | hϕf | ψ(t)i |2 sobre
um certo grupo de estado finais.

7.15 Integração sobre um contínuo de estados finais: Den-


sidade de Estados
Detector

pf
δΩf
Feixe incidente

W (r) θ
z
0
Alvo

Considere o espalhamento de uma partícula sem spin por um potencial W (r) cujos estados
|ψ(t)i da partícula num instante t, podem ser expandidos sobre os estados |pi de momenta p
bem definidos e energias
p2
E=
2m
e cujas funções de onda ψ(r) são dados por
 3
1
ψ(r) = hr | pi = eip·r/~ .
2π~

Prof. Salviano A. Leão 194


7.16. Caso geral

A densidade de probabilidade associada a uma medida do momentum, em um dado instante


de tempo t é dada por
|hp | ψ(t)i|2 .

Aqui, consideramos que |ψ(t)i é normalizado.


O detector usado no experimento fornece um sinal quando uma partícula é espalhada com
momentum com momentum pf e energia Ef , dada por

p2f
Ef =
2m
Como o detector possuí uma abertura angular δΩf finita, ele seleciona um pequeno espectro
de energia no intervalo Ef ± δEf . Considerando que Df representa o domínio dos estados no
espaço-p definido por estas condições, então a probabilidade de obtermos um sinal do detector é
ˆ
δP(pf , t) = d3 p | hp | ψ(t)i |2
pf ∈Df

Temos que
dp
d3 p = p2 dpdΩ = ρ(E)dEdΩ =⇒ ρ(E) = p2
dE

mas temos ainda que, p = 2mE e que

p2 p
E= =⇒ dE = dp
2m m
Logo
dp m √
ρ(E) = p2 = p2 = mp = m 2mE
dE p
e desta forma, a probabilidade de obtermos um sinal do detector pode ser escrita como
ˆ
δP(pf , t) = ρ(E)dEdΩ | hp | ψ(t)i |2
Ω∈δΩf
E∈δδEf

7.16 Caso geral


Considere um espectro contínuo de H0 , tal que

H0 |αi = Eα |αi com hα | α0 i = δ(α − α0 )

Ao realizarmos uma medida, a probabilidade δ℘(αf , t) de encontrarmos o sistema em um


grupo de estados finais |αf i, caracterizados pelo domínio Df de valores do parâmetro α, centrados
em αf , é dada por ˆ
δ℘(αf , t) = dα| hα | ψ(t)i |2
α∈Df

Mudança de Variáveis

Prof. Salviano A. Leão 195


7.17. Regra de ouro de Fermi

Os estados serão caracterizados

• pelos autovalores de H0 , a energia E.

• pelo conjunto de parâmetros β, os quais são necessários quando H0 , por si só, não constituí
um conjunto completo de observáveis que comutam entre si.

Logo em termos de E e de β temos:

dα = ρ(β, E) dβ dE,

na qual ρ(β, E) é a densidade de estados finais. Portanto,


ˆ
δ℘(αf , t) = dβ dE ρ(β, E)| hβ, E | ψ(t)i |2 (7.111)
β∈δβf
E∈δEf

na qual δβf e δEf são respectivamente os intervalos de valores de β e E definidos pelo domínio
Df .
Aqui,

hψ(t) | ψ(t)i = 1.

d3 p = p2 dpdΩ = ρ(E)dEdΩ

7.17 Regra de ouro de Fermi


Aplicando (7.111) ao caso de uma perturbação senoidal, o resultado só será válido se os
estado finais pertencerem ao espectro contínuo de H0 .
Considerando uma perturbação W constante, temos que a probabilidade de transição é dada
por
2
|Wf,i |2

sen ωf,i t/2
℘if (t) = F (t; ωf,i ) com F (t; ωf,i ) =
~2 ωf,i /2
logo a densidade de probabilidade | hβ, E | ψ(t)i |2 em primeira ordem em W é
 
2 1 2 E − Ei
| hβ, E | ψ(t)i | = 2 | hβ, E|W |ϕi i | F t,
~ ~

na qual E e Ei são respectivamente as energias dos estados |β, Ei e |ϕi i.


Trocando a notação δ℘(αf , t) por δ℘(ϕi , αf , t), podemos escrever,
ˆ  
1 2 E − Ei
δ℘(ϕi , αf , t) = 2 dβ dE ρ(β, E)| hβ, E|W |ϕi i | F t, (7.112)
~ ~
β∈δβf
E∈δEf

Prof. Salviano A. Leão 196


7.18. Função delta de Dirac

F (t,ωf i )

7.18 Função delta de Dirac


A função F (t; ωf,i ) varia rapidamente em torno de ωf,i = 0, ou seja, em torno de E = Ei , já
que ωf,i = (E − Ei )/~.
Se t for o suficientemente grande, esta função pode ser aproximada, a menos de um fator
constante, por um função δ(E − Ei ), pois
 
E − Ei
lim F (t; ωf,i ) = πtδ = 2π~tδ(E − Ei ) (7.113)
t→∞ 2~
Condições

• A função ρ(β, E)| hβ, E|W |ϕi i |2 geralmente varia muito lentamente com E.

• Consideraremos que t seja o suficientemente grande, para que a variação desta função no
intervalo de largura 4π~/t, centrado em E = Ei seja negligenciável.

Portanto, troncando F (t; ωf,i ) pela 2π~tδ(E − Ei ) na equação (7.112) a integração na energia
torna-se imediata.

7.19 Perturbação constante: condições


Se δβf for muito pequeno, a integração sobre β é desnecessária, e temos:

• Quando a energia Ei pertence ao domínio δEf



δ℘(ϕi , αf , t) = δβf t| hβf , Ef = Ei |W |ϕi i |2 ρ(βf , Ef = Ei ) (7.114)
~
Prof. Salviano A. Leão 197
7.20. Regra de ouro de Fermi

• Quando a energia Ei não pertence a este domínio:

δ℘(ϕi , αf , t) = 0 (7.115)

Note que:

• Uma perturbação constante só pode induzir uma transição entre estados de mesma energia.

• O sistema deve ter a mesma energia no intervalo 2π~/t para o estado inicial e final.

• Por isso que se o domínio δEf excluir a energia Ei , a probabilidade de transição é nula.

7.20 Regra de ouro de Fermi


A probabilidade (7.114) cresce linearmente como o tempo. Consequentemente, a probabilidade
de transição por unidade de tempo, δW (ϕi , αf ), definida por

d
δW (ϕi , αf ) = δ℘(ϕi , αf , t) (7.116)
dt

é independente do tempo.
A densidade de probabilidade de transição por unidade de tempo e por intervalo unitário da
variável βf é:
δW (ϕi , αf )
w(ϕi , αf ) = (7.117)
δβf
Portanto temos que:


w(ϕi , αf ) = | hβf , Ef = Ei |W |ϕi i |2 ρ(βf , Ef = Ei ) (7.118)
~

a qual é conhecida como regra de ouro de Fermi.

7.21 Perturbação Senoidal


Se W for uma perturbação senoidal que acopla o estado discreto |ϕi i com o estado |βf , Ef i
do contínuo com energia Ef próxima da energia Ei + ~ω, ou seja,

Ef ≈ Ei + ~ω.

Um procedimento similar ao da perturbação constante fornece:


w(ϕi , αf ) = | hβf , Ef = Ei + ~ω|W |ϕi i |2 ρ(βf , Ef = Ei + ~ω) (7.119)
~

Prof. Salviano A. Leão 198


7.22. Exemplo

7.22 Exemplo
Considere o espalhamento de uma partícula sem spin por um potencial W cujos elementos
de matriz na representação |ri são:

hr|W |r0 i = W (r)δ(r − r0 )

Se o estado inicial do sistema possui um momentum bem definido pi , então:


 3
1
|ψ(t = 0)i = |pi i , com hr | pi = eip·r/~
2π~

A probabilidade de espalhamento de uma partícula incidente de momentum pi em um grupo


de estado de momentum p em torno do valor pf , com |pi | = |pf |, é


w(pi , pf ) =| hpf |W |pi i |2 ρ(Ef = Ei )
~

Para uma partícula livre vimos que ρ(Ef = Ei ) = m 2mEi , logo
  6 ˆ 2
2π p 1 3 i(p −p )·r/~

w(pi , pf ) = m 2mEi d re i f W (r)
~ 2π~

No lado direito da expressão anterior temos a transformada de Fourier do potencial W (r),


calculada para os valores de p iguais a pi − pf .
Note que:

• O estado inicial escolhido |pi i não é normalizável e não pode representar o estado físico
de uma partícula.

• Apesar da norma de |pi i ser infinita, o lado direito de w(pi , pf ) tem um valor finito.

Se dividirmos a probabilidade obtida pela corrente de probabilidades:


 3  3 r
1 ~ki 1 2Ei
Ji = =
2π~ m 2π~ m

obtemos ˆ 2
w(pi , pf ) m2 3 i(pi −pf )·r/~

= 2 4 d re W (r)
Ji 4π ~
que é a expressão para a seção de choque de espalhamento na aproximação de Born.

Prof. Salviano A. Leão 199


7.22. Exemplo

Prof. Salviano A. Leão 200


Capítulo 8

Decaimento de um estado discreto


acoplado ressonantemente a um contínuo
de estados finais

8.1 Introdução
Vimos que o acoplamento induzido por uma perturbação constante entre um estado inicial
discreto de energia Ei e um contínuo de estados finais (alguns dos quais têm uma energia igual
a Ei ) faz com que o sistema vá do estado inicial para esse continuo de estados finais. Mais
precisamente, a probabilidade de encontrar o sistema em um grupo bem definido de estados
do continuo no instante de tempo t aumenta linearmente com o tempo. Consequentemente, a
probabilidade Pii (t) de encontrar o sistema no estado inicial |ϕi i, no instante t deve diminuir
linearmente com o tempo a partir do valor Pii (0) = 1. É claro que este resultado é válido somente
intervalos de tempo curtos, uma vez que a extrapolação da diminuição linear de Pii (t) para
tempos longos levaria a valores negativos de Pii (t), o que é um absurdo para uma probabilidade.
Isto traz a tona o problema de determinar o comportamento do sistema após um longo tempo.
Encontramos um problema análogo quando estudamos as transições ressonantes induzida
por uma perturbação senoidal entre dois estados discretos |ϕi i e |ϕf i. A teoria de perturbação,
em primeira ordem, prevê uma diminuição de Pii (t) proporcional à t2 , a partir do valor inicial
de Pii (0) = 1. O método apresentado no complemento CXIII , mostra que o sistema realmente
oscila entre os estados |ϕi i e |ϕf i. A diminuição, com t2 encontrada pela teoria de perturbação
em primeira ordem, representa apenas o “início” da correspondente perturbação senoidal.
Poderíamos esperar encontrar um resultado análogo para o problema que iremos investigar
aqui, ou seja, as oscilações do sistema entre um estado discreto e o contínuo. Vamos mostrar
que este não é o caso: o sistema físico deixa o estado |ϕi i irreversivelmente. Encontraremos uma
diminuição exponencial e−Γt por Pii (t) (para os quais o tratamento de perturbativo dá apenas o
comportamento para tempos curto que é 1 − Γt). Portanto, a natureza contínua do conjunto
de estados finais faz com que a reversibilidade encontrada em complemento CXIII desapareça;
ela é responsável por uma deterioração do estado inicial, que adquire assim um tempo de vida

201
8.2. Descrição do modelo

finito (estado instável; complemento KIII ).


A situação prevista aqui é frequentemente encontrado na física. Por exemplo, um sistema,
inicialmente em um estado discreto, pode-se dividir, sob o efeito de um acoplamento interno
(descrito, por conseguinte, por um Hamiltoniano W independente do tempo), em duas partes
distintas cujas energias (cinética, no caso de partículas materiais e eletromagnéticos no caso
de fótons) pode ter, teoricamente, qualquer valor, o que dá ao conjunto de estados finais uma
natureza contínua. Assim, no decaimento α, um núcleo que está inicialmente em um estado
discreto é transformado (através do efeito de túnel) em um sistema composto de uma partícula
α e outro núcleo. Um átomo de muitos elétrons A, que está inicialmente em uma configuração
(conforme os complementos AXIV e BXIV ), no qual os elétrons estão excitados podem, sob o
efeito da interação eletrostática entre elétrons, dar origem a um sistema formado por um íon A+
e um elétron livre (a energia da configuração inicial deve, é claro, ser maior do que o limite de
ionização simples de A): este é o fenômeno “auto-ionização”. Podemos também citar a emissão
espontânea de um fóton por um estado atômico (ou nuclear) excitado: a interação do átomo
com o campo eletromagnético quantizado acopla o estado discreto inicial (o átomo excitado
na ausência de fótons) com um continuo de estados finais (o átomo em um estado inferior na
presença de um fóton de direção arbitrária, polarização, e energia). Finalmente, podemos citar
o efeito fotoelétrico, no qual uma perturbação, agora senoidal, acopla um estado discreto de um
átomo A a um continuo de estados finais (o íon A+ e os fotoelétrons e− ).
Estes poucos exemplos de estados instáveis tirados de vários domínios da física são suficientes
para indicar a importância do problema que está sendo tratado neste texto.

8.2 Descrição do modelo


Para simplificar os cálculos tanto quanto o possível, faremos uso das seguintes hipóteses
sobre o espectro do Hamiltoniano não perturbado H0 . Este espectro inclui

1. Estado inicial, discreto |ϕi i , de energia Ei não degenerado:

H0 |ϕi i = Ei |ϕi i (8.1)

2. Um conjunto de estados finais |αi os quais formam um contínuo:

H0 |αi = E |αi (8.2)

Aqui E pode tomar uma infinidade de valores continuamente, distribuídos sobre uma porção do
eixo real incluindo Ei . Iremos considerar que E varia no intervalo

0 ≤ E ≤ ∞, ou seja, E ≥ 0. (8.3)

Cada estado |αi é caracterizado por sua energia E e um conjunto de outros parâmetros
os quais denotaremos por β. Portanto, o estado |αi pode ser escrito na seguinte forma |β, Ei.
Temos então que
dα = ρ(β, E) dβ dE (8.4)

Prof. Salviano A. Leão 202


8.2. Descrição do modelo

na qual ρ(β, E) é a densidade final de estados.


Os autoestados de H0 satisfazem as seguintes relações ortogonalidade e completeza:

hϕi | ϕj i = δi,j (8.5a)


hϕi | αi = 0 (8.5b)
hα | α0 i = δ(α − α0 ) (8.5c)
X ˆ
|ϕi ihϕi | + dα |αihα| = 1 (8.6)
i

8.2.1 Hipóteses sobre o acoplamento W


Consideramos que W não depende explicitamente do tempo e não tem elementos na diagonal:

hϕi |W |ϕi i = hα|W |αi = 0, (8.7)

se esses elementos diagonais não fossem zero, podíamos adicioná-los aos termos de H0 , o que
simplesmente mudaria o valor das energias não perturbadas). Similarmente iremos considerar
que W não pode acoplar dois estados discretos e nem dois estados do contínuo

hϕj |W |ϕi i = 0 e hα|W |α0 i = 0. (8.8)

Os únicos elementos não nulos de W são aqueles os quais conectam o estado discreto |ϕi i com os
estados do contínuo. Estes são os elementos hα|W |ϕi i, os quais são responsáveis pelo decaimento
do estado |ϕi i.
Antes de apresentarmos um novo método de resolver a equação de Schrödinger, apresentare-
mos os resultados da teoria de perturbação de primeira ordem.

8.2.2 Resultados da teoria de perturbação de primeira ordem


A probabilidade de encontrarmos o sistema físico no instante t, (inicialmente no estado |ϕi i),
em um estado final de energia arbitrária pertencendo ao grupo de estados finais caracterizados
pelo intervalo δβf em torno do valor βf .
A probabilidade de encontrarmos o sistema em um estado final qualquer |αi: aqui nem β e
nem E foram especificados. Devemos portanto integrar a expressão (7.118) com relação a β, a
qual fornece a densidade de probabilidade (na expressão (7.118) a integração sobre a energia já
foi realizada). Portanto, introduzimos a constante
ˆ ˆ

Γ= dβ w(ϕi , β, E = Ei ) = dβ |hβ, E = Ei |W |ϕi i|2 ρ(β, E = Ei ) (8.9)
~
A probabilidade desejada é igual a Γt. Com as hipóteses iniciais, essa constante representa
probabilidade do sistema ter deixado o estado inicial |ϕi i no instante t. Chamando de Pii (t) a
probabilidade de que no instante t o sistema ainda esteja no estado |ϕi i, temos então que:

Pii (t) = 1 − Γt (8.10)

Devemos lembrar que a expressão (8.10) é válida se:


[i)]

Prof. Salviano A. Leão 203


8.2. Descrição do modelo

1. A expressão (8.10) resulta da teoria de perturbação de primeira ordem a qual é válida


somente se Pii (t) diferir suavemente do seu valor inicial Pii (0) = 1. Então devemos ter que
1
t . (8.11)
Γ

2. Além disso, a expressão (8.10) somente para tempos o suficientemente longos.

Para declararmos a segunda condição em uma forma mais precisa, e para vermos, em particular,
se ela é compatível com (8.11), retornamos a expressão (7.112), na qual E e β não estão
vinculados a variar somente dentro do intervalo δβf e δEf . Procedendo conforme na seção 7.17,
integramos a densidade de probabilidade que aparece em (8.11), primeiro sobre β e depois sobre
E. Ao fazermos isso, surge a seguinte integral:
ˆ∞  
1 E − Ei
dE F t, K(E) (8.12)
~2 ~
0

na qual K(E), o qual resulta da primeira integração em β, é dado por:


ˆ
K(E) = dβ |hβ, E|W |ϕi i|2 ρ(β, E) (8.13)

e com    2
E − Ei sen(ωt/2)
F t, = F (t, ω) = (8.14)
~ ω/2
a qual é a função de difração, com ω = (E − Ei )/~, centrada em E = Ei e de largura 4π~/t.
Seja ~∆ a largura de K(E): ~∆ representa então a ordem de magnitude da variação de E
necessária para K(E) mudar significantemente, conforme a figura ??. Logo para tempos t o
suficientemente grande tal que:
1
t (8.15)

a função F (t, (E − Ei )/~) comporta-se como um função delta, com relação a função K(E).
Usando a relação (7.113) podemos escrever (8.12) na seguinte forma:
ˆ∞
2π 2πt
t dE δ (E − Ei ) K(E) = K(E = Ei ) = Γt, (8.16)
~ ~
0

desde que comparando (8.9) com (8.13), podemos ver facilmente que:

K(E = Ei ) = Γ (8.17)
~
Novamente encontramos que o decréscimo linear que surge em (8.10) é válido somente se t
for grande o suficiente para satisfazer (8.15).
As condições (8.11) e (8.15), obviamente, são compatíveis somente se

∆  Γ. (8.18)

No que segue, iremos considerar que a condição (8.18) é satisfeita.

Prof. Salviano A. Leão 204


8.2. Descrição do modelo

Pif (t,ω)


∆ω = t

~∆

K(E)

F (t, E−E
~
i
)
Ei E
Figura 8.1: Na figura mostramos a variação da função K(E) e F (t, (E − Ei )/~) com relação a E. As
respectivas larguras das duas curvas são mostradas, sendo da ordem de ~∆ e 4π~/t. Para tempos t o
suficientemente longos, a função F (t, (E − Ei )/~) se comporta como um função delta, com relação a
função K(E).

8.2.3 Equação Integro-diferencial equivalente à Equação de Schrödin-


ger
O estado do sistema no instante t pode ser expandido na base {|ϕi i , |αi} da seguinte forma
X ˆ
|ψ(t)i = Cn (t) |ϕn i + dα C(α, t) |αi , (8.19)
n

considerando que esses coeficientes não variam muito com o tempo, podemos escrever

Cn (t) = bn (t)e−iEn t/~ e C(α, t) = b(α, t)e−iEt/~ ,

assim o estado do sistema em um dado instante t é dado por


X ˆ
−iEn t/~
|ψ(t)i = bn (t)e |ϕn i + dα b(α, t)e−iEt/~ |αi . (8.20)
n

Substituindo essa expressão na equação de Schrödinger, obtemos que


X d ˆ
−iEn t/~ d
i~ bn (t)e |ϕn i + i~ dα b(α, t)e−iEt/~ |αi =
dt dt
n
X ˆ
−iEn t/~
bn (t)e W |ϕn i + dα b(α, t)e−iEt/~ W |αi . (8.21)
n

Prof. Salviano A. Leão 205


8.2. Descrição do modelo

Projetando essa equação no estado |ϕi i e levando em conta como a perturbação W , acopla os
estados encontramos que
ˆ
d
i~ bi (t) = dα b(α, t)e−i(E−Ei )t/~ hϕi |W |αi . (8.22)
dt

Projetando a equação (8.21) no estado |α0 i e levando em conta como a perturbação W ,


acopla os estados encontramos que:

d
i~ b(α, t) = bi (t)ei(E−Ei )t/~ hα|W |ϕi i . (8.23)
dt
O problema em questão, consiste em usar rigorosamente as equações (8.22) e (8.23) para
predizer como será o comportamento do sistema após um longo intervalo de tempo t, levando
em conta as seguintes condições iniciais

bi (0) = 1 e b(α, 0) = 0. (8.24)

As hipóteses simplificadoras para o acoplamento W , implicam que o termo dbi (t)/dt depende
somente de b(α, t) e por sua vez o termo db(α, t)/dt depende somente de bi (t). Portanto, podemos
integrar a equação (8.22) levando em conta as condições iniciais (8.24), obtendo assim que
ˆ t ˆ
1 0 0
bi (t) = 1 + dt dα b(α, t0 )e−i(E−Ei )t /~ hϕi |W |αi , (8.25)
i~ 0

e ao integrar a equação (8.23) levando em conta as condições iniciais (8.24) têm-se que
ˆ t
1 0
b(α, t) = dt0 bi (t0 )ei(E−Ei )t /~ hα|W |ϕi i . (8.26)
i~ 0

Substituindo (8.26) na equação (8.22), têm-se que


ˆ ˆ t
d 1 0
bi (t) = dα dt0 e−i(E−Ei )(t−t )/~ |hα|W |ϕi i|2 bi (t0 ). (8.27)
dt (i~)2 0

Já ao substituir a equação (8.25) na equação (8.23), têm-se que


ˆ ˆ t
d 1 1 0
b(α, t) = ei(E−Ei )t/~ hα|W |ϕi i + dα dt0 ei(E−Ei )(t−t )/~ |hϕi |W |αi|2 b(α, t0 )
dt i~ (i~)2 0
(8.28)
Temos agora dois conjuntos de equações integro-diferenciais desacopladas para os coeficientes
bi (t) e b(α, t). Porém antes de avançar um pouco mais, vamos reescrever estas duas equações
em termos dos seguintes parâmetros

dα = dβ dE com |αi = |β, Ei ,

e usando a seguinte definição


ˆ
K(E) = dβ | hβ, E|W |ϕi i |2 ρ(β, E), (8.29)

Prof. Salviano A. Leão 206


8.3. Aproximação para tempos curtos: Relação com a teoria de perturbação em primeira ordem

a equação (8.27) pode ser reescrita como


ˆ ∞ ˆ t
d 1 0
bi (t) = − 2 dE dt0 K(E)e−i(E−Ei )(t−t )/~ bi (t0 ) (8.30)
dt ~ 0 0

Note que a equação (8.30) envolve somente os coeficientes bi (t), entretanto, ela não é mais
uma equação diferencial, mas sim uma equação integro-diferencial. Nesse caso, temos que o
termo dbi (t)/dt depende inteiramente da “história do sistema”, entre os instantes 0 e t.
A equação (8.30) é rigorosamente equivalente a equação de Schrödinger, entretanto, não
sabemos resolvê-la exatamente. A seguir serão apresentadas duas soluções aproximadas para
essa equação, sendo a primeira equivalente a teoria de perturbação em primeira ordem. Já a
segunda solução, permitirá que se investigue de forma satisfatória o comportamento do sistema
para intervalos de tempos longos.

8.3 Aproximação para tempos curtos: Relação com a teo-


ria de perturbação em primeira ordem
Para tempos curtos, isto é, se bi (t) não for muito diferente de bi (0) = 1, pode-se trocar bi (t0 )
por bi (0) = 1 no lado direito de (8.30), o que a reduz a seguinte forma
ˆ ∞ ˆ t
d 1 0
bi (t) = − 2 dE K(E) dt0 e−i(E−Ei )(t−t )/~ , (8.31)
dt ~ 0 0

cuja integração temporal não apresenta dificuldades. Introduzindo o fator Γ definido por
ˆ
2π 2π
Γ= dβ | hβ, E = Ei |W |ϕi i |2 ρ(β, E = Ei ) = K(E = Ei ) (8.32)
~ ~

e usando a relação
ˆ +∞ ˆ ∞  
ikx ik(x+i) i 1
dk θ(k)e = lim+ dk e = lim+ = iP + πδ(x) (8.33)
−∞ →0 0 →0 x + i x

pode-se escrever
ˆ t  
0 −i(E−Ei )τ /~ 1
lim dt e dτ = ~πδ (Ei − E) + iP . (8.34)
t→∞ 0 Ei − E

Para escrever este resultado fez-se a seguinte transformação τ = t − t0 .


Realmente não é necessário fazermos t se aproximar de infinito para usarmos a equação
(8.34), no cálculo de (8.31). Em (8.31) é o suficiente que ~/t seja muito menor que a “largura”
~∆ de K(E), isto é, que t seja muito maior que 1/∆, conforme ilustra a Fig. (??). Novamente,
encontramos a condição de validade t  1/∆, da teoria de perturbação em primeira ordem.
Se essa condição for satisfeita, podemos usar (8.34) para escrever a equação (8.31) na seguinte
forma: ˆ ∞
d π i K(E)
bi (t) = − K(E = Ei ) − P dE. (8.35)
dt ~ ~ 0 Ei − E

Prof. Salviano A. Leão 207


8.4. Segunda aproximação para resolver a equação de Schrödinger

De acordo com (8.32) o primeiro termo de (8.35) é dado por −Γ/2. Fazendo
ˆ ∞
K(E)
δE = P dE (8.36)
0 Ei − E
então pode-se reescrever a equação (8.35) na seguinte forma
d 1 δE
bi (t) = − Γ − i . (8.37)
dt 2 ~
Ao integrarmos essa equação, usando a condição de que bi (0) = 1, encontra-se que
 
1 δE
bi (t) = 1 − Γ+i t. (8.38)
2 ~

Obviamente, que esse resultado só é válido se |bi (t)| diferir muito pouco de 1, isto é, se:
1 ~
t e t (8.39)
Γ δE
Essa é uma outra condição de validade, para a teoria de perturbação em primeira ordem.
Usando a expressão (8.38) pode-se calcular facilmente a probabilidade Pii (t) = |bi (t)|2 de
que o sistema ainda esteja no estado |ϕi i no instante t. Se neglicenciarmos os termos da ordem
de Γ2 e (δE)2 , essa probabilidade pode ser escrita como

Pii (t) = 1 − Γt. (8.40)

Todos os resultado obtidos anteriormente para a teoria de perturbação dependente do tempo


em primeira ordem, podem ser obtidos a partir da equação (8.30), na qual troca-se bi (t0 ) por
bi (0) = 1. Essa equação nos permiti incluir o parâmetro δE, cujo significado será discutido
posteriormente.

8.4 Segunda aproximação para resolver a equação de Schrö-


dinger
Uma aproximação melhor do que a anterior, consiste em trocar bi (t0 ) por bi (t), em vez de
bi (0), em (8.30), o que resulta em
ˆ ∞ ˆ t
d bi (t) 0
bi (t) = − 2 dE dt0 K(E)e−i(E−Ei )(t−t )/~ (8.41)
dt ~ 0 0

da qual obtém-se a seguinte função g(Ei , t − t0 ) de Ei e de t − t0 :


ˆ
0 1 ∞ 0
g(Ei , t − t ) = − 2 dE K(E)ei(Ei −E)(t−t )/~ (8.42)
~ 0
a qual é claramente diferente de zero somente se t − t0 for muito pequeno. Em (8.42), está se
integrando sobre E o produto de K(E), a qual varia lentamente com E (conforme Fig. (??)),
com uma exponencial cujo período com relação a variável E é 2π~/(t − t0 ). Se escolhermos
valores para t e t0 tais que esse período seja muito menor do que a largura ~∆ de K(E), o

Prof. Salviano A. Leão 208


8.4. Segunda aproximação para resolver a equação de Schrödinger

produto dessas funções irá sofrer uma grande número de oscilações quando E for variada, e nesse
caso, a sua integral sobre E será negligenciável. Consequentemente, o módulo de g(Ei , t − t0 ) é
grande para t − t0 ≈ 0 e torna-se negligenciável tão rápido quanto t − t0  1/∆. Essa propriedade
significa que, para todo t, os únicos valores de bi (t0 ) que contribuem significantemente no lado
direito de (8.30) são aqueles os quais correspondem a um t0 muito próximo de t (t − t0  1/∆).
De fato, uma vez que a integração sobre E tenha sido realizada, este lado direito torna-se
ˆ t
d
bi (t) = dt0 g(Ei , t − t0 )bi (t0 ), (8.43)
dt 0

e vê-se que a presença do termo g(Ei , t − t0 ) praticamente elimina a contribuição de bi (t0 ) tão
rápido quanto t − t0  1/∆.
Portanto, a derivada dbi (t)/dt no instante t tem somente uma curta memória dos valores
prévios de bi (t) entre os instante 0 e t. Realmente ela só depende dos valores de bi (t) no instante
t imediatamente antes, isso é verdade para todos os instantes t. Essa propriedade permite que
essa equação integro-diferencial seja transformada em uma equação diferencial. Se bi (t) variar
muito pouco sobre um intervalo de tempo da ordem de 1/∆, o erro cometido ao trocar bi (t0 )
por bi (t) em (8.43) será pequeno. Esse procedimento resulta em:
ˆ t  
d 0 0 1 δE
bi (t) = bi (t) dt g(Ei , t − t ) = − Γ+i bi (t) (8.44)
dt 0 2 ~

conforme o resultado da equação (8.37).


De acordo com os resultados da seção anterior, a escala temporal característica da evolução
de bi (t) é da ordem de 1/Γ ou δE/~. A condição de validade de (8.43) é então

δE
Γ∆ e  ∆, (8.45)
~
a qual já foi considerada como sendo satisfeita.
Para obter uma melhor aproximação, para todos os tempos t, integra-se a equação (8.44), a
qual é dada por
ˆ bi (t) ˆ t  
dbi 0 1 δE
= dt − Γ−i ,
1 bi 0 2 ~
com a condição inicial bi (0) = 1, o que resulta em

bi (t) = e−Γt/2 e−iδEt/~ (8.46)

A expansão em série Taylor no parâmetro complexo que multiplica o tempo na equação (8.46),
fornece em primeira ordem, nesse parâmetro, o mesmo resultado fornecido por (8.38).
Note que não foi imposto nenhum limite superior ao tempo t. Porém a integral
ˆ t  
0 0 1 δE
dt g(Ei , t − t ) = − Γ+i ,
0 2 ~

a qual surge em (8.44), possui esse valor somente se t  1/∆, com foi mostrado na seção
anterior. Para tempos muito curtos, a teoria apresentada nessa seção está submetida as mesmas

Prof. Salviano A. Leão 209


8.5. Análise dos resultados

limitações da teoria de perturbação; porém, ela possui a grande vantagem de ser válida para
tempos longos.
Agora ao substituir a expressão (8.46) na equação (8.26), obtém-se que

ˆ
1 t 0 i(E−Ei +i~Γ/2−δE)t0 /~
b(α, t) = dt e hα|W |ϕi i
i~ 0
ˆ
hα|W |ϕi i t 0 i(E−Ei +i~Γ/2−δE)t0 /~
= dt e (8.47)
i~ 0

a qual é uma expressão muito simples para a amplitude de probabilidade b(α, t). Após a
integração de (8.47), têm-se que

hα|W |ϕi i 1 − e−Γt/2 ei(E−Ei −δE)t/~


b(α, t) = · (8.48)
i~ (E − Ei − δE)/~ + iΓ/2

As equações (8.46) e (8.48), respectivamente descrevem o decaimento do estado inicial e o


preenchimento do estado final |αi = |β, Ei. Na próxima seção será investigado o conteúdo físico
dessas duas equações com mais detalhes.

8.5 Análise dos resultados

8.5.1 Tempo de vida do estado discreto


Conforme a equação (8.46), temos então que a probabilidade da permanecer em se estado
inicial é dada por
Pii (t) = |bi (t)|2 = e−Γt (8.49)

Pii (t)
1

1/e

τ = 1/Γ t

Figura 8.2: Gráfico da taxa de decaimento, ou seja, da probabilidade do estado inicial não decair, ou
seja, não transicionar para um outro estado.

Prof. Salviano A. Leão 210


8.6. O deslocamento discreto do estado devido ao acoplamento com o contínuo

Na figura 8.2 temos a variação da probabilidade de encontrarmos o sistema no estado discreto


|ϕi i no instante t, em função do tempo. O resultado obtido, foi um decréscimo exponencial,
e−Γt para o qual a regra de Ouro de Fermi fornece a tangente na origem.
Portanto, Pii (t) decresce irreversivelmente, iniciando com Pii (0) = 1 e se aproxima de zero
quando o tempo vai infinito, ou seja, Pii (t → ∞) → 0. Então dizemos que o estado inicial
discreto possui um “tempo de vida” t finito; aqui τ é uma constante característica do decaimento
exponencial, dada por
τ = 1/Γ. (8.50)

Esse comportamento irreversível, contrasta muito com a oscilação do sistema (a fórmula de


Rabi) entre dois estados discretos quando eles são submetidos a uma perturbação ressonante
acoplando esses dois estados.

8.6 O deslocamento discreto do estado devido ao acopla-


mento com o contínuo
Ao retornarmos a notação original, reescrevendo os coeficientes Ci (t) em termos dos coefici-
entes bi (t), assim têm-se que
Ci (t) = e−Γt/2 e−i(Ei +δE)t/~ . (8.51)

Deve-se notar que na ausência do acoplamento W , o coeficiente

Ci (t) = e−Γt/2 e−iEi t/~ . (8.52)

Portanto, além do decaimento exponencial, e−Γt/2 , o acoplamento com o contínuo é responsável


por um deslocamento da energia do estado discreto, a qual vai de Ei para Ei + δE. Essa é a
interpretação da quantidade δE, introduzida anteriormente.
Agora será analisada a expressão (8.36) para δE. Ao Substituir a definição (8.29) de K(E)
em (8.36), resulta em
ˆ ∞ ˆ
dE
δE = P dβ | hβ, E|W |ϕi i |2 ρ(β, E) (8.53)
0 Ei − E

ou se usarmos o fato de que dα = ρ(β, E)dβdE e trocarmos o bra hβ, E| pelo bra α, pode-se
escrever ˆ ∞
| hα|W |ϕi i |2
δE = P dα. (8.54)
0 Ei − E
A contribuição para essa integral, de um estado |αi qualquer do contínuo, para o qual E 6= Ei
é:
| hα|W |ϕi i |2
(8.55)
Ei − E
A equação (8.55) apresenta uma expressão cuja forma é similar a que surge da teoria de
perturbação estacionária. A equação (8.55) representa o deslocamento em energia do estado |ϕi i
devido ao acoplamento com o estado |αi do contínuo, em segunda ordem em W . Por sua vez,

Prof. Salviano A. Leão 211


8.7. Distribuição de energia dos estados finais

δE é simplesmente a soma dos deslocamentos dos vários estados |αi do contínuo. Pode-se pensar
que irá surgir um problema para os estados |αi do contínuo, para os quais E = Ei : Realmente
a presença em (8.54) da parte principal P implica que as contribuições dos estados |αi situados
imediatamente acima do estado |ϕi i, compensa aquela dos estados situados imediatamente
abaixo.
Sem síntese temos:

1. O acoplamento do estado |ϕi i com o estado |αi de mesma energia é o responsável pelo
tempo de vida finito do estado |ϕi i, devido a função δ(E − Ei ) que surge em (8.34).

2. acoplamento do estado |ϕi i com o estado |αi de diferentes energias é o responsável por
um deslocamento na energia do estado |ϕi i. Este deslocamento pode ser calculado por
uma teoria de perturbação estacionária.

No caso particular da emissão de um fóton por um átomo, δE, representa o deslocamento do


nível atômico em questão devido ao acoplamento com o contínuo de estados finais (um átomo
em um outro estado discreto, na presença de um fóton). A diferença entre os deslocamentos de
energia δE dos estados 2S1/2 e 2p1/2 do átomo de hidrogênio é conhecido como “Lamb-Shift”.

8.7 Distribuição de energia dos estados finais


Uma vez que o estado discreto decai, isto é, quando t  1/Γ, o estado final do sistema pertence
ao contínuo de estados |αi. É interessante investigarmos o comportamento da distribuição de
energia dos estados finais. Por exemplo, na emissão espontânea de um fóton por um átomo, essa
distribuição de energia é aquela de um fóton emitido quando o átomo decai do estado excitado
para um nível de mais baixa energia (a largura natural da linha espectral).
Quando t  1/Γ, a exponencial que aparece no numerador de (8.48) é praticamente zero.
Nesse caso, têm-se então que

∼ 1
|b(α, t)|2 | hα|W |ϕi i |2 · (8.56)
t  1/Γ (E − Ei − δE)2 + ~2 Γ2 /4

aqui |b(α, t)|2 representa uma densidade de probabilidade. A probabilidade de encontrar o


sistema após o decaimento, em um estado qualquer de um grupo de estados finais caracterizados
pelo intervalo dβf e dEf em torno de βf e Ef , pode ser calculada diretamente da expressão
(8.56):

1
dP(βf , Ef , t) = |hβf , Ef |W |ϕi i|2 ρ(βf , Ef ) · dβf , dEf , (8.57)
(Ef − Ei − δE)2 + ~2 Γ2 /4

como a dependência em Ef da densidade de probabilidade é

dP(βf , Ef , t) 1
= |hβf , Ef |W |ϕi i|2 · ρ(βf , Ef ). (8.58)
dβf , dEf (Ef − Ei − δE)2 + ~2 Γ2 /4

Prof. Salviano A. Leão 212


8.7. Distribuição de energia dos estados finais

Desde que |hβf , Ef |W |ϕi i|2 ρ(βf , Ef ) permanece praticamente constante quando Ef varia sobre
um intervalo da ordem de ~Γ, a variação da densidade de probabilidade com relação a Ef é
essencialmente determinada pela função (a lorentziana):
1
(8.59)
(Ef − Ei − δE)2 + ~2 Γ2 /4

e consequentemente, tem a forma mostrada na figura 8.3 a seguir.

dP(βf ,Ef ,t)


dβf ,dEf

~
~Γ = τ

Ei + δE Ef

Figura 8.3: Forma lorentziana, da distribuição de energia dos estados finais do sistema após o seu
decaimento de um estado discreto.

A figura 8.3 mostra a forma da distribuição de energia dos estados finais obtida pelo sistema
após o seu decaimento de um estado discreto. O resultado obtido, foi uma distribuição lorentziana
centrada em Ei + δE (a energia do estado discreto corrigida pelo deslocamento de energia δE,
devido ao acoplamento com o contínuo). Então, têm-se um tempo de vida curto para o estado
discreto, e uma larga distribuição de energia (uma relação de incerteza energia-tempo).
A distribuição de energia (8.59) dos estados finais, possui um máximo em Ef = Ei + δE,
isto é, quando a energia do estado final é igual aquela do estado inicial |ϕi i, corrigida pelo
deslocamento de energia δE.
A forma da distribuição é a de uma lorentziana de largura ~Γ, chamada “largura natural”
do estado |ϕi i. Portanto, surge uma dispersão na energia dos estado finais. A largura ~Γ (isto
é, o tempo de vida curto τ = 1/Γ do estado discreto), significa uma grande dispersão. Mais
precisamente
~
∆Ef = ~Γ = . (8.60)
τ
Note novamente a analogia entre a expressão (8.60) e a relação de incerteza energia-tempo.
Na presença do acoplamento W , o estado |ϕi i pode ser observado somente durante um tempo
finito, da ordem do seu tempo de vida τ . Quando desejamos determinar sua energia, medindo
aquela do estado final do sistema, a incerteza ∆E do resultado não pode ser menor do que ~/τ .

Prof. Salviano A. Leão 213


8.7. Distribuição de energia dos estados finais

Prof. Salviano A. Leão 214


Capítulo 9

Quantização do Campo Eletromagnético

9.1 Introdução
Aqui as equações de Maxwell serão usadas no sistema internacional de unidades SI para
descrever o campo eletromagnético.

9.2 Equações de Maxwell


As equações de Maxwell no sistema MKSA (SI), são constituídas por quatro equações
diferenciais parciais de primeira ordem que relacionam as diversas componentes do campo
elétrico E(r, t) e do campo magnético B(r, t) com a densidade de cargas livres ρ(r, t) e a
densidade de corrente j(r, t) e são dadas por:

∇ · D(r, t) = ρ(r, t) Lei de Gauss (9.1a)

∂D(r, t)
∇ × H(r, t) = j(r, t) + Lei de Ampère-Maxwell (9.1b)
∂t

∂B(r, t)
∇ × E(r, t) = − Lei de Faraday (9.1c)
∂t

∇ · B(r, t) = 0 Ausência de pólos magnéticos livres (9.1d)

na qual para um meio material não dispersivo, as relações constitutivas são

1
D(r, t) = E(r, t) e B(r, t) = µH(r, t) e c= √
0 µ0

 = (1 + χ)0 = κ0 e µ = (1 + χm )µ0 = κm µ0 .

215
9.2. Equações de Maxwell

Estas equações formam a base de todos os fenômenos eletromagnéticos clássicos. Combinadas


com a equação da força de Lorentz que descreve o movimento de uma partícula de massa mα e
carga qα , posição rα (t) e velocidade vα (t) em um campo eletromagnético,

d2
Fα = m rα (t) = qα [E(rα (t), t) + vα (t) × B(rα (t), t)] . (9.2)
dt2

e com a segunda lei de Newton, elas fornecem a descrição completa da dinâmica clássica da
interação de partículas carregadas e dos campos eletromagnéticos. Note que a equação (9.2) só
é válida para partículas lentas, ou seja, partículas não relativísticas (vα  c).
A partir de (9.1a) e de (9.1b) pode-se mostrar que


ρ(r, t) + ∇ · j(r, t) = 0. (9.3)
∂t

Essa equação, conhecida como equação da continuidade, expressa a conservação global da carga
elétrica ˆ
Q= d3 r ρ(r, t). (9.4)

As expressões de ρ(r, t) e de j(r, t) como uma função das variáveis das partículas são


ρ(r, t) = P q δ [r − r (t)]
α α α
P (9.5)
α qα vα (t)δ [r − rα (t)]
j(r, t) =

Pode-se mostrar que as equações (9.5) satisfazem a equação da continuidade (9.3).


As equações (9.1) e (9.2) formam dois conjuntos de equações acopladas. A evolução dos
campos dependem das partículas por meio das densidades de carga ρ(r, t) e de corrente j(r, t)
respectivamente. O movimento das partículas dependem dos campos E(r, t) e B(r, t). As
equações (9.1) são equações diferenciais parciais de primeira ordem, enquanto as equações (9.2)
são equações diferenciais ordinárias de segunda ordem. Segue então que o estado global do
sistema partícula mais campo, é determinado em um dado instante t0 , fornecendo-se os campos
E(r, t0 ) e B(r, t0 ) em todos os pontos r do espaço e a posição rα (t) e velocidade vα (t) de cada
partícula rotulada pelo índice α, ou seja,

{E(r, t0 ), B(r, t0 ), rα (t), vα (t)}.

É importante notar que nas equações de Maxwell (9.1), r não é uma variável dinâmica como
rα (t), mas um parâmetro contínuo que rotula as variáveis do campo no espaço.
As equações de Maxwell (9.1) só podem ser resolvidas na forma em que estão escritas em
situações simples. Muitas vezes é conveniente introduzir potenciais, obtendo um número menor
de equações de segunda ordem, satisfazendo identicamente a algumas das equações de Maxwell.
Já estamos familiarizados com este conceito na eletrostática e na magnetostática, onde usamos
o potencial escalar ϕ(r, t) e o potencial vetor A(r, t).

Prof. Salviano A. Leão 216


9.3. Potenciais vetor e escalar – Invariância de calibre

9.3 Potenciais vetor e escalar – Invariância de calibre


Uma vez que ∇ · B(r, t) = 0, podemos definir B(r, t) em termos de um potencial vetor
A(r, t), da seguinte forma:
B(r, t) = ∇ × A(r, t) (9.6)

Então a lei de Faraday, equação (9.1c), pode ser reescrita como


 
∂A(r, t)
∇ × E(r, t) + = 0. (9.7)
∂t
Isto significa que a grandeza irrotacional em (9.7) pode ser escrita como o gradiente de uma
função escalar, a saber, o potencial escalar φ(r, t):

∂A(r, t) ∂A(r, t)
E(r, t) + = −∇φ(r, t) ou E(r, t) = −∇φ(r, t) − (9.8)
∂t ∂t
A definição de B(r, t) e de E(r, t) em termos dos potenciais A(r, t) e φ(r, t), de acordo com (9.6)
e (9.8), satisfaz identicamente ás duas equações homogêneas de Maxwell. O comportamento
dinâmico de A(r, t) e de φ(r, t) será determinado pelas duas equações não-homogêneas em (9.1).
Como D(r, t) =  E(r, t) então
 
∂A(r, t) ∂A(r, t)
D(r, t) = −∇φ(r, t) −  = − ∇φ(r, t) + , (9.9)
∂t ∂t
desta forma podemos reescrever a lei de Gauss da seguinte forma:
∂ 1
∇2 φ(r, t) + [∇ · A(r, t)] = − ρ(r, t). (9.10)
∂t 
Agora iremos reescrever a lei de Ampère-Maxwell usando a eq. (9.8) e o fato de que
H(r, t) = µ1 B(r, t) = µ1 ∇ × A(r, t), desta forma,
 
∂ ∂A(r, t)
∇ × [∇ × A(r, t)] = µj(r, t) + µ −∇φ(r, t) − (9.11)
∂t ∂t
mas como, ∇ × (∇ × A) = ∇ (∇ · A) − ∇2 A, então

∂ 2 A(r, t)
 
2 ∂φ(r, t)
∇ A(r, t) − µ − ∇ ∇ · A(r, t) + µ = −µj(r, t) (9.12)
∂t2 ∂t
Agora reduzimos o conjunto das quatro equações de Maxwell a duas equações, as quais
podem ser escritas como

∂ 1
∇2 φ(r, t) + [∇ · A(r, t)] = − ρ(r, t) (9.13a)
∂t 
2
 
∂ A(r, t) ∂φ(r, t)
∇2 A(r, t) − µ − ∇ ∇ · A(r, t) + µ = −µj(r, t) (9.13b)
∂t2 ∂t
Estas equações ainda estão correlacionadas. O desacoplamento de ambas pode ser realizado
explorando o fato da arbitrariedade que está implícita na definição dos potenciais vetor e escalar.
Uma vez que B está definido pela eq. (9.6) em termos de A(r, t), o potencial vetor é arbitrário

Prof. Salviano A. Leão 217


9.4. Transformações de Calibre

a menos do gradiente de uma função escalar χ(r, t), que lhe pode ser adicionado sem alterar a
forma de B(r, t). Então B(r, t) fica invariante sob a seguinte transformação de calibre (calibre)

A(r, t) −→ A0 (r, t) = A(r, t) + ∇χ(r, t) (9.14)


Para que o campo elétrico (9.8) permaneça também invariante, o potencial escalar φ(r, t)
deve ser simultaneamente transformado de acordo com

∂χ(r, t)
φ(r, t) −→ φ0 (r, t) = φ(r, t) − . (9.15)
∂t
A liberdade envolvida em (9.14) e em (9.15) significa que podemos escolher um conjunto de
potenciais {A0 (r, t), φ0 (r, t)} de tal modo que as equações (9.10) e (9.12) se desacoplem, e para
que isto ocorra devemos ter que
∂φ0 (r, t) ∂φ(r, t)
∇ · A0 (r, t) + µ = ∇ · A(r, t) + µ = 0. (9.16)
∂t ∂t
o que nos leva a condição extra
∂ 2 χ(r, t)
∇2 χ(r, t) − µ = 0. (9.17)
∂t2
Com isto, o par de equações (9.10) e (9.12) fica desacoplado e se têm duas equações de onda
não-homogêneas, uma para φ(r, t) e outra A(r, t):
∂ 2 φ(r, t) 1
∇2 φ(r, t) − µ 2
= − ρ(r, t) (9.18)
∂t 

∂ 2 A(r, t)
∇2 A(r, t) − µ = −µj(r, t) (9.19)
∂t2
As equações (9.18) e (9.19), juntamente com a eq. (9.16), formam um conjunto de equações
equivalentes, sob todos os pontos de vista, às equações de Maxwell.

9.4 Transformações de Calibre


As transformações (9.18) e (9.19) são denominadas transformações de calibre (gauge) e a
invariância sob estas transformações é a invariância de calibre (gauge). A relação (9.16) entre
A(r, t) e φ(r, t) é denominada condição de Lorentz. Para ver que é sempre possível determinar
potenciais que satisfaçam à condição de Lorentz, suponhamos que os potenciais A(r, t) e φ(r, t)
satisfazem a (9.10) e a (9.12) mas não à equação (9.16). Façamos então uma transformação
de calibre para os potenciais A0 (r, t) e φ0 (r, t) e coloquemos a condição de A0 (r, t) e φ0 (r, t)
satisfazendo a condição de Lorentz:
∂φ0 (r, t) ∂φ(r, t) ∂ 2 χ(r, t)
∇ · A0 (r, t) + µ = ∇ · A(r, t) + µ + ∇2 χ(r, t) − µ =0 (9.20)
∂t ∂t ∂t2
Assim, desde que se possa encontrar uma função de calibre χ(r, t) satisfazendo à equação
∂ 2 χ(r, t)
 
2 ∂φ(r, t)
∇ χ(r, t) − µ = − ∇ · A(r, t) + µ (9.21)
∂t2 ∂t

Prof. Salviano A. Leão 218


9.4. Transformações de Calibre

os novos potenciais A0 (r, t) e φ0 (r, t) satisfarão à condição de Lorentz e também às equações de


onda (9.18) e (9.19).
Mesmo para os potenciais que satisfazem à condição de Lorentz (9.16), ainda persiste um
grau de arbitrariedade. Evidentemente, a transformação de calibre restrita


 A(r, t) −→ A0 (r, t) = A(r, t) + ∇χ(r, t)

(9.22)
 ∂χ(r, t)
−→ φ0 (r, t) = φ(r, t) −

 φ(r, t)
∂t
onde
∂ 2 χ(r, t)
∇2 χ(r, t) − µ =0 (9.23)
∂t2
preserva a condição de Lorentz desde que A(r, t) e φ(r, t) a satisfaçam inicialmente. Todos os
potenciais desta classe restrita pertencem ao chamado calibre de Lorentz.
O calibre de Lorentz é usado comumente pois, em primeiro lugar, leva às equações de onda
(9.18) e (9.19) que tratam A(r, t) e φ(r, t) em pé de igualdade e, em segundo lugar porque é um
conceito independente do sistema de coordenadas escolhido e enquadra-se assim naturalmente
nas considerações da relatividade restrita.
Outro calibre útil para os potenciais é o calibre de Coulomb, de radiação ou transversal. Este
é o calibre em que

∇ · A(r, t) = 0. (9.24)

Dá equação (9.10), vemos que o potencial escalar satisfaz à equação de Poisson,

1
∇2 φ(r, t) = − ρ(r, t) (9.25)

com a solução ˆ
ρ (r0 , t)
φ (r, t) = 0
d3 r0 (9.26)
4π |r − r |
O potencial escalar é exatamente o potencial coulombiano instantâneo, devido à densidade de
carga ρ (r, t). Esta é a origem da denominação calibre de Coulomb.
O potencial vetor satisfaz à equação de onda não-homogênea,

∂ 2 A(r, t) ∂φ(r, t)
∇2 A(r, t) − µ = −µj(r, t) + µ∇ (9.27)
∂t2 ∂t
O termo de corrente que envolve o potencial pode, em princípio, ser calculado a partir da
equação (9.26). Uma vez que ele envolve o operador gradiente, é um termo irrotacional, ou seja,
tem o rotacional igual a zero. Isto sugere que ele possa anular uma parcela correspondente da
densidade de corrente. A densidade de corrente (ou qualquer campo vetorial) pode ser escrita
como a soma de dois termos,

j(r, t) = j` (r, t) + jt (r, t) (9.28)

Prof. Salviano A. Leão 219


9.4. Transformações de Calibre

onde j` (r, t) é a corrente longitudinal ou irrotacional, para a qual ∇ × j` (r, t) = 0, enquanto


jt (r, t) é a corrente transversal ou solenoidal e se tem ∇ · jt (r, t) = 0. Iniciando pela identidade
vetorial,

∇ × [∇ × j(r, t)] = ∇ (∇ · j(r, t)) − ∇2 j(r, t) (9.29)

juntamente com  
1
∇ 2
= −4π δ (r − r0 ) , (9.30)
|r − r0 |
pode-se mostrar que j` (r, t) e jt (r, t) podem ser construídas explicitamente a partir de j(r, t),
conforme as expressões (teorema de Helmholtz, ver George Arfken [2, ver pág. 74–78]) :
ˆ
1 ∇0 · j (r0 , t) 3 0
j` (r, t) = − ∇ dr (9.31)
4π |r − r0 |
ˆ
1 ∇0 × j (r0 , t) 3 0
jt (r) = ∇× dr (9.32)
4π |r − r0 |
Com a ajuda da equação da continuidade (9.3) e da equação (9.26), pode-se ver que

∂φ(r, t) ∂ 1
∇ = ∇φ(r, t) = j` (r, t) . (9.33)
∂t ∂t 
Portanto, a fonte para a equação de onda de A(r, t) pode ser expressa inteiramente em termos
da corrente transversal (9.32):

∂ 2 A(r, t)
∇2 A(r, t) − µ = −µjt (r, t) (9.34)
∂t2
Esta é, conforme é claro, a origem da denominação calibre transversal. O nome calibre de
radiação provém do fato dos campos de radiação transversais serem dados apenas pelo potencial
vetor, enquanto que por sua vez o potencial de Coulomb instantâneo contribui somente para os
campos a distâncias pequenas. Este calibre é especialmente útil na eletrodinâmica quântica.
Uma descrição quântica dos fótons necessita somente da quantização do potencial vetor.
O Calibre de Coulomb ou transversal é frequentemente usado quando não existem fontes.
Então φ(r, t) = 0, e A(r, t) satisfaz à equação de onda homogênea. Os campos são dados por

∂A(r, t)

 E(r, t) = − ∂t


(9.35)


B(r, t) = ∇ × A(r, t)

De passagem, observamos uma peculiaridade no calibre de Coulomb. Sabe-se que as perturbações


eletromagnéticas propagam-se com uma velocidade finita. Apesar disto, a Eq. (9.26) indica
que o potencial escalar se propaga instantaneamente a todos os pontos do espaço. O potencial
vetor, por outro lado, satisfaz a equação de onda (9.34), com uma velocidade de propagação

consequentemente igual a c (c = 1/ 0 µ0 a velocidade da luz). À primeira vista, é difícil
perceber como evitar este comportamento assimétrico dos potenciais, que evidentemente não

Prof. Salviano A. Leão 220


9.5. Equações de onda para o espaço livre

pode ser físico. Uma observação é a de que a corrente transversal (9.32) envolve uma integração
sobre todo o espaço.1

9.5 Equações de onda para o espaço livre


Para um espaço completamente vazio, com a fonte de carga ρ(r, t) nula, ou seja, ρ(r, t) = 0
e ∇ · j(r, t) = 0, é sempre possível encontrar uma função de calibre χ(r, t) tal que

∇ · A0 (r, t) = 0 e φ0 (r, t) = 0 (9.36)

para todo r e t. Esse é o calibre de Coulomb.


As transformações de calibre (9.22) e as condições (9.36), conduzem as seguintes equações

 ∂χ(r,t) = φ(r, t)
∂t
(9.37)
∇2 χ(r, t) = −∇ · A(r, t)

A solução explicita para a função de calibre é obtida realizando uma integração no tempo
da primeira equação de (9.37), o que resulta em
ˆ
χ(r, t) = φ(r, t)dt + const. (9.38)

Note que as duas condições ∇ · A0 (r, t) = 0 e φ0 (r, t) = 0 satisfazem automaticamente a condição


de Lorentz (9.16), de modo que as equações de onda (9.18) e (9.19) são mantidas, mas somente
para ρ(r, t) = 0 e ∇ · j(r, t) = 0.
Pode-se verificar a validade das equações (9.37), usando as equações de Maxwell. Para isso,
diferencie a segunda equação de (9.37)com relação ao tempo e insira no resultado a primeira eq.
de (9.37), resultando em
∂A(r, t)
∇2 φ(r, t) + ∇ · = 0. (9.39)
∂t
Porém essa equação só é válida se ρ(r, t) = 0. De fato da equação de Maxwell ∇ · E(r, t) =
ρ(r, t)/0 e da eq. (9.8) segue que
 
∂A(r, t)
∇ · E(r, t) = ∇ · −∇φ(r, t) −
∂t
∂A(r, t) 1
= −∇2 φ(r, t) − ∇ · = ρ(r, t)
∂t 0
= 0.

Para verificar que ∇ · j(r, t) = 0, vamos tomar o divergente da equação de Maxwell (9.1b), o
que resulta em

∇ · (∇ × H(r, t)) = ∇ · j(r, t) + ∇ · D(r, t),
∂t
1
Ver O. L. Brill e B. Goodman, Am. J. Phys. 35, 832 (1967) com uma discussão detalhada sobre a causalidade
no calibre de Coulomb.

Prof. Salviano A. Leão 221


9.5. Equações de onda para o espaço livre

entretanto temos que∇ · D(r, t) = ∇ · E(r, t) = 0 e como o divergente do rotacional de um


campo vetorial qualquer é sempre nulo segue imediatamente que

∇ · j(r, t) = 0.

No calibre de Coulomb, ∇ · A0 (r, t) = 0 e φ0 (r, t) = 0, encontra-se ondas planas transversais


como uma solução para A0 (r, t) e consequentemente para os campos E(r, t) e B(r, t)
Ao considerarmos um espaço vazio, livre de fontes cargas e correntes, ρ(r, t) = 0 e j(r, t) = 0,

e o fato de que c = 1/ 0 µ0 , então a equação 9.19 toma a seguinte forma:
1 ∂ 2A
∇2 A − = 0. (9.40)
c2 ∂t2
Para evitar-se divergências, o espaço será dividido em caixas cúbicas de volume L3 e o campo
eletromagnético será tratado dentro destas caixas com condições periódicas de contorno. Como
resultado do tratamento dado aqui, obteremos uma forma para o campo eletromagnético a
qual será dada como a soma de osciladores harmônicos. Devido a periodicidade do sistema o
potencial vetor pode ser escrito como uma expansão em série de Fourier, dado por,
1 X
Ck,α (0)ˆk,α eik·r e−iωk t + Ck,α

(0)ˆ∗k,α e−ik·r eiωk t ,

A(r, t) = √ (9.41)
V k,α

onde ωk = |k|c, k = L
(nx , ny , nz ) e ˆk,α é o vetor polarização.
A energia total do campo eletromagnético é dada por;
ˆ
0
H= d3 r(E2 + c2 B2 ). (9.42)
2 V
Como
∂A ∂A
E2 = · (9.43)
∂t ∂t
e
B2 = (∇ × A) · (∇ × A), (9.44)
então, ou ainda
ˆ  
0 3 ∂A ∂A 2
H= dr · + c (∇ × A) · (∇ × A) = HE + HB . (9.45)
2 V ∂t ∂t
Definindo
Ck,α (t) = Ck,α (0)e−iωk t (9.46)
e
1
µk,α = √ ˆk,α eik·r . (9.47)
V
A seguir será calculado o primeiro membro da integral na eq.(9.45), o termo devido ao campo
elétrico:
ˆ  
0 3 ∂A ∂A
HE = dr · , (9.48)
2 V ∂t ∂t
ˆ
0 X 3
h
∗ ∗
i
HE = d r µk,α Ċk,α (t) + µk,α Ċk,α (t) ·
2 k,α,k0 ,α0 V
h i
µk0 ,α0 Ċk0 ,α0 (t) + µ∗k0 ,α0 Ċk∗0 ,α0 (t) .

Prof. Salviano A. Leão 222


9.5. Equações de onda para o espaço livre

´ 0
Calculando separadamente a integral V µαk · µαk0 d3 r, temos
ˆ ˆ
3 ˆk,α · ˆk0 ,α0 0
µk,α · µk0 ,α0 d r = ei(k+k )·r d3 r,
V
ˆV
µk,α · µk0 ,α0 d3 r = ˆk,α · ˆk0 ,α0 δk,−k0 ,
ˆV
µk,α · µk0 ,α0 d3 r = δαα0 δk,−k0 .
V

Analogamente, temos que ˆ


0
µαk · µαk0 ∗ d3 r = δαα0 δk,k0 .
V

assim a energia devido ao campo elétrico é dada por


0 X h ∗ ∗ ∗ ∗
i
HE = Ċk,α (t)Ċ−k,α (t) + Ċk,α (t)Ċk,α (t) + Ċk,α (t)Ċk,α (t) + Ċk,α (t)Ċ−k,α (t) .
2 k,α

Porém como
Ċk,α (t) = −iωk Ck,α (t), (9.49)

segue então que


0 X 2  ∗ ∗ ∗ ∗

HE = ωk −Ck,α (t)C−k,α (t) + Ck,α (t)Ck,α (t) + Ck,α (t)Ck,α (t) − Ck,α (t)C−k,α (t) .
2 k,α
(9.50)
O termo devido ao campo magnético, do segundo membro de 9.48, é dado por:
ˆ
0 c2
HB = d3 r(∇ × A) · (∇ × A), (9.51)
2 V
ˆ
0 c2 X X ∗
HB = d3 r[Ck,α (t)∇ × µk,α + Ck,α (t)∇ × µ∗k,α ] ·
2 k,α k0 ,α0 V
[Ck0 ,α0 (t)∇ × µk0 ,α0 + Ck∗0 ,α0 (t)∇ × µ∗k0 ,α0 ].
´
Calculando separadamente a integral V
d3 r(∇ × µk,α ) · (∇ × µ∗k0 ,α0 ), temos

ˆ ˆ
1 0
3
d r(∇ × µk,α ) · (∇ × µ∗k0 ,α0 ) d3 r[ik × ˆk,α eik·r ] · [−ik0 × ˆ∗k0 ,α0 e−ik ·r ],
=
V
ˆV V ˆ
3 ∗ 0 ∗ 1 0
d r(∇ × µk,α ) · (∇ × µk0 ,α0 ) = (k × ˆk,α ) · (k × ˆk0 ,α0 ) d3 rei(k−k )·r ,
V V
ˆV
d3 r(∇ × µk,α ) · (∇ × µ∗k0 ,α0 ) = (k × ˆk,α ) · (k0 × ˆ∗k0 ,α0 )δkk0 ,
V

usando as relações (A × B) · (C × D) = (A · C)(B · D) − (A · D)(B · C) e k · ˆk,α = 0, já que,


∇ · A = 0, logo
ˆ
d3 r(∇ × µk,α ) · (∇ × µ∗k0 ,α0 ) = [(k · k0 )(ˆk,α · ˆ∗k0 ,α0 ) − (k · ˆ∗k0 ,α0 )(k · ˆk,α )]δkk0 ,
ˆV
d3 r(∇ × µk,α ) · (∇ × µ∗k0 ,α0 ) = k 2 δkk0 δαα0 .
V

Prof. Salviano A. Leão 223


9.5. Equações de onda para o espaço livre

No entanto,

0 c2 X 2  ∗ ∗ ∗ ∗

HB = k Ck,α (t)C−k,α (t) + Ck,α (t)Ck,α (t) + Ck,α (t)Ck,α (t) + Ck,α (t)C−k,α (t) ,
2 k,α
0 X 2  ∗ ∗ ∗ ∗

HE = ωk Ck,α (t)C−k,α (t) + Ck,α (t)Ck,α (t) + Ck,α (t)Ck,α (t) + Ck,α (t)C−k,α (t) . (9.52)
2 k,α

Usando os resultados obtidos para HE , eq. 9.50, e HB , eq. 9.52, e substituindo esses
resultados em 9.45, obtemos que a energia do campo eletromagnético será dado por;
X

H = 20 ωk2 Ck,α (t)Ck,α (t). (9.53)
k,α

Como Ck,α (t) = Ck,α (0)e−iωk t , então vemos que os termos dependentes do tempo devidos as
campos elétricos e magnéticos, se cancelam, como esperado, já que o Hamiltoniano de um sistema
fechado deve se independente do tempos, já que o mesmo é uma constante de movimento.
Dirac [45] ao obter está equação, a reconheceu como sendo a equação do oscilador harmônico,
conforme John S. Townsend [38, section 14.2, pag. 408].
A astúcia de Dirac, deve-se a observação de que Ck,α (t) = Ck,α (0)e−iωk t , logo

C̈k,α (t) = −(ωk2 )Ck,α (t) ⇒ Oscilador Harmônico . (9.54)

Podemos, obter uma forma mais adequada para o Hamiltoniano, definindo novas variáveis;
√ ∗
Qk,α = 0 (Ck,α (t) + Ck,α (t)) (9.55)

e
√ ∗
Pk,α = −iωk 0 (Ck,α (t) − Ck,α (t)). (9.56)

Note, ainda que


Q†k,α = Qk,α e †
Pk,α = Pk,α (9.57)

Temos ainda que as relações inversas são


 
1 i
Ck,α (t) = √ Qk,α + Pk,α (9.58)
2 0 ωk
e  
∗ 1 i
Ck,α (t) = √ Qk,α − Pk,α (9.59)
2 0 ωk
Logo,
2
Pk,α 0 ωk2 ∗
=− (Ck,α (t) − Ck,α (t))2 , (9.60)
2 2
ωk2 Q2k,α 0 ωk2 ∗
= (Ck,α (t) + Ck,α (t))2 . (9.61)
2 2
Então,
1 X 2
Pk,α + ωk2 Q2k,α ,

H= (9.62)
2 k,α

Prof. Salviano A. Leão 224


9.6. Quantização do campo eletromagnético

com
√ ∗ ∂H
Q̇k,α = −iωk 0 (Ck,α (t) − Ck,α (t)) = Pk,α = (9.63)
∂Pk,α
e
√ ∗ ∂H
Ṗk,α = −ωk2 0 (Ck,α (t) + Ck,α (t)) = −ωk2 Qk,α = − . (9.64)
∂Qk,α
Portanto, vemos que formalmente o campo eletromagnético pode ser considerado como sendo
um conjunto de osciladores harmônicos independentes. Este fato, é geralmente o ponto de
partida para a dedução do espectro da radiação do corpo negro de Planck. Nessa aproximação,
a densidade de energia eletromagnética é determinada como o número de modos (osciladores)
em um determinado intervalo de frequências multiplicada pela energia média de cada oscilador.
o Ingrediente fundamental na solução clássica da catástrofe do ultravioleta de Rayleigh, a qual
surge do fato de que nesse modelo cada oscilador harmônico contribui com uma energia média
KT . Notem que a quantização é imposta sobre os termos dependentes do tempo do campo.
Note ainda, que as duas variáveis canônicas introduzidas são independentes do tempo.

9.6 Quantização do campo eletromagnético


Agora, estamos preparados para quantizar o campo eletromagnético, e para isso iremos
considerar que Pk,α e Qk,α são operadores canonicamente conjugados que satisfazem as seguintes
relações de comutação
[Qk,α , Qk0 ,α0 ] = [Pk,α , Pk0 ,α0 ] = 0, (9.65)
[Qk,α , Pk0 ,α0 ] = i~δk,k0 δα,α0 . (9.66)
Agora consideremos combinações lineares dePk,α e Qk,α , dadas por

ωk Qk,α + iPk,α
ak,α = √ , (9.67a)
2~ωk
ωk Qk,α − iPk,α
a†k,α = √ , (9.67b)
2~ωk
onde [ak,α , a†k0 ,α0 ] = δkk0 δαα0 e [ak,α , ak0 ,α0 ] = [a†k,α , a†k0 ,α0 ] = 0.
Note que

 
ωk i
ak,α =√ Qk,α + Pk,α (9.68a)
2~ωk ωk
r
ωk √ 20 ωk
=√ · 2 0 Ck,α (t) = Ck,α (t) (9.68b)
2~ωk ~
Como
1
a†k,α ak,α = (ωk Qk,α − iPk,α )(ωk Qk,α + iPk,α ),
2~ωk
1
a†k,α ak,α = [(ωk Qk,α )2 + (Pk,α )2 + iωk Qk,α Pk,α − iωk Pk,α Qk,α ],
2~ωk
1
a†k,α ak,α = [(ωk Qk,α )2 + (Pk,α )2 − ωk ~],
2~ωk

Prof. Salviano A. Leão 225


9.6. Quantização do campo eletromagnético

então,  
1 † 1
(ωk Qk,α )2 + (Pk,α )2 =

ak,α ak,α + ~ωk , (9.69)
2 2
logo o operador Hamiltoniano do campo livre é dado por,
X † 1

H= ak,α ak,α + ~ωk . (9.70)
k,α
2

Definindo Nk,α = a†k,α ak,α , temos


X 1

H= Nk,α + ~ωk . (9.71)
k,α
2

Aqui Nk,α é interpretado como o autovetor que possui o seguinte autoestado |nk,α i com um
autovalor dando o número de fótons no estado cujo modo do campo é dado por ν = (k, α). O
fator 1/2 representa a energia de ponto zero de um oscilador Harmônico. Usando a notação
ν = (k, α) para o respectivo modo do campo, o operador número é agora dado por

Nν = a†ν aν (9.72)

e consequentemente
X 1

H= Nν + ~ωk . (9.73)
ν
2
Note que o índice k = |k|, está incluso na soma em ν.
Então nesse ponto, surge a seguinte questão: quais são os vetores de estados que esse operador
atua?
Denotando a energia de um único modo de oscilador ν, associada ao autovetor |nν i, com
nν = 0, 1, 2, . . . são os números quânticos usuais do oscilador, e aqui dizem quantos fótons
estão associados ao modo ν do oscilador. Esses kets podem expandir o espaço de estados Eν
associados com um único modo, o qual é o espaço no qual os operadores Qν e Pν (para um dado
valor de ν) atuam. O ket de todo espaço de estados Eem do campo eletromagnético é dado pelo
produto tensorial dos espaços de estados de cada modo, ou seja,
Y
Eem = ⊗Eν . (9.74)
ν

Os autoestado de H são especificados por um lista infinita de números quânticos

{nν } = {n1 , n2 , n3 , . . . , nν−1 , nν , nν+1 , . . .}

sendo um número para cada modo do campo, seus auto estado são agora escritos como

|{nν }i = |n1 , n2 , . . . , nν , . . .i (9.75)


Y
|n1 , n2 , . . . , nν , . . .i = ⊗ |nν i (9.76)
ν

= |n1 i ⊗ |n2 i ⊗ · · · ⊗ |nν i ⊗ · · · (9.77)

Prof. Salviano A. Leão 226


9.6. Quantização do campo eletromagnético

Os operadores de criação e aniquilação atuam da seguinte forma:



aν |n1 , n2 , . . . , nν , . . .i = nν |n1 , n2 , . . . , nν − 1, . . .i (9.78)

a†ν |n1 , n2 , . . . , nν , . . .i = nν + 1 |n1 , n2 , . . . , nν + 1, . . .i (9.79)

A base {|n1 , n2 , . . . , nν , . . .i} é chamada de base de ocupação de números.


O estado de mais baixa energia de (9.71), o estado fundamental do campo livre, associado
com nν = 0 é chamado de estado de vácuo e é representado pelo ket |0i, ou seja,

|0i = |01 , 02 , . . . , 0ν , . . .i (9.80)

ou ainda usando a notação anterior



|0i = |0k1 ,α1 i ⊗ |0k2 ,α2 i ⊗ |0k3 ,α3 i ⊗ · · · ⊗ 0kj ,αj ⊗ · · · (9.81)

Este estado é tal que para todos os valores de ν = (k, α), temos

ak,α |0i = aν |0i = 0 e h0| a†k,α = h0| a†ν = 0. (9.82)

Aplicando-se sucessivamente o operador de criação sobre o estado de vácuo, pode-se construir


um autoestado qualquer de energia, o qual é
Y 1 nν
|n1 , n2 , . . . , nν , . . .i = √ a†ν |0i (9.83)
ν
nν !

ou ainda
Y 1 

nk,α
nk1 ,α1 , nk2 ,α2 , . . . , nk
j ,αj
, . . . = p a k,α |0i (9.84)
k,α
n k,α !

Se aplicarmos o operador criação a†k,α em um desses osciladores do estado fundamental,


obtemos

a†kj ,αj |0i = |0k1 ,α1 i ⊗ |0k2 ,α2 i ⊗ · · · ⊗ a†kj ,αj 0kj ,αj ⊗ · · ·

(9.85)

= |0k1 ,α1 i ⊗ |0k2 ,α2 i ⊗ · · · ⊗ 1kj ,αj ⊗ · · · (9.86)

Por simplicidade representamos esse estado por

= a†kj ,αj |0i



1k (9.87)
j ,αj

o que significa que todos os osciladores exceto aquele especificado pelo índice vetorial k e pelo
estado da polarização α estão no estado fundamental.
A energia desse estado é determinada atuando o operador Hamiltoniana nele,
 
X † 1
H |1k,α i = ~ωk0 ak0 ,α0 ak0 ,α0 + |1k,α i (9.88)
0
k ,α 0
2

chamando
1X
E0 = ~ωk0 (9.89)
2 k0 ,α0

Prof. Salviano A. Leão 227


9.7. A energia do vácuo

e observando que
a†k,α ak,α |1k,α i = |1k,α i (9.90)
enquanto
a†k0 ,α0 ak0 ,α0 |1k,α i = 0 Para k 6= k0 ; α 6= α0 (9.91)
segue então
H |1k,α i = (E0 + ~ωk ) |1k,α i (9.92)
Portanto, a energia adicionada ao modo ν = (k, α) do sistema pela ação do operador número
Nk,α = a†k,α ak,α é ~ωk .

9.7 A energia do vácuo


O vácuo é o estado de menor energia do campo eletromagnético e sua energia é dada por
1X
E0 = h0|H|0i = ~ωk = ∞, (9.93)
2 k,α

e infelizmente essa soma é infinita, ou seja, a energia do estado de vácuo é infinita.


A menos que haja algum corte (“cut-off ”) na teoria que limite o número de osciladores com
frequências arbitrariamente altas, esta soma diverge, porque há um número infinito de tais
osciladores. Apesar disso é conveniente tratarmos E0 como se tivesse um valor finito. Veremos
que somente as diferenças em energia é que são relevantes.
A energia de vácuo é dada por uma soma infinita das energias de ponto zero de todos os
osciladores que compõem o campo. No caso de osciladores harmônicos mecânicos com um
número finito de graus de liberdade, a energia do ponto zero é real e fisicamente significativa,
mas aqui no caso do campo eletromagnético é um constrangimento que causa dificuldades na
sua interpretação física. A energia do ponto zero é apenas uma das várias classes de infinitos que
surgem na teoria quântica de campos, e é um dos mais fáceis de eliminar por uma racionalização.
Em uma das abordagens, argumenta-se simplesmente que para a maioria dos processos físicos a
definição da origem da energia é uma questão de convenção, uma vez que é apenas as diferenças
de energia que importam. Adicionando uma constante no Hamiltoniano não afeta as equações de
movimento (tanto as equações de Hamilton clássicas ou as equações de Heisenberg na mecânica
quântica), então devemos ser capazes de jogar fora a energia do ponto zero, uma vez que ela é
apenas uma constante, embora uma constante infinita.
Em outra abordagem, pode-se argumentar que a energia do ponto zero está conectada com
as ambiguidades da quantização da Hamiltonianas clássicas contendo ordenações não triviais
das variáveis canônicas q e p. É verdade que o Hamiltoniano (9.62) não possui produtos do tipo
q · p, mas isso só é verdade para o par de coordenadas canônicas (Qk,α , Pk,α ). Para um outro par
qualquer de coordenadas canônicas não haveria produtos não triviais. Por exemplo, classicamente,
não há diferença entre a∗k,α ak,α e ak,α a∗k,α , mas na mecânica quântica a†k,α ak,α = ak,α a†k,α − 1.
Portanto, se decidirmos quantizar simplesmente substituindo os ak,α e a∗k,α respectivamente
por ak,α e a†k,α o então operador hamiltoniano irá depender do ordenamento clássico dos ak,α e

Prof. Salviano A. Leão 228


9.8. Operadores criação e aniquilação

a∗k,α . Mas usando diferentes ordenamentos pode-se obter o Hamiltoniano (9.70), ou um outro
tendo duas vezes a energia do ponto zero, ou um que não tem energia do ponto zero. Sem
usar qualquer processo de racionalização, em geral usa-se a última abordagem, de modo que o
hamiltoniano do campo eletromagnético toma a seguinte forma
X
H= Nk,α ~ωk (9.94)
k,α

e com isso, a energia do estado |. . . , nk,α , . . .i é dada por


!
X
H |. . . , nk,α , . . .i = nk,α ~ωk |. . . , nk,α , . . .i
k,α

ou
X
h. . . , nk,α , . . . |H| . . . , nk,α , . . .i = nk,α ~ωk .
k,α

E para esse caso em particular a energia do vácuo é zero.

9.8 Operadores criação e aniquilação


Das relações de comutação entre os operadores aαk e a†k,α temos que

a†k,α |nk,α i =
p
nk,α + 1 |nk,α + 1i (9.95)

e que

ak,α |nk,α i = nk,α |nk,α − 1i (9.96)

Portanto, é natural chamarmos o operador a†k,α de operador de criação de um fóton, já que ele
aumenta por um o número de fótons de um estado. Similarmente chamamos o operador ak,α de
operador aniquilação de um fóton, já que ele reduz em um o número de fótons de um estado.
Pode-se criar um estado com nk,α fótons, cada um com momentum ~k e polarização ˆk,α ,
atuando o operador criação a†k,α nk,α vezes sobre o estado de vácuo, ou seja,
 nk,α

ak,α
|nk,α i = p |0i (9.97)
nk,α !

9.9 A energia de ponto zero é real?


A mecânica quântica é uma das mais bem testadas teorias da física e a sua correção só pode
ser verificada por comparação com o experimento. A energia de ponto zero [?, ?] é um desses
aspectos e a pergunta que se faz é: Existem consequências físicas observáveis da energia de ponto
zero, que acabou de ser negligenciada? Em um oscilador mecânico, pode-se, em princípio, alterar
a constante da mola, isto é, a frequência do oscilador. Se tomarmos um oscilador harmônico,
inicialmente, em seu estado fundamental, e mudar lentamente a frequência do seu valor inicial
zero, então o trabalho é feito como se o pacote de onda do estado fundamental expandisse

Prof. Salviano A. Leão 229


9.9. A energia de ponto zero é real?

Figura 9.1: Duas placas perfeitamente condutoras eletricamente neutras e paralelas entre si são
atraídas uma pela outra, devido a flutuação do vácuo quântico. Efeito previsto teoricamente por
Hendrik B. G. Casimir em 1948 [?] e confirmada experimentalmente por Steven Lamoreaux em 1996 [?]

lentamente. É como o trabalho realizado por um gás quando o volume de seu recipiente é
aumentado. Deste modo, a energia do estado fundamental ~ω/2 pode ser acessada. Há muitas
outras maneiras de demonstrar que a energia de ponto zero de um oscilador mecânico é real.
No caso do campo eletromagnético que não podemos mudar as frequências dos modos, mas
podemos mudar a estrutura dos modos com os condutores que mudam as condições de contorno
satisfeitas pelo campo eletromagnético. Por exemplo, vamos considerar um capacitor de placas
paralelas. Para simplificar considere que as ondas eletromagnéticas do espaço serão modificadas
a partir do que seria no espaço vazio, devido à presença dos condutores [?]. Em particular, as
ondas de luz entre as placas têm uma estrutura de modo semelhante as autofunções de uma
dada energia de uma partícula dentro de uma caixa.
Se o campo electromagnético na presença das placas for quantizado, obtém-se um oscilador
harmônico para cada modo, tal como na ausência das placas, e a energia total de ponto zero
ainda é infinita. Mas verifica-se que é possível fazer a diferença entre a energia infinita do ponto
zero na presença das placas, e aquela da ausência das placas, e que ela faz sentido e o resultado
é finito [?, ?, 25], para maiores detalhes do cálculo veja por exemplo Greiner [?, 14] ou o artigo
original. Ou seja, pode-se entender a diferença entre dois infinitos. Esta diferença pode ser
interpretada como uma mudança da energia do estado fundamental do campo quando as placas
são introduzidos. Acontece que ela depende da distância entre as duas placas [?, ?, 8, 26]. Assim,
obtém-se a previsão de que, como a distância entre as placas é variável, o trabalho tem de ser
feito para compensar a variação na energia de ponto zero. Isto é, deve haver uma força entre as
placas. Este é o chamado efeito Casimir, pois sua existência foi prevista teoricamente pelo físico
holandês Hendrik Brugt Gerhard Casimir em 1948 [?] e confirmada experimentalmente pelo

Prof. Salviano A. Leão 230


9.9. A energia de ponto zero é real?

físico norte americano Steven Ken Lamoreaux em 1996 [?]. O efeito Casimir é um dos vários
fenômenos que fornecem provas convincentes para a realidade do vácuo quântico - o equivalente
em mecânica quântica de que, na física clássica, poderia ser descrito como o espaço vazio.
O efeito Casimir foi testado experimentalmente, e os resultados estão de acordo com a teoria.
As experimentos atuais não usam um par de placas metálicas, já que é experimentalmente difícil
mantê-las exatamente paralela, mas a ideia básica é a descrita aqui. Tem havido um interesse
renovado no efeito Casimir, nos últimos anos, por causa de aplicações física em uma escala
nanométrica.
Embora a força de Casimir pareça ser completamente absurda, atualmente ela já é bem
compreendida. Nos velhos tempos da mecânica clássica o vácuo era o que restava quando
esvaziava-se um recipiente de todas as suas partículas e baixava-se sua temperatura até o zero
absoluto. A chegada da mecânica quântica, no entanto, mudou completamente a nossa noção
de um vácuo. Todos os campos - em particular campos electromagnéticos - possuem flutuações.
O vazio não é realmente vazio. Ele está cheio de partículas virtuais, que estão em um estado
contínuo de flutuação. Um par virtual de partícula antipartícula pode ser criado a partir de
vácuo e em seguida aniquilado voltando a vácuo. Estas partículas virtuais existem por um
tempo muito curto ditado pela relação de incerteza de Heisenberg.

∆E · ∆t = ~

Os fótons (os quanta das ondas eletromagnéticas) são as partículas virtuais dominantes nas
flutuações do vácuo, mas outras partículas também são produzidas.
Um vácuo não é simplesmente “nada”, mas é melhor descrito como uma superposição de
muitos estados diferentes do campo eletromagnético. Assim, a criação e subsequente absorção
de fótons pelo vácuo implica que há flutuações do vácuo.
No entanto, as flutuações do vácuo não são uma abstração da mente de um físico. Elas têm
consequências observáveis que pode ser observadas diretamente em experiências realizadas em
uma escala microscópica. Por exemplo, um átomo em um estado excitado não permanecerá
lá por um tempo infinitamente longo, mas vai voltar ao seu estado fundamental, emitindo um
fóton espontaneamente. Este fenômeno é uma consequência das flutuações de vácuo. A força
de Casimir é o mais famoso efeito mecânico de flutuação do vácuo. A força de Casimir surge
entre dois espelhos no vácuo, como uma consequência da pressão de radiação de flutuação do
vácuo [?].
Casimir realizou seu cálculo para uma configuração geométrica em que prepara-se duas
placas perfeitamente condutoras (espelhos), eletricamente neutras e paralelas entre si no vácuo,
conforme ilustrado pela figura 9.1.
Essencialmente o efeito Casimir deve-se:

• a natureza geométrica da configuração das placas;

• ao fato de que o espaço entre as duas placas é diferente do espaço externo a elas, e
consequentemente a flutuação do vácuo é diferente em ambas as regiões.

Prof. Salviano A. Leão 231


9.10. Propriedades dos fótons

• ao fato de que a flutuação do vácuo exerce diferentes forças sobre os lados internos e
externo das placas, o que resulta em uma pressão líquida que aproxima as placas.

A força de Casimir e a estatística das partículas

• além dos fótons há outras partículas que também fornecem uma pequena contribuição,
porém somente a força devida aos fótons é mensurável;

• os fótons são bósons pois obedecem a estatística de Bose-Einstein, e todos os bósons assim
como os fótons exercem uma força atrativa enquanto os férmions, partículas que obedecem
a estatística de Fermi-Dirac, exercem uma força repulsiva.

Note que a energia do ponto zero não é apenas uma energia infinita, ela é uma densidade de
energia infinita. Isso é porque está sendo usada uma caixa de normalização, então quando
divide-se o (infinito) da energia de ponto zero pelo volume V da caixa, ainda obtém-se um
resultado infinito. Foi dito anteriormente, que para a maioria dos processos físicos somente as
diferenças de energia é que são importantes, mas há um lugar no qual a quantidade absoluta de
energia é importante, e esse é o caso da gravidade. Como a energia e massa estão relacionadas
por E = mc2 , a energia corresponde a massa que produz campos gravitacionais. Uma densidade
de massa infinita, obviamente, não faz sentido na teoria gravitacional, mas pode-se argumentar
que a soma sobre modos na soma em (9.93) para a energia do ponto zero deve ser interrompida
(cortada) quando o comprimento de onda torna-se comparável ao comprimento de Planck. Isto
fornece uma densidade de energia muito grande, mas finita no espaço [?, ?]. A densidade de
energia é uma componente do tensor de esforços e energia, que é a fonte do campo gravitacional
na relatividade geral. As outras componentes do tensor de esforços e energia associado com o
ponto de zero do campo também pode ser calculado, e elas dão origem a um termo de fonte nas
equações de Einstein para o campo gravitacional que é da forma Λgµν , isto é, eles têm a mesma
forma que o termo cosmológico, onde Λ é a constante cosmológica. Observações recentes dão
um valor numérico pequeno e positivo para a constante cosmológica. Infelizmente, o valor de Λ
obtido a partir da a dinâmica do ponto de zero dos campos quânticos é muito maior do que o
valor observado (algo por um fator da ordem de 10120 ). Ninguém sabe a razão para esta grande
discrepância, mas subsiste a suspeita de que a dinâmica do ponto zero de campos quânticos
têm algo a ver com o termo cosmológica na relatividade geral, e, portanto, com a expansão do
universo.

9.10 Propriedades dos fótons


Viu-se que classicamente a variável normal aν é proporcional a amplitude da onda plana
eletromagnética de modo ν = (k, α). Portanto a quantidade clássica |aν |2 = aν a∗ν é proporcional
a energia do respectivo modo. Porém, no tratamento quântico dado, encontrou-se que a energia
do modo ν = (k, α), a qual é proporcional ao valor esperado do operador número Nν = a†ν aν , é
quantizada em unidades de ~ωk conforme a equação 9.92. Esta é de fato exatamente a mesma

Prof. Salviano A. Leão 232


9.11. Operador Momentum do campo e dos fótons

hipótese originalmente proposta por Max Planck que foi desenvolvida por Albert Einstein, a
qual interpretava o estado quântico com o número quântico nν com como aquele contendo nν
fótons, cada com uma energia~ωk .
Foi Max Planck quem propôs que a energia transferida entre a radiação e a matéria deveria
ocorrer em unidade de ~ω. Porém foi Albert Einstein que insistiu que a energia no campo
deveria ser restrita a múltiplos inteiros de ~ω (isto é, a energia em um modo de frequência ω).
Ele também sugeriu que estes quantum de energia deveriam ser associados com partículas, isto
é, partículas de luz. Na época todo mundo achava que Einstein era louco, mas no final, ele
provou estar certo. O termo fóton foi cunhado por Gilbert N. Lewis em 1926 (Veja a origem da
palavra fóton [21]).
Atualmente o fóton é dito ser o quantum da radiação eletromagnética (o que inclui a luz),
dentro do contexto da física de partículas elementares ele é interpretado como a partícula
elementar mediadora da força eletromagnética.
A troca de fótons “virtuais” entre as partículas como os elétrons e os prótons é descrita pela
eletrodinâmica quântica, a qual é a parte mais antiga do Modelo Padrão da física de partículas.
Ele interage com os elétrons e núcleo atômico sendo responsável por muitas das propriedades da
matéria, tais como a existência e estabilidades dos átomos, moléculas, e sólidos.
Assim, temos o início da interpretação de partícula dos estados quânticos que pertencem
ao espaço de estados do campo eletromagnético livre quantizado Eem . Na discussão a seguir,
esta interpretação será gradualmente aperfeiçoada, analisando-se sucessivamente o momentum,
momentum angular e de spin e a estatística destas partículas chamada de fóton. No desen-
volvimento a seguir, sera visto que o formalismo desenvolvido para a quantização do campo
eletromagnético livre incorpora uma descrição via mecânica quântica de um sistema no qual as
partículas podem ser criadas ou destruídas, de modo que o número de partículas é variável. As
partículas em questão são fótons, que podem ser criados em números arbitrários em energias
arbitrariamente baixas, porque eles possuem massa.

9.11 Operador Momentum do campo e dos fótons


Albert Einstein também sugeriu que um fóton de energia ~ω deveria ter um momentum de
~k, no qual a frequência ω e o vetor de onda k estão relacionados pela relação de dispersão
clássica de ondas de luz, ω = c|k|. Agora será analisado o momentum do campo eletromagnético
e do fóton.
Note que no tratamento dado foi adicionado um momentum ao sistema. Embora classicamente
o campo eletromagnético transporte momentum. De fato, a direção do momentum do campo é
a mesma do vetor Poynting ˆ
2
Sp = c 0 d3 r (E × B) (9.98)
V
o qual fornece a energia do campo por unidade de área por unidade de tempo. Ao colocar um
disco negro na frente de uma fonte de luz, tal como ilustrado na fig. 9.2, o disco vai recuar
e aquecerá à medida que absorve momentum e energia do campo. O operador momentum

Prof. Salviano A. Leão 233


9.11. Operador Momentum do campo e dos fótons

A)

B) C)
Figura 9.2: Absorção de fótons por um disco negro. A)Um disco negro recua ao absorver fótons. B) e
C) A taxa de rotação aumenta ao absorver fótons circularmente polarizados, seja para a direita |Ri ou
para a esquerda |Li [?].

do campo eletromagnético foi construído para expressar os operadores de campo elétrico e


magnético em termos do potencial vetor, assim o operador momentum é dado por
ˆ ˆ  
3 3 ∂A
P = 0 d r (E × B) = 0 dr − × (∇ × A) (9.99)
V V ∂t

Note que classicamente os campos são funções dos coeficientes aν e a∗ν , os quais estão
relacionados aos coeficientes Cν (t) pela equação (9.68b). Agora iremos reescrever os campos em
termos os coeficientes aν e a∗ν , para obtermos os respectivos operadores quânticos. Substituindo
os coeficientes Cν (t) pelos aν nas expressões dos campos obtém-se que

r
~
Ck,α (t) = · ak,α (t) (9.100)
20 ωk
logo o potencial vetor e os campos serão dados por

r
~ X 1  
A(r, t) = √ ˆk,α ak,α (t)eik·r + ˆ∗k,α a†k,α (t)e−ik·r , (9.101a)
20 V k,α ωk
r
~ X√  
E(r, t) = − ωk iˆk,α ak,α (t)eik·r − iˆ∗k,α a†k,α (t)e−ik·r , (9.101b)
20 V k,α
r
~ X 1 h i
i (k × ˆk,α ) ak,α (t)eik·r − i k × ˆ∗k,α a†k,α (t)e−ik·r

B(r, t) = √ (9.101c)
20 V k,α ωk

Aqui, assim como na teoria clássica de campos, as coordenadas r e o tempo t não são nada
mais do que meros parâmetros dos campos, porém agora os campos são operadores, já que o seu
lado direito é expresso por uma combinação linear dos operadores ak,α (t) e a†k,α (t). Portanto,
agora A(r, t), E(r, t) e B(r, t) são operadores de campo que atuam sobre o espaço de estados do

Prof. Salviano A. Leão 234


9.11. Operador Momentum do campo e dos fótons

campo eletromagnético livre quantizado Eem . Eles são os nossos primeiros exemplos de campos
quânticos.
Note que, assim como os campos clássicos são reais, estes campos quânticos são Hermitianos.
Como de costume na mecânica quântica, os operadores hermitianos correspondem a medidas que
podem ser feitas em um sistema físico, e tais medidas estão sujeitas a flutuações estatísticas e
as restrições do princípio da incerteza. Veremos que esses elementos estão presentes na medição
dos campos electromagnéticos quantizados.
Retornando ao momentum, a expressão 9.99 para P é clássica. O campos clássicos E e
B que surgem no integrando de (9.42) podem ser expandidos como combinações lineares dos
coeficientes aν e a∗ν , de acordo com as equações (9.43) e (9.44). Mas quando substituir um aν e
a∗ν por um aν e a†ν , a fim de obter a expressão quantizada para P, surge a questão da ordenação
adequada dos coeficientes clássicos aν e a∗ν . Poder-se-ia seguir simplesmente a ordem dada pelo
produto de E × B, mas isso, como se vê leva a um momentum de ponto zero infinito, bem
como a energia de ponto zero na equação (9.93). Gostaríamos de ter h0|P|0i = 0, portanto,
o momentum do vácuo desapareceria. Isso pode ser feito se na ordem de aν e a∗ν da fórmula
clássica, colocarmos todos os a∗ν à esquerda dos aν e, depois de substituir um aν e a∗ν por um aν
e a†ν . Então, quando o valor esperado do momentum P do vácuo for calculado, haverá sempre
um operador aniquilação atuando a esquerda do ket do vácuo|0i, ou um operador de criação ao
lado direito do bra do vácuo h0|, e o resultado será nulo.
Com um procedimento análogo ao do cálculo da energia, encontra-se que o operador momento
é
X
P = ~k(a†k,α ak,α + ak,α a†k,α ) (9.102)
k,α
X 1 X
P = (Nk,α + )~k = ~k Nk,α (9.103)
k,α
2 k,α

Note que o último termo do operador momentum não contribui porque


X
~k = 0 (9.104)
k,α

pois cada vetor k da soma será cancelado pelo vetor −k. Portanto, o valor esperado do operador
momentum no estado de vácuo é
P |0i = 0. (9.105)
Considerando o efeito de H e P sobre o estado de um único fóton;

Ha†k,α |0i = H |1k,α i = (E0 + ~ωk ) |1k,α i (9.106)

Pa†k,α |0i = P |1k,α i = ~k |1k,α i (9.107)


Portanto, o estado |1k,α i em relação ao estado de vácuo, possuí um momentum adicional ~k e
uma energia adicional ~ωk que são respectivamente, o momentum e a energia do fóton. Como
ωk = |k|c, a energia adicional e o momentum adicional estão relacionados por E = pc = ~|k|c =
~ωk , como deveria ser para uma partícula que se move com a velocidade da luz, ou seja, o fóton.

Prof. Salviano A. Leão 235


9.11. Operador Momentum do campo e dos fótons

A massa do fóton é dada por

1
E 2 = m2 c4 + |P|2 c2 m2 = 2 2 2

=⇒ E − |P| c
c4
logo

1 
m2 = 2 2

(~ωk ) − (~|k|c) = 0.
c4

9.11.1 Polarização do fóton


O estado do fóton é caracterizada não apenas por seu momentum mas também pelo vetor
polarização ˆk,α . Desde ˆk,α transforma-se como um vetor, a teoria geral do momento angular
nos encoraja-nos a associar a ele uma unidade de momentum angular. Isto é o que se entende
pela afirmação de que o fóton tem um momento angular de spin unitário. Para encontrar as
componentes do spin será considerado inicialmente que
1
ˆk,± = ∓ √ (ˆk,1 ± iˆk,2 ) ,
2
os quais são chamados de vetores de polarização circular. Por uma rotação infinitesimal de δφ
em torno da direção de propagação k, os vetores de polarização circular mudam da seguinte
forma
δφ
δˆk,± = ∓ √ (ˆk,2 ∓ iˆk,1 ) = ∓iδφˆk,± .
2
É por isso que as componentes ˆk,± foram associadas com o spin m = ±1, onde o eixo de
quantização foi escolhido na direção de propagação. Se ˆk,α estivesse ao longo de k, poderíamos
associar m = 0 (desde que k não é alterado por uma rotação infinitesimal em torno de k);
entretanto, o estado m = 0 está ausente na expansão do operador potencial vetor A(r, t) devido
a condição transversalidade k · ˆk,α = 0. Em outras palavras, o spin do fóton ou é paralelo ou
antiparalelo a direção de propagação. Deve-se notar que a ausência do estado m = 0 tem um
significado invariante apenas para uma partícula cuja massa é estritamente zero. Se a massa dos
fótons fosse diferente de zero, poder-se-ia realizar uma transformação de Lorentz, tal que, no
novo referencial do fóton ele estaria em repouso; em tal referencial o spin do fóton é “paralelo a
nada” [33].
A descrição do estado de polarização com ˆk,± tal como vetores de base é denominada a
representação da polarização circular, em contraste com a representação de polarização linear
baseada em ˆk,1 e ˆk,2 . As relações de ortogonalidade para ˆk,± são

ˆk,± · ˆ∗k,± = −ˆk,± · ˆ∗k,∓ = 1


ˆk,± · ˆ∗k,∓ = −ˆk,± · ˆ∗k,± = 0
k · ˆk,± = 0.

Poderia se ter começado com uma expansão de A(r, t) comˆk,± no lugar de ˆk,1 e ˆk,2 . Um
estado de fóton único com polarização circular definida pode ser construído aplicando-se o

Prof. Salviano A. Leão 236


9.11. Operador Momentum do campo e dos fótons

operador de criação
1  
a†k,± = ∓ √ a†k,1 ± ia‡k,2
2
ao estado de vácuo |0i. Por outro lado, a†k,α |0i, com α = 1, 2 e k = kêz estando na direção z,
esse estado pode ser considerado como uma mistura de 50% dos estado com m = +1 e m = −1.
Como foi dito antes, o rótulo α no estados de um fóton |nk,α i indicam o seu estado de
polarização. Por exemplo, para um fóton viajando na direção k = kêz , o estado de um fóton
|1k,1 i é um fóton com polarizaçãoêx enquanto o estado |1k,2 i indica um estado de um fóton com
polarizaçãoêy . Em particular o estado polarizado circularmente a direita é dado por
1
|Ri = a†k,+ |0i = − √ (|1k,1 i + i |1k,2 i)
2
1  † 
= − √ ak,x |0i + ia†k,y |0i
2
enquanto o fóton circularmente polarizado a esquerda é dado por
1
|Li = a†k,− |0i = √ (|1k,1 i − i |1k,2 i)
2
1  † †

= √ ak,x |0i − iak,y |0i
2
Para resumir, o postulado quântico aplicado às variáveis canônicas da radiação oscilante
conduz naturalmente à ideia de que as excitações do campo de radiação da mecânica quântica
podem ser consideradas como partículas de massa zero e spin um. É uma característica geral
da teoria quântica de campos que, com todos os campos que nós associamos uma partícula de
massa definida e spin. Os argumentos que apresentamos podem ser repetidos para a quantização
de outros campos praticamente sem modificações.
Usando a teoria quântica do campo eletromagnético, pode-se verificar que esses estados
correspondem respectivamente aos autoestado de momentum angular +~ e −~, ao longo da
direção do momentum do fóton, verificando que
   
J·k 1  † † 1  † †
√ ak,x |0i + iak,y |0i = ~ √ ak,x |0i + iak,y |0i
|k| 2 2
e que 
J·k 1  †  
1  † 
† †
√ ak,x |0i − iak,y |0i = −~ √ ak,x |0i − iak,y |0i .
|k| 2 2
Note que o operador momentum angular do campo eletromagnético é dado por
ˆ
J = 0 d3 r r × (E × B) . (9.108)
V

O fóton possui um spin intrínseco de valor um. Dá física clássica sabe-se que há um momento
angular no campo eletromagnético dado pela expressão (9.108). Por exemplo, o disco negro
representado na fig. 9.2 irá começar a girar em torno do seu eixo, se o campo electromagnético
incidente sobre o disco for circularmente polarizado. Mas é claro que esse fenômeno é devido
somente à mecânica quântica desde que seu momento angular é quantizado em unidades de ~.

Prof. Salviano A. Leão 237


9.12. Flutuações e relações de incerteza

Devido ao valor do spin do fóton, ele obedece a estatística de Bose-Einstein, qual permite que
diversas partículas compartilhem o mesmo estado, e portanto é um bóson. Isto é confirmado por
(9.97), a qual mostra que há mais do que um fóton com o mesmo momentum ~k e polarização
α no mesmo estado. Esta conexão entre o spin e a estatísticas entrou realmente na teoria na
escolha de que os operadores de criação e aniquilação dos fótons obedecem relações de comutação.
Uma forma alternativa de conectar a mecânica quântica com a teoria de campos, dá-se pelas
relações de anticomutação, a qual limita o número de partículas que podem estar no mesmo
estado de uma partícula.

9.12 Flutuações e relações de incerteza


Note que nem o número de ocupação individual o operador Nν e nem o operador número
total, definido por
X X
N= Nν = a†ν aν (9.109)
ν ν

comutam com A(r, t), E(r, t) e B(r, t), uma vez que os campos são uma soma de operadores de
criação e aniquilação. Portanto, esses observáveis não podem ser determinados simultaneamente
com um grau de precisão arbitrário.
Observáveis correspondentes a operadores que não comutam tem um princípio de incerteza
entre eles. Portanto, não pode-se fixar o número de fótons e conhecer os campos exatamente.
Flutuações no campo ocorrerá mesmo no estado de vácuo, onde sabemos que não há fótons.
É claro que o valor médio do vetor campo eléctrico ou magnético é zero, por simetria. Para
se ter uma ideia sobre o intensidade das flutuações do campo, devemos olhar para o valor
quadrático médio do campo, por exemplo, no estado de vácuo.
Se o número de fótons for aproximadamente fixo, como no caso do estado de vácuo, então deve
existir uma incerteza na intensidade dos campos. Para verificarmos isso considere o operador do
campo elétrico,
r  
~ Xp 0 0 0
E(r, t) = − ωk iˆk0 ,α0 ak0 ,α0 (t)eik ·r − a†k0 ,α0 (t)e−ik ·r (9.110)
20 V k0 ,α0

Para um estado |nν i = |nk,α i fixo qualquer temos que:


r
~ωk
hnk,α |E(r, t)|nk,α i = −iˆk,α ×
20 V
hnk,α |ak,α (t)eik·r − a†k,α (t)e−ik·r |nk,α i = 0

pois

hnk,α |ak,α (t)|nk,α i = hnk,α |a†k,α (t)|nk,α i = 0. (9.111)

Prof. Salviano A. Leão 238


9.12. Flutuações e relações de incerteza

X ~ωk 0 0
hnν |E · E† |nν i = ˆν 0 · ˆν 00 hnν | (aν 0 (t)eik ·r − a†ν 0 (t)e−ik ·r )× (9.112)
ν 0 ,ν 00
20 V
00 ·r 00
(a†ν 00 (t)e−ik − aν 00 (t)eik ·r ) |nν i (9.113)
X ~ωk0
= hnν |(aν 0 a†ν 0 + a†ν 0 aν 0 )|nν i (9.114)
ν0
20 V
X ~ωk0
= hnν |(2a†ν 0 aν 0 + 1)|nν i (9.115)
ν0
20 V
X ~ωk  1

= nν + δν,ν 0 (9.116)
ν 0
0V 2

Devido ao fator 1/2 vê-se que essa soma é infinita, logo para o estado do vácuo temos que

h0|E · E† |0i − | h0|E|0i |2 = h0|E · E† |0i = ∞. (9.117)

Portanto, nos casos em que os números de ocupação estão fixados, a intensidade dos campos
ficam completamente indeterminados [33]. Esse cálculo é ilustrativo ainda que a resposta seja
infinita. Basicamente, um termo proporcional a aν a†ν primeiro cria um fóton para em seguida
absorvê-lo dando uma contribuição diferente de zero para cada modo de oscilador. Soma-se
infinitos termos, mas devido aos seus infinitos comprimentos de onda infinitamente curtos, a
soma diverge. Mais uma vez, faz sentido em renormalizar a energia máxima.
O efeito dessas flutuações de campo sobre as partículas é mitigado pela mecânica quântica.
Na realidade, qualquer partícula quântica será distribuída ao longo de um volume finito e sua
área média sobre o volume pode fazer com que a partícula experimente uma força.
Por outro lado, uma vez que ao medirmos por um corpo de teste, é a intensidade média do
campo em alguma região do espaço que estamos medindo, portanto pode-se ser mais realista
ao considerar-se o valor médio do operador de campo sobre um ponto, por exemplo, a origem,
definido por ˆ
1
Ē = E d3 r
∆V ∆V
3
no qual ∆V = (∆`) é o volume de um cubo de lado ∆`, que contém o ponto em questão.
Pode-se mostra então que
~c
h0|Ē · Ē|0i ∼ .
(∆`)4
Esse resultado caracteriza as flutuações da intensidade do campo elétrico do vácuo quando não
há fótons presentes. Em geral se o conjunto de números de ocupação for aproximadamente fixo,
então o campo elétrico e o campo magnético não terão um valor preciso, mas apresentarão uma
flutuação em torno de um determinado valor.
Uma outra característica peculiar do campo de radiação quantizado, é que as componentes
dos campos E(r, t) e B(r, t) não necessariamente comutam. Temos por exemplo que


[Ex (r, t), By (r0 , t)] = i~c δ (r − r0 ) .
∂z
Prof. Salviano A. Leão 239
9.12. Flutuações e relações de incerteza

Portanto, disso segue que não se pode determinar simultaneamente os campos E(r, t) e B(r, t)
no mesmo ponto do espaço com um certo grau arbitrário de precisão. Porém, é possível mostrar
que 2
t − t0

0 0 2
[Ex (r, t), By (r , t)] = 0 para (r − r ) − 6= 0.
c
Portanto, não há qualquer interferência entre as medidas da intensidade dos campos realizadas
em dois pontos do espaço-tempo, separados por uma distância a qual não pode ser conectada
por um sinal de luz. Esse resultado está em conformidade com o princípio da causalidade da
teoria da relatividade especial.
Sabe-se da óptica clássica que um feixe de luz localizado ou convergente pode ser construído
por uma superposição de várias ondas planas com relações de fase definidas. Por este motivo,
será considerado o operador de fase φk,α associado com um dado modo do campo ν = (k, α), de
tal modo que o observável correspondente é a fase da onda plana em questão, no sentido da
óptica clássica. Isso pode ser feito através das seguinte definições

ak,α = ei(φk,α −ωt) Nk,α ,


p

a†k,α = Nk,α · e−i(φk,α −ωt)


p

p p
na qual o operador Nk,α , satisfaz a propriedade ( Nk,α )2 = Nk,α . O Campo de radiação
p
quantizada pode ser escrito de modo tal que os únicos operadores que surgem são Nk,α e φk,α :
r
1 XX ~ h i
ˆk,α ei(k·r−ωt+φk,α ) Nk,α + Nk,α ˆk,α e−i(k·r−ωt+φk,α ) ,
p p
A(r, t) = √
V k α 20 ωk

o qual, possui um forma conveniente para ser usada na discussão que conecta com a descrição
clássica. As relações de comutação para os operadores ak,α e a†k,α (para um dado modo ν = (k, α))
podem agora ser escritas como para um modo qualquer como

eiφ N e−iφ − N = 1,
eiφ N − N eiφ = eiφ ,

na qual os índices do modo ν = (k, α) foram suprimidos. É fácil provar, expandindo-se cada
exponencial, que cada relação de comutação acima é satisfeita se N φ − φN = i. Isso, nos conduz
a uma nova relação de incerteza para os correspondentes observáveis:

∆N ∆φ & 1.

Por exemplo, se a diferença de fase de duas componentes de uma onda plana é dada
precisamente, então não se pode dizer qual é o número de ocupação associado a cada uma das
componentes da onda.

Prof. Salviano A. Leão 240


Capítulo 10

Hamiltoniano de Interação

10.1 Onda Plana Eletromagnética


Uma onda plana eletromagnética, de forma geral tem a seguinte forma,

1 X  α ˆα ik·r −iwk t α∗ ˆα −ik·r iwk t



A(r, t) = √ Ck (0)ξk e e + Ck (0)ξk e e ,
V k,α

Ao considerar uma onda plana monocromática com uma frequência wk = ωδk0 ,k e polarização
ξˆα = êz , e vetor de onda k = kêy a expansão do potencial vetor A(x, t) acima tomará a seguinte
k
forma

1
Ckα (0)eiky e−iωt + Ckα∗ (0)e−iky eiωt êz ,

A(r, t) = √
V
a qual é ilustrada na figura 10.1.
Agora, chamando
Ckα (0)
A= √ (10.1)
V
temos então que
A(r, t) = Aeiky e−iωt + A∗ e−iky eiωt êz .


Figura 10.1: Onda eletromagnética plana.

241
10.1. Onda Plana Eletromagnética

Como temos uma onda, então é sempre possível considerar um calibre no qual

U (r, t) =0 (10.2a)
A(r, t) = Aei(ky−ωt) + A∗ e−i(ky−ωt) êz
 
(10.2b)

note ainda que nesse calibre temos que


∂  i(ky−ωt)
+ A∗ e−i(ky−ωt) = 0,

∇ · A(r, t) = Ae
∂z
portanto estamos usando o calibre de Coulomb.

10.1.1 Campos E e B
Como

E(r, t) = −∇U (r, t) − A(r, t) e B(r, t) = ∇ × A(r, t) (10.3)
∂t
então

E(r, t) =iω Aei(ky−ωt) − A∗ e−i(ky−ωt) êz


 
(10.4)
B(r, t) =ik Aei(ky−ωt) − A∗ e−i(ky−ωt) êx
 
(10.5)

Definindo,
1 1
E = iωA e B = ikA com E, B ∈ < (10.6)
2 2
em que E e B são duas quantidades reais tais que
E ω
= = c. (10.7)
B k
temos
1 
E(r, t) = E ei(ky−ωt) + e−i(ky−ωt) êz

(10.8)
2
1  i(ky−ωt)
+ e−i(ky−ωt) êx

B(r, t) = B e (10.9)
2

10.1.2 Vetor de Poynting S


Note que Z + Z ∗ = 2<Z e que Z − Z ∗ = 2i=Z portanto, temos que:

E(r, t) =E êz cos(ky − ωt) (10.10)


B(r, t) =Bêx cos(ky − ωt) (10.11)

E aqui, E e B são as amplitudes dos campos elétrico e magnético da onda plana considerada.
O Vetor de Poynting S associado a essa onda plana é:

S(r, t) =0 c2 E(r, t) × B(r, t) (10.12)


S(r, t) =0 cE 2 êy cos2 (ky − ωt) (10.13)

A média temporal deste deste vetor é dada por:


ˆ
1 T 1
S̄ = dt S(r, t) = 0 cE 2 êy (10.14)
T 0 2

Prof. Salviano A. Leão 242


10.2. Hamiltoniano de interação para baixas intensidades

10.2 Hamiltoniano de interação para baixas intensidades


interação com o núcleo estático é:

F = −∇V (r) (10.15)

O Hamiltoniano que descreve o movimento de


um elétron de carga q e massa m na presença
A força que atua sobre o elétron devido a da onda plana monocromática é

[P − qA(R, t)]2 q
H= + V (R) + qU (R, t) − S · B (10.16)
2m m
• Os termos qA(R, t) e qU (R, t) vem da interação do elétron com o campo eletromagnético
da onda plana. Note que eles dependem da escolha de calibre, que aqui U (R, t) = 0.

• O termo V (R) representa a interação com o núcleo.

• O termo −(q/m)S · B representa a interação do elétron com o campo magnético oscilante


da onda plana.

Expandindo o Hamiltoniano, lembrando que U (R, t) = 0, obtemos

P · P − q(P · A + A · P) + q 2 A · A q
H= + V (R) − S · B (10.17)
2m m
A diferença entre P · A e A · P pode ser determinada pela ação destes operadores em uma
função de onda arbitrária ψ(x),

(P · A) ψ(r) = −i~∇ · (Aψ) = −i~A · ∇ψ − i~ψ∇ · A.

Desde que ψ(r) é uma função de onda arbitrária, a relação acima pode ser escrita como uma
relação entre operadores:

P · A − A · P = −i~ (∇ · A) , (10.18)

a qual é mantida em qualquer representação, e com isto temos que:

P · A + A · P = 2P · A + i~ (∇ · A)
P · A + A · P = 2A · P − i~ (∇ · A)

Como é sempre possível escolher um potencial vetor A de tal modo que ∇ · A = 0, e esta
escolha de calibre é conhecida como calibre de Coulomb, e ela é feita frequentemente. Note que
para a onda plana representada pelo potencial vetor A(R, t), temos que a relação ∇ · A = 0 é
mantida. Deste modo, a forma geral do hamiltoniano na representação das coordenadas é
P2 q q2 2 q
H= + V (R) − P · A(R, t) + A (R, t) − S · B (10.19)
2m m 2m m
Prof. Salviano A. Leão 243
10.3. Luz de Baixa Intensidade

Este Hamiltoniano ainda pode ser escrito como

H = H0 + W (t) (10.20)

no qual o termo devido a interação do elétron com o átomo é


P2
H0 = + V (R) (10.21)
2m
e o termo de interação com a onda plana incidente é
q q2 2 q
W (t) = − P · A(R, t) + A (R, t) − S · B (10.22)
m 2m m

10.3 Luz de Baixa Intensidade


Como a intensidade de uma fonte luz comum é muito baixa, então o feito do termo A2 (R, t)
é negligenciável em relação ao termo diretamente proporcional a A(R, t). Com isso podemos
escrever,
W (t) ' WI (t) + WII (t) (10.23)

em que
q
WI (t) = − P · A(R, t) (10.24)
m
q
WII (t) = − S · B (10.25)
m
Note ainda que, para um estado ligado do elétron, a ordem de magnitude dos
WII (t) (q/m)~kA ~k
' = (10.26)
WI (t) (q/m)pA p
Devido a relação de incerteza para o momentum de um estado ligado do elétron temos que
~
a0 p ' ~ =⇒ ' a0 . (10.27)
p

Como para um átomo temos que a0 ' 0.529 Å e o comprimento de onda λ da onda plana
incidente está relacionado com o seu número de onda por k = 2π/λ. Como λ  a0 , temos então
que
WII (t) a0
' 1 (10.28)
WI (t) λ
Portanto, inicialmente considerar somente o termo WI (t), para em seguida considerar também
o termo WII (t).

10.4 Hamiltoniano do Dipolo-Elétrico


Usando a expressão para A(R, t), podemos escrever
q
Pz Aei(kY −ωt) + A∗ e−i(kY −ωt)
 
WI (t) = − (10.29)
m
Prof. Salviano A. Leão 244
10.5. Termo de Dipolo-Elétrico

Figura 10.2: Espectro eletromagnético, com destaque para a região visível.

Figura 10.3: Onda plana visível incidindo sobre o átomo.

Expandindo a exponencial e±ikY em potências de kY ,


1
e±ikY = 1 ± ikY − k 2 Y 2 + . . . (10.30)
2
Como Y é da ordem das dimensões atômica, temos então que
a0
kY '  1. (10.31)
λ
Portanto, manter somente o termo de ordem zero da expansão, ou seja, o 1 é uma boa aproximação
para WI (t). E esta é a aproximação conhecida como aproximação de dipolo-elétrico. Logo
trocando eikY por 1, e lembrando que A∗ = −A já que A é um imaginário puro, então obtemos
que
q  2iqA
Pz Ae−iωt + A∗ eiωt =

WI (t) = − Pz sen(ωt) (10.32)
m m

λ ' 5000 Å Para luz visível e a0 ' 0.529 Å (10.33)

10.5 Termo de Dipolo-Elétrico


Seja WDE (t) o operador obtido pela troca de eikY por 1, assim

qE
WDE (t) = Pz sen(ωt), (10.34)

Prof. Salviano A. Leão 245
10.6. Calibre Alternativo

Este termo é chamado de Hamiltoniano de Dipolo-Elétrico. Portanto a aproximação de dipolo-


elétrico consiste em negligenciar o termo WII (t) em relação a WI (t) e além disso identificamos
WI (t) como WDE (t).
Mostraremos a seguir que se trocarmos W (t) por WDE (t) o elétron irá oscilar como se ele
estivesse submetido a um campo elétrico senoidal uniforme

E(r, t) = E êz cos(ωt), (10.35)

cuja amplitude é aquela do campo elétrico da onda plana incidente na origem O.


Fisicamente isso significa que a função de onda do elétron está muito localizada em torno da
origem O para que o elétron possa sentir a variação espacial do campo elétrico da onda plana
incidente.
Usando o teorema de Ehrenfest, podemos calcular a evolução temporal de hRi (t) com

d hRi 1 hPi qE
= h[R, H0 + WDE ]i = + êz sen(ωt) (10.36)
dt i~ m mω
d hPi 1
= h[P, H0 + WDE ]i = − h∇V (R)i (10.37)
dt i~
Eliminando hPi destas duas equações, obtemos

d2 hRi
m = − h∇V (R)i + qE êz cos(ωt) (10.38)
dt2
Esta expressão diz que o centro do pacote de ondas associado ao elétron move-se como uma
partícula de massa m e carga q a qual está submetida a ação da força central da ligação atômica
e de um campo elétrico uniforme.

10.6 Calibre Alternativo


A expressão obtida para Hamiltoniana de interação de dipolo-elétrico WDE (t) não é usual
para uma partícula de carga q em um campo elétrico uniforme E(r, t) = E êz cos(ωt).
A forma mais usual para esta expressão é a seguinte:

0
WDE (t) = −D · E = −qEZ cos(ωt) (10.39)

na qual D = qR é o momento de dipolo-elétrico associado ao elétron.


0
As expressões para WDE (t) e WDE (t) são equivalentes. Pode-se ir de uma para outra através
de uma transformação de calibre. O calibre usado para obter WDE (t) foi:

U (r, t) =0
E
A(r, t) = êz sen(ky − ωt).
ω
Agora considere a seguinte função escalar
E
χ=z sen(ωt) (10.40)
ω
Prof. Salviano A. Leão 246
10.6. Calibre Alternativo

a qual define um outro calibre


∂χ
U 0 (r, t) =U (r, t) − = −zE cos(ωt) (10.41a)
∂t
E
A0 (r, t) =A(r, t) + ∇χ = êz [sen(ky − ωt) + sen(ωt)] . (10.41b)
ω
A aproximação de dipolo-elétrico foi levada em conta trocando ky por 0, logo usando a
mesma aproximação para o potenciais deste novo calibre obtemos:
E
A0 (r, t) ' êz [sen(−ωt) + sen(ωt)] = 0. (10.42)
ω
Para obtermos a Hamiltoniana de interação de dipolo-elétrico, o termo devido a interação do
campo magnético com o spin é negligenciado, então a Hamiltoniana de interação tem a seguinte
forma
[P − qA0 (R, t)]2 q
H0 = + V (R) + qU 0 (R, t) − S · B (10.43)
2m m
P2
= + V (R) + qU 0 (R, t) (10.44)
2m
= H0 + W 0 (t) (10.45)

na qual
W 0 (t) = qU 0 (R, t) = −zqE cos(ωt) = WDE
0
(t). (10.46)
Esta é a Hamiltoniana de interação de dipolo-elétrico usual.

Note que o sistema não é mais descrito pelo mesmo ket quando fazemos uma transfor-
0
mação de calibre. A troca de WDE (t) por WDE (t) deve portanto, ser acompanhada
por uma mudança do vetor de estado, entretanto, o conteúdo físico, realmente
permanece o mesmo.

10.6.1 Elementos de Matriz do Dipolo-Elétrico


Seja
H0 |ϕi i = Ei |ϕi i e H0 |ϕf i = Ef |ϕf i (10.47)
então
qE
hϕf |WDE |ϕi i =sen(ωt) hϕf |Pz |ϕi i (10.48)

Como [R, Pn ] = i~nPn−1 , então, podemos escrever
∂H0 Pz
[Z, H0 ] = i~ = i~ (10.49)
∂Pz m
portanto,

hϕf |[Z, H0 ]|ϕi i = hϕf |ZH0 − H0 Z|ϕi i (10.50)


= −(Ef − Ei ) hϕf |Z|ϕi i (10.51)
i~
= hϕf |Pz |ϕi i . (10.52)
m

Prof. Salviano A. Leão 247


10.7. Comentários

Introduzindo a frequência angular de Bohr ωf i = (Ef − Ei )/~, pode-se escrever

hϕf |Pz |ϕi i = imωf i hϕf |Z|ϕi i (10.53)

e consequentemente
ωf i
hϕf |WDE |ϕi i = iq E sen(ωt) hϕf |Z|ϕi i . (10.54)
ω
Portanto, os elementos de matriz de WDE (t) são proporcionais a Z.

10.7 Comentários
• O elemento de matriz hϕf |Z|ϕi i, depende somente de Z, porque o campo elétrico E(r, t),
foi escolhido na direção z.

• Deve-se usar as simetrias dos estados |ϕf i e |ϕi i e não a polarização da luz, para escolher
o sistema de coordenadas. Por exemplo, se um átomo está na presença de um campo
magnético uniforme B(r, t), o eixo mais conveniente para estudar a quantização dos seus
estados estacionários é o eixo paralelo ao campo magnético B(r, t).

• Para um polarização do campo elétrico E(r, t) em uma direção arbitrária, o elemento de


matriz hϕf |WDE |ϕi i será uma combinação linear de X, Y e Z.

10.7.1 Regras de Seleção Para as Transições de Dipolo-Elétrico


Algumas considerações antes de determinarmos as regras de seleção:

• Se hϕf |WDE |ϕi i =


6 0, ou seja, hϕf |Z|ϕi i =
6 0 a transição |ϕi i → |ϕf i é chamada de
transição de dipolo-elétrico. Para estudarmos a transição entre |ϕf i e |ϕi i induzida pela
onda incidente, trocamos W (t) por WDE (t).

• Se hϕf |WDE |ϕi i = 0, devemos levar em conta os termos de mais alta ordem na expansão
de W (t), e com isso as correspondentes transições serão uma transição de dipolo magnético
ou uma transição de quadrupolo elétrico, ou etc . . . .

• Como WDE (t) é muito maior do que os termos subsequentes da expansão em série de W (t)
em a0 /λ, as transições de dipolo elétrico serão as mais intensas.

• A maioria da linhas de transições ópticas emitidas pelos átomos correspondem as transições


de dipolo elétrico.

Considere que as funções de onda na representação |Ri, associadas aos estados |ϕi i e |ϕf i são:

hR | ϕ i = ϕ mi
i ni ,li ,mi (r) = Rni ,li (r)Yli (θ, ϕ)
m
. (10.55)
hR | ϕ i = ϕ
f (r) = R
nf ,lf ,mf (r)Y f (θ, ϕ)
nf ,lf lf

Prof. Salviano A. Leão 248


10.8. Acoplamento Spin-Órbita

Como,
r
4π 0
z = r cos θ = rY (θ), (10.56)
3 1
então o elemento de matriz hϕf |Z|ϕi i é proporcional a integral
ˆ
mf ∗
dΩ Ylf (θ, ϕ) Y10 (θ, ϕ) Ylimi (θ, ϕ) = δli ±1,lf δmi ,mf (10.57)

Para maiores detalhes dos possíveis resultados destas integrais, vejam a seção 12.9 do livro
“Mathematical Methods For Physicists” by George B. Arfken and Hans J. Weber. Outras
informações podem ser obtidas na pág 1047 do livro do Cohen-Tannoudji.
Portanto, para haja uma probabilidade finita de transição é necessário que:

∆l = lf − li = ±1 (10.58)
∆m = mf − mi = −1, 0, +1 (10.59)

• Note que Z é um operador ímpar, e portanto, ele só conecta dois estados com paridades
opostas. Já que as paridades dos estados |ϕi i e |ϕf i são definidas pelos índices li e lf , logo
∆l deve ser ímpar, neste caso ∆l = ±1.

• Se escolhermos uma outra polarização, por exemplo, uma paralela ao eixo Ox ou ao eixo
Oy, nesses casos teremos mf = mi ± 1.

• Se houver um acoplamento spin-órbita ξ(r)L · S entre L e S, os estados estacionários do


elétron são rotulados pelos índices l, s, J, m, com J = L + S.

10.8 Acoplamento Spin-Órbita


As regras de seleção da transição por dipolo elétrico podem ser obtidas calculando os
elementos de matriz não nulos de

hlf , sf , Jf , mf |R|li , si , Ji , mi i . (10.60)

Usando as expansão destes vetores da base nos kets |lmi |s, ms i encontramos

∆J = 0, ±1 (10.61)
∆l = ±1 (10.62)
∆mJ = −1, 0, +1 (10.63)

Note ainda que ∆J = 0 não é uma transição proibida, a não ser no caso em que Ji = Jf = 0.
Isso, deve-se ao fato de que J não está relacionado com a paridade do estado no nível específico.

Prof. Salviano A. Leão 249


10.9. Hamiltonianas de Dipolo Magnético e Quadrupolo Elétrico

10.9 Hamiltonianas de Dipolo Magnético e Quadrupolo


Elétrico
Agora iremos levar em conta os termos de mais altas ordens na Hamiltoniana de interação,
portanto, W (t) pode ser reescrita como

W (t) = WI (t) + WII (t) = WDE (t) + [WI (t) − WDE (t)] + WII (t), (10.64)

Como já estudamos WDE (t), vimos que


WI (t) − WDE (t) a0 WII (t) a0
' e ' . (10.65)
WDE (t) λ WDE (t) λ
Para calcular o termo WI (t) − WDE (t) simplesmente trocamos e±ikY por e±ikY − 1 '=
±ikY + . . ., logo obtemos que
q 
ikAe−ωt + −ikA∗ eωt PZ Y + . . .

WI (t) − WDE (t) = − (10.66)
m
ou usando o fato de que ikA/2 = B, encontramos que
q
WI (t) − WDE (t) = − B cos(ωt)PZ Y + . . . (10.67)
m
Se escrevermos Pz Y na forma:
1 1 1 1
Pz Y = (Pz Y − ZPy ) + (Pz Y + ZPy ) = Lx + (Pz Y + ZPy )
2 2 2 2
obtemos finalmente que
q q
WI (t) − WDE (t) = − Lx B cos(ωt) − [Y Pz + ZPy ]B cos(ωt) + . . . (10.68)
2m 2m
Na expressão para WII (t) é inteiramente justificável trocarmos e±ikY por 1. Portanto,
obtemos termos da ordem de a0 /λ em relação a WI (t), isto é, da mesma ordem de magnitude
de WI (t) − WDE (t), assim
q
WII (t) = − Sx B cos(ωt) + . . . (10.69)
m
Substituindo as eqs. (10.68) e (10.69) na equação (10.64), e agrupando os termos, obtemos

W (t) = WDE (t) + WDM (t) + WQE (t), (10.70)

a qual é uma Hamiltoniana de interação que está levando em contas termos de ordem maior que
a0 /λ. Note, o primeiro termo já é conhecido e é da ordem de a0 /λ, enquanto os outros dois não.
Na expressão anterior para W (t) temos que
qE
WDE (t) = Pz sen(ωt) gauge U (R, t) = 0 (10.71)
m
WDE (t) =