Elementos de Análise Funcional e Aplicações Na Teoria Quântica

No Au
de
ta la
s
Métodos Matemáticos Avançados em Física
Elementos de Análise Funcional

e Aplicações na Teoria Quântica
Daniel H.T. Franco
Métodos Matemáticos Avançados em Física

& Aplicações na Teoria Quântica
Daniel H.T. Franco
Departamento de Física (DPF)

Universidade Federal de Viçosa (UFV)
Julho de 2022
Ficha catalográfica elaborada pela Seção de Catalogação e
Classificação da Biblioteca Central da Universidade Federal de Viçosa
Franco, Daniel Heber Theodoro, 1962-

F825e Elementos de análise funcional & aplicações na teoria
2022 quântica [recurso eletrônico] / Daniel Heber Theodoro
Franco -- Viçosa, MG: O Autor, 2022.
1 livro eletrônico (802 p.) : il.
Inclui bibliografia.
ISBN 978-65-998244-0-1
1. Física matemática. 2. Análise funcional. 3. Teoria

quântica. 4. Hilbert, Espaço de. 5. Teoria espectral
(Matemática). 6. Operadores lineares. I. Universidade
Federal de Viçosa. Centro de Ciências Exatas e Tecnológicas.
Departamento de Física. II. Título.
CDD 22. ed. 530.15
Bibliotecária responsável: Bruna Silva CRB6/2552

Daniel H.T. Franco,
Universidade Federal de Viçosa,
Departamento de Física,
Avenida Peter Henry Rolfs s/n,
Campus Universitário, Viçosa,
Minas Gerais, Brasil, CEP: 36570-900.
Copyright © 2022 by Daniel H.T. Franco. Todos os direitos reservados. Qualquer parte destas
notas pode ser baixada e impressa apenas para uso pessoal ou educacional, desde que citada a
fonte. Nenhuma parte destas notas pode ser reproduzida, alterada, ou transmitida de qualquer
forma para fins comerciais.
Versão: 12 de Julho de 2022
Para Pedro, Lu e meus pais, dedico.
“Feliz aquele que transfere o que sabe e
aprende o que ensina.”
Cora Coralina
Conteúdo
Prefácio i
Primeira Parte: Elementos de Análise e Espaços Vetoriais 2
1 Noções sobre Conjuntos e Topologia 3

1.1 Primeiras Noções sobre Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . 3
1.1.1 Subconjuntos e Igualdade de Conjuntos . . . . . . . . . . . . . . . . . . 5
1.1.2 Operações com Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . 6
1.1.3 Álgebra de Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
1.1.4 Supremo e Ínfimo de Conjuntos . . . . . . . . . . . . . . . . . . . . . . 8
1.1.5 Extensão do Conjunto R . . . . . . . . . . . . . . . . . . . . . . . . . . 16
1.1.6 Cardinalidade de Conjuntos . . . . . . . . . . . . . . . . . . . . . . . . 16
1.1.7 Infinidades de Cantor . . . . . . . . . . . . . . . . . . . . . . . . . . . . 18
1.1.8 Funções . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 19
1.2 Primeiras Noções sobre Topologia . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2.1 Conjuntos Especiais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 23
1.2.2 Espaços Topológicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . 25
1.2.3 Bases . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 27
1.2.4 Vizinhanças . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 28
1.2.5 Comparações entre Topologias . . . . . . . . . . . . . . . . . . . . . . . 29
1.2.6 Axiomas de Separação . . . . . . . . . . . . . . . . . . . . . . . . . . . 31
1.2.7 Limite de uma Sequência . . . . . . . . . . . . . . . . . . . . . . . . . . 32
1.2.8 Pontos de Aderência, de Acumulação e Fecho de um Conjunto . . . . . 35
1.2.9 Espaços Completos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 39
1.2.10 Primeiro Axioma da Enumerabilidade . . . . . . . . . . . . . . . . . . . 44
1.2.11 Continuidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 45
1.2.12 Espaços Compactos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 47
1.2.13 Partição da Unidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . 50
Apêndice 1A: Sobre Provas de Teoremas . . . . . . . . . . . . . . . . . . . . . . . . . . 55
2 Espaços Vetoriais Normados 59

2.1 Espaços Vetoriais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 60
2.2 Convexidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 65
2.3 Espaços Vetoriais Normados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 69
2.4 Conceitos Topológicos Básicos de um Espaço Vetorial Normado . . . . . . . . . 71
2.5 Espaços de Banach . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 75
2.6 Espaços Vetoriais Topológicos Localmente Convexos . . . . . . . . . . . . . . . . 79
3 Espaços de Hilbert 87
3.1 Espaços Pré-Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 87
3.2 Espaços de Hilbert . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 94
3.3 Complementos Ortogonais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 100
3.4 O Teorema da Projeção . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 101
3.5 Convergência Fraca em Espaços de Hilbert . . . . . . . . . . . . . . . . . . . . . 105
3.6 Sobre a Existência de Bases Ortonormais . . . . . . . . . . . . . . . . . . . . . . 107
3.7 Teorema de Hahn-Banach em Espaços de Hilbert . . . . . . . . . . . . . . . . . 118
3.8 Sobre a Compacidade da Bola Unitária em Espaços de Hilbert de Dimensão
Infinita . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 121
3.8.1 Não-Compacidade (Forte) da Bola Unitária em Espaços de Hilbert . . . 121
3.8.2 Compacidade (Fraca) da Bola Unitária em Espaços de Hilbert . . . . . . 125
3.9 O Espaço L2 (Rn ) e a Mecânica Quântica . . . . . . . . . . . . . . . . . . . . . 127
Apêndice 3A: Caracterização Topológica de um Espaço de Hilbert . . . . . . . . . . . 133
Segunda Parte: Elementos de Teoria de Operadores Lineares 138
4 Operadores Lineares em Espaços de Hilbert 139

4.1 Fatos Básicos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 139
4.2 Operadores Limitados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 145
4.3 Dualidade e Reflexividade de Espaços de Hilbert . . . . . . . . . . . . . . . . . 164
4.4 Operadores Ilimitados . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
4.4.1 Operadores Fechados . . . . . . . . . . . . . . . . . . . . . . . . . . . . 168
4.4.2 Gráfico de um Operador . . . . . . . . . . . . . . . . . . . . . . . . . . 172
4.5 Operadores Hermitiano, Simétrico e Auto-Adjunto . . . . . . . . . . . . . . . . . 175
4.5.1 Operadores Auto-Adjuntos Limitados . . . . . . . . . . . . . . . . . . . 176
* Um Interlúdio Matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 179
4.5.2 Operadores Auto-Adjuntos Ilimitados . . . . . . . . . . . . . . . . . . . 183
4.6 Operador Unitário . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 199
4.6.1 A Transformada de Cayley . . . . . . . . . . . . . . . . . . . . . . . . . 201
4.7 Operadores Multiplicação e Diferenciação . . . . . . . . . . . . . . . . . . . . . 206
4.7.1 Operador Posição . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 206
4.7.2 Operador Momentum . . . . . . . . . . . . . . . . . . . . . . . . . . . . 209
4.8 Operadores Simétricos e suas Extensões . . . . . . . . . . . . . . . . . . . . . . 217
4.8.1 Critérios Fundamentais para a Auto-Adjunção . . . . . . . . . . . . . . . 218
4.8.2 Espaços e Índices de Deficiência de um Operador Simétrico . . . . . . 220
4.8.3 Correspondência entre as Extensões de Operadores Simétricos e as
Extensões da Transformada de Cayley . . . . . . . . . . . . . . . . . . . 223
4.8.4 Extensão de Friedrichs de Operadores Simétricos Semi-Limitados . . . . 231
4.9 Perturbações Relativamente Limitadas de Operadores Auto-Adjuntos . . . . . . . 236
4.9.1 O Método de Tosio Kato . . . . . . . . . . . . . . . . . . . . . . . . . . 237
4.9.2 O Método das Formas Quadráticas . . . . . . . . . . . . . . . . . . . . . 244
5 Análise Espectral em Espaços de Hilbert 249
5.1 Um Prelúdio Matricial . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 250
5.2 O Espectro de um Operador . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 252
5.2.1 Operador Resolvente e o Espectro . . . . . . . . . . . . . . . . . . . . . 252
5.2.2 Decomposição do Espectro . . . . . . . . . . . . . . . . . . . . . . . . . 260
5.2.3 Operador Resolvente e a Aproximação de Yosida . . . . . . . . . . . . . 268
5.3 O Espectro Essencial de Weyl . . . . . . . . . . . . . . . . . . . . . . . . . . . . 275
5.4 Caracterização Variacional de Auto-Valores . . . . . . . . . . . . . . . . . . . . . 286
5.5 Espectro de Alguns Operadores da Mecânica Quântica . . . . . . . . . . . . . . 287
5.6 Teorema da Decomposição Espectral para Operadores Auto-Adjuntos Limitados . 293
5.6.1 Operadores de Projeções Ortogonais . . . . . . . . . . . . . . . . . . . . 294
5.6.2 Operadores Compactos . . . . . . . . . . . . . . . . . . . . . . . . . . . 300
5.6.3 Decomposição Espectral de Operadores Compactos . . . . . . . . . . . 304
5.6.4 Caracterização Variacional de Auto-Valores (Continuação I) . . . . . . . 315
5.6.5 Decomposição Espectral de Operadores Auto-Adjuntos Limitados . . . . 315
5.7 Perturbações Relativamente Compactas de Operadores Auto-Adjuntos . . . . . . 340
5.8 Sobre o Espectro Discreto de um Operador Auto-Adjunto Limitado Inferiormente 344
5.8.1 Projetores de Riesz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 344
5.8.2 Auto-Valores Imersos no Espectro Essencial . . . . . . . . . . . . . . . . 351
5.9 Perturbações do Espectro Discreto . . . . . . . . . . . . . . . . . . . . . . . . . 352
5.10 Teorema da Decomposição Espectral para Operadores Auto-Adjuntos Ilimitados . 355
5.11 Algumas Aplicações da Representação Espectral . . . . . . . . . . . . . . . . . . 359
Terceira Parte: Elementos de Teoria de Distribuições 376
6 Teoria de Distribuições e Análise de Fourier 377

6.1 Distribuições: Um Conceito Matemático Generalizando o Conceito Clássico de
Função . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 377
6.1.1 Notação de Multi-índices . . . . . . . . . . . . . . . . . . . . . . . . . . 379
6.2 As Célebres Distribuições de Schwartz D ′ , E ′ e S ′ . . . . . . . . . . . . . . . . 383
6.2.1 O Espaço D e seu Dual D ′ . . . . . . . . . . . . . . . . . . . . . . . . 383
6.2.2 Localização e Suporte de uma Distribuição . . . . . . . . . . . . . . . . 385
6.2.3 O Espaço E e seu Dual E ′ . . . . . . . . . . . . . . . . . . . . . . . . . 388
6.2.4 O Espaço S e seu Dual S ′ . . . . . . . . . . . . . . . . . . . . . . . . 389
6.2.5 Relação entre os Espaços D, S e E . . . . . . . . . . . . . . . . . . . 397
6.3 Operações no Espaço de Distribuições . . . . . . . . . . . . . . . . . . . . . . . 400
6.4 Distribuições como o Limite de Sequências de Funções . . . . . . . . . . . . . . 406
6.5 Abordagem Distribucional do Espaço L2 (Rn ) . . . . . . . . . . . . . . . . . . . 415
6.5.1 Alguns Conjuntos Ortonormais Completos de Distribuições L2 (Rn ) na
Teoria Quântica . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 423
2
* Polinômios de Hermite: I = R, w(x) = e−x . . . . . . . . . . . . . . . . . . 424
* Polinômios de Laguerre: I = R+ , w(x) = e−x . . . . . . . . . . . . . . . . . 424
* Polinômios de Legendre: I = [−1, +1], w(x) = 1 . . . . . . . . . . . . . . . 425
6.5.2 Umas Poucas Palavras sobre o Espaço Lp (Rn ) . . . . . . . . . . . . . . 426
6.6 Transformada de Fourier . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 429
6.6.1 Transformada de Fourier em L1 (Rn ) . . . . . . . . . . . . . . . . . . . 429
6.6.2 Transformada de Fourier Inversa . . . . . . . . . . . . . . . . . . . . . . 432
6.6.3 Transformada de Fourier em L2 (Rn ) . . . . . . . . . . . . . . . . . . . 435
6.6.4 Transformada de Fourier em S e S ′ . . . . . . . . . . . . . . . . . . . 437
6.6.5 O Princípio da Incerteza de Heisenberg . . . . . . . . . . . . . . . . . . 440
6.7 Espaços de Sobolev . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 441
6.8 O Tripleto de Gel’fand . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 445
6.9 Convolução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 448
6.10 Potencial de Riesz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 451
6.11 Potencial de Bessel . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 453
6.12 Transformada de Fourier-Laplace de Distribuições . . . . . . . . . . . . . . . . . 457
6.12.1 Transformada de Fourier-Laplace de Distribuições Temperadas com Su-
porte Compacto . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 457
6.12.2 Transformada de Fourier-Laplace de Distribuições Temperadas com Su-
porte em Cones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 462
6.12.3 Transformada de Fourier-Laplace de Distribuições Temperadas e o Teo-
rema “Edge of the Wedge” . . . . . . . . . . . . . . . . . . . . . . . . . . 469
6.13 Análise Microlocal de Singularidades . . . . . . . . . . . . . . . . . . . . . . . . 473
6.13.1 Conjunto de Frente de Ondas de Distribuições . . . . . . . . . . . . . . 474
6.13.2 Produto de Distribuições: O Critério de Hörmander . . . . . . . . . . . 480
6.13.3 Pseudo-Topologia de Hörmander . . . . . . . . . . . . . . . . . . . . . . 481
6.13.4 Caracterização do Conjunto de Frente de Ondas em Termos do Valor
Limite de Funções Analíticas . . . . . . . . . . . . . . . . . . . . . . . . 481
6.13.5 O Teorema “Edge of the Wedge” Revisitado . . . . . . . . . . . . . . . . 483
6.14 Distribuições Homogêneas e a Teoria da Renormalização . . . . . . . . . . . . . 484
6.14.1 Funções e Distribuições Homogêneas . . . . . . . . . . . . . . . . . . . 484
6.14.2 Extensão de Distribuições . . . . . . . . . . . . . . . . . . . . . . . . . 487
6.14.3 Renormalização de Distribuições Homogêneas . . . . . . . . . . . . . . 492
6.14.4 Renormalização da Energia Potencial Eletrostática . . . . . . . . . . . . 503
Apêndice 6A: Área da Esfera Unitária S n−1 . . . . . . . . . . . . . . . . . . . . . . . . 506
Apêndice 6B: A Equação de Poisson e as Identidades de Green . . . . . . . . . . . . . 509
Apêndice 6C: Definição e Alguns Fatos sobre Funções Analíticas . . . . . . . . . . . . 513
Apêndice 6D: Prova da Equação (6.13.7) . . . . . . . . . . . . . . . . . . . . . . . . . . 516
Apêndice 6E: Integral Oscilatória . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 519
Apêndice 6F: Solução Fraca de uma Equação Diferencial . . . . . . . . . . . . . . . . 524
Quarta Parte: Elementos de Teoria Quântica não-Relativística 530
7 Aspectos Matemáticos da Mecânica Quântica 531

7.1 Fatos sobre a Mecânica Quântica Não-Relativística . . . . . . . . . . . . . . . . 531
7.2 Estados Puros e Misturados na Mecânica Quântica . . . . . . . . . . . . . . . . 534
7.2.1 Pontos Extremos e o Teorema de Krein-Milman . . . . . . . . . . . . . . 534
7.2.2 Caracterização de Estados Puros na Mecânica Quântica . . . . . . . . . 539
7.3 Relações de Comutação e Incerteza de Heisenberg . . . . . . . . . . . . . . . . 540
7.3.1 Lema de Wintner-Wielandt . . . . . . . . . . . . . . . . . . . . . . . . . 548
8 O Teorema de Stone e o Fluxo do Tempo na Mecânica Quântica 551

8.1 Introdução . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 551
8.2 Preliminares: Semi-grupos-C0 e o Teorema de Hille-Yosida . . . . . . . . . . . . 552
8.2.1 Fórmulas Exponenciais . . . . . . . . . . . . . . . . . . . . . . . . . . . 562
8.2.2 Teoria Espectral para Semi-grupos . . . . . . . . . . . . . . . . . . . . . 569
8.3 Operador de Evolução Temporal e a Equação de Schrödinger . . . . . . . . . . . 574
8.4 Teorema de Stone e a Existência da Dinâmica Quântica . . . . . . . . . . . . . . 578
8.5 Uma Aplicação Simples do Operador de Evolução Temporal . . . . . . . . . . . 587
8.6 Irreversibilidade e Reversibilidade de Processos Físicos . . . . . . . . . . . . . . 594
9 O Teorema de Stone e as Simetrias na Mecânica Quântica 597

9.1 Simetrias . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 598
9.2 Grupos de Lie: Transformações Contínuas . . . . . . . . . . . . . . . . . . . . . 598
9.2.1 Translações Espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . 600
9.2.2 Rotações Espaciais . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 604
* Quantização do Momentum Angular . . . . . . . . . . . . . . . . . . . . . . . 607
9.2.3 Transformações de Escala . . . . . . . . . . . . . . . . . . . . . . . . . 622
9.2.4 Transformações de Calibre . . . . . . . . . . . . . . . . . . . . . . . . . 625
9.3 Teorema de Noether . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 627
9.4 Corrente de Probabilidade . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 628
10 Operadores de Schrödinger 631

10.1 Auto-adjunção dos Operadores de Schrödinger . . . . . . . . . . . . . . . . . . . 632
10.2 Espectro dos Operadores de Schrödinger . . . . . . . . . . . . . . . . . . . . . . 642
10.2.1 O Hamiltoniano Livre . . . . . . . . . . . . . . . . . . . . . . . . . . . . 642
10.2.2 Potenciais do Tipo V (x) → 0 Quando |x| → ∞ . . . . . . . . . . . . . 649
10.2.3 Potenciais do Tipo V (x) → ∞ Quando |x| → ∞ . . . . . . . . . . . . 663
10.2.4 Resumo . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 668
10.3 Auto-Valores Negativos dos Operadores de Schrödinger . . . . . . . . . . . . . . 668
10.3.1 Existência de Auto-Valores Negativos . . . . . . . . . . . . . . . . . . . . 669
10.3.2 Estimativa do Número de Auto-Valores Negativos . . . . . . . . . . . . . 670
10.4 Decaimento Exponencial das Auto-Funções . . . . . . . . . . . . . . . . . . . . 686
10.5 Operador de Schrödinger Unidimensional: O Caso do Potencial Quadrado Finito 690
10.6 Operador de Schrödinger Bidimensional: O Caso do Potencial do Tipo Bessel-
Macdonald . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 698
10.7 Operador de Schrödinger Tridimensional: O Caso do Potencial Atômico . . . . . 709
10.7.1 Auto-adjunção do Operador de Schrödinger Atômico . . . . . . . . . . . 709
10.7.2 Espectro do Operador de Schrödinger Atômico . . . . . . . . . . . . . . 714
* Decomposições em Clusters . . . . . . . . . . . . . . . . . . . . . . . . . . . . 715
* Teorema de Hunziker-van Winter-Zhislin . . . . . . . . . . . . . . . . . . . . . 717
10.7.3 Ausência de Auto-Valores Positivos . . . . . . . . . . . . . . . . . . . . . 727
10.7.4 Espectro dos Átomos do Hidrogênio e do Hélio . . . . . . . . . . . . . . 729
* O Átomo do Hidrogênio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 730
* Átomo do Tipo Hélio . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 733
10.8 Os Termos de Hughes-Eckart e o Teorema HVZ . . . . . . . . . . . . . . . . . . 741
10.9 Estabilidade da Matéria . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 744
10.10 Quantos Elétrons um Núcleo Atômico Pode Ligar? . . . . . . . . . . . . . . . . . 750
Apêndice 10A: O Princípio de Birman-Schwinger . . . . . . . . . . . . . . . . . . . . . 760
Apêndice 10B: Desigualdades de Lieb-Thirring . . . . . . . . . . . . . . . . . . . . . . 767
Lista de Exercícios 775
Exercícios do Capítulo 1 . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 775
Referências 797
Prefácio
“Não é de surpreender que nossa linguagem seja incapaz de descrever processos que ocorrem dentro de
átomos, pois, como foi observado, ela foi inventada para descrever as experiências da vida cotidiana . . . Felizmente,
a matemática não está sujeita a essa limitação, e foi possível inventar um esquema matemático – a teoria quântica
– que parece inteiramente adequado para o tratamento de processos atômicos.”
Werner Heisenberg
em “The Physical Principles of the Quantum Theory”
A revolução quântica teve início no final do Século XIX e início do Século XX com a desco-
berta de uma miríade de fenômenos naturais, muitos deles contra-intuitivos, que não podiam
ser explicados pelos paradigmas científicos da época. A teoria quântica descreve o comporta-
mento de partículas nas menores escalas de tamanho, portanto, a descrição da estrutura de
átomos e sua interação com outros átomos, bem como o comportamento de núcleos atômi-
cos. No entanto, nós, seres humanos, estamos mal “aparelhados” para observar diretamente
o microcosmo. Por exemplo, os elétrons, frequentemente usados como objetos de estudo, são
imperceptíveis pelos nossos orgãos sensoriais. Nós simplesmente não são somos capazes de
observar o movimento de um elétron. É por isso que a matemática torna-se crucial quando
nossa intuição falha; ou seja, o melhor que podemos fazer é tentar entender o elétron e seu
movimento como abstrações matemáticas. Portanto, a teoria quântica é um modelo matemático
do mundo físico na escala microscópica. De fato, a teoria quântica foi considerada a primeira
teoria da física que exigiu estruturas matemáticas abstratas, como a álgebra linear, os espaços
de Hilbert de dimensão infinita, a teoria espectral dos operadores auto-adjuntos, as álgebras dos
operadores e, mais fundamentalmente, a análise funcional. Todos esses campos da matemática
são hoje parte integrante da física-matemática.
A física-matemática refere-se ao desenvolvimento de métodos matemáticos para aplicação a
problemas na física. Ela remonta um longo tempo, mas no Século XX, ela passou a girar em
torno de métodos matemáticos utilizados na teoria quântica, tanto relativística e não-relativística,
incluindo as principais áreas como a teoria quântica dos campos e a mecânica estatística
quântica. Cada uma dessas áreas, por sua vez, implica noções de dinâmica, sistemas dinâmicos,
teoria de espalhamento, estudo das interações e teorias rigorosas de transição de fase. Por causa
dos fundamentos da teoria quântica, e do quadro sugerido por John von Neumann e Paul Dirac,
os problemas e os modelos estudados na física-matemática se baseiam na teoria de operadores
lineares em espaços de Hilbert e nas álgebras desses operadores. Relacionado a isso está a teoria
de problemas de medição quântica. No caso da teoria quântica dos campos existem os sistemas
i
Prefácio
de axiomas de Wightman (também chamados axiomas de Gårding-Wightman), bem como a

consideração das representações unitárias, a teoria espectral e as ferramentas de continuação
analítica.
Este texto é devotado aos métodos matemáticos aplicados à teoria quântica. Ele é direcionado
a todo aquele interessado nos vários aspectos matemáticos do “universo quântico.” Isto inclui,
naturalmente, os estudantes de matemática e os estudantes de física. Tentamos ser o mais
pedagógico possível, reconhecendo que vários estudantes podem não ter todos os fatos básicos
na sua formação. O objetivo é familiarizar o leitor com alguns tópicos, princípios e métodos da
análise funcional que são amplamente utilizados na teoria quântica.
Para manter as coisas dentro de certos limites, o material apresentado é altamente seletivo.
Como resultado, muitos assuntos importantes e interessantes não são abordados. Trata-se de
um texto destinado a dar ao estudante instrumentos da análise funcional, apresentando, de
uma maneira introdutória, um subconjunto representativo de resultados fundamentais, de forma
a salientar a sua profunda relação com a teoria quântica. Espera-se que, equipado com este
conhecimento básico da análise funcional, o leitor possa se sentir estimulado a se interessar
mais pelo assunto de tal forma a consolidar e ampliar seus conhecimentos em análise funcional
e teoria quântica.
Procuramos organizar o texto da forma que acreditamos seja a mais lógica e didática; por
isso, o subdividimos em quatro partes. O tema central da primeira parte, composta pelos
primeiros três capítulos, é a teoria dos espaços vetoriais normados. Um espaço vetorial normado
completo é chamado de espaço de Banach e quando sobre este espaço temos definido um
produto interno ele é chamado espaço de Hilbert. Vários dos resultados importantes na teoria
dos espaços vetoriais dependem da completeza. De forma a pavimentar o caminho para o
estudo de um espaço vetorial normado completo, no Capítulo 1 apresentamos, de forma breve,
definições e resultados básicos sobre a teoria dos conjuntos e topologia, com ênfase nos espaços
métricos. Os resultados apresentados, necessários para o entendimento dos capítulos posteriores,
foram reduzidos ao mínimo. No Capítulo 2 apresentamos um estudo sobre espaços vetoriais
dotados de uma topologia, em particular os espaços de dimensão infinita. Isto contrasta com
a álgebra linear, que lida principalmente com espaços de dimensão finita, e não usa topologia.
Estaremos particularmente interessados no estudo de algumas propriedades dos espaços de
Banach, que são espaços vetoriais normados sobre os quais uma topologia está definida (a
topologia naturalmente gerada pela norma). No Capítulo 3, nos concentramos no estudo dos
espaços de Hilbert, um caso particular dos espaços de Banach. Assim como no caso dos espaços
de Banach, veremos que a estrutura topológica de um espaço de Hilbert é derivada a partir de
uma norma, que por sua vez é derivada de um produto interno. Isto faz com que os espaços
de Hilbert desempenhem um papel de destaque na física-matemática, em particular na física
quântica.
A segunda parte, composta pelos Capítulos 4 e 5 (talvez a mais importante do presente texto,
juntamente com a terceira parte), é reservada para o estudo dos operadores lineares em espaços
de Hilbert e seus espectros. Estes tópicos, fundamentais na formação matemática de pessoas
interessadas na teoria quântica, constituem um amplo campo e espera-se que a seleção dos
tópicos apresentados ajude a preencher a lacuna teórica muitas vezes deixada na frágil formação
dos nossos alunos com relação aos fundamentos matemáticos da teoria quântica. Por isto, no
Capítulo 4 fazemos uma exposição introdutória sobre a teoria de operadores lineares em espaços
vetoriais normados, tendo como foco principal os espaços de Hilbert. Apresentamos alguns
resultados que são de importância imediata na teoria quântica, em particular a distinção entre
operadores hermitianos, simétricos e auto-adjuntos é cuidadosamente analisada. No Capítulo
ii
Prefácio
5 analisamos o papel central desempenhado pela noção do “espectro” de um operador linear

e algumas de suas aplicações. O principal objetivo deste capítulo é o estudo das propriedades
mais elementares da teoria espectral dos operadores lineares em espaços de Hilbert.
A terceira parte é composta pelo Capítulo 6. Lá fazemos uma introdução às noções básicas
sobre distribuições, transformada de Fourier e análise microlocal. Mesmo que esses conceitos
não capacitem imediatamente o leitor a computar melhor os efeitos físicos, a apresentação
dos conceitos ligados com a teoria da distribuição é fundamental para todo o mecanismo da
mecânica quântica.
A quarta parte, composta pelos Capítulos 7, 8, 9 e 10, é reservada para uma apresentação de
alguns conceitos matemáticos da mecânica quântica não-relativística. No Capítulo 7, iniciamos
com a definição de estados puros e como esses estão relacionados com o celebrado Teorema
de Krein-Milman. Finalizamos discutindo as relações de comutação e incerteza de Heisenberg.
No Capítulo 8, apresentamos uma discussão sobre a dinâmica quântica e como a sua existência
é garantida pelo Teorema de Stone. O assunto deste capítulo é fundamental para a mecânica
quântica. Com efeito, os objetos que se obtêm da mecânica clássica são o hamiltoniano e sua
dinâmica, conforme determinado pela equação de Schrödinger. O Teorema de Stone fornece a
conexão entre as duas abordagens através de uma correspondência de um-para-um entre grupos
unitários contínuos uni-paramétrico e operadores auto-adjuntos. O Teorema de Stone forma a
base matemática para a descrição da evolução temporal de sistemas quânticos conservativos e
reversíveis; mais precisamente, sistemas quânticos fechados com um número finito de partículas.
O escopo do Capítulo 9 são as simetrias contínuas de sistemas quânticos. Se G é um grupo de
Lie associado à uma simetria de um sistema quântico, então, um grupo unitário contínuo está
relacionado a cada elemento da álgebra de Lie de G. Os geradores desses grupos são operadores
auto-adjuntos, sendo interpretados como os observáveis do sistema ligados aos elementos da
álgebra de Lie. Por fim, no Capítulo 10, analisamos vários aspectos da teoria dos operadores de
Schrödinger.
Em um texto deste tipo qualquer alegação de originalidade dos resultados por si só é falsa.
Entretanto, não fizemos nenhuma tentativa de dar crédito preciso a um resultado, uma ideia
ou uma prova, embora nomes relacionados àlguns teoremas sejam declarados no corpo do
texto. Com exceção de alguns pontos ligados à própria área de pesquisa do autor e de algumas
demonstrações, quase todos os resultados apresentados no texto foram “garimpados” de várias
fontes citadas na bibliografia ao final do texto que, longe de ser completa, deve servir de guia
para estudos mais aprofundados (todo estudante sério deve consultá-la!). As demonstrações e
as discussões dos exemplos ao longo das notas foram feitas com todos os detalhes possíveis.
Aos olhos de um especialista, em vários lugares do texto, as demonstrações podem parecer
demasiada e desnecessariamente longas. Isto é proposital, principalmente porque sentimos que
desta forma as demonstrações tornam-se mais claras e, ao mesmo tempo, exigem uma formação
matemática menor comparada com as versões mais curtas. O leitor atento também notará que
ocasionalmente repetimos algumas fórmulas e demonstrações. Isto é feito para evitar, sempre
que necessário, referências a algum material precedente. Além disso, ao longo de todos os
capítulos, observações importantes foram organizadas no formato de Notas. Adotamos este
expediente como forma de destacar fatos importantes, e por vezes fundamentais, que aparecem
“entre linhas” na bibliografia consultada. A lista de exercícios encontrada no final do texto tem
o objetivo de fixar e estender o material apresentado.
Os pré-requisitos necessários para uma leitura deste conjunto de notas é um sólido conhe-
cimento de cálculo avançado, de álgebra linear e uma introdução à análise complexa. Eventu-
almente, conhecimentos mais avançados, como a teoria da medida e a integração de Lebesgue
iii
Prefácio
são abordados no texto. A falta de tal conhecimento, no entanto, não vai impedir que os leitores
captem a essência dos principais assuntos.
A tarefa de escrever um texto como este é uma operação complexa que requer numerosas ve-
rificações no texto, nas imagens e nas relações estabelecidas entre eles. A experiência sugere que
é impossível escrever um livro livre de erros. Apesar de todas as tentativas de eliminá-los, alguns
sempre escapam à revisão. Qualquer observação, sugestão e correção dos leitores serão bem-
vindas, basta enviá-las para os seguintes endereços eletrônicos: daniel.franco@ufv.br,
dhtfranco@gmail.com.
Estas notas surgiram dos cursos e tópicos de métodos matemáticos em Física que lecionei
na Universidade Federal de Viçosa. Por isso, meus agradecimentos vão em primeiro lugar para
os vários estudantes dos cursos de graduação e pós-graduação do Departamento de Física
da UFV que leram as versões preliminares do texto e contribuíram significativamente para
o melhoramento de um número considerável de detalhes e, em especial, aos Profs. Magno
B. Alves, Olivier Piguet e Oswaldo M. Del Cima por terem apontado algumas imprecisões
no texto (naturalmente, eventuais imprecisões ou obscuridades remanescentes são de minha
responsabilidade). Por último, eu gostaria de agradecer a todos aqueles que me ajudaram e
incentivaram de uma forma ou de outra durante a preparação deste texto. Quero aqui renovar
meus agradecimentos aos meus amigos, Afrânio R. Pereira, Emmanuel A. Pereira, José A. Helayël-
Neto, Magno B. Alves, Marcelo L. Martins, Olivier Piguet, Orlando P.F. Rodrigues e Oswaldo M.
Del Cima, pelo apoio recebido durante esta empreitada.
Boa caminhada! E lembre-se que uma caminhada de mil milhas inicia-se com um passo.
Belo Horizonte, 12 de Julho de 2022. Daniel H. T. Franco
iv
Primeira Parte:
Elementos de Análise e Espaços Vetoriais
1
Capítulo 1
Noções sobre Conjuntos e Topologia
“Os matemáticos trabalham com termos

obsessivamente definidos. A insistência quase neurótica em que todos os termos sejam rigorosamente definidos, nos
liberta para imaginar e falar do inimaginável. Precisão absoluta nos dá a liberdade de sonhar significamente. Mas
a precisão absoluta tem suas exigências: os termos exigem definição muito cuidadosa, e toda afirmação, mesmo que
aparentemente óbvia, tem que ser provada. O que parece óbvio é às vezes extremamente difícil de ser provado.”
Donal O’Shea
em “A Solução de Poincaré: Em Busca da Forma do Universo”
Para “trilharmos” os caminhos da Análise Funcional precisamos de um certo background em

elementos de Análise. Por este motivo, neste capítulo, reunimos o material básico necessário
para o entendimento dos capítulos posteriores. Os resultados apresentados foram reduzidos
ao mínimo. O leitor pode simplesmente ler, descompromissadamente, o capítulo primeiro,
retornando aos tópicos específicos conforme a necessidade.
1.1 Primeiras Noções sobre Conjuntos

Praticamente todas as áreas da matemática moderna são desenvolvidas a partir de um
conceito chamado conjunto. Cantor definiu um conjunto como uma pluralidade concebida
como uma unidade. Em outras palavras, o conceito de conjunto envolve reunir mentalmente
um número de coisas (ou ‘objetos’ como são frequentemente chamados) e atribuir às coisas
assim reunidas uma identidade como um todo, isto é, uma identidade separada daquela de
cada uma dessas coisas. As coisas são chamadas de elementos ou membros do conjunto obtido
ao concebê-las juntas. Assim, um conjunto consiste ou é composto por seus elementos, mas é
ele próprio uma entidade diferente de qualquer um de seus elementos. Por exemplo, um bando
(ou seja, um conjunto) de pássaros não é igual a nenhum dos pássaros, não é um pássaro. Na
verdade, o bando é um conceito que não tem existência material. Claro, podemos atribuir ao
bando certos atributos em termos dos atributos correspondentes de seus membros, seja fazendo
uma convenção ou por implicações de senso comum. Por exemplo, podemos definir “um bando
de pássaros está voando” para indicar que cada um de seus membros está voando. Deve-se
notar, no entanto, que o bando tem certos atributos que não podem ser descritos em termos de
3
quaisquer atributos de membros individuais. Por exemplo, “um grande bando de pássaros” não
é o mesmo que “um bando de grandes pássaros.”
A abordagem da teoria dos conjuntos em que se tentou definir um conjunto e postular uma
série de axiomas sobre conjuntos, de modo a evitar paradoxos, é conhecida como a teoria
axiomática dos conjuntos. Tal análise pertence propriamente aos fundamentos da matemática
e da lógica matemática, e não é nosso propósito iniciar o estudo desses campos. Adotaremos,
como a maioria dos matemáticos, o ponto de vista ingênuo em relação à teoria dos conjuntos.
Assumiremos que o que se entende por um conjunto de objetos é intuitivamente claro e
procederemos com base nisso sem analisar mais profundamente o conceito em si.
Denotamos conjuntos por letras maiúsculas comuns A, B, C, . . ., e elementos ou objetos de
conjuntos por letras minúsculas a, b, c, . . .. Por exemplo, escrevemos
! "
A = a, b, c ,
para indicar que A é a coleção de elementos a, b, c. Se um elemento x pertence a um conjunto

A, escrevemos
x∈A.
Neste caso, dizemos que “x pertence ao conjunto A,” ou “x está contido em A,” ou ainda “x é
um elemento de A,” Se x é qualquer elemento e se A é um conjunto, então assumimos que se
sabe se x pertence a A ou se x não pertence a A. Se x não pertence a A escrevemos
x∈
/A.
Normalmente não descrevemos um conjunto listando cada elemento entre as chaves { }

como fizemos para o conjunto A acima. Um método conveniente de caracterizar conjuntos
é o seguinte. Suponha que para cada elemento x de um conjunto A existe uma afirmação
P (x) que é verdadeira ou falsa. Podemos então definir um conjunto B que consiste de todos
os elementos x ∈ A tal que P (x) é verdadeiro, isto é, se A é um conjunto, x um elemento
qualquer de A e P uma proposição sobre x, então
! "
B = x ∈ A | P (x) é verdadeiro
representa o conjunto formado por todos os elementos de A para os quais a proposição

P é verdadeira. Quando está claro a qual conjunto x pertence, às vezes escrevemos {x |
P (x) é verdadeiro} (em vez de, digamos, {x ∈ A | P (x) é verdadeiro}.
Exemplo 1.1. Sejam C[a, b] o conjunto de todas as funções contínuas1 com valores reais defini-
das no intervalo fechado [a, b] e P a propriedade que diz que para f ∈ C[a, b] a integral em
[a, b] tem valor menor que M. Então, B é o conjunto representado da seguinte forma:
# $ b %
B= f ∈ C[a, b] | f (x) dx < M .
a
1
Se f (x) é uma função contínua em um certo domínio Ω ⊆ Rn , escrevemos f ∈ C(Ω). Se todas as derivadas
parciais de f de ordem ℓ existem e são contínuas, escrevemos f ∈ C ℓ (Ω). Quando as derivadas parciais de f
de todas as ordens existem e são contínuas, dizemos que f é infinitamente diferenciável ou suave e escrevemos
f ∈ C ∞ (Ω).
4
1.1.1 Subconjuntos e Igualdade de Conjuntos

Se A e B são conjuntos e se todo elemento de A é um elemento de B, dizemos que A é
subconjunto de B, ou que B contém A, e escrevemos
A⊂B ou B⊃A.
Esta definição implica que todo conjunto deve ser considerado como contendo a si mesmo, ou
seja A ⊂ A.
Nota 1.1. O símbolo A ⊂ B indica que A é um subconjunto próprio de B, isto é, A é um
subconjunto próprio de B se, e somente se, A é um subconjunto de B e B contém um ou
mais elementos que não pertencem ao conjunto A. Ocasionalmente, para indicar que A é um
subconjunto de B, porém não necessariamente um subconjunto próprio, escrevemos A ⊆ B
ou B ⊇ A. Neste caso, existe a possibilidade que os dois conjuntos sejam iguais. Diz-se que
dois conjuntos são iguais se, e somente se, eles têm os mesmos elementos. Em outras palavras,
se A e B são dois conjuntos, então eles são iguais se, e somente se, A ⊂ B e B ⊂ A. Neste
caso, escrevemos que A = B.
Também é necessário considerar um conjunto que não possui membros. Uma vez que um
conjunto é determinado por seus elementos, existe apenas um conjunto que é chamado de
conjunto vazio, que é denotado pelo símbolo ∅. Qualquer conjunto, A, consistindo de um ou
mais elementos é considerado não vazios. Se A não for vazio, escrevemos A ̸= ∅.
Nota 1.2 (Alerta sobre o conjunto ∅). Pela definição de subconjunto, o conjunto vazio é um
subconjunto de qualquer conjunto A por vacuidade. Para se provar que algo é verdadeiro para
o conjunto vazio, costuma-se recorrer à demonstração por vacuidade. Na demonstração por
vacuidade mostra-se que a sentença p ⇒ q é verdadeira quando sabemos que p é falsa. Assim,
por exemplo, como afirmar ser falso que ∅ ⊂ A? Seria verdade dizer que é falso que ∅ ⊂ A
somente se ∅ tivesse um elemento que não pertencesse a A. Dado que o conjunto ∅ não
possui nenhum elemento, tem-se um absurdo. Conclusão: ∅ ⊂ A não é falso, e portanto
∅ ⊂ A para todo conjunto A.
Nota 1.3 (Conjuntos de Números). Os vários conjuntos númericos usados ao longo do texto
são:
• Números naturais: N = {1, 2, 3, 4, . . .}; também N0 = {0, 1, 2, 3, 4, . . .}.
• Números inteiros: Z = {. . . , −4, −3, −2, −1, 0, 1, 2, 3, 4, . . .}.
• Números racionais: Q = {p/q | p, q ∈ Z, q ̸= 0 . . .}.
• Números reais: denotado por R.
• Números complexos: C = {a + ib | a, b ∈ R}.
Naturalmente, temos a seguinte sequência de inclusões: N ⊂ Z ⊂ Q ⊂ R ⊂ C.
5
1.1.2 Operações com Conjuntos

* União: A união (ou reunião) de dois conjuntos A e B é o conjunto de todos elementos x
que pertencem ao conjunto A, ou ao conjunto B, ou a ambos. Neste caso, escrevemos:
! "
A ∪ B = x | x ∈ A ou x ∈ B .
Nota 1.4. Deve-se enfatizar que o significado matemático de “ou” no símbolo acima não é
exclusivo, como na linguagem corrente. Assim, x pode pertencer simultaneamente a A e a B.
A união de um número de conjuntos A1 , A2 , . . . , An é o conjunto
n
& ! "
A1 ∪ A2 ∪ · · · ∪ An = Ai = x | x ∈ A1 ou x ∈ A2 · · · ou x ∈ An .
i=1
* Interseção: A interseção de dois conjuntos A e B é o conjunto de elementos x que

pertencem tanto a A como a B. Neste caso, escrevemos:
! "
A∩B = x|x∈A e x∈ B .
A inteserção de um número de conjuntos A1 , A2 , . . . , An é o conjunto de elementos comuns

a todos os n conjuntos:
n
' ! "
A1 ∩ A2 ∩ · · · ∩ An = Ai = x | x ∈ A1 e x ∈ A2 · · · e x ∈ An .
i=1
* Conjuntos Disjuntos: Dois conjuntos A e B são disjuntos se eles não têm elementos em
comum. Neste caso, a interseção entre A e B é o conjunto vazio ∅, ou seja A ∩ B = ∅.
* Diferença: A diferença de dois conjuntos A e B, denotada por A − B, é o conjunto
formado por todos os elementos que pertencem a A mas não a B, ou seja
! "
A − B = x | x ∈ A, x ∈/B .
* Complemento: No caso particular em que B ⊂ A, a diferença A − B chama-se comple-

mentar do conjunto B relativamente a A. Neste caso, escrevemos
!A B = A − B ou A′ = A − B ou Ac = A − B .
Em geral, se A, B ⊂ C, a diferença A − B sendo o conjunto dos elementos de A que não

pertencem a B será também denotada por A ∩ B c .
* Diferença Simétrica: A diferença simétrica de dois conjuntos A e B, denotada por A ∆ B,
é o conjunto de elementos pertencendo a A e B, porém não a A e B; isto é
A ∆ B = (A − B) ∪ (B − A) .
* Famílias: Os conjuntos cujos elementos são eles próprios conjuntos, são chamados famílias
e são representados pelas letras A , B, C , D, etc. Exemplo: se A, B e C são, respectivamente,
os conjuntos A = {0, 1}, B = {a, b, c} e C = {∅}, então A = {{0, 1}, {a, b, c}, {∅}} é
uma família.
6
1.1.3 Álgebra de Conjuntos

A partir das operações com conjuntos podemos construir uma álgebra de conjuntos que é
governada por um número de leis básicas.
• Leis Idempotentes
A∪A=A ; A∩A=A .
• Leis Comutativas
A∪B =B∪A ; A∩B =B∩A .
• Leis Associativas
A ∪ (B ∪ C) = (A ∪ B) ∪ C ,
A ∩ (B ∩ C) = (A ∩ B) ∩ C .
• Leis Distributivas
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C) ,
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C) .
• Leis de Identidade
A∪∅=A ; A∩U =A ,
A∪U = U ; A∩∅= ∅ .
Aqui U representa um conjunto universal, ou seja A ⊂ U.
• Leis de Morgan
A − (B ∪ C) = (A − B) ∩ (A − C) ,
A − (B ∩ C) = (A − B) ∪ (A − C) .
• Leis de Dualidade: sendo U um conjunto universal, segue que

n
& n
'
U− Ai = (U − Ai ) ,
i=1 i=1
que é o mesmo que dizer que

( n
)c n
& '
Ai = Ai .
i=1 i=1
E ainda,
n
' n
&
U− Ai = (U − Ai ) ,
i=1 i=1
que é o mesmo que dizer que

( n
)c n
' &
Ai = Ai .
i=1 i=1
7
• Leis do Complemento
A ∪ Ac = U ; A ∩ Ac = ∅ ,
(Ac )c = A ; U c = ∅ ; ∅c = U .
Nota 1.5. Com relação à álgebra de conjuntos, as leis acima são teoremas que podem ser
provados pelo uso direto das definições sobre subconjuntos e igualdades de conjuntos. Por
exemplo, a primeira lei de Morgan pode ser provada
! da seguinte forma: comecemos " com o
caso em que n = 2. Defina Bi = U − Ai = x | x ∈ U, x ∈ Ai , i = 1, 2 . Então,
∀ x ∈ U − (A1 ∩ A2 ) ⇒ x ∈ / A1 ∩ A2 ⇒ x ∈ / A1 ou x ∈ / A2 ⇒ x ∈ B1 ou x ∈
B2 ⇒ x ∈ B1 ∪ B2 . Assim, U − (A1 ∩ A2 ) ⊂ (U − A1 ) ∪ (U − A2 ). Agora, note
que ∀ x ∈ B1 ∪ B2 ⇒ x ∈ B1 ou x ∈ B2 ⇒ x ∈ / A1 ou x ∈ / A2 . Se x ∈/ A1 ⇒
x ∈/ A1 ∩ A2 ⇒ x ∈ U − (A1 ∩ A2 ). *Assim, (U − A1 )*∪ (U − A2 ) ⊂ U − (A1 ∩ A2 ).
Passemos para o caso geral; ∀ x ∈ U − ni=1 Ai ⇒ x n
+n∈ i=1 Ai ⇒ x ∈ a no mínimo*n um
U − Ai ⇒ x ∈ (U − A1 ) ∪ · · ·+∪ (U − An ) = x ∈ i=1 (U − Ai ). Assim, U − i=1 Ai ⊂
+ n n
i=1 (U*− Ai ). Agora, ∀ x ∈
* i=1 (U − A+i) ⇒ x ∈/ a no mínimo*n um Ai , i = 1, . . . , n
n n n
⇒x∈ / i=1 Ai ⇒ x ∈ U − i=1 Ai . Logo, i=1 (U − Ai ) ⊂ U − i=1 Ai .
1.1.4 Supremo e Ínfimo de Conjuntos

Dois dos conceitos mais importantes sobre conjuntos (e muito explorados ao longo do texto)
são os conceitos de supremo e ínfimo que revisaremos agora. Para motivar a definição desses
conceitos, vamos começar com a seguinte
DEFINIÇÃO 1.1. Seja M um conjunto. Uma métrica – ou função distância – em M é uma

aplicação, d : M × M → [0, ∞), satisfazendo as seguintes propriedades:
M1. d(x, y) " 0 (axioma da separação) ,
M2. d(x, y) = 0 se, e somente se, x = y (axioma da coincidência) ,
M3. d(x, y) = d(y, x) (simetria) ,
M4. d(x, z) # d(x, y) + d(y, z) (subaditividade) ,
quaisquer que sejam x, y, z ∈ M.
Na definição acima, a Propriedade M1 diz que a função distância d nunca é negativa e a

Propriedade M2 que d é zero somente para pontos coincidentes. A Propriedade M3 afirma
que a função distância d independe da ordem dos pontos, ou seja, ela nos diz que x é tão
distante de y quanto y o é de x. A Propriedade M4 afirma que a distância de x a y é menor
ou igual a soma das distâncias utilizando um ponto intermediário z. Em R2 a Propriedade M4
exprime o fato conhecido que cada lado de um triângulo não excede a soma dos outros dois.
Por esse motivo, ela é conhecida como “desigualdade triangular.” Além disso, um ponto y
em M é dito estar entre os pontos x e z de M se: x ̸= y ̸= z e d(x, z) = d(x, y) + d(y, z).
O conjunto M munido de uma métrica d é chamado um espaço métrico, isto é, um espaço
equipado com a noção de proximidade entre seus elementos.
Neste ponto, é importante enfatizar que não existe uma regra única para determinar a
distância entre entidades matemáticas, como números, vetores e funções, já que os últimos
podem ser “metrizados” de várias maneiras diferentes. Em vez disso, estabeleceremos uma
8
regra conveniente e auto-consistente para a distância de acordo com a natureza das sequências,
conjuntos e espaços em consideração. Portanto, conceitos fundamentais como continuidade,
convergência e inclusão terão significados diferentes. Quando isso acontece, dizemos que
estamos “introduzindo uma topologia no espaço matemático (ou conjunto).”
Exemplo 1.2 (Distância entre números reais). Considere o conjunto dos números reais, R, e
d(x, y) = |x−y|. Logo d(x, y) é uma métrica em R. De fato, temos que d(x, y) = |x−y| " 0
pela definição de valor absoluto de um número real. Além disso, d(x, y) = 0 se, e somente se,
|x − y| = 0. Isto acontece se, e somente se, x − y = 0. Portanto, x = y. Agora, de |x| = | − x|
segue que, |x − y| = | − (x − y)| = |y − x|. Logo, d(x, y) = d(y, x). Por fim, como para
x, y ∈ R vale que |x + y| # |x| + |y|, então |x − z| = |(x − y) + (y − z)| # |x − y| + |y − z|,
para todo x, y, z ∈ R.
Exemplo 1.3 (Distância entre funções contínuas). Seja C[a, b] o espaço que consiste de todas
as funções contínuas definidas no intervalo fechado [a, b]. Para um par de elementos f e g no
espaço C[a, b], é possível definir a distância d1 (f , g) entre eles como
d1 (f , g) = max |f (x) − g(x)| .

a#x#b
No entanto, esta não é a única definição de distância entre funções no espaço C[a, b]; podemos
definir outras regras para a distância entre esses elementos da seguinte forma:
$ b ,$ b -1/2
2
d2 (f , g) = dx |f (x) − g(x)| e d3 (f , g) = dx |f (x) − g(x)| .
a a
Não faz sentido dizer que d1 é mais correta que d2 ou d3 . As três regras são bem definidas e
só precisamos escolher qual delas é mais conveniente para um certo problema. A natureza de
um espaço de funções depende da nossa escolha de distância entre seus elementos. Mesmo
que dois espaços sejam compostos por elementos idênticos, isso não significa que eles sejam o
mesmo espaço. Os dois espaços irá diferir se forem dotados de regras diferentes para determinar
a distância entre os elementos. Esta é a razão pela qual diferentes notações são necessárias
para espaços dotados de diferentes regras de distância.
Nota 1.6 (Alguns poucos fatos sobre métrica). Uma métrica é chamada de ultramétrica
(ou métrica não-Arquimediana) se ela satisfaz a seguinte versão mais forte da desigualdade
triangular, em que os pontos nunca podem estar “entre” outros pontos:
. /
d(x, z) # max d(x, y), d(y, z) , ∀ x, y, z ∈ M .
A métrica d em M é chamada de intrínseca se quaisquer dois pontos x e y em M podem ser

unidos por uma curva com comprimento arbitrariamente próximo de d(x, y).
Para conjuntos em que uma adição + : M × M → M está definida, d é chamada de
métrica invariante por translações se
d(x, y) = d(x + a, y + a) , ∀ x, y ∈ M .
Ainda, uma pseudométrica em M é uma função d : M ×M → [0, ∞) que satisfaz os axiomas

de uma métrica, exceto que em vez do axioma da coincidência podemos ter d(x, y) = 0
não só para x = y, mas possivelmente para alguns valores distintos de x ̸= y. Esta é a
generalização mais comum de métricas. Em alguns contextos, as pseudométricas são referidas
como semimétricas por causa de sua relação com seminormas.
9
Nota 1.7 (Métricas sobre espaços vetoriais). Veremos no Capítulo 2 que normas sobre espa-
ços vetoriais são equivalentes a determinadas métricas, especificamente sobre aqueles espaços
vetoriais homogêneos e invariantes por translações. Em outras palavras, uma norma determina
uma métrica se dado um espaço vetorial normado (X , ∥ · ∥) podemos definir uma métrica
em X por d(x, y) = ∥x − y∥. Neste caso, a métrica d é dita ser induzida pela norma
∥ · ∥. Inversamente, se uma métrica d num espaço vetorial X satisfaz as propriedades (veja o
Teorema 2.5)
d(x, y) = d(x + a, y + a) (invariância por translações) ,
d(αx, αy) = |α|d(x, y) (homogeneidade) ,
então podemos definir uma norma em X por ∥x∥ = d(x, 0). Da mesma forma, uma semi-
norma induz um pseudométrica (ver nota acima).
DEFINIÇÃO 1.2. Seja M um espaço métrico. Se x0 ∈ M e r " 0, então:
* O conjunto ! "
B(x0 ; r) = y ∈ M | d(x0 , y) < r ,
é chamado uma bola aberta de centro x0 e raio r.
* O conjunto ! "
B[x0 ; r] = y ∈ M | d(x0 , y) # r ,
é chamado uma bola fechada de centro x0 e raio r.
* O conjunto ! "
S(x0 ; r) = y ∈ M | d(x0 , y) = r ,
é chamado uma esfera de centro x0 e raio r.
Evidentemente, da definição acima, temos que B[x0 ; r] = B(x0 ; r) ∪ S(x0 ; r), o que repre-
senta uma união disjunta.
Exemplo 1.4. Seja d : M × M → R+ = {x ∈ R | x " 0} definida por
⎧
⎨0 , se x = y
d(x, y) =
⎩1 , se x ̸= y
Se x0 ∈ M e r > 1, então
B[x0 ; r] = B(x0 ; r) = M ,
e
S(x0 ; r) = ∅ .
Se 0 < r < 1, então
B[x0 ; r] = B(x0 ; r) = {x0 } ,
e
S(x0 ; r) = ∅ .
Se r = 1, então
B[x0 ; r] = M ; B(x0 ; r) = {x0 } ,
e
S(x0 ; r) = M − {x0 } .
10
DEFINIÇÃO 1.3. Seja A um subconjunto de um conjunto M sobre o qual está definida uma
métrica. O conjunto A é dito limitado quando existir uma constante c > 0 tal que d(x, y) # c
para quaisquer x, y ∈ A.
Da definição acima segue que um conjunto A é limitado se, e somente se, A ⊂ B[x0 ; r],
para algum x0 ∈ A. De fato, se A ⊂ B[x0 ; r], então para algum x0 ∈ A e r > 0, tomando-se
y, z ∈ A segue que
d(y, z) # d(y, x0) + d(x0 , z) # r + r = 2r .
Logo, se A ⊂ B[x0 ; r], então A é limitado. Por outro lado, se A é limitado, isto é, se existe
uma constante c > 0 tal que d(x, y) # c, para todo x, y ∈ A, então dado um x0 ∈ A,
podemos tomar r = c de tal forma que d(x0 , y) # c = r, para todo y ∈ A. Isto significa que
A ⊂ B[x0 ; r].
Exemplo 1.5. Seja A = B[x0 ; r] uma bola fechada em R2 . Então existe
max d(x, y) = 2r
x,y∈A
que define o diâmetro da bola fechada. Por outro lado, seja B = B(x0 ; r) uma bola aberta
em R2 . Neste caso, não existe o máximo dos números x, y ∈ B. Com efeito, para todo
x, y ∈ B ⊂ R2 e diametralmente opostos, podemos tomar um ε > 0, arbitrário, tal que
d(x + ε, y + ε) é sempre menor que 2r. Assim, não podemos definir o diâmetro de bolas
abertas pelo maxx,y∈B d(x, y). Esta dificuldade é contornada através de um conceito que
generaliza a ideia de máximo: o supremo de um conjunto. Para isso, precisaremos da noção de
ordem sobre conjuntos.
DEFINIÇÃO 1.4. Seja X um conjunto não-vazio. Uma relação de ordem parcial em o conjunto
X é uma relação denotada por “≺” satisfazendo as seguintes propriedades:
1. x ≺ x para todo x ∈ X (propriedade reflexiva),
2. x ≺ y e y ≺ z implica que x ≺ z (propriedade transitiva),
3. x ≺ y e y ≺ x implica que x = y (propriedade anti-simétrica).
Nota 1.8. Um conjunto X munido com a ordem ≺ é chamado um conjunto ordenado parci-
almente. Neste caso, a relação x ≺ y pode ser entendida dizendo que x precede y.
Exemplo 1.6. Os conjuntos N, Z, Z+ , Q e R são exemplos fundamentais de conjuntos ordena-
dos parcialmente pela relação “#”: x ≺ y significa x # y. Já o conjunto de todos os números
complexos z = x + iy, w = u + iv é ordenado parcialmente pela convenção z ≺ w se, e
somente se, x # u e y # v.
Exemplo 1.7. Se P é o conjunto de todos os subconjuntos de um dado conjunto X, então
por convenção, A ≺ B se, e somente se, A ⊂ X, B ⊂ X e A ⊂ B. Esta ordem é chamada
relação de inclusão de conjuntos. Às vezes é útil considerar a ordem oposta: A ≺ B significa
que A ⊃ B. Essa relação, chamada de relação de inclusão inversa de conjuntos, aparece
frequentemente, sendo a ordem “natural” imposta sobre o conjunto de vizinhanças de qualquer
ponto em um espaço topológico, como teremos a oportunidade de ver mais adiante.
11
Exemplo 1.8. A relação de ordem pode ser definida por diagramas. Com efeito, podemos indicar
os membros de um dado conjunto X por símbolos apropriados, conectando-os através de uma
seta, ou seja, se x e y são membros de X, então conectamo-os por uma seta se, e somente se,
x ≺ y e se não existir um z ∈ X tal que x ≺ z ≺ y. Por exemplo, tome X = {u, v, x, y, z}.
Então o diagrama
z
y x
u v
define a seguinte ordem: v ≺ x, u ≺ x, u ≺ y, y ≺ z, x ≺ z e por causa da transitividade

u ≺ z, v ≺ z.
DEFINIÇÃO 1.5. Seja X um conjunto ordenado parcialmente. Se Y é um subconjunto de X,

então s ∈ X é chamado um limite superior (ou majorante) de Y se y ≺ s acontece para
todo y ∈ Y (ou seja, se todo y ∈ Y precede s). Diz-se que um elemento m ∈ X é maximal, se
x ∈ X e m ≺ x juntos implicam que m = x (ou seja, se não existe m ∈ X distinto de x tal
que x precede m. Assim, se x é maximal, qualquer outro elemento em X deve preceder x).
Exemplo 1.9. Se P é o conjunto de todos os subconjuntos de um dado conjunto X, então existe

somente um elemento maximal em P: o próprio conjunto X. Naturalmente, se considerarmos
a relação de inclusão inversa, o elemento maximal é o conjunto vazio. O conjunto R não tem
elemento maximal.
DEFINIÇÃO 1.6. Seja X um conjunto ordenado parcialmente. Diz-se que um subconjunto Y de

X é uma cadeia (ou está linearmente ordenado, ou totalmente ordenado) se para cada par
x, y de elementos distintos de Y tem-se x ≺ y ou y ≺ x (no sentido da ordem gerada pela
ordem inicial de X). Diz-se que um conjunto é ordenado indutivamente se toda cadeia em X
tem um limite superior.
Nota 1.9. Neste ponto é importante esclarecer a diferença entre um conjunto parcialmente
ordenado e um conjunto totalmente ordenado. No caso de um conjunto parcialmente ordenado,
X, o termo “parcial” é adotado porque pode haver elementos em X que não são comparáveis
de acordo com a ordenação ≺ dada. Por outro lado, o termo “total” será empregado quando os
elementos de um dado conjunto com a ordenação parcial ≺ dada forem comparáveis. Com
efeito, a ordem definida sobre o conjunto X do Exemplo 1.8 não é total uma vez que u e v não
são comparáveis: nem u ≺ v e nem v ≺ u!
A noção de um elemento maximal nos leva à um axioma de fundamental importância na
demonstração de vários teoremas da Análise Funcional, conhecido como
LEMA 1.1 (Lema de Max Zorn). Todo conjunto ordenado indutivamente tem no mínimo um
elemento maximal.
Em outras palavras, o Lema de Zorn estabelece que se cada cadeia em um conjunto ordenado
parcialmente tiver um majorante, esse conjunto conterá um elemento maximal. Esse elemento
maximal não precisa ser único!
O Lema de Zorn é equivalente2 ao
2
Isto significa que o Axioma da Escolha e o Lema de Zorn podem ser deduzidos um do outro.
12
! "
AXIOMA 1 (Axioma da Escolha). Seja A =+ A1 , A2 , . . . uma coleção de conjuntos disjuntos.
Então existe um conjunto A tal que A ⊆ i Ai e, para cada i, A ∩ Ai tem exatamente um
elemento.
Note que o axioma da escolha afirma que se A é um conjunto não-vazio de conjuntos e
se não existe quaisquer dois membros distintos de A que tenham um elemento em comum,
então existe um conjunto que consiste exclusivamente de um único elemento tomado de cada
conjunto de A.
Retornemos ao conceito de supremo. Vamos mostrar como a noção de ordem parcial torna
possível precisar a ideia de supremo de um conjunto. Seja X um conjunto parcialmente
ordenado. Um subconjunto A de X é majorado se existe x0 ∈ X tal que x ≺ x0 , para todo
x ∈ A. Se x0 ≺ y0 , então y0 também é um majorante de A.
DEFINIÇÃO 1.7. O menor dos majorantes de A é chamado o supremo de A, denotado por sup A.
De maneira semelhante definimos o ínfimo de um conjunto. Seja X um conjunto ordenado.
Um subconjunto A de X é minorado se existe x0 ∈ X tal que x0 ≺ x, para todo x ∈ A. Se
y0 ≺ x0 , então y0 também é um minorante de A.
DEFINIÇÃO 1.8. O maior dos minorantes de A é chamado o ínfimo de A, denotado por inf A.
Exemplo 1.10. Seja X = {t, u, v, x, y, z, w} e tome X ⊃ Y = {x, y, z}. Defina uma ordem
em X como representada no diagrama abaixo:
t w
y x
u v
O único minorante de Y é u (claramente u ∈

/ Y ). Logo, inf Y = u. Por sua vez, os majorantes
de Y são os elementos z, w e t. z é o menor dos majorantes; logo, sup Y = z. Note que
z ∈ Y , enquanto que w, t ∈
/ Y.
O exemplo acima nos mostra que quando o supremo (assim como o ínfimo) de um conjunto
quando existe, ele pode ou não pertencer ao conjunto. Se dado um conjunto A tivermos que
sup A ∈ A, então nós também o denotamos por max A, o máximo de A; da mesma forma se
tivermos que inf A ∈ A, então nós também o denotamos por min A, e o mínimo de A.
Exemplo 1.11. Considere os conjuntos A = (a, b) e B = [a, b]. Então, sup A = max B = b,
enquanto inf A = min B = a.
Exemplo 1.12. Seja A = {1/n | n ∈ N}. Então sup A = 1 pertence a A; logo temos que
max A = 1. Por outro lado, inf A = 0 não pertence a A e, portanto, A não tem mínimo.
Deve-se enfatizar que o supremo e o ínfimo de um conjunto são univocamente determinados
pelas propriedades que os definem. De fato, se x = sup A e y = sup A, então x ≺ y e y ≺ x,
mas isto implica que x = y pelo fato de A ser parcialmente ordenado. O mesmo raciocínio
mostra que o se x = inf A, ele é único. No caso em que A ⊂ R caracterizamos a unicidade
do sup A e do inf A através da seguinte
PROPOSIÇÃO 1.1. O supremo, ou ínfimo, de um conjunto A ⊂ R se existir, é único. Além disso,
se ambos existem, então inf A # sup A.
13
Demonstração. Suponha que M e M ′ são supremos de A. Então M # M ′ se M ′ é um limite

superior de A e M é o menor limite superior de A; de forma semelhante, M ′ # M, então
M = M ′ . Por outro lado, se m e m′ são ínfimos de A, então m " m′ se m′ é um limite inferior
de A e m é o maior limite inferior; de forma semelhante, m′ " m, assim m = m′ . Agora, se
inf A e sup A existem, então A é não vazio. Escolha x ∈ A, então inf A # x # sup A já que
inf A é um limite inferior de A e sup A é um limite superior. Logo, inf A # sup A.
Se A ⊂ R a seguinte caracterização alternativa do sup e inf é uma consequência imediata
da definição.
PROPOSIÇÃO 1.2. Se A ⊂ R, então M = sup A se, e somente se (a) M é um limite superior
de A e (b) para todo M ′ < M existe um x ∈ A tal que x > M ′ . Da mesma forma, m = inf A
se, e somente se (a) m é um limite inferior de A e (b) para todo m′ > m existe um x ∈ A tal
que x < m′ .
Demonstração. Suponha que M satisfaz as condiçõs na proposição. Então M é um limite
superior e (b) implica que se M ′ < M, então M ′ não é um limite superior, logo M = sup A.
Reciprocamente, se M = sup A, então M é um limite superior e se M ′ < M então M ′ não é
um limite superior, assim existe um x ∈ A tal que x > M ′ . A prova para ínfimo é análoga.
Frequentemente, usa-se um dos seguintes argumentos: (a) se M é um limite superior de A,
então M " sup A; (b) para todo ε > 0, existe um x ∈ A tal que x > sup A − ε. Da mesma
forma: (a) se m é um limite inferior de A, então m # inf A; (b) para todo ε > 0, existe um
x ∈ A tal que x < inf A + ε.
Se A ⊂ R nós dizemos que o supremo ou ínfimo de um conjunto existe se ele é um número
real finito. Para um conjunto indexado A = {xk | k ∈ J}, muitas vezes escrevemos
sup A = sup xk e inf A = inf xk .

k∈J k∈J
PROPOSIÇÃO 1.3. Sejam A ⊂ R e c ∈ R. Defina
cA = {y ∈ R | y = cx para algum x ∈ A} .
Se c " 0, então sup cA = c sup A e inf cA = c inf A. Se c < 0, então sup cA = c inf A e
inf cA = c sup A.
Demonstração. O resultado é óbvio se c = 0. Se c > 0, então cx # M se, e somente se,
x # M/c, o que mostra que M é um limite superior de cA se, e somente se M/c é um limite
superior de A; logo sup cA = c sup A. Se c < 0, então cx # M se, e somente se, x " M/c.
Assim, M é um limite superior de cA se, e somente se, M/c é um limite inferior de A; logo
sup cA = c inf A. Para provar os resultados restantes usamos raciocínio análogo.
PROPOSIÇÃO 1.4. Sejam A e B subconjuntos de R. (a) Se A ⊂ B e A ̸= ∅, então sup A #
sup B e inf B # inf A. (b) Se C = A + B = {x + y | x ∈ A, y ∈ B}, então sup C =
sup A + sup B e inf C = inf A + inf B.
Demonstração. (a) Uma vez que sup B é um limite superior de B e A ⊂ B, então sup B é
um limite superior de A; logo sup A # sup B. A prova para o ínfimo é similar. (b) O conjunto
A + B é limitado superiormente se, e somente se, A e B são limitados superiormente. Logo
sup(A + B) existe se, e somente se, tanto sup A e sup B existem. Nesse caso, se x ∈ A e
y ∈ B, então x + y # sup A + sup B; assim sup A + sup B é um limite superior de A + B
14
e, portanto, sup(A + B) # sup A + sup B. Para obter a desigualdade na direção oposta, tome
um ε > 0. Então existem x ∈ A e y ∈ B tais que
ε ε
x > sup A − e y > sup B − .
2 2
Então, x + y > sup A + sup B − ε, para todo ε > 0, o que implica que sup(A + B) "
sup A + sup B. Consequentemente, sup(A + B) = sup A + sup B.
DEFINIÇÃO 1.9 (Diâmetro de um Conjunto). Seja A ⊂ B, tal que sobre B está definida uma
métrica. Sendo A limitado, o diâmetro de A é o supremo dos números d(x, y), com x, y ∈ A,
isto é,
diam(A) = sup d(x, y) .
x,y∈A
COROLÁRIO 1.1. O diâmetro de uma bola aberta, B(x0 ; r), de centro x0 e raio r > 0 é
sup d(x, y) = 2r .
x,y∈B(x0 ;r)
No caso de uma bola fechada, o diâmetro é
sup d(x, y) = max d(x, y) = 2r .

x,y∈B[x0 ;r] x,y∈B[x0 ;r]
DEFINIÇÃO 1.10 (Distância Entre Dois Conjuntos). Sejam A e B subconjuntos não-vazios de

um espaço M sobre o qual está definida uma métrica. A distância entre A e B é definida por
d(A, B) = inf d(x, y) .

x∈A,y∈B
COROLÁRIO 1.2. Sejam x um ponto e A um subconjunto não-vazio de um espaço M sobre o

qual está definida uma métrica. A distância do ponto x ao conjunto A é o número real
d(x, A) = inf d(x, y) .

y∈A
Exemplo 1.13. Suponha que A seja a reta ligando os pontos y, z ∈ M, tal que sobre M está
definida uma métrica. Seja x um ponto de M que não pertence à reta A. Então d(x, A) é o
comprimento de reta perpendicular ligando x a A (veja a figura abaixo).
M
z
y x
15
1.1.5 Extensão do Conjunto R

Quando queremos expressar a ideia de que uma quantidade pode ser feita tão grande quanto
se queira, nós simplesmente dizemos que esta quantidade é infinita. Por exemplo, você pode se
lembrar do Cálculo que
1
lim+ = ∞ .
x→0 x
Podemos ampliar o conjunto dos número reais de forma a incluir os símbolos −∞ e ∞. O

conjunto resultante é chamado conjunto dos números reais estendido denotado por
R = [−∞, ∞] = R ∪ {−∞, ∞} .
Os símbolos −∞ e ∞ satisfazem as seguintes propriedades aritméticas:

(a) Se x ∈ R, então |x| < ∞ (ou seja, −∞ < x < ∞), isto significa que é um número real
finito e
1 1 1
x + ∞ = ∞ , x − ∞ = −∞ , = =0, =∞.
∞ −∞ 0
(b) Se x > 0, então
x · ∞ = ∞ , x · (−∞) = −∞ .
(c) Se x < 0, então
x · ∞ = −∞ , x · (−∞) = ∞ .
(d) Ainda, nós adotamos as seguintes convenções: ∞ + ∞ = ∞, −∞ − ∞ = −∞
∞ · ∞ = ∞, ∞ · (−∞) = −∞ e (−∞) · (−∞) = ∞.
Neste ponto, alertamos o leitor de que os novos símbolos ∞ e −∞ não são números, sendo
definidos apenas em termos das propriedades acima e não podem ser usados, exceto conforme
∞
prescrito por essas convenções. Em particular, expressões como ∞ − ∞, ∞ e 0 · (±∞) não
têm significado, não√estão definidas. Por exemplo, x/(1 + x2 ) se aproxima de 0 como x → ∞,
enquanto x/(1 + x) se aproxima de +∞ quando x → ∞. Assim, o quociente de dois
∞
números grandes podem se aproximar de 0 ou ∞. É por isso que dizemos que ∞ não faz
sentido.
Um uso conveniente do conjunto R surge quando um conjunto A não é limitado superior-
mente. Neste caso, escreve-se sup A = +∞. Da mesma forma, inf A = −∞ exprime o fato
que A não é limitado inferiormente. Assim, em R todo conjunto tem sup e inf. Se A = ∅ é
o conjunto vazio, então todo número real é tanto um limite superior e um limite inferior de A,
e escrevemos sup ∅ = −∞ e inf ∅ = ∞, respectivamente. Uma função cujo os valores estão
em R é chamada uma função valorada no conjunto dos reais estendido.
1.1.6 Cardinalidade de Conjuntos

Sejam A e B dois conjuntos. Diz-se que A e B são equivalentes (relação denotada por
A ∼ B) se existe uma bijeção entre os elementos dos conjuntos. Se A e B são finitos, então
eles são equivalentes se eles contém o mesmo número de elementos. Dizer que um conjunto A
é finito é o mesmo que dizer que A é equivalente ao conjunto In = {1, 2, . . . , n} de números
naturais. Ou seja, para algum n ∈ N, temos que
! "
In = m ∈ N | 1 # m # n .
De forma mais precisa, definimos:
16
* Conjunto Finito: Diz-se que um conjunto A é finito se, e somente se, existe um n ∈ N tal
que A ∼ In . Se A tem zero elementos ele é vazio, e, portanto, é também finito; caso contrário
n ∈ N é o número de elementos de A.
* Conjunto Infinito: Diz-se que um conjunto A é infinito se ele não é finito.
* Conjunto Enumerável: Diz-se que um conjunto A é enumerável se, e somente se, A ∼ N.
Em outras palavras, um conjunto A diz-se enumerável quando seus elementos podem ser
nomeados “o primeiro elemento,” “o segundo elemento,” · · · , “o n-ésimo elemento,” e assim
por diante. Isto significa que os elementos do conjunto A podem ser postos em correspondên-
cia bijetiva com o conjunto dos naturais N, isto é, os elementos do conjunto A podem ser
sistematicamente contados. A bijeção f : N → A chama-se uma enumeração dos elementos de
A. Evidentemente, N é um conjunto infinito.
* Conjunto Contável: Diz-se que um conjunto A é contável se, e somente se, A é finito ou
enumerável.
Nota 1.10. Alguns autores dizem que um conjunto A é enumerável quando é finito ou existe
uma aplicação biunívoca f : A → N de A sobre o conjunto N. Outros chamam enumeráveis
apenas os conjuntos que estão em correspondência biunívoca com N. Muitas vezes a estes
conjuntos chama-se conjuntos infinitos enumeráveis.3
Se A e B são dois conjuntos equivalentes, diz-se que eles tem a mesma cardinalidade.
Cardinalidade, em teoria dos conjuntos, é uma forma de “medir” a quantidade de elementos de
um conjunto. Para quantificar a noção de cardinalidade, introduzimos o conceito do número
cardinal de um conjunto. O cardinal indica o número ou quantidade dos elementos constituintes
de um conjunto. É interessante destacar que o cardinal se diferencia do ordinal, porque o ordinal
introduz ordem e dá ideia de hierarquia: primeiro, segundo, terceiro, etc. O cardinal, por sua
vez, nomeia o número de elementos constituintes e esse é o nome do conjunto correspondente.
Geralmente, o símbolo ℵ0 (alef zero) é usado para indicar o número cardinal dos conjuntos
enumeráveis. O conjunto vazio ∅ é associado ao número cardinal 0. Números cardinais finitos
1, 2, 3, . . . estão associados aos conjuntos {∅}, {∅, {∅}}, {∅, {∅}, {∅, {∅}}}, . . ., etc. O
intervalo unitário A = {x ∈ R | 0 # x # 1} é não-contável no sentido que é infinito e com
cardinalidade superior a ℵ0 – diz-se que ele é um continuum e está associado à cardinalidade
c. Nesse sentido, diz-se que ℵ0 é a menor das cardinalidades infinitas.
O fato de não existir qualquer subconjunto dos reais com cardinalidade estritamente maior
que ℵ0 e estritamente menor que c é conhecida como a hipótese do continuum. Por isso,
ocasionalmente se usa a notação c = ℵ1 .
TEOREMA 1.1. A cardinalidade do conjunto R é ℵ1 .
Prova usando o Método Diagonal de Cantor. A prova de que a cardinalidade do conjunto dos
reais R é ℵ1 é realizada por contradição. Assuma que o intervalo unitário [0, 1] é um intervalo
infinito contável. Se assim, podemos obter uma sequência de números reais (rn )n∈N ⊂ [0, 1].
Por outro lado, sabe-se que os números reais existentes entre 0 e 1 podem ser representados
univocamente na forma decimal. Organizemos esses números em uma lista, que não precisa,
necessariamente, de estar em ordem. Logo, uma sequência de números reais entre [0, 1] pode
ser r1 = 0, 6341582 . . ., r2 = 0, 4272125 . . ., r3 = 0, 9159821 . . ., r4 = 0, 1251074 . . .,
r5 = 0, 9341323 . . ., r6 = 0, 3627194 . . ., r7 = 0, 1253126 . . ., etc. Em seguida, se constrói
3
Alguns resultados sobre conjuntos finitos, infinitos e enumeráveis podem ser encontrados no livro do Elon L.
Lima, “Curso de Análise,” Volume 1, IMPA, 2014.
17
um número real “x = 0, x1 x2 x3 . . . ” usando-se os dígitos destacados em negrito da sequência

escolhida da seguinte forma: o dígito k corresponde ao k-ésimo dígito de rk , ao qual se soma
1, e no caso em que este dígito é nove, se coloca um zero. Portanto, o número “x” seria igual
a 0, 7362407 . . ., que é real, mas não pode ser encontrado na lista acima já que difere de
todos os números da lista. De fato, x difere de r1 no primeiro dígito, difere de r2 no segundo
dígito, difere de r3 no terceiro dígito, e assim por diante. Mas isto contradiz a hipótese que o
intervalo unitário [0, 1] é enumerável, uma vez que o número 0, 7362407 . . . já deveria estar
presente entre todos os números reais entre 0 e 1. Portanto, de acordo com a construção acima,
dada uma lista numerada de infinitos números reais no intervalo unitário [0, 1], sempre se pode
obter um número real entre 0 e 1 que não estava na lista. Finalmente, note que a função
f (x) = tan(π(x − 1/2)) define um mapeamento bijetivo (veja a definição abaixo) entre [0, 1]
e R. Assim, podemos afirmar que existem tantos números reais quanto os números reais entre
0 e 1. Logo, o conjunto dos reais R é não-contável.
1.1.7 Infinidades de Cantor

Cantor criou toda uma série de infinidades de diferentes tamanhos. A menor delas era o
conjunto dos naturais N. Outro conjunto infinito considerado do mesmo tamanho de N é o
conjunto de todos números pares {2, 4, 6, 8, 10, . . .}. De fato, este conjunto pode ser contado
fazendo corresponder o número 1 ao número 2, o número 2 ao número 4, o número 3 ao
número 6, o número 4 ao número 8, o número 5 ao número 10 e continuando ad infinitum.
Portanto, esse argumento mostra que existe uma correspondência direta um-a-um entre N e
todos os números pares. Por sua vez, o conjunto dos números racionais Q pode ser postos em
correspondência direta um-a-um com os números naturais, fazendo corresponder o número 1
ao racional 1/1, o número 2 ao racional 2/1, o número 3 ao racional 1/2 e continuando ad
infinitum, na ordem indicada pela sequência das setas mostrada no padrão abaixo:
1/1 2/1 3/1 4/1 5/1 6/1 7/1 ···
1/2 2/2 3/2 4/2 5/2 6/2 ··· ···
1/3 2/3 3/3 4/3 5/3 ··· ··· ···
1/4 2/4 3/4 4/4 ··· ··· ··· ···
1/5 2/5 3/5 ··· ··· ··· ··· ···
1/6 2/6 ··· ··· ··· ··· ··· ···
1/7 ··· ··· ··· ··· ··· ··· ···
··· ··· ··· ··· ··· ··· ··· ···
Portanto, esse argumento mostra que existe uma correspondência direta de um-para-um entre
N e todos os racionais ao longo da sequência
1/1, 2/1, 1/2, 1/3, 2/2, 3/1, 4/1, 3/2, 2/3, 1/4, 1/5, . . . ,
18
e assim por diante, ad infinitum. Logo, nesse sentido, os racionais formam um conjunto infinito
do mesmo tamanho que os números naturais.
1.1.8 Funções
Uma função f de um conjunto A em um conjunto B é um tripleto ordenado de conjuntos
(f , A, B), representada por f : A → B (que se lê “f definida da A a B”) ou por f : x 3→ f (x)
(que se lê “f associa f (x) ∈ B a x ∈ A”), tal que
(i) f ⊆ A × B,
(ii) para cada elemento x ∈ A existe um elemento y ∈ B tal que (x, y) ∈ f ,
(iii) para cada elemento x ∈ A e y1 , y2 ∈ B, se (x, y1 ) ∈ f e (x, y2 ) ∈ f , então y1 = y2 .
Quando (x, y) ∈ f , escreve-se y = f (x). Note que, (ii) e (iii) implicam que f é uma
regra4 que associa a cada elemento x de um conjunto A um, e somente um, elemento y de
um conjunto B. Dito de outra forma, se f é uma função e y1 = f (x1 ), y2 = f (x2 ), então
x1 = x2 =⇒ y1 = y2 . O conjunto A é chamado o domínio (ou campo de definição) da
função f , enquanto que B, o conjunto em que f toma valores, é chamado o contradomínio
de f . Deve-se enfatizar que o domínio de uma função nunca pode ser o conjunto vazio!
Nota 1.11 (Conjuntos Conexos). Ao longo destas notas, teremos que lidar frequentemente com
funções em subconjuntos do Rn . Como tais subconjuntos podem apresentar-se sob as mais
variadas formas, vamos procurar fixar o tipo de subconjuntos do Rn que nos interessará.
Estaremos interessados em subconjuntos do Rn mais particulares. Em primeiro lugar, estes sub-
conjuntos deverão possuir pontos interiores. Em segundo lugar, por simplicidade, assumiremos
que estes subconjuntos sejam constituídos de um só pedaço. Em termos técnicos isto significa
que assumiremos que os subconjuntos são conexos. Um subconjunto A ⊂ Rn diz-se conexo
quando quaisquer dois elementos x1 , x2 ∈ A podem ser ligados por um caminho contido em
A. Subconjuntos do Rn que mais aparecerão daqui para frente são abertos e conexos. Além
disso, um subconjunto do Rn pode ainda ser limitado ou não-limitado. Um conjunto A ⊂ Rn
é limitado quando a distância da origem a qualquer dos seus pontos não pode exceder um
valor fixo. Neste caso, existe uma bola aberta B(0; R) de centro na origem e raio R tal que
A ⊂ B(0; R).
Deve-se ter em mente que (i) implica que f é um conjunto. De fato, f : A → B é o um
conjunto de pares ordenados (x, y), x ∈ A, y ∈ B, com o assim chamado gráfico de f sendo
precisamente o conjunto
3 4
G(f ) = (x, f (x)) ∈ A × B | x ∈ A, f (x) ∈ B .
Nota 1.12. Costuma-se usar também os termos aplicação, mapeamento, transformação, ou

ainda operador como sinônimos de função. Assim, se f : A → B, dizemos que “f mapea A
em B” ou “f é uma transformação de A em B” ou “f é um operador de A em B”. Ao longo
destas notas aplicaremos o termo operadores para funções cujos domínios e contradomínios
são subconjuntos de espaços vetoriais munidos de uma estrutura topológica.
O elemento y ∈ B tal que f (x) = y é chamado a imagem de x ∈ A, o valor da função
em x. O conjunto dos elementos de B que são imagens de elementos de A é chamado
4
Aqui, consideramos uma “regra” como um dispositivo matemático que determina a maneira pela qual os
elementos em um conjunto A estão relacionados aos elementos de um outro conjunto B.
19
o conjunto imagem. Pode acontecer de existir elementos de B que não são a imagem de
qualquer elemento de A. Por outro lado, elementos distintos do conjunto domínio A podem
ter como imagem um mesmo elemento de B. Propriedades especiais de f são listadas pela
seguinte
DEFINIÇÃO 1.11. Diz-se que uma função f : A → B é

(i) uma sobrejeção, ou uma função sobrejetiva, se, e somente se, todo y ∈ B é imagem de
algum elemento de A; isto é, f (A) = B.
(ii) uma injeção, ou uma função injetiva, ou uma função um-para-um – denotada 1 : 1
– se para todo y pertencendo ao conjunto imagem de f existe exatamente um x ∈ A tal que
y = f (x); isto é, elementos distintos de A são levados em elementos distintos de B.
(iii) bijeção, ou uma função bijetiva, se, e somente se, todo y ∈ B é a única imagem de
algum x ∈ A; isto é, uma função é bijetiva se ela é ao mesmo tempo uma bijeção e uma
sobrejeção.
Exemplo 1.14. Sejam R o conjunto dos números reais e R+ o conjunto dos números reais
não-negativos, isto é, R+ = {x ∈ R | x " 0}. Seja f a regra f (x) = x2 . Então considere as
seguintes funções:
1. f1 : R → R. Esta função não é bijetiva, uma vez que −x e +x são mapeados em x2 .

Ela também não é sobrejetiva, já que números reais negativos estão no contradomímio
R, mas não no conjunto imagem.
2. f2 : R → R+ . Esta função não é injetiva, mas é sobrejetiva.
3. f3 : R+ → R. Esta função é injetiva, mas não é sobrejetiva.
4. f4 : R+ → R+ . Esta função é bijetiva.
Note que, embora a regra f (x) = x2 definindo cada uma das funções f1 , f2 , f3 e f4 seja a
mesma, as quatro funções são completamente diferentes.
Seja C um subconjunto de A. A função f |C : C → B é a restrição de f ao subconjunto
C. O conjunto ! "
f (C) = f (x) ∈ B | x ∈ C ⊂ A ,
é a imagem direta de C. Naturalmente, o conjunto imagem de C está contido no conjunto
imagem de A. Por outro lado, suponha que D seja um subconjunto de B. Então, o conjunto
! "
f −1 (D) = x ∈ A | f (x) ∈ D ⊂ B ,
é chamado a imagem inversa de D sob f . Claramente, f −1 (D) é um subconjunto do domínio

de f , e consiste daqueles elementos de A que têm imagens em E ⊂ D; dito de outra forma,
nem todo elemento de D é imagem de elementos de A. Em resumo, se f : A → B e se
C ⊂ A e D ⊂ B, então
C ⊂ f −1 (f (C)) e f (f −1 (D)) ⊂ D .
A primeira inclusão é uma igualdade se f é injetiva, enquanto que a segunda inclusão é uma
igualdade se f é sobrejetiva.
20
Sejam A, B e C conjuntos. Dadas as funções f : A → B e g : B → C, definimos a função

composta g ◦ f de f e g como a função g ◦ f : A → C que associa a cada elemento de A
um elemento de C via a função g; isto é,
(g ◦ f )(x) = g(f (x)) .
Isto acontece somente quando o contradomínio de f é igual ao domínio de g. Geralmente,

g ◦ f ̸= f ◦ g (verifique dando um exemplo!).
DEFINIÇÃO 1.12 (Suporte de uma função). O suporte de uma função f : A → B, denotado

por supp f , é o fecho do conjunto de pontos em A que têm a imagem por f diferente de zero, ou
seja,
! "
supp f = x ∈ A | f (x) ̸= 0 .
O supremo e ínfimo de uma função é o supremo e ínfimo de sua imagem, e os resultados

sobre conjuntos se aplicam imediatamente aos resultados sobre as funções.
DEFINIÇÃO 1.13. Se f : A → R é uma função, então

! " ! "
sup f = sup f (x) | x ∈ A e inf f = inf f (x) | x ∈ A .
A A
Uma função f é limitada superiormente sobre A se supA f é finito, e limitda inferiormente sobre
A se inf A f é finito, e limitada sobre A se ambos os limites são finitos.
Desigualdades e operações sobre funções são definidas considerando-se cada valor de f (x)
de uma função f . Por exemplo, se f , g : A → R, então f # g significa que f (x) # g(x) para
todo x ∈ A, e f + g : A → R é definido por (f + g)(x) = f (x) + g(x).
PROPOSIÇÃO 1.5. Suponha que f , g : A → R e f # g. Se g é limitada superiormente, então
sup f # sup g ,
A A
e se f é limitada inferiormente, então
inf f # inf g .
A A
Demonstração. Se f # g e g é limitada superiormente, então para todo x ∈ A
f (x) # g(x) # sup g .

A
Assim, f é limitada superiormente por supA g; logo supA f # supA g. Similarmente, g é

limitada inferiormente por inf A f ; logo inf A g " inf A f .
Note que, f # g não implica que supA f # inf A g; para se chegar a essa conclusão, é
necessário saber se f (x) # g(y) para todo x, y ∈ A e usar a Proposição 1.4.
21
Exemplo 1.15. Considere f , g : [0, 1] → R tais que f (x) = 2x e g(x) = 2x + 1. Então f < g
e
sup f = 2 , inf f = 0 , sup g = 3 , inf g = 1 .
[0,1] [0,1] [0,1] [0,1]
Logo, sup[0,1] f > inf [0,1] g.

A seguir, consideramos o supremo e ínfimo de combinações lineares de funções. A multipli-
cação por uma constante positiva multiplica o inf ou sup, enquanto a multiplicação por uma
constante negativa muda o inf e o sup.
PROPOSIÇÃO 1.6. Sejam A ⊂ R e c ∈ R. Suponha que f : A → R é uma função limitada. Se
c " 0, então supA cf = c supA f e inf A cf = c inf A f . Se c < 0, então supA cf = c inf A f e
inf A cf = c supA f .
Demonstração. Basta aplicar a Proposição 1.3 ao conjunto {cf (x) | x ∈ A} = c{f (x) | x ∈
A}.
PROPOSIÇÃO 1.7. Se f , g : A ⊂ R → R são funções limitadas, então
(a) supA (f + g) # supA f + supA g e inf A (f + g) " inf A f + inf A g;
5 5 5 5
(b) 5supA f − supA g 5 # supA |f − g| e 5inf A f − inf A g 5 # supA |f − g|.
Demonstração. (a) Uma vez que f (x) # supA f e g(x) # supA g para todo x ∈ [a, b], então
f (x)+g(x) # supA f +supA g. Portanto, f +g é limitada superiormente por supA f +supA g;
logo supA (f + g) # supA f + supA g. A prova para ínfimo é análoga (ou se aplica o resultado
para o supremo às funções −f e −g).
(b) Dado que f = f − g + g e f − g # |f − g|, obtemos do item (a) e da Proposição 1.5
que
sup f # sup(f − g) + sup g # sup |f − g| + sup g ,
A A A A A
logo,
sup f − sup g # sup |f − g| .
A A A
Trocando f e g na desigualdade acima, obtemos
sup g − sup f # sup |g − f | = sup |f − g| ,

A A A A
e isto implica que 5 5

5sup f − sup g 5 # sup |f − g| .
A A A
Finalmente, substituindo f por −f e g por −g na desigualdade acima e usando a identidade

sup(−f ) = − inf f (que segue da Proposição 1.3 tomando-se c = −1), obtemos
5 5
5inf f − inf g 5 # sup |f − g| ,
A A A
como era para ser provado.

É interessante enfatizar que podemos ter desigualdade estrita no item (a) na proposição
acima porque f e g podem assumir valores próximos de seus supremos (ou ínfimos) em
diferentes pontos. Por exemplo, considere f , g : [0, 1] → R definidas por f (x) = x e
g(x) = 1 − x. Então sup[0,1] f = sup[0,1] g = sup[0,1] (f + g) = 1. Logo, sup[0,1] (f + g) <
sup[0,1] f + sup[0,1] g.
22
PROPOSIÇÃO 1.8. Se f , g : A ⊂ R → R são funções limitadas tais que
|f (x) − f (y)| # |g(x) − g(y)| , ∀ x, y ∈ A ,
então
sup f − inf f # sup g − inf g .
A A A A
Demonstração. A condição implica que para todo x, y ∈ A, temos que

! " ! "
f (x) − f (y) # |g(x) − g(y)| = max g(x), g(y) − min g(x), g(y) # sup g − inf g .
A A
Isto, por sua vez, implica que

. /
sup f (x) − f (y) # sup g − inf g .
x,y∈A A A
Por outro lado,

. / . /
sup f (x) − f (y) = sup f (x) + (−1)f (y)
x,y∈A x,y∈A
= sup f (x) + sup(−1)f (y)

A A
= sup f (x) − inf f (y) ,

A A
com a última igualdade sendo obtida da Proposição 1.3 tomando-se c = −1. Disso segue o
resultado que era para ser provado.
1.2 Primeiras Noções sobre Topologia

Entre os conceitos mais importantes da Matemática encontramos a noção de convergência
e continuidade. Para que esses conceitos tenham algum significado é necessário falar de
proximidade entre pontos de um dado conjunto. Topologia5 é a área da Matemática que se ocupa
do estudo de aplicações contínuas entre espaços topológicos. Nesta seção definimos o que é
um espaço topológico, e apresentamos alguns conceitos elementares e teoremas associados com
espaços topológicos. Particularmente, consideraremos os espaços sobre os quais está definida
uma métrica.
1.2.1 Conjuntos Especiais

Seja A um conjunto sobre o qual está definida uma métrica. Se B ⊂ A, então um elemento
(ou ponto) x ∈ B é chamado um ponto interior a B quando este é o centro de uma bola aberta
contida inteiramente em B. Em outras palavras, para cada x ∈ B, existe um ε > 0, arbitrário,
tal que se y ∈ A, então d(x, y) < ε.
DEFINIÇÃO 1.14. O interior intA de um conjunto A é o conjunto de todos os pontos interiores

de A. O exterior extA de um conjunto A é o interior do complemento de A.
5
A palavra “topologia” se origina da combinação de duas palavras gregas: topos (lugar) e logos (estudo).
23
DEFINIÇÃO 1.15. A fronteira de B em A é o conjunto ∂B, formado pelos elementos y ∈ A tal

que toda bola aberta de centro y contém pelo menos um ponto de B e um ponto de B c = A−B.
A
y B
TEOREMA 1.2. Seja A um conjunto sobre o qual esteja definida uma métrica. Se B ⊂ A, então
x0 ∈ ∂B se d(x0 , B) = d(x0 , B c ) = 0.
Demonstração. Para x0 ∈ ∂B, dizer que d(x0 , B) = d(x0 , B c ) = 0 é o mesmo que dizer que
para cada ε > 0, arbitrário, existem x ∈ B e y ∈ B c tal que d(x0 , x) < ε e d(x0 , y) < ε.
De fato,! por definição, d(x"0 , x) " 0 !e d(x0 , y) " 0, para
" todo x ∈ B e y ∈ B c . Sejam
D1 = d(x0 , x) | x ∈ B e D2 = d(x0 , y) | y ∈ B c conjuntos de números reais não-
negativos, formados pelas distâncias de x0 aos diversos pontos de B e B c , respectivamente.
Note que 0 é um limite inferior para D1 e D2 . Assim, nenhum ε > 0 é o limite inferior para
D1 e D2 . Isto significa que, para todo x ∈ B e y ∈ B c , não existe ε > 0 tal que d(x0 , x) " ε
e d(x0 , y) " ε. Portanto, para todo ε > 0, arbitrário, existem x ∈ B e y ∈ B c tal que
d(x0 , x) < ε e d(x0 , y) < ε quando x0 ∈ ∂B.
DEFINIÇÃO 1.16. Um conjunto A diz-se aberto se, e somente se, A ∩ ∂A = ∅; ou seja, quando
todo elemento x ∈ A é interior a A.
Em topologia, um conjunto aberto é um conceito abstrato generalizando a ideia de um

intervalo aberto na linha real. Ainda, intuitivamente, um conjunto aberto fornece um método
para distinguir dois pontos. Por exemplo, se entorno de um ponto em um espaço topológico
existe um conjunto aberto (isto é, uma vizinhança aberta) que não contém outro ponto (distinto),
os dois pontos são referidos como topologicamente distinguíveis. Dessa maneira, pode-se falar
se dois subconjuntos de um espaço topológico estão “próximos” sem definir concretamente uma
métrica no espaço topológico.
TEOREMA 1.3. Toda bola aberta B(x0 ; ε), de centro x0 e raio ε > 0 arbitrário, contida em um
conjunto A sobre qual esteja definida uma métrica é um conjunto aberto.
Demonstração. Para todo x ∈ B(x0 ; ε) segue que d(x0 , x) < ε. Seja ε′ = ε − d(x0 , x) > 0.
Então, B(x; ε′ ) ⊂ B(x0 ; ε). Com efeito, para todo y ∈ B(x; ε′ ), segue que d(x, y) <
ε − d(x0 , x). Portanto,
d(x0 , y) # d(x0 , x) + d(x, y) < d(x0 , x) + ε − d(x0 , x) = ε .
Logo, y ∈ B(x0 ; ε).

Note que, de acordo o teorema acima, em todo espaço sobre os qual temos definida uma
métrica, um conjunto A é aberto se todo elemento x ∈ A é o centro de uma bola aberta
que está completamente contida em A (veja o Lema 1.2 abaixo) ou, de forma equivalente, um
conjunto A é aberto se ele não contém nenhum de seus pontos de fronteira.
24
DEFINIÇÃO 1.17. Um conjunto A diz-se fechado se, e somente se, seu complemento Ac é aberto.
Em outras palavras, A é fechado se ele contém todos os seus pontos de fronteira.
Nota 1.13. Nas definições de conjuntos abertos e fechados, os conjuntos A e Ac são sempre
considerados como subconjuntos de um conjunto universal U, também chamado conjunto
suporte.
1.2.2 Espaços Topológicos

Vamos definir o que é um espaço topológico. Com esse objetivo, começamos provando o
seguinte
TEOREMA 1.4. Seja F a família dos subconjuntos abertos de um conjunto U sobre o qual esteja
definida uma métrica. Então:
(i) ∅ ∈ F e U ∈ F ,
(ii) a interseção de um número finito de elementos de F pertence a F ,
(iii) a união arbitrária de elementos de F pertence a F .
Demonstração. (i) Para mostrar que ∅ ∈ F e U ∈ F , devemos mostrar que ambos conjuntos
são abertos. Assuma que existe x ∈ ∂∅. Isto significa que a bola aberta B(x; ε), de centro
x e raio ε > 0, arbitrário, contém pelo menos um elemento de ∅ e um elemento de ∅c .
Evidentemente, isso contradiz a definição de conjunto vazio. Assim, ∅ ∩ ∂∅ = ∅.6 Logo,
por definição ∅ é aberto. Que U é aberto segue do seguinte fato: seja x ∈ ∂U; então, por
definição, toda bola aberta de centro x contém pelo menos um ponto de U e um ponto de
U c = ∅. Mas isso novamente contradiz a definição de conjunto vazio. Assim, todo elemento
x ∈ U é interior a U. Portanto, U é aberto.
(ii) Para provar que A1 ∩ A2 ∩ · · · ∩ An ∈ F precisamos do seguinte
LEMA 1.2. Seja A um conjunto sobre o qual esteja definida uma métrica. Então C ⊂ A é aberto
se, e somente se, cada x ∈ C é centro de uma bola aberta B(x; ε) inteiramente contida em C.
Demonstração. Se todo x ∈ C é centro de uma bola aberta B(x; ε), de raio ε, arbitrário,
inteiramente contida em C então x ∈ / ∂C, caso contrário B(x; ε) deveria conter pelo menos
um elemento de A − C. Logo, C ∩ ∂C = ∅; ou seja, C é aberto. Reciprocamente, assuma que
C seja aberto e tome x ∈ C. Toda bola aberta B(x; ε) de centro em x e raio ε > 0, arbitrário,
deve conter um elemento y ∈ C tal que y ̸= x. Como x ∈ / ∂C, segue do Teorema 1.3 que
podemos sempre encontrar uma bola aberta B(x; ε) que não contém elementos de A − C,
tomando-se raios cada vez menores de tal forma que B(x; ε) ⊂ C.
*
Continuação da demonstração do Teorema 1.4. Tome x ∈ ni=1 Ai . Pelo Lema 1.2, existem
ε1 > 0, . . . , εn > 0 tal que B1 (x; ε1 ) ⊂ A1 , . . . , Bn (x; εn ) ⊂ An , uma vez que os conjuntos
A1 , . . . , An são abertos. Seja ε = min{ε1 , . . . , εn }. Então, B(x; ε) ⊂ Bi (x; εi ) ⊂ Ai , para
todo i = 1, . . . , n. Evidentemente,
n
'
x ∈ B(x; ε) ⊂ Ai .
i=1
6
Aqui, podemos recorrer à demonstração por vacuidade (veja a Nota 1.2) para afirmar que é verdade que o
conjunto vazio é aberto, pois é impossível encontrar um elemento x ∈ ∂∅ tal que a bola aberta B(x; ε), de centro
x e raio ε > 0, arbitrário, contenha pelo menos um elemento de ∅ e um elemento de ∅c .
25
*n
Logo, i=1 Aié aberto pelo Lema 1.2.
+
(iii) Seja A = i∈I Ai , em que I é um conjunto de índices. Tome um elemento x qualquer
de A. Por definição, x deve pertencer a pelo menos um dos conjuntos Ai . Sendo cada conjunto
Ai aberto, segue que a bola aberta B(x; ε) ⊂ Ai . Assim, B(x; ε) ⊂ A. Logo A é aberto.
COROLÁRIO 1.3. Seja A um conjunto sobre o qual está definida uma métrica. Um subconjunto
C de A é aberto se, e somente se, é união de bolas abertas.
Demonstração. Em virtude do Teorema 1.3 e do item (iii) do Teorema

+ 1.4, segue que qualquer
união de bolas abertas é um conjunto aberto. Logo, se C = x∈C B(x; ε), em que B(x; ε)
é uma bola aberta de centro x e raio ε, então C é um conjunto aberto. Reciprocamente,
se C ⊂ A é aberto, então para cada x ∈ C existe uma bola aberta B(x; ε) centrada em
x, inteiramente
+ contida
+ em C. Logo {x} ⊂ B(x; ε) ⊂ C. Tomando uniões, segue que
C = x∈C {x} ⊂ x∈C B(x; ε) ⊂ C, o que mostra ser C uma união de bolas abertas.
Nota 1.14. Segue imediatamente da Lei do Complemento e do teorema acima que os conjuntos
∅ e U são ao mesmo tempo abertos e fechados.
Exemplo 1.16. O conjunto Rn não admite nenhum ponto de fronteira; assim, a fronteira de Rn
é vazia. Como ∅ ⊂ Rn , concluímos que Rn é também um conjunto fechado. Portanto, Rn
considerado como um subconjunto de Rn é fechado e aberto. Por sua vez, o conjunto vazio é
subconjunto de Rn . O complemento de ∅ em relação a Rn é o próprio Rn . Como esse último
é aberto, concluímos que ∅ é fechado, e como Rn é fechado, concluímos que ∅ é também
aberto!
Nota 1.15. Segue do item (ii) do Teorema 1.4 que a interseção de uma família infinita de abertos
pode não ser um conjunto aberto. Por exemplo, todo elemento x ∈ A, em que A é um conjunto
sobre o qual está definida uma métrica, é a interseção de todas as bolas abertas com centro x
e raio ε = 1/n, ou seja
' 6 17
{x} = B x; .
n∈N
n
Mas, a menos que x seja um ponto isolado, {x} não é um conjunto aberto de A.
DEFINIÇÃO 1.18. Seja A um conjunto sobre o qual existe definida uma métrica. O elemento
x ∈ A chama-se um ponto isolado de A quando existe um ε > 0, arbitrário, tal que B(x; ε) =
{x}, ou seja, quando a bola aberta B(x; ε) consiste unicamente do elemento {x}.
Exemplo 1.17. Considere o conjunto dos números inteiros Z. Sabemos que Z ⊂ R. Sendo
d(x, y) = |x − y| a métrica usual em R, podemos definir a distância entre dois elementos
x, y ∈ Z como a mesma distância entre eles considerados como elementos de R, ou seja, se
x, y ∈ Z, então d(x, y) = |x − y|. Neste caso, dizemos que a métrica d(x, y) = |x − y|
definida em Z foi induzida pela métrica usual de R. Com esta métrica induzida, não é difícil
ver que todo elemento de Z é um ponto isolado, portanto, todo elemento de Z é aberto em Z.
De fato, basta tomarmos bolas abertas de raios ε < 1. Por outro lado, os elementos de Z vistos
agora como elementos de R não são abertos em R.
DEFINIÇÃO 1.19. Seja E um conjunto. Diz-se que o conjunto E está munido de uma estrutura
τ
topológica se é dada uma família de subconjuntos de E satisfazendo as seguintes propriedades:
(A.1) o conjunto vazio, ∅, e o espaço todo, E, pertencem a ;τ
τ
(A.2) a interseção de um número finito de elementos de pertence a ; τ
26
τ
(A.3) a união de uma família qualquer de elementos de pertence a . τ
Os conjuntos dessa família τ τ
chamam-se abertos, e o par (E, ) é chamado um espaço
topológico.
Nota 1.16. A Propriedade (A.2), na definição acima, é equivalente a dizer que a interseção de
dois abertos é um aberto.
Nota 1.17. Qualquer propriedade de E que seja inteiramente expressa em termos dos conjuntos
abertos de E (isto é, em termos da topologia de E) é chamada uma propriedade topológica
de E. Por exemplo, um conjunto E ser limitado não é uma propriedade topológica, pois isso
depende em particular da métrica que é definida em E.
Exemplo 1.18. Se sobre um conjunto E existe definida uma métrica d, então sobre E podemos
definir uma topologia induzida pela métrica d. Com efeito, como a família de abertos de τ
é composta de subconjuntos abertos
! Ci ⊂ E, então" para todo x ∈ Ci , existe ε > 0 tal que
para a bola aberta B(x; ε) = y | d(x, y) < ε , com centro + x e raio ε > 0, temos que
B(x; ε) ⊂ Ci ⊂ E. Logo, pelo Corolário 1.3, cada aberto Ci = x∈C B(x; ε) ⊂ E.
1.2.3 Bases
Notamos que no Exemplo 1.18 cada aberto Ci ⊂ E, em que E é equipado com uma métrica,
pode ser escrito como a união de bolas abertas. Esse exemplo é generalizado pela seguinte
τ
DEFINIÇÃO 1.20. Uma família B ⊂ é chamada uma base se, e somente se, qualquer aberto
+
τ
A ∈ é da forma A = i∈I Bi para alguma família {Bi }i∈I ⊂ B .
Uma definição alternativa de uma base para um espaço topológico segue da seguinte
PROPOSIÇÃO 1.9. Uma família de conjuntos {Bi }i∈I forma uma base aberta para um espaço
τ
topológico (E, ) se, e somente se, cada x ∈ E está contido em algum Bi , e se x ∈ Bi1 ∩ Bi2
então existe Bi3 tal que x ∈ Bi3 ⊂ Bi1 ∩ Bi2 .
+
Demonstração. Como o próprio conjunto E é aberto, por definição, então E = i∈I Bi para
alguma família {Bi }i∈I ⊂ B . Assim, para todo x ∈ E existe pelo menos um Bi tal que
x ∈ Bi , o que demonstra a primeira condição. Agora, se Bi1 ∩ Bi2 ̸= ∅, como Bi1 ∩ Bi2 é
a interseção de dois conjuntos abertos, será um aberto. Logo, Bi1 ∩ Bi2 deve ser representado
como a união de conjuntos abertos {Bi }i∈I para alguma família {Bi }i∈I ⊂ B , de modo
que para todo x ∈ Bi1 ∩ Bi2 existe pelo menos um B tal que x ∈ B = Bi3 . Portanto,
x ∈ Bi3 ⊂ Bi1 ∩ Bi2 . Isto demonstra a segunda condição. Reciprocamente, suponha que a
família de conjuntos {Bi }i∈I satisfaz as condições acima. Se
! "
τ = Aj | ∀x ∈ Aj , ∃Bi ∈ B de tal forma que x ∈ Bi ⊂ Aj ,
+ + 8+ 9 +
então τ ∋ j∈J Aj = j∈J i∈I Bi j = k∈K Bk , devido às propriedades elementares da
união de conjuntos.
+ Pela primeira condição, como!cada x pertence
" a pelo menos um Bi , segue
τ
que E = i∈I Bi . Logo E ∈ . Considere! a "∪ x | x ∈ ∅ . Desde que o conjunto ∅ não
possui nenhum elemento, tem-se ∪ x | x ∈ ∅ = ∅. Em outras palavras, a união vazia, ∪∅,
τ
de conjuntos da base é um subconjunto vazio de E. Portanto, ∅ ∈ . Resta mostrar que a
interseção de dois conjuntos Aj1 ∩ Aj2 em τ τ
pertence a . Com efeito, tome x ∈ Aj1 ∩ Aj2 ;
então existem conjuntos Bi1 e Bi2 que pertencem à família {Bi }i∈I tais que x ⊂ Bi1 ⊂ Aj1 e
x ⊂ Bi2 ⊂ Aj2 . Pela segunda condição, existe Bi3 tal que x ∈ Bi3 ⊂ Bi1 ∩ Bi2 . Ora, mas isso
τ
implica que x ∈ Bi3 ⊂ Aj1 ∩ Aj2 ; assim Aj1 ∩ Aj2 ∈ , por definição.
27
Exemplo 1.19. Sobre um conjunto

! E em que esteja definida uma métrica
" d, a família de todas
as bolas abertas Bi (x; εi ) = y ∈ E | d(x, y) < εi , x ∈ E, εi > 0 é uma base para a toplogia
τ
em E. De fato, dada uma família de Bi (x;+εi ) ∈ B , então Bi (x; εi ) ∈ , por definição.
Porque τ τ
é uma topologia em E, a união i∈I Bi (x; εi ) está em . Reciprocamente, dado
τ
um aberto Aj ∈ , para cada x ∈ Aj + existe um elemento Bi (x; εi ) ∈ B (pelo Lema 1.2) tal
que x ∈ Bi (x; εi ) ⊂ Aj . Então, Aj = x∈Aj Bi (x; εi ), de maneira que Aj é igual a união de
bolas abertas Bi (x; εi ) ∈ B (pelo Corolário 1.3).
Nota 1.18. Se sobre um conjunto E existem definidas mais de uma métrica, então cada família
de bolas abertas, gerada por cada uma das métricas definidas em E, é uma base para uma
topologia em E. Logo, cada aberto A em E pode ser escrito como a união de elementos de
cada uma das bases geradas pelas métricas definidas em E. Assim, o termo “base” em topologia
difere, e muito, do seu uso em álgebra linear, em que um vetor é escrito como uma combinação
linear de vetores de uma base; logo, esta combinação linear é única.
1.2.4 Vizinhanças
DEFINIÇÃO 1.21. Sejam E um espaço topológico e x ∈ E. Um subconjunto V de E é chamado
uma vizinhaça de x ∈ E se existe um subconjunto aberto U de E tal que x ∈ U ⊂ V .
De acordo com esta definição, uma vizinhança pode ser aberta ou fechada, já que a única
coisa que é exigida é que V contenha um subconjunto aberto U de E tal que x ∈ U ⊂ V ,
para todo x ∈ E. Se V é aberto então dizemos que V é uma vizinhança aberta de x, caso
contrário dizemos que V é uma vizinhança fechada de x.
TEOREMA 1.5. Seja E um espaço topológico e V ⊂ E. As seguintes condições são equivalentes:
(1) V é aberto;
(2) V é uma vizinhança de cada um de seus elementos.
Demonstração. (1) ⇒ (2). Suponha que V é aberto. Seja x ∈ V . Então x ∈ V ⊂ V , assim V é
uma vizinhança de x.
(2) ⇒ (1). Suponha que a condição (2) seja satisfeita. Então, +
para cada x ∈ V existe um
′ ′
subconjunto aberto Ux de E tal que x ∈ Ux ⊂ V . Seja V = x∈V Ux . Então + V é aberto
′ ′
pelo Teorema 1.4. Devemos provar que V = V . Com efeito, ∀ x ∈ V ⇒ x ∈ x∈V Ux ⇒ x ∈
a pelo menos um Ux . Como cada Ux ⊂ V ⇒ x ∈+V ⇒ V ′ ⊂ V . Reciprocamente, como
∀ x ∈ V existe um Ux tal que x ∈ Ux ⊂ V ⇒ x ∈ x∈V Ux ⇒ x ∈ V ′ ⇒ V ⊂ V ′ . Logo V
é aberto.
Se o espaço E é equipado com uma métrica, podemos trocar U na Definição 1.21 acima por
uma bola aberta. Dessa foma temos a
DEFINIÇÃO 1.22. Sobre um conjunto E sobre o qual esteja definida uma métrica, diz-se que um
conjunto V é uma vizinhaça de x ∈ E se, e somente se, V contém, inteiramente, uma bola
aberta B(x; ε), de centro x e raio ε > 0, arbitrário.
Nota 1.19. De acordo com o Lema 1.2 e com o Exemplo 1.19, todo conjunto aberto na definição
de topologia é uma vizinhança de cada um de seus elementos (ou pontos). Assim, toda família
de bolas abertas é uma base de vizinhanças de x, uma vez que pelo Teorema 1.3 toda bola
aberta é um conjunto aberto. Isso é interessante, pois nos permite tomar vizinhanças de x tão
pequenas quanto se queira. Este fato é importante na definição de continuidade de uma função.
28
1.2.5 Comparações entre Topologias

Em geral, notamos que um conjunto E pode ser equipado com mais de uma estrutura
topológica. Por exemplo, vamos tomar o seguinte caso simples: considere o conjunto E =
{1, 2, 3, 4, 5}, então as famílias
3 4
τ 1 = E, ∅, {1}, {2}, {1, 2}, {1, 2, 3}, {1, 2, 3, 4} ,
e 3 4
τ 2 = E, ∅, {1}, {2}, {1, 2} ,
são duas topologias em E. Isso nos permite comparar as topologias τ eτ
1 2. De fato, observe
τ τ
que todo aberto de 2 é um aberto de 1 . Isso nos leva à seguinte
τ τ
DEFINIÇÃO 1.23. Dado um conjunto E com topologias 1 e 2 , diz-se que 1 é mais finaτ
τ τ
que 2 se, para qualquer elemento x ∈ E, todo aberto contendo x segundo 2 é também um
τ τ τ
aberto segundo 1 . Ou seja, dado um A ⊂ E, A ∈ 2 implica que A ∈ 1 . Isto implica que
τ 2 ⊂ τ
1 – ou que τ
1 tem mais conjuntos abertos que 2. τ
Nota 1.20. Esta definição merece um comentário. Veja o que diz Munkres em seu livro “Topo-
τ τ
logy,” pg. 77, a respeito disso: “If ′ ⊃ , some mathematicians would say that ′ is larger τ
τ τ τ
than , and is smaller that ′ . This is certainly acceptable terminology, if not as vivid as the
words “finer” and “coarser.” Many mathematicians use the words “weaker” and “stronger” in this
τ
context. Unfortunately, some of them – particularly analysts – are apt to say that ′ is stronger
than τ τ τ τ
if ′ ⊃ , while others – particularly topologists – are apt to say that ′ is weaker
than τ in the same situtation! If you across the terms “stronger topology” or “weak topology” in
some book, you will have to decide from the context which inclusion is meant.” Fique atento!
τ τ
TEOREMA 1.6. Sejam B 1 e B 2 bases para as topologias 1 e 2 , respectivamente, sobre E.
τ τ
Então para que 1 seja mais fina que 2 é necessário e suficiente que para cada x ∈ E e para
cada B ∈ B 2 contendo x, exista um elemento de base B ′ ∈ B 1 tal que x ∈ B ′ ⊂ B.
τ
Demonstração. Suficiência. Dado um elemento U ∈ 2 , queremos mostrar que U ∈ 1 . Uma τ
τ
vez que B 2 gera 2 , existe B ∈ B 2 tal que x ∈ B ⊂ U. Assuma a existência de B ′ ∈ B 1
tal que B ′ ⊂ B. Isto imediatemente implica que x ∈ B ′ ⊂ U ∈ 1 . τ
Necessidade. Tome um x ∈ E e um B ∈ B 2 tal que x ∈ B. Como B ∈ 2 , por τ
τ τ τ τ
definição, B ∈ 1 pela hipótese que 2 ⊂ 1 . Uma vez que 1 é gerada por B 1 , B pode
ser escrito como uma união de elementos de B 1 . Isto implica que, para x ∈ E, existe um
elemento B ′ ∈ B 1 tal que x ∈ B ′ ⊂ B.
DEFINIÇÃO 1.24. Dadas duas métricas d1 e d2 no mesmo conjunto E, diz-se que d1 é mais fina
do que d2 , e escreve-se d1 ≻ d2 se, e somente se, toda bola aberta segundo d2 contém uma bola
aberta, de mesmo centro, segundo d1 ; isto é, se
3 4 3 4
Bd2 (x; ε) = y ∈ E | d2 (x, y) < ε ⊃ Bd1 (x; δ) = y ∈ E | d2 (x, y) < δ < ε .
Da Definição 1.24 e do Teorema 1.6 temos o seguinte
τ τ
COROLÁRIO 1.4. Sejam d1 e d2 duas métricas sobre E. Sejam 1 e 2 as topologias induzidas
τ τ
pelas métricas d1 e d2 , respectivamente, sobre E. Então 1 é mais fina do que 2 se, e somente
se, para cada x ∈ E e para cada ε > 0, existe um δ > 0 tal que Bd1 (x; δ) ⊂ Bd2 (x; ε).
29
τ τ
Demonstração. Se 1 é mais fina que 2 , então todo aberto A ⊂ E pertencente a 2 tambémτ
τ τ
pertence a 1 , por definição. Seja B 1 uma base para 1 formada por bolas abertas Bd1 (x; δ),
de centro x ∈ A e raio δ = 1/m, em que m é um inteiro positivo. Seja B 2 uma base para 2 τ
formada por bolas abertas Bd2 (x; ε), de centro em x ∈ A e raio ε = 1/n, em que n também
é um inteiro positivo. Tome m < n; então Bd1 (x; δ) ⊂ Bd2 (x; ε). Logo, x ∈ A implica que
{x} ⊂ Bd1 (x; δ) ⊂ Bd2 (x; ε) ⊂ A. Reciprocamente, sejam Bd1 (x; δ) um elemento da base
τ τ
B 1 ⊂ 1 e Bd2 (x; ε) um elemento da base B 2 ⊂ 2. Se Bd1 (x; δ) ⊂ Bd2 (x; ε), assim
para todo aberto A ⊂ E temos que, se x ∈ A então x ∈ Bd1 (x; δ) ⊂ Bd2 (x; ε) ⊂ A. Logo,
τ τ
A ∈ 2 implica que A ∈ 1 . Isto resulta em 2 ⊂ 1 . τ τ
DEFINIÇÃO 1.25. Sejam d1 e d2 duas métricas no mesmo conjunto E. Diz-se que d1 e d2 são
equivalentes, e escreve-se d1 ∼ d2 , quando d1 ≻ d2 , e ao mesmo tempo d2 ≻ d1 .
Das Definições 1.24 e 6.42 segue o seguinte
COROLÁRIO 1.5. Sejam d1 e d2 duas métricas no mesmo conjunto E. Afim que se tenha d1 ∼ d2
em E, é necessário e suficiente que toda bola aberta segundo uma dessas métricas contenha uma
bola aberta de mesmo centro segundo a outra métrica.
PROPOSIÇÃO 1.10. Para que duas métricas d1 e d2 no mesmo conjunto E sejam equivalentes
deve existir uma constante c > 0 tal que d1 (x, y) # c · d2 (x, y) e d2 (x, y) # c · d1 (x, y)
quaisquer que sejam x, y ∈ E.
Demonstração. Sejam m e n números inteiros positivos tais que Bd1 (x; ε/n) ⊂ Bd2 (x; ε) e
Bd2 (x; ε/m) ⊂ Bd1 (x; ε), para todo x ∈ E e ε > 0. Note que a primeira inclusão mostra
que d2 # n · d1 . De fato, d2 # n · d1 < n · (ε/n). Da mesma forma, a segunda inclusão
mostra que d1 # m · d2 . Tomando-se c = sup {m, n}, segue que d1 (x, y) # c · d2 (x, y) e
d2 (x, y) # c · d1 (x, y).
Nota 1.21. A condição da Proposição 1.10 (a existência da constante c) é suficiente porém não
é necessária para que duas métricas sejam equivalentes. Para tornar isto claro, vamos tomar o
seguinte exemplo do livro do Elon, “Espaços Métricos,” pg. 47: seja d uma métrica no conjunto
E. Defina
d(x, y)
d1 (x, y) = .
1 + d(x, y)
Assuma que d é ilimitada. Então, não pode existir uma constante c > 0 tal que d(x, y) #
c · d1 (x, y), para quaisquer x, y ∈ E. Com efeito,
d(x, y)
d(x, y) # c · d1 (x, y) =⇒ d(x, y) # c · =⇒ 1 + d(x, y) # c ,
1 + d(x, y)
quando x ̸= y. Isto contradiz o fato que d é ilimitada.
PROPOSIÇÃO 1.11. Para que duas métricas d1 e d2 no mesmo conjunto E definam a mesma
topologia, é necessário e suficiente que elas sejam equivalentes.
τ τ
Demonstração. Se 1 e 2 são as topologias definidas por d1 e d2 , respectivamente, então
τ 1 = τ2 se, e somente se, τ1 ⊂ τ 2 e τ2 ⊂ τ
1 . Pelo Corolário 1.4, existem números
reais m e n tais que Bd1 (x; ε/n) ⊂ Bd2 (x; ε) e Bd2 (x; ε/m) ⊂ Bd1 (x; ε), para todo x ∈
E e ε > 0, e pela Proposição 1.10 estas inclusões implicam que d1 (x, y) # c · d2 (x, y) e
d2 (x, y) # c · d1 (x, y). Logo, d1 e d2 são equivalentes. Reciprocamente, assuma que d1 e d2
30
são equivalentes. Então dado que d1 (x, y) # c · d2 (x, y), segue que Bd2 (x; ε/c) define um
τ
elemento da base B 2 ⊂ 2 , enquanto Bd1 (x; ε) define um elemento da base B 1 ⊂ 1 . τ
Como Bd2 (x; ε/c) ⊂ Bd1 (x; ε), logo para todo aberto A ⊂ E segue que x ∈ A implica
τ τ
x ∈ Bd2 (x; ε/m) ⊂ Bd1 (x; ε) ⊂ A. Disso resulta que 2 ⊂ 1 . Analogamente, como ao
τ τ τ
mesmo tempo temos d2 (x, y) # c · d1 (x, y), então 1 ⊂ 2 . Portanto, segue que 1 = 2 τ
como era para ser provado.
1.2.6 Axiomas de Separação

De acordo com a Nota 1.17 as propriedades de espaços topológicos são em geral bem dife-
rentes daquelas de um espaço munido com uma métrica. Abaixo introduzimos duas condições
adicionais que um espaço E pode satisfazer, e que são inteiramente expressas em termos dos
conjuntos abertos de E. Por isso, são propriedades topológicas de E. Essas condições são
chamadas axiomas de separação.
DEFINIÇÃO 1.26. Um espaço topológico E é chamado um espaço-T1 , ou Tychonoff, se, e somente
se, dados quaisquer dois pontos distintos x, y ∈ E, existem vizinhanças Vx de x e Vy de y tais
que y ∈/ Vx e x ∈/ Vy . Um espaço topológico E é chamado um espaço-T2 , ou Hausdorff, se, e
somente se, dado quaisquer dois pontos distintos x, y ∈ E existem vizinhanças Vx de x e Vy de
y tais que Vx ∩ Vy = ∅.
Nota 1.22. As duas condições acima são satisfeitas por espaços munidos com uma métrica. Note
que em um espaço-T1 as vizinhanças de qualquer par de pontos não precisam, necessariamente,
ser disjuntas. Com isso, segue imediatamente que T2 ⇒ T1 .
A seguinte proposição caracteriza os espaços-T1 .
PROPOSIÇÃO 1.12. Se E é um espaço-T1 , então para cada x ∈ E, o conjunto singleto {x} é
fechado.
Demonstração. Seja y ∈ E − {x}, logo y ̸= x. Visto que E é um espaço-T1 , cada y ∈ E − {x}
está contido em uma vizinhança+Vy ⊂ E − {x} que contém y mas não x. Consequentemente,
pelo Teorema 1.5, E − {x} = y∈E−{x} Vy é uma vizinhança de cada um de seus pontos;
portanto é um aberto. Assim, {x} é fechado.
PROPOSIÇÃO 1.13. Todo conjunto sobre o qual esteja definida uma métrica é Hausdorff.
Demonstração. Sabemos que bolas abertas compõem uma base de vizinhanças para todo ele-
mento de um conjunto E sobre o qual existe definida uma métrica. Sendo assim, tome dois
elementos x, y ∈ E. Sejam ε > 0 e δ > 0 tais que ε + δ < d(x, y). Queremos mostrar
que as bolas B(x; ε) e B(y; δ) são disjuntas. Com efeito, assuma, por absurdo, que existe um
elemento z ∈ E tal que z ∈ B(x; ε) ∩ B(y; δ). Isto, por sua vez, implica que d(x, z) < ε e
d(y, z) < δ. Logo, d(x, y) # d(x, z) + d(z, y) < ε + δ, o que contradiz a hipótese inicial que
ε + δ < d(x, y). Assim, B(x; ε) e B(y; δ) são disjuntas.
Existem outros dois axiomas de separação, similares ao axioma de Hausdorff, porém mais
fortes.
DEFINIÇÃO 1.27. Suponha que conjuntos singletos {x} sejam fechados em um espaço topológico
E. Então, diz-se que E é um espaço-T3 , ou regular, se para cada par consistindo de um
ponto x e um conjunto fechado B, disjunto de x, existem conjuntos abertos disjuntos contendo
x e B, respectivamente. O espaço E é chamado um espaço-T4 , ou normal, se para cada par
A, B de conjuntos fechados disjuntos de E, existem conjuntos abertos disjuntos contendo A e B,
respectivamente.
31
Figura 1.1: Espaços Hausdorff, regular e normal, respectivamente. Figura retirada, e adptada, do
livro-texto de J.R. Munkres, “Topology,” Second Edition, Prentice Hall, 2000. Todos os Direitos
Reservados.
Nota 1.23. Note que, devido ao fato de termos incluído a condição que conjuntos singletos {x}
sejam fechados como parte da definição dos espaços T3 e T4 , segue que T4 ⇒ T3 ⇒ T2 ⇒ T1 .
A letra “T ” usada para rotular os espaços T1 (Tychonoff), T2 (Hausdorff), T3 (regular) e T4
(normal) vem do alemão “Trennungsaxiom,” que significa “axioma de separação.”
1.2.7 Limite de uma Sequência
! sequência num" conjunto E é uma aplicação f : N → E, definida no conjunto

Uma
N = 1, 2, 3, . . . , n, . . . , isto é, consideramos uma coleção de pares ordenados
! "
(n, xn ) | n ∈ N, xn ∈ E .
O domínio de f , o conjunto dos números naturais, é ordenado pela noção de sucessor imedi-
ato, sujeito às seguintes condições: (i) cada elemento n ∈ N tem um único sucessor imediato
n+ ∈ N, (ii) se n+ = m+ , então n = m e (iii) 1 ∈ N e não existe n ∈ N tal que
n+ = 1. Note que o ordenamento pela noção de sucessor imediato do conjunto N induz um
ordenamento do conjunto imagem em E. A imagem ordenada está associada à sequência de
elementos (xn )n∈N , e o valor que a sequência assume no número n ∈ N, representado por xn ,
é chamado o n-ésimo termo da sequência.
DEFINIÇÃO 1.28. Uma sequência de elementos (xn )n∈N num espaço topológico E converge para
x ∈ E se para cada vizinhança V de x, existe um número n0 ∈ N tal que xn ∈ V , para todo
n > n0 . O ponto x ∈ E é chamado de limite da sequência (xn )n∈N e representamos isso por
limn→∞ xn = x, ou por xn → x, quando n → ∞.
Nota 1.24. Decorre da definição acima que, ao afirmar que limn→∞ xn = x num espaço
topológico E, isto equivale a dizer que toda vizinhança V de x contém todos os elementos da
sequência (xn )n∈N , com exceção de um número finito deles, que são no máximo os elementos
x1 , x2 , . . . , xn0 . Se o espaço E é munido com uma métrica, a vizinhança V pode ser substituída
por uma bola aberta B(x; ε), de centro x e raio ε > 0, arbitrário. Nesse caso, informalmente,
podemos dizer que a sequência (xn )n∈N converge para x se, e somente se, existe um número
n0 ∈ N tal que para todo n > n0 todos os elementos xn da sequência eventualmente entram
e ficam dentro de qualquer bola aberta centrada em x (veja a figura abaixo).
32
x1 x2
xn0
ε
x
Isto significa que xn se aproxima de x a medida que n aumenta, e a distância d(x, xn )

diminui ilimitadamente; ou seja, d(x, xn ) → 0, quando n → ∞. Observe que este fato indica
que a convergência de uma sequência num espaço métrico reduz-se à convergência de números
reais, pois xn → x se, e somente se, a sequência de números reais d(x, xn ) converge para 0.
Por outro lado, se para algum número finito M ∈ R existe um n0 ∈ N tal que xn > M sempre
que n > n0 , então nós escrevemos xn → ∞ quando n → ∞, ou simplesmente xn → ∞, e o
limite da sequência é dito ser ∞; da mesma forma, M ∈ R existe um n0 ∈ N tal que xn < M
sempre que n > n0 , então nós escrevemos xn → −∞ quando n → ∞, ou simplesmente
xn → −∞, e o limite da sequência é dito ser −∞. Estes importantes fatos nos levam ao
seguinte
TEOREMA 1.7. Seja E um espaço munido com uma métrica. Então, se uma sequência (xn )n∈N ⊂
E é convergente, ela é limitada.
Demonstração. Seja E um espaço munido com uma métrica e x ∈ E o limite da sequência

(xn )n∈N . Sabemos que, com exceção de um número finito de elementos, que são no máximo
os elementos x1 , x2 , . . . , xn0 , todos os outros elementos da sequência (xn )n∈N , para n > n0 ,
se encontram dentro de uma bola aberta B(x; ε), de centro x e raio ε > 0, arbitrário. Tome
ε = 1; portanto
! o conjunto"dos valores da sequência está contido na união X ∪ B(x; 1), em
que X = x1 , x2 , . . . , xn0 . Sendo o conjunto X finito, ele é limitado. Com efeito, fixe um
xi = a ∈ X; logo existe um c > 0 tal que d(a, xn ) # c, para n = 1, . . . , i−1, i+1, . . . , n0 . Por
outro lado, para todo xn tal que n > n0 temos que d(x, xn ) < 1. Escolha k = c + 1 + d(a, b),
em que b é um elemento fixado arbitrariamente em B(x; 1). Então, d(x, xn ) # d(x, b) +
d(b, a) + d(a, xn ) < c + 1 + d(a, b) = k. É evidente que d(x, xn ) < k quando xn ∈ X,
ou quando xn ∈ B(x; 1). Logo, d(x, xn ) < k vale para todo xn ∈ X ∪ B(x; 1). Portanto,
X ∪ B(x; 1) é limitado, pois X ∪ B(x; 1) ⊂ B[x; k].
!
DEFINIÇÃO 1.29. " Dada uma aplicação f : N → E e um subconjunto infinito N1 = n1 <
n2 < n3 < ·5· · de N, formado por uma sequência estritamente crescente de inteiros positivos,
a restrição f 5N1 : N1 → E da função f é chamada subsequência da sequência (xn )n∈N . Em
outras palavras, uma subsequência é uma sequência que pode ser derivada de outra sequência,
excluindo alguns elementos sem alterar a ordem dos elementos restantes. Esta subsequência é
representada por (xnk )k∈N ou por (xn )n∈N1 .
TEOREMA 1.8. Sejam E um espaço munido com uma métrica e (xn )n∈N uma sequência con-
vergente em E, com x sendo seu limite. Então, toda subsequência de (xn )n∈N converge para x.
Demonstração. Seja (xnk )k∈N uma subsequência. Então, para qualquer bola aberta B(x; ε), de
centro x e raio ε, existe, por definição, um n0 ∈ N tal que todos os termos da sequência (xn )n∈N
com n > n0 pertencem à bola B(x; ε). Ora, neste caso, todos os termos da subsequência
(xnk )k∈N , como nk > n0 também pertencem a B(x; ε). Logo limk→∞ xnk = x.
33
Nota 1.25. A recíproca do Teorema 1.8 não é verdadeira. Podemos ter subsequências conver-
gentes sem que a sequência,
! da qual as"subsequências foram geradas, convirja. Tome como
exemplo a sequência 2, 0, 2, 0, 2, 0, . . . , cujo n-ésimo termo é xn = 1 + (−1)n+1 . Esta
sequência não é convergente, pois tem os pontos 0 e 2 como pontos aderentes. No entanto,
as subsequências constantes (x2n−1 )n∈N e (x2n )n∈N , cujos os n-ésimos termos são x2n−1 =
1 + (−1)2n e x2n = 1 + (−1)2n+1 , respectivamente, são convergentes, com limn→∞ x2n−1 = 2
e limn→∞ x2n = 0. Notamos, desse exemplo, que toda subsequência pode ser vista como uma
sequência. Para tanto, basta definir yk = xnk .
O próximo conceito está intimamente relacionado com o fato do conjunto dos reais ser
totalmente ordenado.
DEFINIÇÃO 1.30 (Sequências monótonas). Diz-se que a sequência (xn )n∈N de números reais
é monótona não-decrescente se xn # xn+1 para todo n ∈ N. Analogamente, diz-se que a
sequência (xn )n∈N é monótona não-crescente se xn " xn+1 para todo n ∈ N.
A nomenclatura não-decrescente (ou não-crescente) é usada para enfatizar que alguns termos
da sequência podem ser iguais. Os nomes crescente e decrescente são reservados para os casos
em que todos os termos são diferentes: x1 < x2 < · · · e x1 > x2 > · · · , respectivamente.
TEOREMA 1.9. Seja (xn )n∈N uma sequência de números reais monótona não-decrescente,
tal que o conjunto {xn } tem uma cota superior. Então, (xn )n∈N é convergente e seu limite é
o supremo do conjunto {xn }. Analogamente, seja (xn )n∈N uma sequência de números reais
monótona não-crescente, tal que o conjunto {xn } tem uma cota inferior. Então, (xn )n∈N é
convergente e seu limite é o ínfimo do conjunto {xn }.
Demonstração. Seja a o supremo do conjunto {xn }. Dado um ε > 0 arbitrário, pela definição
de supremo, existe um elemento do conjunto {xn }, digamos xn0 , tal que a − ε < xn0 # a.
Como a sequência é monótona não-decrescente, segue-se que xn > a − ε para todo n > n0 .
Logo, |xn − a| < ε para todo n > n0 , o que prova que a sequência (xn )n∈N converge
para a = sup {xn }. Evidentemente, raciocínio análogo vale para uma sequência monótona
não-crescente.
Exemplo 1.20. (i) A sequência 1, 2, 3, 4, . . . é monótona crescente, (ii) também é monótona

crescente a sequência 1, 1, 2, 2, 3, 3, . . ., (iii) a sequência 1, 21 , 31 , 41 , . . . é monótona decres-
cente, (iv) a sequência 1, 1, 1, 1, . . . é monótona crescente e monótona decrescente, (v) já a
sequência 1, 0, 1, 0, . . . não é monótona crescente nem monótona decrescente.
Um dos critérios mais importante e útil para determinar se uma sequência é convergente ou
não, segue da seguinte
DEFINIÇÃO 1.31 (Critério de Cauchy). Uma sequência (xn )n∈N converge se para todo ε > 0,
existe n0 ∈ N tal que para todo m, n > n0 temos que d(xm , xn ) < ε.
Para que uma sequência (xn )n∈N respeite o critério de Cauchy, é preciso que seus termos
xm e xn , para valores suficientemente grandes dos índices m e n se aproximem arbitrariamente
uns dos outros. Ou seja, se impõe uma condição sobre os termos da própria sequência. Uma
sequência de Cauchy também é chamada sequência fundamental.
PROPOSIÇÃO 1.14. Toda sequência convergente é de Cauchy.
34
Demonstração. Se limn→∞ xn = x, então dado um ε > 0, existe n0 tal que para todo n > n0
temos que d(x, xn ) < ε/2. Isto implica que se tomarmos m, n > n0 , teremos que d(xm , xn ) #
d(xm , x) + d(x, xn ) < ε/2 + ε/2 = ε. Assim, limn→∞ xn = x é de Cauchy.
COROLÁRIO 1.6. Toda sequência de Cauchy é limitada.
PROPOSIÇÃO 1.15. Em um espaço Hausdorff, E, limites de sequências são únicos.
Demonstração. Dado que E é Hausdorff, existem vizinhanças Vx de x e Vy de y tais que
Vx ∩ Vy = ∅. Suponha, por absurdo, que limn→∞ xn = x e limn→∞ xn = y, com x ̸= y.
Então, existem n′0 , n′′0 ∈ N, tais que xn ∈ Vx para todo n > n′0 e xn ∈ Vy para todo n > n′′0 .
Seja n0 um inteiro maior que n′0 e n′′0 . Então, xn ∈ Vx ∩ Vy , para todo n > n0 , contradizendo
a hipótese que E é Hausdorff.7
Nota 1.26. Note que a proposição acima não estabelece que em um espaço Hausdorff toda
sequência tem um limite. Ela somente estabelece que o limite, se ele existe, é único.
Nota 1.27. O fato de que em um espaço Hausdorff os limites de sequências são únicos, não
garante que o inverso seja verdade. Ou seja, o conceito de limite de uma sequência não é
forte o bastante para caracterizar espaços Hausdorff. Esta “inadequabilidade” de sequências
ocorre porque a convergência de sequências em um espaço não é suficiente para determinar
univocamente propriedades topológicas de um espaço. Para assegurar que propriedades topoló-
gicas importantes, como ser Hausdorff, possam ser caracterizadas em termos de convergência,
uma generalização apropriada de sequências deve ser usada. Essa generalização é conhecida
como Rede, com o conjunto de índices N sendo substituído por conjuntos direcionados arbitrá-
rios. Outro conceito que permite caracterizar propriedades topológicas através de convergência
é conhecido como Filtros. Tanto o conceito de Rede como o conceito de Filtros não serão
abordados aqui.
Exemplo 1.21 (Caso particular). Espaços munidos de uma métrica são casos particulares para
os quais o inverso da Proposição 1.15 acontece. Com efeito, se limn→∞ xn = x, então xn ∈
B(x; r) para todo n > n0 . Para x ̸= y, tome r = d(x, y)/3, isto implica que d(y, xn ) > r
para todo n > n0 . Logo, xn ∈/ B(x; r) ∩ B(y; r). Assim, B(x; r) ∩ B(y; r) = ∅, de onde se
conclui que E é Hausdorff.
Nota 1.28. O fato de que em espaços munidos de uma métrica o inverso da Proposição 1.15
acontece, se deve, em particular, ao fato de bolas abertas formarem um sistema fundamental
de vizinhanças que satisfazem a um axioma chamado Primeiro Axioma da Enumerabilidade
(PAE). Vamos mostrar, mais adiante, que se um espaço topológico E satisfaz o PAE em que toda
sequência convergente possui um único limite, então E é Hausdorff.
1.2.8 Pontos de Aderência, de Acumulação e Fecho de um Conjunto

Vamos examinar alguns conceitos importantes de um conjunto sobre o qual esteja definida
uma métrica. Começamos com a seguinte
DEFINIÇÃO 1.32. Seja M um conjunto sobre o qual esteja definida uma métrica. Diz-se que um
elemento x ∈ M é um ponto aderente de E ⊂ M se cada bola aberta contendo x contém pelo
menos um ponto de E, isto é, x ∈ M é um ponto aderente de E ⊂ M se para todo ε > 0,
tem-se B(x; ε) ∩ E ̸= ∅. Equivalentemente, um elemento x ∈ M é um ponto aderente de
E ⊂ M quando este for o limite de uma sequência de elementos de E.
7
Podemos dizer em decorrência disso que, informalmente, ou a sequência entra na vizinhança de Vx de x e
ali fica, ou ela entra na vizinhança de Vy de y.
35
Note que, pela definição acima, dizer que um elemento x ∈ M é um ponto aderente de
E ⊂ M, significa dizer que existem pontos de E arbitrariamente próximos de x, ou seja, para
cada ε > 0, podemos encontrar sempre um elemento y ∈ E tal que d(x, y) < ε.
Exemplo 1.22. Se E é um subconjunto de um conjunto M sobre o qual esteja definida uma
métrica, então todo elemento pertencente a E é aderente a E, basta tomarmos x = limn→∞ xn ,
com xn = x para todo n ∈ N.
Exemplo 1.23. Se E for um subconjunto de R que é limitado por cima, então, o sup E é
aderente a E.
Exemplo 1.24. Um subconjunto E de um espaço métrico M contém todos os seus pontos
aderentes se, e somente se, E é fechado em M. Intuitivamente, isto significa que, sendo E um
conjunto aberto que delimita o interior de uma área (não incluindo os pontos de fronteira), os
pontos aderentes de E são os próprios pontos de E mais os pontos de fronteira.
PROPOSIÇÃO 1.16. Seja M um conjunto sobre o qual esteja definida uma métrica. Então, um
elemento x ∈ M é um ponto aderente de E ⊂ M se, e somente se, toda bola aberta de centro x
contém algum elemento de E.
Demonstração. Tome x ∈ M. Se toda bola aberta de centro x contém algum elemento de E,

então x é aderente a E, por definição. Reciprocamente, x é aderente a E, então para cada
bola aberta B(x; 1/n) podemos escolher um ponto xn ∈ E de forma a obter uma sequência
tal que limn→∞ xn = x.
DEFINIÇÃO 1.33. Seja M um conjunto sobre o qual esteja definida uma métrica. O fecho de
um subconjunto E ⊂ M, denotado por E, é o conjunto de todos os pontos de aderência de E
em M. Equivalentemente, o fecho E de E é o menor conjunto fechado que contém E, ou seja, é
a interseção de todos os conjuntos fechados que contêm E.
Exemplo 1.25. Seja M um conjunto sobre o qual esteja definida uma métrica. Então, ∅ = ∅,
M = M, E ⊂ E para todo E ⊂ M e se E ⊂ F =⇒ E ⊂ F .
DEFINIÇÃO 1.34. Seja M um conjunto sobre o qual esteja definida uma métrica. Diz-se que
um elemento x ∈ M é um ponto de acumulação, ou ponto limite, de E ⊂ M se existe uma
sequência (xn )n∈N de elementos de E \ {x}, dois a dois distintos, tal que limn→∞ xn = x.
Equivalentemente, diz-se que um elemento x ∈ M é um ponto de acumulação de E ⊂ M
quando toda
. bola de /centro x contém algum ponto de E diferente do ponto x, isto é, se tivermos
B(x; ε) ∩ E − {x} ̸= ∅.
Deve-se ressaltar que o ponto x pode situar-se em E, ou não; pela definição acima isto não
importa! O conjunto de todos os pontos de acumulação de E é, muitas vezes, representado por
E ′ , sendo denominado o derivado do conjunto E. Ainda, de acordo com a Definição 1.34, a
união E ∪ E ′ não é necessariamente disjunta. De fato, se x ∈ E ∪ E ′ , ou x ∈ E ou x ∈ / E;
então toda bola de centro x deve conter um ponto y ∈ E que, necessariamente, é diferente de
x; portanto, x ∈ E ′ .
TEOREMA 1.10. Seja M um conjunto sobre o qual esteja definida uma métrica e E ⊂ M. Se x
é um ponto de acumulação de E, então toda bola aberta de raio arbitrário ε e centrada em x
contém uma infinidade de pontos de E.
36
Demonstração. Provaremos. o /teorema por contradição.8 Assuma que exista uma bola aberta
tal que B(x; ε) ∩ E − {x} ̸= ∅ e que esta bola contenha um número finito de pontos
x1 , x2 , . . . , xn de E. Seja r = mini=1,2,...,n {d(x, xi )}. Como ε é arbitrário, podemos tomar
ε = r/2; no entanto,
. a bola
/ aberta B(x; r/2) não conterá pontos de E distintos de x, ou seja,
B(x; r/2) ∩ E − {x} = ∅. Isto, com certeza, é uma contradição, de forma que o teorema
está provado.
De acordo com o teorema acima, um conjunto E com um número finito de elementos
não pode ter qualquer ponto de acumulação. Entretanto, podem existir conjuntos infinitos que
também não têm pontos de acumulação. O exemplo mais simples desse fato é representado
pelo conjunto dos inteiros, Z. Com efeito, se x é um inteiro, a bola aberta B(x; 1) não contém
outros inteiros além do próprio x.
Existe uma outra forma de descrever o fecho de um conjunto, uma forma que envolve o
conceito de pontos de acumulação, como mostra a seguinte
DEFINIÇÃO 1.35. Seja M um conjunto sobre o qual esteja definida uma métrica. O fecho de um
subconjunto E ⊂ M, denotado por E, é o conjunto de todos os pontos de E mais os pontos de
acumulação de E em M.
PROPOSIÇÃO 1.17. Seja E ′ o conjunto de todos os pontos de acumulação de E. Então E =

E ∪ E ′.
Demonstração. Para todo x ∈ E ∪ E ′ , segue que x ∈ E ou x ∈ E ′ . Por outro lado, sendo E

o conjunto de todos os pontos de acumulação de E, então E ⊂ E e E ′ ⊂ E. Isto implica
que x ∈ E. Assim, E ∪ E ′ ⊂ E. Agora, para todo x ∈ E, segue que x ∈ E ou x ∈ E ′ . Se
x∈ / E, então, pelo Teorema 1.10, toda bola aberta de raio arbitrário ε e centrada em x contém
uma infinidade de pontos de E diferente de x, ou seja, x ∈ E ′ , de maneira que x ∈ E ∪ E ′ .
Isto implica que E ⊂ E ∪ E ′ . Portanto, E = E ∪ E ′ .
Nota 1.29. As Definições 1.33 e 1.35 podem dar margem para a interpretação que “pontos de
aderência = pontos de acumulação.” Apesar desses conceitos serem muito próximos, existe
uma sutil diferença entre eles. Primeiro já deve ficar claro que, dado um conjunto M sobre o
qual esteja definida uma métrica, a definição de ponto aderente difere daquela de um ponto
de acumulação, uma vez que para um ponto x ser um ponto de acumulação é necessário
que cada bola aberta contendo x contenha pelo menos um ponto de E diferente de x, ou
seja, que xn ̸= x para todo n ∈ N. Sem essa condição, qualquer ponto seria um ponto de
acumulação. Para ver isso, bastaria tomar uma sequência constante igual a x que, naturalmente,
converge sempre para x. Noutros termos, o conjunto de pontos que são limites em E de
sequências não-constantes em E são os pontos de acumulação de E. Assim, E, o fecho
de E em M é E ∪ {limites de todas as sequências não-constantes em E}. Segundo, pode
ocorrer de um elemento x ser aderente a um conjunto E sem pertencer a esse conjunto.
Neste caso, x é um ponto de acumulação. Por exemplo, tome E = B(0; 1) ⊂ Rn , isto é,
E é a bola aberta de centro na origem e raio 1 em Rn . O ponto e1 = (1, 0, . . . , 0) ∈ / E;
no entanto, tomando xn = (1 − 1/n, 0, . . . , 0), vemos que xn ∈ E para todo n ∈ N e
limn→∞ xn = e1 . Logo e1 é aderente a E. Este exemplo nos mostra que cada ponto de
acumulação é um ponto aderente. Por outro lado, a recíproca não é verdadeira. Um ponto
aderente que não é um ponto de acumulação é um ponto isolado. Por exemplo, considere o
8
Uma prova direta pode ser encontrada no livro-texto do Elon L. Lima, “Espaços Métricos,” Projeto Euclides,
IMPA, Terceira Edição, 1993, pg.79.
37
! "
subconjunto E = x | x ∈ (0, 1) ou x = 2 = (0, 1) ∪ {2} ⊂ R. O conjunto de todos
os pontos de acumulação de E é composto pelo intervalo fechado [0, 1]; ou seja, 0 e 1 são
pontos de acumulação de E, uma vez que toda vizinhança de 0 e 1, isto é, os intervalos abertos
(0 − ε, 0 + ε) e (1 − ε, 1 + ε), em que ε é arbitrário, contêm sempre pontos de E. Já o conjunto
de todos os pontos aderentes é [0, 1] ∪ {2}. Nesse caso, 2 é um ponto isolado em E, uma
vez que (2 − 1/2, 2 + 1/2) ∩ E contém unicamente o elemento {2}. Portanto, 2 é um ponto
aderente, mas não é um ponto de acumulação. Claramente, E não é fechado, uma vez que os
pontos de acumulação 0 e 1 não pertencem à E. Contudo os intervalos abertos (0 − ε, 0 + ε)
e (1 − ε, 1 + ε) contêm !uma infinidade de pontos" de E (veja o Teorema 1.10 abaixo). O fecho
de E é o conjunto E = x | x ∈ [0, 1] ou x = 2 = [0, 1] ∪ {2}. Portanto, de acordo com o
exemplo acima, a aderência de um conjunto E ⊂ M é o conjunto E formado pelos pontos de
E e por seus pontos de acumulação!
Já foi definido anteriormente que se E é um subconjunto de M, então E é fechado em M
se M − E é aberto em M. Queremos, agora, provar a seguinte
PROPOSIÇÃO 1.18. Seja E um subconjunto de um espaço topológico M. Então, E é fechado em

M.
Demonstração. Para provar que E = E ∪ E ′ que é fechado basta mostrar que M − (E ∪ E ′ )

é aberto em M, ou que M − (E ∪ E ′ ) é uma vizinhança de cada um de seus pontos. Seja
y ∈ M − (E ∪ E ′ ). Visto que y não é um ponto de acumulação de E, existe um conjunto
aberto V contendo y tal que V não contém qualquer ponto de E. Como y ∈ / E, segue que
E ∩V = ∅. Temos que mostrar que E ∩V também é vazia. Para isso, assuma que z ∈ E ′ ∩V ;
′
mas, então, V é um conjunto aberto contendo z que é um ponto de acumulação de E. Assim,

pela definição de um ponto de acumulação, E ∩ V ̸= ∅, que é uma contradição. Portanto,
E ′ ∩ V = ∅ e V ⊂ M − (E ∪ E ′ ). Isto prova que E ∪ E ′ é fechado.
COROLÁRIO 1.7. Um subconjunto E de um espaço topológico M é fechado se, e somente se, E

contém todos os seus pontos de acumulação.
PROPOSIÇÃO 1.19. Seja E um subconjunto de um espaço topológico M. Então, E é o menor

subconjunto fechado de M contendo E.
Demonstração. O exterior de E é int(M − E), que é o maior conjunto aberto contido em

M − E. Pela Proposição 1.18 sendo E fechado, E é o complemento de int(M − E) e contém
E. Se F é um subconjunto fechado de M contendo E, então M − F é aberto e está contido
em M − E (veja Exercício 1.27). Logo, M − F ⊂ int(M − E) = M − E, assim F ⊃ E.
Podemos ainda caracterizar o fecho de um conjunto através do seguinte
TEOREMA 1.11. Para um subconjunto E de um espaço topológico M, seu fecho é o conjunto

! "
E = x ∈ M | toda vizinhança de x tem uma interseção não-vazia com E .
!
Demonstração. Seja Nx a coleção (ou família) de vizinhanças de x. Seja B = x ∈ M | U ∈
"
Nx ⇒ U ∩E ̸= ∅ . Temos que mostrar que E = B, o que significa mostrar que E ∪E ′ = B.
Tome x ∈ E ∪ E ′ . Se x ∈ E então, certamente, toda vizinhança de x intercepta E, no mínimo
no ponto x, e assim x ∈ B. Se x ∈ E ′ então também toda vizinhança de x contém um ponto
38
de E, pela definição de um ponto de acumulação. Logo x ∈ B. Portanto, todo elemento de

E ∪ E ′ é elemento de B, ou seja E ∪ E ′ ⊂ B. Reciprocamente, seja y ∈ B. Se y ∈
/ E ∪ E′,
então x ∈/ E e assim M − E é uma vizinhança de x que não intercepta E, contradizendo o
hipótese que x ∈ B. Logo, B ⊂ E ∪ E ′ , o que implica que B = E.
Nota 1.30. O Teorema 1.11 nos fornece uma forma para “testar” se um ponto particular pertence
ao fecho de um conjunto. Em certo sentido, ele diz que o fecho E de E consiste de todos
pontos que estão próximos a E. Por exemplo, seja M um espaço equipado com uma métrica e
E um subconjunto não-vazio !de M. Lembre-se"que para x ∈ M a distância de x a E é dada
pela expressão d(x, E) = inf d(x, y) | y ∈ E . Logo, d(x, E) é a menor distância do ponto
! "
x ao conjunto E. Assim, E é precisamente o conjunto x ∈ M | d(x, E) = 0 .
DEFINIÇÃO 1.36. Seja E um subconjunto de um espaço topológico M. Então sua fronteira é o

conjunto E ∩ M − E.
Segue imediatamente da definição acima o seguinte
COROLÁRIO 1.8. A fronteira de um conjunto é sempre um conjunto fechado.
1.2.9 Espaços Completos

Ao se considerar uma sequência infinita (de pontos, números ou funções) contida em um
espaço, é desejável que o limite da sequência esteja contido no mesmo espaço. Em outras
palavras, é desejado que o espaço seja completo. Isso acontece porque a “integridade” de um
dado espaço garante a existência do limite no espaço. Somos, assim, capazes de estabelecer
uma teoria auto-consistente baseada em uma sequência infinita contida no espaço.
Um conceito importante ligado à completude de um espaço que usaremos frequentemente,
principalmente quando formos definir o domínio de um operador linear ilimitado, é o conceito
de conjunto denso. Para compreendermos esse conceito, começamos lembrando que toda
sequência convergente é de Cauchy. Entretanto, a recíproca não é necessariamente verdadeira.
Por exemplo, considere o conjunto dos números racionais Q, com a métrica usual d(x, y) =
|x − y|, e seja x∗ ∈ R − Q qualquer número irracional. É possível encontrar uma sequência
(xn )n∈N ∈ Q, tal que limn→∞ xn = x∗ ; ou seja, d(x∗ , xn ) → 0, quando n → ∞. Então,
(xn )n∈N é uma sequência de Cauchy de elementos em Q que não converge para um elemento
em Q. Neste caso, dizemos que Q é não-completo.
DEFINIÇÃO 1.37. Diz-se que um conjunto E é completo se, e somente se, toda sequência de
Cauchy em E tem como limite um elemento x ∈ E.
Exemplo 1.26 (Completude do conjunto R). Já vimos que o conjunto Q dos números ra-
cionais não é completo, visto que existem sequências de números racionais que conver-
gem
! para números irracionais. " Por exemplo, o √ limite da sequência dos números racionais
1; 1, 4; 1, 41; 1, 412;
! . . . é o número irracional
" 2, enquanto que o limite da sequência dos
números racionais 3; 3, 1; 3, 14; 3, 141; . . . é o número irracional π. Já o limite da sequência
dos números racionais (xn )n∈N , em que xn = (1 + 1/n)n , é o número neperiano e, um número
irracional aproximadamente igual a 2, 71828.
Por outro lado, o conjunto dos reais R, sendo a união dos conjuntos dos números racionais
e irracionais, é completo: o limite de toda sequência de Cauchy de números reais é um número
real. Assim, o conjunto R é um resultado do completamento de Q.
39
O exemplo acima sugere o que precisamos fazer para tornar completo um espaço incompleto
E: devemos ampliar o espaço E adicionando-lhe todos os possíveis limites de sequências de
Cauchy de forma a obter um conjunto completo. Neste caso, o espaço original E deve ser
denso no espaço maior obtido pela ampliação de E. Isto nos leva à noção de completude de
um espaço!
DEFINIÇÃO 1.38 (Conjunto denso em espaços métricos). Seja M um conjunto sobre o qual
esteja definida uma métrica. Considere dois subconjuntos E, F de M tais que E ⊂ F . Diz-se
que o conjunto E é denso em F se, para todo y ∈ F e todo ε > 0 arbitrário, existe um elemento
x ∈ E tal que d(x, y) < ε.
Nota 1.31. De acordo com a definição acima todo elemento de F pode ser aproximado (no
sentido da métrica) arbitrariamente por elementos do conjunto E. Em outras palavras, para
todo elemento y ∈ F existe uma sequência (xn )n∈N ∈ E tal que limn→∞ xn = x. Note ainda
que, o fecho de E contém F : E ⊃ F . Em particular, se E = F , diz-se que E é denso em
toda parte em F (ou everywhere dense em F ). Trivialmente, um conjunto é sempre denso
em si próprio. Um subconjunto E de M que é tanto fechado e denso em si próprio é chamado
conjunto perfeito. Se o exterior de E é denso em M, então E é dito ser denso em nenhum
lugar em M (ou nowhere dense em M).
Exemplo 1.27. O conjunto dos racionais Q é denso em toda parte em R, visto que Q = R.
Informalmente, podemos dizer que todo ponto em R está em Q, ou arbitrariamente “próximo”
de um elemento de Q. Assim, em certo sentido, o conjunto Q está “bem próximo” do conjunto
R, embora R contenha um número infinito de elementos que não estão em Q. Por outro lado,
Z é nowhere dense em R.
Combinando as observações feitas na Nota 1.30 com o conceito de conjunto denso, temos
uma interpretação geométrica concreta para o caso de espaços métricos. Com efeito, se E é
denso em M, em que M é um espaço equipado com uma métrica, toda sequência (xn )n∈N ∈ E
tem um limite x ∈ E = M. Isto significa que, para todo ε > 0 escolhido arbitrariamente,
d(xn , x) < ε, para n suficientemente grande, quando xn ∈ E. Reciprocamente, se d(x, x0 ) <
ε, tal que x0 ∈ E, então escolhendo-se valores de ε cada vez menores, obtemos uma sequência
de elementos de E convergindo para um ponto em M. Isto prova o seguinte
TEOREMA 1.12. Seja M é um espaço equipado com uma métrica e E ⊂ M. Então, E é denso
em toda parte em M se, e somente se, para todo ε > 0, escolhido arbitrariamente, e todo x ∈ M
existe um elemento x0 ∈ E tal que d(x, x0 ) < ε.
Exemplo 1.28 (Incompletude do espaço C[0, 1]). Considere uma sequência infinita (fn )n∈N
de funções contínuas definidas por
⎧
⎪
⎪ 0, se 0 # x # 21 − n+2
1
⎪
⎨ . /
fn (x) = (n + 2) x − 21 + n+2
1
, se 21 − n+21
# x < 21 .
⎪
⎪
⎪
⎩
1, se 21 # x # 1
A sequência (fn )n∈N é uma sequência de Cauchy contida no espaço C[0, 1]. Os elementos
vizinhos fn e fn+1 ficam infinitamente próximos um do outro à medida que n aumenta. A
figura abaixo mostra o comportamento de aproximação dos elementos da sequência (fn )n∈N ,
onde estão representados os elementos f1 , f2 e f18 , respectivamente.
40
fn (x)
···
1 1 9 1
x
6 4 20 2 1
Note que para um n arbitrário, os elementos fn são contínuos durante todo o intervalo [0, 1].
O limite desta sequência de Cauchy é escrito como
⎧
⎨0 , se 0 # x < 21
f (x) = lim fn (x) = .
n→∞ ⎩1 , se 1 # x # 1
2
Este limite é uma função descontínua, mostrando um salto discreto em x = 1/2. Devido à
descontinuidade, este limite não pertence ao espaço de funções contínuas C[0, 1]. Portanto,
C[0, 1] é um espaço incompleto.9 Embora a sequência infinita (fn )n∈N esteja completamente
contida em C[0, 1], seu limite está fora de C[0, 1].
O exemplo acima nos leva à seguinte questão: que tipo de espaço de função obtemos
a partir do completamento de C[0, 1]? A resposta é um espaço de Lebesgue, comumente
representado por L1 [0, 1]. Em outras palavras, ao realizarmos o completamento do espaço
C[0, 1], adicionando ao espaço C[0, 1] as funções limites que são excluídas de C[0, 1], geramos
um novo espaço mais amplo de funções, chamado L1 [0, 1]. O espaço L1 [0, 1] é um espaço de
funções no qual a distância entre seus elementos é quantificada pela métrica d2 do Exemplo 1.3.
Deve-se ressaltar que, no completamento de C[0, 1], a distância d2 do Exemplo 1.3 é escolhida
em vez de d1 porque esta distância é aplicável a funções descontínuas.
TEOREMA 1.13 (Completamento de um espaço métrico). Seja M um espaço métrico in-
completo. Então, M pode ser estendido para um espaço métrico completo M adicionando-se
elementos apropriados, de modo que M seja um subconjunto denso de M .
Demonstração. O procedimento utilizado é análogo ao procedimento de Cantor ao estender o
sistema dos números racionais ao sistema dos números reais. Seguiremos a prova de G. Hellwig,
apresentada no livro “Differential Operators of Mathematical Physics,” Addison-Wesley, 1967. A
prova será dividida em quatro etapas.
Etapa 1. Seja x1 , x2 , . . . uma sequência de Cauchy em M. Denote por M a totalidade de
todas as sequências de Cauchy, isto é, defina x = (xn )n∈N , y = (yn )n∈N , . . . com xn , yn ∈ M.
Dois elementos x e y em M são assumidos iguais se, e somente se,
lim dM (xn , yn ) = 0 ,
n→∞
em que dM (xn , yn ) é a métrica em M. Defina a métrica em M como

dM (x, y) = lim dM (xn , yn ) . (1.2.1)
n→∞
9
Esta situação é semelhante ao caso dos números racionais Q, em que o limite de sequências em Q não é um
membro de Q.
41
Este limite sempre existe. Com efeito, sendo (xn )n∈N e (yn )n∈N sequências de Cauchy
com elementos xn , yn ∈ M, segue que para um ε > 0 arbitrário dM (xm , xn ) < ε/2 e
dM (ym , yn ) < ε/2. Logo,
dM (xn , yn ) # dM (xn , xm ) + dM (xm , ym ) + dM (ym , yn ) .
Portanto,
dM (xn , yn ) − dM (xm , ym ) # dM (xn , xm ) + dM (ym , yn ) . (1.2.2)
Uma mudança de índices dá
dM (xm , ym ) − dM (xn , yn ) # dM (xm , xn ) + dM (yn , ym ) . (1.2.3)
Desse modo, segue de (1.2.2) e (1.2.3) que

ε ε
|dM (xm , ym ) − dM (xn , yn )| # dM (xm , xn ) + dM (yn , ym ) < + =ε.
2 2
para todo n, m > N(ε). Pelo critério de convergência de Cauchy a sequência de números
an = dM (xn , yn ) é convergente.
Resta provar que o limite (1.2.1) é independente das sequências de Cauchy escolhidas, que
devem ser consideradas iguais em M . Sejam (xn )n∈N , (x′n )n∈N e (yn )n∈N , (yn′ )n∈N sequências
de Cauchy em M tais que limn→∞ dM (xn , x′n ) = 0 e limn→∞ dM (yn , yn′ ) = 0. Então,
devemos mostrar que
lim dM (xn , yn ) = lim dM (x′n , yn′ ) . (1.2.4)

n→∞ n→∞
De
dM (xn , yn ) # dM (xn , x′n ) + dM (x′n , yn′ ) + dM (yn′ , yn ) ,
segue que
lim dM (xn , yn ) # lim dM (x′n , yn′ ) . (1.2.5)

n→∞ n→∞
Da mesma forma, temos que
dM (x′n , yn′ ) # dM (x′n , xn ) + dM (xn , yn ) + dM (yn , yn′ ) ,
logo,
lim dM (x′n , yn′ ) # lim dM (xn , yn ) . (1.2.6)

n→∞ n→∞
Finalmente, (1.2.5) e (1.2.6) juntas implicam (1.2.4).

Etapa 2. Devemos mostrar que M com a distância dM (x, y) = limn→∞ dM (xn , yn ) é um
espaço métrico. De dM (xn , yn ) " 0, segue que dM (x, y) " 0. A igualdade dM (x, y) = 0
implica que limn→∞ dM (xn , yn ) = 0 e, de acordo com a nossa definição, esta relação acontece
se, e somente se, x = y. Além disso, da relação de simetria dM (xn , yn ) = dM (yn , xn ), obtemos
que dM (x, y) = dM (y, x). A desigualdade triangular é obtida da desigualdade
dM (xn , yn ) # dM (xn , wn ) + dM (wn , yn ) ,
42
por um processo de passagem ao limite:
dM (x, y) = lim dM (xn , yn ) # lim dM (xn , wn ) + lim dM (wn , yn )

n→∞ n→∞ n→∞
= dM (x, w) + dM (w, y) .
Portanto, M é um espaço métrico.

A seguir, considere o conjunto de todas as sequências de Cauchy estacionárias, isto é,
x = {x, x, x, x, . . .} com x∈M .
Este conjunto é um subconjunto K de M . Sejam x e y duas sequências de Cauchy estacionárias.

Então, da Eq.(1.2.1), segue que
dM (x, y) = lim dM (xn , yn ) = dM (x, y) . (1.2.7)

n→∞
Existe uma correspondência um-para-um, x = {x, x, x, x, . . .} ↔ x, entre os elementos x = K

e x ∈ M. Assim, pela Eq.(1.2.7), K e M são isométricos. Portanto, a seguir, não distinguiremos
entre os elementos x e sequências de Cauchy estacionárias. Desse modo, podemos considerar
M como um subconjunto de M e obter, para x ∈ M e y ∈ M,
dM (x, y) = lim dM (xn , yn ) = dM (x, y) com x = {x1 , x2 , x3 , x4 , . . .} .

n→∞
Etapa 3. Devemos mostrar que M é denso em M . Seja x = {x1 , x2 , x3 , x4 , . . .} uma

sequência de Cauchy arbitrária. Então, dM (xn , xm ) < ε para todo n, m > N(ε), logo,
dM (x, xn ) = lim dM (xm , xn ) # ε . (1.2.8)

m→∞
Portanto, para todo x ∈ M existe uma sequência (xn )n∈N ⊂ M para a qual o limite
limn→∞ xn = x existe. Consequentemente, M é denso em M .
Etapa 4. Finalmente, precisamos mostrar que M é completo. Seja (xn )n∈N uma sequência
de Cauchy arbitrária em M . Como o conjunto M é denso em M , segue que para todo xℓ ∈ M
existe um xℓ ∈ M tal que
1
dM (xℓ , xℓ ) < para ℓ ∈ N . (1.2.9)
ℓ
Para dM (xn , xm ), temos a estimativa
dM (xn , xm ) = dM (xn , xm ) # dM (xn , xn ) + dM (xn , xm ) + dM (xm , xm ) < ε ,
para todo n, m ∈ N(ε). Portanto, x = {x1 , x2 , x3 , x4 , . . .} é uma sequência de Cauchy e de

(1.2.8) segue que limn→∞ dM (x, xn ) = 0. De (1.2.9) e da desigualdade triangular, obtemos que
dM (xn , x) # dM (xn , xn ) + dM (xn x) < ε ,
para todo n ∈ N(ε). Isto implica que limn→∞ xn = x, que é equivalente à completeza de
M.
O próximo teorema é um resultado importante na topologia geral e na análise funcional. O
teorema fornece condições suficientes para que em um espaço topológico a interseção enume-
rável de abertos densos ainda seja densa.
43
TEOREMA 1.14 (Teorema de Baire). Seja M um espaço métrico completo. Toda interseção
enumerável de abertos densos é um subconjunto denso de M.
Demonstração. Sejam A1 , A2 , . . . , An , . . . uma coleção enumerável de subconjuntos densos

abertos em M. Para mostrar que a interseção ∩∞ n=1 An é densa em M, é suficiente mostrar
que qualquer conjunto aberto não vazio A em M tem um ponto x em comum com todo
An . Como A1 é denso, A intercepta A1 ; assim, existe um ponto x1 e 0 < r1 < 1 tal
que B(x1 ; r1 ) ⊂ A ∩ A1 , em que B(x, r) e B(x, r) denotam uma bola aberta e seu fecho,
respectivamente, centrada em x com raio r. Como cada An é denso, podemos continuar
recursivamente para encontrar um par de sequências xn e 0 < rn < 1/n de modo que
B(xn , rn ) ⊂ B(xn−1 , rn−1) ∩ An .
Isto é possível porque uma interseção finita de conjuntos abertos é um aberto (veja o Teorema
1.4) e, portanto, uma bola aberta centrada em xn pode ser encontrada dentro desta interseção.
Como xn ∈ B(xm , rm ) quando n > m, temos que xn é Cauchy e, portanto, xn converge para
algum limite x pela completude de M. Para qualquer n, por fechamento, x ∈ B(xn , rn ), isto
é, x ∈ ∩∞ n=1 B(xn , rn ) (isto é possível já que a interseção de uma família infinita de fechados é
um conjunto fechado; veja a Nota 1.15). Portanto, x ∈ A e x ∈ An para todo n.
1.2.10 Primeiro Axioma da Enumerabilidade

Em topologia, diz-se que um espaço E satisfaz o Primeiro Axioma da Enumerabilidade (PAE)
se cada ponto x ∈ E tem uma base local; ou seja, se para cada x ∈ E existe uma sequência de
vizinhanças abertas V1 , V2 , . . . de x tal que Vn+1 ⊂ Vn para todo n e dada qualquer vizinhança
aberta U de x, existe um n para o qual Vn ⊂ U.
DEFINIÇÃO 1.39. Diz-se que em um espaço topológico E todo x ∈ E possui um Sistema

Fundamental de Vizinhanças quando E satisfaz o PAE.
Exemplo 1.29. Todo espaço E sobre o qual esteja definida uma métrica satisfaz o PAE. Para se
verificar isto, basta tomarmos !
uma coleção"de bolas abertas B(x; 1/n), de centro x e raio 1/n,
n ∈ N. Isto gera a sequência B(x; 1/n) n∈N .
LEMA 1.3. Se o PAE é satisfeito em um ponto x, então de um conjunto E qualquer que tem x
como ponto de acumulação, é possível selecionar uma sequência x1 , x2 , . . . que converge para x.
Demonstração. Primeiro notamos que podemos sempre considerar uma coleção de vizinhanças
decrescentes satisfazendo o PAE, isto é, tais que V!1 ⊃ V2 ⊃ · · · . De " fato, se este axioma
não é satisfeito por uma coleção de vizinhanças V1 , V2 , . . . , Vn , . . .! basta substituir cada
"
Vn por Wn = V1 ∩ V2 ∩ · · · ∩ Vn ,. A nova coleção de vizinhanças W1 , W2 , . . . , Wn , . . .
assim gerada satisfaz o PAE. Se x é um ponto de acumulação de algum conjunto E, podemos
escolher um ponto xn ∈ E em cada vizinhança Vn (assumindo que V1 ⊃ V2 ⊃ · · · ); então
limn→∞ xn = x. Na verdade, para qualquer vizinhança U de x existe alguma vizinhança
Vn ⊂ U tal que xn ∈ Vn . Visto que Vn+r ⊂ Vn , segue que xn+r ∈ Vn+r ⊂ U, para qualquer
r. Logo, qualquer vizinhança de x contém todos os pontos x1 , x2 , . . . partindo-se com algum
ponto, como exigido.
Podemos agora explorar o conceito de um sistema fundamental de vizinhanças para provar
um inverso da Proposição 1.15.
44
PROPOSIÇÃO 1.20. Se E é um espaço topológico que satisfaz o PAE, em que toda sequência
convergente possui um único limite, então E é Hausdorff.
Demonstração. Suponha que os limites de todas as sequências em E são únicos. Se E não é
Hausdorff, então existem dois pontos distintos x, y ∈ E que não têm vizinhanças mutualmente
disjuntas em E. Sejam Nx e Ny sistemas de vizinhanças de x e y, respectivamente. Seja
D = Nx × Ny e para (Un , Vn ) ∈ D e (Un+1 , Vn+1 ) ∈ D, defina (Un , Vn ) ≺ (Un+1 , Vn+1 )
se, e somente se, Un ⊃ Un+1 e Vn ⊃ Vn+1 . Isto torna D um conjunto ordenado, com a
ordem de inclusão inversa. Para qualquer Un ∈ Nx e Vn ∈ Ny , sabemos que Un ∩ Vn ̸= ∅.
Seja (xn )n∈N uma sequência em E. Tome xn ∈ Un ∩ Vn . Seja W uma vizinhança aberta
de x. Então, (W , E) ∈ D. Se (W , E) ≺ (Un , Vn ) em D, então Un ⊂ W e, assim,
xn ∈ Un ∩ Vn ⊂ Un ⊂ W . Logo, xn converge para x. Pelo mesmo raciocínio, pode-se mostrar
que xn converge para y também, contradizendo a hipótese. Portanto, E é T2 .
Vamos finalizar esta seção introduzindo um conceito importante relacionado à noção de
enumerabilidade de um conjunto.
DEFINIÇÃO 1.40 (Espaço Separável). Diz-se que um espaço topológico E é separável se existe
um conjunto D ⊂ E finito, ou enumerável, que é denso em E.
Exemplo 1.30. Um espaço M munido de uma métrica é separável se ele contém um subcon-
junto enumerável denso em toda parte. Do Teorema 1.12 segue
! que, se M é separável, " então,
para cada x ∈ M existe um conjunto enumerável de pontos x1 , x2 , . . . , xn , . . . tal que para
cada ε > 0, existe um elemento xn neste conjunto tal que d(x, xn ) < ε.
1.2.11 Continuidade
Os conceitos fundamentais da topologia, mais especificamente, a continuidade e a conver-
gência podem facilmente ser estabelecidos em termos de vizinhanças como mostra a seguinte
DEFINIÇÃO 1.41. Sejam E e F espaços topológicos, f um mapeamento de E para F e x0 ∈ E.
Diz-se que mapeamento f é contínuo em x0 se a seguinte condição é satisfeita: para toda
vizinhança B de f (x0 ) em F , existe uma vizinhança A de x0 em E tal que f (A) ⊂ B. Diz-se
que mapeamento f é contínuo sobre E se f é contínuo em todo ponto de E.
Exemplo 1.31 (Continuidade e limite). Sejam E e F espaços munidos com uma métrica, f
um mapeamento de E para F e x0 ∈ E. O mapeamento f é contínuo em x0 se para todo
ε > 0, existe δ(ε) > 0 tal que f (B(x0 ; δ)) ⊂ B(f (x0 ); ε). Isto é, qualquer bola B(f (x0 ); ε)
centrada na imagem f (x0 ) de qualquer ponto x0 ∈ E, contém a imagem de uma bola centrada
em x0 . Note que se E = F = R, então para x0 ∈ R e ε > 0 existe um δ > 0 tal que
6! "7 3 4
f y | |x0 − y| < δ ⊂ f (y) | |f (x0 ) − f (y)| < ε .
Isto é o mesmo que dizer que para x0 ∈ R e ε > 0, existe um δ > 0 tal que para 0 <
|x0 − y| < δ ⇒ |f (x0 ) − f (y)| < ε, que é a forma da definição de continuidade com a qual
o leitor talvez esteja mais familiarizado. A ideia está ilustrada na parte (a) da figura abaixo;
isto é, se y está suficientemente próximo de x0 , f (y) = a pode ser tomado tão próximo de
f (x0 ) quanto desejarmos. Por outro, lado, a parte (b) da mesma figura mostra o caso em que
f (x) é descontínua em x0 . Claramente, se tomamos um ε > 0 suficientemente pequeno, não
existe nenhum ponto a no contra-domínio e nenhum δ para os quais |f (x0 ) − a| < ε quando
45
|x0 − y| < δ. Se escolhermos x < x0 , então |f (x) − a1 | < ε quando |x0 − x| < δ; por outro
lado, se escolhermos x > x0 , então |f (x) − a2 | < ε quando |x0 − x| < δ. Então, a1 é chamado
o limite à esquerda de f (x) em x0 , enquanto a2 é chamado o limite à direita de f (x) em x0 .
f (x) f (x)
a+ε a2
a
a−ε a 2δ
a1
2δ
x0 x x0 x
(a) (b)
A função f (x) tem um limite f (x0 ) em x0 ∈ E se, e somente se, a1 = a2 = f (x0 ), e

escrevemos
lim f (y) = f (x0 ) .
x→x0
Neste caso, x0 é dito ser um ponto de acumulação de E.

A definição de continuidade pode ser reescrita sem se referir à noção de um limite.
DEFINIÇÃO 1.42 (Definição ε–δ de Cauchy). Uma função f : E ⊂ Rn → Rm é contínua

em um ponto x0 ∈ E se, e somente se, para cada ε > 0 existe um δ > 0 de forma que
d(f (x0 ), f (x)) < ε quando d(x0 , x) < δ, x ∈ E.
Observa-se que as duas métricas na definição acima podem ser diferentes, com a primeira
sendo a métrica euclidiana em Rn e a segunda métrica euclidiana sobre Rm , com a possibili-
dade de que m ̸= n.
Deve ficar claro que, a essência da noção de continuidade está realmente amarrada ao
conceito de vizinhança, em vez do conceito de limites ou do conceito do argumento ε–δ. De
fato, as Definições 1.41 e 1.42 são equivalentes!
Cada uma das três condições do teorema seguinte é uma possível definição de continuidade
de funções em espaços munidos com uma métrica.
TEOREMA 1.15 (Conceito de Continuidade). Sejam E e F espaços munidos com uma métrica,
f um mapeamento de E para F . As seguintes condições são equivalentes:
(a) Se A é aberto em F , então f −1 (A) é aberto em E.
(b) Para todo x ∈ E, e dado ε > 0, existe um δ > 0 tal que f (B(x; δ)) ⊂ B(f (x); ε).
Isto é, qualquer bola B(f (x); ε) centrada na imagem f (x) de qualquer ponto x ∈ E, contém a
imagem de uma bola centrada em x.
(c) xn → x ⇒ f (xn ) → f (x).
Demonstração. (a) ⇒ (b). Suponha (a) e sejam x ∈ E e ε > 0. Sendo que B(f (x); ε)
é aberto, temos por (a) que f −1 (B(f (x); ε)) é aberto. Uma vez que x ∈ f −1 (B(f (x); ε)),
existe um δ > 0 tal que, pelo Lema 1.2, é possível interpor entre x e f −1 (B(f (x); ε)) uma
bola aberta; isto é, {x} ⊂ B(x; δ) ⊂ f −1 (B(f (x); ε)), o que também pode ser escrito como
x ∈ B(x; δ) ⊂ f −1 (B(f (x); ε)). Portanto, do fato que A = f (f −1 (A)), para todo A ⊂ f (E),
segue que f (B(x; δ)) ⊂ B(f (x); ε).
46
(b) ⇒ (c). Suponha (b). Seja x o limite da sequência (xn )n∈N . Tome ε > 0. Escolha
δ(ε) > 0 tal que f (B(x; δ)) ⊂ B(f (x); ε). Como xn → x, existe N tal que para todo
n > N ⇒ xn ∈ B(x; δ) ⇒ f (xn ) ∈ B(f (x); ε). Portanto, f (xn ) → f (x).
(c) ⇒ (a). Suponha (c) e seja A ⊂ F aberto. Suponha por absurdo que f −1 (A) não seja
aberto, ou seja, f −1 (A) ∩ ∂f −1 (A) ̸= ∅. Sendo assim, tome x ∈ ∂f −1 (A). Naturalmente, a
bola aberta B(x; δ) ̸⊂ f −1 (A). Escolha xn ∈ B(x; δ) − f −1 (A), para todo inteiro n maior
que um inteiro n0 . Evidentemente, xn → x. Entretanto f (xn ) ̸∈ A, para todo n > n0 . Assim,
a bola aberta B(f (x); ε) não pode conter os elementos f (xn ); portanto, f (xn ) ̸→ f (x). Isto
contradiz (c).
Nota 1.32. Existe o risco de se confundir a condição (a) do Teorema 1.15 com a seguinte
condição: (a′ ) a imagem direta de um subconjunto aberto de E é um subconjunto aberto de
F . Esta confusão deve ser evitada. Mapeamentos satisfazendo a condição (a′ ) são chamados
mapeamentos abertos. Em outras palavras, a condição (a′ ) implica que f é contínuo se, e
somente se, a imagem inversa de cada conjunto aberto for novamente aberta (equivalentemente,
a imagem inversa de cada conjunto fechado será fechada). Se a imagem de cada conjunto
aberto for aberta, f será chamada de mapeamento aberto. Uma bijeção f é chamada de
homeomorfismo se a função f e sua inversa f −1 são contínuas. Note que se f é uma bijeção,
então, f −1 é contínua se, e somente se, f for um mapeamento aberto.
1.2.12 Espaços Compactos

Uma das propriedades especiais que um espaço topológico pode apresentar é ser compacto.
Uma das principais razões para se estudar espaços compactos é o fato que de alguma forma
eles são muito semelhantes aos conjuntos finitos. Existem muitos resultados que são fáceis de
mostrar para conjuntos finitos, cujas provas podem ser aplicadas com alterações mínimas para
espaços compactos. Muitas vezes se diz que a “compacidade é o que se tem de mais próximo de
conjuntos finitos.”
Antes de definirmos o que é um espaço compacto, precisamos da
DEFINIÇÃO 1.43. Sejam E um espaço topológico e F ⊂

+ E. Uma cobertura de F é uma coleção
C = {Cλ }λ∈L de subconjuntos de E tal que F ⊂ λ∈L Cλ . Em outras palavras, a coleção
C = {Cλ }λ∈L é chamada uma cobertura de F se todo ponto x ∈ F está em, pelo menos, um
dos conjuntos Cλ da coleção C .
Nota 1.33. As expressões cobertura aberta e cobertura fechada, naturalmente, referem-se aos
casos em que todo conjunto Cλ ∈ C é aberto ou fechado, respectivamente. Uma cobertura C
é finita quando a coleção C+= {Cλ }λ∈L contém apenas um número finito de conjuntos. Se
existir L′ ⊂ L tal que F ⊂ λ∈L′ Cλ , diremos que C ′ = {Cλ}λ∈L′ é uma subcobertura de
C para F .
DEFINIÇÃO 1.44. Sejam E um espaço topológico e F ⊂ E. Diz-se que F é compacto se qualquer

cobertura C de F por conjuntos abertos contém uma subcobertura finita. Em outras palavras,
dada uma coleção C = {Cλ }λ∈L de conjuntos abertos + de E, é possível selecionar de C um
número finito de conjuntos C1 , . . . , Cn tal que F ⊂ nλ=1 Cλ . Se o subconjunto
+n compacto F é
igual ao próprio conjunto E, então E é dito ser um espaço compacto e E = λ=1 Cλ .
Nota 1.34. A definição acima pode ser imediatamente transformada numa propriedade de con-
juntos fechados de E, considerando-se os complementos (fechados) dos conjuntos abertos Cλ .
47
Entretanto, deve-se ressaltar que os conjuntos abertos Cλ , λ ∈ L, não cobrem E precisamente

quando seus complementos (E − Cλ ) têm uma interseção não-vazia. Ou seja, para que os
conjuntos Cλ , λ ∈ L, formem uma cobertura aberta de um espaço topológico E, é necessário
e suficiente que os seus* complementos (E − Cλ ) constituam uma coleção de fechados em E
tal que a interseção λ∈L (E − Cλ ) = ∅. Portanto, por passagem aos complementos, diz-se
que um espaço topológico E é compacto se, * e somente se, toda coleção {(E − Cλ )}λ∈L de
subconjuntos fechados em E, cuja interseção λ∈L (E − Cλ ) é vazia, contém uma subcoleção
finita {(E − C1 ), . . . , (E − Cn )} cuja interseção (E − C1 ) ∩ · · · ∩ (E − Cn ) = ∅.
DEFINIÇÃO 1.45. Diz-se que uma coleção F de subconjuntos de um conjunto E tem a*propri-
edade de interseção finita se para qualquer n ∈ N e F1 , . . . , Fn ∈ F , a interseção nλ=1 Fλ
é não-vazia.
O resultado seguinte caracteriza a propriedade de compacidade de um espaço em termos de
coleções que possuem a propriedade de interseção finita.
TEOREMA 1.16. Um espaço topológico E é compacto se, e somente se, toda coleção F =
{Fλ }λ∈L de subconjuntos fechados de E, que possui a propriedade de interseção finita, tem
uma interseção não-vazia.
Demonstração. Suponha primeiro que E é compacto. Seja F = {Fλ }λ∈L de subconjuntos
fechados
* de E e assuma que F possui a propriedade de interseção finita. Temos que mostrar
que λ∈L Fλ ̸= ∅. Se esta interseção fosse vazia então pela leis de Morgan, a coleção
constituida dos complementos dos membros de F seria uma cobertura de E e esta cobertura
seria aberta visto que os membros de F são fechados. Pela compacidade de E, existe uma
subcobertura finita constituida, por exemplo, dos membros E − F1 , E − F2 , . . . , E − Fn com
*λn ∈ F , para λ = 1, . . . , n. Porém, novamente pelas leis de Morgan, isto implicaria que
F
*λ=1 Fλ = ∅ contradizendo o fato que F possui a propriedade de interseção finita. Assim,
n
λ=1 Fλ ̸= ∅. Isto prova a implicação direta. A prova da implicação inversa é similar, não
envolvendo nada mais que a definição, as leis de Morgan e o fato que um conjunto é fechado
se, e somente, seu complemento é aberto.
Agora, suponha que E seja Hausdorff. Isto significa que qualquer dois subconjuntos {x}
e {y} de E pode ser separado um do outro por conjuntos abertos disjuntos. Substitua o
singleto {y} por um conjunto finito F . Sejam y1 , y2 , . . . , yn elementos distintos de F . Para
*nsejam Ui e Vi+conjuntos
i = 1, . . . , n, abertos tais que x ∈ Ui , yi ∈ Vi e Ui ∩ Vi = ∅.
n
Sejam U = i=1 Ui e V = i=1 Vi . Então U e V são conjuntos abertos, x ∈ U, F ∈ V e
U ∩ V = ∅. O argumento acima não é válido quando F é infinito. Por outro lado, se F é
compacto, as coisas não são tão ruins, como mostra a
PROPOSIÇÃO 1.21. Seja E um espaço de Hausdorff, x ∈ E e F um subconjunto compacto de E
/ F . Então, existem conjuntos abertos U, V tais que x ∈ U, F ⊂ V e U ∩ V = ∅.
tal que x ∈
Demonstração. Para cada! yi ∈ F existe " conjuntos abertos Ui , Vi tais que x ∈ Ui , yi ∈ Vi e
Ui ∩ Vi = ∅. A família !Vi | yi ∈ F é " uma cobertura aberta de F . * Visto que F é compacto,
+
existe uma subcobertura V1 , V2 , . . . , Vn que cobre F . Sejam U = ni=1 Ui e V = ni=1 Vi .
Então, U, V são subconjuntos * abertos disjuntos,
+nx ∈ U e F ⊂ V . De fato, assuma por absurdo
n
que z ∈ U ∩ V . Logo, z ∈ i=1 Ui e z ∈ i=1 Vi . Isto, por sua vez implica que z ∈ Ui ,
para todo i = 1, . . . , n e z ∈ V1 , ou z ∈ V2 ,. . ., ou z ∈ Vn (ou seja, z deve pertencer a pelo
menos um dos conjuntos Vi ). Assim, z ∈ Ui ∩ Vi , o que contradiz a hipótese que Ui ∩ Vi = ∅.
Portanto, U ∩ V = ∅. Que x ∈ U e F ⊂ V é imediato. Isto conclui a prova.
48
COROLÁRIO 1.9. Um subconjunto compacto em um espaço de Hausdorff é fechado.
Demonstração. Suponha que E é Hausdorff e F um subconjunto compacto de E. Então pela

proposição acima, para qualquer x ∈ E − F existem conjuntos abertos U, V tais que x ∈ U,
F ⊂ V e U ∩ V = ∅. Em particular, U ∩ F = ∅ e, portanto, U ⊂ E − F . Assim, E − F é
uma vizinhança de cada um de seus pontos. Logo, E − F é aberto e F fechado.
PROPOSIÇÃO 1.22. Seja E um espaço topológico munido de uma métrica e F ⊂ E. Se F é

compacto, F é limitado.
Demonstração. Seja C = {E ∩B(xλ ; 1)}λ∈L , com xλ ∈ E, uma cobertura de F . Visto +nque. F é

compacto,/ E ∩ B(x1 ; 1), . .!. , E ∩ B(xn ; 1) é uma subcobertura
" para F , isto é, F = λ=1 E ∩
B(xλ ; 1) . Seja k = max d(xλi , xλj ) | i, j = 1, . . . , n . Se F não fosse limitado, existiriam
z, y ∈ F tais que d(z, y) > k + 2. Entretanto, existem índices i, j tais que z ∈ E ∩ B(xλi ; 1)
e y ∈ E ∩ B(xλj ; 1). Mas, então, d(z, y) # d(z, xλi ) + d(xλi , xλj ) + d(xλj , y) # k + 2,
contradizendo a hipótese que d(z, y) > k + 2. Logo, F é limitado.
Combinando os resultados acima com o fato que todo espaço topológico munido de uma
métrica é Hausdorff, temos o
COROLÁRIO 1.10. Todo subconjunto compacto de um espaço topológico munido de uma métrica
é fechado e limitado.
Uma classe importante de espaços são os localmente compactos.
DEFINIÇÃO 1.46. Seja E um espaço topológico. Diz-se que E é localmente compacto se, e
somente se, todo ponto x ∈ E tem uma vizinhança compacta. Em outras palavras, um espaço
topológico é localmente compacto se todo ponto tem uma vizinhança cujo fecho é compacto.
Existe uma série de propriedades topológicas que são equivalentes à compacidade em espaços
métricos (mas não são equivalentes em espaços topológicos mais gerais). Entre estas se inclue
a seguinte
DEFINIÇÃO 1.47 (Compacidade sequencial). Um espaço topológico E, munido de uma métrica,

é sequencialmente compacto se toda sequência convergente em E tem uma subsequência
convergente, que converge para o mesmo ponto.
Exemplo 1.32 (Compacidade de subconjuntos de Rn e Cn ). Para qualquer subconjunto com-

pacto F dos espaço Euclidianos Rn e Cn , as Definições 1.44 e 1.47 e o Corolário 1.10 podem ser
usados sem distinção como caracterização da compacidade de F , isto é, as seguintes condições
são equivalentes:
1. Cada cobertura aberta de F tem uma subcobertura finita. Esta é a definição topológica.
2. Cada sequência convergente tem uma subsequência convergente, que converge para o
mesmo ponto em F .
3. O conjunto F é fechado e limitado. Esta é a condição mais fácil de se verificar. Por

exemplo, um intervalo fechado ou bolas fechadas.
49
Atenção: Dependendo das propriedades do espaço considerado, estas condições podem ou

não ser equivalentes. Por exemplo, mostraremos no Capítulo 3 que uma bola unitária fechada
em espaços de Hilbert de dimensão infinita, apesar de ser limitada, não satisfaz a Definição
1.47 (segundo a topologia da norma). Portanto, uma bola unitária em espaços de Hilbert de
dimensão infinita não é compacta. Isto mostra que, em geral, o inverso do Corolário 1.10 não é
verdade para todo espaço topológico munido de uma métrica!
Exemplo 1.33 (Compacidade de subconjuntos do espaço de funções contínuas). Um dos
espaços métricos mais importantes na análise é o espaço de funções C[a, b], introduzido no
Exemplo 1.3, pg.9. Para subconjuntos deste espaço, temos um critério importante e frequente-
mente usado para compacidade relativa, chamado Teorema de Arzelà, que será enunciado sem
prova após a introdução de dois novos conceitos, o primeiro dos quais sendo dado pela seguinte
DEFINIÇÃO 1.48. Diz-se que uma família F de funções f definida em um intervalo fechado
[a, b] é uniformemente limitada se existe um número K > 0 tal que |f (x)| # K para todo
x ∈ [a, b] e toda função f ∈ F .
O segundo conceito é dado pela seguinte
DEFINIÇÃO 1.49. Diz-se que uma família F de funções f definida em um intervalo fechado
[a, b] é equicontínua se, dado qualquer ε > 0, existe um número δ > 0 tal que |x′ − x′′ | < δ
implica que |f (x′ ) − f (x′′ )| < ε para todo x′ , x′′ ∈ [a, b] e toda função f ∈ F .
A prova do próximo teorema pode ser encontrada no livro de A.N. Kolmogorov & S.V. Fomin,
“Introductory Real Analysis,” pg.102, Dover, 2017.
TEOREMA 1.17 (Teorema de Arzelà). Uma condição necessária e suficiente para uma família
F de funções contínuas f definida em um intervalo fechado [a, b] ser relativamente compacta
em C[a, b], é que F seja uniformemente limitada e equicontínua.
1.2.13 Partição da Unidade

Uma técnica utilizada em muitas partes da Topologia e da Análise é chamada partição da
unidade. As partições da unidade são uma maneira padrão de reunir resultados locais para
obter resultados globais.
DEFINIÇÃO 1.50. Seja {Ω1 , . . . , Ωm } uma cobertura aberta indexada e finita de um espaço E
munido de uma métrica. Uma família indexada de funções contínuas Φk : E → [0, 1], para
k = 1, . . . , m, é dita ser uma partição
;mda unidade subordinada à cobertura {Ω1 , . . . , Ωm } se:
(1) supp Φk ⊂ Ωk para todo k; (2) k=1 Φk = 1.
TEOREMA 1.18 (Existência de partições finitas da unidade). Seja {Ω1 , . . . , Ωm } uma cober-
tura aberta finita de um espaço normal E munido de uma métrica.10 Então, existe uma partição
da unidade subordinada à cobertura {Ωk }mk=1 .
Para provarmos o Teorema 1.18 precisaremos de dois resultados. O primeiro, é chamado de

Princípio do Encolhimento de uma cobertura; o segundo é um teorema profundo, um teorema
comumente chamado de “Lema de Urysohn.” Ele estabelece a existência de certas funções
10
Lembramos que um espaço topológico E é chamado um espaço normal se para cada par C1 , C2 de conjuntos
fechados disjuntos de E, existem conjuntos abertos disjuntos contendo C1 e C2 , respectivamente (veja a Figura
1.1, na Nota 1.23, da Subseção 1.2.6).
50
contínuas com valor real em um espaço normal E. Em outras palavras, o Lema de Urysohn é
um lema que estabelece que um espaço topológico é normal se, e somente, se dois subconjuntos
fechados disjuntos podem ser separados por uma função contínua. O Lema de Urysohn é uma
ferramenta crucial usada para provar vários teoremas importantes da Topologia e da Análise.
Evidentemente, se dois conjuntos abertos se sobrepõem, eles devem se sobrepor por uma
fronteira, e a fronteira sempre pode ser reduzida um pouco sem alterar a união dos conjuntos
(cf. a Figura 1.2). Este fato pode ser adequadamente generalizado como mostra o lema a seguir.
A B A B
Figura 1.2: Redução das fronteiras de sobreposição dos conjuntos A e B.
LEMA 1.4 (Princípio do Encolhimento). Seja A um conjunto fechado em Rn – possivelmente

todo Rn . Seja {Ωk }k∈I uma coleção contável, isto
+é, finita ou enumerável, de conjuntos abertos
limitados que cobrem A, ou seja, tal que A ⊂ k∈I Ωk – cf. a Figura 1.3. Então, é possível
encolher um pouco todos os conjuntos Ωk , sem destruir as propriedades de cobertura da coleção.
Especificamente, existe uma coleção {Ω′k }k∈I de conjuntos abertos, de modo ′
+ que′ o fecho Ωk de
′
Ωk está contido no correspondente Ωk , para todo k ∈ I, enquanto A ⊂ k∈I Ωk .
Ω1
Ω2
Figura 1.3: Uma cobertura aberta de um conjunto compacto. Figura retirada, e adptada, do livro-
texto de Robert D. Richtmyer, “Principles of Advanced Mathematical Physics,” Vol. 1, Springer-
Verlag, 1978. Todos os Direitos Reservados.
+
Demonstração. Primeiro, note que a interseção de A com o complemento de ∞ k=2 Ωk (aqui,
Ω1 foi omitido) é um conjunto fechado e limitado K1 situado em Ω1 (isto é, K1 é a parte de
A que foi coberta por Ω1 , mas não por qualquer outro Ωk – cf. a Figura 1.4.
51
K1
Ω1
Ω′1
Figura 1.4: Encolhimento de Ω1 . Figura retirada, e adptada, do livro-texto de Robert D. Richtmyer,

“Principles of Advanced Mathematical Physics,” Vol. 1, Springer-Verlag, 1978. Todos os Direitos
Reservados.
Então, sempre é possível encontrar um conjunto aberto intermediário Ω′1 que também contém
K1 tal !que o fecho Ω′1 de Ω′1"está contido no correspondente ! Ω1 . Com efeito, o conjunto "
Ω′1 = x | dist(x, K1 ) # 21 d , em que dist(x, K1 ) = inf ∥x − y∥ | x ∈ K1 , y ∈ / Ω1 ,
tem a propriedade necessária. Em outras palavras, se K1 é um conjunto limitado e fechado
em Rn contido no conjunto aberto Ω1 , então a distância d de K1 ao complemento de Ω1 é
positiva. Ou seja, existe uma margem em torno de K1 em Ω1 , cuja largura não é inferior a
d. Consequentemente, existe um conjunto aberto Ω′1 que contém K1 e cujo fecho está em Ω1 .
Claramente, Ω′1 pode substituir Ω1 na cobertura. Agora suponha que {Ω′1 ∪· · ·∪Ω′k−1 , Ωk ∪. . .}
seja uma cobertura obtida encolhendo-se os primeiros k − 1 conjuntos abertos. Então, a
interseção de A com o complemento de {Ω′1 ∪ · · · ∪ Ω′k−1 , Ωk+1 ∪ . . .} (agora Ωk foi omitido)
é um conjunto fechado e limitado Kk contido em Ωk . Então, Ω′k pode ser construído como foi
Ω′1 e uma indução em k prova o teorema.
LEMA 1.5 (Lema de Urysohn). Sejam K1 e K2 subconjuntos fechados disjuntos de um espaço
normal E munido de uma métrica. Então, existe uma função contínua f : E → [0, 1] tal que
f é 0 em K2 e 1 em K1 . Em particular, se E é localmente compacto e K1 é compacto, pode-se
escolher f com suporte compacto.
Demonstração. Para provar a primeira afirmação, defina

dist(x, K2 )
f (x) = ,
dist(x, K1 ) + dist(x, K2 )
em que dist(x, Kj ) = inf y∈Kj d(x, y) é a distância entre um ponto x ∈ E e o subconjunto
Kj ⊂ E, com j = 1, 2. Para provar a segunda afirmação, observe que existe um conjunto
aberto Ω tal que Ω é compacto e K1 ⊂ Ω ⊂ Ω ⊂ E \ K2 . De fato, para todo x ∈ K1 , existe
uma bola B(x; ε) tal que B(x; ε) é compacta e B(x; ε) ⊂ E \ K2 . Como K1 é compacto,
uma quantidade finitamente grande dessas bolas cobre K1 e podemos escolher a união dessas
bolas como sendo Ω. Agora substitua K2 por E \ Ω.
Nota 1.35. Na segunda afirmação no Lema de Urysohn foi assumido que se E é localmente
compacto e K1 é compacto, então pode-se escolher f com suporte compacto. A coleção de
todas as funções conínuas f com suporte compacto é denotada por C0 (E):
! "
C0 (E) = f ∈ C(E) | supp f é compacto em E .
52
Claramente, toda função f ∈ C0 (E) é limitada. Além disso, as relações

supp (f + g) ⊆ supp f ∪ supp g , supp (cf ) = c supp f (c ̸= 0) e supp(f g) ⊆ supp f ,
mostra que C0 (E) é um ideal na álgebra de funções limitadas.
Demonstração do Teorema 1.18. Nossa demonstração foi tomada do livro do Munkres, Topology,
Second Edition, Prentice Hall, 2000, pg.225.
Etapa 1. Primeiro, provamos que é possível “encolher” a cobertura {Ω1 , . . . , Ωm } para uma
cobertura aberta {Ω′1 , . . . , Ω′m } de E, de modo que Ω′k ⊂ Ωk para cada k. Prosseguimos por
indução. Primeiro, observe que o conjunto
A = E − (Ω2 ∪ · · · ∪ Ωm ) ,
é um subconjunto fechado de E. Como {Ω1 , . . . , Ωm } cobre E, o conjunto A está contido
no conjunto aberto Ω1 . Usando a normalidade de E, escolha um conjunto aberto Ω′1 contendo
A de modo que Ω′1 ⊂ Ω1 . Então, a coleção {Ω′1 , Ω2 , . . . , Ωm } cobre E. Em geral, dados os
conjuntos abertos {Ω′1 , . . . , Ω′k−1 }, de modo que a coleção
{Ω′1 , . . . , Ω′k−1 , Ωk , Ωk+1 , . . . , Ωm } ,
cobre E, tome 8 9
A = E − (Ω′1 ∪ · · · ∪ Ω′k−1 ) − (Ωk+1 ∪ · · · ∪ Ωm ) .
Então, A é um subconjunto fechado de E que está contido no conjunto aberto Ωk . Escolha Ω′k
para ser um conjunto aberto contendo A, de modo que Ω′k ⊂ Ωk . Logo, a coleção
{Ω′1 , . . . , Ω′k−1 , Ω′k , Ωk+1 , . . . , Ωm } ,
cobre E. No k-ésimo passo da indução, nosso resultado é comprovado.
Etapa 2. Agora provamos o teorema. Dada a cobertura aberta {Ω1 , . . . , Ωm } de E, escolha

uma cobertura aberta {Ω′1 , . . . , Ω′m } de E tal que Ω′k ⊂ Ωk para cada k. Então, escolha
cobertura aberta {Ω′′1 , . . . , Ω′′m } de E, tal que Ω′′k ⊂ Ω′k para cada k. Usando o Lema de
Urysohn, escolha para cada k uma função contínua
fk : E → [0, 1] ,
tal que fk (x) = 1 se x ∈ Ω′′k e fk (x) = 0 se x ∈ E − Ω′′k . Neste ponto, lembramos que se
f : E → R, o suporte de f é definido como o fecho do conjunto fk−1 (R \ {0}). Assim, se x
está fora do suporte de f , existe alguma vizinhança de x na qual f desaparece. Portanto, como
fk−1 (R \ {0}) está contido em Ω′k , segue que
supp fk ⊂ Ω′k ⊂ Ωk .
;
Como a coleção {Ω′′1 , . . . , Ω′′m } cobre E, a soma m k=1 fk (x) é positiva para cada x. Portanto,
podemos definir, para cada k,
f (x)
Φk (x) = ;m .
k=1 fk (x)
Consequentemente, as funções Φ1 , . . . , Φm assim definidas satisfazem todas as propriedades
exigidas.
53
Nota 1.36. Devido ao fato de termos assumido em toda análise acima que E é um espaço
topológico munido de uma métrica, de acordo com a Nota 1.23, nós temos a seguinte relação:
T4 ⇒ T3 ⇒ T2 ⇒ T1 , em que T1 significa Tychonoff, T2 Hausdorff, T3 regular e T4 normal,
respectivamente. Isto significa que, o Lema de Urysohn poderia ser enunciado na seguinte
versão:
LEMA 1.6 (Versão do Lema de Urysohn para Espaços Hausdorff). Seja E localmente com-
pacto e Hausdorff. Se K ⊂ Ω ⊂ E, com K compacto e Ω aberto, então, existe uma função
contínua Φ : E → [0, 1] com suporte compacto tal que f (x) = 1 para todo x ∈ K e f (x) = 0
para todo x ∈ E \ Ω.
COROLÁRIO 1.11 (Caso especial do Lema de Urysohn em Rn ). Se K é compacto e Ω ⊂ Rn é

aberto com Ω ⊃ K, então, existe uma função f ∈ C0 (Rn ) tal que 0 # f # 1 com f ≡ 1 em
K e f ≡ 0 em Rn \ Ω.
Demonstração. Seja K ⊂ Rn compacto e Ω uma vizinhança aberta de K. Fixe t > 0 e defina

! "
f (x) = max 1 − t dist(x, K), 0 , ∀ x ∈ Rn .
Segue que f ∈ C0 (Rn ), 0 # f # 1 com f ≡ 1 em K. Então, escolhendo-se um t

suficientemente grande, obtemos f ≡ 0 em Rn \ Ω.
54
Apêndice 1A: Sobre Provas de Teoremas

Em matemática, uma prova é uma demonstração de que, dados certos axiomas, algum
enunciado de interesse é necessariamente verdadeiro. As técnicas mais comuns de demonstração
são:11
Se, e somente se é uma forma de expressão para um teorema. Com uma certa frequência,
encontramos teoremas que afirma que uma certa condicão A é verdadeira se, e somente se, uma
certa condição B acontece. O correspondente símbolo lógico é ⇔. Equivalentemente, algumas
vezes afirma-se que uma condição necessária e suficiente para que A seja verdadeira é que B
aconteça, ou ainda que A é equivalente a B (a condição A é válida exatamente nas mesma
circunstâncias em que a condição B é). Sobre as condições de A e B, elas podem ser, cada
uma delas, verdadeira ou falsa, havendo assim, quatro possibilidades. Se a afirmação A se, e
somente se, B é verdadeira, temos:
condição A condição B ////
verdadeira verdadeira possível
verdadeira falsa impossível
falsa verdadeira impossível
falsa falsa possível
É impossível a condição A ser verdadeira quando B é falsa, porque A ⇒ B. Da mesma

forma, é impossível a condição B ser verdadeira quando A é falsa, porque B ⇒ A. Assim as
duas condições A e B devem ser ambas verdadeiras ou ambas falsas. Em todo caso, a prova
deve proceder da seguinte forma:
• Se (Suficiência) – Assuma que a condição B aconteça; então mostre que isto implica que
a condição A é verdadeira.
• Somente se (Necessidade) – Assuma que a condição A aconteça; então mostre que a
condição B segue como uma consequência.
Exemplo 1.34. Se x e y são números reais e y ̸= 0, podemos considerar a condição A como
sendo x ÷ y = 3. Uma condição suficiente para que A seja verdadeira é que x = 6 e y = 2.
Chamamos isto de condição B. Obviamente, se assumimos a condição B, então A é verdadeira.
Contudo, se a condição A é assumida como verdadeira, a condição B não necessariamente
segue como uma consequência. Assim, A é verdadeira se B é verdadeira e não somente se.
Por outro lado, assuma que B é a condição que afirma que x = 3y. Então B é uma condição
necessária e suficiente para que A aconteça. De fato, assuma que B aconteça, então isto implica
que a condição A é verdadeira. A seguir assuma que a condição A aconteça, então a condição
B segue como uma consequência.
Indução matemática é um método de prova matemática usado para demonstrar a verdade

de um número infinito de proposições. O princípio da indução matemática se fundamenta nos
seguinte postulados de Peano para os números naturais (que são números inteiros, excluindo o
zero):
11
Origem: Wikipédia, a enciclopédia livre!
55
POSTULADOS DE PEANO. Seja N o conjunto dos números naturais. Então
I. 1 ∈ N,
II. Para cada n ∈ N existe um único n̂ ∈ N chamado, o sucessor de n
III. Para cada n ∈ N, n̂ ̸= 1,
IV. Se m, n ∈ N e m̂ = n̂, então m = n.
V. Qualquer subconjunto M de N tendo as propriedades (a)1 ∈ M, (b)k̂ ∈ M quando

k ∈ M é igual a N.
Os Postulados I e II meramente estabelecem que 1 e n > 1 pertencem ao conjunto N, n

sendo um número natural. O Postulado III afirma que existe um primeiro número natural, e
este número é 1. O Postulado IV afirma que números naturais distintos têm sucessores distintos.
O Postulado V afirma que qualquer número natural pode ser alcançado partindo-se com 1 e
contando-se sucessores.
Assuma que nos seja dada uma proposição P (n) que é verdadeira para todo n ̸= n̂, n ∈ N.
Seja M ⊂ N o conjunto dos números naturais para os quais P (n) é verdadeira. Então, pelo
Postulado I 1 ∈ N e 1̂ ̸= 1 (Postulado III); assim 1 ∈ M, isto é, P (1) é verdadeira. A seguir,
assuma que k ∈ M e que P (k), k̂ ̸= k, é verdadeira. Será que k̂ ∈ M? Vejamos. Se k1
é o sucessor de k̂, então k = k̂. Portanto, k̂ ∈ M. Logo, pelo Postulado V, M = N. Estas
observações nos leva à seguinte
PROPOSIÇÃO 1.23 (O Princípio da Indução Matemática). A proposição P (n) é verdadeira

para todo n ∈ N se
1. P (1) é verdadeira,
2. se, para cada n = k, pode-se mostrar que P (k) é verdadeira, então o mesmo vale para
n = k + 1, isto é, P (k + 1) é verdadeira.
Em resumo, esse método funciona provando que o enunciado é verdadeiro para um valor
inicial, e então provando que o processo usado para ir de um valor para o próximo é valido. Se
ambas as coisas são provadas, então qualquer valor pode ser obtido através da repetição desse
processo.
Exemplo 1.35. Considere a soma
Sn = 1 + 2 + 3 + · · · + n . (1A.1)
Desejamos provar por indução que
n(n + 1)
Sn = , para n ∈ N . (1A.2)
2
56
Suponha que M é o conjunto dos números naturais para os quais a afirmação (1A.2) é verdadeira.
Usando a definição (6.2), vemos que
1(1 + 1)
S1 = 1 = .
2
Logo, 1 ∈ M. A seguir, suponha que (A.2) é verdadeira, isto é, suponha que n ∈ M. Então,
n(n + 1)
Sn+1 = Sn + n + 1 = +n+1
2
(n + 1)[(n + 1) + 1]
= .
2
Portanto, n + 1 ∈ M e, pelo princípio da indução matemática, M = N. Isto conclui a prova.
Prova por contradição (ou redução ao absurdo, do latim reductio ad absurdum) é um

método de prova matemática indireta. Este tipo de prova é feito assumindo-se como verdade o
contrário do que queremos provar e então chegando-se a uma contradição.
A prova por contradição é muito usada em teoremas de existência. Neste caso, é usada
para provar a existência de um elemento com determinada característica, sem no entanto
mostrar tal elemento. Por esta razão, alguns matemáticos a evitam quando possível, preferindo
métodos de prova construtivos. O fato é que existem teoremas para os quais só se conhece
prova por contradição, como o argumento de diagonalização de Cantor para demonstrar a
não-enumerabilidade dos números reais.
√
Exemplo 1.36. A prova que 2 √ não é um racional é um exemplo clássico de uma prova por
contradição. De fato, tome x = 2 e assuma que x é racional. Então, x = p/q, com p e q
escolhidos de modo que sejam ambos números inteiros ímpares. Assim, x2 = 2 = p2 /q 2 , o que
implica que p2 = 2q 2 . Portanto, p é par (se p fosse ímpar, p2 seria ímpar). Logo, p2 é divisível
por 4 e, dessa forma, q 2 é par, √
o que resulta ser q par. Isto contradiz a hipótese que p e q são
ambos ímpares. Assim, se x = 2, x é irracional.
57
Capítulo 2
Espaços Vetoriais Normados
“A matemática é a mais bela e mais poderosa criação do espírito humano.”
S. Banach
No Capítulo 1, tratamos de espaços topológicos (em particular, espaços métricos), isto é,

espaços equipados com a noção de proximidade entre seus elementos. Até este momento nós
não introduzimos qualquer estrutura algébrica em nossas considerações. Nosso objetivo neste
capítulo é combinar estas duas ideias, isto é, estudar classes de espaços que são equipados
com uma estrutura topológica e com uma estrutura algébrica. Se X é um espaço vetorial
sobre o corpo dos reais (R), ou sobre o corpo dos complexos (C), uma topologia τ
sobre
X diz-se compatível com a estrutura algébrica de X se as operações algébricas em X são
contínuas. Isto significa que a operação de adição de vetores, x + y, é uma função contínua
dos pares de variáveis x, y ∈ X e a operação de multiplicação de vetores por um escalar,
α · x, é uma função contínua dos pares de variáveis α ∈ R (ou C) e x ∈ X . Um espaço
vetorial X equipado com uma topologia τ tal que as operações de adição e multiplicação são
contínuas é chamado um espaço vetorial topológico. O tema central deste Capítulo é a teoria
dos espaços vetoriais normados. Estaremos particularmente interessados no estudo de algumas
propriedades dos espaços de Banach, que são espaços vetoriais normados sobre os quais uma
topologia está definida (a topologia naturalmente gerada pelas normas) e toda sequência de
Cauchy é convergente, isto é, se X é um espaço de Banach, então toda sequência de Cauchy
em X converge (segundo a topologia da norma) para um elemento x ∈ X . Portanto, todo
espaço de Banach é completo!
59
2.1 Espaços Vetoriais

Neste capítulo, X , Y , etc, denotarão sempre espaços vetoriais lineares sobre R (ou C),
enquanto, x, y, z, . . ., pontos nesses espaços. Os símbolos α, β, . . . denotarão números reais
ou complexos. Muitos dos resultados e argumentos apresentados a seguir são indiferentes ao
corpo envolvido. Assim, vamos geralmente representar o corpo dos escalares por K; entretanto
deve-se ter sempre em mente que K está representando o corpo C dos números complexos (ou
o corpo R dos números reais). Quando necessário especificar um corpo, isto será feito.
DEFINIÇÃO 2.1. Um espaço vetorial X sobre um corpo K é um conjunto cujos elementos –
chamados vetores – satisfazem as seguinte operações:
I – Adição: Se x, y, z ∈ X , os seguintes axiomas devem ser satisfeitos:
1. fechamento: x + y ∈ X
2. associatividade: (x + y) + z = x + (y + z),
3. comutatividade: x + y = y + x,
4. vetor nulo: existe um vetor 0 ∈ X , o vetor nulo ou vetor zero, tal que x + 0 = x para
todo x ∈ X ,
5. inverso aditivo: a cada x ∈ X corresponde um elemento −x ∈ X , chamado o inverso

aditivo ou simétrico de x, tal que x + (−x) = 0.
II – Multiplicação por um elemento de K: Se x, y, z ∈ X e λ, µ ∈ K, os seguintes

axiomas devem ser satisfeitos:
1. fechamento: λx ∈ X
2. associatividade: λ(µx) = (λµ)x,
3. multiplicação por zero: 0x = 0, com o símbolo 0 também representando o elemento

zero dos números complexos ou reais,
4. multiplicação pela unidade: seja 1 a unidade de K, então 1x = x,
5. distributividade: λ(x + y) = λx + λy e (λ + µ)x = λx + µx.
Em várias situações, estaremos interessados não somente com o espaço X em sua totalidade,
mas também em certos subsistemas chamados subespaços.
DEFINIÇÃO 2.2 (Subespaços Vetoriais). Um subconjunto não-vazio Y de um espaço vetorial
X sobre um corpo K é chamado um subespaço vetorial de X se Y é fechado com respeito às
operações de adição vetorial e multiplicação por um elemento de K definidas sobre X , isto é,
Y + Y ⊆ Y e αY ⊆ Y , para todo α ∈ K. Dito de outra forma, Y ⊂ X é um subespaço
vetorial de X se αx + βy ∈ Y , para todo x, y ∈ Y e α, β ∈ K.
60
Nota 2.1. Se Y e Z representam dois subespaços de um espaço vetorial X , então, o conjunto

de todos os vetores da forma w = y + z (com y ∈ Y e z ∈ Z ) é também um espaço vetorial,
denotado por Y + Z , chamado a soma de Y e Z . Da mesma forma o conjunto de todos os
vetores comuns a Y e a Z , formam um espaço vetorial chamado a interseção de Y e Z . Se
Y e Z não têm elementos não-nulos em comum, Y ∩ Z é o espaço vetorial linear trivial
{0}, isto é, Y e Z tem somente o vetor zero em comum. Combinando estas informações,
definimos a soma direta de Y e Z , quando X = Y + Z e Y ∩ Z = {0} acontecem. A
soma direta é denotada por Y ⊕ Z .
TEOREMA 2.1. X = Y ⊕ Z se, e somente se, todo vetor x ∈ X tem uma única representação
x = y + z, para algum y ∈ Y e z ∈ Y .
Demonstração. Assuma que x ∈ X tem uma única representação x = y+z, com y ∈ Y ⊆ X

e z ∈ Z ⊆ X . Seja w ∈ Y ∩ Z . Logo, w = w + 0 = 0 + w, onde na primeira soma
w ∈ Y e 0 ∈ Z , enquanto que na segunda soma 0 ∈ Y e w ∈ Z (lembre-se que Y e
Z são subespaços de X , portanto o vetor zero deve pertencer a ambos subespaços). Como
qualquer vetor x ∈ X é assumido ter uma única representação x = y + z, isto implica que
w ≡ 0 e Y ∩ Z = {0}, isto é X = Y ⊕ Z . Reciprocamente, se X = Y ⊕ Z , então
Y + Z e todo vetor x ∈ X pode ser expresso como a soma y + z, para algum y ∈ Y e
z ∈ Z . Assuma que x = u + w, com u ∈ Y e w ∈ Z . Logo, temos que y + z = u + w,
ou y − u = w − z. Isto implica que y − u ∈ Y e w − z ∈ Z . Ao mesmo tempo, temos que
y − u e w − z pertencem tanto a Y como a Z . Mas por hipótese somente o vetor zero pode
pertencer à interseção de Y e Z . Portanto, y − u = 0 e w − z = 0, implicando que y = u e
w = z. Assim, x tem uma única representação como soma x = y + z.
Sejam X um espaço vetorial sobre K e Y um subespaço vetorial de X . Para dois

elementos arbitrários x, y ∈ X , a propriedade x − y ∈ Y define uma relação de equivalência.
Esta relação é reflexiva, visto que x − x ∈ Y (todo subespaço vetorial contém a origem); ela
é simétrica, visto que x − y ∈ Y implica que −(x − y) = y − x ∈ Y (se um subespaço
vetorial contém um elemento, ele contém seu inverso); ela é transitiva, visto que se x − y ∈ Y
e y − z ∈ Y então x − z = (x − y) + (y − z) ∈ Y (quando um subespaço vetorial contém
dois vetores, ele também contém a soma deles).
DEFINIÇÃO 2.3. Por espaço quociente, denotado por X /Y , entendemos o conjunto de classes
de equivalência para a relação x − y ∈ Y . Isto é, x está relacionado a y se um pode ser obtido
do outro adicionando-se um elemento de Y . A classe de elementos equivalentes a x modulo Y
é muitas vezes denotada por [x] = x + Y , a translação de Y por x, uma vez que ela é dada
por ! "
[x] = x + n | n ∈ Y .
PROPOSIÇÃO 2.1. Defina por α[x] = [αx], para todo α ∈ K, e por [x] + [y] = [x + y] as
operações de multiplicação de uma classe por um escalar e a adição de classes, respectivamente.
Então, X /Y tem uma estrutura de um espaço vetorial sobre K.
Demonstração. Com efeito, seja x + n1 um elemento qualquer de [x] e y + n2 um elemento

qualquer de [y], em que n1 , n2 ∈ Y ; então, como Y é um subespaço vetorial de X , segue
(n1 + n2 ) = n ∈ Y . Assim, (x + y) + n é um elemento de [x + y]. Logo, a soma de elementos
61
da classe [x] com elementos da classe [y] tem como resultado um elemento da classe [x + y].
Da mesma forma, seja α ∈ K; então α(x + n) = αx + αn. Novamente, sob o argumento que
Y é um subespaço vetorial de X , segue αn = n′ ∈ Y . Assim, (αx) + n′ é um elemento de
[αx]. Devemos agora checar que estas operações não dependem dos representantes escolhidos.
Por exemplo, para mostrar que soma [x] + [y] é definida sem ambiguidades, basta mostrar que
[x+y] = [u+v] se [x] = [u] e [y] = [v]. Sejam x, y, u e v vetores fixos e x+n1 , y+n2, u+n3 e
v+n4 elementos quaisquer de [x], [y], [u] e [v], respectivamente. Se [x] = [u] e [y] = [v]; então
cada elemento de [x] é um elemento de [u], o mesmo acontecendo para [y] e [v]. Suponha que
x + n1 = u + n3 e que y + n2 = v + n4 . Logo, x − u = n1 − n2 ∈ Y e y − v = n2 − n4 ∈ Y .
Note que (x+y)−(u+v) = (x−u)+(y−v). Portanto, (x+y)−(u+v) ∈ Y . Da mesma forma,
para a multiplicação por escalares αx + αn1 = αu + αn3 . Logo, αx − αu = αn3 − αn1 ∈ Y ,
que é o mesmo que α(x − u) = α(n3 − n1 ) ∈ Y . Assim, provamos que [x + y] = [u + v] e
que [αx] = [αu].
Sejam X espaço vetorial sobre um corpo K e Y = {x1 , x2 , . . . , xn } um subconjunto de

vetores do espaço vetorial X . Um vetor v ∈ X é uma combinação linear dos vetores em Y se
existir uma lista de escalares α1 , . . . , αn ∈ K tal que v = α1 x1 +α2 x2 +· · ·+αn xn . Considere
a coleção {Zi } de todos subespaços que contêm o subconjunto Y = {x1 , x2 , . . . , xn }. Esta
coleção não é vazia, uma vez que ela certamente contém X . Visto que a interseção de
subespaços vetoriais de um espaço vetorial X é novamente um espaço vetorial, existe associado
a cada subconjunto de vetores Y = {x1 , x2 , . . . , xn } de X um menor subespaço vetorial que
contém Y . Esse subsespaço é chamado o span linear de Y .
DEFINIÇÃO 2.4. Seja X um espaço vetorial sobre um corpo K. Tome um subconjunto de vetores
Y = {x1 , x2 , . . . , xn } em X . Então, o span linear de Y é o conjunto
3 4
span(Y ) = α1 x1 + α2 x2 + · · · + αn xn | αi ∈ K, xi ∈ Y , i = 1, . . . , n .
Nota 2.2. O span linear é também denominado o envelope linear de Y , ou o hull linear,
ou a cobertura linear, ou ainda a envoltória linear de Y .
PROPOSIÇÃO 2.2. Sejam X um espaço vetorial sobre um corpo K e Y = {x1 , . . . , xn } um
subconjunto de vetores do espaço vetorial X . Então, o span(Y ) é um subespaço de X .
;n ;n
Demonstração. Se u = i=1 αi xi e w = i=1 βi xi são elementos do span(Y ), então
qualquer combinação linear de u e w também pertence ao span(Y ). Com efeito, para todo
γ, µ ∈ K, segue que
6<
n 7 6<
n 7
γu + µw = γ αi xi + µ βi xi
i=1 i=1
n
< n
<
= γαi xi + µβi xi
i=1 i=1
n
<
= (γαi + µβi )xi ∈ span(Y ) .
i=1
Logo, o conjunto span(Y ) é um subespaço de X .
62
Exemplo 2.1. Seja Y um subconjunto de R2 formado pelos vetores u = 1i + 1j, v = 1i − 1j

e w = 2j. Então, span(Y ) = R2 . Com efeito, se x = αi + βj é um vetor arbitrário em R2 ,
não é difícil ver que , -
3 1
x = (α − β)u + βv + β− α w.
2 2
Por outro lado, o subconjunto Z de R2 formado pelos vetores r = 1i, w = 2j também gera
R2 , isto é, span(Z ) = R2 , uma vez que um vetor arbitrário em R2 pode ser escrito como
uma combinação linear do tipo
1
x = αr + βw .
2
Ainda, note que excluindo do conjunto Y o vetor v obtemos um novo conjunto Y ′ que também
gera R2 já que um vetor arbitrário pode ser escrito como uma combinação linear do tipo
1
x = αu + (β − α)w .
2
Nota 2.3. Em geral, um espaço vetorial possui muitos spans diferentes e muitas vezes é im-
portante termos um span linear que seja o menor possível. No caso particular do Exemplo 2.1,
deve-se notar uma diferença importante entre os spans lineares de R2 : enquanto o conjunto Y
é linearmente dependente, os conjuntos Z e Y ′ (menores que o conjunto Y ) são linearmente
independentes. Isto pode ser generalizado, imediatamente, para o espaço Rn da seguinte forma:
seja Y = {y1 , y2 , y3 , . . .} um conjunto de vetores de Rn , nem todos linearmente independen-
tes, então excluindo-se de Y qualquer vetor yn+1 que seja linearmente dependente, obtém-se
um novo conjunto menor Y ′ de vetores linearmente independentes que gera o mesmo espaço
que Y ; ou seja, span(Y ) = span(Y ′ ). Apesar de gerarem o mesmo espaço, o conjunto Y ′
tem uma vantagem em relação ao conjunto Y : todo elemento de Rn se escreve de maneira
única como uma combinação linear dos elementos de Y ′ . Assim, por trás dessa minimidade de
Y ′ comparada com Y está o conceito de base. Portanto, os spans linearmente independentes
de um espaço vetorial desempenham um papel especial uma vez que eles fornecem uma base
para o espaço.
DEFINIÇÃO 2.5 (Independência Linear). Sejam X um espaço vetorial sobre um corpo K e

Y; = {x1 , . . . , xn } um subconjunto de vetores de X . Diz-se que Y é linearmente independente
se ni=1 αi xi = 0, com α1 , α2 , . . . , αn ∈ K, implica que e α1 = α2 = · · · = αn = 0 para todo
n e x1 , x2 , . . . , xn ∈ Y .
Combinando a noção de span linear com a noção de independência linear, temos o seguinte
importante
LEMA 2.1. Sejam X um espaço vetorial sobre K e Y = {x1 , . . . , xn } um subconjunto de

vetores de X . Então Y é linearmente independente se, e somente se, w ∈ span(Y ) pode ser
escrito como uma única combinação linear dos vetores x1 , x2 , . . . , xn .
Demonstração. Assuma que para ;cada w ∈ span(Y ) exista uma lista de escalares αi ∈ K,
com i = 1, 2, . . ., tal que w = ni=1 αi xi . Isto implica, em particular, que w = 0 somente se
α1 = α2 = · · · = αn = 0. Isto mostra que Y é linearmente independente. Reciprocamente,
63
assuma que Y = {x1 , . . . , xn } é subconjunto de vetores de X , linearmente independentes.

Suponha que exista uma forma de escrever um;vetor w ∈ span(Y ) como uma combinação
linear dos vetores x1 , x2 , . . . , xn , isto é, w = ni=1 αi xi . Admita que w ∈ span(Y ;n) possa
ser escrito
;n como uma ;noutra combinação linear dos x ,
1;2x , . . . , xn , isto é, w = i=1 βi xi .
n
Logo, i=1 αi xi = i=1 βi xi . Disto segue que, w = i=1 (αi − βi )xi = 0. Mas como os
vetores x1 , x2 , . . . , xn são linearmente independentes, os coeficientes da última combinação
devem ser todos nulos. Portanto, temos que αi = βi , para todo i = 1, . . . , n, o que implica
que w ∈ span(Y ) é representado unicamente como uma combinação linear dos vetores
x1 , x2 , . . . , xn .
DEFINIÇÃO 2.6. Seja X um espaço vetorial. Um conjunto {x1 , x2 , . . . , xn } ⊂ X é chamado
uma base de Hamel de X se (i) {x1 , x2 , . . . , xn } é um subconjunto linearmente independente
de X e (ii) todo vetor x ∈ X pode ser expresso como uma combinação linear dos vetores
{x1 , x2 , . . . , xn }, isto é, se span({x1 , x2 , . . . , xn }) = X .
Combinando a definição acima com o Lema 2.1, temos o seguinte

COROLÁRIO 2.1. Se Y = {x1 , . . . , xn } é uma base de X , então cada vetor x ∈ X pode ser
escrito como uma única combinação linear dos vetores x1 , x2 , . . . , xn .
Nota 2.4. Observe que na Definição 2.6 uma combinação linear é sempre uma soma finita.
Isso significa que, mesmo que exista um número infinito de vetores na base, a noção de base
de Hamel usa combinações lineares que são somas finitas. De fato, um espaço vetorial é uma
entidade em que somas infinitas não têm qualquer significado, a não ser que a noção de limite
de uma sequência de vetores seja introduzida. Assim, se B é uma base para X e se x e
y são dois vetores distintos, devem existir vetores da base x1 , x2 , . . . , xn ∈ B e escalares
α1 , α2 , . . . , αn tais que
x = α1 x1 + α2 x2 + · · · + αn xn ,
e vetores da base w1 , w2 , . . . , wm ∈ B e escalares β1 , β2 , . . . , βm tais que
y = β1 w1 + β2 w2 + · · · + βm wm .
Ainda, deve-se enfatizar que uma base de Hamel é meramente um de muitos tipos de bases
encontradas no estudo de vários sistemas matemáticos. Ela retrata uma propriedade puramente
algébrica de espaços vetoriais lineares. Ao estudarmos espaços de Hilbert no Capítulo 3,
novamente falaremos de bases, no entanto estaremos interessados nas propriedades topológicas
de tais espaços, e a estrutura de bases topológicas é muito diferente daquela de uma base de
Hamel.
Dado um espaço vetorial X , um subconjunto Y ⊂ X composto de vetores linearmente

independentes é chamado maximal se Y não é subconjunto próprio de qualquer outro sub-
conjunto linearmente independente Y ′ ⊂ X . Neste sentido, uma base de Hamel em X é um
subconjunto linearmente independente maximal.
PROPOSIÇÃO 2.3. Todo espaço vetorial X não-trivial tem uma base de Hamel.
Demonstração. Faça com que M = {Mα }α∈A seja o conjunto de todos os subconjuntos de
vetores linearmente independentes em X . Podemos ordenar M pela inclusão. De fato, por
64
convenção, M1 ≺ M2 , se, e somente se, M1 ⊂ X , M2 ⊂ X e M1 ⊂ M2 . Isto define

uma relação de ordem parcial em X . Note que, se X ̸= {0}, então M é não-vazio,
uma vez que se 0 ̸= x é qualquer elemento de X , o conjunto consistindo somente de x
é um conjunto linearmente independente (por que?); portanto x pertence a pelo menos um
subconjunto Mα . Além disso, se {Mα }α∈A é totalmente ordenado, então Mu = ∪α∈A Mα é
um conjunto linearmente independente que contém cada Mα e é, assim, um limite superior
para a cadeia. Pelo Lema de Zorn (veja Capítulo 1), existe um elemento maximal Mm ∈
M . Vamos verificar que Mm é de fato uma base de Hamel de X . Basta considerar o
span linear de Mm , span(Mm ). Naturalmente, span(Mm ) ⊂ X . Se span(Mn ) ̸= X ,
∃ 0 ̸= x0 ∈ X \ span(Mn ). Então, Mm ∪ {x0 } seria um conjunto de vetores linearmente
independentes contendo propriamente Mm . Porém isto contradiz, a maximalidade de Mm .
Portanto, span(Mn ) = X e Mm é uma base de Hamel de X .
DEFINIÇÃO 2.7. A dimensão de um espaço vetorial X sobre K é definida como

⎧
⎪
⎨0 se X = {0}
dimK X = n se X admite uma base finita
⎪
⎩
∞ se X não admite uma base finita
!
Exemplo 2.2. (i) dimK Kn = n," (ii) dimC Cn = n, (iii) dimR Cn = 2n, (iv) seja co = (xn )n∈N ∈
Kn | (xn )n∈N converge a zero , então dimK co = ∞.
2.2 Convexidade
Um exemplo de combinação linear muito importante em um espaço vetorial está baseada no
conceito de convexidade.
DEFINIÇÃO 2.8. Seja X um espaço vetorial. Um subconjunto Y de X é chamado convexo se

para todo x, y ∈ Y a combinação linear αx + βy ∈ Y quando α " 0, β " 0 e α + β = 1.
Exemplo 2.3. O conjunto vazio é convexo. Com efeito, para mostrar que ∅ não é convexo
é preciso encontrar elementos x, y ∈ ∅ tais que a combinação z = αx + βy ∈ / ∅, com
α + β = 1. No caso do conjunto vazio é impossível encontrar tais elementos. Logo, diz-se
que o conjunto vazio é convexo por vacuidade. Também é convexo por vacuidade o conjunto
consistindo de um único ponto.
Nota 2.5.!Da Definição 2.8 segue que αx" + βy = αx + (1 − α)y, com α ∈ [0, 1]. O conjunto
[x, y] = αx + (1 − α)y | α ∈ [0, 1] é chamado o segmento de reta fechado unindo x e
y. Os pontos x e y são os pontos extremos (ou finais) de [x, y]. O conjunto [x, y] é chamado
! próprio se x ̸= y. Se"x = y, então [x, y] = {x}. Por sua vez, o
um segmento de reta
conjunto (x, y) = αx + (1 − α)y | α ∈ (0, 1) é chamado o segmento de reta aberto unindo
x e y. Se x = y, então (x, y) = ∅; ou seja, o segmento de reta aberto não tem pontos
extremos. Um z é chamado ponto interior dos segmentos de reta fechado e aberto quando
0 < α < 1. O ponto (1/2)x + (1/2)y é chamado o ponto médio das retas [x, y] e (x, y), e
está entre x e y para x ̸= y. Assim, um conjunto X é convexo se, e somente se, [x, y] ⊂ X ,
" X é estritamente convexo se o segmento de reta
quando x,!y ∈ X . Além disso, diz-se que
[x, y] = αx + (1 − α)y | α ∈ [0, 1] intercepta a fronteira de X possivelmente somente
em seus pontos extremos. Por exemplo, em R2 um círculo é estritamente convexo, mas um
65
quadrado não é. No caso do quadro, observa-se que o segmento de reta conectando quaisquer
dois vértices do quadrado está contido inteiramente na fronteira do quadrado. A natureza
geométrica do conceito de convexidade está representada na Figura 2.1:
y
y
z z
x x
Conjunto Convexo Conjunto não-Convexo
Figura 2.1: Diferença entre um conjunto convexo e um não-convexo.
LEMA 2.2. Se X e Y são conjuntos convexos, assim também são os conjuntos X ∩ Y , λX e

X +Y .
Demonstração. Prova que X ∩Y é convexo. Selecione x, y ∈ X ∩Y . Por hipótese, temos que

αx+(1−α)y ∈ X e αx+(1−α)y ∈ Y , para todo α ∈ [0, 1]. Então, αx+(1−α)y ∈ X ∩Y .
Prova que λX é convexo. Tome um λ ∈ R. Selecione x, y ∈ λX , com X sendo convexo.

Então, existem x′ , y ′ ∈ X tais que x = λx′ e y = λy ′. Visto que X é convexo, temos que
αx′ +8(1 − α)y ′ = z ′ 9∈ X , para todo α ∈ [0, 1]. Multiplicando a última equação por λ, segue
que λ αx′ +(1−α)y ′ = λz ′ ∈ λX , para todo α ∈ [0, 1], ou seja, αx+(1−α)y = z ∈ λX ,
para todo α ∈ [0, 1]). Logo, λX é convexo.
!
Prova que X + Y é convexo. Seja Z = z | z = x + y, x ∈ X , y ∈ Y . Se x1 , x2 ∈ X ,
então αx1 + (1 − α)x2 ∈ X , para todo α ∈ [0, 1].
8 Da mesma forma,
9 8se y1 , y2 ∈ Y , então
9
αy1 + (1 − α)y2 ∈ Y , para todo α ∈ [0, 1]. Logo αx1 + (1 − α)x2 + αy1 + (1 − α)y2 =
α(x1 + y1 ) + (1 − α)(x2 + y2 ) ∈ X + Y = Z . Assim, X + Y é convexo.
COROLÁRIO 2.2. A interseção arbitrária de conjuntos convexos é um conjunto convexo. Além

disto, se X e Y são conjuntos convexos; então o conjunto αX + βY é convexo, para todo
α, β ∈ R. Se X é convexo; então (α + β)X é convexo, para todo α, β ∈ R.
! "
Demonstração. Seja Xi i∈I uma família de conjuntos convexos, em que I é um conjunto de
índices. Selecione x, y ∈ ∩i Xi . Por hipótese, temos que αx + (1 − α)y ∈ Xi , para todo i ∈ I
e para todo α ∈ [0, 1]. Então, αx + (1 − α)y ∈ ∩i Xi . Portanto, ∩i Xi é convexo. A prova
da segunda parte segue do seguinte raciocínio: sendo X e Y conjuntos convexos, segue pelo
Lema 2.2 que αX e βY são conjuntos convexos, para todo α, β ∈ R. Pelo mesmo lema, segue
que a soma de dois conjuntos convexos é um conjunto convexo. Por último, defina λ = α + β,
para todo α, β ∈ R. Isto implica que λ ∈ R. Logo,(α + β)X = λX é convexo, pelo Lema
2.2, dado que X é convexo.
Menos evidente é o
66
TEOREMA 2.2. Seja Y um subconjunto convexo em X . Sejam α e β positivos. Então, αY +

βY = (α + β)Y .
Demonstração. Começamos observando que, em geral, o conjunto αY + βY é distinto do

conjunto (α + β)Y . Por outro lado, é sempre verdade que (α + β)Y ⊂ αY + βY , isto
desconsiderando-se a convexidade de Y . Por outro lado, se Y é convexo, e y = αx1 + βx2 ,
com x1 , x2 ∈ Y , então
, - , - , -
1 α β
y= x1 + x2 ∈ Y ,
α+β α+β α+β
uma vez que
α β
+ =1.
α+β α+β
8 9
Multiplicando 1/(α+β) y ∈ Y por (α+β), teremos que y ∈ (α+β)Y . Assim, αY +βY ⊂
(α + β)Y . Isto completa a prova.
TEOREMA 2.3. Sejam X um espaço vetorial e Y ⊂ X convexo. Então, toda combinação

linear convexa de vetores xi ∈ Y , com i = 1, . . . , n, em que n é arbitrário, ainda pertence a
Y.
;n
Demonstração. Queremos mostrar
;n que todo elemento x = i=1 αi xi ∈ Y , se xi ∈ Y ,
αi ∈ [0, 1] (para cada i) e i=1 αi = 1. A prova segue por indução com respeito a n. Para
n = 1 a afirmativa do teorema é certamente verdadeira. Com efeito, se n = 1, segue que
x = α1 x1 ; mas isto implica que α1 = 1 e x ∈ Y , visto que xi ∈ Y . Para n > 2, assuma que
αn ̸= 1 e que ;o teorema é verdadeiro com n substituído por n − 1. Tome βi = αi /(1 − αn ),
n−1
i < n. Então, i=1 βi = 1. De fato,
αi αi
= ,
(1 − αn ) α1 + · · · + αn−1
e
α1 αn−1
+···+ =1.
α1 + · · · + αn−1 α1 + · · · + αn−1
;n−1
Assim, i=1 βi xi ∈ Y pela hipótese de indução. Portanto,
n−1
<
x = (1 − αn ) βi xi + αn xn ∈ Y ,
i=1
;n−1
uma vez que (1 − αn ) i=1 βi + αn = 1.
DEFINIÇÃO 2.9. Dado qualquer subconjunto Y , não necessariamente convexo, no

;nespaço veto-
rial X , o conjunto composto
;n por todas as combinações lineares convexas x = i=1 αi xi , tal
que xi ∈ Y , αi " 0, i=1 αi = 1 e n arbitrário, é um conjunto que contém Y , denotado
por Ch(Y )1 e denominado o envelope convexo de Y , ou a cobertura convexa, ou ainda a
envoltória convexa de Y .
1
Ch é uma abreviação de convex hull, o termo em inglês para envelope convexo!
67
Ch(Y )
Figura 2.2: Conjunto Y e seu envelope-convexo Ch(Y )
TEOREMA 2.4. Ch(Y ) é convexo, e igual à interseção de todos os conjuntos convexos contendo
Y.
Demonstração. Vamos dividir a prova em duas etapas: na primeira etapa provamos que Ch(Y )
é um conjunto convexo. Na segunda etapa mostramos que esse conjunto é na verdade a
interseção de todos os conjuntos convexos contendo Y .
Primeira Etapa. Seja
3 n
< n
< 4
Ch(Y ) = y | y = αi xi ; xi ∈ Y ; αi " 0; αi = 1 ,
i=1 i=1
o envelope convexo de Y . Sejam y1 e y2 dois elementos de Ch(Y ). Tome z = βy1 +(1−β)y2 ,

com β " 0. Devemos mostrar que todo z expresso desta forma pertence também a Ch(Y ).
Note que z pode ser escrito da seguinte forma:
6<
n 7 6<
n 7 n
<
z=β αi xi + (1 − β) γi xi = µi xi ,
i=1 i=1 i=1
;µni = βαi + (1 − β)γi . Sendo β " 0, αi " 0 e γi " 0, segue que

assumindo por definição que
µi " 0. Resta mostrar que i=1 µi = 1. Com efeito,
n
< = > = >
µi = βα1 + (1 − β)γ1 + · · · + βαn + (1 − β)γn
i=1
6<
n 7 6<
n 7
=β αi + (1 − β) γi ≡ 1 .
i=1 i=1
Portanto, z ∈ Ch(Y ).
Segunda Etapa. Para provar que Ch(Y ) é na verdade a interseção de todos os conjuntos
convexos contendo Y , precisamos do seguinte
LEMA 2.3. Seja Y um subconjunto no espaço vetorial X . Então Y ⊂ Ch(Y ). Além disso, se
Z é qualquer subconjunto convexo de X contendo Y , então Z ⊃ Ch(Y ).
68
Demonstração. Para todo xi ∈ Y , com i = 1, . . . , n, em que n é arbitrário, temos que

xi ∈ Ch(Y ). De fato, basta tomar αj = 0, ∀j ̸= i na definição de Ch(Y ). Isto implica que
para y ∈ Ch(Y ) temos que y = xi , uma vez que, por definição, αi = 1. Logo, todo elemento
de Y é elemento de Ch(Y ). Assim, Y ⊂ Ch(Y ). Note que como Y não é necessariamente
convexo, existem elementos de Ch(Y ) que não pertencem a Y . Por outro lado, tome um
y ∈ Ch(Y ) e um z ∈ Z , em que Z é qualquer subconjunto convexo de X contendo Y .
Escreva um w qualquer como uma combinação linear convexa do tipo w = βy + (1 − β)z, com
β " 0. Como, pela ;Definição 2.9, todo elemento y ∈ Ch(Y
;n ) é escrito como uma combinação
n
linear convexa y = i=1 αi xi , com xi ∈ Y , αi " 0, i=1 αi = 1 e n arbitrário, então,
,< n -
w=β αi xi + (1 − β)z .
i=1
6; 7
n
Note que β i=1 αi + (1 − β) = 1. Mas, por hipótese, xi ∈ Y ⊂ Z e Z é convexo; então
w ∈ Z . Assim, todo elemento de Ch(Y ) pertence a Z . Portanto, Z ⊃ Ch(Y ).
Continuação da demonstração do Teorema 2.4. Tome x, y ∈ ∩i Zi . Logo, pelo Corolário

;n 2.2,
segue que
; z = αx + (1 − α)y ∈ ∩i Zi , ; com α ∈ [0, 1]. ;Agora, considere x = j=1 βj yj
e y = nj=1 γj yj , com βj " 0, γj " 0, nj=1 βj = 1 e nj=1 γj = 1, com cada yi ∈ Y .
6; 7 6; 7 ;n
n n
Assim, αx + (1 − α)y = α β y
j=1 j j + (1 − α) γ y
j=1 j j = j=1 ηj yj , em que
;n
ηj = αβj + (1 − α)γj " 0 e j=1 ηj = 1. Portanto todo z ∈ ∩i Zi também pertence ao
envelope convexo de Y . Agora, tome z ∈ Ch(Y ) tal que z ∈ / ∩i Zi . Isto significa que z
não pertence a todo Zi . Mas isto gera uma contradição, pois de acordo com o Lema 2.3 todo
elemento de Ch(Y ) deve pertencer a qualquer conjunto convexo contendo Y . Por isso, z deve
pertencer a todo Zi e portanto deve pertencer ∩i Zi . Logo, Ch(Y ) ⊂ ∩i Zi e da igualdade
entre conjuntos segue que Ch(Y ) = ∩i Zi
Segue do Teorema 2.4 e do Lema 2.3 o seguinte

COROLÁRIO 2.3. Ch(Y ) é o menor subconjunto convexo de X que contém Y .
2.3 Espaços Vetoriais Normados

A fim de desenvolver uma discussão profunda sobre espaços vetoriais de dimensão infinita,
o conceito a seguir deve ser examinado: a norma de um elemento. Primeiro, deve-se enfatizar
que os axiomas que definem um espaço vetorial (Definição 2.1) não fornecem nenhum critério
para medir a proximidade entre dois elementos em um espaço vetorial. Portanto, não temos
meios de examinar a convergência de sequências infinitas de elementos em um dado espaço
vetorial. Esse problema é resolvido pela indução de uma topologia ao espaço, que transforma o
espaço vetorial em um espaço vetorial topológico. Vários métodos podem induzir uma topologia
e diferentes topologias resultam em diferentes espaços vetoriais topológicos. Um espaço vetorial
topológico simples é chamado de espaço vetorial normado, que é um espaço vetorial dotado de
uma norma. A norma generaliza a noção de comprimento de um vetor no sentido clássico (isto
é, o comprimento de uma seta geométrica) e é convencionalmente denotada por ∥x∥ para o
vetor x. Usando a norma, a distância entre dois elementos, x e y, é representada por ∥x − y∥.
69
Essa noção de distância nos permite medir a proximidade entre os elementos e examinar a
convergência de sequências em um espaço.
Nesta seção, vamos discutir um dos conceitos centrais da análise funcional: o conceito de
espaços vetoriais normados.
DEFINIÇÃO 2.10. Um espaço vetorial normado X é um espaço vetorial X sobre K, equipado
com uma função ∥ · ∥ valorada nos reais não-negativos, isto é, ∥ · ∥ : x ∈ X → R+ , tal que
quaisquer que sejam x, y ∈ X e para todo α ∈ K as seguintes propriedades são satisfeitas:
1. ∥x∥ " 0 (positividade);
2. ∥x + y∥ # ∥x∥ + ∥y∥ (desigualdade triangular);
3. ∥αx∥ = |α|∥x∥ (homogeneidade);
4. ∥x∥ = 0 ⇒ x = 0 (separação).
Nota 2.6. Um espaço vetorial equipado com uma norma é também chamado um espaço pré-
Banach.
Nota 2.7. A Propriedade 4 pode ser derivada da Propriedade 3. Para ver isto, tome α = 0, a
Propriedade 3 nos dará ∥0∥ = 0, então a Propriedade 4 pode ser assim anunciada: ∥x∥ = 0
equivale a x = 0 (deve-se ressaltar que se ∥x∥ = 0 ̸⇒ x = 0, então a função ∥ · ∥ é chamada
seminorma). Além disso, tomando α = −1 na Propriedade 3, segue que ∥x∥ = ∥ − x∥; em
particular, tem-se ∥x − y∥ = ∥y − x∥. Por fim, note que a Propriedade 1 pode ser derivada das
Propriedades 2 e 3. De fato, tome y = −x na Propriedade 2; então segue da Propriedade 3 que
0 = ∥x − x∥ # ∥x∥ + ∥x∥ = 2∥x∥. Portanto, ∥x∥ " 0.
PROPOSIÇÃO 2.4 5(Segunda desigualdade
5 triangular). Se x, y são elementos de um espaço
vetorial X , então 5∥x∥ − ∥y∥5 # ∥x − y∥.
Demonstração. Com efeito, aplicando-se a Propriedade 2, da Definição 2.10, à igualdade x =

(x − y) + y, segue que ∥x∥ # ∥x − y∥ + ∥y∥, donde temos ∥x∥ − ∥y∥ # ∥x − y∥. Trocando-se
os papéis de x e y, segue que ∥y∥ − ∥x∥ # ∥y 5 temos ∥x∥ − ∥y∥ " −∥x − y∥.
5 − x∥, donde
Logo, −∥x − y∥ # ∥x∥ − ∥y∥ # ∥x − y∥ ⇒ 5∥x∥ − ∥y∥5 # ∥x − y∥.
TEOREMA 2.5. Todo espaço vetorial X é um espaço métrico relativamente à métrica natural
d(x, y) = ∥x − y∥ derivada da norma. Além disso, quaisquer que sejam x, y, z ∈ X e para
todo α ∈ K, tem-se a validade das seguintes propriedades:
(a) d(0, x) = ∥x∥;
(b) d(x + z, y + z) = d(x, y) (invariância por translação);
(c) d(αx, αy) = |α|d(x, y) (homogeneidade).
Demonstração. Que d(x, y) = ∥x − y∥ " 0 é5 uma consequência

5 da Proposição 2.4 e da
5 5
definição de norma. De fato, como ∥x − y∥ " ∥x∥ − ∥y∥ e como da definição de norma
70
5 5
∥x∥ ∈ R+ , segue da definição de valor absoluto de um número real que 5∥x∥ − ∥y∥5 " 0.
Além disso, ∥x − y∥ = 0 se, e somente se, x − y = 0. Portanto, x = y. Que ∥x − y∥ = ∥y − x∥
segue, como já vimos, da Propriedade 3 da norma. Com efeito, ∥x − y∥ = ∥ − (y − x)∥ =
| − 1|∥y − x∥ = ∥y − x∥. Por fim, a desigualdade triangular d(x, z) # d(x, y) + d(y, z), resulta
imediatamente do fato que ∥x − z∥ = ∥(x − y) + (y − z)∥ # ∥x − y∥ + ∥y − z∥. A Propriedade
(a) segue imediatamente da definição d(x, y) = ∥x − y∥, tomando y = 0. Já a Propriedade
(b), também é imediata: d(x + z, y + z) = ∥(x + z) − (y + z)∥ = ∥x − y∥ = d(x, y). Para
provar a Propriedade (c), note que d(αx, αy) = ∥αx − αy∥ = ∥α(x − y)∥ = |α|∥x − y∥ =
|α|d(x, y).
Nota 2.8 (Alerta). Existem espaços vetoriais métricos cuja a métrica não resulta de nenhuma
norma. Para mais detalhes, veja, por exemplo, o livro do A.E. Taylor, “Introduction to Functional
Analysis,” pg. 155, e o Exercício 2.11, no final deste capítulo!
Exemplo 2.4. Os espaços Rn e Cn são exemplos clássicos de espaços vetoriais normados.
Eles se tornam espaços vetorias normados de várias formas. Vamos tomar Rn . Considerando
uma base ortonormal {ei }i∈N em Rn , todo vetor x ∈ Rn pode ser representado pela lista
x = (a1 , . . . , an ) ∈ Rn , que são as coordenadas de x na base ortonormal {ei }i∈N ; logo
definimos
6<
n 71/p
∥x∥ = |ai |p , p"1. (2.3.1)
i=1
Quando Rn é considerado como um espaço vetorial normado, com a norma (2.3.1), denotamos
esse espaço por ℓp (n). Podemos tornar o espaço complexo Cn um espaço vetorial normado da
mesma forma.
Exemplo 2.5 (Espaços de sequências infinitas). Análogo aos espaços ℓp (n) temos os espaços
de sequências infinitas, denotados;por ℓp , em que p " 1. Estes espaços consistem de todas as
sequências x = (ai )i∈N tais que ∞ p
i=1 |ai | < ∞. A norma de ℓp é definida por
( ∞
)1/p
<
∥x∥ = |ai |p (2.3.2)
i=1
Para o caso particular em que p = 2, nos temos o espaço ℓ2 que foi primeiro estudado por
Hilbert. O espaço ℓ2 é o protótipo clássico de uma variedade de espaços de Hilbert. Com efeito,
será mostrado no Capítulo 3, Teorema 3.16, que todo espaço de Hilbert de dimensão infinita é
isomorfo ao espaço ℓ2 . Espaços de Hilbert são espaços vetoriais com uma estrutura métrica
especial, com a métrica sendo oriunda do produto interno.
2.4 Conceitos Topológicos Básicos de um Espaço Vetorial

Normado
Todo espaço vetorial normado X é, de modo natural, um espaço topológico, já que, de
acordo com o Teorema 2.5, todo espaço vetorial normado é um espaço métrico relativamente
à métrica natural derivada da norma. Portanto, em X tem sentido falar dos conceitos de
conjuntos aberto e fechado, limite, e assim por diante. Diz-se que essa topologia natural é
definida pela norma.
71
Por uma questão de completeza, os conceitos topológicos tratados no Capítulo 1 são estendi-
dos, a seguir, para os espaços vetoriais normados. Começamos com a seguinte
DEFINIÇÃO 2.11 (Bolas e vizinhanças). Sejam X um espaço vetorial normado, x0 ∈ X e
R ∋ r " 0. Então,
* o conjunto ! "
B(x0 ; r) = x ∈ X | ∥x − x0 ∥ < r ,
é chamado uma bola aberta de centro x0 e raio r,
* o conjunto ! "
B[x0 ; r] = x ∈ X | ∥x − x0 ∥ # r ,
é chamado uma bola fechada de centro x0 e raio r,
* o conjunto ! "
S(x0 ; r) = x ∈ X | ∥x − x0 ∥ = r ,
é chamado uma esfera de centro x0 e raio r e
* para x0 ∈ X , uma vizinhança de x0 é um subconjunto de X que contém uma bola

B(x0 ; δ) para algum δ > 0.
DEFINIÇÃO 2.12 (Conjuntos aberto e fechado). Sejam X um espaço vetorial normado e Y
um subconjunto de X . Então,
(i) Y é aberto se para cada x0 ∈ Y existe um δ > 0 tal que B(x0 ; δ) ⊂ Y ;
(ii) O complemento de Y é o conjunto Y c = X \ Y .
(iii) Y é fechado se o complemento Y c é aberto.
A definição acima explica como se pode verificar se um subconjunto de um espaço vetorial

normado é aberto. A fim de verificar se um subconjunto é fechado, pode-se verificar se o
complemento é aberto, ou usar o seguinte
LEMA 2.4 (Conjuntos fechados). Para um subconjunto Y de um espaço vetorial normado X
as seguintes propriedades são equivalentes:
(i) Y é fechado;
(ii) Para qualquer sequência convergente de vetores (xn )n∈N em Y , o limite x = limn→∞ xn
também pertence a Y .
Demonstração. Para provar que (i) =⇒ (ii), suponha que Y é fechado, ou seja, que Y c é
aberto. Seja (xn )n∈N uma sequência convergente de vetores em Y . Tome x = limn→∞ xn .
Vamos mostrar que x ∈ Y . Para isso, suponha o oposto, ou seja, que x ∈ Y c . Então, existe
um δ > 0 tal que B(x; δ) ⊂ Y c ; mas isso implica que xn ∈ Y c para n suficientemente
grande, o que é uma contradição. Assim, x ∈ Y , o que prova (ii).
72
Para provar que (ii) =⇒ (i), assuma que (ii) acontece. Vamos mostrar que Y é fechado,
mostrando que o complemento Y c é aberto. Tome x ∈ Y c . Queremos provar que para n ∈ N
suficientemente grande, B(x; 1/n) ⊂ Y c . Na verdade, se isso não é o caso, poderíamos para
uma infinitamente de muitos n ∈ N escolher xn ∈ B(x; 1/n) ∩ Y . Isto geraria uma sequência
de vetores xn ∈ Y convergindo para x ∈ Y c . Mas, isto contradiz a hipótese (ii)! Isto prova
que para δ > 0 suficientemente pequeno, a bola B(x; δ) está contida em Y c . Assim, Y c é
aberto, e, portanto, Y é fechado.
DEFINIÇÃO 2.13 (Conjunto denso). Diz-se que um subconjunto Y de um espaço vetorial nor-
mado X é denso em X se para todo x ∈ X e todo ε > 0 existe um vetor y ∈ Y tal que
∥x − y∥ < ε.
Se Y é um subespaço denso de X , então, todos os vetores em X podem ser aproximados

arbitrariamente por vetores em Y . De fato, dado um x ∈ X tome ε = 1/n, para n ∈ N.
Então, a condição na Definição 2.13 diz que podemos encontrar um vetor yn ∈ Y tal que
∥x − yn ∥ < 1/n . Por construção, a sequência de vetores (yn )n∈N ∈ Y convergirá para x, isto
é, yn → x, quando n → ∞.
Para um subconjunto Y de um espaço vetorial normado X , é conveniente ter uma notação

formal para o conjunto de elementos em X que podem ser aproximados arbitrariamente na
norma por vetores em Y . Isto nos leva à seguinte
DEFINIÇÃO 2.14 (Fecho). Seja Y um subconjunto de um espaço vetorial normado X . O fecho
de Y , denotado por Y , consiste de todos os vetores x ∈ X para os quais podemos encontrar
um vetor y ∈ Y tal que ∥x − y∥ < ε, para todo ε > 0.
Segue, imediatamente, do Lema 2.4 que Y é um conjunto fechado; de fato, ele é o menor
conjunto fechado em X contendo Y .
A combinação das Definições 2.13 e 2.14 nos leva ao seguinte

PROPOSIÇÃO 2.5 (Caracterização de subconjunto denso). Seja Y um subconjunto do espaço
vetorial normado X . Então, Y é denso em toda parte em X se, e somente se, Y = X .
PROPOSIÇÃO 2.6. Se X é um espaço vetorial normado, então as aplicações (i) (x, y) ∈
X × X 3→ d(x, y) = ∥x − y∥ ∈ R+ e (ii) x ∈ X 3→ ∥x∥ ∈ R+ são contínuas.
Demonstração. Uma vez que temos à nossa disposição a noção de bolas abertas para espaços
normados, sendo ∥x − y∥ uma métrica, (i) segue imediatamente do item (b) do Teorema 1.15.
Com efeito, basta mostrar que, dado ε > 0, existe um δ > 0 tal que se ∥x − x0 ∥ < δ e
∥y − y0 ∥ < δ, então ∥(x − y) − (x0 − y0 )∥ < ε. Tome δ = ε/2. Por meio das propriedades
da norma, segue que
5 5 5 5
5 5 5 5
5d(x, y) − d(x0 , y0 )5 = 5∥x − y∥ − ∥x0 − y0 ∥5
# ∥(x − x0 ) − (y − y0 )∥
# ∥x − x0 ∥ + ∥y − y0 ∥
< ε/2 + ε/2 = ε .
73
Por sua vez, (ii) segue de (i) bastando para isso tomar y = 0. Este resultado trata da
propriedade de que uma aplicação contínua de duas variáveis é parcialmente contínua em cada
variável.
O próximo resultado nos mostra que para a topologia da norma tem-se que as operações
de adição + : (x, y) ∈ X × X → x + y ∈ X e de multiplicação · : (α, x) ∈ K × X →
α · x ∈ X são contínuas.
TEOREMA 2.6. Se X é um espaço vetorial normado, então são contínuas as seguintes aplicações:
(i) (x, y) ∈ X × X 3→ x + y ∈ X ,
(ii) (α, y) ∈ K × X 3→ αx ∈ X .
Demonstração. Para provar a continuidade da adição em (x0 , y0 ) ∈ X × X , em que (x0 , y0 )

é um ponto qualquer, basta mostrar que dado um ε > 0, existe um δ > 0 tal que para todo
vetor x ∈ B(x0 ; δ) e para todo vetor y ∈ B(y0 ; δ), o vetor soma x + y ∈ B(x0 + y0 ; ε); ou
seja, dado que ∥x − x0 ∥ < δ e ∥y − y0 ∥ < δ, então ∥(x + y) − (x0 + y0 )∥ < ε. Com efeito,
tomando δ = ε/2, como na Proposição 2.6, segue que
∥(x + y) − (x0 + y0 )∥ = ∥(x − x0 ) + (y − y0 )∥
# ∥x − x0 ∥ + ∥y − y0 ∥
< ε/2 + ε/2 = ε .
Vamos, agora, provar a continuidade da multiplicação em (α0 , y0 ) ∈ K × X , quaisquer que

sejam α0 ∈ K e x0 ∈ X . Para isto, basta mostrar que dado um ε > 0, existe um δ > 0 tal
que se |α − α0 | < δ e ∥x − x0 ∥ < δ, então ∥αx − α0 x0 ∥ < ε. Com efeito,
∥αx − α0 x0 ∥ = ∥(α − α0 )x0 + α0 (x − x0 ) + (α − α0 )(x − x0 )∥
# ∥(α − α0 )x0 + α0 (x − x0 )∥ + ∥(α − α0 )(x − x0 )∥
# ∥(α − α0 )x0 ∥ + ∥α0 (x − x0 )∥ + ∥(α − α0 )(x − x0 )∥
# |α − α0 |∥x − x0 ∥ + |α0 |∥x − x0 ∥ + |α − α0 |∥x0 ∥
< δ 2 + |α0 | δ + ∥x0 ∥ δ
= δ (δ + |α0 | + ∥x0 ∥)
# δ (1 + |α0 | + ∥x0 ∥) .
Então, temos a tese se tomarmos

# %
ε
δ = inf 1, .
1 + |α0 | + ∥x0 ∥
74
PROPOSIÇÃO 2.7. Se Y é um subespaço de um espaço vetorial normado X , então Y também

é um subespaço de X .
Demonstração. Sejam x, y ∈ Y e α, β ∈ K. Então existem duas sequências

. (xn )/n∈N e (yn )n∈N
em Y tais que xn → x e yn → y. Pelo Teorema 2.6, a sequência αxn + βyn n∈N converge
para αx + βy. Além disso, αxn + βyn ∈ Y , para todo n ∈ N, pois Y é subespaço vetorial de
X . Portanto, αx + βy ∈ Y , como queríamos demonstrar.
DEFINIÇÃO 2.15 (Homeomorfismo). Sejam X e Y espaços topológicos e f uma aplicação
bijetiva contínua f : X → Y , tal que a inversa f −1 : Y → X existe e é também contínua.
Neste caso, f é chamada um homeomorfismo de X em Y .
Homeomorfismos são os “isomorfismos” de espaços topológicos.

PROPOSIÇÃO 2.8. Seja X um espaço vetorial sobre K. Tome x0 ∈ X e α ∈ K arbitrários,
porém fixos, com α ̸= 0. Então, a aplicação x ∈ X 3→ αx + x0 ∈ X é um homeomorfismo de
X sobre X .
Demonstração. Se α = 1, segue que x 3→ x + x0 é uma translação. Esta aplicação é contínua

pela primeira parte do Teorema 2.6, tomando y = x0 . Se x0 = 0, temos uma homotetia
x 3→ αx, que é contínua pela segunda parte do Teorema 2.6. A aplicação x 3→ αx + x0 é
contínua, visto ser a composição das aplicações x 3→ x + x0 e x 3→ αx, que são contínuas.
Agora, note que x = (1/α)y + (−x0 /α) = βy + y0 , com β = (1/α) e y0 = (−x0 /α), tem a
mesma forma que a aplicação dada. Logo, f (x) = αx + x0 é um homeomorfismo.
Muitas vezes encontraremos situações em que teremos definidas sobre um espaço vetorial
normado mais de uma norma. Como todo espaço normado é um espaço sobre o qual podemos
definir uma métrica (a métrica derivada da norma), então podemos também definir, de acordo
com as Proposições 1.10 e 6.2, a equivalência entre normas.
DEFINIÇÃO 2.16. Duas normas ∥ · ∥1 e ∥ · ∥2 no mesmo espaço vetorial X são equivalentes
se existir uma constante c > 0 tal que ∥ · ∥1 # c · ∥ · ∥2 e ∥ · ∥2 # c · ∥ · ∥1 .
De acordo com a definição acima, as normas ∥ · ∥1 e ∥ · ∥2 definirão a mesma topologia

sobre X .
2.5 Espaços de Banach

A noção de convergência de uma sequência em um espaço métrico pode ser estendida para
um espaço normado, uma vez que todo espaço normado é um espaço métrico, com a métrica
naturalmente oriunda da norma.
DEFINIÇÃO 2.17. Sejam X um espaço vetorial normado e (xn )n∈N uma sequência de vetores em
X . Diz-se que (xn )n∈N converge para o vetor x ∈ X se dado ε > 0, existe um N ∈ N tal que
para todo n > N, temos ∥x−xn ∥ < ε. Se xn converge para x, escrevemos limn→∞ ∥x−xn ∥ = 0,
ou limn→∞ xn = x, ou xn → x.
75
Exatamente como para o caso de sequências em um espaço métrico, dizemos que uma
sequência em um espaço vetorial normado X é de Cauchy se dado ε > 0, existe um N ∈ N
tal que para todo m, n > N, temos ∥xm − xn ∥ < ε.
PROPOSIÇÃO 2.9. Seja X um espaço vetorial normado. Toda sequência convergente em X é

de Cauchy.
Demonstração. Seja (xn )n∈N uma sequência de vetores em X . Assuma que esta sequência
converge para um vetor x ∈ X , isto é, limn→∞ xn = x. Então, dado um ε > 0, existe um N
tal que para todo n > N temos que ∥x − xn ∥ < ε/2. Isto implica que se tomarmos m, n > N
teremos que ∥xm − xn ∥ # ∥xm − x∥ + ∥x − xn ∥ < ε/2 + ε/2 = ε. Assim, limn→∞ xn = x
é de Cauchy.
COROLÁRIO 2.4. Seja X um espaço vetorial normado. Então, toda sequência de Cauchy em
X é limitada.
Demonstração. Com exceção de um número finito de vetores, que são no máximo os vetores
x1 , x2 , . . . , xN , para todos os outros vetores da sequência (xn )n∈N segue que ∥xm − xn ∥ < ε
para todo m, n > N. Tome ε = 1. Pela segunda desigualdade triangular, temos que ∥xm ∥ <
1 + ∥xn ∥, e para m > N, segue que, ∥xm ∥ < 1 + ∥xn ∥ < 1 + ∥xN ∥. Portanto, para todo m
∥xm ∥ < 1 + ∥x1 ∥ + ∥x2 ∥ + · · · + ∥xN ∥ .
Isto prova que toda sequência de Cauchy em X é limitada.
DEFINIÇÃO 2.18. Diz-se que um espaço vetorial normado X é completo, se toda sequência de
Cauchy (xn )n∈N em X converge para um elemento x ∈ X . Um espaço vetorial normado
completo é chamado um espaço de Banach, B.
Exemplo 2.6. A reta é um espaço vetorial normado unidimensional completo. Com efeito,
sendo R = Q, então o limite de toda sequência de Cauchy (xn )n∈N em R converge para
um elemento x ∈ R. O espaço Euclidiano Rn é um espaço vetorial normado n-dimensional
completo. Para ver isto, lembremos que Rn é o produto cartesiano de n fatores R, sendo
que cada fator R é um espaço vetorial normado completo. Agora, tome uma sequência de
pontos xk = (xk1 , . . . , xkn ) ∈ Rn . Cada uma das sequências de coordenadas (xki )k∈N ,
i = 1, . . . , n, é de Cauchy em cada fator R. Logo, existem os limk→∞ xki = ai . Pondo
a = (a1 , . . . , an ) ∈ R × · · · × R, temos que limk→∞ xk = a. Assim, Rn é completo. Por fim,
em virtude do fato de podermos identificar o conjunto dos números complexos C com R2 , via
a correspondência (x, y) ↔ x + iy, segue que mapamento Rn × Rn → Cn implica que Cn é
um espaço vetorial normado complexo n-dimensional completo.
TEOREMA 2.7 (Completamento de um espaço vetorial normado). Seja X um espaço vetorial

normado incompleto. Então, X pode ser estendido para um espaço de Banach B, isto é,
X = B, adicionando-se vetores apropriados, de forma que X seja um subespaço denso de B.
Demonstração. Novamente, seguiremos o texto de G. Hellwig, “Differential Operators of Mathe-

matical Physics,” Addison-Wesley, 1967. Em primeiro lugar, devemos lembrar que X é, em
particular, um espaço métrico com a distância d(x, y) = ∥x − y∥ para todo x, y ∈ X . Com o
76
método descrito no Teorema 1.13, X se torna um espaço métrico completo X . Portanto, resta
provar que a adição x + y, a multiplicação αx por um número complexo arbitrário α e a norma
∥x∥ de X podem ser continuados de X para X de forma que X se torne um espaço de
Banach.
Etapa 1. Sejam x, y dois vetores em X . Assuma que (xn )n∈N e (yn )n∈N sejam sequências
de Cauchy em X . Então, de
∥αxn − αxm ∥ = |α|∥xn − xm ∥ ,
∥(xn + yn ) − (xm + ym )∥ = ∥(xn − xm ) + (yn − ym )∥
# ∥xn − xm ∥ + ∥yn − ym ∥ ,
segue que (αxn )n∈N e (xn + yn )n∈N também são sequências de Cauchy. Os vetores do espaço
X que são definidos por estas sequências serão denotados por αx e x + y (pelo Teorema 1.13
estas definições são independentes das sequências de Cauchy escolhidas, que são consideradas
iguais em X ). Definimos, portanto, a adição e a multiplicação por número complexo em X ,
e é fácil mostrar que com estas definições X é um espaço vetorial.
Etapa 2. Para definir uma norma em X , primeiro observe que para todo x, y, z ∈ X
d(αx, αy) = ∥αx − αy∥ = |α|∥x − y∥ = |α|d(x, y) ,
d(x + z, y + z) = ∥(x + z) − (y + z)∥ = ∥x − y∥ = d(x, y) .
As relações d(αx, αy) = |α|d(x, y) e d(x + z, y + z) = d(x, y) podem ser facilmente com-
provadas como válidas em X por um processo de passar ao limite. Agora nós definimos
∥x∥ = d(x, 0) para todo x ∈ X .
Então, os três axiomas da norma são satisfeitos. Isso é óbvio para os dois primeiros; a
desigualdade triangular segue de
∥x + y∥ = d(x + y, 0) # d(x + y, y) + d(y, 0)
= d(x, 0) + d(y, 0) = ∥x∥ + ∥y∥ .
Consequentemente, X é um espaço vetorial completo, portanto, um espaço de Banach B, e

X é um subespaço denso de X = B.
Um critério útil para saber se um espaço vetorial normado é completo segue da seguinte
DEFINIÇÃO 2.19. Seja; X um espaço vetorial normado. Se (xn )n∈N é uma sequência em X ,
diz-se que a série ∞ n=1 xn converge para x, se x ∈ X e se a sequência de somas parciais
;N
sn = n=1 xn converge para x, quando N → ∞, ;∞isto é, ∥x − sn ∥ → 0, quando N → ∞.
Além disso, a série é absolutamente convergente se n=1 ∥xn ∥ < ∞.
77
TEOREMA 2.8. Um espaço vetorial normado X é completo se, e somente se, toda série absolu-
tamente convergente em X converge para um elemento em X .
;∞
Demonstração. Assuma que X é completo e que n=1 xn é uma série absolutamente conver-
gente de elementos em X . Visto que
∞
< N
< ∞
<
∥xn ∥ = ∥xn ∥ + ∥xn ∥ < ∞ ,
n=1 n=1 n=N
;∞ ;m
existe para cada ε > 0;um N tal que n=N ∥xn ∥ < ε. Tome sm = n=1 xn como sendo a
soma parcial da série ∞ n=1 xn . Então, para ℓ > m > N, segue que
?<ℓ m
< ? ?< ℓ ? < ℓ ∞
< ∞
<
? ? ? ?
∥sℓ − sm ∥ = ? xn − xn ? = ? xn ? # ∥xn ∥ # ∥xn ∥ # ∥xn ∥ < ε .
n=1 n=1 n=m n=m n=m n=N
Portanto, a sequência (sm )m∈N de somas parciais é uma sequência de Cauchy que converge
para um elemento x ∈ X , já que X é assumido ser completo.
Na sequência nos será útil o seguinte

;
LEMA 2.5. ∞ n=1 2
−n
= 1.
Demonstração. Primeiro note que, pelo teste de razão, também conhecido como critério de
D’Alembert 5 −(n+1) 5
52 5 1
lim 55 −n 55 = .
n→∞ 2 2
Assim, a série é absolutamente convergente.2 Uma vez que concluímos que a série
<∞
1 1 1 1 1
n
= + + +···+ ℓ +··· ,
n=1
2 2 4 8 2
converge, vamos provar que s = 1. Para isto, formemos a seguinte sequência de somas parciais:
1 3 7 1 1 1 2n − 1
s1 = , s2 = , s3 = ..., sn = + +···+ n = .
2 4 8 2 4 2 2n
Logo, , - , -
2n − 1 1
s = lim sn = lim = lim 1− n =1,
n→∞ n→∞ 2n n→∞ 2
o que completa a prova.
2
;∞
Pelo teste da razão, dada uma série n=1 an se existir um r tal que
5 5
5 an+1 5
lim 5 5=r ,
n→∞ 5 an 5
então, se r < 1 a série é absolutamente convergente. Se r > 1, a série diverge. Se r = 1, o teste de razão não é
conclusivo e a série pode convergir.
78
Retornemos à prova do Teorema 2.8. Assuma, reciprocamente, que toda série absolutamente
convergente em X converge para um elemento x ∈ X , e que (xn )n∈N é de Cauchy em X .
Então, para cada inteiro positivo j, existe um inteiro positivo nj tal que ∥xn − xm ∥ < 2−j para
todo n, m > nj . Escolha os inteiros nj de tal forma que nj+1 > nj . Para esta escolha, geramos
uma subsequência (xnk )k∈N de (xn )n∈N . Considerando y1 = xn1 e yj = xnj − xnj−1 , para
;
j > 1, obtemos uma série cuja a k-ésima soma parcial é xnk , isto é, kj=1 yj = xnk . Note que,
yj = xnj − xnj−1 implica que ∥yj ∥ < 2−j+1, se j > 1. Além disso, temos que a subsequência
(xnk )k∈N convergente. Com efeito, fazendo k → ∞, segue que
?<∞ ? < ∞ ∞
<
? ?
lim ∥xnk ∥ = ? yj ? # ∥yj ∥ = ∥y1 ∥ + ∥yj ∥
k→∞
j=1 j=1 j=2
∞
<
< ∥y1 ∥ + 2−j
j=1
= ∥y1 ∥ + 1 < ∞ .
; ; ;∞
Estamos usando o fato que ∞ j=2 2
−j+1
= ∞ −j
j=1 2 . Assim, o limk→∞ xnk = j=1 yj existe,
e por hipótese este limite é um elemento x em X . Resta mostrar que xn → x. Visto que
(xn )n∈N é assumida ser de Cauchy, dado ε > 0, existe um N tal que ∥xn − xm ∥ < ε/2
para todo n, m > N. Uma vez que xnk → x, existe K tal que para todo k > K temos
∥x − xnk ∥ < ε/2. Tomando nk > N, então
∥x − xn ∥ # ∥x − xnk ∥ + ∥xnk − xn ∥ < ε/2 + ε/2 = ε .
Assim, para todo n > N, temos ∥x − xn ∥ < ε, e portanto xn → x. Isto completa a prova.
2.6 Espaços Vetoriais Topológicos Localmente Convexos

Espaços de Banach são exemplos concretos de espaços vetoriais topológicos, com a topologia
tendo a propriedade adicional que todo ponto tem uma base de vizinhanças constituida de
conjuntos absolutamente convexos (veja a Definição 2.23 abaixo).
DEFINIÇÃO 2.20. Diz-se que um espaço vetorial topológico X é um espaço localmente convexo
se existe uma base de vizinhanças em X constituida de conjuntos convexos.
Nota 2.9. Em geral, a estrutura topológica na teoria dos espaços vetoriais topológicos é defi-
nida especificando-se vizinhanças da origem ao invés de conjuntos abertos.3 Aprendemos da
Proposição 2.8 que, para cada elemento x0 em um espaço vetorial X , o operador translação
Tx0 (x) = x + x0 é um homeomorfismo de X sobre X . Como consequência disso, toda topo-
logia τ sobre um espaço vetorial é invariante sob translações: um conjunto C ⊂ X é aberto
se, e somente se, cada um de seus transladados x0 + C é aberto. Assim, τ
é completamente
determinada por qualquer base local. No contexto de um espaço vetorial o termo base local
significará sempre uma base local da origem. De fato, por causa da invariância por translações
3
Lembre-se que uma vizinhança de um ponto não precisa ser necessariamente um conjunto aberto: V é uma
vizinhança de x se V contém um conjunto aberto U tal que x ∈ U ; equivalentemente, lembramos que, V é uma
vizinhança de x se x é um ponto interior de V .
79
τ
de , se C é uma vizinhança da origem, x0 + C é a correspondente vizinhança de x0 , e
x ∈ x0 + C se, e somente se, x − x0 ∈ C. Com isso, a definição acima pode ser substituída
pela seguinte
DEFINIÇÃO 2.20a. Diz-se que um espaço vetorial topológico X é um espaço localmente convexo
se toda vizinhança da origem contém uma vizinhança convexa da origem. Ou seja, para todo
V ∈ N0 , em que N0 é uma família de vizinhanças do vetor 0, existe U ∈ N0 , com U sendo
convexo, tal que U ⊂ V .
DEFINIÇÃO 2.21. Seja X um espaço vetorial sobre K.
• Um subconjunto C de X é chamado simétrico se x ∈ C implica que −x ∈ C, isto é, se

−C ⊂ C. Naturalmente, isto é equivalente a dizer que −C = C.
• Um subconjunto C de X é chamado absorvente se para todo x ∈ X existe um α ∈ R,

com α > 0, tal que λx ∈ C, para todo λ ∈ K, se |λ| # α.
• Um subconjunto C de X é chamado equilibrado (ou balanceado, ou circular) se para

todo x ∈ C, temos que αx ∈ C (que é o mesmo que dizer que αC ⊂ C) se |α| # 1, com
α ∈ K.
Nota 2.10. A interseção de conjuntos equilibrados é equilibrado. A envoltória balanceada de

C é a interseção de todos os conjuntos balanceados contendo C. Além disso, um conjunto
equilibrado é simétrico e contém o vetor 0.
PROPOSIÇÃO 2.10.
! Seja X um espaço
" vetorial normado e c qualquer número positivo. Então o
conjunto M = x ∈ X | ∥x∥ # c satisfaz as seguintes propriedades:
(i) M ∋ 0,
(ii) M é convexo: se x, y ∈ M e α ∈ [0, 1], então xα + (1 − α)y ∈ M,
(iii) M é equilibrado: se x ∈ M e |α| # 1, então αx ∈ M,
(iv) M é absorvente: para todo x ∈ X e para todo α " 1, segue que α−1 x ∈ M,
! "
(v) ∥x∥ = inf αc | α " 1, α−1x ∈ M .
Demonstração. A propriedade (i) segue imediatamente da propriedade 4 da Definição 2.10

(definição de norma). (ii) Para x, y ∈ M e α ∈ [0, 1], segue que
∥αx + (1 − α)y∥ # ∥αx∥ + ∥(1 − α)y∥ = α∥x∥ + (1 − α)∥y∥
# αc + (1 − α)c = c .
(iii) Da propriedade de homogeneidade da Definição 2.10 segue que ∥αx∥ = |α|∥x∥ #

1 · ∥x∥ # c. (iv) Também da propriedade de homogeneidade, da Definição 2.10, temos que
∥α−1 x∥ = α−1 ∥x∥ # α−1 c # c, para todo α " 1.! (v) Como α−1 x ∈ M,"para todo α " 1,
então, ∥α−1x∥ # c ⇒ ∥x∥ # αc. Logo, ∥x∥ = inf αc | α " 1, α−1x ∈ M .
80
O próximo teorema mostra que podemos sempre encontrar uma base de vizinhanças da
origem (ou do vetor nulo) de tal forma que uma topologia pode ser construida para um espaço
vetorial normado.
TEOREMA 2.9. Seja X um espaço vetorial normado. Sejam a ∈ X e Na , N0 famílias de vizi-
nhanças de a e do vetor nulo, respectivamente. Então, as seguintes propriedades são satisfeitas:
(a) Na = a + N0 .
(b) V ∈ N0 e V ⊂ V1 implica que V1 ∈ N0 .
(c) V1 , . . . , Vn ∈ N0 implica que ∩ni=1 Vi ∈ N0 .
(d) V ∈ N0 implica que existe U ∈ N0 tal que U + U ⊂ V .
(e) N0 é invariante sob homotetias.
(f ) Todo V ∈ N0 é absorvente.
(g) Existe um sistema fundamental de vizinhanças balanceadas do vetor nulo.
Antes de provarmos o Teorema 2.9, vamos tornar mais precisa a definição de vizinhanças
dada no Capítulo 1.
DEFINIÇÃO 2.22. Seja X um conjunto. Um sistema de vizinhanças de um elemento x ∈ X é
uma família Nx não-vazia de subconjuntos de X satisfazendo as seguintes propriedades:
(i) V ∈ Nx implica que x ∈ V .
(ii) Se U ∈ Nx e V ⊃ U, então V ∈ Nx .
(iii) V1 , . . . , Vn ∈ Nx , então ∩ni=1 Vi ∈ Nx .
(iv) Se U ∈ Nx , então existe V ⊂ U e V ∈ Nx tal que U ∈ Ny para qualquer y ∈ V .
(v) X ∈ Nx para qualquer x ∈ X .

Nota 2.11. As propriedades (i) − (v) acima, de certo modo, nos permite definir uma topologia a
partir de vizinhanças. De fato, se X é um conjunto e Nx uma família de vizinhanças associada
à cada x ∈ X satisfazendo as propriedades (i) − (v) acima, então se definirmos que U ⊂ X
é aberto, deve existir V ∈ X tal que V ⊂ U quando x ∈ U, Assim, X torna-se um espaço
topológico.
Demonstração do Teorema 2.9. Vamos começar lembrando, do Teorema 2.5, que todo espaço
vetorial normado é um espaço métrico. Então, como definido no Capítulo 1, toda vizinhança V
do vetor nulo contém uma bola aberta
3 4
B∥ · ∥ (0; ε) = y ∈ X | ∥y∥ < ε .
81
Portanto, definimos
3 4
N0 = V ⊂ X | V ⊃ B∥ · ∥ (0; ε), para algum ε > 0 .
Propriedade (a). Em primeiro lugar, observamos que, pela Proposição 2.8, a translação
x 3→ x + a estabelece um homeomorfismo de B∥ · ∥ (0; ε) sobre B∥ · ∥ (a; ε), em que
3 4
B∥ · ∥ (a; ε) = y ∈ X | ∥y − a∥ < ε .
Em outras palavras, ao “enviármos” o vetor nulo para o vetor a por uma translação, “enviamos”
também toda vizinhança V ∈ N0 para uma vizinhança U ∈ Na . Então, segue que a família
de vizinhanças do vetor a, definida por
3 4
Na = U = a + V ⊂ X | U ⊃ B∥ · ∥ (a; ε), para algum ε > 0 ,
!
é composta precisamente
" por translações das vizinhanças do vetor nulo, em que U = y ∈
X | y = x + a, x ∈ V . Isto naturalmente implica que Na = a + N0
Propriedades (b) e (c). (b) e (c) seguem imediatamente da definição de vizinhanças.
Propriedade (d). Por U + U deve-se entender o conjunto de elementos

3 4
U + U = z ∈ X | z = x + y, x, y ∈ U .
Seja V ∈ N0 . Da definição de vizinhanças, existem U1 , U2 ∈ N0 tais que U1 ⊂ V , U2 ⊂ V e

+ : U1 × U2 → U1 + U2 ⊂ V . Tome U = U1 ∩ U2 . Logo, U ⊂ V . Isto, por sua vez, implica
que U + U ⊂ U1 + U2 ⊂ V .
Propriedade (e). Pela Proposição 2.8, a homotetia x → (ε′ /ε)x estabelece um homeomor-
fismo entre as bolas abertas B∥ · ∥ (0; ε) e B∥ · ∥ (0; ε′ ) em V ⊂ X . Isto significa multiplicar
todos os vetores por ε′ /ε de modo que todos vetores de comprimento < ε passem a ter
comprimento < ε′ . De fato,
x′ = (ε′/ε)x ⇒ ∥x′ ∥ = ∥(ε′/ε)x∥ = (ε′ /ε)∥x∥ < (ε′ /ε) · ε = ε′ .

Portanto, N0 é invariante por homotetias.
Propriedade (f ). Sejam x ∈ X e V ⊂ X . Como V ⊃ B∥ · ∥ (0; ε), para algum ε > 0, então

tomando α < ε e multiplicando x por λ tal que |λ| # α, teremos que λx ∈ B∥ · ∥ (0; ε) ⊂ V .
De fato, definindo λ = ∥x′ ∥/∥x∥, o vetor x′ = λx terá comprimento |λ| # α < ε.
Propriedade (g). (g) segue do fato que uma bola B∥ · ∥ (0; 1) é balanceada. Com efeito,
assuma que B∥ · ∥ (0; 1) ⊂ V . Tome λ = 1 − ∥x∥ para todo x ∈ B∥ · ∥ (0; 1). Assim, se x ∈ X ,
então λx ∈ B∥ · ∥ (0; 1) ⊂ V .
TEOREMA 2.10. Suponha que X seja um espaço vetorial normado. Assuma que N0 seja uma
família de vizinhanças do vetor nulo satisfazendo as propriedades do Teorema 2.9. Então, existe
uma única topologia para X tal que X é um espaço vetorial topológico com N0 , como uma
base em 0.
82
Demonstração. Para provar que X é um espaço vetorial topológico, basta verificar que N0 é um
sistema de vizinhanças de 0, uma vez que pelo Teorema 2.6 a soma de vetores e a multiplicação
de vetores por escalares são aplicações contínuas. Vamos mostrar que as propriedades provadas
no Teorema 2.9 implicam que as propriedades da Definição 2.22 são satisfeitas.
(a) ⇒ (i). Seja U ∈ Na , então, U = a + V , com V ∈ N0 . Logo, se U ∈ Na ⇒ U ⊃

B∥ · ∥ (a; ε) ∋ a. Da mesma forma, segue que, como V = U − a ∈ N0 ⇒ V ⊃ B∥ · ∥ (0; ε) ∋ 0.
(a) e (b) ⇒ (i). Se U ∈ Na e U1 ⊃ U, então como U ⊃ B∥ · ∥ (a; ε) ⇒ U1 ⊃

B∥ · ∥ (a; ε) ⇒ U1 ∈ Na . Mas, como U1 ⊃ U ⇒ U1 − a ⊃ V ⊃ B∥ · ∥ (0; ε), de onde se conclui
que U1 − a ∈ B∥ · ∥ (0; ε).
(a) e (c) ⇒ (iii). Se U1 , . . . , Un ∈ Na , então U1 ⊃ B∥ · ∥ (a; ε1 ), . . . , Un ⊃ B∥ · ∥ (a; εn ).

! "
Tome ε = min ε1 , . . . , εn . Daí segue que U1 ⊃ B∥ · ∥ (a; ε), . . . , Un ⊃ B∥ · ∥ (a; ε) ⇒
∩ni=1 Ui ⊃ B∥ · ∥ (a; ε). Mas isto implica que ∩ni=1 (Ui − a) ⊃ B∥ · ∥ (0; ε). Logo, temos que
∩ni=1 (Ui − a) = ∩ni=1 Vi ∈ N0 , em que V1 , . . . , Vn ∈ N0 .
(a) ⇒ (iv). Se U ∈ Na ⇒ U ⊃ B∥ · ∥ (a; ε); assim B∥ · ∥ (a; ε) ∈ Na . Por outro lado, para
todo y ∈ B∥ · ∥ (a; ε) temos que U ⊃ B∥ · ∥ (y; δ), desde que δ < ε − d(a, y). Logo, U ∈ Ny .
. /
Da mesma forma, para todo y − a ∈ B∥ · ∥ (0; ε) temos U − a ⊃ B∥ · ∥ (y − a); δ , desde que
. /
δ < ε − d 0, (y − a) . Assim, U − a ∈ Ny−a se U − a ∈ N0 .
(f ) e (g) ⇒ (v). Isto é imediato.
Finalmente, a unicidade segue dos seguintes fatos: primeiro, sendo N0 uma base em 0 ∈ X ,
a família de conjuntos x0 + V , em que V varia sobre N0 , é uma base em x0 ; segundo, uma
vez que temos à nossa disposição uma base, esta determina sua topologia univocamente, já que
todo aberto da topologia pode ser escrito como a união de elementos da base.
TEOREMA 2.11. Seja X um espaço vetorial topológico. Então as seguintes condições são equi-
valentes:
(i) X é T1 (ou Tychonoff).

*! "
(ii) {0} = V | V ∈ N0 .
(iii) X é T2 (ou Hausdorff).
Demonstração. (i) ⇒ (ii). Seja y ∈ X , tal que y ̸= 0. Como, por

*! hipótese, X é"T1 , existem
U !∈ Ny e V ∈
* " N0 tais que 0 ∈ / U e y ∈ / V . Logo, y ∈
/ V | V ∈ N0 . Portanto,
V | V ∈ N0 = {0}.
(ii) ⇒ (iii). Devemos mostrar que para todo y ∈ X , y ̸= 0, existe U ∈ N0 tal que
U ∩ (y + U) = ∅. Se (ii) acontece, então existe V ∈ N0 tal que y ∈ / V . Por ser X um
espaço vetorial topológico, existe U ∈ N0 , U balanceada, tal que U + U ⊂ V . Suponha que
U ∩ (y + U) ̸= ∅; então existe x ∈ U ∩ (y + U) de modo que x ∈ U e x = y + z, com
z ∈ U. Logo, y = x − z ∈ U − U = U + U ⊂ V , por ser U balanceada. Mas isto contradiz o
83
fato que y ∈
/ V . Portanto, X é T2 (ou Hausdorff).
(iii) ⇒ (i). Por hipótese, para todo y ∈ X , y ̸= 0, existe U ∈ N0 tal que U ∩(y+U) = ∅.
Mas isto implica que y ∈
/U e0∈ / (y + U). Logo, X é T1 (ou Tychonoff).
DEFINIÇÃO 2.23. Diz-se que o conjunto X é absolutamente convexo se ele é convexo e
balanceado; isto é, para todo x, y ∈ X , αx + βy ∈ X , quando |α| + |β| # 1.
Algumas propriedades úteis de conjuntos absolutamente convexos estão resumidas no

LEMA 2.6. Suponha que X seja um conjunto, não-vazio, absolutamente convexo. Então,
(i) 0 ∈ X .
(ii) αX ⊆ βX , quando |α| # |β|.

; . / 6; 7
(iii) 1#i#n αi X = 1#i#n |αi | X .
Demonstração. (i). Seja x ∈ X . Então, 0 = (1/2)x + (−1/2)x ∈ X .

5 5
(ii). Se β = 0, então αX = βX = {0}. Se β ̸= 0 e x ∈ X , então 5(α/β)5 # 1 e
(α/β)x ∈ X , uma vez que X é equilibrado. Portanto, αx ∈ βX , e assim αX ⊆ βX .
. /
(iii). O caso n = 1 é trivial. Para n = 2,. basta provar
/ que αX + βX = |α| + |β| X,
uma vez que, sendo X convexo, temos que |α| + |β| X ⊂ |α|X + |β|X .
PROPOSIÇÃO 2.11. Se X é um espaço vetorial topológico localmente convexo, a origem tem um
sistema fundamental de vizinhanças absolutamente convexas.
Demonstração. Seja V ∈ N0 . Visto que X é localmente convexo, existe U1 ∈ N0 , U1 convexo,

tal que U1 ⊂ V . Como X é um espaço vetorial topológico, existe uma vizinhança balanceada
U2 da origem tal que U2 ⊂ U1 (veja Propriedade (g) do Teorema 2.9). Seja U = Ch(U2 ); então
U é convexo (veja Teorema 2.4), balanceado e U ⊂ U1 ⊂ V . Além disso, U é uma vizinhança
da origem, já que U ⊃ U2 (veja Lema 2.3).
TEOREMA 2.12. Seja X um espaço de Banach. Então, X é um espaço vetorial topológico
localmente convexo e Hausdorff.
Demonstração. A prova é imediata, basta tomar uma família de vizinhanças V de 0 como sendo
bolas abertas B∥ · ∥ (0; ε), para algum ε > 0.
Vamos finalizar esta seção com a seguinte importante

DEFINIÇÃO 2.24. Seja X um espaço vetorial topológico localmente convexo. Diz-se que X
é localmente compacto quando o vetor nulo possui uma vizinhança compacta. Em outras
palavras, X é localmente compacto se, e somente se, toda vizinhança do vetor nulo tem fecho
compacto.
84
No Capítulo 3 (Teorema 3.15) mostraremos que todo espaço vetorial topológico localmente
convexo, X , é localmente compacto, se X tem dimensão finita. Em particular, apesar de não
serem compactos (cf. Exercício 1.40), os espaços euclidianos Rn e Cn são localmente compactos,
já que a bola unitária é compacta em Rn e Cn .
85
Capítulo 3
Espaços de Hilbert
“A física é importante demais para ser deixada para os físicos.”
D. Hilbert
Até agora, em ordem crescente de especialização, falamos sobre espaços topológicos, espaços
métricos, espaços vetoriais normados e espaços de Banach. Nosso objetivo neste capítulo
é estudar classes de espaços que são equipados, além das estruturas topológica e algébrica,
com uma estrutura adicional, principalmente de natureza geométrica, o que permite abstrações
de termos como direção e ortogonalidade de vetores. Estaremos interessados no estudo dos
espaços de Hilbert, um caso particular de espaços de Banach. Espaços de Hilbert representam
a generalização natural do conceito de espaços euclidianos. Assim como no caso dos espaços
de Banach, veremos que a estrutura topológica de um espaço de Hilbert é derivada a partir de
uma norma, que por sua vez é derivada de um produto interno. Isto faz com que os espaços
de Hilbert desempenhem um papel de destaque na Física-Matemática, em particular na Física
Quântica.
3.1 Espaços Pré-Hilbert

Assim como no caso dos espaços euclidianos, o conceito de norma de um vetor em um
espaço de Hilbert é introduzido através de um produto interno, também chamado produto
escalar.
DEFINIÇÃO 3.1 (Produto interno). Seja H um espaço vetorial sobre o corpo K. A função ⟨ · , · ⟩
valorada em K, isto é, ⟨ · , · ⟩ : (x, y) ∈ H × H → K é chamada um produto interno se as
seguintes propriedades são satisfeitas:
87
Espaços de Hilbert
(P I1) Condição de positividade. ⟨x, x⟩ " 0 para todo x ∈ H e ⟨x, x⟩ = 0 se, e somente
se, x = 0.
(P I2) Condição de linearidade. ⟨z, αx + βy⟩ = α⟨z, x⟩ + β⟨z, y⟩, para todo x, y, z ∈ H
e para todo α, β ∈ K.
(P I3) Condição de Hermiticidade. ⟨y, x⟩ = ⟨x, y⟩, para todo x, y ∈ H .
O espaço vetorial H equipado com um produto interno é chamado um espaço pré-Hibert.

Nota 3.1. Naturalmente, em qualquer subespaço M de H existe um produto escalar induzido,
definido pela restrição do produto escalar original em H a M, isto é, ⟨ · , · ⟩|M .
Segue da Definição 3.1 o seguinte

COROLÁRIO 3.1. Para todo x, y, z ∈ H e para todo α, β ∈ K vale
(P I2′) ⟨αx + βy, z⟩ = α⟨x, z⟩ + β⟨y, z⟩.
Demonstração. O resultado é uma consequência imediata da cambinação de (P I2) e (P I3).

De fato,
⟨αx + βy, z⟩ = ⟨z, αx + βy⟩ = α ⟨z, x⟩ + β ⟨z, y⟩ = α ⟨x, z⟩ + β ⟨y, z⟩ .
Nota 3.2. Por causa das condições (P I2) e (P I2′), convenciona-se dizer que o produto interno
é linear no segundo argumento e conjugado linear (ou anti-linear) no primeiro argumento. Esta
é a convenção usualmente adotada pelos físicos. Entre os matemáticos, a linearidade é assumida
ser no primeiro argumento.
Exemplo
;n 3.1. Sobre o espaço euclidiano Kn o produto interno;n é definido por ⟨x, y⟩ =
n n
i=1 xi yi . Em particular, se K = R temos que ⟨x, y⟩ = i=1 xi yi .
Exemplo 3.2. Sobre o espaço vetorial C(I, K), composto pelas funções contínuas sobre o
intervalo I = [a, b] com valores em K, o produto interno é definido por:
$ b
⟨f , g⟩ = f (x)g(x) dx .
a
Com efeito, se f = g, então

$ $ b5
b 5
⟨f , f ⟩ = f (x)f (x) dx = 5f (x)52 dx .
a a
Logo, ⟨f , f ⟩ = 0 se, e somente se, f (x) = 0. Além disso,

$ b
. /
⟨f , αg + βh⟩ = f (x) αg(x) + βh(x) dx
a
$ b $ b
=α f (x)g(x) + β f (x)h(x) dx
a a
= α ⟨f , g⟩ + β ⟨f , h⟩ .
88
Espaços de Hilbert
Por fim, note que

$ b $ b
⟨f , g⟩ = f (x)g(x) dx = g(x)f (x) dx .
a a
DEFINIÇÃO 3.2. Seja H um espaço pré-Hilbert. Diz-se que dois vetores x, y ∈ H são orto-
gonais (condição denotada por x ⊥ y) se, e somente se, ⟨x, y⟩ = 0. Diz-se que uma família
{xi }i∈I de vetores em H é ortonormal se, e somente se, ⟨xi , xj ⟩ = δij , para todo i, j perten-
cendo ao conjunto de índices I. Aqui, δij é o delta de Kronecker, isto é, δij = 1 se i = j e δij = 0
se i ̸= j.
1
DEFINIÇÃO 3.3. Seja H um espaço pré-Hilbert. A função x 3→ ∥x∥ = ⟨x, x⟩ 2 é o comprimento
do vetor x ∈ H . Por causa de (P I1), ∥x∥ ∈ [0, ∞[.
Segue das Definições 3.2 e 3.3 o seguinte

COROLÁRIO 3.2. Sejam H um espaço pré-Hilbert e {xi }i∈I uma família de vetores ortonormais
em H . Então, ∥xi ∥ = 1, para todo i ∈ I.
TEOREMA 3.1 (Teorema de Pitágoras). Seja H um espaço pré-Hilbert. Se {xi }i∈I é uma
família de vetores ortonormais em H , então para cada x ∈ H a seguinte identidade acontece:
n
< 5 52 ?
?
n
< ?2
?
2
∥x∥ = 5 5
⟨xi , x⟩ + ?x − ⟨xi , x⟩xi ? .
i=1 i=1
A prova deste teorema é facilmente alcançada se levarmos em conta a seguinte propriedade

de um conjunto ortonormal.
LEMA 3.1. Sejam H um espaço pré-Hilbert e {x1 , x2 , . . . , xn } um conjunto de vetores ortonor-
mais em H . Então, para qualquer vetor x ∈ H , o vetor
z = x − ⟨x1 , x⟩x1 − ⟨x2 , x⟩x2 − · · · − ⟨xn , x⟩xn , (3.1.1)
é ortogonal a cada um dos vetores xi , para i = 1, . . . , n.
Demonstração. Vamos calcular o produto interno de xi com z, para i = 1, . . . , n.

@ 6<
n 7A
⟨xi , z⟩ = ⟨xi , x⟩ − xi , ⟨xj , x⟩xj
j=1
n
<
= ⟨xi , x⟩ − ⟨xj , x⟩⟨xi , xj ⟩
j=1
n
<
= ⟨xi , x⟩ − ⟨xj , x⟩ δij = ⟨xi , x⟩ − ⟨xi , x⟩ = 0 .
j=1
Portanto, o vetor z, definido por (3.1.1), é ortogonal a cada um dos vetores ortonormais do
conjunto {x1 , x2 , . . . , xn } em H .
89
Espaços de Hilbert
Demonstração do Teorema 3.1. Tome x ∈ H . Considere os vetores

n
<
y= ⟨xi , x⟩xi e z =x−y .
i=1
Pelo Lema 3.1 z ⊥ y. Além disso, o vetor x é igual à soma do vetor y, que está contido no
espaço gerado pela família {xi }i∈I de vetores ortonormais em H , e do vetor z que é ortogonal
à este espaço. Logo,
∥x∥2 = ⟨(y + z), (y + z)⟩
= ⟨y, y⟩ + ⟨y, z⟩ + ⟨z, y⟩ + ⟨z, z⟩
= ∥y∥2 + ∥z∥2
@6<
n 7 6<
n 7A ? n
< ?2
? ?
= ⟨xi , x⟩, xi , ⟨xj , x⟩, xj + ?x − ⟨xi , x⟩xi ?
i=1 j=1 i=1
n <
< n ? n
< ?2
? ?
= ⟨xi , x⟩⟨xj , x⟩ δij + ?x − ⟨xi , x⟩xi ?
i=1 j=1 i=1
n
< 5 52 ?
?
n
< ?2
?
= 5 5
⟨xi , x⟩ + ?x − ⟨xi , x⟩xi ? .
i=1 i=1
Isto completa a prova.
Segue imediatamente do teorema acima o seguinte resultado:

COROLÁRIO 3.3. Seja H um espaço pré-Hilbert. Então, (i) se {xi }i∈I é uma família de vetores
ortogonais em H , segue que,
?< n ?2 < n
? ?
? xi ? = ∥xi ∥2 .
i=1 i=1
(ii) Se {xi }i∈I é uma família de vetores ortonormais em H , segue que

?< n ?2
? ?
? xi ? = n .
i=1
Demonstração. Prova-se (i) por recorrência:

?< n ?2 ? <n ?2 @6 n
< 7 6 n
< 7A
? ? ? ?
? xi ? = ?x1 + xi ? = x1 + xi , x1 + xi
i=1 i=2 i=2 i=2
@6<
n 7 6<
n 7A
= ⟨x1 , x1 ⟩ + xi , xi
i=2 i=2
?<n ?2
2? ?
= ∥x1 ∥ + ? xi ? .
i=2
90
Espaços de Hilbert
Aqui, usamos o fato que

@ 6<
n 7A @6<
n 7 A
x1 , xi = xi , x1 = 0 ,
i=2 i=2
uma vez que x1 ⊥ xi , para todo i = 2, . . . , n. Repetindo passo-a-passo o raciocínio acima

obtemos que
?<n ?2 ?<n ?2
? ? 2 2 ? ?
? xi ? = ∥x1 ∥ + ∥x2 ∥ + ? xi ?
i=1 i=3
..
.
= ∥x1 ∥ + · · · + ∥xn−2 ∥2 + ∥(xn−1 + xn )∥2
2
= ∥x1 ∥2 + · · · + ∥xn−2 ∥2 + ⟨xn−1 , xn−1 ⟩ + ⟨xn , xn ⟩

n
<
= ∥xi ∥2 ,
i=1
já que ⟨xn−1 , xn ⟩ = ⟨xn , xn−1 ⟩ = 0.
A prova de (ii) é imediata, bastando-se para isto combinar (i) e o Corolário 3.2. De fato,
para ∥xi ∥ = 1, i = 1, . . . , n, segue que
?< n ?2
? ?
? xi ? = B1 + 1 + 1CD+ · · · + 1E = n · 1 = n .
i=1
n fatores 1
PROPOSIÇÃO 3.1. Sejam H um espaço pré-Hilbert e {xi }i∈I uma família (enumerável ou
não) de vetores ortonormais em H . Então, {xi }i∈I é uma família de vetores linearmente
independentes.
Demonstração. Basta tomar um conjunto finito desta família de;vetores. Com efeito, seja {αi }i∈I
uma família de elementos de K. Para um conjunto finito, se ni=1 αi xi = 0, então
?<n ?2 n
<
? ?
0=? αi xi ? = ⟨(α1 x1 + · · · + αn xn ), (α1 x1 + · · · + αn xn )⟩ = |αi |2 .
i=1 i=1
Aqui, recorremos à ortonormalidade dos vetores xi . Logo, αi = 0, para todo i.

DEFINIÇÃO
;∞ 3.4. Seja x1 , x2 , . . . uma sequência infinita em H . Diz-se que a série infinita
n=1 αn xn converge, e o vetor s ∈ H é dito ser a sua soma, se a sequência de somas parciais
PROPOSIÇÃO 3.2 (Desigualdade de Bessel). Sejam H um espaço pré-Hilbert e {xi }i∈I uma
família contável (isto é, I é finito ou I = N) de vetores ortonormais em H . Então, para todo
x ∈ H a seguinte estimativa acontece:
n
< 5 5
5⟨xi , x⟩52 # ∥x∥2 .
i=1
91
Espaços de Hilbert
Demonstração. Seja I finito. Pelo teorema de Pitágoras, segue que

n
< 5 5
sn = 5⟨xi , x⟩52 # ∥x∥2 .
i=1
Assim, para I finito a desigualdade é satisfeita. Se I = N, isto é, se n = +∞, note que

(sn )n∈N é uma sequência crescente monótona, limitada por ∥x∥2 , ou seja, sn # ∥x∥2 , para
(n = 1, 2, 3, . . .). Sejam E o conjunto de valores de (sn )n∈N e s # ∥x∥2 o supremo de E.
Então, para cada ε > 0 (arbitrário) existe um inteiro N tal que s − ε < sN # s, pois, em
caso contrário, s − ε seria uma cota superior de E. Como (sn )n∈N é uma sequência crescente,
temos que para n " N, s − ε < sn # s, o que prova que essa sequência converge para um
número menor ou igual a ∥x∥2 . Assim,
∞
< 5 5
5⟨xi , x⟩52 = lim sn # ∥x∥2 .
n→∞
i=1
Isto prova a desigualdade de Bessel no segundo caso.

PROPOSIÇÃO 3.3 (Desigualdade de Cauchy-Schwarz-Bunjakowski). Sejam H um espaço
pré-Hilbert e x, y ∈ H . Então, 5 5
5⟨x, y⟩5 # ∥x∥∥y∥ .
Demonstração. Sejam x, y ∈ H . Se x = 0 ou y = 0, então ⟨x, y⟩ = 0 e a desigualdade de

Cauchy-Schwarz-Bunjakowski acontece trivialmente. Então, vamos assumir que x ̸= 0 e y ̸= 0.
Tome
⟨x, y⟩
λ = 55 5 ∈ C =⇒ |λ| = 1 e α ∈ R .
⟨x, y⟩5
Logo,
0 # ⟨(λx + αy), (λx + αy)⟩ = |λ|⟨x, x⟩ + λα⟨x, y⟩ + λα⟨y, x⟩ + α2 ⟨y, y⟩
. /
= ⟨x, x⟩ + 2 Re λα⟨x, y⟩ + α2 ⟨y, y⟩
5 5
# ∥x∥2 + 2α5⟨x, y⟩5 + α2 ∥y∥2 .
O lado direito da desigualdade acima é um polinômio quadrático positivo-definido para todo α
real. Assim, para que ele seja não-negativo, ele pode ter no5 máximo
52 uma raiz real. Isto requer
1 5 5
que o discriminante seja no máximo zero, de modo que 4 ⟨x, y⟩ − 4∥x∥ ∥y∥2 # 0, ou seja,
2
5 5 5 5
5⟨x, y⟩52 # ∥x∥2 ∥y∥2 =⇒ 5⟨x, y⟩5 # ∥x∥∥y∥. Note que a igualdade acontece se, e somente
se, os vetores x, y são linearmente dependentes. Isto prova a proposição.
1
Lembrete: seja , -
b c
P (x) = ax2 + bx + c = a x2 + x + .
a a
Completando quadrado, obtemos que
, - F, - G
b c b2 b2 b b2 − 4ac
P (x) = a x2 + x + + 2 − 2 = a x + − .
a a 4a 4a 2a 4a2
Então, P (x) " 0 se, e somente se, a > 0 e b2 − 4ac # 0.
92
Espaços de Hilbert
Segunda demonstração da Proposição 3.3. Sejam x, y ∈ H . Se um desses vetores é o vetor

nulo, por exemplo y = 0, então ⟨x, y⟩ = 0 e a desigualdade de Cauchy-Schwarz-Bunjakowski
acontece trivialmente. Se y ̸= 0, então ∥y∥ " 0. Assuma que os vetores y/∥y∥ formam um
sistema ortonormal em H . Portanto, pela desigualdade de Bessel, temos que para qualquer
x∈H
5 5 5 5 5 5
5⟨x, (y/∥y∥)⟩52 = (1/∥y∥2)5⟨x, y⟩52 # ∥x∥2 =⇒ 5⟨x, y⟩5 # ∥x∥∥y∥ .
COROLÁRIO 3.4. Sejam H um espaço pré-Hilbert real e x, y dois vetores não-nulos em H .

Então, existe um número θ(x, y) (o ângulo entre os vetores x, y) tal que
⟨x, y⟩
cos θ(x, y) = .
∥x∥∥y∥
Demonstração. Da desigualdade de Cauchy-Schwarz-Bunjakowski segue que
⟨x, y⟩
−1 # #1.
∥x∥∥y∥
Logo, para o intervalo [0, π] existe um número θ = θ(x, y) tal que
⟨x, y⟩
cos θ(x, y) = .
∥x∥∥y∥
Portanto, θ é o ângulo entre x e y.
PROPOSIÇÃO
H 3.4. Todo espaço pré-Hilbert H é um espaço normado, com a norma dada por
∥x∥ = ⟨x, x⟩.
H
Demonstração. Pela Propriedade (P I1) temos que ∥x∥ = ⟨x, x⟩ " 0, para todo x ∈ H e
que ∥x∥ = 0 ⇒ x = 0. Pelas Propriedades (P I2) e (P I2′) temos que ∥αx∥2 = ⟨αx, αx⟩ =
αα⟨x,
H x⟩ = |α|2 ∥x∥2 . Assim, ∥αx∥ = |α|∥x∥. Finalmente, precisamos mostrar que ∥x∥ =
⟨x, x⟩ satisfaz a desigualdade triangular. Sejam x, y ∈ H . Então,
∥x + y∥2 = ⟨(x + y), (x + y)⟩
= ⟨x, x⟩ + ⟨x, y⟩ + ⟨y, x⟩ + ⟨y, y⟩
= ∥x∥2 + 2 Re ⟨x, y⟩ + ∥y∥2

5 5
# ∥x∥2 + 2 5⟨x, y⟩5 + ∥y∥2
. /2
# ∥x∥2 + 2 ∥x∥∥y∥ + ∥y∥2 = ∥x∥ + ∥y∥ .
Usamos a desigualdade de Cauchy-Schwarz-Bunjakowski na última desigualdade. Logo, ∥x +

y∥ # ∥x∥ + ∥y∥.
93
Espaços de Hilbert
Nota 3.3. É interessante observar que na desigualdade triangular acima, a igualdade acontece
. /2
se, e somente se, ∥x + y∥2 = ∥x∥ + ∥y∥ . Isto implica que ∥x∥2 + 2 Re ⟨x, y⟩ + ∥y∥2 =
∥x∥2 + 2 ∥x∥∥y∥ + ∥y∥2, ou que 2 Re ⟨x, y⟩ = ∥x∥∥y∥. Como ∥ · ∥ ∈ [0, ∞[, isto implica que
Re ⟨x, y⟩5 ∈ [0,5 ∞[. Ora, mas então, podemos representar esta última igualdade da seguinte
forma: 5⟨x, y⟩5 = ∥x∥∥y∥. Isto por sua vez representa a igualdade na desigualdade de
Cauchy-Schwarz-Bunjakowski, que acontece se, e somente se, os vetores x, y são linearmente
dependentes. Mas cuidado, pois se tomarmos y = λx, com λ ∈ R, então a igualdade
∥x + λx∥ = ∥x∥ + ∥λx∥ não implica que |1 + λ|∥x∥ = (1 + |λ|)∥x∥, a não ser que λ " 0!
Como todo espaço normado é também um espaço métrico, segue da Proposição 3.4 o
seguinte
COROLÁRIO 3.5. Todo espaço pré-Hilbert H é um espaço métrico, com a métrica dada por:
H
d(x, y) = ⟨(x − y), (x − y)⟩ .
3.2 Espaços de Hilbert

A Proposição 3.4 nos mostrou que todo
H espaço pré-Hilbert H é um espaço normado, com
a norma induzida pela função ∥ · ∥ = ⟨ · , · ⟩. Consequentemente, todo espaço pré-Hilbert
H é um espaço sobre o qual podemos definir uma métrica (Corolário 3.5). Portanto, podemos
falar sobre as noções de convergência, completeza, densidade, etc, em H .
DEFINIÇÃO 3.5. Seja H um espaço pré-Hilbert equipado com sua topologia da norma ∥ · ∥ =
H
⟨ · , · ⟩. Diz-se que:
(a) Uma sequência (xn )n∈N

H ⊂ H converge se, e somente se, ∃ x ∈ H , tal que ∀ ε > 0,
arbitrário, ∃ n0 ∈ N tal que ⟨(x − xn ), (x − xn )⟩ < ε, ∀ n > n0 .
H sequência (xn )n∈N ⊂ H é de Cauchy se, e somente se, ∀ ε > 0, arbitrário, ∃ n0 ∈ N

(b) Uma
tal que ⟨(xn − xm ), (xn − xm )⟩ < ε, ∀ n, m > n0 .
(c) O espaço pré-Hilbert H é completo se, e somente se, toda sequência de Cauchy em H
converge para um elemento de H .
PROPOSIÇÃO 3.5. Seja H um espaço pré-Hilbert. Equipe H com a topologia da norma. Então,
toda sequência convergente em H é de Cauchy. Além disto, se a sequência (xn )n∈N converge
para x ∈ H , então limn→∞ ∥xn ∥ = ∥x∥.
Demonstração. A prova da Proposição 1.14 se aplica, sem modificações, à primeira parte, uma
vez que H sendo um espaço normado, é também um espaço métrico, com a métrica induzida 5
pela5norma. Para provar a segunda parte, recorremos à segunda desigualdade triangular 5∥x∥ −
∥y∥5 # ∥x − y∥ (veja Proposição 2.4) que é válida ∀ x, y ∈ H . Assim, temos que
5 5
5∥x∥ − ∥xn ∥ 5 # ∥x − xn ∥ .
H H H
5Logo, se ∥x − xn5∥H → 0 (que significa dizer que limn→∞ ∥x − xn ∥H = 0), segue que
5∥x∥ − ∥xn ∥ 5 → 0, ou que limn→∞ ∥xn ∥ = ∥x∥ .
H H H H
94
Espaços de Hilbert
DEFINIÇÃO 3.6 (Convergência forte). Seja H um espaço pré-Hilbert. Considere uma sequência
de vetores (xn )n∈N ⊂ H . Se esta sequência converge para um vetor x em H , isto é, se, para
todo ε > 0, existe um inteiro n0 > 0 tal que ∥xn − x∥ < ε, quando n > n0 – ou que
limn→∞ ∥xn − x∥H = 0, então dizemos que a sequência (xn )n∈N converge fortemente para o
vetor x, e escrevemos s−limn→∞ xn = x.
Nota 3.4. A convergência limn→∞ d(x, xn ) = 0 em um espaço normado é muitas vezes
representada por s−limn→∞ xn = x para enfatizar a convergência forte. O adjetivo “forte” é
introduzido para distinguir a convergência forte da convergência “fraca” que será introduzida
mais tarde.
DEFINIÇÃO 3.7 (von Neumann, 1925). Um espaço de Hilbert é um espaço pré-Hilbert completo.
Em outras palavras, um espaço pré-Hilbert é um espaço de Hilbert se toda
H sequência de Cauchy
converge neste espaço segundo a topologia gerada pela norma ∥ · ∥ = ⟨ · , · ⟩.
A necessidade da completeza dos espaços Hilbert fica clara quando, por exemplo, resolvemos
a equação de Schrödinger na teoria quântica. Determinar a solução da equação de Schrödinger
para um certo sistema quântico em um único “golpe” pode ser difícil. Em vez disso, uma
solução inicial é frequentemente aproximada e depois refinada conforme aproximações repetidas
da solução aumentam sua precisão. A solução final, obtida repetindo as aproximações infinitas
vezes, é a solução para a equação de Schrödinger.2 Por ser um limite, devemos determinar se
a solução final está contida no conjunto de funções em consideração (ou seja, é um espaço de
funções). Se existe uma solução em nosso espaço de funções, podemos criar uma discussão
auto-consistente sobre as propriedades da equação de Schrödinger usando a norma do espaço e
a classe de funções contidas no espaço. Neste caso, a completeza do espaço de Hilbert garante
que a solução final existe dentro do espaço. Por outro lado, se o espaço de Hilbert não fosse
completo, nossa discussão sobre convergência poderia perder o significado apropriado.
TEOREMA 3.2 (Completamento de um espaço pré-Hilbert). Seja H um espaço pré-Hilbert
incompleto. Então, H pode ser estendido para um espaço de Hilbert H adicionando-se vetores
apropriados, de forma que H seja um subespaço denso de H .
H
Demonstração. O espaço H , com a norma ∥x∥ = ⟨x, x⟩, é um espaço de Banach. Portanto,
de acordo com o Teorema 2.7, H pode ser estendido para um espaço de Banach pela a adição
de novos elementos. Então, usando o método de extensão do Teorema 2.7 basta provar (veja o
Exercício 3.5) que o produto escalar ⟨x, y⟩ (mais as leis algébricas para
H o produto escalar, como
descritas pelas propriedades na Definição 3.1) e a norma ∥x∥ = ⟨x, x⟩ em H podem ser
estendidos e comprovados como válidos em H por um processo de passar ao limite.
Nota 3.5. Segue da Definição 3.7 que todo espaço de Hilbert é um espaço de Banach, ou seja, é
um espaço vetorial normado completo, com a norma derivada do produto interno. Entretanto, a
recíproca não é verdadeira. Portanto, é importante termos um critério que nos informe quando
um espaço de Banach é um espaço de Hilbert, isto é, quando sua norma é induzida por um
produto interno. Responderemos esta questão construtivamente, partindo-se da seguinte
2
Esse método de aproximação sucessiva na teoria quântica é conhecido como teoria da perturbação. Na
teoria quântica, o estado de uma partícula quântica é descrito usando-se uma combinação linear das soluções
da equação de Schrödinger. Entretanto, determinar a solução exata para essa equação é praticamente impossível.
A teoria de perturbação nos permite encontrar uma solução aproximada usando aproximações sucessivas, o que
aumenta a precisão e também pode truncar os termos de ordem superior na equação de Schrödinger.
95
Espaços de Hilbert
PROPOSIÇÃO 3.6 (Lei do Paralelograma). Em um espaço de Hilbert H , a norma induzida

pelo produto interno satisfaz à seguinte identidade:
. /
∥x + y∥2 + ∥x − y∥2 = 2 ∥x∥2 + ∥y∥2 , ∀ x, y ∈ H .
Demonstração. Calcule primeiro ∥x + y∥2. Temos que,
∥x + y∥2 = ⟨(x + y), (x + y)⟩
= ⟨x, x⟩ + ⟨x, y⟩ + ⟨y, x⟩ + ⟨y, y⟩ (3.2.1)
= ⟨x, x⟩ + 2 Re ⟨x, y⟩ + ⟨y, y⟩ .
Da mesma forma, segue que
∥x − y∥2 = ⟨(x − y), (x − y)⟩
= ⟨x, x⟩ − ⟨x, y⟩ − ⟨y, x⟩ + ⟨y, y⟩ (3.2.2)
= ⟨x, x⟩ − 2 Re ⟨x, y⟩ + ⟨y, y⟩ .
Somando (3.2.1) e (3.2.2) temos imediatamente a verificação da identidade.

Nota 3.6. Observe que não foi necessário recorrer à completeza do espaço de Hilbert para
provar o resultado acima. Portanto, verifica-se a lei do paralelograma em qualquer espaço com
um produto interno. Quando for necessário, faremos menção explícita à completeza do espaço
de Hilbert.
COROLÁRIO 3.6 (Identidade de Apollonius). Sejam H um espaço de Hilbert e x, y, z ∈ H .

Então, ? ?2
1 ? 1 ?
∥x − z∥2 + ∥x − y∥2 = ∥y − z∥2 + 2?x − (y + z)? .
2 2
Demonstração. Para x, y, z ∈ H , considere os vetores x−z e x−y. Substituindo esses vetores

na lei do paralelograma, segue que
. /
2 ∥x − z∥2 + ∥x − y∥2 = ∥2x − z − y∥2 + ∥y − z∥2
? . 1 /?
? ?2
= ?2 x − (y + z) ? + ∥y − z∥2
2
? 1 ?2
? ?
= 4?x − (y + z)? + ∥y − z∥2 .
2
Agora, basta dividir ambos os lados da equação acima por 2 para obtermos a identidade de
Apollonius.3
3
Note que, da segunda para terceira linha da prova, usamos o fato que ∥αx∥2 = ⟨αx, αx⟩ = α2 ⟨x, x⟩ =
α ∥x∥2 , para α ∈ R!
2
96
Espaços de Hilbert
PROPOSIÇÃO 3.7 (Identidade de Polarização). Sejam H um espaço de Hilbert e x, y, z ∈ H .

Então, se H é real
1 1
⟨x, y⟩ = ∥x + y∥2 − ∥x − y∥2 ,
4 4
enquanto que se H é complexo
1 1 i i
⟨x, y⟩ = ∥x + y∥2 − ∥x − y∥2 − ∥x + iy∥2 + ∥x − iy∥2 .
4 4 4 4
Demonstração. O primeiro caso segue imediatamente da prova da Proposição 3.6, tomando-se

(3.2.1)-(3.2.2). Com efeito, teremos
∥x + y∥2 − ∥x − y∥2 = 2⟨x, y⟩ + 2⟨y, x⟩ = 4⟨x, y⟩.
Para o espaço vetorial complexo, note que pelo mesmo cálculo realizado acima, teremos
∥x + y∥2 − ∥x − y∥2 = 2⟨x, y⟩ + 2⟨y, x⟩. (3.2.3)
e
∥x + iy∥2 − ∥x − iy∥2 = 2⟨x, iy⟩ + 2⟨iy, x⟩ = 2i⟨x, y⟩ − 2i⟨y, x⟩ .
Multiplicando ambos os lados da última equação por −i, segue que
−i∥x + iy∥2 + i∥x − iy∥2 = 2⟨x, y⟩ − 2⟨y, x⟩ (3.2.4)
Somando-se (3.2.3) e (3.2.4),
4⟨x, y⟩ = ∥x + y∥2 − ∥x − y∥2 − i∥x + iy∥2 + i∥x − iy∥2 ,
obtemos, imediatamente, o resultado no caso em que H é complexo.
De acordo com a Proposição 3.7, a lei do paralelograma é uma condição necessária para que
uma norma seja induzida por um produto interno.
Exemplo 3.3 (Contra-exemplos). (i) Seja C([0, 3]) o conjunto de funções contínuas sobre o
intervalo fechado [0, 3]. Defina
⎧ ⎧
⎪
⎨1 se 0 # x # 1 ⎪
⎨0 se 0 # x # 1
f (x) = 2 − x se 1 # x # 2 e g(x) = x − 1 se 1 # x # 2
⎪
⎩ ⎪
⎩
0 se 2 # x # 3 1 se 2 # x # 3
Tomando ∥f ∥ = supx∈[0,3] |f (x)|, segue que ∥f ∥ = ∥g∥ = ∥f + g∥ = ∥f − g∥ = 1. Logo,
∥f + g∥2 + ∥f − g∥2 ̸= 2(∥f ∥2 + ∥g∥2). Portanto, C([0, 3]) não é um espaço de Hilbert. (ii)
Como segundo exemplo, denote por X o espaço ℓ2 (veja Exemplo 2.5) equipado com a norma
∥x∥ = ∥x∥2 + ∥x∥∞ . Então X é isomorfo ao espaço ℓ2 uma vez que a nova norma satisfaz
∥x∥2 # ∥x∥ # 2∥x∥2 . É fácil checar que a lei do paralelograma também não é respeitada.
Com efeito, tome, por exemplo, x = (1, 0, 0, 0, . . .) e y = (0, 1, 0, 0, . . .). Portanto, X não é
um espaço de Hilbert. Este dois exemplos nos ensina que não basta ter um produto interno bem
definido, nem mesmo uma norma que se aproxima de uma norma de um espaço de Hilbert
conhecido, como é o caso do espaço ℓ2 . O próximo teorema mostra que, na verdade, a Lei
do Paralelograma não é somente necessária, mas também suficiente para que um espaço de
Banach seja um espaço de Hilbert.
97
Espaços de Hilbert
TEOREMA 3.3. Um espaço de Banach B é também um espaço de Hilbert se, e somente se, a Lei
do Paralelograma é satisfeita pela norma definida em B.
Demonstração. A parte “somente se” foi provada na Proposição 3.6. Para provar a parte “se”,
assuma que a lei do paralelograma é satisfeita. Seja B um espaço de Banach real (o caso em
que o espaço de Banach é complexo fica a cargo do leitor). Se um produto interno está definido
em B, devemos ter satisfeito as seguintes propriedades:
∥x + y∥2 = ∥x∥2 + 2⟨x, y⟩ + ∥y∥2 e ∥x − y∥2 = ∥x∥2 − 2⟨x, y⟩ + ∥y∥2 .
Isto sugere a seguinte definição
13 4
⟨x, y⟩ = ∥x + y∥2 − ∥x − y∥2 . (3.2.5)
4
Temos que verificar se (3.2.5) satisfaz as seguinte propriedades:
(a) ⟨x, αy⟩ = α⟨x, y⟩, para todo α ∈ R e x, y ∈ B.
(b) ⟨x, (y + z)⟩ = ⟨x, y⟩ + ⟨x, z⟩, para todo x, y, z ∈ B.
(c) ⟨x, y⟩ = ⟨y, x⟩.
(d) ⟨x, x⟩ = ∥x∥2 .
Note que (c) e (d) são satisfeitas imediatamente por (3.2.5). Vamos verificar (b). Com efeito,
temos que
13 4
⟨x, y⟩ + ⟨x, z⟩ = ∥x + y∥2 − ∥x − y∥2 + ∥x + z∥2 − ∥x − z∥2
4
1 36 7 6 74
= ∥x + y∥2 + ∥x + z∥2 − ∥x − y∥2 + ∥x − z∥2
4
1 36 1 ? 1 ?2 7 6 1 ? 1 ?2 74
? ? ? ?
= ∥y − z∥2 + 2?x + (y + z)? − ∥y − z∥2 + 2?x − (y + z)?
4 2 2 2 2
1 3? 1 ?2 ? 1 ?2 4
? ? ? ?
= ?x + (y + z) ? − ? x − (y + z) ? . (3.2.6)
2 2 2
Aqui, usamos a identidade de Apollonius. Olhando para (3.2.5), observe que o lado direito de
(3.2.6) pode ser escrito da seguinte forma:
1 3? 1 ?2 ? 1 ?2 4 @ 1 A
? ? ? ?
?x + (y + z)? − ?x − (y + z)? = 2 x, (y + z) .
2 2 2 2
Logo,
@ 1 A
⟨x, y⟩ + ⟨x, z⟩ = 2 x, (y + z) . (3.2.7)
2
Tomando y = 0 em (3.2.7), segue que
@ 1 A
⟨x, z⟩ = 2 x, z ,
2
98
Espaços de Hilbert
uma vez que ⟨x, 0⟩ = 0, pela Eq.(3.2.5). Aplicando este resultado no lado esquerdo da Eq.(3.2.7),
obtemos que
@ 1 A @ 1 A @ 1 A
2 x, y + 2 x, z = 2 x, (y + z) ,
2 2 2
ou que
@ 1 A @ 1 A @ 1 A
x, y + x, z = x, (y + z) .
2 2 2
Isto prova (b).
Para provar a propriedade (a), primeiro note que pela aplicação de (b) repetidas vezes,
obtemos que n⟨x, y⟩ = ⟨x, ny⟩, em que n ∈ Z+ . De fato, tome z = y em (b). Logo,
⟨x, 2y⟩ = ⟨x, y⟩ + ⟨x, y⟩ = 2⟨x, y⟩ .
Seguindo, temos que
⟨x, 3y⟩ = ⟨x, 2y + y⟩ = ⟨x, 2y⟩ + ⟨x, y⟩
= 2⟨x, y⟩ + ⟨x, y⟩
= 3⟨x, y⟩ .
Assim, para n ∈ Z+ , com n > 1, segue que
⟨x, ny⟩ = ⟨x, (n − 1)y + y⟩ = ⟨x, (n − 1)y⟩ + ⟨x, y⟩
= (n − 1)⟨x, y⟩ + ⟨x, y⟩
= n⟨x, y⟩ .
Se m, n ∈ Z+ , então
(n/m)⟨x, y⟩ = (n/m)⟨x, m(y/m)⟩ = (n/m) · m⟨x, (y/m)⟩
= n⟨x, (y/m)⟩
= ⟨x, (n/m)y⟩ .
Assim, (a) acontece para os números racionais α positivos. Além disso, tomando z = −y em
(b), segue que
⟨x, (y + (−y))⟩ = 0 = ⟨x, y⟩ + ⟨x, −y⟩ .
Isto implica que
⟨x, −y⟩ = −⟨x, y⟩ ,
o que mostra que (a) acontece para todos os racionais α. Agora, se α é um número real,
e considerando que Q é denso em R, segue que existe uma sequência (αn )n∈N em Q que
converge para α. Logo,
α⟨x, y⟩ = lim αn ⟨x, y⟩ = lim ⟨x, αn y⟩ = ⟨x, αy⟩ .
n→∞ n→∞
Isto completa a prova para o caso em que B é um espaço de Banach real.
99
Espaços de Hilbert
3.3 Complementos Ortogonais

Complementos ortogonais desempenham uma papel importante na análise de espaços de
Hilbert. A falta de projeções ortogonais e complementos ortogonais em espaços não-Hilbertianos
é muitas vezes o que tornam a análise de espaços de Banach genéricos muito mais difícil do
que a análise de espaços de Hilbert.
DEFINIÇÃO 3.8. Para qualquer subconjunto M em um espaço de Hilbert H , o complemento
ortogonal de M em H é o conjunto
3 4 3 4
M ⊥ = y ∈ H | ⟨y, x⟩ = 0, ∀ x ∈ M = y ∈ H | y ⊥ M .
Existem algumas consequências importantes derivadas a partir desta definição, como mostra
o
LEMA 3.2. Seja H um espaço de Hilbert. Então o seguinte acontece:
1. H ⊥ = {0} e {0}⊥ = H .
2. O complemento ortogonal M ⊥ de qualquer subconjunto M ⊂ H é um subespaço vetorial

de H .
3. Se M ⊂ N, então, N ⊥ ⊂ M ⊥ .
4. Se 0 ∈ M ⊂ H , então M ∩ M ⊥ = {0}.
Demonstração. A Propriedade 1 segue imediatamente da definição do produto interno. Com

efeito, se y é um vetor em H tal que ⟨y, x⟩ = 0, para todo x ∈ H , então y deve ser o
vetor nulo. De fato, tomando x = y e aplicando a propriedade (P I1) da definição do produto
interno, segue que y = 0. Que {0}⊥ = H é, então, imediato.
Para provar a Propriedade 2, primeiro note que M é somente um subconjunto. Sejam

x, y ∈ M ⊥ ; então, por definição, temos
⟨x, z⟩ = 0 e ⟨y, z⟩ = 0 , ∀z ∈ M .
Portanto, segue que ⟨x, z⟩ + ⟨y, z⟩ = 0, para todo z ∈ M. Pela propriedade de linearidade
(P I2), temos que ⟨x, z⟩ + ⟨y, z⟩ = ⟨(x + y), z⟩. Assim, ⟨(x + y), z⟩ = 0, para todo z ∈ M.
Logo x + y ∈ M ⊥ . Agora, tome α ∈ K e x ∈ M ⊥ . Sabemos que ⟨x, y⟩ = 0, para todo
y ∈ M. Logo, α⟨x, y⟩ = 0, para todo y ∈ M. Por causa de (P I2′) (veja Corolário 3.1), segue
que ⟨αx, y⟩ = 0, para todo y ∈ M. Portanto, αx ∈ M ⊥ . Consequentemente, M ⊥ é fechado
sob as operações de soma de vetores e multiplicação por um elemento de K definidas sobre
H.
Para provar a Propriedade 3, tome um vetor x ∈ M =⇒ x ∈ N. Agora, tome um vetor

qualquer y ∈ N ⊥ =⇒ ⟨x, y⟩ = 0. Logo, y ∈ M ⊥ , já que x ∈ M. Assim, todo vetor em N ⊥
também é um vetor de M ⊥ =⇒ N ⊥ ⊂ M ⊥ .
Finalmente, para provar a Propriedade 4, suponha que x ∈ M ∩ M ⊥ . Isto imediatamente

implica que ⟨x, x⟩ = 0; por sua vez, isto implica que x ≡ 0.
100
Espaços de Hilbert
3.4 O Teorema da Projeção

Nesta seção vamos provar o seguinte resultado importante de caráter geométrico.
TEOREMA 3.4 (Teorema da Projeção). Sejam H um espaço de Hilbert e M um subespaço
fechado de H . Então, todo vetor x ∈ H tem uma única representação x = y + z, em que
y = y(x) ∈ M e z = z(x) ∈ M ⊥ .
No caso particular de um espaço de Hilbert de dimensão finita a situação é representada na

figura abaixo, com a projeção de x sobre M.
M⊥
x w
z M
A prova do Teorema 3.4 exige alguns resultados preliminares. Começamos com a seguinte
PROPOSIÇÃO 3.8. Sejam H um espaço de Hilbert e M um subespaço de H . Então, o fecho M
de M é um subespaço de H .
Demonstração. Sejam x, y ∈ M . Logo, existem sequências (xn )n∈N e (yn )n∈N em M tal que
xn → x e yn → y. Então, xn + yn ∈ M e xn + yn → x + y, pelo Teorema 2.6. Portanto,
x + y ∈ M. Por outro lado, se α ∈ K, então αxn ∈ M e αxn → αx. Logo, αx ∈ M . Isto
completa a prova.
DEFINIÇÃO 3.9. Diz-se que o subespaço M de um espaço de Hilbert H é fechado se x ∈ M,
quando existe uma sequência (xn )n∈N ⊂ M que converge para x em M. Em outras palavras,
M é fechado em H se, e somente se, M contém todos os seus pontos limites.
PROPOSIÇÃO 3.9. Sejam H um espaço de Hilbert e M um subespaço fechado de H . Então,
M é completo.
Demonstração. Seja (xn )n∈N uma sequência de Cauchy em M. Ela também é de Cauchy em
H . Logo xn → x ∈ H . Visto que xn ∈ M, para todo n, segue que x ∈ M = M, uma vez
que M é fechado. Assim, toda sequência de Cauchy tem limite em M. Logo, M é completo.
A recíproca da Proposição 3.9 também acontece, como mostra a

PROPOSIÇÃO 3.10. Sejam H um espaço de Hilbert e M um subespaço completo de H . Então,
M é fechado.
101
Espaços de Hilbert
Demonstração. Seja x ∈ M ; então existe uma sequência (xn )n∈N 5⊂ M tal que xn → x. Visto 5
que H é um espaço métrico, assim o é M, com a métrica d(x, y)5 = ⟨(x−y), (x−y)⟩1/2 5 .
M M
Logo, (xn )n∈N é de Cauchy (veja Proposição 1.14). Assim, (xn )n∈N tem limite em M, já que M
foi assumido ser completo. Por outro lado, já que H é Hausdorff, (xn )n∈N tem limite único.
Portanto, se xn → x′ ∈ M, pela unicidade do limite x′ = x ∈ M ⇒ M ⊂ M. Logo, M = M
(lembre-se que por definição M ⊂ M ).
PROPOSIÇÃO 3.11. Seja H um espaço de Hilbert. Então, o complemento ortogonal M ⊥ de um
subconjunto M ⊂ H é um subespaço fechado.
Demonstração. De acordo com Lema 3.2, M ⊥ é um subespaço de H . Para mostrar que M ⊥

é fechado, considere o seguinte conjunto
3 4
Fx = y ∈ H | ⟨y, x⟩ = 0, para cada x ∈ H .
Sabemos que, por definição, Fx ⊂ Fx . Seja y ∈ Fx . Logo, existe uma sequência (yn )n∈N ⊂ Fx
tal que yn → y. Como ⟨yn , x⟩ = 0 para todo n, segue que ⟨y, x⟩ = limn→∞ ⟨yn , x⟩, por causa
da continuidade do produto interno (veja a Proposição 3.13). De fato, este resultado segue da
continuidade da aplicação d(x−y) = ∥x−y∥ = ⟨(x−y), (x−y)⟩1/2 (veja Proposição 2.6), e da
identidade de polarização (lembre-se, a Proposição 3.7 e Teorema 3.3 nos garantem que o produto
interno é expresso em termos da norma). Assim, ⟨y, x⟩ = 0 ⇒ y ∈ Fx ⇒ Fx ⊂ Fx . Portanto,
Fx = Fx , e isto implica que Fx é fechado. Agora, M ⊥ = ∩x∈M Fx . Consequentemente, pelo
Exercício 1.25, M ⊥ é fechado.
Sejam x um ponto e M um subconjunto não-vazio de um espaço vetorial normado X . De

acordo com o Corolário 1.2, definimos a distância do ponto x ao conjunto M como sendo o
número real
d(x, M) = inf ∥x − y∥ .
y∈M
Exemplo 3.4. Sejam M uma reta em um plano e x um ponto fora desse plano, como mostra
a figura abaixo.
y M
y0
Note que o ponto y0 ∈ M, pé da perpendicular baixada de x sobre M, é o ponto de M

que está mais próximo de x. De fato, qualquer outro ponto y ∈ M determina o triângulo
retângulo xy0 y. Pelo teorema de Pitágoras, segue que ∥x − y∥2 = ∥(x − y0 ) + (y0 − y)∥2 =
∥x − y0 ∥2 + ∥y0 − y∥2, de onde se conclui que ∥x − y0 ∥ # ∥x − y∥. Logo, podemos escrever
que d(x, y0 ) = inf y∈M ∥x − y∥.
Vamos, agora, generalizar o exemplo acima para um espaço de Hilbert.
102
Espaços de Hilbert
LEMA 3.3. Sejam H um espaço de Hilbert, x ∈ H e M um subespaço fechado de H . Então,

existe em M um único elemento y0 que está mais próximo de x.
Demonstração. Seja d = d(x, M) = inf y∈M ∥x − y∥. Devemos mostrar que d = ∥x − y0 ∥.

Isto significa que para qualquer y ∈ M, com y ̸= y0 , temos que ∥x − y∥ " d. Escolha uma
sequência (yn )n∈N ⊂ M tal que d = limn→∞ ∥x − yn ∥. Considere os seguintes dois vetores:
(x − yn ) e (x − ym ). Pela identidade de Apollonius, segue que
? 1 ?2
2 2 2 ? ?
∥ym − yn ∥ = 2∥x − ym ∥ + 2∥x − yn ∥ − 4?x − (ym + yn )? .
2
Visto que ym , yn ∈ M, a combinação convexa 1/2(ym + yn ) é um elemento de M, já que M
é um subespaço de H . Logo,
? 1 ?2
? ?
?x − (ym + yn )? " d2 .
2
Portanto,
∥ym − yn ∥2 # 2∥x − ym ∥2 + 2∥x − yn ∥2 − 4d2 −→ 2d2 + 2d2 − 4d2 = 0 ,
quando m, n → ∞. Assim, (yn5)n∈N ⊂ M é de Cauchy. Sendo 5 H um espaço métrico, também

5
o é M, com a métrica d(x, y) = ⟨(x − y), (x − y)⟩ 1/2 5
, induzida pela norma. Logo, M
M M
é Hausdorff e (yn )n∈N converge para um único elemento y ∈ M . Pela Proposição 3.9, M é
completo. Portanto, se yn → y0 ∈ M, y0 = y, pela unicidade do limite e pelo fato de M ser
fechado. Assim, por construção
d = lim ∥x − yn ∥ = ∥x − y0 ∥ .
n→∞
Isto finaliza a prova do lema.
Passemos, agora, para a
Demonstração do Teorema 3.4. Pelo Lema 3.3, existe um único elemento y ∈ M mais próximo
de x ∈ H . Evidentemente, y ̸= 0 ⇒ x ̸= z, dado que y = x − z. Temos que mostrar que
z ∈ M ⊥ (que é o mesmo que dizer que z é ortogonal a todo elemento de M). Para tanto, seja
w qualquer elemento de M. Para α ∈ K, segue que y + αw ∈ M. Note que pelo Lema 3.3,
d2 # ∥x − (y + αw)∥2 = ∥z − αw∥2
= ⟨(z − αw), (z − αw)⟩
= ⟨z, z⟩ − ⟨z, αw⟩ − ⟨αw, z⟩ + ⟨αw, αw⟩
= ∥z∥2 − α⟨z, w⟩ − α⟨w, z⟩ + |α|2 ∥w∥2 .
Em particular, assuma que α = ⟨w, z⟩/∥w∥2. Logo,

1 1 1
d2 # ∥z∥2 − ⟨w, z⟩⟨z, w⟩ − ⟨z, w⟩⟨w, z⟩ + |⟨w, z⟩|2∥w∥2 ,
∥w∥2 B CD E ∥w∥2 B CD E ∥w∥2 · ∥w∥2
|⟨w,z⟩|2 |⟨w,z⟩|2
103
Espaços de Hilbert
ou
1
d2 # ∥x − y∥2 − 2
|⟨w, z⟩|2 ,
∥w∥
ou
1
d2 # d2 − 2
|⟨w, z⟩|2 .
∥w∥
Assim, temos que
1
0#− |⟨w, z⟩|2 .
∥w∥2
Esta estimativa implica que ⟨w, z⟩ = 0. Finalmente, devemos mostrar a unicidade da repre-
sentação de x ∈ H . Assuma que x = y ′ + z ′ seja uma outra representação de x ∈ H .
Logo, temos que y + z = y ′ + z ′ , ou que y − y ′ = z ′ − z. Naturalmente, y − y ′ ∈ M e
z ′ − z ∈ M ⊥ . Isto implica que y − y ′ = z ′ − z ∈ M ∩ M ⊥ . Pelo Lema 3.2, podemos concluir
que y − y ′ = z ′ − z = 0 ∈ H . Isto finaliza a prova.
Nota 3.7. O Teorema 3.4 estabelece um isomorfismo natural H ∼
= M ⊕ M ⊥ . Na verdade,
mostraremos a seguir que H = M ⊕ M ⊥ .
LEMA 3.4. Sejam M
! e N subespaços fechados
" do espaço de Hilbert H . Suponha que M ⊥ N.
Então, M + N = x + y | x ∈ M e y ∈ N é um subespaço fechado.
Demonstração. Naturalmente, M + N é um subespaço de H . Com efeito, M ∩ N = {0}.

Além disso, se y, y ′ ∈ M e z, z ′ ∈ N, então y + y ′ = y ′′ ∈ M e z + z ′ = z ′′ ∈ N. Isto
implica que y ′′ + z ′′ ∈ M + N. E mais, para α, β ∈ K, segue que αy ∈ M e βz ∈ N.
Logo, αy + βz ∈ M + N. Assim, resta mostrar que M + N é fechado. Por definição,
M + N ⊂ M + N. Seja w ∈ M + N; então existe uma sequência (wn )n∈N ⊂ M + N, tal
que wn → w. Visto que cada elemento wn ∈ M + N, segue que wn = xn + yn , em que
xn ∈ M e yn ∈ N. Logo, usando esta representação para cada elemento da sequência, temos
que wm − wn = (xm − xn ) + (ym − yn ). Vamos examinar a norma deste vetor. Uma vez que
(xm − xn ) ⊥ (ym − yn ), podemos aplicar o teorema de Pitágoras para obter que
∥wm − wn ∥2 = ∥xm − xn ∥2 + ∥ym − yn ∥2 .
Pela Proposição 3.9, as sequências (xn )n∈N ⊂ M e (yn )n∈N ⊂ N são de Cauchy. Se wn →
w ′ ∈ M + N, então usando o fato que w ′ ∈ H e que H é Hausdorff, devemos ter
w ′ = w pela unicidade do limite (veja Proposição 1.15). Logo, w ∈ M + N e isto implica que
M + N ⊂ M + N. A prova está completa.
TEOREMA 3.5. Se M é um subespaço fechado do espaço de Hilbert H ; então H = M ⊕ M ⊥ .
Demonstração. Como M é um subespaço de H , então, por definição, o vetor nulo pertence

a M. Isto implica, de acordo com o Lema 3.2, que M ∩ M ⊥ = {0}; entre outras coisas,
esta condição implica que os subespaços M e M ⊥ são linearmente independentes. De fato,
sejam x ∈ M e y ∈ M ⊥ vetores não-nulos. Considere a combinação linear αx + βy = 0.
Logo, ⟨x, (αx + βy)⟩ = 0 ⇒ α⟨x, x⟩ ⇒ α = 0. Da mesma forma, mostra-se que β = 0.
104
Espaços de Hilbert
Assim, só precisamos mostrar que H = M + M ⊥ . Para tanto, defina N = M + M ⊥ . Pelo

Lema 3.4, N é um subespaço fechado e, pelo Lema 3.2, como M ⊂ N, então N ⊥ ⊂ M ⊥ .
Além disso, como M ⊥ ⊂ N, por definição, por um raciocínio análogo ao usado no Lema 3.2,
podemos concluir que N ⊥ ⊂ (M ⊥ )⊥ . Note que {0} = M ⊥ ∩ (M ⊥ )⊥ ⊃ N ⊥ ⇒ N ⊥ =
{0} ⇒ (N ⊥ )⊥ = {0}⊥ ⇒ N ⊂ (N ⊥ )⊥ ⇒ N ⊂ (N ⊥ )⊥ . Naturalmente, N ⊂ H . Seja
x ∈ H ⇒ x ⊥ {0} = N ⊥ ⇒ x ∈ N ⇒ x ∈ N ⇒ H ⊂ N ⇒ H = N ⇒ H = N.
Finalmente, dado que (N ⊥ )⊥ ⊂ H = N ⇒ (N ⊥ )⊥ = N ⇒ {0}⊥ = H .
Neste ponto é importante enfatizar que para qualquer subconjunto M em um espaço de

Hilbert H , em geral, M ⊂ (M ⊥ )⊥ , já que x ∈ M =⇒ x ⊥ M ⊥ =⇒ x ∈ (M ⊥ )⊥ . Em
contrapartida, se M ⊂ H é um subespaço fechado, então, (M ⊥ )⊥ = M. Com efeito, se
(M ⊥ )⊥ ̸= M, então existe um vetor em x ∈ (M ⊥ )⊥ , tal que x ∈/ M. Então, pelo Lema 3.3,
existe em M um único elemento y0 que está mais próximo de x. Por outro lado, pelo Lema
3.2, (M ⊥ )⊥ é um subespaço vetorial, por isso, z = x − y0 ∈ (M ⊥ )⊥ . Mas, pelo Teorema 3.5,
nós temos que x = y0 + z, com z ∈ M ⊥ . Isto implica que z ∈ M ⊥ ∩ (M ⊥ )⊥ =⇒ z = 0 =⇒
x = y0 . Isto prova que M ⊃ (M ⊥ )⊥ . Em resumo, provamos o seguinte
LEMA 3.5. Sejam H um espaço de Hilbert e M um subespaço fechado de H . Então, o

complemento ortogonal do complemento ortogonal de M é o próprio M.
3.5 Convergência Fraca em Espaços de Hilbert

As propriedades topológicas de espaços de Hilbert são complicadas pelo fato de que as
topologias podem ser induzidas em tais espaços de mais de uma maneira. Este fato aponta uma
diferença fundamental entre espaços normados e espaços métricos sem estrutura algébrica, e
leva a uma série de noções alternativas de continuidade, compacidade e convergência para um
dado espaço normado. A convergência em espaços de Hilbert pode ser construída de pelo
menos duas maneiras fundamentalmente diferentes. A convergêngia forte é determinada pela
norma e foi descrita anteriormente dizendo que uma sequência de vetores (xn )n∈N ⊂ H
converge fortemente para um vetor x ∈ H se, para todo ε > 0, existe um inteiro n0 > 0
tal que ∥xn − x∥ < ε, quando n > n0 – ou que limn→∞ ∥xn − x∥H = 0 (veja a Definição
3.6). Neste caso, escrevemos s−limn→∞ xn = x ou xn → x. Uma outra noção (muito útil) de
convergência em espaços de Hilbert é descrita pela seguinte
DEFINIÇÃO 3.10 (Convergência fraca). Sejam H um espaço de Hilbert e (xn )n∈N uma sequên-
cia de vetores em H .
1. Diz-se que a sequência (xn )n∈N ⊂ H converge fracamente para o vetor x ∈ H se,
para um vetor y ∈ H e para todo ε > 0 arbitrário, existe um inteiro n0 ∈ N tal que
|⟨y, xn⟩ − ⟨y, x⟩| < ε, quando n > n0 – ou que limn→∞ |⟨y, xn ⟩ − ⟨y, x⟩| = 0. Neste caso,
escrevemos w−limn→∞ xn = x ou xn ⇀ x.
/ que a sequência (xn )n∈N é de Cauchy fraca se, e somente se, a sequência numérica
. 2. Diz-se
⟨y, xn ⟩ n∈N é de Cauchy.
Nota 3.8. Aqui, as letras s e w usadas em s − limn→∞ xn = x e w − limn→∞ xn = x,

respectivamente, representam abreviações das palavras strong e weak!
105
Espaços de Hilbert
PROPOSIÇÃO 3.12. Uma sequência (xn )n∈N em um espaço de Hilbert H que converge forte-
mente para o vetor x também converge fracamente para o mesmo vetor.
Demonstração. Novamente, usaremos a desigualdade de Cauchy-Schwarz-Bunjakowski. Com

efeito,
|⟨y, xn ⟩ − ⟨y, x⟩| = |⟨y, (xn − x)⟩| # ∥y∥H ∥xn − x∥H .
Logo, se ∥xn − x∥H → 0, quando n → ∞, segue que |⟨y, xn ⟩ − ⟨y, x⟩| → 0. Assim, se
s−limn→∞ xn = x, então w−limn→∞ xn = x, como queríamos provar.
Uma diferença essential entre a convergência forte e a convergência fraca é que a primeira
implica
∥xn ∥H = ∥x∥H , (3.5.1)
enquanto que esta relação não segue da convergência fraca. Pela convergência forte, a Eq.(3.5.1)
é uma consequência imediata das desigualdades
∥xn ∥H # ∥xn − x∥H + ∥x∥H e ∥x∥H # ∥x − xn ∥H + ∥xn ∥H . (3.5.2)
Dessa forma, em geral, o inverso da Proposição 3.12 não acontece. Em outras palavras, uma
sequência (xn )n∈N em um espaço de H que converge fracamente para o vetor x pode não
convergir segundo a topologia da norma, como mostra o seguinte
Exemplo 3.5. Sejam H um espaço de Hilbert e (xn )n∈N uma sequência de vetores ortonormais
em H . Tal sequência converge fracamente para zero, mas não fortemente. Com efeito, segue
da desigualdade de Bessel que para qualquer y ∈ H
∞
< 5 5
5⟨y, xn ⟩52 # ∥y∥2 .
n=1
; 5 5
Assim, a série ∞ 5⟨y, xn ⟩52 é majorada por ∥y∥2 , e, portanto, é convergente. Logo, ⟨y, xn ⟩ →
n=1
0. Isto mostra que a sequência de vetores ortonormais (xn )n∈N converge fracamente para zero.
Por outro lado, uma vez que ∥xn ∥ = ∥xn −0∥ = 1, (xn )n∈N não converge para zero fortemente.
Contudo, se adicionarmos à convergência fraca a hipótese que a relação (3.5.1) seja válida,
obtemos a convergência forte. Assim, a relação entre os conceitos de convergência forte e
convergência fraca fica completamente entendida via o seguinte
TEOREMA 3.6. Sejam H um espaço de Hilbert e (xn )n∈N uma sequência de vetores em H . Tal
sequência converge fortemente para x ∈ H se, e somente se, ela converge fracamente para x e
limn→∞ ∥xn ∥H = ∥x∥H .
Demonstração. A condição de necessidade (somente se) da convergência fraca foi provada na

Proposição 3.12. Por outro lado, pelas desigualdades (3.5.2), as Proposições 2.4 e 3.5, implicam
que 5 5
5∥x∥ − ∥xn ∥ 5 # ∥x − xn ∥ .
H H H
Logo, se ∥x − xn ∥H → 0, então limn→∞ ∥xn ∥H = ∥x∥H .
106
Espaços de Hilbert
Condição de suficiência (se). Assuma que a sequência (xn )n∈N converge fracamente para
x ∈ H e que a sequência de normas converge para a norma de x (limn→∞ ∥xn ∥H = ∥x∥H ).
Visto que a norma é definida em termos do produto interno, segue que
∥x − xn ∥2H = ⟨(x − xn ), (x − xn )⟩ = ∥x∥2H + ∥xn ∥2H − ⟨x, xn ⟩ − ⟨xn , x⟩ ,
para todo n ∈ N. A convergência fraca implica que
lim ⟨x, xn ⟩ = lim ⟨xn , x⟩ = ∥x∥2H .

n→∞ n→∞
Por outro lado, uma vez que assumimos que limn→∞ ∥xn ∥H = ∥x∥H , deduzimos que ∥x −
xn ∥2H → 0, quando n → ∞, que implica na convergência forte.
PROPOSIÇÃO 3.13 (Continuidade do Produto Interno). Sejam H um espaço de Hilbert e
(xn )n∈N , (yn )n∈N duas sequências em H . Se xn → x e yn → y, então ⟨xn , yn ⟩ → ⟨x, y⟩.
Demonstração. Primeiro note que se xn → x e yn → y, então ∥xn ∥H → ∥x∥H e ∥yn ∥H →

∥y∥H . De fato, pelo Teorema 3.6 dado ε > 0, existem números n1 , n2 ∈ N tais que
5 5
5∥x∥ − ∥xn ∥ 5 # ∥x − xn ∥ < ε ∀n > n1 ,
H H H
5 5
5∥y∥ − ∥yn ∥ 5 # ∥y − yn ∥ < ε ∀n > n2 . (3.5.3)
H H H
Logo, se n3 = max{n1 , n2 }, temos, para n > n3 :

5 5 5 5
5⟨xn , yn ⟩ − ⟨x, y⟩5 = 5⟨xn , yn ⟩ − ⟨x, yn ⟩ + ⟨x, yn ⟩ − ⟨x, y⟩5
5 5
= 5⟨(xn − x), yn ⟩ + ⟨x, (yn − y)⟩5
5 5 5 5
# 5⟨(xn − x), yn ⟩5 + 5⟨x, (yn − y)⟩5
# ∥x − xn ∥H ∥yn ∥H + ∥x∥H ∥y − yn ∥H
. /
< ∥yn ∥H + ∥x∥H ε ,
e como ∥yn ∥H é limitada pela Eq.(3.5.3), isto implica que ⟨xn , yn ⟩ → ⟨x, y⟩, concluindo a
prova da continuidade do produto interno.
Nota 3.9. No caso da convergência fraca existe uma classe de semi-continuidade que permanece
válida, mais especificamente, se ∥xn ∥H # C, então, ∥x∥H # C. Com efeito,
C∥x∥H " ∥xn ∥H ∥x∥H " |⟨xn , x⟩| → ⟨x, x⟩ = ∥x∥2H ,
depois de dividir por ∥x∥H .
3.6 Sobre a Existência de Bases Ortonormais

Talvez não exista propriedade mais importante dos vetores em um espaço de Hilbert do
que formarem um sistema (ou sequência, ou coleção) ortonormal completo(a). Com efeito,
muitas aplicações e resultados da teoria quântica, e da física em geral, requerem a existência
107
Espaços de Hilbert
de bases ortonormais. Mas a questão é saber se todos os espaços de Hilbert têm bases
ortonormais. Vamos mostrar que se um espaço de Hilbert é separável, então ele contém um
sistema ortonormal completo de vetores que define uma base. Tal base desempenha o mesmo
papel que um sistema de coordenadas em um espaço vetorial de dimensão finita.
DEFINIÇÃO 3.11. Diz-se que um espaço de Hilbert H é separável se ele contém um subconjunto
denso contável. Em outras palavras, diz-se que H é um espaço de Hilbert separável se existe uma
sequência de vetores x1 , x2 , . . . ∈ H tal que para todo vetor x ∈ H e todo ε > 0, arbitrário,
podemos encontrar um vetor xn na sequência para o qual ∥x − xn ∥ < ε acontence.
A relação entre a classe de espaços de Hilbert separáveis com o conceito de bases ortonormais
será o foco desta seção.4
Nota 3.10. Na literatura mais antiga sobre espaços de Hilbert sempre se assumiu a separabili-
dade como parte integrante da definição de um espaço de Hilbert, com a separabilidade sempre
sendo usada para provar vários teoremas importantes. Entretanto, mais tarde, descobriu-se que
vários desses teoremas poderiam ser provados sem a hipótese da separabilidade. Atualmente,
invocamos a separabilidade sempre que necessário, como é feito usualmente na literatura de
física-matemática. Com efeito, todos os espaços de Hilbert da Mecânica Quântica e da Teo-
ria Quântica dos Campos são sempre assumidos serem separáveis. Assim, salvo menção em
contrário, estaremos assumindo daqui por diante que todo espaço de Hilbert é separável.
DEFINIÇÃO 3.12. Se M é um conjunto ortonormal em um espaço de Hilbert H e se nenhum

outro conjunto ortonormal contém M como um subconjunto próprio, então, M é chamado
sistema ortonormal completo, ou uma base ortonormal, para H se para todo vetor x ∈
H e todo ε > 0, arbitrário, existem elementos x1 , x2 , . . . , xj ∈ M e números complexos
α1 , α2 , . . . , αj tal que
? ?
? <j ?
? ?
?x − αn xn ? < ε .
? n=1
?
Equivalentemente, se M é um conjunto ortonormal em um espaço de Hilbert H , então, M é

uma base ortonormal se, e somente se, M é um conjunto ortonormal total. Isto significa que
o conjunto de todas as combinações lineares finitas de elementos de M é denso em H , ou seja,
span(M) = H .
O leitor não deve confundir o conceito de completo na definição acima com o conceito de
espaço de Hilbert completo, que é válido no sentido topológico.
Nota 3.11. Sistemas (ou sequências, ou coleções) ortonormais completos(as) são também cha-
mados(as) bases hilbertianas.
TEOREMA 3.7. Seja H um espaço de Hilbert não-trivial, isto é, H ̸= {0}. Então, H possui
um sistema ortonormal completo.
Para provar este teorema precisamos da seguinte

4
No caso de espaços de Hilbert não-separáveis a resposta à questão acima é um pouco mais difícil de ser dada
e não a trataremos aqui.
108
Espaços de Hilbert
PROPOSIÇÃO 3.14. Seja H um espaço de Hilbert. Um conjunto M é denso em H se, e somente

se, M ⊥ = {0}.
Demonstração. Assuma que M é denso em H e que x0 ∈ M ⊥ . Como x0 ∈ H , existe uma

sequência (xn )n∈N ⊂ M tal que xn → x0 em H . Usando a desigualdade de Cauchy-Schwarz-
Bunjakowski e o fato que ⟨xn , x0 ⟩ = 0, segue que
∥x0 ∥2 = ⟨x0 , x0 ⟩ = ⟨x0 , x0 ⟩ − ⟨xn , x0 ⟩
= ⟨(x0 − xn ), x0 ⟩
# ∥x0 − xn ∥∥x0 ∥ .
Portanto, temos que
∥x0 ∥ # ∥x0 − xn ∥ → 0 quando n→∞.
Logo, x0 ≡ 0 e M ⊥ = {0}.
Reciprocamente, assuma que M ⊥ = {0}. Primeiro, precisamos provar que M é um subes-

paço fechado de H . Assuma que M é um subconjunto fechado de H . Seja x um elemento
de H tal que x ∈ M ∩ M ⊥ . Naturalmente, isto implica que ⟨x, x⟩ = 0 e que x ≡ 0. Portanto,
0 ∈ M, também. Agora, como M ⊥ = {0}, obtemos que ⟨0, x⟩ + ⟨0, y⟩ = ⟨0, (x + y)⟩ = 0,
para todo x, y ∈ M. Isto implica que x + y deve pertencer a M. Se assim não fosse, então,
x + y deveria pertencer a (M ⊥ )⊥ . Mas, então, pelo Lema 3.3, deve existir em M um único
elemento z0 que está mais próximo de x + y. Por outro lado, pelo Lema 3.2, (M ⊥ )⊥ é um
subespaço vetorial, por isso, w = (x + y) − z0 ∈ (M ⊥ )⊥ . No entanto, pelo Teorema 3.5, nós
temos que (x + y) = z0 + w, com w ∈ M ⊥ . Todavia, como M ⊥ = {0} =⇒ (x + y) = z0 .
Isto prova que, realmente, x + y ∈ M.
A seguir, tome α ∈ K e x ∈ M. Assim, α⟨0, x⟩ = ⟨0, αx⟩ = 0, para todo x ∈ M.

Portanto, αx ∈ M. Consequentemente, M é fechado sob as operações de soma de vetores e
multiplicação por um elemento de K definidas sobre H . Logo, M é um subespaço fechado.
Só resta provar que M = H . Do Teorema 3.5 e das conclusões acima temos que H =
M ⊕ M ⊥ = M ⊕ M ⊥ ⇒ M ⊂ H . Sejam x ∈ H e (xn )n∈N uma sequência em M tal que
xn → x. Como M é fechado, x ∈ M ⇒ H ⊂ M. Portanto, M é denso em H .
Nota 3.12. De acordo com a Proposição 3.9, o fato do conjunto M ser denso em H na
Proposição 3.14, implica que M é completo. Esta hipótese é essencial na prova do Teorema 3.7,
uma vez que ser completo implica na maximalidade de M. Contudo, pode acontecer de termos
um espaço pré-Hilbertiano H com um conjunto ortonormal M ⊂ H tal que M ̸= H (veja,
por exemplo, o artigo de J. Dixmier, “Sur les bases orthonormales dans les espaces préhilbertiens,
Acta Sci. Math. Szeged 15 (1953) 29).
Demonstração do Teorema 3.7. Recorremos, novamente ao Lema de Zorn. Assuma que M =

{Mα }α∈A seja a famíla de todos os subconjuntos de vetores mutuamente ortonormais de H ;
então por convenção, M1 ≺ M2 , se, e somente se, M1 ⊂ H , M2 ⊂ H e M1 ⊂ M2 . Isto
109
Espaços de Hilbert
define uma relação de ordem parcial em H . Note que, se H ̸= {0}, então M é não-vazio,
uma vez que para 0 ̸= x ∈ H temos que (x/∥x∥) é um conjunto ortonormal e, portanto,
pertence a pelo menos um subconjunto
+ Mα . Além disso, se M = {Mα }α∈A é uma família
totalmente ordenada, então a união α∈A Mα é um conjunto ortonormal que contém cada Mα
e é, portanto, um limite superior para a cadeia de conjuntos {Mα }α∈A . Pelo Lema de Zorn,
existe um elemento maximal Mm ∈ M . Vamos verificar que Mm é de fato denso em H . De
⊥
acordo com a Proposição 3.14, Mm é denso em H se, e somente se, Mm = {0}. Suponha
⊥
que ∃ x0 ∈ Mm , com x0 ̸= 0. Então, Mm ⊂ Mm ∪ {(x0 /∥x0 ∥)}. Porém isto contradiz a
maximalidade de Mm em M , isto é, nenhum outro sistema ortonormal pode conter Mm como
um subconjunto próprio. Isto conclui a prova do teorema.
COROLÁRIO 3.7. Todo espaço de Hilbert não-trivial tem uma base ortonormal.
Nota 3.13. É importante enfatizar que, em geral, uma base em um espaço de Hilbert não é
uma base algébrica. A base de Hamel, que é um conceito puramente algébrico, não é muito
apropriada no tratamento de espaços de Hilbert de dimensão algébrica infinita, uma vez que
uma base de Hamel para um espaço de Hilbert de dimensão infinita é não-contável. De fato,
cada subespaço de dimensão finita de um espaço de Hilbert H de dimensão infinita tem
interior vazio, e não é denso em toda parte em H .5 Segue-se então, como consequência do
Teorema de Categoria de Baire, que H nunca pode ser a união de um número contável desses
subespaços de dimensão finita. Portanto, esses subespaços de dimensão finita não podem servir
de base.6 Ao final deste capítulo damos uma prova (veja Proposição 3.17) que um conjunto
ortonormal completo infinito nunca é uma base de Hamel em um espaço de Hilbert.
Como indicado na nota acima, o conceito de base em um espaço de Hilbert difere do

conceito de base em um espaço vetorial. O ponto que distingue estes conceitos é o fato
que para a definição de uma base em um espaço de Hilbert um processo de limite é usado.
Por exemplo, no caso de um espaço;de Hilbert separável H , o elemento x ∈ H tem uma
representação como uma série x = ∞ n=1 αn xn nos elementos xn da base, porém não como
uma combinação linear. Em 1927, J. Schauder introduziu o conceito de base de espaços de
Hilbert que leva em consideração a estrutura topológica desses espaços.
DEFINIÇÃO 3.13 (Base de Schauder). Uma sequência (xn )n∈N em um espaço de Hilbert H
é uma base de Schauder se para todo vetor x ∈ H existe uma única sequência de escalares
(αn )n∈N ⊂ K tal que
<∞
x= αn xn ,
n=1
isto é, tal que

? ?
? j
< ?
? ?
lim ?x − αn xn ? = 0 .
j→∞ ? ?
n=1
Diz-se que a base de Schauder (xn )n∈N é normalizada quando todos os vetores da base têm
norma 1.
5
Veja a Definição 1.38 onde se define um conjunto denso em toda parte.
6
Para detalhes sobre o Teorema de Categoria de Baire veja M. Reed and B. Simons, “Methods of Modern
Mathematical Physics. Functional Analysis,” Vol. I, Academic Press, 1980, pg.80.
110
Espaços de Hilbert
Naturalmente, a definição acima se aplica no caso de H ser de dimensão finita N; basta,

para tanto, assumir que αn = 0 se n > N!
Nota 3.14. Falar de convergência na Definição 3.13 não é tão trivial. Por exemplo, considere o
espaço de; sequências complexas. Naturalmente,
;∞ existe uma norma associada ao produto interno
⟨α, β⟩ = ∞ α β
n=1 n n , isto é, ∥α∥ = n=1 |α | 2
n . Tome o vetor (1, i, −1, −i, 1, i, −1, −i, . . .).
Logicamente, sua norma é infinita. Portanto, este exemplo mostra que, sem hipóteses adicionais,
falar de norma pode trazer outras dificuldades. O Teorema 3.8 abaixo estabelece qual hipótese
deve ser respeitada para podermos falar de convergência e normas na Definição 3.13 sem
dificuldades.
DEFINIÇÃO 3.14. Seja x1 , x2 , . . . uma sequência infinita em H . Diz-se que a série infinita
; ∞
n=1 αn xn converge,; e o vetor y ∈ H é dito ser a sua soma, se a sequência de somas parciais
y1 , y2, . . ., com yj = jn=1 αn xn é convergente e tem y como seu limite.
Em outras palavras, para qualquer ε > 0, arbitrário, existe um número positivo N(ε) tal
que ∥y − yn ∥ < ε parar todo n > N(ε). Mas, como H é completo, a definição acima é
equivalente à afirmação de que y1 , y2, . . . é uma sequência de Cauchy.
TEOREMA 3.8. Sejam (xn )n∈N uma sequência de vetores de norma ;1 em um espaço de Hilbert
de números complexos. Então, a série ∞
H e (αn )n∈N uma sequência ; n=1 αn xn converge para
∞ 2
um elemento de H se a série n=1 |αn | é convergente.
;
Demonstração. Seja (sm )m∈N a sequência de somas parciais sm = m n=1 αn xn . Note que para
m > k > 0, temos que
? ?2
?< m ? <m <m
? ?
∥sm − sk ∥2 = ? αn xn ? # ∥αn xn ∥2 = |αn |2 = |σm − σk |2 . (3.6.1)
? ?
n=k n=k n=k
;∞ 2
Então,
;m se n=1 |αn | < ∞ temos de (3.6.1) que a sequência de somas parciais sm =
n=1 αn xn é uma sequência de Cauchy, de modo que dado ε > 0, existe N ∈ N tal
que, para todo m, k > N,
∥sm − sk ∥2 # |σm − σk |2 < ε2 =⇒ ∥sm − sk ∥ < ε .

;
Isto implica a convergência da série ∞n=1 αn xn por causa da completeza de H ; isto é, a
sequência (sm )m∈N possui um limite em H .
A caracterização de sistemas ortonormais completos em espaços de Hilbert, H , nos permite,

assim como no caso de um espaço vetorial de dimensão finita, escrever todo elemento de H
como uma combinação linear (possivelmente infinita) de elementos de um sistema ortonormal
completo. É isto o que nos mostra o seguinte
TEOREMA 3.9. Seja H um espaço de Hilbert. Então são equivalentes as seguintes afirmações:
(i) {xi }i∈I um sistema ortonormal completo para H ,
(ii) se x ∈ H e x ⊥ xi para todo i ∈ I, então x = 0,
111
Espaços de Hilbert
(iii) span({xi }i∈I ) é denso em H , ou seja, para todo vetor x ∈ H temos

<
x= ⟨xi , x⟩xi , ⟨xi , x⟩ ∈ C , (3.6.2)
i∈I
(iv) identidade de Parseval: se x ∈ H , então

<
∥x∥2 = |⟨xi , x⟩|2 . (3.6.3)
i∈I
Nota 3.15 (Convergência comutativa). A igualdade (3.6.2) indica que a soma do lado direito
converge para x ∈ H independentemente de reordenações, como consequência do Teorema
3.8. De fato, toda série absolutamente convergente é convergente independentemente de re-
ordenações. Isto é similar à noção de convergência incondicional de números reais, uma
convergência forte o bastante para garantir que nenhum rearranjo na ordem dos termos de uma
série convergente possa alterar o valor da sua soma. Esta última observação motiva a adoção
do termo convergência comutativa.
Nota 3.16. É importante enfatizar que na igualdade (3.6.2), os coeficientes ⟨xi , x⟩ são diferentes
de zero somente num conjunto contável de índices i ∈ I. De fato, se N é um inteiro positivo
maior que n∥x∥2 , então não é possível que |⟨xi , x⟩|2 " 1/n se n > N. Para vermos isto,
considere o conjunto
3 1 4
Fn = xi | |⟨xi , x⟩|2 " , em que n " 1 ,
n
e suponha que x1 , x2 , . . . , xk ∈ Fn . Então, pela desigualdade de Bessel e pela definição de Fn ,
temos
k
1 <
k· # |⟨xi , x⟩|2 # ∥x∥2 .
n i=1
Isto implica que

k # n∥x∥2 < N < ∞ .
Logo, o conjunto
3 4 &∞
F = xi | ⟨xi , x⟩ ̸= 0 = Fn ,
n=1
é a união contável de conjuntos finitos e, portanto, é contável. Assim, para cada x ∈ H o

conjunto de índices em que ⟨xi , x⟩ =
̸ 0 é contável!
Antes de provarmos o Teorema 3.9, lembremos do Corolário 3.7 que todo espaço de Hilbert
H tem uma base ortonormal. Mas, dado uma coleção de vetores quaisquer em H como
podemos obter um conjunto ortonormal a partir dessa coleção? O próximo resultado mostra
que é sempre possível obter um conjunto ortonormal a partir de uma coleção contável de
vetores linearmente independentes em H (de fato, a coleção não precisa ser necessariamente
composta só por vetores linearmente independentes!).
112
Espaços de Hilbert
PROPOSIÇÃO 3.15 (Ortonormalização de Gram-Schmidt). Seja {xi }i∈I uma coleção contável
linearmente independente em H . Então, existe uma coleção ortonormal {ei }i∈I em H , com a
mesma cardinalidade de {xi }i∈I , de forma que para todo n,
span({x1 , . . . , xn }) = span({e1 , . . . , en }) .
Demonstração. Seja S = {x1 , x2 , x3 , . . .} um conjunto contável de vetores, em que nem todos

os vetores são necessariamente linearmente independentes. Lembremos, então, do Exemplo 2.1
e da Nota 2.3 que, excluindo-se de S qualquer vetor xn+1 que seja linearmente dependente, ob-
temos um novo conjunto contável de vetores linearmente independentes S ′ = {x′1 , x′2 , x′3 , . . .}
que gera o mesmo espaço que S; ou seja, span(S) = span(S ′ ). De posse do conjunto S ′
prossegue-se da seguinte forma: como x′1 ̸= 0, define-se e1 = x′1 /∥x′1 ∥; então, {e1 } é um vetor
de norma 1. Note que x′1 e e1 geram o mesmo subespaço vetorial (neste caso uni-dimensional).
A seguir, recorremos, repetidamente, ao Lema 3.1. Primeiro, tomamos o vetor não-nulo
v2 = x′2 − ⟨e1 , x′2 ⟩e1 ,
ou seja, o vetor v2 é obtido a partir do vetor x′2 retirando-se de x′2 sua componente ao longo de
e1 (isto é, subtraimos de x′2 sua projeção sobre o subespaço gerado por e1 ; veja a figura abaixo).
−⟨e1 , x′2 ⟩e1
v2 x′2
e2
e1 ⟨e1 , x′2 ⟩e1
A seguir, normalizamos o vetor v2 : e2 = v2 /∥v2 ∥. Pelo Lema 3.1 o vetor v2 (e, portanto, e2 )
é ortogonal ao vetor e1 ; então, {e1 , e2 } é ortonormal e {x′1 , x′2 } e {e1 , e2 } geram o mesmo
subespaço (neste caso bi-dimensional). A seguir, tomamos o vetor não-nulo
v3 = x′3 − ⟨e1 , x′3 ⟩e1 − ⟨e2 , x′3 ⟩e2 ,
ou seja, o vetor v3 é obtido a partir do vetor x′3 retirando-se de x′3 suas componentes ao longo
de e1 e e2 (isto é, subtraimos de x′2 sua projeção sobre span{e1 , e2 }). A seguir, normalizamos
o vetor v3 : e3 = v3 /∥v3 ∥. Novamente, pelo Lema 3.1 o vetor v3 (e, portanto, e3 ) é ortogonal aos
vetores e1 e e2 (e, portanto, ao subespaço gerado por {e1 , e2 }). Logo, {e1 , e2 , e3 } é ortonormal
e {x′1 , x′2 , x′3 } e {e1 , e2 , e3 } geram o mesmo subespaço (neste caso tri-dimensional).
Em geral, depois de se obter {e1 , e2 , . . . , en−1 }, tomamos o vetor não-nulo
vn = x′n − ⟨e1 , x′n ⟩e1 − ⟨e2 , x′n ⟩e2 − · · · − ⟨en−1 , x⟩en−1 ,
ou seja, o vetor vn é obtido a partir do vetor x′n retirando-se de x′n suas componentes
ao longo de e1 , e2 , . . . , e en−1 (isto é, subtraimos de x′n sua projeção sobre o conjunto
span{e1 , e2 , . . . , en−1 }; veja a figura abaixo).
113
Espaços de Hilbert
;n−1
− i=1 ⟨ei , x′n ⟩ei
vn x′n
en
;n−1
i=1 ⟨ei , x′n ⟩ei
A seguir, normalizamos o vetor vn : en = vn /∥vn ∥. Como antes, pelo Lema 3.1 o vetor vn
(e, portanto, en ) é ortogonal aos vetores e1 , e2 , . . . , e en−1 (e, portanto, ao subespaço gerado
por {e1 , e2 , . . . , en−1 }). Assim, o conjunto {e1 , e2 , . . . , en } é um sistema ortonormal completo
(de fato, se n fosse o menor subescrito para o qual vn = 0, então x′n seria uma combina-
ção linear de e1 , e2 , . . . , en−1 , e, portanto, de x′1 , x′2 , . . . , x′n−1 , contradizendo a hipótese que
{x′1 , x′2 , . . . , x′n } é linearmente independente).
Consequentemente, por construção, segue que para todo n,

span({x′1 , . . . , x′n }) = span({e1 , . . . , en }) ,
uma vez que qualquer combinação linear de elementos de {x′1 , . . . , x′n } é uma combinação
linear dos elementos correspondentes de {e1 , . . . , en } e vice-versa. Isto finaliza a prova da
proposição.
Demonstração do Teorema 3.9. Estamos assumindo que I é finito ou igual a N. (i) ⇒ (ii). Se
{xi }i∈I é um sistema ortonormal completo, então, pelo Teorema 3.7, nenhum outro sistema
ortonormal pode conter {xi }i∈I como um subconjunto próprio. Logo, pela Proposição 3.14,
segue que
span({xi }i∈I ) = H ,
e para todo x ∈ H temos <
x= ⟨xi , x⟩xi .
i∈I
Assim, se ⟨xi , x⟩ = 0, para todo i ∈ I, então x = 0.
(ii) ⇒ (iii). Assuma que ⟨xi , x⟩ = 0, para todo i ∈ I, implica que x = 0. Então,
? ?2 I J
? < n ? < n n
<
? ?
?x − αi xi ? = x − αi xi , x − αi xi
? ?
i=1 i=1 i=1
I n
J I n J n
< < <
2
= ∥x∥ − x, αi xi − αi xi , x + |αi |2 ∥xi ∥2
i=1 i=1 i=1
n
< n
< n
<
= ∥x∥2 − αi ⟨xi , x⟩ − αi ⟨xi , x⟩ + |αi |2
i=1 i=1 i=1
n
< n
5 52 < 5 5
= ∥x∥ − 2 5 5
⟨xi , x⟩ + 5⟨xi , x⟩ − αi 52 , (3.6.4)
i=1 i=1
114
Espaços de Hilbert
em que α1 , . . . , αn são números

;complexos arbitrários. Em particular, se tomarmos αi = ⟨xi , x⟩
esta escolha minimiza ∥x − ni=1 αi xi ∥, fornecendo a melhor aproximação de x por uma
combinação linear dos vetores x1 , . . . , xn .7 Portanto, a hípotese (ii) junto com a escolha acima
para os coeficientes αi e a hípotese (i) garantem a convergência para zero quando n → ∞.
Assim, ? ?2
? < n ? <
? ?
lim ?x − ⟨xi , x⟩xi ? = 0 =⇒ x = ⟨xi , x⟩xi .
n→∞ ? ?
i=1 i∈I
(iii) ⇒ (iv). Seja x ∈ H . Pela Eq.(3.6.4), para todo n ∈ N, temos

? ?2
? <n ? <n
5 5
? ? 2 5⟨xi , x⟩52 ,
?x − ⟨xi , x⟩xi ? = ∥x∥ − (3.6.5)
? ?
i=1 i=1
Como, pela hipótese (i), {xi }i∈I é um sistema ortonormal completo, então, pelo Teorema 3.8,
o lado esquerdo da Eq(3.6.5) converge para zero, quando n → ∞. Logo,
? ?2 ( )
? <n ? < n
5 5
? ? 5⟨xi , x⟩52
0 = lim ?x − ⟨xi , x⟩xi ? = lim ∥x∥2 −
n→∞ ? ? n→∞
i=1 i=1
<5 5
= ∥x∥2 − 5⟨xi , x⟩52 .
i∈I
(iv) ⇒ (i). Assuma a validade da identidade de Parseval e que ⟨xi , x⟩ = 0, para todo
i ∈ I. Logo, x = 0 e isto implica que ({xi }i∈I )⊥ = {0}. Logo, span({xi }i∈I ) = H , ou seja,
{xi }i∈I um sistema ortonormal completo para H .
Na análise de espaços de Hilbert, uma vantagem imediata de termos à nossa disposição

sequências ortonormais em comparação com as sequências (arbitrárias) linearmente indepen-
dentes é o fato que, como todo elemento x de um espaço de Hilbert pode ser representado
como uma combinação linear de alguns dos elementos de uma sequência ortonormal, a orto-
normalidade dos elementos da sequência torna a determinação dos coeficientes na combinação
linear muito mais fácil. Com efeito, se (x1 , x2 , x3 , . . .) é uma sequência ortonormal em um
espaço de Hilbert e se sn ∈ span({x
;n 1 , . . . , xn }), com n fixo (mas arbitrário), então, pela
definição de span linear, sn = i=1 αi xi e se tomamos o produto interno por um xk fixo,
obtemos αk = ⟨xk , sn ⟩.8 Além disso, se adicionarmos um outro termo αn+1 xn+1 à expansão
de sn , de tal forma que temos sn+1 = sn + αn+1 xn+1 ∈ span({x1 , . . . , xn , xn+1 }), então
precisamos determinar somente mais um coeficiente ;∞uma vez que todos os outros coeficientes
2
permanecem inalterados. Ainda, se a condição i=1 |αi | < ∞ é satisfeita, e se sn → x,
então pela continuidade do produto interno temos que ⟨xi , sn ⟩ → ⟨xi , x⟩; consequentemente
αi = ⟨xi , x⟩. Muitas vezes dizemos que os αk são as coordenadas de x com respeito à base or-
tonormal {xi }i∈I . Portanto, de acordo com os resultados acima, podemos refrasear a Definição
3.12 da seguinte forma:
7
Esta propriedade dos sistemas ortonormais desempenha papel fundamental para muitas técnicas de aproxi-
mação!
8
Deve-se ressaltar que se a base é somente ortogonal, então αk ̸= ⟨xk , sn ⟩!
115
Espaços de Hilbert
DEFINIÇÃO 3.12a. Diz-se que um sistema ortonormal {xi }i∈I em um espaço de Hilbert H é
completo se todo x ∈ H tem uma única representação
<
x= αi xi ,
i∈I
em que C ∋ αi = ⟨xi , x⟩ e os xi ’s são elementos distintos de {xi }i∈I .
O próximo resultado estabelece a estreita relação entre separabilidade de espaços de Hilbert

e a existência de bases ortonormais
TEOREMA 3.10. Um espaço de Hilbert H é a separável se, e somente se, H tem uma base
ortonormal contável.
Demonstração. Suponha que H seja separável e que S = {x1 , x2 , x3 , . . .} seja um conjunto

contável de vetores, em que nem todos os vetores são necessariamente linearmente indepen-
dentes. De acordo com a Proposição 3.15, excluindo-se de S qualquer vetor xn+1 que seja
linearmente dependente, obtemos um novo conjunto contável de vetores linearmente indepen-
dentes S ′ = {x′1 , x′2 , x′3 , . . .} que gera o mesmo espaço que S; ou seja, span(S) = span(S ′ ).
Então, pelo procedimento de Gram-Schmidt, obtemos uma coleção ortonormal completa e con-
tável de vetores {e1 , e2 , e3 , . . .} em H , com a mesma cardinalidade de S ′ , de forma que para
todo n,
span({x′1 , . . . , x′n }) = span({e1 , . . . , en }) .
Inversamente, seja (xn )n∈N uma sequência ortonormal completa em um espaço de Hilbert H .
O conjunto de combinações lineares finitas de vetores com coeficientes racionais
3 4
S = (α1 + iβ1 )x1 + · · · + (αn + iβn )xn | α1 , . . . , αn , β1 , . . . , βn ∈ Q, n ∈ N ,
é obviamente contável, já que, de acordo com o argumento nas páginas 18 e 18, existe uma
correspondência direta um-a-um entre N e todos os racionais. Uma vez que, pelo Teorema 3.9,
item (iii), para todo x ∈ H e ⟨xi , x⟩ ∈ C, temos
? ?
? <n ?
? ?
?x − ⟨xi , x⟩xi ? → 0 quando n → ∞ ,
? ?
i=1
então, S é denso em H .
De acordo com o teorema acima podemos concluir que em um espaço de Hilbert separável
existem duas alternativas: (i) qualquer sistema ortonormal completo tem um número infinito
de elementos ou (ii) então existe um sistema ortonormal completo com um número finito n
de elementos. No último caso, tal sistema é uma base (no sentido do espaço vetorial) de H .
Portanto, H é um espaço vetorial de dimensão finita, e qualquer sistema de elementos n + 1
é linearmente dependente. Consequentemente, todo sistema ortonormal pode ter no máximo n
elementos nele contido. Daí resulta que todo sistema ortonormal completo deve ter n elementos.
Provamos, assim, que em um espaço Hilbert separável todo sistema ortonormal completo tem o
mesmo número de elementos. Chamamos este número a dimensão de H . Assim, se H tem
um sistema ortonormal completo infinito contável, dizemos dim H = ℵ0 .
116
Espaços de Hilbert
Neste ponto, lembremos que dois espaços vetoriais de dimensão finita são isomórfos se,
e somente se, eles tiverem a mesma dimensão. Da mesma forma, os espaços de Hilbert
são caracterizados, a menos de uma isomorfia, pela cardinalidade de sua base. Com efeito,
um isomorfismo U de um espaço de Hilbert H1 sobre um espaço de Hilbert H2 é um
mapeamento linear um-para-um de H1 sobre H2 tal que ⟨Uy, Ux⟩ = ⟨y, x⟩. Exemplos
clássicos de isomorfismos entre espaços de Hilbert aparecem na seguinte
PROPOSIÇÃO 3.16. Seja H um espaço de Hilbert.
(a) Se H tem dimensão infinita, então ele é isomorfo ao espaço ℓ2 ;
(b) Se H tem dimensão finita n, então ele é isomorfo ao espaço Cn .
Demonstração. (a) Suponha que dim H = ℵ0 e que H é separável. Então, pelo Teorema
3.10, existe um sistema ortonormal completo e contável de vetores S = {e1 , e2 , e3 , . . .} em H
tal que para todo vetor x ∈ H temos
∞
<
x= ⟨en , x⟩en , ⟨en , x⟩ ∈ C .
n=1
Defina Ux = (αn )n∈N , em que αn = ⟨en , x⟩, com n ∈ N. Pelo Exemplo 2.5 (com p = 2) e
pelo Teorema 3.8 (veja também o Teorema 3.9, item (iv)), U é um mapeamento um-para-um
de H para ℓ2 . É, também, claramente um mapeamento linear. Com efeito, se Ux = (αn )n∈N
e Uy = (βn )n∈N , então,
Ux + Uy = (αn )n∈N + (βn )n∈N = (αn + βn )n∈N = U(x + y) .
Além disso, para αn = ⟨en , x⟩ e βn = ⟨en , y⟩, com x, y ∈ H e n ∈ N, temos
⟨Uy, Ux⟩ = ⟨(βn )n∈N , (αn )n∈N ⟩

∞
< ∞
<
= β n αn = ⟨en , y⟩⟨en , x⟩
n=1 n=1
∞ @
I∞ J
< A <
= ⟨en , y⟩en , x = ⟨en , y⟩en , x = ⟨y, x⟩ .
n=1 n=1
Assim, U é um isomorfismo de H em ℓ2 . Usando-se o mesmo raciocínio acima, a prova de

(b) torna-se imediata se consideramos que S tem n elementos.
Como último resultado desta seção, vamos mostrar que um sistema ortonormal que é “pró-
ximo o suficiente” de uma base ortonormal também é uma base ortonormal.
TEOREMA 3.11 (Estabilidade de bases ortonormais). Seja {xj }Jj=1 (J finito ou infinito) uma
ortonormal para um espaço de Hilbert H . Se {uj }Jj=1 é um sistema ortonormal em H tal
base;
que j∈J ∥xj − uj ∥2 < ∞, então, {uj }Jj=1 é uma base ortonormal para H .
117
Espaços de Hilbert
Demonstração. Suponha que {uj }Jj=1 não seja uma base ortonormal para H . Então, pelo
Teorema 3.9, existe um vetor u0 ∈ H tal que ∥u0∥ = 1 e ⟨u0 , uj ⟩ = 0, j = 1, 2, . . . Escolha
um inteiro N tal que
J
<
∥xj − uj ∥2 < 1 . (3.6.6)
j=N +1
A seguir, vamos levar em conta o resultado do Exercício 3.14 que estabelece que se M e
N são subespaços de H e dim M < dim N, então, M ⊥ ∩ N ̸= {0}. Na proposição em
questão, este resultado garante a existência de um vetor w ̸= {0} no espaço gerado pelos
vetores {u0 , . . . , uN } (isto é, w ∈ span{u0 , . . . , uN }) tal que w ⊥ xj para 1 # j # N. Visto
que {xj }Jj=1 é uma base ortonormal para H e w ⊥ uj , para j > N,
< J
<
0 < ∥w∥2 = |⟨xj , w⟩|2 = |⟨xj , w⟩|2
j∈J j=N +1
J
<
= |⟨(xj − uj ), w⟩|2
j=N +1
J
<
2
# ∥w∥ ∥xj − uj ∥2 ,
j=N +1
que contradiz (3.6.6). Assim, {uj }Jj=1 é uma base ortonormal para H .
3.7 Teorema de Hahn-Banach em Espaços de Hilbert

Nesta seção queremos discutir o seguinte problema de extensão: dado que temos definido
um funcional linear contínuo g sobre um subespaço vetorial M de um espaço de Hilbert H ,
queremos saber se g pode ser estendido para todo o espaço de Hilbert H , enquanto retém
suas propriedades inicialmente válidas em M. Em outras palavras, queremos saber se é possível
encontrar um funcional linear contínuo u que, uma vez definido sobre o espaço de Hilbert H ,
coincide com o funcional linear g quando restringirmos u ao subespaço M. A resposta para
este problema é surpreendente: g pode sempre ser estendido para todo o espaço de Hilbert
H . A chave para resolver este problema é um teorema de caráter geral, o celebrado Teorema
de Hahn-Banach. Junto com o Teorema de Krein-Milman, que será discutido no Capítulo 7,
o Teorema de Hahn-Banach é um dos mais fundamentais e importantes resultados da Análise
Funcional, aparecendo em várias aplicações da Física-Matemática.
DEFINIÇÃO 3.15. Seja X um espaço vetorial. O funcional p(x) sobre X é chamado funcional
sublinear se
p(x + y) # p(x) + p(y) , ∀ x, y ∈ X ,
e
p(αx) = αp(x) , ∀x ∈ X ,α " 0 .
118
Espaços de Hilbert
Note que, toda norma em um espaço vetorial normado é um funcional sublinear!

TEOREMA 3.12 (Teorema de Hahn-Banach). Sejam H um espaço de Hilbert e p um funci-
onal sublinear sobre H . Sejam M um subespaço de H e g um funcional linear g sobre M
satisfazendo
g(x) # p(x) , ∀x ∈ M . (3.7.1)
Então, existe um funcional linear F sobre todo H tal que
F (x) # p(x) , ∀x ∈ H , (3.7.2)
F (x) = g(x) , ∀x ∈ M . (3.7.3)
Demonstração. Vamos provar o teorema assumindo que H é separável. Primeiro, se M = H

não temos nada a provar. Então, assuma que M é um subespaço próprio de H . Seja
x0 ∈ H − M. Considere o subespaço gerado por M e {x0 }, isto é, considere
M1 = M + {x0 } .
Logo, todo vetor em M1 é da forma

x + αx0 ,
em que x ∈ M e α é um escalar. Se o funcional linear f é para ser uma extensão do funcional
linear g, então
f (x + αx0 ) = f (x) + f (αx0 ) = f (x) + αf (x0 ) = g(x) + αf (x0 ) .
Note que, f é completamente determinado pela a escolha de f (x0 ). Além disso,
g(x) + αf (x0 ) # p(x + αx0 ) .
em que x ∈ M e α é um escalar. Se α > 0, então

1 6x 7 6x7
f (x0 ) # [p(x + αx0 ) − g(x)] = p + x0 − g .
α α α
Por outro lado, se α < 0, segue que
1 6 x7 6 x 7
f (x0 ) " [p(x + αx0 ) − g(x)] = g − − p − − x0 .
α α α
Logo, 6 x7 6 x 7 6x 7 6x7
g − − p − − x0 # f (x0 ) # p + x0 − g .
α α α α
Como para um dado x0 e f , f (x0 ) é uma constante, se denotarmos esta constante por µ, então
µ1 # µ # µ2 ,
em que 3 6 x7 6 x 74
µ1 = sup g − − p − − x0 ,
−(x/α)∈M α α
119
Espaços de Hilbert
e 3 6x 7 6 x 74
µ2 = inf p + x0 − g .
(x/α)∈M α α
Com efeito, como
6 x7 6 x 7 6x 7 6x7
g − − p − − x0 # p + x0 − g ;
α α α α
então se fixarmos y = −(x/α) deixando z = (x/α) variar através de todos elementos de M,
temos 6 x7 6 x 7 3 6x 7 6 x 74
g − − p − − x0 # inf p + x0 − g ≡ µ2 .
α α (x/α)∈M α α
Como isto acontece para todo y ∈ M, temos
3 6 x7 6 x 74 6x 7 6x7
µ1 ≡ sup g − − p − − x0 #p + x0 − g .
−(x/α)∈M α α α α
Portanto, µ1 # µ2 . Basta, agora tomar µ1 # f (x0 ) # µ2 . Naturalmente, se x ∈ M, então

f (x) = g(x); ou seja, f estende g. No entanto, a extensão f é única somente quando µ1 = µ2 .
A seguir fazemos uso da separabilidade assumida de H . Neste caso, existe uma sequência
(xn )n∈N que é densa em H . Construa subespaços lineares da forma Mn+1 = {xn } + Mn ,
com (n = 1, 2, . . .). Repetindo os mesmos argumentos usados acima prova-se a existência de
funcionais lineares f1 , f2 , f3 , . . . sobre os subespaços lineares M = M0 ⊂ M1 ⊂ M2 ⊂ · · ·
tais que, fn (x) # p(x), com (n = 1, 2, . . .). Claramente, fn coincide fn−1 sobre Mn−1 .
Desta forma, podemos obter um funcional linear sobre um subconjunto denso V de H .
Como V = H , existe uma sequência (xn )n∈N em V que converge para x em H . Defina
F (x) = limn→∞ F (xn ). Este limite existe uma vez que K é completo. Portanto, F é uma
extensão de fn e coincide com fn sobre Mn .
Nota 3.17. O Teorema de Hahn-Banach não se refere à unicidade da extensão. Em geral,

não existe unicidade. Um bom exemplo de aplicação concreta do Teorema de Hahn-Banach
em que a unicidade das extensões de funcionais definida em subespaços não acontece, é o
problema da renormalização na teoria quântica dos campos. De fato, a renormalização envolve
estender, em cada ordem da teoria perturbativa, o domínio de definição do produto de campos
(distribuições) para todo o espaço, incluíndo os pontos coincidentes. No entanto, esta extensão
não é única. Isto gera, ao final do processo, um número de constantes livres que devem ser
fixadas apropriadamente através de um conjunto não singular de condições de normalização.
Uma consequência importante do Teorema de Hahn-Banach é a existência de extensões

limitadas de funcionais limitados definidos em subespaços de H , como mostra o seguinte
COROLÁRIO 3.8. Dado um subespaço vetorial M de um espaço de Hilbert H , todo funcional

linear contínuo g em M pode ser estendido a um funcional linear contínuo F em H ; ou seja,
F (x) = g(x) para todo x ∈ M, de modo que ∥F ∥ = ∥g∥.
Demonstração. Tome
p(x) = ∥g∥∥x∥ , x∈M .
120
Espaços de Hilbert
Então p é um funcional sublinear e
g(x) # p(x) , x∈M .
Pelo Teorema de Hahn-Banach existe um funcional F definido sobre todo H tal que F (x) =
g(x) para todo x ∈ M e
F (x) # p(x) , x ∈ H .
Como
−F (x) = F (−x) # p(−x) = ∥g∥∥ − x∥ , x∈H ,
temos
|F (x)| # ∥g∥∥x∥ , x∈H .
Assim, ∥F ∥ # ∥g∥. Mas, como F é uma extensão de g, devemos ter ∥g∥ # ∥F ∥. Logo,
∥F ∥ = ∥g∥.
F
H −−−→ K |F (x)| # ∥F ∥∥x∥H
K
⏐
⏐
g
M −−−→ K |g(x)| # ∥g∥∥x∥M .
3.8 Sobre a Compacidade da Bola Unitária em Espaços de

Hilbert de Dimensão Infinita
Sempre que um conjunto é dotado de uma topologia, muitas questões técnicas automatica-
mente exigem alguma atenção. Nesta seção, nossa atenção estará direcionada para a questão
sobre a compacidade da bola unitária em espaços de Hilbert de dimensão infinita. Este assunto
é tão difícil quanto importante. De fato, ele é muito importante. Já foi enfatizado no início
deste capítulo que espaços de Hilbert generaliza a noção de espaços euclidianos. De fato, se um
espaço de Hilbert tem dimensão finita sua identificação com um espaço euclidiano é imediata.
Contudo, no caso de um espaço de Hilbert de dimensão infinita existem diferenças essenciais,
principalmente, quando levamos em conta a estrutura topológica desses espaços. Do Corolário
1.10, aprendemos que todo conjunto compacto de um espaço topológico munido de uma métrica
é fechado e limitado. No entanto, em geral, o inverso do Corolário 1.10 não é verdade: apesar
dos espaços de Hilbert pertencerem à classe de espaços topológicos munidos de uma métrica, a
bola unitária, enquanto fechada e limitada, só é compacta para espaços de Hilbert de dimensão
finita. No caso de espaços de Hilbert de dimensão infinita, a bola unitária não é compacta com
respeito à topologia forte (ou topologia da norma), com a consequência de que, em tal caso,
existe muito poucos conjuntos compactos de interesse para análise. Entretanto, a bola unitária
é compacta com relação à topologia fraca. São estes resultados que estudamos nesta seção.
3.8.1 Não-Compacidade (Forte) da Bola Unitária em Espaços de Hilbert
TEOREMA 3.13. Seja H um espaço de Hilbert de dimensão infinita. Então a bola unitária
fechada, de centro em zero, definida por
! "
B[0; 1] = x ∈ H | ∥x∥ # 1 ,
121
Espaços de Hilbert
não é compacta.
Para provar este teorema, precisamos de alguns resultados auxiliares. Vamos começar mos-
trado que quando um espaço de Hilbert H tem dimensão finita, o isomorfismo de H sobre
Cn do Teorema 3.16 é, na verdade, um homeomorfismo. Assim, podemos dizer que a topologia
de Cn é a única topologia vetorial que um espaço de Hilbert complexo de dimensão finita pode
ter.
LEMA 3.6. Se H tem dimensão finita, então o isomorfismo de H sobre Cn é um homeomor-

fismo, isto é, H e Cn são topologicamente isomorfos.
Demonstração. Veja o livro de A.E. Taylor, “Introduction to Functional Analysis,” John Wiley,
1958, Theorem 3.12-A, pg.95.
LEMA 3.7. Sejam H um espaço de Hilbert (de qualquer dimensão) e M ⊂ H . Suponha que
M tenha dimensão finita. Então, M é fechado.
Demonstração. Pela Proposição 4.4 e pelo Lema 3.6 segue que M é completo. Então, pela
Proposição 3.10 M é fechado.
TEOREMA 3.14 (Lema de Riesz para Espaços de Hilbert). Sejam M e N subespaços vetoriais
de um espaço de Hilbert H (de qualquer dimensão). Suponha que M seja um subespaço vetorial
fechado de N. Então, para cada número real α no intervalo (0, 1) existe um z ∈ N tal que
∥z∥ = 1 e ∥z − y∥ " α, para todo y ∈ M.
Demonstração. Tome qualquer x ∈ N − M. Seja r = d(x,!M) a distância entre

" x e M (veja
a figura abaixo). Lembre-se que neste caso d(x, M) = inf ∥x − y∥ | y ∈ M . Note que ao
assumirmos M fechado, então r > 0.
r
x
y0
M
N
H
Tome, agora, y0 ∈ M tal que

r
∥x − y0 ∥ # .
α
Observe que r/α > r, visto que α ∈ (0, 1). Logo, pela definição de ínfimo, segue que
r
r # ∥x − y0 ∥ # .
α
122
Espaços de Hilbert
Defina
x − y0
z= .
∥x − y0 ∥
Então, ∥z∥ = 1. Note que z ∈ N − M. Com efeito, assuma que z ∈ M, então ∥x − y0 ∥z ∈ M,
visto que M é um subespaço vetorial de H . Isto implica que x − y0 ∈ M, e a soma de vetores
(x − y0 ) + y0 também deve pertencer a M. Mas (x − y0 ) + y0 = x. Isto implicaria que x ∈ M,
o que contradiz a hipótese de x ∈ N − M.
Além disto, para todo y ∈ M, segue que

? ?
? x − y0 ?
∥z − y∥ = ?
? ∥x − y ∥ − y ?
?
0
1 ? ?
? ?
= · ?x − (y0 + ∥x − y0 ∥ · y)? .
∥x − y0 ∥
? ?
? ?
Dado que y0 + ∥x − y0 ∥ · y ∈ M, temos que ?x − (y0 + ∥x − y0 ∥ · y)? " r; ou seja,
r
∥z − y∥ " .
∥x − y0 ∥
Porém,
r α
" · r =⇒ ∥z − y∥ " α .
∥x − y0 ∥ r
Uma vez que y é assumido ser arbitrário, isto completa a prova.
Demonstração do Teorema 3.13. A ideia é usar o lema acima repetidamente com r = 1/2.
Primeiro, assuma que B[0; 1] é compacta. Escolha qualquer vetor x1 de norma 1. Para espaços
de Hilbert este vetor pode ser qualquer vetor da base ortonormal {e1 , e2 , . . . , en , . . .}, em que
para cada n ∈ N, en = (0, . . . , 0, 1, 0, . . .). Assim, escolhemos x1 = e1 . O vetor e1 gera
um subespaço próprio M1 uni-dimensional de H , que é fechado pelo Lema 3.7. Pelo Lema
de Riesz d(e2 , M1 ) " 1/2. Por sua vez, os vetores e1 , e2 geram um subespaço próprio M2
bi-dimensional de H , que também é fechado pelo Lema 3.7. Aplicando mais uma vez o Lema
de Riesz, temos que d(e3 , M2 ) " 1/2. Note que o conjunto de vetores {e1 , e2 , e3 } ∈ B[0; 1].
Prosseguindo por indução, encontraremos uma sequência (en )n∈N de elementos en ∈ B[0; 1] e
uma sequência de subespaços fechados Mn tal que d(en+1 , Mn ) " 1/2. Em particular, segue
que para quaisquer √ dois elementos da base ortonormal {e1 , e2 , . . . , en , . . .}, teremos sempre
que ∥em − en ∥ = 2, para todo m ̸= n ∈ N. Consequentemente, a sequência (en )n∈N
não pode ter uma subsequência convergente, contradizendo a hipótese de compacidade de
B[0; 1].
Nota 3.18. Uma outra prova do Teorema 3.13 está baseada no Problema 4, do Capítulo V, do
livro de Reed-Simons, “Methods of Modern Mathematical Physics. Functional Analysis,” Vol. I,
(veja também o livro do Blanchard-Brüning, “Mathematical Methods in Physics. Distributions,
Hilbert Space Operators and Variational Methods,” Teorema 18.1.1). O objetivo é provar que todo
espaço vetorial topológico localmente convexo (pelo Teorema 2.12 um espaço de Hilbert é um
espaço vetorial topológico localmente convexo), é localmente compacto (veja Definição 2.24) se
ele for de dimensão finita.
123
Espaços de Hilbert
TEOREMA 3.15. Sejam H um espaço de Hilbert e B[0; 1] a bola unitária fechada em H .

Então, B[0; 1] é compacta se, e somente se, H tem dimensão finita.
Demonstração. Se H é dimensão finita, então pelo Lema 3.6 a topologia de Cn é a única

topologia vetorial que um espaço de Hilbert complexo de dimensão finita pode ter e pelo
Exemplo 1.32 toda bola fechada e limitada é compacta. Inversamente, assuma que B[0; 1] é
compacta em H . Designa por B(x; r) a bola aberta de centro x ∈ H e raio r > 0. Então,
C = {B(x; r) | x ∈ B[0; 1]} é uma cobertura aberta de B[0; 1] para qualquer r > 0. A
compacidade de B[0; 1] implica que existe uma subcobertura finita, isto é, existem pontos
x1 , . . . , xn ∈ B[0; 1] tal que
n
&
B[0; 1] ⊂ {x1 , . . . , xn } + rB(0; 1) = B(xi ; r) . (3.10)
i=1
em que B(xi ; r) = xi + rB(0; 1).
Seja M o subespaço vetorial de H gerado pelos vetores x1 , . . . , xn . Certamente, dim M #

n e, pelo Lema 3.7, é fechado em H . Assim,
n
&
B[0; 1] ⊂ (xi + rB(0; 1)) ⊂ M + rB(0; 1) ⊂ M + rB[0; 1] .
i=1
Tome r = 1/2. Portanto, B[0; 1] ⊂ M + 12 B[0; 1]. Isto implica 12 B[0; 1] ⊂ 12 (M + 21 B[0; 1]),
e porque M é subespaço vetorial de H , segue que λM = M, para todo escalar λ ̸= 0. Assim,
1
2
B[0; 1] ⊂ M + 41 B[0; 1] ⇒ B[0; 1] ⊂ M + (M + 14 B[0; 1]) = M + 41 B[0; 1]. Prosseguindo
por indução, vemos que
1
B[0; 1] ⊂ M + B[0; 1] , (3.11)
2k
para todo k ∈ N. Agora, fixe um y ∈ B[0; 1]. Então, para cada k existem xk ∈ M e
yk ∈ B[0; 1] tais que y = xk + 21k yk ; isto implica que xk = y − 21k yk . Como B[0; 1] é
compacta, existe uma subsequência (ykr )r∈N da sequência (yk )k∈N tal que limk→∞ ykr = z em
H . Assim, tomando o limite k → ∞, temos
, -
1
lim xkr = lim y − k yk
k→∞ k→∞ 2
1
= y − lim yk
k→∞ 2k
1
= y − lim · lim yk
k→∞ 2k k→∞
= y − 0z = y .
Mas, M é um subespaço fechado. Logo y ∈ M ⇒ B[0; 1] ⊂ M. Por fim, note que
H = ∪∞r=1 rB[0; 1]. Portanto,
∞
& ∞
&
H ⊂ rM = M =M .
r=1 r=1
Consequentemente, dim H # n. A prova está completa.
124
Espaços de Hilbert
3.8.2 Compacidade (Fraca) da Bola Unitária em Espaços de Hilbert
A compacidade sequencialmente fraca tem a mesma importância que a compacidade no

sentido da convergência forte (no caso de espaços de Hilbert falamos de convergência segundo
a norma). Para provar que para espaços de Hilbert infinitos a bola unitária é compacta com
relação à topologia fraca, vamos lançar mão do fato de estármos considerando aqui somente
espaços de Hilbert que são separáveis e o fato que espaços de Hilbert são reflexivos.
Um primeiro passo importante para mostrar que a bola unitária fechada de um espaço
de Hilbert é compacta na topologia fraca é mostrar que sequências fortemente limitadas têm
subsequências fracamente convergentes. Começamos com a seguinte
DEFINIÇÃO 3.16 (Vizinhança fraca). Para um espaço de Hilbert H , uma base de vizinhanças
para a topologia fraca é
U(x0 ; y1 , . . . , yn ; r) , para y1 , . . . , yn ∈ H , r > 0 , n ∈ N ,

3 4
U(x0 ; y1 , . . . , yn ; r) = x ∈ H | |⟨yj , (x − x0 )⟩| < r , i = 1, . . . , n .
Observe que, o produto interno é, devido às suas propriedades, invariante por translações;
portanto, podemos tomar x0 = 0 na definição acima.
LEMA 3.8. Seja (yn )n∈N uma sequência limitada de vetores em um espaço de Hilbert H , no
sentido que ∥yn ∥ # C para n ∈ N. Então, esta sequência converge fracamente para um vetor
y ∈ H se a sequência numérica ⟨yn , x⟩ converge para ⟨y, x⟩ quando x é qualquer vetor de um
conjunto denso contável M de H .
Demonstração. A hipótese que ∥yn ∥ # C, para n ∈ N, implica que |⟨yn , x⟩| # C∥x∥; isto
é, para todo vetor x dado, o produto escalar ⟨yn , x⟩ forma uma sequência numérica limitada.
Além disso, dado um ε > 0 arbitrário, escolha κ grande o suficiente tal que ∥x − xκ ∥ # ε,
com xκ ∈ M (isto é possível já que xκ → x). Então,
|⟨yn , x⟩ − ⟨ym , x⟩| # |⟨yn , x⟩ − ⟨yn , xκ ⟩| + |⟨yn, xκ ⟩ − ⟨ym , xκ ⟩| + |⟨ym , x⟩ − ⟨yn , x⟩|
# ∥yn ∥∥x − xκ ∥ + |⟨yn, xκ ⟩ − ⟨ym , xκ ⟩| + ∥ym ∥∥x − xκ ∥
# 2Cε + |⟨yn , xκ ⟩ − ⟨ym , xκ ⟩| ,
o que garante a convergência da sequência (⟨yn , x⟩)n∈N para todo x ∈ M. Com efeito,
podemos tomar o lado direito da desigualdade acima tão pequeno quanto desejarmos, tomando
ε suficientemente pequeno no primeiro termo e n, m suficientemente grande no segundo termo
(já que pela hipótese xκ ∈ M). Visto que M é um conjunto denso contável em H , de acordo
com Definição 3.11, podemos sempre encontrar um vetor xκ ∈ M para o qual ∥x−xκ ∥ < ε para
todo vetor x ∈ H e todo ε > 0, arbitrário. Assim, concluímos que limn→∞ ⟨yn , x⟩ = ⟨y, x⟩
para todo vetor x ∈ H . Portanto, (yn )n∈N é fracamente convergente.
TEOREMA 3.16. De toda sequência limitada (yn )n∈N em um espaço de Hilbert H separável,
no sentido que ∥yn ∥ # C para n ∈ N, nós podemos extrair uma subsequência fracamente
convergente.
125
Espaços de Hilbert
Demonstração. Como H é separável, existe um conjunto contável de vetores M que é denso

em toda parte em H . Suponha que a sequência (yn )n∈N em H é limitada na norma. Então,
a sequência numérica
⟨y1 , x1 ⟩, ⟨y2, x1 ⟩, . . . , para x1 ∈ M ,
é limitada e, portanto, pelo clássico Teorema de Bolzano-Weierstrass (yn )n∈N contém uma
subsequência (yn1k )k∈N de modo que a sequência numérica
⟨yn11 , x1 ⟩, ⟨yn12 , x1 ⟩, . . . ,
converge. Da mesma forma, a subsequência (yn1k )k∈N contém uma subsequência (yn2k )k∈N de
modo que a sequência
⟨yn2k , x2 ⟩, ⟨yn2k , x2 ⟩, . . . , para x2 ∈ M ,
converge. Continuando esta construção, obtemos um sistema de subsequências (ynjk )j,k∈N tal
que (i) (yn(j+1)k )j,k∈N é uma subsequência de (ynjk )j,k∈N e (ii) (ynjk )j,k∈N converge para todo
vetor x ∈ M. Portanto, tomando a “sequência diagonal”
yn11 , yn22 , yn33 , . . . ,
obtemos uma sequência numérica
⟨yn11 , xn ⟩, ⟨yn22 , xn ⟩, . . . , para xn ∈ M ,
que converge para todo n. Mas, então, pelo Lema 3.8, essa sequência converge para todo vetor
x∈H.
A topologia fraca em um espaço de Hilbert H não é metrizável. No entanto, quando restrito

à esfera unitária fechada, é metrizável de acordo com o seguinte
LEMA 3.9. Dado um espaço de Hibert H separável, seja B[0; 1] a esfera unitária fechada em
H . Então, na bola fechada B[0; 1] em H , a topologia fraca induz a topologia de um espaço
métrico através da função
∞
<
d(y, z) = 2−n |⟨(y − z), xn ⟩| ,
n=1
em que {x1 , . . . , xn , . . .} é qualquer conjunto contável denso em toda parte em H .
Demonstração. A primeira observação a se fazer é que d(x, y) tem todas as propriedades de

uma métrica, e além disso é invariante sob translações, no sentido de que
d(y + w, z + w) = d(y, z) .
! "
Portanto, precisamos apenas verificar que cada “bola aberta” B(0; ε) = x | d(x, 0) < ε
contém a interseção de B[0; 1] com alguma vizinhança fraca de zero em H . Com efeito, seja
N tal que 2−N < ε/2, e considere a vizinhança fraca de zero
3 4
U(0; x1 , . . . , xn ; ε) = y ∈ H | |⟨y, xi ⟩| < ε/2 , i = 1, . . . , N .
126
Espaços de Hilbert
Então, y ∈ B[0; 1] ∩ U(0; x1 , . . . , xn ; ε) implica que

N
< ∞
<
−n
d(y, 0) = 2 |⟨y, xn ⟩| + 2−n |⟨y, xn⟩|
n=1 n=N +1
N ∞
ε < −n <
# 2 + 2−n < ε ,
2 n=1 n=N +1
e, portanto, B[0; 1] ∩ U(0; x1 , . . . , xn ; ε) ⊂ B(0; ε).
Reunindo todos os resultados desta subseção, a compacidade anunciada da bola unitária

fechada em relação à topologia fraca segue facilmente.
TEOREMA 3.17. Em um espaço de Hilbert H separável a bola unitária fechada B[0; 1] é

fracamente compacta.
Demonstração. Uma vez que a topologia fraca é metrizável nessa bola, é suficiente mostrar a
compacidade sequencial. Dada qualquer sequência (xn )n∈N ⊂ B[0; 1], podemos extrair dela
uma subsequência fracamente convergente pelo Teorema 3.9 e o limite fraco dessa subsequência
pertence à bola B[0; 1] por causa do Lema 3.8. Isso prova compacidade sequencial.
Nota 3.19. Na verdade, as bolas fechadas em qualquer espaço de Banach reflexivo, não apenas
em espaços de Hilbert, são fracamente compactas.
3.9 O Espaço L2(Rn) e a Mecânica Quântica

Entre os espaços de Hilbert, um dos exemplos mais importantes é o espaço composto por
funções de quadrado integrável, também chamado de espaço L2 (Rn ). Em outras palavras,
L2 (Rn ) é o espaço composto por funções para as quais a integral do quadrado do valor
absoluto é finita. Assim, se $
dx |Ψ(x)|2 < ∞ ,
Rn
então Ψ é de quadrado integrável em Rn . As funções de quadrado integrável formam um
espaço vetorial com um produto interno dado por
$
⟨Ψ, Φ⟩ = dx Ψ(x)Φ(x) ,
Ω
em que Ψ e Φ são de quadrado integrável, Ψ é o complexo conjugado de Ψ e Ω ⊆ Rn é o

conjunto sobre o qual a integral é realizada. Se Ψ = Φ, então
M$
H
∥Ψ∥2 = ⟨Ψ, Ψ⟩ = dx Ψ(x)Ψ(x) > 0 (a não ser que Ψ = 0) .
Ω
define a norma em L2 (Rn ). Tecnicamente, afirmar que a norma L2 é positiva, isto é, que
∥Ψ∥2 > 0, a não ser que Ψ = 0, não é completamente correto. Aqui, devemos entender que
127
Espaços de Hilbert
Ψ = 0 em quase-toda-parte (q.t.p.), um conceito que está fundamentado na teoria de integração

de Lebesgue.
Da desigualdade de Hölder (veja o Lema 6.9) – que é a desigualdade de Cauchy-Schwarz-

Bunjakowski para integrais em L2 (Rn ) – segue que
5 5
5⟨Ψ, Φ⟩5 # ∥Ψ∥2 ∥Φ∥2 ,
enquanto que, da desigualdade de Minkowski (veja tb. o Lema 6.9), pode-se mostrar que quando
Ψ, Φ ∈ L2 (Rn ), então Ψ + Φ ∈ L2 (Rn ) e
∥Ψ + Φ∥2 # ∥Ψ∥2 + ∥Φ∥2 .
As funções de quadrado integrável formam um espaço métrico completo sob a métrica

induzida pelo produto interno definido acima. Portanto, o espaço das funções de quadrado
integrável é um espaço de Banach, sob a métrica induzida pela norma acima, que por sua vez
é induzida pelo produto interno. Como temos a propriedade adicional do produto interno, este
é especificamente um espaço de Hilbert, porque o espaço é completo sob a métrica induzida
pelo produto interno. Além disso, pode-se mostrar que este espaço de Hilbert é separável.
Várias propriedades do espaço L2 (Rn ), bem como as desigualdades de Hölder e Minkowski,
serão provadas no Capítulo 6, no contexto da teoria das distribuições. O motivo para adiarmos
as provas desses resultados para o Capítulo 6 é devido ao fato deles exigirem uma maior
maturidade do leitor sobre a teoria de integração e medida de Lebesgue, e são mais facilmente
tratáveis usando-se o ferramental da teoria das distribuições.
É óbvio que se Ψ, Φ ∈ L2 (Rn ) e λ ∈ C, então, λΨ, λΦ ∈ L2 (Rn ); além disso,

$ $
⟨Ψ, λΦ⟩ = dx Ψ(x)λΦ(x) = λ dx Ψ(x)Φ(x) = λ⟨Ψ, Φ⟩ ,
Ω Ω
e $ $
⟨λΨ, Φ⟩ = dx , λ Ψ(x)Φ(x) = λ dx Ψ(x)Φ(x) = λ⟨Ψ, Φ⟩ .
Ω Ω
Portanto,
$ $
∥λΨ∥22 = dx λ Ψ(x)λΨ(x) = |λ| 2
dx Ψ(x)Ψ(x) = |λ|2∥Ψ∥22 .
Ω Ω
Isto implica que ∥λΨ∥2 = |λ|∥Ψ∥2. Ainda, temos que

,$ - $
. /
⟨Ψ, Φ⟩ = dx Ψ(x)Φ(x) = dx Ψ(x)Φ(x) = ⟨Φ, Ψ⟩ .
Ω Ω
Tudo isto evidencia a caráter vetorial do espaço L2 (Rn ). A diferença é que L2 (Rn ) não é um
espaço de Hilbert de dimensão finita, já que seus elementos não são combinações lineares de
um dado número finito de elementos. De fato, L2 (Rn ) é um exemplo de um espaço de Hilbert
de dimensão infinita, o que significa que qualquer base para o conjunto L2 (Rn ) exigirá um
número infinito de funções de base.
128
Espaços de Hilbert
Dada uma sequência (Ψn )n∈N ⊂ L2 (Ω), com Ω ⊆ Rn , e um elemento Ψ ∈ L2 (Ω), diz-se
que a sequência (Ψn )n∈N converge fortemente para Ψ se
lim ∥Ψ − Ψn ∥2 = 0 .
n→∞
Para garantir esta convergência é necessário e suficiente que

lim ∥Ψm − Ψn ∥2 = 0 .
m,n→∞
Em outras palavras, se existe uma sequência (Ψn )n∈N de funções em L2 (Ω) tal que ∥Ψm −
Ψn ∥2 → 0, quando m, n → ∞, então existe uma função Ψ ∈ L2 (Ω) tal que ∥Ψ − Ψn ∥2 → 0,
quando n → ∞. A sequência (Ψn )n∈N de funções em L2 (Ω) que satisfaz esta propriedade é
chamada, como já vimos, sequência de Cauchy. Isto nos leva ao seguinte
TEOREMA 3.18 (Completeza de L2 ). Dada uma sequência (Ψn )n∈N ⊂ L2 (Ω), então para que
exista um elemento Ψ ∈ L2 (Ω) em direção ao qual a sequência converge fortemente, é necessário
e suficiente que ∥Ψm − Ψn ∥2 → 0, quando m, n → ∞.
Demonstração. A condição de necessidade segue, imediatamente, da desigualdade de Minkowski

escrevendo Ψm − Ψ no lugar de Ψ e Ψ − Ψn no lugar de Φ; então, temos
∥Ψm − Ψn ∥2 # ∥Ψm − Ψ∥2 + ∥Ψ − Ψn ∥2 → 0 quando m, n → ∞ .
Para mostrar que esta condição também é suficiente, assuma que a sequência (Ψn )n∈N ⊂
L2 (Ω) é Cauchy, isto é, para qualquer ε > 0, existe um N(ε) tal que se m, n > N(ε), então,
∥Ψm − Ψn ∥2 < ε. Seja mk = N(2−k ); então a subsequência (Ψmk )mk ∈N ⊂ L2 (Ω) satisfaz a
condição
∥Ψmk+1 − Ψmk ∥2 # 2−k .
Defina a função Ψ por
∞
< . /
Ψ(x) = Ψm1 (x) + Ψmk+1 (x) − Ψmk (x) , ∀x ∈ Ω .
k=1
Note que, a soma parcial

N
< −1
. /
SN (Ψ(x)) = Ψm1 (x) + Ψmk+1 (x) − Ψmk (x) = ΨmN (x) .
k=1
Então, pela desigualdade de Minkowski, segue que

? ?
?N<−1
. / ?
? ?
∥ΨmN ∥2 # ∥Ψm1 ∥2 + ? Ψmk+1 − Ψmk ?
? ?
k=1 2
N
< −1
? ?
# ∥Ψm1 ∥2 + ?Ψm − Ψm ?
k+1 k 2
k=1
N
< −1
# ∥Ψm1 ∥2 + 2−k .
k=1
129
Espaços de Hilbert
Isto mostra que as normas ∥ΨmN ∥2 são majoradas por ∥Ψm1 (x)∥2 + 1 ou, equivalentemente,
que as integrais de |ΨmN |2 permanecem limitadas. Agora, note que,
? ?
?<∞
. / ?
? ?
∥Ψ − ΨmN ∥2 = ? Ψmk+1 (x) − Ψmk (x) ?
? ?
k=N 2
∞
< ? ?
# ?Ψm − Ψm ?
k+1 k 2
k=N
∞
<
# 2−k
k=N
∞
< ′
= 2−(k +N ) = 2−N → 0 quando N → ∞ .
k ′ =0
Isto prova a condição de suficiência. Além disso, se Ψ∗ fosse também o limite da mesma
sequência, então,
∥Ψ − Ψ∗ ∥2 # ∥Ψ − ΨmN ∥2 + ∥ΨmN − Ψ∗ ∥2 → 0 quando N →∞,
ou seja, ∥Ψ − Ψ∗ ∥2 = 0 ⇒ Ψ = Ψ∗ !
Vamos, agora, considerar uma sequência ortonormal completa (Φn )n∈N ⊂ L2 (Rn ) e um
elemento arbitrário Ψ ∈ L2 (Rn ). Pela desigualdade de Bessel temos que
∞
< 5 5
5⟨Φn , Ψ⟩52 # ∥Ψ∥22 .
n=1
Uma vez que a série à esquerda da desigualdade de Bessel converge para um número menor ou
igual a ∥Ψ∥22 , então,
? m ?
?< ? <m
5 5
? ? 5⟨Φn , Ψ⟩52 → 0 quando ℓ, m → ∞ .
? ⟨Φn , Ψ⟩Φn ? =
? ?
n=ℓ 2 n=ℓ
Portanto, pelo Teorema 3.18, a série

∞
<
⟨Φn , Ψ⟩Φn (x) , (3.9.1)
n=1
converge fortemente para algum elemento Λ de L2 (Rn ).9 No entanto, pela Proposição 3.12, a
convergência forte implica a convergência fraca; logo,
( m ) ( m )
< <
⟨Φk , Λ⟩ = lim ⟨Φn , Ψ⟩⟨Φn , Φk ⟩ = lim ⟨Φn , Ψ⟩δnk = ⟨Φk , Ψ⟩ .
m→∞ m→∞
n=1 n=1
9
Note que, na convergência da série (3.9.1) usamos o fato que o quadrado dos módulos dos seus coeficientes
forma uma série convergente, de acordo com o Teorema 3.8.
130
Espaços de Hilbert
Assim,
⟨Φk , Ψ − Λ⟩ = 0 .
Isto implica que Ψ −Λ é perpendicular a todos os elementos da sequência ortonormal completa
(Φn )n∈N e, consequentemente, a todas as combinações lineares dos elementos dessa sequência.
Mas, como a sequência ortonormal (Φn )n∈N é completa, pelo Teorema 3.9, isto implica que
Ψ − Λ = 0 ⇒ Ψ = Λ. Também pelo Teorema 3.9, esta última condição implica que
∞
<
Ψ(x) = ⟨Φn , Ψ⟩Φn (x) , ⟨Φn , Ψ⟩ ∈ C ,
n=1
que, por sua vez, implica a identidade de Parseval

∞
<
∥Ψ∥22 = |⟨Φn , Ψ⟩|2 .
n=1
Com base na análise acima, temos o seguinte
TEOREMA 3.19 (Teorema de Riesz-Fischer). Dados uma sequência arbitrária de números com-
plexos (cn )n∈N tal que
<∞
|cn |2 < ∞ ,
n=1
e uma sequência ortonormal completa (Φn )n∈N ⊂ L2 (Rn ), a série

∞
<
cn Φn ,
n=1
convirgirá fortemente para uma função Ψ ∈ L2 (Rn ) e, neste caso,

∞
<
cn = ⟨Φn , Ψ⟩ e ∥Ψ∥22 = |cn |2 .
n=1
Nota 3.20. Já tínhamos estabelecido anteriormente, na Proposição 3.16, que qualquer espaço
de Hilbert separável de dim H = ℵ0 é isomorfo a ℓ2 . Assim, quaisquer dois desses espa-
ços são isomórfos e, em certo sentido, existe apenas um espaço complexo e um espaço de
Hilbert separável de dim H = ℵ0 (o mesmo é verdade para os espaços de Hilbert reais;
qualquer espaço de Hilbert separável real de dim H = ℵ0 é isomórfo ao espaço real ℓ2 ).10
Portanto, o Teorema 3.19 pode ser visto como um caso particular da Proposição
; 3.16. De fato,
a sequência arbitrária de números complexos (cn )n∈N , tal que a série ∞ 2
n=1 n | converge,
|c
é um elemento do espaço ℓ2 . Assim, pelo Teorema de Riesz-Fischer, a sequência ortonormal
completa (Φn )n∈N ⊂ L2 (Rn ) estabelece uma correspondência um-para-um entre os elementos
10
Mas, então, por que é importante estudar outros espaços de Hilbert separáveis além do espaço de sequências
ℓ2 ? É porque esses outros espaços de Hilbert separáveis têm, assim como o espaço L2 (Rn ), uma estrutura
adicional que é perdida se forem tratados como espaços de sequências. Enquanto os operadores diferenciais
parciais lineares, por exemplo os operadores de Schrödinger, podem ser estudados convenientemente no espaço
L2 (Rn ), isto não é em geral o caso no espaço de sequências.
131
Espaços de Hilbert
;
Ψ ∈ L2 (Rn ) e os elementos x = (cn )n∈N ∈ ℓ2 por meio da fórmula Ψ = ∞ n=1 cn Φn , que
expressa que os números complexos cn são as “coordenadas” de Ψ no sistema ortonormal for-
mado pelos Φn . Esta correspondência preserva a estrutura linear, já qua combinações lineares
dos Ψ correspondem a combinações lineares dos {cn }, e também preserva a estrutura métrica,
já que pela identidade de Parseval produtos escalares e normas dos elementos de L2 (Rn ) são
iguais àqueles dos correspondentes elementos em ℓ2 . Em resumo, os espaços L2 (Rn ) e ℓ2 têm
as mesmas estruturas linear e métrica, e, consequentemente, podem ser considerados como
realizações do mesmo espaço abstrato, que é definido precisamente pelas propriedades comuns:
linearidade, existência de produtos escalares e normas, e também pela validade do critério de
Cauchy para a convergência forte.
O espaço L2 desempenha um papel importante em muitas áreas da análise matemática. Ele

também desempenha um papel fundamental na física, especialmente na mecânica quântica.
Neste caso, a motivação para se adotar o espaço L2 tem origem na interpretação que mudou o
nosso próprio modo de conceber o movimento de partículas subatômicas, que era baseado na
mecânica clássica e no conceito de trajetória. Em vez de uma trajetória, Schrödinger associou ao
elétron uma função (complexa) chamada função-de-onda Ψ(x, y, z) de tal forma que, de acordo
com Max Born, seu módulo ao quadrado |Ψ(x, y, z)|2 define a distribuição de probabilidade de
encontrar uma partícula no ponto do espaço com coordenadas (x, y, z). Para ser mais preciso,
Born assumiu que se a partícula se encontra em um estado representado pela função Ψ,11 a
quantidade
d3 x Ψ(t, x)Ψ(t, x) = d3 x |Ψ(t, x)|2 , para todo t ∈ R ,
deve ser interpretada como a densidade de probabilidade de encontrar a partícula no ponto
x ∈ Ω ⊆ R3 . Esta interpretação obviamente requer a condição de normalização
$
d3 x |Ψ(t, x)|2 = 1 .
Ω
Neste novo cenário, a visão determinista da mecânica clássica (posição exata da partícula a cada
instante) foi substituída pela visão estatística da mecânica quântica (probabilidade de encontrar a
partícula em um ponto no espaço). Consequentemente, do ponto de vista da mecânica quântica,
a escolha de L2 (Ω) como o espaço de estados de uma partícula “localizável” é consistente com
a interpretação probabilística da função-de-onda Ψ. Se H é o espaço de Hilbert de funções de
quadrado integrável Ψ, então podemos dizer que toda função-de-onda situa-se sobre a esfera
unitária no espaço H . Portanto, nós não consideramos H = L2 (Ω) como um espaço abstrato,
mas sim como o conjunto de funções-de-onda da mecânica quântica de quadrado integrável
definidas no espaço de configuração 3-dimensional.
11
Por este motivo, Ψ é chamada função de estado da partícula.
132
Espaços de Hilbert
Apêndice 3A: Caracterização Topológica de um Espaço de

Hilbert
Neste apêndice estabelecemos as condições necessária e suficiente para que um espaço
vetorial topológico seja um espaço com produto interno. Os resultados foram obtidos da tese
de Lambert.12
Existem vários resultados na literatura que caracterizam um espaço com produto interno em
termos de uma dada norma.13 Um destes resultados, conhecido como Teorema de Jordan-von
Neumann de 1935, é a combinação das Proposições 3.6 e 3.7.
Nota 3.21. É importante que seja enfatizado que se uma dada norma não satisfaz as pro-
priedades que caracterizam um espaço com produto interno, isto de forma alguma exclui a
possível existência de uma outra norma com uma topologia equivalente que possa induzir um
produto interno sobre o espaço. Isso é o que acontece com seguinte exemplo. Seja X o plano
euclidiano. Normas equivalentes podem ser definidas sobre X por
. /1/p
∥x∥p = |a|p + |b|p
em que x = (a, b). Pode-se facilmente verificar, através das Proposições 3.6 e 3.7, que, se p = 2
a norma ∥x∥2 induz um produto interno sobre X , enquanto que para p = 1 isto não ocorre.
TEOREMA 3.20 (Teorema 12 de Lambert). Seja X um espaço vetorial topológico para o qual
existe uma base de Hamel H, tal que o conjunto
n
< n
<
! "
C= x∈X |x= αi xi , xi ∈ H, |αi |2 < 1, n arbitrário ,
i=1 i=1
é aberto e limitado. Então, X é um espaço com produto interno.
Demonstração. Primeiro provaremos que o conjunto C é convexo. Sejam x, y ∈ C. Logo,

n
< n
<
x= αi xi , xi ∈ H , |αi |2 < 1 ,
i=1 i=1
e n n
< <
y= βi xi , xi ∈ H , |βi |2 < 1 .
i=1 i=1
Para qualquer t, tal que 0 < t < 1, segue que
n
< n
<
tx + (1 − t)y = t αi xi + (1 − t) βi xi
i=1 i=1
n
< . /
= tαi + (1 − t)βi xi .
i=1
12
H.B. Lambert, “Topological Characterization of an Inner Product Space,” Dissertation in Mathematics, Graduate
Faculty of Texas Technological College, 1968.
13
Uma coletânea destes resultados pode ser encontrada no livro de V.I. Istrǎtescu, “Inner Product Structures:
Theory and Applications,” Series: Mathematics and Its Applications, Vol. 25, Springer, 1987.
133
Espaços de Hilbert
Por sua vez,

6<
n
5 5 71/2 6<
n
5 71/2 6<
n
5 52 71/2
5tαi + (1 − t)βi 52 # 5tαi | 2
+ 5(1 − t)βi 5
i=1 i=1 i=1
6<
n
5 2 71/2 6<
n
5 52 71/2
=t 5 αi | + (1 − t) 5βi 5
i=1 i=1
< t + (1 − t) = 1 .
;n 5 52
Portanto, 5 5 < 1.
i=1 tαi + (1 − t)βi
Nosso próximo passo é mostrar que ; C é equilibrado

; e absorvente (veja Definição
; 2.21). De
se |t| # 1 e x ∈ C, segue que t ni=1 αi xi = ni=1 tαi xi . Daí segue que, ni=1 |tαi |2 =
fato,;
|t|2 ni=1 |αi |2 < 1. Logo, C é equilibrado. Da ;nmesma forma, > 0 tal que |u−1 | # 1,
;nse u −1
−1 −1
então, para x ∈ C, temos
; ;nque u 2 x = u i=1 αi xi = i=1 u αi xi . Daí segue que,
n −1 2 −1 2
i=1 |u α i | = |u | i=1 |α i | < 1. Portanto, C é absorvente.
Uma vez que C é convexo, equilibrado e absorvente, definimos

! "
∥x∥ = inf u | u > 0, u−1x ∈ C .
∥x∥ é chamado funcional de Minkowski de M. Note que ∥x∥ < ∞ para todo x ∈ X , visto
que C é absorvente. A norma sobre X será precisamente o funcional de Minkowski.
;n
Observe que se x = i=1 αi xi e ∥x∥ = u, então
?<n ?
−1 ? −1 ?
1 = u ∥x∥ = ? u αi xi ? .
i=1
Isto significa que u−1 x está sobre a fronteira de C (lembre-se que os elementos da fronteira
de um conjunto não precisam necessariamente pertencer ao conjunto,
;n se ele é um conjunto
aberto, como é o caso de C). Por sua vez, isto implica que i=1 |u αi |2 = 1. Portanto,
;
−1
n 2 2
i=1 |αi | = u = ∥x∥ .
;n
Tome
;x, y ∈ X tais que x ̸= 0, y ̸= 0 e x = ±y. Como antes, assuma que x = i=1 αi xi
n
e y = i=1 βi xi , para x ∈ H, então
n
< n
<
2 2 2
∥x + y∥ + ∥x − y∥ = |αi + βi | + |αi − βi |2
i=1 i=1
n 6
< 7
= |αi + βi |2 + |αi − βi |2 .
i=1
Lembrando que para αi e βi complexos temos
|αi ± βi |2 = (αi ± β i )(αi ± βi )
= αi αi ± αi β ± β i αi + β i βi ,
134
Espaços de Hilbert
então,
n 6
< 7 n 6
< 7
2 2
|αi + βi | + |αi − βi | = 2 |αi |2 + |βi |2 .
i=1 i=1
Consequentemente,
n 6
< 7 6 7
2 2 2 2 2 2
∥x + y∥ + ∥x − y∥ = 2 |αi | + |βi | = 2 ∥x∥ + ∥y∥ .
i=1
Pela Proposição 3.6, X é um espaço com produto interno. Isto completa a prova do teorema.
COROLÁRIO 3.9. Se X é um espaço vetorial topológico com um produto interno induzido pelo
conjunto C do Teorema 3.20, então o conjunto H do mesmo teorema é uma base ortonormal
com respeito à este produto interno.
Demonstração. H ;= {x1 , x2 , . . . , xn } é um subconjunto linearmente independente de X , por

definição. Se x = ni=1 αi xi , então
?<n ?2 @<
n n
< A <n <
n
2 ? ?
∥x∥ = ? αi xi ? = αi xi , αj xj = αi αj ⟨xi , xj ⟩ .
i=1 i=1 j=1 i=1 j=1
;n
Por outro lado, do Teorema 3.20, ∥x∥2 = i=1 |αi |2 . Logo,
n <
< n n
<
αi αj ⟨xi , xj ⟩ = |αi |2 =⇒ ⟨xi , xj ⟩ = δij .
i=1 j=1 i=1
Os resultados até agora apresentados nos leva à seguinte
PROPOSIÇÃO 3.17. Um conjunto ortonormal completo infinito nunca é uma base de Hamel em
um espaço de Hilbert.
Demonstração. Seja H um espaço de Hilbert e C um conjunto ortonormal completo infinito em

H . Uma vez que C é assumido ser infinito, pode-se extrair de C uma sequência enumerável ; de
elementos distintos, (x1 , x2 , x3 , . . .). Se αi ∈ K,;(i = 1, 2, . . .), segue que a série ∞
i=1 i xi
α
∞ 2
converge para algum;x ∈ H se, e somente se, i=1 |αi | < ∞. De fato, se consideramos a
soma parcial Sn = ni=1 αi xi e supomos que n > m, então
? ?2
? ?2 ? n
< ? n
<
?Sn − Sm ? = ?
? α x
?
i i? = |αi |2
? ?
i=m+1 i=m+1
; ;n
se a série ∞
Com isso, ; i=1 αi xi converge,
2
i=m+1 |αi | deve ir a zero, quando n, m → ∞,
∞ 2
e;a série i=1 |αi | deve convergir. Reciprocamente, suponha que quando ;nn, m → ∞,
n 2
i=m+1 |α i | → 0. Isto implica que a sequência de
;∞ somas parciais S n = i=1 αi xi é de
Cauchy, e uma vez que H é um espaço de Hilbert, i=1 αi xi converge para algum x ∈ H .
135
Espaços de Hilbert
Tomemos agora a série

<∞
1
x .
2 i
(3A.1)
i=1
i
;
Como a série ∞ 1
i=1 i4 converge, segue que a série (3A.1) deve convergir para algum x ∈ H .
Suponha que C é uma base para H . Então, de acordo com a Nota 2.4, x ∈ H pode ser
escrito como uma combinação linear finita de elementos de C, ou seja, poderíamos escrever
x = α1 x1 + · · · + αn xn ,
em que x1 , x2 , . . . , xn ∈ C e α1 , α2 , . . . , αn são escalares. Tome j como sendo qualquer outro

índice de valor diferente de 1, 2, . . . , n. Assim,
1 @ < 1 A ∞
= xj , xi = ⟨xj , α1 x1 + · · · + αn xn ⟩ = 0 ,
j2 i=1
i2
o que é contraditório. Portanto, C não pode ser uma base de Hamel.
136
Segunda Parte:
Elementos de Teoria de Operadores Lineares
137
Capítulo 4
Operadores Lineares em Espaços de
Hilbert
“O comportamento de um físico em relação à Matemática é similar ao de um ladrão inteligente em relação ao

código penal: ele estuda apenas o suficiente para evitar as punições.”
I.M. Gel’fand
A teoria dos operadores lineares é um campo muito amplo, com numerosas facetas e uma
série de aplicações. Existem conexões profundas dessa teoria com a análise funcional, a física
matemática e a análise complexa, só para citar algumas. Podemos definir a teoria dos operadores
lineares como sendo o estudo das operações entre espaços vetoriais topológicos, sendo estes
em geral (mas não exclusivamente) os espaços de Banach, de Hilbert ou de Fréchet (e seus
duais). No presente capítulo, examinaremos a teoria dos operadores lineares em espaços de
Hilbert. Essa classe de operadores desempenha um papel fundamental na formulação da teoria
quântica. Faremos uma apresentação das ferramentas mais importantes e métodos da teoria de
operadores em espaços de Hilbert, focando, em particular, a existência dos operadores auto-
adjuntos. Naturalmente, em nossa escolha de temas, tentamos refletir a diversidade subjacente,
e qualquer escolha de tópicos necessariamente deixa de lado alguns aspectos da teoria.
4.1 Fatos Básicos

Iniciamos com alguns resultados elementares sobre operadores lineares entre espaços ve-
toriais normados. Lembre-se que qualquer mapeamento entre certos conjuntos é especificado
dando-se os seguintes dados: um domínio, um espaço-alvo e uma regra que nos informa como
associar a um elemento do domínio um elemento no espaço-alvo. Quando o domínio e o
139
Operadores Lineares em Espaços de Hilbert
espaço-alvo carregam uma estrutura linear, podemos considerar os mapeamentos que respeitam
essa estrutura. Tais mapeamentos são chamados lineares.
Alerta: Apesar de estarmos interessados no estudo de operadores lineares em espaços de

Hilbert, o leitor atento vai observar que vários resultados apresentados ao longo deste capítulo
estão relacionados com espaços vetoriais que não são, necessariamente, espaços de Hilbert. No
entanto, todos esses resultados são válidos em um espaço de Hilbert!
DEFINIÇÃO 4.1. Sejam X , Y dois espaços vetoriais sobre o mesmo corpo K. Um operador A
de X para Y é uma regra que associa a cada vetor do subespaço Dom(A) ⊂ X um único
vetor Ax em Y . O vetor Ax é chamado a imagem do vetor x ∈ X , ou o “valor” do operador A
no vetor x. Diz-se que o operador A é linear se, e somente se, A é homogêneo
A(αx) = αAx , ∀ x ∈ Dom(A), α ∈ K
e aditivo
A(x + y) = Ax + Ay , ∀ x, y ∈ Dom(A) .
Equivalentemente, A : X → Y é linear se, e somente se,
A(αx + βy) = αAx + βAy , ∀ x, y ∈ Dom(A) e α, β ∈ K .
Nota 4.1 (Anti-linearidade). Diz-se que um operador é anti-linear se
A(αx + βy) = αAx + βAy , ∀ x, y ∈ Dom(A) e α, β ∈ C .
Observe que um operador anti-linear é distinto de um operador linear apenas para espaços
vetoriais complexos ou, mais geralmente, para espaços vetoriais sobre corpos K para os quais
uma operação de involução é definida por um mapeamento a 3→ a, para a, a ∈ K, obedecendo
às condições que a = a, a+b → a+b e ab → ba. Como o caso de espaços vetoriais complexos
é de generalidade suficiente para a mecânica quântica, ignoramos as possibilidades mais gerais.
Na Definição 4.1, o subespaço Dom(A) em que a ação de A está definida é chamado

domínio de definição de A, ou simplesmente domínio de A; ele contém no mínimo o vetor
nulo e sempre temos que A0 = 0. O conjunto de todos os vetores em Y que são imagens
/ X é chamado o alcance (ou range) de A, denotado por Ran(A) =
de. vetores em
A Dom(A) , isto é,
3 4
Ran(A) = y ∈ Y | y = Ax, tal que x ∈ Dom(A) ⊂ X .
É fácil verificar que Ran(A) não é apenas um subconjunto de Y , mas também é um su-
bespaço de Y . A dimensão de Ran(A) é chamada de rank de A; nós a denotamos por
rank(A).
DEFINIÇÃO 4.2. Sejam X , Y dois espaços vetoriais sobre o mesmo corpo K. Diz-se que A é
um funcional linear (ou forma linear) sobre X se, em particular, Y = K.
DEFINIÇÃO 4.3. Sejam X , Y espaços vetoriais. Por La (X , Y ) representamos o conjunto de
todos os operadores lineares A de X em Y .
140
DEFINIÇÃO 4.4 (Endomorfismo). Seja X um espaço vetorial. Por La (X , X ) ≡ La (X )

denota-se o conjunto de todos os operadores lineares A de X sobre si mesmo. Neste caso,
dizemos que A define um endomorfismo de X .
Ao longo de todo o texto sempre que afirmarmos que “A é um operador em X ” significa

que A é um operador de X sobre si mesmo.
DEFINIÇÃO 4.5 (Dual Algébrico). Seja X um espaço vetorial sobre K. Chamaremos dual
algébrico de X o conjunto
3 4
X ∗ = La (X , K) = A : X → K | A é um funcional linear .
Nota 4.2. O índice “a” nas definições acima representa a inicial de algébrico; significa que não
se exige a noção de continuidade.
Nota 4.3. Os conjuntos dos operadores lineares La (X , Y ), La (X ) e X ∗ são espaços
vetoriais se definimos a adição de operadores e a multiplicação de operadores por escalares da
forma natural, isto é
(A1 + A2 )x = A1 x + A2 x , ∀ x ∈ Dom(A1 + A2 ) ,
em que Dom(A1 + A2 ) = Dom(A1 ) ∩ Dom(A2 ) e

(αA)x = α(Ax) , ∀ x ∈ Dom(αA) = Dom(A) ,
Em cada caso, o operador que mapea todo x ∈ X no elemento zero, é o zero do espaço vetorial
de operadores. Uma vez que estamos sempre supondo que o domínio de um operador é um
subespaço vetorial, o conjunto Dom(A1 )∩Dom(A2 ) nunca é vazio porque 0 ∈ Dom(A1 )∩
Dom(A2 ). No entanto, no caso extremo, poderíamos ter Dom(A1 ) ∩ Dom(A2 ) = {0} e,
então, A1 + A2 é um operador trivial (com Ran(A1 + A2 ) = {0} também), um resultado que
não é de muito interesse.
DEFINIÇÃO 4.6. O espaço nulo (ou kernel) de um operador linear A : X → Y é o conjunto
3 4
Ker(A) = x ∈ X | Ax = 0 .
Ker(A) é um subespaço de X .
É muito fácil mostrar que o conjunto Ker(A) é um subespaço linear de Dom(A). A

dimensão de Ker(A) é chamada de nulidade de A, a qual denotaremos por null(A). Pode-se
mostrar que
rank(A) + null(A) = dim X .
Um operador linear A : Dom(A) ⊂ X → Y , é chamado injetivo se, e somente se,

Ax1 = Ax2 , com x1 , x2 ∈ Dom(A), implica que x1 = x2 . Em outras palavras, um operador
linear A de X em Y é injetivo se, e somente se, o seu espaço nulo Ker(A) é trivial, isto é,
Ker(A) = {0}. Um operador linear A é sobrejetivo se, e somente se, o seu conjunto imagem
é igual ao espaço-alvo, ou seja, Ran(A) = Y . Diz-se que um operador linear A é bijetivo se,
e somente se, ele for tanto injetivo quanto sobrejetivo. Um exemplo importante de um operador
bijetivo é o operador identidade.
141
DEFINIÇÃO 4.7 (Operador inverso). Sejam X e Y espaços vetoriais. Suponha que A é um

operador linear com domínio Dom(A) ⊂ X e conjunto imagem Ran(A) ⊂ Y . O operador
A tem um inverso se, e somente se, a correspondência entre os vetores x e Ax, quando x varia
sobre Dom(A), é uma correspondência biunívoca entre os vetores do conjunto Dom(A) e os
vetores do conjunto Ran(A).
De acordo com a definição acima, podemos dizer que o operador A tem um inverso se a
equação vetorial
Ax = y . (4.1.1)
tem solução única para todo y ∈ Ran(A); ou seja, se Ax1 = Ax2 , então, x1 = x2 . Dessa
forma, se o operador A tem um inverso, podemos associar a única solução de (4.1.1) com cada
y ∈ Ran(A). Isto dá um operador, com domínio Ran(A), chamado o inverso de A e
denotado por A−1 .
LEMA 4.1. Sejam X e Y espaços vetoriais. Suponha que A seja um operador linear com
domínio Dom(A) ⊂ X e conjunto imagem Ran(A) ⊂ Y . O inverso do operador A existe
se, e somente se, Ax = 0 implica que x = 0. Quando A−1 existe ele é um operador linear.
Demonstração. Pela Definição 4.7, o operador inverso A−1 existe se, e somente se, Ax1 = Ax2
implica que x1 = x2 . Suponha que Ax = 0 e que Ax1 = Ax2 . Então, pela linearidade
de A, segue que A(x1 − x2 ) = 0; portanto x1 − x2 = 0, ou x1 = x2 . Assim, A−1 existe.
Reciprocamente, suponha que A−1 existe. Seja x um vetor tal que Ax = 0. Então, x =
A−1 (Ax) = A−1 0 ⇒ x = 0, já que A−1 também tem um inverso, o operador A, e isto
é garantido provando-se que A−1 é linear. Com efeito, assuma que A−1 (αy1 + βy2 ) ̸=
αA−1 y1 + βA−1 y2 . Usando a linearidade de A e o fato que yi = Axi (i = 1, 2) é equivalente
a xi = A−1 yi , então
. A−1 (αy1 + βy /
−1 −1 −1
2 ) ̸= αA y1 + βA y2 ⇒ A (αAx1 + βAx2 ) ̸=
αx1 + βx2 ⇒ A−1 A(αx1 + βx2 ) ̸= αx1 + βx2 ⇒ αx1 + βx2 ̸= αx1 + βx2 , que é um
absurdo. Assim, A−1 é necessariamente linear. Isto conclui a prova do lema.
Dois operadores A e B são considerados iguais, A = B, se Dom(A) = Dom(B) e

Ax = Bx para cada x no domínio comum. Por outro lado, o produto AB de dois operadores
lineares A e B é definido de tal forma que o domínio de AB consiste daqueles elementos x
do domínio de B para os quais Bx pertence ao domínio de A. Em outras palavras, se Ω é o
maior subconjunto de Dom(B) cuja imagem sob B situa-se em Dom(A), então,
B(Ω) = Ran(B) ∩ Dom(A) ,
em que Ran(B) é a imagem de B. Logo, define-se o produto AB como sendo o operador

com domínio
Dom(AB) = Ω = {x ∈ Dom(B) | Bx ∈ Dom(A)} ,
tal que para todo x ∈ Dom(AB)
(AB)x = A(Bx) .
142
O produto AB é simplesmente a composição de A e B. Tradicionalmente, no contexto dos

operadores, a palavra produto é usada em vez de composição. Novamente, como no caso da
soma de operadores, pode acontecer do Dom(AB) estar definido somente para o vetor nulo,
0.
Quando um operador A é multiplicado por um escalar λ, então, o resultado pode ser

interpretado como o produto do operador de multiplicação λ1I e do operador A, ou seja,
λA = (1Iλ)A. Esta interpretação diferente não muda as propriedades da operação. Em algumas
situações, pode ser conveniente identificar escalares com operadores de multiplicação. Visto
que 1IA = 1A, o operador identidade é muitas vezes denotado por 1.
De tudo que foi dito até agora sobre os operadores lineares, um ponto precisa ser desta-
cado (principalmente porque isto às vezes é ignorado, especialmente nos livros sobre mecânica
quântica): deve ficar claro que um operador linear A : X → Y não pode ser considerado
como totalmente especificado até que o seu domínio de definição esteja caracterizado – ou seja,
até que o conjunto de todos os vetores x ∈ X , para os quais Ax tem significado, tenha sido
identificado. Uma mesma regra1 definirá operadores diferentes quando os domínios de definição
forem diferentes (isso já acontece mesmo no caso de funções mais simples do Cálculo, como
vimos no Exemplo 1.14).
Exemplo 4.1. Sejam H = L2 ([0, 1]) um espaço de Hilbert e A uma regra que multiplica
vetores Ψ ∈ H por 1/x. Considere os conjuntos
3 4
Ω1 = Ψ : (0, 1) → C | Ψ é contínua, supp Ψ ⊂ (0, 1) ,
3 4
Ω2 = Ψ ∈ H | Ψ = xα Φ, Φ ∈ H com α " 1 ,
3 4
Ω3 = Ψ ∈ H | x1 Ψ ∈ H .
Esses três conjuntos são subespaços lineares de H = L2 ([0, 1]) e eles são todos diferentes:
Ω1 " Ω2 " Ω3 .
Em todos os três casos, a representação matemática da regra A é invariante, isto é, multiplicamos

cada função Ψ ∈ Ωi (i = 1, 2, 3) por 1/x. Checa-se que na verdade x1 Ψ ∈ L2 ([0, 1]) em todos
os três casos. Assim, a mesma regra, multiplicar por 1/x, define três operadores lineares
diferentes:
A1 com domínio Dom(A1 ) = Ω1 , Ω1 ∋ Ψ 3→ x1 Ψ ,
A2 com domínio Dom(A2 ) = Ω2 , Ω2 ∋ Ψ 3→ x1 Ψ ,
A3 com domínio Dom(A3 ) = Ω3 , Ω3 ∋ Ψ 3→ x1 Ψ .
No entanto, a diferença na escolha do domínio de A pode alterar drasticamente as consequên-

cias obtidas pela operação de A nas funções do domínio. Por exemplo, a regra 1/x não pode
definir um operador multiplicação que tenha como domínio todo o espaço de Hilbert L2 ([0, 1]).
1
Aqui, consideramos uma “regra” como um dispositivo matemático que determina a maneira pela qual os
elementos de um espaço vetorial X estão relacionados aos elementos de um outro espaço vetorial Y .
143
De fato, a função Ψ = 1 é de quadrado integrável no intervalo [0, 1], enquanto que x1 · 1 não é
de quadrado integrável no mesmo intervalo. Portanto, devemos ter em mente que é fundamental
especificar claramente qual subespaço é escolhido como o domínio de um operador.
Nota 4.4. Neste ponto, é importante destacar o quanto é delicada a questão do domínio
de um operador. No Exemplo 4.1, assumimos como operador a regra multiplicar por 1/x
funções Ψ ∈ L2 ([0, 1]) e tomamos três domínios diferentes Ωj (j = 1, 2, 3). Afirmamos que
1
x
Ψ ∈ L2 [0, 1] nos três casos. No caso particular do Dom(A1 ) = Ω1 , assumimos que Ψ
é contínua e com supp Ψ ⊂ (0, 1). Esta última condição é fundamental para garantir que
1
x
Ψ ∈ L2 [0, 1]. Com efeito, se em Ω1 tivéssemos assumido que supp Ψ ⊆ [0, 1], então,
1
x
Ψ∈/ L2 [0, 1] como mostra o seguinte exemplo: considere a função
⎧
⎨1 se 0 # x # 1/2
Ψ(x) = .
⎩2 − 2x se 1/2 # x < 1
Note que, Ψ : [0, 1] → R é contínua em (0, 1) e como Ψ é diferente de zero no intervalo

aberto [0, 1), o fecho deste conjunto é [0, 1]. Logo,
supp Ψ = [0, 1] ,
ou seja, Ψ ∈ Ω1 . No entanto,
⎧
, - ⎨1/x se 0 < x # 1/2
1
Ψ (x) = ,
x ⎩2/x − 2 se 1/2 # x # 1
que, claramente, não pertence a L2 [0, 1], pois
$ 1 $ 1/2 $ 1
1 2
dx 2 Ψ (x) = dx 1/x +2
dx (2/x − 2)2 = +∞ .
0 x 0 1/2
A cautela mencionada acima na escolha dos domínios de um operador é relevante mesmo

quando examinamos a igualdade de dois operadores lineares. Sejam A1 e A2 operadores
lineares que mapeiam X em Y , em que ambos X e Y são espaços vetoriais topológicos com
dimensão infinita. Se quisermos afirmar que os dois operadores são iguais ou não, precisamos
examinar se os domínios Dom(A1 ) e Dom(A2 ) são completamente idênticos um ao outro.
Não é suficiente verificar se A1 e A2 representam a mesma regra matemática. Para esta situação
uma terminologia apropriada é introduzida na seguinte
DEFINIÇÃO 4.8. Sejam X , Y espaços vetoriais e A1 e A2 operadores de X em Y . Dizemos
que A1 é uma extensão de A2 se, e somente se, Dom(A2 ) ⊂ Dom(A1 ) e se A1 x = A2 x
para todo x ∈ Dom(A2 ). Também se diz que A2 é a restrição de A1 em Dom(A2 ). Neste
caso, escrevemos A2 ⊂ A1 , ou A1 ⊃ A2 .
Usando esta terminologia temos que para o Exemplo 4.1 a seguinte situação acontece:
A1 ⊂ A2 ⊂ A3 .
O Exemplo 4.1, discutido acima, mostra algumas características sobre os operadores lineares
que são muito importantes e que merecem ser destacadas:
144
1. Operadores lineares de um espaço de Hilbert H1 em um espaço de Hilbert H2 não são

necessariamente definidos em todo H1 . O domínio como um subespaço linear de H1 é
uma parte essencial da definição de um operador linear.
2. O domínio de um operador consiste de vetores que devem satisfazer duas condições

fundamentais: (1) uma condição de compatibilidade e (2) uma condição de contorno.
Uma condição de contorno nem sempre está presente. No entanto, a condição de
compatibilidade é sempre necessária. Vamos explicar a compatibilidade. Mesmo que uma
regra Ψ 3→ AΨ faça sentido matematicamente, o vetor Ψ pode não estar no domínio
de A. Considere, por exemplo, o caso em que H1 = H2 = L2 (R) e tome a função
1
Ψ(x) = 1+x 2 ∈ L2 (R) (verifique isso!). Seja A a multiplicação pela função 1 + x2 .
O operador A quando age sobre a função Ψ produz como resultado a função Φ = 1,
indicando que Ψ não pode pertencer ao domínio do operador multiplicação A, visto
que Φ ∈ / L2 (R). Assim, devemos excluir do domínio de nosso operador a função
1
Ψ(x) = 1+x 2 , e todas as funções que como ela produzem como resultado AΨ ∈ / L2 (R).
Isso nos leva à definição precisa de “compatibilidade” e mostra que existem operadores
lineares que são definidos somente em certos subespaços do espaço de Hilbert.
3. Se ou não um operador linear A pode ser definido em todo espaço de Hilbert H pode
ser decidido investigando-se o conjunto
# %
∥Ax∥
| x ∈ H , x ̸= 0 .
∥x∥
Se este conjunto não é limitado, o operador A é chamado de operador linear ilimitado.

Esses operadores não são contínuos e para lhe lidar com eles um cuidado especial deve
ser tomado. Por outro lado, se o conjunto acima é limitado o operador A é chamado de
operador linear limitado.
Uma observação final sobre a importância do domínio de um operador linear em um espaço

de Hilbert se faz necessária. Como vimos, um operador linear geralmente pode ser definido em
muitos domínios diferentes. A mesma regra formal considerada em domínios diferentes pode
conduzir a operadores com propriedades completamente diferentes (por exemplo, variando-se
as condições de contorno para o operador momentum, vamos ver isso na Seção 4.7). Assim,
determinar qual o domínio é mais relevante depende do tipo de problema do qual o operador
linear de interesse toma parte. Na sua maioria, a teoria dos operadores lineares em espaços
de Hilbert foi desenvolvida em conexão direta com a mecânica quântica, com os operadores
lineares devendo representar observáveis de um sistema e, como tal, devem ser auto-adjuntos
(uma propriedade que será tratada mais adiante). Além disso, o espectro de um operador linear
depende de uma forma muito sensível do domínio.
4.2 Operadores Limitados

Dado que os domínios dos operadores lineares sobre os quais estaremos interessados são es-
paços vetoriais normados, e como esses espaços dispõem também de uma estrutura topológica,
podemos falar sobre operadores limitados e contínuos, em completa analogia com a teoria das
funções.
145
DEFINIÇÃO 4.9. Sejam X e Y espaços vetoriais normados. Diz-se que um operador A mape-
ando X em Y é limitado se ele mapea conjuntos limitados em X em conjuntos limitados em
Y.
Lembremos que, um conjunto M em um espaço vetorial normado X é limitado se seu

“diâmetro” é finito (veja a figura abaixo)
Em outras palavras, diz-se que um conjunto M ⊂ X é limitado quando ele tem “uma ordem
de grandeza 2C,” se seu diâmetro é menor do que 2C: para todo x, y ∈ M, ∥x − y∥ < 2C,
ou equivalentemente, x − y ∈ B(0; C), com B(0; C) sendo a bola de centro 0 e raio C (veja
a figura abaixo)2
Isto significa que ∥x∥X # C para todo x ∈ M ⊂ X . Assim, dizemos que um operador
A : X → Y é limitado se existir uma constante M > 0 tal que a norma dos vetores Ax ∈ Y
é limitada por M, isto é, ∥Ax∥Y # M, para todo x ∈ M.
A noção de um operador linear ser limitado pode ser descrita em termos relativamente
simples através da seguinte
DEFINIÇÃO 4.10. Um operador linear A : X → Y é limitado se, e somente se, existe um
número real M não-negativo tal que
∥Ax∥Y # M∥x∥X , ∀ x ∈ Dom(A) ⊂ X , (C1)
2
Sem perda de generalidade, usamos a vizinhança de 0 para caracterizar a limitação de M ⊂ X .
146
em que ∥ · ∥Y e ∥ · ∥X denotam as normas em Y e X , respectivamente. Equivalentemente,

diz-se que o operador linear A é limitado se, e somente se, a função real positiva
∥Ax∥Y
x ∈ X − {0} 3→ ∈R
∥x∥X
é limitada no sentido usual, isto é, se, e somente se,
∥Ax∥Y
sup #M . (C2)
x∈X −{0} ∥x∥X
Por construção, um operador limitado é Lipschitz contínuo.3 Com efeito, de acordo com a
Definição 4.10, podemos sempre associar com qualquer operador linear limitado uma coleção
de números positivos M de forma a termos satisfeita a condição (C1). Se tomarmos o menor de
tais M’s, isto é, Mmin , então nós, efetivamente, estabelecemos uma correspondência N entre
o operador A e o conjunto dos números reais positivos, R+ : N(A) = Mmin . A função N
determinada desta forma satisfaz todas as propriedades de uma norma, e, portanto, denotamos
N(A) por ∥A∥ e nos referimos a ela como a norma do operador A. Assim,
3 4
∥A∥ = inf M " 0 | ∥Ax∥Y # M∥x∥X , ∀ x ∈ X
∥Ax∥Y
= sup . (N0)
x∈X −{0} ∥x∥X
Logo, ∥Ax∥Y # ∥A∥∥x∥X . Note que a condição ∥Ax∥Y # M∥x∥X é satisfeita por uma
constante M " 0, qualquer que seja x ∈ Dom(A) ⊂ X se, e somente se, M " ∥A∥.
Nota 4.5. Em um espaço de Hilbert, existem expressões para ∥A∥ em termos do produto
interno, isto é,
5 5
5⟨y, Ax⟩5 Re ⟨y, Ax⟩
∥A∥ = sup = sup . (4.2.1)
x∈X −{0} ∥x∥X ∥y∥Y x∈X −{0} ∥x∥X ∥y∥Y
y∈Y −{0} y∈Y −{0}
3
Lembre-se que, se X e Y são espaços normados e Ω ⊂ X um aberto não vazio, então a aplicação
Ψ : Ω → Y é dita ser lipschitziana em Ω se
∥Ψ(x1 ) − Ψ(x2 )∥ # M ∥x1 − x2 ∥ .
Em geral, a desigualdade é (trivialmente) satisfeita se x1 = x2 . Caso contrário, pode-se definir equivalentemente
uma aplicação para ser Lipschitz contínua se, e somente se, existir uma constante M " 0 tal que, para quaisquer
x1 , x2 ∈ Ω, com x1 ̸= x2 ,
∥Ψ(x) − Ψ(y)∥
#M .
∥x − y∥
A constante M é chamada constante de Lipschitz da aplicação (ou módulo de continuidade uniforme). Disso resulta
que Ψ é contínua. Ainda, se Ψ é diferenciável em Ω, então
∥Ψ(x1 ) − Ψ(x2 )∥
sup " sup ∥DΨ(x)∥ .
x1 ̸
=x 2 ∥x1 − x2 ∥ x
A igualdade vale quando Ω é convexo (verifique!). Em tal caso, Ψ é lipschitziana se, e somente se, DΨ for limitada
em Ω. A continuidade segundo Lipschitz é uma forma forte de continuidade uniforme de funções. A seguinte
cadeia de inclusões para funções definidas sobre um subconjunto fechado e limitado acontece: continuamente
diferenciável ⊆ Lipschitz contínua ⊆ uniformemente contínua. Também temos, Lipschitz contínua ⊆ absolutamente
contínua.
147
Com efeito, para x ̸= 0, segue que

5 5
∥Ax∥Y Re ⟨y, Ax⟩ 5⟨y, Ax⟩5
# sup # sup ,
∥x∥X y∈Y −{0} ∥x∥X ∥y∥Y y∈Y −{0} ∥x∥X ∥y∥Y
para todo x ∈ X e y ∈ Y . Portanto, pela definição de ∥A∥, conclui-se que

5 5
∥Ax∥Y Re ⟨y, Ax⟩ 5⟨y, Ax⟩5
∥A∥ = sup # sup # sup . (4.2.2)
x∈X −{0} ∥x∥X x∈X −{0} ∥x∥X ∥y∥Y x∈X −{0} ∥x∥X ∥y∥Y
y∈Y −{0} y∈Y −{0}
Por outro lado, pela desigualdade de Cauchy-Schwarz-Bunjakowski e, novamente, pela definição

de ∥A∥, segue que
5 5
Re ⟨y, Ax⟩ # 5⟨y, Ax⟩5 # ∥Ax∥Y ∥y∥Y # ∥A∥∥x∥X ∥y∥Y .
Isto implica que

5 5
5⟨y, Ax⟩5 Re ⟨y, Ax⟩
∥A∥ " sup " sup . (4.2.3)
x∈X −{0} ∥x∥X ∥y∥Y x∈X −{0} ∥x∥X ∥y∥Y
y∈Y −{0} y∈Y −{0}
Dessa forma, obtemos a Eq.(4.2.1) ao compararmos as Eqs.(4.2.2) e (4.2.3).

PROPOSIÇÃO 4.1. A função A 3→ ∥A∥ ∈ R é uma norma.
Demonstração. A condição de positividade na definição de norma é satisfeita imediatamente.
Desigualdade triangular. Sejam A e B dois operadores lineares limitados de X para Y .

Pela Proposição 1.4, segue que
∥Ax + Bx∥Y
∥A + B∥ = sup
x∈X −{0} ∥x∥X
∥Ax∥Y ∥Bx∥Y
# sup + sup = ∥A∥ + ∥B∥ .
x∈X −{0} ∥x∥X x∈X −{0} ∥x∥X
Homogeneidade. Sejam A um operador linear limitado de X para Y e α um escalar. Pela

Proposição 1.3, segue que
∥αAx∥Y ∥Ax∥Y
∥αA∥ = sup = |α| sup = |α|∥A∥ .
x∈X −{0} ∥x∥X x∈X −{0} ∥x∥X
Separação. Se ∥A∥ = 0, então ∥Ax∥Y # ∥A∥∥x∥X ⇒ ∥Ax∥Y = 0, para todo x ∈ X .

Mas, isto é possível somente se A = 0.
PROPOSIÇÃO 4.2. Se AB é o produto de dois operadores lineares limitados, então ∥AB∥ #
∥A∥∥B∥.
148
Demonstração. Com efeito, sejam B um operador linear limitado de X para Y e A um

operador linear limitado de Y para Z ; então
∥ABx∥Z = ∥A(Bx)∥Z # ∥A∥∥Bx∥Y # ∥A∥∥B∥∥x∥X , ∀x ∈ X .
Logo, ∥AB∥ # ∥A∥∥B∥.
Nota 4.6. Na proposição acima deve ficar claro que
3 4
Dom(AB) = x ∈ Dom(B) ⊂ X | Bx ∈ Dom(A) ⊂ Y .
Existem outras formas de definir a norma de um operador linear limitado A, como mostra
o seguinte
TEOREMA 4.1. Seja A um operador linear limitado de X para Y . Então, as normas
∥A∥1 = sup ∥Ax∥Y , (N1)
∥x∥X =1
∥A∥2 = sup ∥Ax∥Y , (N2)

∥x∥X #1
∥A∥3 = sup ∥Ax∥Y . (N3)

∥x∥X <1
coincidem com a norma ∥A∥ definida pela Eq.(N0).
Demonstração. Começamos mostrando que valem as desigualdades

∥A∥3 # ∥A∥2 # ∥A||1 # ||A|| .
De fato, temos o seguinte:
1. Seja x tal que ∥x∥X = 1. Neste caso, temos que

? , -?
? x ?
∥Ax∥Y = ?A ? ? # ∥A∥ .
∥x∥X ?
Daí, conclui-se que
∥A∥1 = sup ∥Ax∥Y # ∥A∥ .
∥x∥X =1
2. Seja x tal que ∥x∥X # 1. Se x = 0 então

∥Ax∥Y = ∥A0∥Y = ∥0∥X # ∥A∥1 .
Se 0 < ∥x∥ # 1 então
? , -?
? x ?
∥Ax∥Y = ∥x∥X ?A ? # ∥A∥1 .
? ∥x∥X ?
Juntando as informações acima, obtemos que

∥A∥2 = sup ∥Ax∥Y # ∥A∥1 .
∥x∥X #1
149
3. Seja x tal que ∥x∥X < 1. Como

! " ! "
x ∈ X | ∥x∥X < 1 ⊂ x ∈ X | ∥x∥Y # 1 ,
segue que
∥A∥3 = sup ∥Ax∥Y # sup ∥Ax∥Y = ||A||2 .
∥x∥X <1 ∥x∥X #1
Logo, temos que

∥A∥3 # ∥A∥2 # ∥A∥1 # ∥A∥ .
4. Agora, note que, para 0 < λ < 1,
λ∥A∥ # ∥A∥3 .
De fato,
? , -?
∥Ax∥Y ∥A(λx)∥Y ? x ?
λ∥A∥ = λ sup = sup = sup ? ?A λ ?
x∈X −{0} ∥x∥X x∈X −{0} ∥x∥X x∈X −{0} ∥x∥X ?Y
# sup ∥Ax∥Y
∥x∥X <1
= ∥A∥3 .
Resumindo, para 0 < λ < 1 arbitrário, temos que
λ∥A∥ # ∥A∥3 # ∥A∥2 # ||A||1 # ∥A∥ ,
mostrando que as normas ∥ · ∥1 , ∥ · ∥2 e ∥ · ∥3 são equivalentes à norma ∥ · ∥. Finalmente,

tomando o limite λ → 1 nas desigualdades acima, obtemos que as normas ∥ · ∥1 , ∥ · ∥2 e
∥ · ∥3 coincidem com a norma ∥ · ∥. Isto conclui a prova.
DEFINIÇÃO 4.11. Sejam X , Y espaços vetoriais. Um operador linear A : Dom(A) ⊂ X →
Y é dito ser:
(i) contínuo em x0 ∈ Dom(A) se ele é contínuo em x0 com respeito às topologias geradas

pelas normas ∥ · ∥X e ∥ · ∥Y . Em outras palavras, A : Dom(A) ⊂ X → Y é contínuo em
x0 ∈ Dom(A) se para todo ε > 0, existe um δ = δ(ε, x0 ) tal que ∥Ax − Ax0 ∥Y < ε quando
∥x − x0 ∥X < δ,
(ii) contínuo se ele contínuo em todos os pontos de Dom(A),
(iii) uniformemente contínuo em x0 ∈ Dom(A) se ∥Ax − Ax0 ∥Y < ε quando ∥x −

x0 ∥X < δ, com δ = δ(ε).
Segue imediatamente desta definição o seguinte

COROLÁRIO 4.1. Sejam X , Y espaços vetoriais e A um operador linear de Dom(A) ⊂ X
em Y . Então, se A é uniformemente contínuo, ele é contínuo em todos os pontos de Dom(A).
150
Vale a pena observar que o conceito de continuidade de um operador está fundamentado

sobre o conceito de “vizinhança,” isto é, um operador é contínuo se ele transforma elementos
“vizinhos” em elementos “vizinhos.” Assim, dado dois espaços vetoriais normados X e Y ,
diz-se que um operador A : Dom(A) ⊂ X → Y é contínuo no ponto x0 ∈ Dom(A) se,
dado qualquer vizinhança V do ponto y0 = Ax0 , existe uma vizinhança U do ponto x0 tal que
Ax ∈ V para todo x ∈ U ∩ Dom(A). Neste caso, é a própria norma que fornece a estrutura
topológica ao espaço (veja a Proposição 4.3). Em outras palavras, a continuidade local de um
operador linear A : Dom(A) ⊂ X → Y implica que a convergência em um ponto específico
é preservada antes e depois do mapeamento. Na verdade, a definição de continuidade requer
que, se uma sequência infinita de pontos (xn )n∈N ⊂ X converge para x0 , então a sequência
deve ser mapeada em outra sequência infinita (Axn )n∈N ⊂ Y que converge para Ax0 .
PROPOSIÇÃO 4.3. Um operador A : Dom(A) ⊂ X → Y é contínuo em Dom(A) se, e
somente se, ele é contínuo em um ponto do domínio Dom(A).
Demonstração. Sejam x0 ∈ X e A um operador linear contínuo em x0 . Então, devemos

mostrar que A é contínuo em qualquer outro ponto de x′0 ∈ X . Uma vez que A é contínuo
em x0 , segue, pelo Teorema 1.15, que toda bola aberta B∥·∥ (Ax0 ; ε), centrada em Ax0 e de
Y
raio ε, contém a imagem da bola aberta B∥·∥ (x0 ; δ); ou seja
X
. /
A B∥·∥ (x0 ; δ) ⊂ B∥·∥ (Ax0 ; ε) .
X Y
em que 3 4
B∥·∥ (x0 ; δ) = x ∈ X | ∥x − x0 ∥X < δ
X
e 3 4
B∥·∥ (Ax0 ; ε) = Ax ∈ Y | ∥Ax − Ax0 ∥Y < ε .
Y
Por uma translação, tome um outro ponto x′0 = x0 + a ∈ X . Assim,

3 4
B∥·∥ (x′0 ; δ) = x + a ∈ X | ∥(x + a) − (x0 + a)∥X = ∥x − x0 ∥X < δ .
X
Da mesma forma, temos que

3 4
B∥·∥ (Ax′0 ; ε) = A(x + a) ∈ Y | ∥A(x + a) − A(x0 + a)∥Y < ε
Y
3 4
= A(x + a) ∈ Y | ∥Ax + Aa − Ax0 − Aa∥Y < ε
3 4
= Ax ∈ Y | ∥Ax − Ax0 ∥Y < ε .
Aqui, usamos a linearidade do operador A. Portanto, o resultado acima implica que

. /
A B∥·∥ (x′0 ; δ) ⊂ B∥·∥ (Ax′0 ; ε) .
X Y
Logo, A é contínuo em x′0 .
A recíproca é imediata. Se A é contínuo em Dom(A), então A é contínuo em um ponto

qualquer x ∈ Dom(A) ⊂ X .
151
TEOREMA 4.2 (Continuidade e limitação). Sejam X , Y espaços vetoriais normados e A um

operador linear de Dom(A) ⊂ X em Y . As seguintes condições são equivalentes:
! "
(a) sup ∥Ax∥Y | ∥x∥X # 1 .
(b) Existe um C > 0 tal que ∥Ax∥Y # C∥x∥X para todo x ∈ Dom(A).
(c) A é uniformemente contínuo.
(d) A é contínuo.
(e) A é contínuo na origem.
Demonstração. (a) ⇒! (b). Seja x ∈ Dom(A)

" tal que ∥x∥X ̸= 0. Tome C = ∥A∥, isto
implica que C = sup ∥Ax∥Y | ∥x∥X # 1 . Logo, teremos
? . /? ?. / ? . /
? ? ? ?
?A x/∥x∥X ? = ? 1/∥x∥X Ax? = 1/∥x∥X ∥Ax∥Y # C .
Y Y
Portanto ∥Ax∥Y # C∥x∥X , para todo x ∈ Dom(A).
(b) ⇒ (c). Da condição de linearidade do operador A, segue que ∥A(x − x0 )∥Y =

∥Ax − Ax0 ∥Y . Logo, ∥Ax − Ax0 ∥Y # C∥x − x0 ∥X < C · δ. Tomando δ = ε/C ⇒
∥Ax − Ax0 ∥Y < ε, em que x0 é um ponto de Dom(A).
(c) ⇒ (d). Isto é imediato pela Definição 4.11 e pelo Corolário 4.1.
(d) ⇒ (e). É óbvio pela Proposição 4.3 (basta tomar y0 = 0 na proposição).
(e) ⇒ (a).! Se A é contínuo em 0, dado

" ε = 1, existirá um δ > 0 tal que se
! x ∈
B∥·∥ [0; δ] = x ∈ Dom(A) | ∥x∥X # δ , então teremos que Ax ∈ B∥·∥ [0; 1] = Ax ∈
X " Y
Y | ∥Ax∥Y # 1 , visto que A0 = 0. Ou seja, ∥x∥X # δ ⇒ ∥Ax∥Y # 1. Agora,
se ∥x∥X # 1, então ∥A(δx)∥Y # 1, uma vez que ∥δx∥X = δ∥x∥X # δ · 1. Ou seja,
∥A(δx)∥Y = δ∥Ax∥Y # 1 ⇒ ∥Ax∥Y # δ −1 se ∥x∥X # 1. A prova do teorema está
completa.
Nota 4.7. O teorema acima estabelece uma relação de equivalência entre operadores limitados
e operadores lineares contínuos. Assim, um operador linear entre espaços normados é contínuo
se, e somente se, ele é limitado. No entanto, deve-se ressaltar que na teoria dos espaços
vetoriais topológicos apesar de termos definidos os conceitos de operadores lineares contínuos
e operadores lineares limitados, nem sempre se tem a equivalência entre estes conceitos. De
fato, operadores lineares podem ou não ser limitados, e operadores limitados podem ou não
ser lineares. No entanto, a linearidade de um operador A fornece uma ponte conceitual entre
a continuidade e a limitação: os dois conceitos se tornam equivalentes se, e somente se, A é
linear.
Nota 4.8. Os Teoremas 4.1 e 4.2 aplicam-se sem modificações no caso em que A é um funcional
linear limitado. A única mudança que deve ser feita nos enunciados e nas provas é a substituição
152
do símbolo de norma ∥Ax∥Y pelo símbolo de valor absoluto |Ax|K . No caso do Teorema 4.1
teremos
∥A∥1 = sup |Ax|K ,
∥x∥X =1
∥A∥2 = sup |Ax|K ,

∥x∥X #1
∥A∥3 = sup |Ax|K .

∥x∥X <1
Levando-se em consideração o resultado do Teorema 4.2, temos as seguintes

DEFINIÇÃO 4.3a. Sejam X , Y espaços vetoriais normados. Por Lb (X , Y ) representamos a
classe de todos os operadores lineares limitados A de X em Y .
DEFINIÇÃO 4.4a. Seja X um espaço vetorial normado. Por Lb (X , X ) ≡ Lb (X ) represen-
tamos a classe de todos os operadores lineares limitados A de X sobre si mesmo.
DEFINIÇÃO 4.5a (Dual Topológico). Seja X um espaço vetorial normado sobre K. Chamaremos
dual topológico de X o conjunto
3 4
X ′ = Lb (X , K) = A : X → K | A é um funcional linear limitado .
Nota 4.9. O índice “b” nas definições acima representa a inicial de bounded; significa que a
noção de continuidade é levada em consideração. Note que
Lb (X , Y ) ⊂ La (X , Y ) .
Nota 4.10. Em espaços de dimensão finita os conceitos de dual algébrico e dual topológico
coincidem (Por que? Veja Proposição 4.4).
Na Seção 3.5 introduzimos as noções de uma sequência de vetores em um espaço de Hilbert

H que converge “fortemente” e “fracamente” para algum vetor x ∈ H . A seguir, introduzimos
outros tipos de convergências relacionadas com os operadores lineares limitados operando em
espaços de Hilbert. Identificamos três tipos de convergência de uma sequência (An )n∈N de
operadores lineares limitados de acordo com a seguinte
DEFINIÇÃO 4.12 (Sequência de operadores limitados). Sejam H um espaço de Hilbert e
An : H → H operadores lineares limitados. Diz-se que a sequência (An )n∈N de operadores
em Lb (H ) converge
w
1. fracamente para o operador A se para cada x ∈ H , An x −→ Ax, quando n → ∞; ou
seja,
w− lim An = A ⇐⇒ lim ⟨y, (An − A)x⟩ = 0 , ∀ y ∈ H .
n→∞ n→∞
s
2. fortemente para o operador A se para cada x ∈ H , An x −→ Ax, quando n → ∞; ou
seja,
s− lim An = A ⇐⇒ lim ∥An x − Ax∥ = 0 , ∀ x ∈ H .
n→∞ n→∞
153
3. uniformemente para o operador A se para cada x ∈ H , ∥An − A∥ = 0, quando

n → ∞; ou seja,
u− lim An = A ⇐⇒ lim ∥An − A∥ = 0 .
n→∞ n→∞
A convergência uniforme é também chamada convergência na norma do operador.
O seguinte resultado é uma consequência direta da definição acima:

COROLÁRIO 4.2. Se uma sequência de operadores limitados operando em um espaço de Hilbert,
H , converge uniformemente, então, ela converge fortemente; e se ela converge fortemente, então,
ela converge fracamente.
Demonstração. Com efeito, suponha que a sequência (An )n∈N de operadores em Lb (H )

converge uniformemente. Portanto, para todo x ∈ H , segue que
∥Ax − An x∥ = ∥(A − An )x∥ # ∥A − An ∥∥x∥ → 0 quando n → ∞ .
Por outro lado, note que, para todo x ∈ H , segue pela desigualdade Cauchy-Schwarz-
Bunjakowski que
|⟨y, (A − An )x⟩| # ∥(A − An )x∥∥y∥ # ∥A − An ∥∥x∥∥y∥ → 0 quando n→∞.
Assim, temos as seguintes implicações: convergência uniforme =⇒ convergência forte =⇒

convergência fraca.
Deve ficar claro que a convergência forte não implica a convergência uniforme, como nos
mostra o seguinte
Exemplo 4.2 (Operadores de projeções ortogonais). Seja H um espaço de Hilbert. Um
idempotente em H é um operador linear limitado P : H → H tal que P 2 = P . Uma
projeção é um idempotente P se Ker(P ) = Ran(P )⊥ . Além disso, se P é auto-adjunto, isto
é, P = P ∗ , então, P é chamado operador de projeção ortogonal. Vamos usar esta definição
para generalizar a decomposição H = M ⊕ M ⊥ no Teorema 3.5. Com efeito, se escrevemos
<
H = Mi , Mi ∩ Mj = {0} , i ̸= j , (4.2.4)
i∈I
em que os Mi são subespaços lineares fechados, e

<
x= xi , xi ∈ Mi , ⟨xi , xj ⟩ = 0 , i ̸= j ,
i∈I
(a soma acima é finita ou infinita contável), então, a decomposição (4.2.4) nos permite definir,
naturalmente, operadores de projeções ortogonais, Pi , sobre cada subespaço Mi ,
Pi : H → Mi , Pi (H ) = Mi ,
com a composição Pi ◦ Pj = O, se i ̸= j. Isto significa que se x é um elemento de H , então,

x = x1 + · · · + xn , em que xi ∈ Mi . Diz-se que (x1 + · · · + xn ) é a decomposição ortogonal
de x em relação a Mi , e Pi (x) = xi é a componente ortogonal, ou projeção ortogonal, de x
154
em Mi . Cada Pi é um operador linear, auto-adjunto e limitado, com ∥Pi ∥ = 1 (consulte a

Subseção 5.6.1). Assim, cada Pi é um elemento de Lb (H ). Ainda, se o conjunto de subespaços
fechados Mi é finito, por exemplo i = 1, . . . , n, segue que
1I = P1 + · · · + Pn ,
e dizemos que isto define a resolução da identidade. Por outro lado, se o conjunto de
subespaços fechados é infinito contável, podemos ainda escrever
∞
<
1I = Pi ,
i=1
mas, nesse caso, a soma parcial da série de operadores Pi deve convergir para 1I segundo a
topologia forte dos operadores. Esse é um exemplo de uma série de operadores que converge
fortemente, mas não converge uniformemente. De fato, se definirmos Pi x = ⟨xi , x⟩xi , em que
{xi }i∈I é um sistema ortonormal completo em H , e tomarmos a soma parcial
n
<
Sn = Pi ,
i=1
então, pela Definição 3.12a, segue que

? ∞ ?2
?< ? ∞
< ∞
<
? ?
∥(1I − Sn )x∥2 = ? ⟨xi , x⟩xi ? = |⟨xi , x⟩|2 # |⟨xi , x⟩|2 = ∥x∥2 .
? ?
i=n+1 i=n+1 i=1
Portanto, ∥(1I − Sn )∥ # 1. Por outro lado,
∥(1I − Sn )xn+1 ∥ = ∥(0, . . . , 0, 1, 0, . . .)∥ = 1 .
Logo, ∥(1I−Sn )∥ = 1 para todo n. Consequentemente, não é verdade que a sequência (Sn )n∈N
converge segundo a topologia uniforme para o operador identidade 1I. Assim, podemos dizer que
a sequência de operadores (Pi )i∈N em um espaço de Hilbert H é uma resolução da identidade
se é verdade que (i) cada Pi é uma projeção ortogonal, (ii) a composição Pi Pj = O, se i ̸= j
e (iii)
<∞
1I = s− Pi .
i=1
O próximo resultado é considerado um dos pilares da análise funcional. Em sua forma

básica, ele estabelece que para uma família de operadores lineares contínuos (e, portanto,
operadores limitados) cujo domínio é um espaço vetorial normado completo, o limite pontual
é equivalente ao limite uniforme na norma do operador. Em outras palavras, o resultado nos
permite determinar se as normas de uma determinada coleção de operadores lineares limitados
{Aα }α∈J tem um limite superior mínimo finito ou, equivalentemente, se existe algum limite
uniforme para o conjunto {∥Aα ∥}α∈J . Esta questão é importante, pois uma vez que a norma
foi definida para ser um mapeamento com valor real (não um mapeamento com valor real
estendido), a norma de cada Aα deve ser finita, mas isto não garante de que elas não possam
gerar uma sequência crescente ilimitada. Assim, o teorema a seguir fornece um critério para
determinar quando essa sequência crescente não é gerada.
155
TEOREMA 4.3 (Princípio da limitação uniforme). Sejam X um espaço de Banach, Y um

espaço vetorial normado, não necessariamente completo, e A = {Aα }α∈J uma família de
operadores lineares contínuos de X em Y que é pontualmente limitada, ou seja, para todo
x ∈ X tem-se
sup ∥Aα x∥Y # Cx < ∞ , (4.2.5)

α∈J
Então, esta família é de fato uniformemente limitada, ou seja,
sup ∥Aα ∥Lb (X ,Y ) # C . (4.2.6)

α∈J
Demonstração. Para cada n ∈ N, seja Xn ⊂ X o conjunto de todos os x de modo que

∥Aα x∥Y # n, para todo α ∈ J. Cada Xn é fechado. De fato, como cada um dos operadores
Aα em A é limitado, para qualquer x ∈ X n existe uma sequência (xk )k∈N ⊂ Xn convergindo
para x. Isso significa que para cada α fixo temos ∥Aα xk ∥Y # n e, portanto, segue que
∥Aα x∥Y # n. Logo, x ∈ Xn , e Xn é fechado.
Por (4.2.5), cada x ∈ X pertence a algum Xn . Portanto, X = ∪∞ n=1 Xn . Uma vez que X
é completo, o Teorema de Baire (Teorema 1.14) implica que algum Xn contém uma bola aberta,
digamos,
B∥·∥X (x0 ; r) ⊂ Xn0 , (4.2.7)
Seja x ∈ X arbitrário, não nulo. Defina

r
y = x0 + γx , com γ = . (4.2.8)
2∥x∥X
Então, ∥y − x0 ∥X < r, de modo que z ∈ B∥·∥X (x0 ; r). Por (4.2.7) e da definição de Xn0
temos, portanto, ∥Aα y∥Y # n0 para todo α ∈ J. Também temos que ∥Aα x0 ∥Y # n0 , já que
x0 ∈ B∥·∥X (x0 ; r). De (4.2.8) obtemos
1
x= (y − x0 ) .
γ
Isso resulta para todo α ∈ J
1 16 7 2 4
∥Aα x∥Y = ∥Aα (y − x0 ))∥Y # ∥Aα y∥Y + ∥Aα x0 ∥Y # n0 = n0 .
γ γ γ r
Dessa forma, para todo α ∈ J, segue que
4
∥Aα ∥ = sup ∥Aα x∥Y # n0 ,
∥x∥X =1 r
que tem a forma (4.2.6) com C = 4n0 /r.
156
O princípio da limitação uniforme foi publicado pela primeira vez em 1927 por Stefan Banach
e Hugo Steinhaus, e por isso é também chamado Teorema Banach-Steinhaus.4
Uma forma especial do princípio da limitação uniforme que é bastante útil é o seguinte
TEOREMA 4.4 (Teorema de Banach-Steinhaus para espaços de Hilbert). Se H1 e H2 são
espaços de Hilbert e (An )n∈N é uma sequência em Lb (H1 , H2 ) com a propriedade que para
cada x ∈ H1 existe um y ∈ H2 tal que ∥An x − y∥ → 0, então, existe um operador A ∈
Lb (H1 , H2 ) tal que ∥An x − Ax∥ → 0 para todo x ∈ H1 e sup ∥An ∥ < ∞.
Demonstração. Para x ∈ H1 , assuma que Ax = limn→∞ An x. Por hipótese, o operador

A : H1 → H2 está bem definido e é fácil ver que ele é linear. Para mostrar que A é limitado,
observe que o princípio da limitação uniforme implica que existe uma constante C > 0 tal que
∥An ∥ # C para todo n. Se x ∈ H1 e ∥x∥ # 1, então, para qualquer n " 1, segue que
∥Ax∥ # ∥Ax − An x∥ + ∥An x∥ # ∥Ax − An x∥ + C .
Tomando o limite n → ∞, segue que ∥Ax∥ # C sempre que ∥x∥ # 1.
De acordo com o próximo teorema, dado dois espaços vetoriais normados X e Y , então um
operador linear limitado A : X → Y pode ter seu domínio de definição Dom(A) estendido
para seu fecho Dom(A) sem aumentar sua norma. Em particular, se Dom(A) é denso em
X , então Dom(A) = X . Esse teorema, às vezes chamado de Teorema BLT (abreviação em
inglês para “bounded linear transformation”), tem muitas aplicações no estudo de operadores
lineares.
TEOREMA 4.5 (Teorema de Extensão). Sejam X um espaço vetorial normado, Y um espaço
de Banach e A : X → Y um operador linear limitado com domínio denso Dom(A) em X .
N definido sobre todo o espaço X que estende
Então, existe um único operador linear limitado A
N = ∥A∥.
A e tal que ∥A∥
N Para isto, tome o fecho de Dom(A),

Demonstração. Primeiro, provaremos a existência de A.
isto é, Dom(A). Como Dom(A) é denso em X , segue que Dom(A) = X . Escolha um
vetor qualquer x ∈ X ; então, como Dom(A) é denso em X , existe uma sequência (xn )n∈N
em Dom(A) que converge para x, quando n → ∞. Naturalmente, Axn está definido para
todo n e, como A é limitado, (Axn )n∈N é uma sequência de Cauchy em Y , já que Y é
completo, pois Y foi assumido ser um espaço de Banach. De fato,
∥Axn − Axm ∥Y = ∥A(xn − xm )∥Y # ∥A∥∥xn − xm ∥X → 0 ,
quando n, m → ∞, já que como (xn )n∈N converge para x, está sequência é de Cauchy. Se,
N como sendo o limite de Axn , quando n → ∞, então, é
para cada x ∈ X , definirmos Ax
N # ∥A∥, porque
claro que ∥A∥
N
∥Ax∥ = ∥ lim Axn ∥Y # ∥A∥∥ lim xn ∥X = ∥A∥∥x∥X .
Y
n→∞ n→∞
4
S. Banach & H. Steinhaus, “Sur le Principe de la Condensation de Singularités,” Fundamenta Mathematicae 9
(1927) 50.
157
Note que esta definição é boa, pois ela não depende da sequência (xn )n∈N em Dom(A). Com
efeito, se (x′n )n∈N é uma outra sequência em Dom(A) que converge para x então a estimativa
∥Axn − Ax′n ∥Y = ∥A(xn − x′n )∥Y # ∥A∥∥xn − x′n ∥X
# ∥A∥ (∥xn − x∥X + (∥x′n − x∥X ) ,
confirma que limn→∞ Axn = limn→∞ Ax′n . Por outro lado, como por hipótese A ⊂ A, N isto
é, como A N é uma extensão de A, segue que Dom(A) N = Dom(A) = X ⊃ Dom(A) e
N = Ax para todo x ∈ Dom(A). Logo, ∥A∥
Ax N " ∥A∥. Isto implica que ∥A∥ N = ∥A∥. Para
N é um outro operador linear limitado A
provar a unicidade, assuma que A′ N definido sobre todo
o espaço X que estende A. Se (xn )n∈N é uma sequência em Dom(A) que converge para
x ∈ X = Dom(A), então,
N′ x − Axn ∥ = ∥A
∥A N′ x − A
N′ xn ∥ # ∥A
N′ ∥∥x − xn ∥ .
Y Y X
Portanto, AN′ x = limn→∞ Axn , isto é, A

N′ = A.
N Finalmente, vamos provar a linearidade de
N Tome dois vetores quaisquer x1 , x2 ∈ X ; então existem duas sequências (xn )n∈N e
A.
(x′n )n∈N em Dom(A) que convergem para x1 e x2 , respectivamente, quando n → ∞. Defina
N 1 = limn→∞ Axn e Ax
Ax N 2 = limn→∞ Ax′ . Tome α, β ∈ K; então
n
N 1 + β Ax
αAx N 2 = α lim Axn + β lim Ax′ = lim A(αxn ) + lim A(βx′ )
n n
n→∞ n→∞ n→∞ n→∞
6 7
= lim A(αxn ) + A(βx′n )
n→∞
6 7
′
= lim A αxn + βxn .
n→∞
. /
Mas, pelo Teorema 2.6, a sequência αxn + βx′n n∈N converge para αx1 + βx2 . Além disso,
αxn + βx′n ∈ Dom(A), para todo n ∈ N, pois Dom(A) . é subespaço
/ .vetorial de /X .
′ N
Portanto, αx1 + βx2 ∈ Dom(A) = X . Logo, limn→∞ A αxn + βxn = A αx1 + βx2 , o
N
que prova a linearidade de A.
Nota 4.11. O Teorema 4.5 nos permite assumir no futuro, sempre que desejarmos e sem perda
de generalidade, que todo operador linear limitado A, com domínio denso Dom(A) em um
espaço vetorial normado X , pode ser assumido como sendo definido em toda parte em X , já
que A sempre pode ser estendido por A,N que é definido em todo o espaço X . É por esta razão
que nada se perde ao supor que tais operadores sejam definidos inicialmente em todo o espaço,
basta tomar A igual a sua extensão A! N Consequentemente, só é útil considerar operadores
densamente definidos quando o operador é ilimitado. Por outro lado, é possível que o inverso
de um operador, A−1 , mesmo sendo limitado, não tenha um domínio definido em toda parte.
Por exemplo, o operador linear A : ℓ2 → ℓ2 definido por
A(x1 , x2 , . . .) = (0, x1 , x2 , . . .) ,
indica que A−1 é definido somente para aqueles vetores em ℓ2 cuja a primeira componente é
zero.
TEOREMA 4.6. Sejam X , Y espaços vetoriais normados. Então, Lb (X , Y ) é completo se Y
é um espaço de Banach.
158
Demonstração. Queremos mostrar que se Y é um espaço de Banach, também o será o espaço

Lb (X , Y ). Sabemos que Lb (X , Y ) é normado.5 Então para mostrar que Lb (X , Y ) é
completo, temos que mostrar que toda sequência de Cauchy em Lb (X , Y ) converge para
um elemento em Lb (X , Y ), com respeito à topologia gerada pela norma do operador. Seja
(An )n∈N uma sequência de Cauchy em Lb (X , Y ); ou seja, para todo n, m > N ∈ N, existe
um ε > 0 tal que ∥An − Am ∥ < ε. Logo, para cada x ∈ X , tomado arbitrariamente, porém
fixo, temos ∥An x − Am x∥Y < ε · ∥x∥X . Assim, (An x)n∈N é de Cauchy em Y , visto que Y
é completo.
Seja Ax = limn→∞ An x ∈ Y . Temos que provar que A ∈ Lb (X , Y ). Primeiro mostra-

mos que A é linear. Se x, y ∈ X , então
. /
A(x + y) = lim An (x + y) = lim An x + An y
n→∞ n→∞
= lim An x + lim An y = Ax + Ay .
n→∞ n→∞
Aqui, usamos o fato que An é linear e que a adição é uma aplicação contínua para espaços
normados.
Se x ∈ X e α ∈ K, então
. /
A(αx) = lim An (αx) = lim αAn x
n→∞ n→∞
= α lim An x = αAx .
n→∞
Portanto, combinando os resultados acima, temos que A ∈ Lb (X , Y ).
Para mostrar que A é limitado, observe que, para x ∈ X tomado arbitrariamente, porém
fixo, An x = (An − Am )x + Am x, e isso implica que ∥An x∥Y # ∥An x − Am x∥Y + ∥Am x∥Y .
Logo, para todo m > N ∈ N, obtemos que ∥An x∥Y < ∥AN x∥Y + ε · ∥x∥X . Então,
. /
∥Ax∥Y = lim ∥An x∥Y # lim ∥An ∥ · ∥x∥X
n→∞ n→∞
. /
< ∥AN ∥ + ε ∥x∥X .
Assim, prova-se que o operador A é limitado (portanto, contínuo).
Finalmente, para x ∈ X tomado arbitrariamente, porém fixo, temos

∥An x − Ax∥Y = lim ∥An x − Am x∥Y
m→∞
. /
# lim ∥An − Am ∥ · ∥x∥X < ε · ∥x∥X ,
m→∞
para todo n > N ∈ N. Logo, para n > N

∥An − A∥ = sup ∥(An − A)x∥Y < ε .
∥x∥X =1
Portanto, An → A; isso completa a prova do teorema.

5
Sinta-se à vontade para escolher uma das normas (N0), (N1), (N2), ou (N3)!
159
No teorema anterior usamos a noção de convergência forte de uma sequência (An )n∈N de
operadores em Lb (X , Y ).
DEFINIÇÃO 4.13. Sejam X , Y espaços vetoriais normados – sobre o mesmo corpo. Diz-se que
X e Y são isomorfos se existe um operador linear A cujo domínio é X , cujo conjunto imagem
é todo Y , e cujo inverso A−1 (que é necessariamente linear) existe.
Dito de outra forma, um isomorfismo é uma correspondência um-para-um entre os ele-

mentos de X e os elementos de Y que preserva todas as relações lineares, ou a “estrutura
algébrica;” isto é, as operações de adição de vetores e a multiplicação de vetores por escalares
são preservadas sob a correspondência: A(αx1 +βx2 ) = αAx1 +βAx2 , para todo x1 , x2 ∈ X
e α, β ∈ K. Se A é bijetivo, isto é, quando para todo y ∈ Y existe um x ∈ X tal que Ax = y,
os espaços X e Y são ditos isomorfos. Além disso, no caso importante em que A e A−1 são
contínuos, temos o seguinte
TEOREMA 4.7. Se X , Y são espaços vetoriais normados, eles são linearmente homeomorfos
(ou topologicamente isomorfos) se, e somente se, existem um operador linear contínuo A com
domínio X , conjunto imagem todo Y e uma constante positiva M tais que
∥Ax∥Y # M · ∥x∥X e ∥x∥X # M · ∥Ax∥Y ,
para todo x ∈ X .
Demonstração. Necessidade. Assuma que X e Y são lineramente homeomorfos. Logo, existe

um operador linear A : X → Y tal que A é bijetivo e contínuo e A−1 existe e é contínuo
também. De acordo com o Teorema 4.2, sendo A contínuo segue que ele é limitado, ou seja,
∥Ax∥Y # C1 · ∥x∥X . Pela existência de A−1 segue que x = A−1 y, e como A−1 também é
contínuo, então ∥A−1 y∥X # C2 · ∥y∥Y ⇒ ∥x∥X # C2 · ∥Ax∥Y . Tome M = sup{C1 , C2 }.
Assim, segue que ∥Ax∥Y # M · ∥x∥X e ∥x∥X # M · ∥Ax∥Y , para todo x ∈ X .
Suficiência. De ∥Ax∥Y # M · ∥x∥X segue imediatamente que A é um operador linear

contínuo pelo Teorema 4.2. Para provar que ∥x∥X # M · ∥Ax∥Y devemos garantir que A−1
existe e é contínuo. Lembramos que um operador linear é dito ser invertível se Ker(A) = {0}.
Note que a condição ∥x∥X # M · ∥Ax∥Y impõe que x = 0 se Ax = 0, pelas propriedades
da norma. Então, A−1 existe e é linear pelo Lema 4.1. Resta provar que A−1 é contínuo. Como
y = Ax é equivalente a x = A−1 y, segue que ∥A−1 y∥X # M · ∥y∥Y . Logo, A−1 é contínuo
pelo Teorema 4.2.
Homeomorfismos preservam todas as propriedades topológicas essenciais; em particular,

conjuntos abertos em X são mapeados em conjuntos abertos em Y , e, se x é um ponto limite
de M ⊂ X , então Ax será um ponto limite de A(M).
Nota 4.12. Observe que a Definição 2.16 poderia aparecer neste ponto como um corolário do
Teorema 4.7. De fato, isto resultaria tomando-se X = Y e A igual ao operador identidade.
Além disto, a existência da constante M > 0, que era apenas suficiente para a equivalência de
métricas (cf. a Nota 1.21), é também necessária devido à continuidade do operador identidade.
Assim, podemos afirmar (e provar) que duas normas ∥ · ∥1 e ∥ · ∥2 no mesmo espaço vetorial
X são equivalentes se, e somente se, existir uma constante M > 0 tal que ∥ · ∥1 # M · ∥ · ∥2
e ∥ · ∥2 # M · ∥ · ∥1 .
160
A seguir, vamos explorar os conceitos topológicos discutidos acima e apresentar um resultado

sobre a invertibilidade de um operador linear que nos será muito útil em certas ocasiões. Vamos
considerar operadores lineares atuando em um único espaço de Hilbert H ; ou seja, vamos
considerar que X = Y = H . No estabecimento do resultado abaixo, usamos o operador
identidade 1I, definido de tal forma que Dom(1I) = H e 1Ix = x, para todo x ∈ H . Isto
implica que Ran(1I) = H .
TEOREMA 4.8. Seja A um operador linear limitado atuando em um espaço de Hilbert H , tal que
∥A∥ < |λ|, em que λ é um escalar. Então, (a) (A − λ1I) é invertível, (b) Ran(A − λ1I) = H ,
(c) (A − λ1I)−1 é limitado e ∥(A − λ1I)−1 ∥ # (|λ| − ∥A∥)−1 e (d) (A − λ1I)−1 é dado pela
seguinte série uniformemente convergente:
∞
<
−1 −1 −2 −3 2
(A − λ1I) = −λ 1I − λ A − λ A − · · · = − λ−(n+1) An . (4.2.9)
n=0
Demonstração. Primeiro, vamos mostrar que a série (4.2.9) é uniformemente convergente. Com
efeito, como A é limitado, então, pelas Proposições 4.1 e 4.2 segue que
? ∞ ? (∞ )
? < ? < ∞ <
? ? n
?− λ−(n+1) An x? # |λ−(n+1) | ∥An x∥ # |λ−1 | |λ−n | ∥A∥ ∥x∥ .
? n=0 ? n=0 n=0
Consequentemente, a série é convergente (na verdade, absolutamente convergente) já que

∥λ−1 A∥ < 1. A seguir, vamos mostrar que este limite é (A − λ1I)−1 . Para isso, defina
∞
<
def.
Aλ = − λ−(n+1) An .
n=0
Note que, (A − λ1I) = −λ(1I − λ−1 A). Logo,

( ∞
) ∞
< <
−1 −1 −(n+1) n
−λ(1I − λ A)Aλ = −λ(1I − λ A) − λ A = (1I − λ−1 A)λ−n An
n=0 n=0
∞
<
= (λ−n An − λ−(n+1) An+1 )
n=0
= 1I .
Da mesma forma, temos que Aλ (A − λ1I) = 1I. Logo, (A − λ1I) é invertível e

∞
<
−1
(A − λ1I) =− λ−(n+1) An .
n=0
Para provar que (A − λ1I)−1 é limitado e que ∥(A − λ1I)−1 ∥ # (|λ| − ∥A∥)−1 , tome um
161
. /
vetor y ∈ Dom (A − λ1I)−1 . Então, observe que
∞
< ∞
<
−1 −1 −n n −1
∥(A − λ1I) y∥ # |λ | |λ |∥A y∥ # |λ | |λ−n |∥An ∥∥y∥
n=0 n=0
, -
1 1
= ∥y∥
|λ| 1 − ∥A/λ∥
, -
1
= ∥y∥ .
|λ| − ∥A∥
Note que ∥A∥ < |λ| é uma condição suficiente para garantir que (A − λ1I)−1 existe e é
contínuo (portanto, limitado).
Finalmente, note que (A − λ1I)−1 (A − λ1I)x = x para todo x ∈ Dom(A − λ1I) e isto
implica que . /
Ran (A − λ1I)−1 = Dom(A − λ1I) = H .
Por outro lado, (A − λ1I)(A − λ1I)−1 y = y, para todo y ∈ Ran(A − λ1I). Isto implica que
. /
Ran(A − λ1I) = Dom (A − λ1I)−1 .
Assuma que Ran(A) = M ⊂ H e que Ran(A − λ1I) = N ⊂ H . Logo,
H ⊃ N = Ran(A − λ1I) = Ran(A) + Ran(1I) = M + H .
Mas, M + H é subespaço de H que contém H . Assim, H ⊂ M + H ; portanto, M + H

coincide com H . Com isso, concluimos a prova do teorema.
Nota 4.13. A série (4.2.9) é chamada série de Neumann
; (Carln Gottfried Neumann (1832-1925)).
Note-se que, se ∥A∥ < 1, então temos (1I − A)−1 = ∞ n=0 A .
PROPOSIÇÃO 4.4. Seja X um espaço vetorial normado de dimensão finita. Então,
1. X é linearmente homeomorfo a Rn ;
2. X é um espaço de Banach;
3. Todas as normas em X são equivalentes;
4. X é localmente compacto.
Demonstração. 1. Sejam x ∈ Rn e A uma aplicação linear definida em Rn e tomando valores

no espaço vetorial normado X . De acordo com o Teorema 4.7, temos que provar que existe
uma constante positiva M tal que
∥Ax∥X # M · ∥x∥Rn ,
∥x∥Rn # M · ∥Ax∥X ,
162
Primeiro, lembremos que em termos da base canônica
e1 = (1, 0, 0, . . . , 0)
e2 = (0, 1, 0, . . . , 0)
..
.
en = (0, 0, . . . , 0, 1)
todo vetor x = (x1 , . . . , xn ) ∈ Rn se escreve como x = x1 e1 + · · · + xn en . Usando a

linearidade e homogeneidade de A, segue que
Ax = A(x1 e1 + · · · + xn en )
= A(x1 e1 ) + · · · + A(xn en )
= x1 Ae1 + · · · + xn Aen .
Notemos que, pela definição de base, A é linear injetiva. Logo,
∥Ax∥X # |x1 |∥Ae1 ∥ + · · · + |xn |∥Aen ∥.
Tome C1 = max{∥Ae1 ∥, . . . , ∥Aen ∥}, Então,

. /
∥Ax∥X # C1 · |x1 | + · · · + |xn | .
6; 71/p
n p
De acordo com o Exemplo 2.4, ∥x∥ = i=1 |xi | , para p " 1, define uma norma em Rn .
Portanto, tomando p = 1, temos que
∥Ax∥X # C1 · ∥x∥Rn .
Isto prova que A é contínuo.
Como próximo passo na continuação da prova, devemos! obter uma constante C2"tal que
∥x∥Rn # C2 · ∥Ax∥X , para todo x ∈ Rn . Seja B[x0 ; 1] = x ∈ Rn | ∥x − x0 ∥ # 1 a bola
unitária em Rn . De acordo com o Teorema 3.15, Capítulo 3, a bola unitária em Rn é compacta.
Logo, a imagem dessa bola unitária sob A é compacta. Com efeito, seja yn ∈ A(B) ⊂ X .
Temos que yn = Axn para algum xn ∈ B[x0 ; 1]. Visto que B[x0 ; 1] é compacta, pela
definição de compacidade, (xn )n∈N contém uma subsequência (xnk )k∈N que converge em
B[x0 ; 1]. A imagem de (xnk )k∈N é uma subsequência de (yn )n∈N que converge em u(B).
De fato, pela continuidade de A, se xnk → x, então ∥Ax − Axnk ∥X = ∥A(x − xnk )∥X #
C1 · ∥x − xnk ∥Rn → 0, quando k → ∞. Na sequência, precisaremos do seguinte
LEMA 4.2. Seja M um subconjunto compacto de um espaço vetorial normado X . Então, todo
funcional linear contínuo A : M → R assume seus valores máximo e mínimo em M.
Demonstração. Pela análise acima, segue que u(M) ⊂ R é compacto, e pelo Corolário 1.10
u(M) ⊂ R é limitado e fechado. Isto implica que α = inf A(M) ∈ A(M) e β =
sup A(M) ∈ A(M); ou seja, existem x0 , x1 ∈ M tais que Ax0 = α e Ax1 = β. Logo,
α # Ax # β para todo x ∈ M.
163
Note que pelo lema acima existe um γ > 0 tal que ∥Ax∥X " γ, para todo x ∈
B[x0 ; 1]. Certamente, para todo x ̸= 0 em Rn , segue que x/∥x∥Rn ∈ B[x0 ; 1]. Logo,
∥A(x/∥x∥Rn )∥X " γ ⇒ ∥Ax∥X · (1/∥x∥Rn ) " γ ⇒ ∥Ax∥X " γ · ∥x∥Rn , para todo
x ∈ Rn . Escolhendo γ = 1/C2 , temos que ∥Ax∥X · C2 " ·∥x∥Rn . Finalmente, tomando
M = sup{C1 , C2 } completamos a prova do item 1.
2. Deve ficar claro que, em um contexto mais geral, se X e Y são espaços vetoriais
normados linearmente homeomorfos (ou topologicamente isomorfos) e se um deles é completo
(como um espaço métrico), então o outro também é completo. Com efeito, sejam X um espaço
vetorial normado e A um operador linear contínuo com domínio Rn e conjunto imagem todo
X . Se (xn )n∈N é uma sequência de Cauchy em Rn que converge para x, então
∥Axm − Axn ∥X = ∥A(xm − xn )∥X # C · ∥xm − xn ∥Rn → 0
quando m, n → ∞, implicando que (Axn )n∈N é uma sequência de Cauchy que converge para
Ax ∈ X , já que A é um mapeamento sobrejetivo. Consequentemente, como Rn é completo,
isto é, como toda sequência de Cauchy em Rn converge para um elemento de Rn , então X
também é completo.
3. Sejam ∥ · ∥1 e ∥ · ∥2 quaisquer duas normas em X . Como o operador identidade é um

homeomorfismo, logo as normas ∥ · ∥1 e ∥ · ∥2 são equivalentes.
4. Lembremos que, por definição, X é localmente compacto se, e somente se, todo ponto
x ∈ X tem uma vizinhança compacta. Como bolas fechadas definem vizinhanças compactas
em Rn , segue que Rn é localmente compacto e do item 1 que X também o é.
4.3 Dualidade e Reflexividade de Espaços de Hilbert

Na seção anterior foi definido que Lb (X , Y ) é o espaço formado pelo conjunto de todos
os operadores lineares limitados de X em Y . Então, mostramos (Teorema 4.6) que se Y é
um espaço de Banach, Lb (X , Y ) é também um espaço de Banach. Por sua vez, como todo
espaço de Hilbert é também de Banach, segue imediatamente do Teorema 4.6 que se H1 e H2
são espaços de Hilbert, também é um espaço de Hilbert o espaço Lb (H1 , H2 ) formado por
todos os operadores lineares limitados A de H1 para H2 .
A seguir, estaremos interessados no caso em que H2 = K.6
DEFINIÇÃO 4.14. Seja H um espaço de Hilbert. Por H ′ = Lb (H , K) denotamos o dual

topológico de H , isto é, o espaço vetorial dos funcionais lineares limitados sobre H .
No Capítulo 3, vimos que em um espaço de Hilbert H podemos introduzir a noção de

ortogonalidade entre dois vetores. Graças a este fato, um espaço de Hilbert pode ser identificado
com o seu espaço dual. Em outras palavras, o seguinte teorema, entre outras coisas, nos
6
Lembre-se que K está representando o corpo C dos números complexos (ou o corpo R dos números reais) e
que tanto o conjunto C, como o conjunto R, são exemplos de espaço de Hilbert.
164
mostrará que é sempre possível identificar o dual topológico H ′ de um espaço de Hilbert

H com o próprio espaço de Hilbert H , isto é, H ′ $ H como um conjunto abstrato, um
conceito que ficará claro abaixo. Este resultado é chamado Teorema de Representação de de
Riesz-Fréchet,7 e toda a teoria dos espaços de Hilbert é baseada neste teorema.
TEOREMA 4.9 (Teorema de Representação de Riesz-Fréchet). Seja ϕy ∈ H ′ . Então, existe
um único vetor y ∈ H tal que ϕy (x) = ⟨y, x⟩, para todo x ∈ H . Além disso, ∥ϕy ∥H ′ =
∥y∥H
! "
Demonstração. Seja Ker(ϕy ) = x ∈ H | ϕy (x) = 0 . Ker(ϕy ) é um subespaço fe-
chado. De fato, se x ∈ Ker(ϕy ), então existe (xn )n∈N ⊂ Ker(ϕy ) tal que xn → x. Pela
continuidade de ϕy (vide Proposição 4.3) segue que ϕy (x) = limn→∞ ϕy (xn ) = 0. Assim,
x ∈ Ker(ϕy ) ⇒ Ker(ϕy ) ⊂ Ker(ϕy ). Como, por definição, Ker(ϕy ) ⊂ Ker(ϕy ), logo
conclui-se que Ker(ϕy ) = Ker(ϕy ). Assuma que Ker(ϕy ) = H , então ϕy (x) = 0 = ⟨0, x⟩,
para todo x; isto implica que ϕy é trivial, ou seja y = 0. Por outro lado, assuma que Ker(ϕy )
não é todo o espaço H . Pelo Teorema 3.5, existe um vetor não-nulo x0 ∈ Ker⊥ (ϕy ) tal que
ϕy (x0 ) ̸= 0. Neste caso, para todo x ∈ H podemos escrever x = z + x0 , em que z = z(x).
Definindo
α
z = x − x0 ,
β
def def
em que α = ϕy (x) e β = ϕy (x0 ), obtemos que z ∈ Ker(ϕy ). Com efeito, usando a
linearidade de ϕy , segue que
, -
α α
ϕy (z) = ϕy x − x0 = α − β = 0 .
β β
Assim,
O , -P O P
α α
⟨x0 , z⟩ = x0 , x − x0 = ⟨x0 , x⟩ − x0 , x0
β β
α
= ⟨x0 , x⟩ − ⟨x0 , x0 ⟩
β
α
= ⟨x0 , x⟩ − ∥x0 ∥2 = 0 ,
β
para todo x ∈ H . Consequentemente,
I, - J
β β
ϕy (x) = ⟨x0 , x⟩ = x0 , x = ⟨y, x⟩ ,
∥x0 ∥2 ∥x0 ∥2
para todo x ∈ H , em que

, -
def β
y = x0 .
∥x0 ∥2
7
O interessante é que este teorema foi publicado simultaneamente no Comptes Rendus de l’Académie des Sciences
de Paris em 1907 por Riesz e Fréchet, com seus artigos estando separados por apenas algumas páginas: F. Riesz,
“Sur une espèce de géométrie analytique des systèms de fonctions summables,” C. R. Acad. Sci. Paris 144 (1907)
1409-1411, M. Fréchet, “Sur les ensembles de fonctions et les opérations linéaires,” C. R. Acad. Sci. Paris 144 (1907)
1414-1416.
165
A unicidade segue do seguinte argumento: seja y ′ um outro elemento de H tal que ϕy′ (x) =
⟨y ′, x⟩, para todo x ∈ H . Então, temos que
⟨y ′, x⟩ = ⟨y, x⟩ =⇒ ⟨y ′, x⟩ − ⟨y, x⟩ = 0 .
Pela linearidade do produto interno, segue que
⟨y ′ , x⟩ − ⟨y, x⟩ = ⟨(y ′ − y), x⟩ = 0 , ∀x ∈ H .
Logo, pelo Lema 3.2, temos que y ′ − y ∈ H ⊥ = {0}; portanto ϕy′ (x) = ϕy (x) =⇒ y ′ = y.
Finalmente, usando a desigualdade de Cauchy-Schwarz-Bunjakowski, observe que

5 5
∥ϕy ∥H ′ = sup |ϕy (x)|K = sup 5⟨y, x⟩5 # sup ∥y∥H ∥x∥H = ∥y∥H .
K
∥x∥H #1 ∥x∥H #1 ∥x∥H #1
Por outro lado, pelo fato da igualdade ϕy (x) = ⟨y, x⟩ ser assumida válida para todo x ∈ H ,
então se tomarmos x = y, segue que ϕy (y) = ⟨y, y⟩ = ∥y∥2H . Ou seja,
, -
1 y
∥y∥H = ϕ (y) = ϕy .
∥y∥H y ∥y∥H
A última igualdade segue da homogeneidade de ϕy . Pelo Teorema 4.1, temos que
5 , -5 5O P5
5 y 5 5 y 5 ⟨y, y⟩
5
∥ϕy ∥H ′ = sup |ϕy (x)|K " 5ϕy 5 5
= 5 y, 5=
∥y∥ 5 ∥y∥ 5 ∥y∥ = ∥y∥H .
∥x∥H #1 H H H
Portanto, provamos a igualdade ∥ϕy ∥H ′ = ∥y∥H . Isto completa a prova.

Nota 4.14. Note que o Teorema de Representação de Riesz-Fréchet estabelece que todo funcional
linear limitado A sobre um espaço de Hilbert H é meramente um produto interno com um
elemento y ∈ H , com o vetor y sendo chamado vetor representativo de ϕy . Por isso, vários
autores costumam denotar o vetor representativo de ϕy por yϕ .
Recorrendo-se à desigualdade de Cauchy-Schwarz-Bunjakowski podemos provar o inverso do

Teorema 4.9. Com efeito, seja y um vetor em H . Defina ϕy (x) = ⟨y, x⟩ para todo x ∈ H .
Então, |ϕy (x)| = |⟨y, x⟩| # ∥y∥H ∥x∥H , para y, x ∈ H . Logo, ∥ϕy ∥H ′ # ∥y∥H . Assim, ϕy
é um funcional linear limitado de norma ∥y∥H . Por outro lado,
5 , -5 5O P5
5 y 5 5 y 5 ⟨y, y⟩
∥ϕy ∥H ′ = sup |ϕy (x)|K " 55ϕy 5= 5 y, 5= = ∥y∥H .
∥x∥H #1 ∥y∥H 5 5 ∥y∥H 5 ∥y∥H
Daí, segue que ∥ϕy ∥H ′ " ∥y∥H ; isto implica a igualdade ∥ϕy ∥H ′ = ∥y∥H . Portanto,
provamos o
TEOREMA 4.10. Qualquer vetor y ∈ H define um funcional linear limitado ϕy ∈ H ′ tal que
ϕy (x) = ⟨y, x⟩, para todo x ∈ H . Além disso, ∥ϕy ∥ = ∥y∥.
A representatividade de um funcional linear limitado ϕy ∈ H ′ por um vetor yϕ ∈ H , nos

permite definir o functor J de H para H ′ , isto é, J é um mapeamento que associa a cada
vetor y ∈ H um funcional linear limitado ϕy ∈ H ′ .
166
DEFINIÇÃO 4.15. Sejam X e Y espaços vetoriais. Um mapeamento sobrejetivo V : X → Y

é um operador anti-unitário se:
(a) V é anti-linear: V (αx+ βy) = αV x+ βV y, para todo x, y ∈ X e para todo α, β ∈ K,
(b) V é anti-isométrico: ⟨V x, V y⟩Y = ⟨x, y⟩X para todo x, y ∈ X .
Na definição acima, apesar da conjugação complexa em (b), note que ∥V x∥Y = ∥x∥X para
qualquer x ∈ X , isto é, V preserva a norma. Além disso, V é bijetivo.
LEMA 4.3. Seja J : H → H ′ ; então,
(i) J é um mapeamento bijetivo anti-linear de H em H ′ ,
(ii) J é um mapeamento anti-isométrico de H em H ′ .
Demonstração. (i) Tome ϕy = Jy, em que para cada ϕy ∈ H ′ , tem-se ϕy (x) = ⟨y, x⟩,
para todo x ∈ H . Da anti-linearidade do produto interno, segue que ⟨αy + βz, x⟩ =
α⟨y, x⟩ + β⟨z, x⟩. Logo, J(αy + βz) = αJy + βJz, para todo α, β ∈ K e para todo
y, z ∈ H . (ii) Visto que ∥Jy∥H ′ = ∥ϕy ∥H ′ , então, pelo Teorema de Representação de
Riesz-Fréchet, ∥Jy∥H ′ = ∥y∥H . Note que, como um mapeamento isométrico é injetivo, e pelo
Teorema de Representação de Riesz-Fréchet sabemos que J é sobrejetivo, logo J é bijetivo.
Nota 4.15. Segue do Lema 4.3 que espaços de Hilbert e seus duais são indistinguíveis metrica-
mente e “quase” indistinguíveis algebricamente (ou seja, “quase” indistinguíveis como espaços
vetoriais), visto que a correspondência ϕy ↔ yϕ é conjugada linear:
αϕy1 + βϕy2 ↔ αyϕ1 + βyϕ2 .
Se o mapeamento J fosse linear ao invés de conjugado linear, os espaços seriam congruentes
e poderíamos remover a palavra “quase” da frase acima! Isso torna claro a afirmação anterior
que H ′ pode ser identificado com H como um conjunto abstrato.
O dual topológico H ′. de /um espaço de Hilbert H tem ele próprio um espaço dual
′
associado, denotado por H ′ , ou simplesmente H ′′ . H ′′ é chamado o bidual (ou o
segundo dual) do espaço H .
DEFINIÇÃO 4.16. Seja X um espaço vetorial normado. Considere o mapeamento JN : X →
X ′′ , em que X ′′ é o bidual do espaço X . Diz-se que X é reflexivo se JN é bijetivo.
TEOREMA 4.11. H é reflexivo.
Demonstração. Para provarmos que H é reflexivo devemos provar que o mapeamento JN :

H → H ′′ é bijetivo. Com efeito, visto que pelo Teorema 4.9 temos que H ′ $ H , a menos
de uma conjugação linear, então segue que H ′′ $ H ′ . Logo,
JN : H → H ′′ ⇒ JN : H → H ′ .
Pelo Lema 4.3 JN é bijetivo. Portanto, H é reflexivo.
167
4.4 Operadores Ilimitados

A noção de operador ilimitado fornece um ambiente abstrato para lidar com operadores
diferenciais, observáveis ilimitados na mecânica quântica, entre outros casos. Em comparação
com os operadores limitados, os operadores ilimitados em um dado espaço não formam uma
álgebra, nem mesmo um espaço linear, porque todo operador ilimitado é definido em seu
próprio domínio. A teoria dos operadores ilimitados desenvolveu-se no final dos anos de 1920 e
início dos anos de 1930, como parte do desenvolvimento de uma estrutura matemática rigorosa
para a mecânica quântica. O desenvolvimento da teoria é devido, principalmente, a John von
Neumann e Marshall Stone.
Nota 4.16. O termo “operador ilimitado” pode ser enganador, uma vez que “ilimitado” deve,
por vezes, ser entendido como “não necessariamente limitado.” Além disso, o termo “operador
ilimitado” deve ser entendido como “operador linear” (como no caso de operador limitado), com
o seu domínio sendo um subespaço linear, não necessariamente todo o espaço. Esse subespaço
linear não é necessariamente fechado, e muitas vezes o assumiremos como sendo denso (já
vimos que, no caso especial de um operador limitado, o domínio é geralmente assumido, sem
perda de generalidade, como sendo todo o espaço).
Um operador ilimitado não respeita as condições (C1) e (C2) da Definição 4.10 como mostra
o seguinte
Exemplo 4.3. Sejam C([0, 1]) o espaço das funções contínuas definidas no intervalo fechado
[0, 1] e C 1 ([0, 1]) o espaço das funções continuamente diferenciáveis definidas também no
d
mesmo intervalo. Considere o operador diferencial dx : C 1 ([0, 1]) → C([0, 1]) definido pela
fórmula usual: , -
d u(x + h) − u(x)
u (x) = lim , ∀ x ∈ [0, 1] .
dx h→0 h
Toda função continuamente diferenciável é contínua; logo, C 1 ([0, 1]) ⊂ C([0, 1]). O operador
d
dx
: C 1 ([0, 1]) → C([0, 1]) é um operador ilimitado. Com feito, considere o conjunto de
funções diferenciáveis com norma ∥u∥ = sup |u(x)|, com x ∈ [0, 1]. Por exemplo, tome
, -
d
un (x) = sin(nx) =⇒ un (x) = n cos(nx) .
dx
Claramente,
?, - ?
? d ?
∥un ∥ = sup |un (x)| = 1 e ? u (x) ?=n, ∀ x ∈ [0, 1] .
? dx n ?
x∈[0,1]
?. d / ?
Como ∥un ∥ = 1 e ??.dx un /(x)?? cresce indefinidamente quando n → ∞, não existe uma
constante C tal que ? d
u (x)? # C∥un ∥ para todo un ∈ C([0, 1]). Assim, o operador
dx n
d 1
dx
: C ([0, 1]) → C([0, 1]) é ilimitado. Ele não pode nem mesmo ser definido em toda parte
em C([0, 1]) (lembre-se, por exemplo, que a função u(x) = |x|, com x ∈ [0, 1], é contínua,
mas não tem derivada bem definida em x = 0). Um operador diferencial só pode ser definido
em um domínio denso!
4.4.1 Operadores Fechados
Entre os operadores ilimitados a classe dos operadores denominados fechados desempenha

um papel especial. Com efeito, o Teorema 4.2 estabeleceu uma relação de equivalência entre
168
operadores limitados e operadores contínuos. No caso dos operadores ilimitados um análogo

da noção de continuidade é a noção de fechabilidade de um operador, que serve como um
substituto para a propriedade de ser limitado.
DEFINIÇÃO 4.17 (Operador fechado). Sejam X e Y espaços vetoriais normados sobre o mesmo
corpo e A : Dom(A) ⊂ X → Ran(A) ⊂ Y um operador linear. Considere as sequências
(xn )n∈N ⊂ Dom(A) e (Axn )n∈N ⊂ Ran(A) para as quais a realização simultânea das
relações
lim xn = x e lim Axn = y ,
n→∞ n→∞
acontece. Então, diz-se que o operador A é fechado se, e somente se, x ∈ Dom(A) e a imagem
por A de x é y, isto é, y = Ax ∈ Ran(A).
Nota 4.17 (Operador fechado vs. mapa fechado). É importante enfatizar neste ponto que, as
noções de operador fechado e de mapa fechado não são equivalentes. Acontece, frequentemente,
que duas áreas diferentes da matemática usam a mesma palavra para definir duas coisas
diferentes. No caso de um mapa fechado, um mapeamento entre espaços topológicos mapeia
conjuntos fechados em conjuntos fechados. Em outras palavras, dados dois espaços topológicos
X e Y , diz-se que um mapa A é fechado se .seu domínio / Dom(A) é subconjunto fechado
de X e seu conjunto imagem Ran(A) = A Dom(A) é fechado em Y . Por outro lado,
na definição de operador fechado, dados dois espaços vetoriais topológicos X e Y e um mapa
A : X → Y , não se exige que Dom(A) e Ran(A) sejam fechados; deve ficar bem claro
que, a única coisa que se assume é que para toda sequência (xn )n∈N ⊂ Dom(A) tal que
xn → x ∈ X e para a qual a sequência de imagens Axn → y ∈ Y , então exigimos que
x ∈ Dom(A) e que a imagem por A de x seja y.
O próximo resultado estabelece quando um operador linear limitado é fechado.
PROPOSIÇÃO 4.5. Sejam X e Y espaços vetoriais normados e A um operador linear limitado

tal que
A : Dom(A) ⊂ X → Y .
Assuma que Dom(A) é um subespaço fechado de X . Então, A é fechado.
Demonstração. Tome uma sequência (xn )n∈N ⊂ Dom(A) que converge para algum vetor
x ∈ X . Como Dom(A) é um subespaço fechado de X , segue que, necessariamente,
x ∈ Dom(A), enquanto que Axn → y ∈ Y , quando n → ∞. Como A é linear e limitado,
então,
∥A(xn − x)∥ = ∥Axn − Ax∥ # C∥xn − x∥ → 0, quando n→∞.
Logo, segue que Axn → Ax = y. Assim, A é fechado.
Nota 4.18 (Operador contínuo vs. operador fechado). Em certo sentido, a propriedade de
ser fechado é uma forma fraca de continuidade. Por exemplo, pela Proposição 4.5, sendo A
um operador contínuo e assumindo que a sequência (xn )n∈N em Dom(A) converge para
x ∈ Dom(A), então, Ax = A(limn→∞ xn ) = limn→∞ Axn . Ou seja, podemos aplicar
A termo-a-termo e a sequência de imagens resultante será de Cauchy: ∥A(xm − xn )∥ =
∥Axm − Axn ∥ # C∥xm − xn ∥ → 0, quando m, n → ∞. Por outro lado, assuma que A é
169
meramente fechado e que a sequência (xn )n∈N ⊂ Dom(A) converge para x ∈ Dom(A). Se
A é aplicado termo-a-termo e a sequência de imagens resultante (Axn )n∈N é de Cauchy (não
precisa), então Ax = A(limn→∞ xn ) = limn→∞ Axn . Em outras palavras, podemos comutar
operadores contínuos e limites, mas só podemos comutar operadores fechados e limites se a
sequência de imagens obtida pela ação do operador termo-a-termo é de Cauchy. Portanto,
preste bem atenção à diferença entre um operador contínuo e um operador fechado: um
operador A é contínuo se para xn → x em Dom(A), então necessariamente Axn → Ax.
Em contrapartida, para que A seja fechado exige-se que ambas as sequências (xn )n∈N ⊂
Dom(A) e (Axn )n∈N ⊂ Ran(A) sejam convergentes e, caso o sejam, então necessariamente
x ∈ Dom(A) e Axn → Ax ∈ Ran(A).
Exemplo 4.4 (Limitado e não-fechado). Considere o seguinte exemplo ilustrativo: Tome X =
Y . Seja 1I : Dom(1I) ⊂ X → X , com Dom(1I) um subespaço próprio denso de X , o
operador identidade, isto é, 1Ix = x para todo x ∈ Dom(1I); assim 1I é limitado! Tome uma
sequência (xn )n∈N em Dom(1I) tal que xn → x ∈ / Dom(1I). Podemos assumir isto uma
vez que o domínio do operador identidade não é um subespaço fechado de X . Assim, como
xn → x e 1Ixn → x, mas x ∈ / Dom(1I), então, o operador identidade não é fechado.
Nota 4.19. O leitor deve ficar atento para não confundir o resultado apresentado na Proposição
4.5 com aquele apresentado no Exemplo 4.4. Deve ficar claro que no Exemplo 4.4 o domínio do
operador identidade não é um subespaço fechado de X . Portanto, apesar de ser um exemplo
artificial, o Exemplo 4.4 ilustra bem a diferença entre operador linear limitado e fechado. Por
outro lado, se X é um espaço vetorial normado, Y um espaço de Banach e A : X → Y
um operador linear limitado com domínio denso Dom(A) em X , então, de acordo com
o Teorema 4.5, a única extensão linear limitada A N : Dom(A) → Y , definida no fecho de
Dom(A), é um operador fechado. Neste caso, diz-se que A é um operador fechável (veja a
Definição 4.18).
Exemplo
. / 4.5 (Ilimitado e fechado: Exemplo 4.3 revisitado). Assuma que X = Y =
C [0, 1] , o espaço das funções contínuas no intervalo [0, 1], com ∥u∥ = sup{|u(x)| | 0 #
x # 1}. Considere. o operador
/ linear d/dx. Claramente, se Ran(d/dx) ⊂ X , então
1
Dom(d/dx) = C [0, 1] , o espaço das funções com derivadas contínuas no intervalo [0, 1].
Vimos que o operador d/dx não .é limitado;
/ portanto, não é contínuo.
. Por /outro lado,. d/dx/
é fechado. De fato, suponha que un (x) n∈N ⊂ Dom(d/dx), d/dx un (x) → d/dx u(x)
. / . /
e d/dx u(x) = v(x). Então d/dx un (x) converge uniformemente para v(x) e v(x) é
contínua no intervalo [0, 1].
PROPOSIÇÃO 4.6. Sejam X e Y espaços vetoriais normados sobre o mesmo corpo, A um
operador linear fechado, não necessariamente limitado, de X em Y e λ ∈ C. Suponha que
existe uma constante κ > 0 tal que
∥(A − λ1I)x∥ " κ∥x∥ , (4.4.1)
para todo x ∈ Dom(A). Então, o Ran(A − λ1I) é um subespaço fechado de Y . Além disso, o
inverso do operador (A − λ1I) existe, com ∥(A − λ1I)−1 ∥ # 1/κ, isto é, (A − λ1I)−1 é limitado.
Demonstração. Suponha que (yn )n∈N é uma sequência em Ran(A − λ1I) que converge para
algum y. Então, yn = (A − λ1I)xn , para alguma sequência (xn )n∈N no Dom(A) (aqui,
tomamos o domínio do operador (A − λ1I) coincidindo com o domínio de A).8 Aplicando (4.4.1)
8
De fato, por definição, Dom(A − λ1I) = Dom(A) ∩ Dom(1I) = Dom(A)!
170
com x = xn − xm , segue que ∥xn − xm ∥ # (1/κ)∥yn − ym ∥. Isso significa que a sequência

(xn )n∈N ⊂ Dom(A) é de Cauchy e, portanto, converge para algum vetor x. Uma vez que
xn → x e (A − λ1I)xn = yn → y, segue que
Axn = λxn + yn → λx + y .
Assim, pela definição de um operador fechado, x ∈ Dom(A) e Ax = λx + y. Isto significa

que y = (A − λ1I)x e, assim, Ran(A − λ1I) é fechado. A conclusão que Ran(A − λ1I)
é um subespaço de Y é imediata do seguinte fato: por definição Dom(A) é um subespaço
de X , e como A é um operador fechado, então, existem sequências (x′n )n∈N e (x′′n )n∈N em
Dom(A) que convergem para x1 , x2 ∈ Dom(A), respectivamente; logo, pela análise acima,
segue que
Ax′n = λx′n + yn′ → λx1 + y1 e Ax′′n = λx′′n + yn′′ → λx2 + y2 ,
e, pela linearidade de A, temos que
A(x′n + x′′n ) = λ(x′n + x′′n ) + (yn′ + yn′′ ) → λ(x1 + x2 ) + (y1 + y2 ) .
Isto implica que y1 + y2 = (A − λ1I)(x1 + x2 ) ∈ Ran(A − λ1I).
Agora, note que, se (A − λ1I)x = 0, então, ∥x∥ # (1/κ)∥(A − λ1I)x∥ = 0; portanto,

x = 0. Assim, pelo Lema 4.1, (A − λ1I)−1 existe. Além disso, se y ∈ Ran(A − λ1I), então,
y = (A − λ1I)x, para algum x ∈ Dom(A). Consequentemente,
∥(A − λ1I)−1 y∥ = ∥x∥ # (1/κ)∥(A − λ1I)x∥ = (1/κ)∥y∥ .
Assim, ∥(A − λ1I)−1 ∥ # 1/κ, isto é, (A − λ1I)−1 é limitado.
Já vimos que existem operadores lineares que não são fechados. Todavia, alguns desses
operadores lineares podem ter extensões fechadas. Isto nos leva à seguinte
DEFINIÇÃO 4.18. Sejam X e Y espaços vetoriais normados. Um operador linear A de X
em Y é chamado fechável se, e somente se, A tem uma extensão B que é um operador linear
N é a menor extensão
fechado de X em Y . O fecho de um operador linear A, denotado por A,
fechada de A – quando essa existir.
A noção de operador fechado (ou fechável) é útil porque dá conta de uma parte da arbitrari-
edade na escolha de um domínio de um operador. Se considerarmos, por exemplo, o operador
A = −id/dx como um operador ilimitado em L2 (R), existem muitas opções diferentes para
o domínio Dom(A), incluindo (i) o espaço C0∞ (Rn ) das funções infinitamente diferenciáveis
de suporte9 compacto, (ii) o espaço de Schwartz, S (Rn ), isto é, o espaço das funções infini-
tamente diferenciáveis que, juntamente com todas suas derivadas, vão mais rápido para zero do
9
Lembremos da Definição 1.12 que o suporte de uma função é o subconjunto do seu domínio que contém
os elementos que não são mapeados a zero. Em outras palavras, suponha que X é um espaço topológico e
Ψ : X → R é uma função de valor real cujo domínio é X . Então, o suporte de Ψ, denotado por supp(Ψ), é o
fecho do conjunto de pontos em X que têm a imagem por Ψ diferente de zero, ou seja,
! "
supp Ψ = x ∈ X | Ψ(x) ̸= 0 .
171
que qualquer potência inversa de |x|, quando |x| → ∞, (veja a Definição 6.7, no Capítulo 6)
e (iii) o espaço das funções continuamente diferenciáveis Ψ para as quais Ψ e Ψ′ pertencem
a L2 (R). Como se verifica, cada uma destas três escolhas para o domínio Dom(A) conduz
ao mesmo operador A. N É importante enfatizar que isto não significa que toda escolha para
o domínio Dom(A) leva ao mesmo fechamento; entretanto, muitas vezes, muitas escolhas
razoáveis podem levar ao mesmo fechamento.
4.4.2 Gráfico de um Operador
Vamos introduzir o conceito importante do gráfico de um operador.10 Com efeito, muitas

propriedades de um operador refletem-se no seu gráfico; por isso este é um conceito de valor
no estudo de um operador. Ao analisar o gráfico de um operador, percebemos imediatamente
várias propriedades deste. Focamos nossa discussão sobre o gráfico de operadores que atuam
em espaços de Hilbert.
DEFINIÇÃO 4.19 (Gráfico de um operador). Sejam A um operador – não necessariamente linear

– e H1 e H2 espaços de Hilbert sobre o mesmo corpo. Um gráfico é um tripleto (G, H1 , H2 )
que respeita a relação G ⊂ H1 × H2 , tal que para todo x ∈ Dom(A) ⊂ H1 existe um, e
somente um, y = Ax ∈ Ran(A) ⊂ H2 . Em outra palavras, o gráfico de A é o subconjunto de
pares ordenados de H1 × H2 do tipo
3 4
G(A) = (x, Ax) ∈ H1 × H2 | x ∈ Dom(A) ⊂ H1 × H2 .
Nota 4.20. O espaço produto H1 × H2 também é um espaço de Hilbert se definirmos as

operações fundamentais, componente a componente, pelas fórmulas
(x1 , y1 ) + (x2 , y2 ) = (x1 + x2 , y1 + y2 ) e α(x, y) = (αx, αy) ,
para todo x, x1 , x2 ∈ H1 e y, y1, y2 ∈ H2 . Além disso, o espaço produto H1 × H2 é equipado

com o produto interno
⟨(x1 , y1 ), (x2 , y2 )⟩H1 ×H2 = ⟨x1 , x2 ⟩H1 + ⟨y1 , y2 ⟩H2 ,
e a norma
6 71/2
∥(x, y)∥H1×H2 = ∥x∥2H + ∥y∥2H , x ∈ Dom(A) . (4.4.2)
1 2
A norma acima é equivalente à norma
∥(x, y)∥′H = ∥x∥H1 + ∥y∥H2 , x ∈ Dom(A) . (4.4.3)

1 ×H2
As normas ∥( ·, · )∥H1×H2 e ∥( ·, · )∥′H ×H são também chamadas de normas do gráfico do

1 2
operador A.
10
O conceito de gráfico de um operador é a generalização da noção usual de representar graficamente uma
função real de uma variável real Ψ : Ω ⊆ R → R como o conjunto dos pontos ordenados
! "
(x, y) ∈ R2 | x ∈ Ω e y = Ψ(x) ,
que podem ser considerado como a soma direta de dois espaços uni-dimensionais.
172
Como H1 e H2 são espaços completos, então H1 × H2 também é completo. De fato, se

(xn , yn )n∈N é uma sequência de Cauchy em H1 × H2 , então (xn )n∈N é uma sequência de
Cauchy em H1 e (yn )n∈N é uma sequência de Cauchy em H2 . Consequentemente, tanto xn
como yn têm limites, quando n → ∞, digamos x e y, e, portanto, pela definição da norma em
H1 × H2 , segue que
6 71/2
∥(xn − x, yn − y)∥H1×H2 = ∥xn − x∥2H + ∥yn − y∥2H → 0 quando n → ∞ .
1 2
Assim, H1 × H2 é também um espaço de Hilbert.

LEMA 4.4. Um subespaço linear Γ ⊂ H1 × H2 é o gráfico de um operador linear A se, e
somente se,
. / ! "
{0} × H2 ∩ Γ = (0, 0) . (4.4.4)
Demonstração. Se A é um operador linear tal que G(A) = Γ e (0, y) ∈ Γ, então, y = A0 = 0;

portanto, a condição (4.4.4) é satisfeita. Inversamente, assuma que condição (4.4.4) é satisfeita.
Tome 3 4
Dom(A) = x ∈ H1 | (x, y) ∈ Γ, para algum y ∈ H2 .
Para cada x ∈ Dom(A), defina Ax = y, em que (x, y) ∈ Γ. Suponha que existam y, y ′ ∈ H2
tais que (x, y) e (x, y ′ ) estão em Γ. Como Γ é linear, (x, y) − (x, y ′) = (0, y − y ′ ) ∈ Γ e pela
condição (4.4.4), segue que y = y ′ . Portanto, A é bem definido. Agora, se x1 , x2 ∈ Dom(A)
e α, β ∈ C,. então, (αx1 + βx2 , Aαx1/+ Aβx2 ) = (αx1 + βx2 , αAx1 + βAx2 ) ∈ Γ. Isto
implica que αx1 + βx2 , A(αx1 + βx2 ) ∈ Γ, uma vez que Γ é linear. Logo, A(αx1 + βx2 ) =
αAx1 + βAx2 e A é linear.
A noção de operador fechado está intimamente relacionada ao conceito de gráfico de um

operador como mostra o
TEOREMA 4.12. Um operador linear A é fechado se, e somente se, seu gráfico é um subespaço
fechado.
Demonstração. Assuma que A : Dom(A) ⊂ H1 → H2 é fechado. Para mostrar que G(A) é

fechado, basta mostrar que toda sequência de elementos em G(A) converge para um elemento
em G(A). Assim, seja (xn , Axn )n∈N , com xn ∈ Dom(A), uma sequência em G(A) que
converge para (x, y). Isto é equivalente a exigir que
6 71/2
2 2
∥(xn − x, Axn − y)∥H1×H2 = ∥xn − x∥H + ∥Axn − y∥H → 0 quando n→∞,
1 2
mas isto implica que xn → x e Axn → y. Como A é assumido ser fechado, então, x ∈
Dom(A) e y = Ax. Logo, podemos escrever
G(A) ∋ (x, y) = (x, Ax) .
Portanto, G(A) é fechado.
173
De maneira inversa, assuma que G(A) é fechado, e que xn → x, com xn ∈ Dom(A), para
todo n ∈ N, e Axn → y. Devemos mostrar que x ∈ Dom(A) e que y = Ax. Isto implica
que
(xn , Axn ) → (x, y) ∈ G(A) .
Mas, como G(A) é assumido ser fechado, então, G(A) = G(A), e (x, y) ∈ G(A). Pela
definição de G(A), isto implica que x ∈ Dom(A) e y = Ax. Consequentemente, A é
fechado.
Nota 4.21. Em vista da equivalência estabelecida pelo Teorema 4.12, torna-se apenas uma questão
de preferência pessoal tomar como propriedade definidora de um operador linear fechado o seu
gráfico. No entanto, essa relação, mutuamente vantajosa entre a noção de operador fechado e
a noção de gráfico fechado, pode ser perdida se ocorrer uma das seguintes situações:
1a¯ se existir pelo menos uma sequência (xn )n∈N ⊂ Dom(A) que converge para algum
x ∈ Dom(A), quando n → ∞, e para a qual a sequência de imagens (Axn )n∈N ⊂ H2 não
converge para imagem por A de x;
2a¯ pode ocorrer também que uma sequência (xn )n∈N ⊂ Dom(A) converge para algum
/ Dom(A), enquanto que (Axn )n∈N ⊂ H2 converge para um y.
x∈
Para contornar estas situações, podemos formular uma condição para a existência do fecho de
A da seguinte forma: adicionamos a Dom(A) todos os vetores x ∈ Dom(A) que são limites
de sequências (xn )n∈N ⊂ Dom(A) que geram sequências de Cauchy (Axn )n∈N ⊂ H2 , isto
é, sequências que convergem para um y ∈ Ran(A) ⊂ H2 . No entanto, isto só fará sentido
se y não depender da sequência (xn )n∈N ⊂ Dom(A). Portanto, um operador A admitirá
um fecho A N se, e somente se, as relações (xn )n∈N ⊂ Dom(A), (x′n )n∈N ⊂ Dom(A),
xn → x, x′n → x, Axn → y e Ax′n → y ′ implicam que y = y ′. Então, o domínio de
definição do fecho Dom(A) N deve consistir dos vetores x para os quais existe uma sequência
(xn )n∈N ⊂ Dom(A) satisfazendo as condições: as sequências (xn )n∈N e (Axn )n∈N convergem
quando n → ∞, e para os vetores x obtidos pelas sequências (xn )n∈N ⊂ Dom(A) o operador
AN é definido por Ax
N = limn→∞ Axn . Colocado de outra forma, se (xn )n∈N ⊂ Dom(A) é tal
que xn → 0 e Axn → y, devemos ter y = 0. Assim, o conjunto G(A), que deve ser o gráfico
de um certo operador A, consiste dos elementos da forma (x, Ax), com x ∈ Dom(A) e de
seus pontos limites que satisfazem as relações acima.
Uma outra forma de se formular uma condição para a existência de um fecho, usando o
conceito de gráfico, seria tomar o fecho do gráfico de A no espaço produto H1 × H2 . O
problema é que
3 4
G(A) = (x, y) ∈ H1 × H2 | x ∈ Dom(A), Ran(A) ∋ y = Ax ,
pode não ser o gráfico de um operador. Com efeito, G(A) pode conter pontos que não são
univocamente determinados por x ∈ H1 , isto é, G(A) pode conter dois valores distintos
Ax para um único x. Dito de outra forma, pode acontecer de duas sequências distintas em
Dom(A), (xn )n∈N e (x′n )n∈N , convergirem
. ′ / para o mesmo x ∈ Dom(A), enquanto ′que suas
sequências de imagens (Axn )n∈N e Axn n∈N convergem para um y e para um y em Y ,
174
respectivamente, tal que y ̸= y ′. Portanto, G(A) não é o gráfico de um operador. Ou seja,

G(A) é o gráfico de um operador se, e somente se, y = y ′ (veja a Nota 4.21). Equivalentemente,
pelo Lema 4.4, G(A) é o gráfico de um operador se, e somente se, para qualquer sequência
(xn )n∈N ⊂ Dom(A), xn → 0 e Axn → y, então y = 0.
Por outro lado, suponha que A é fechável. Seja {Bκ } uma família de extensões de A,
composta por operadores lineares fechados; isto é, Ax = Bκ x para todo x ∈ Dom(A) e para
todo índice κ. Então, por definição,
N = ∩κ Dom(Bκ ) ,
Dom(A) ⊂ Dom(A) ⊂ Dom(A)
e 3 4
N = (x, y) ∈ H1 × H2 | x ∈ Dom(A),
G(A) N ∩κ Ran(Bκ ) ∋ y = Bκ x .
Note que, todo elemento y ∈ Ran(A) ⊂ Ran(A) ⊂ ∩κ Ran(Bκ ). Logo, todo elemento
de G(A) é elemento de G(A);N ou seja, G(A) ⊂ G(A).
N
Agora, assuma que G(A) é o gráfico de um operador A1 ; portanto, A1 é uma extensão

N ⊂ G(A). Consequentemente, isto prova a seguinte
fechada de A, isto implica que G(A)
PROPOSIÇÃO 4.7. Assuma que A fechável e que o fecho do gráfico de A é o gráfico de um

N
operador. Então, G(A) = G(A).
N Mostraremos
É óbvio que todo operador A é fechado se, e somente se, A é fechável e A = A.
na próxima seção que os operadores mais importantes para mecânica quântica, os operadores
auto-adjuntos, são sempre fechados.
4.5 Operadores Hermitiano, Simétrico e Auto-Adjunto

Os mais importantes operadores lineares na teoria quântica são os operadores auto-
adjuntos, uma vez que os observáveis nessa teoria são representados por operadores auto-
adjuntos agindo sobre um certo espaço de Hilbert H . No entanto, com raríssimas exceções,
é comum encontrarmos nos livros sobre mecânica quântica o uso da terminologia operador
“simétrico,” “hermitiano” e “auto-adjunto” de forma intercambiável.11 Mas, na verdade, qual é a
diferença entre todos esses operadores? Antes de respondermos esta questão, vamos lembrar um
episódio histórico interessante, retirado do livro de Peter D. Lax, “Functional Analysis, ” Wiley-
Interscience, 2002, pg.414, sobre um encontro ocorrido entre o matemático Kurt Otto Friedrichs
e o físico Werner Karl Heisenberg que representa bem o fato mencionado acima: Lax conta
que, na década de 1960, Friedrichs encontrou-se com Heisenberg e, aproveitando-se da ocasião,
expressou-lhe a profunda gratidão dos matemáticos por ele ter contribuído para a criação da
mecânica quântica, que por sua vez deu origem à bela teoria dos operadores em espaços de
Hilbert. Friedrichs acrescentou que os matemáticos tinham, de certa forma, retribuído o favor.
11
Até onde sabemos, os únicos livros-texto sobre mecânica quântica, direcionados para físicos, que abordam
com cuidado a questão sobre a diferença entre operadores hermitiano, simétrico e auto-adjunto são os livros de A.
Galindo e P. Pascual, “Quantum Mechanics,” Vol.I e II, Springer-Verlag, 1991 e A.Z. Capri, “Nonrelativistic Quantum
Machanics,” World Scientific, 2002.
175
Heisenberg se limitou a olhar com um mal disfarçado desdém para Friedrichs. Então, Friedrichs
salientou que foi um matemático, John von Neumann, que esclareceu a diferença entre um
operador auto-adjunto e um operador que é meramente hermitiano. Com certa ironia Heisen-
berg retrucou: “E qual é a diferença? ” É isto que esclareceremos a partir de agora: a relação
entre operadores simétricos e auto-adjuntos, ou mais precisamente, o problema de quando um
operador simétrico é auto-adjunto é o principal tema desta seção e fundamental para teoria
quântica.
4.5.1 Operadores Auto-Adjuntos Limitados
Para iniciarmos nossa discussão sobre a diferença entre um operador hermitiano e um ope-
rador auto-adjunto, vamos primeiro introduzir a noção de operador adjunto de um operador
limitado. Para isto, consideramos a seguinte
PROPOSIÇÃO 4.8. Seja A : H → H um operador linear limitado, com domínio sendo todo
H , isto é, Dom(A) = H . Então, existe um único operador linear A∗ limitado que satisfaz as
seguintes propriedades:
(i) Dom(A∗ ) = H ,
(ii) ⟨y, Ax⟩ = ⟨A∗ y, x⟩ para x, y ∈ H ,
(iii) ∥A∗ ∥ = ∥A∥.
Demonstração. Seja y um vetor arbitrário, porém fixo, em H . Defina o funcional linear

ϕy (x) : H → C, isto é, x 3→ ⟨y, Ax⟩. Uma vez que ∥A∥ é a norma de A, pela desigualdade
de Cauchy-Schwarz-Bunjakowski, segue que
|ϕy (x)| = |⟨y, Ax⟩| # ∥y∥∥A∥∥x∥ . (4.5.1)
Logo, ϕy é um funcional linear limitado. Por outro lado, de acordo com o Teorema de
Representação de Riesz-Fréchet, existe um único um vetor A∗ y ∈ H tal que ϕy (x) = ⟨A∗ y, x⟩,
para todo x ∈ H . Como y é um vetor arbitrário, porém fixo, em H , segue que Dom(A∗ ) =
H . Para mostrar que ∥A∗ ∥ = ∥A∥, primeiro reescrevemos a Eq.(4.5.1) da seguinte forma:
|⟨A∗ y, x⟩| = |⟨y, Ax⟩| # ∥y∥∥A∥∥x∥ ,
e, então, tomamos x = A∗ y na equação acima. Logo,
∥A∗ y∥2 # ∥y∥∥A∥∥A∗y∥ =⇒ ∥A∗ y∥ # ∥y∥∥A∥ , ∀y.
Consequentemente, ∥A∗ ∥ # ∥A∥. O mesmo argumento, com A e A∗ trocados (por que posso
fazer está troca?), mostra que ∥A∥ # ∥A∗ ∥. Assim, segue que ∥A∗ ∥ = ∥A∥.
Para provar a unicidade, assuma que A∗1 é um outro operador linear limitado, tal que
⟨y, Ax⟩ = ⟨A∗1 y, x⟩ para todo x, y ∈ H . Então, isto implica que ⟨A∗ y, x⟩ = ⟨A∗1 y, x⟩. Logo,
⟨(A∗ − A∗1 )y, x⟩ = 0 para todo x ∈ H ; porém, isto implica que (A∗ − A∗1 )y = 0 para todo
y ∈ H . Portanto, A∗ = A∗1 . A linearidade de A∗ é provada na Proposição 4.11 abaixo.
176
Nota 4.22. O operador A∗ na Proposição 4.8 é chamado o adjunto de A. A propriedade

definidora do adjunto A∗ do operador limitado A é a propriedade (ii). O operador limitado A
na Proposição 4.8 será chamado auto-adjunto se A∗ = A, isto é, se ação de A∗ sobre um vetor
y ∈ H coincide com aquela de A sobre o mesmo vetor. Neste caso, a propriedade (ii) assume
a forma ⟨y, Ax⟩ = ⟨Ay, x⟩ para x, y ∈ H e, por isso, o operador limitado A é muitas vezes
chamado simétrico (ou hermitiano)!12 Mas atenção, deve-se enfatizar, neste ponto, que para
operadores ilimitados os termos auto-adjunto, simétrico e hermitiano têm significados diferentes
(veja a próxima subseção).
Exemplo 4.6. Como exemplo de aplicação da Proposição 4.8 considere o seguinte caso. Seja
H o espaço ℓ2 das sequências complexas (x1 , x2 , · · · ) tais que
∞
<
|xn |2 < ∞ ,
n=1
e equipado com o produto interno

∞
<
⟨(y1 , y2 , · · · ), (x1 , x2 , · · · )⟩ = y n xn .
n=1
Seja A : H → H o operador linear definido por A : (x1 , x2 , x3 , · · · ) → (x2 , x3 , · · · ). O

operador A é limitado, pois se x = (xn )n∈N é um elemento arbitrário em ℓ2 , então,
∞
< ∞
<
2
∥Ax∥ = |xn | # |xn |2 = ∥x∥ ,
n=2 n=1
e tem o operador linear S : (x1 , x2 , x3 , · · · ) → (0, x1 , x2 , · · · ) como adjunto. Com efeito, se

x = (x1 , x2 , · · · ) e y = (y1 , y2 , · · · ) são elementos arbitrários em ℓ2 , observe que
∞
<
⟨y, Ax⟩ = ⟨(y1, y2 , · · · ), A(x1 , x2 , · · · )⟩ = y n xn+1
n=1
∞
<
= 0x1 + y n xn+1
n=1
= ⟨(0, y1, y2 , · · · ), (x1 , x2 , x3 , · · · )⟩
= ⟨Sy, x⟩ .
Logo, S = A∗ como afirmado!
O próximo resultado estabelece sob quais condições operadores lineares fechados são limita-
dos. A prova será dada para o caso particular de espaços de Hilbert, mas ele vale no caso mais
geral de espaços de Banach.
12
Enquanto que para matrizes, ser simétrica e hermitiana são duas propriedades diferentes (embora similares),
para operadores limitados em um espaço de Hilbert (complexo) é costume usar-se o conceito de ser simétrico no
mesmo sentido que hermitiano.
177
TEOREMA 4.13 (Teorema do gráfico fechado). Sejam H1 e H2 espaços de Hilbert e A um

operador linear fechado de H1 em H2 , com Dom(A) ⊂ H1 . Então, se o domínio Dom(A)
for fechado em H1 , o operador A é limitado.
Demonstração. Pelo Teorema 4.12, uma vez que o operador A é fechado, então, seu gráfico é um
subespaço fechado em H1 ×H2 . Em outras palavras, isto significa que G(A) é completo, isto é,
toda sequência de Cauchy (xn , Axn )n∈N ⊂ G(A) converge para um elemento (x, y) ∈ G(A).
Como, por hipótese, Dom(A) é fechado em H1 , então, Dom(A) também é completo. Agora,
considere o mapeamento
π : G(A) −→ H1 ,
(x, Ax) 3−→ x ,
a projeção sobre a primeira componente do par ordenado (x, Ax) ∈ G(A). Logo,
∥π(x, Ax)∥ = ∥x∥H1 # ∥(x, Ax)∥H1 ×H2 ,
o que implica que π é um operador limitado, ∥π∥ # 1. Claramente, π é um mapeamento linear

e bijetivo. Com efeito,
. /
π x + y, A(x + y) = x + y = π(x, Ax) + π(y, Ay) , ∀ x, y ∈ Dom(A) .
Assim, π é linear. Para mostrar que π é bijetivo precisamos somente provar que ele é injetivo, já
que nitidamente π é sobrejetivo. Para isto, suponha que π(x, Ax) = 0, então, portanto, x = 0.
Assim, pelo Lema 4.1, π −1 existe e é linear. Isto prova que π é bijetivo, e π −1 é
π −1 : H1 −→ G(A) ,
x 3−→ (x, Ax) .
Como G(A) e Dom(A) são completos e A fechado, então π −1 xn = (xn , Axn )n∈N , com
xn ∈ Dom(A), converge para π −1 x = (x, y), com y = Ax. Logo, π −1 é contínuo e,
portanto, limitado. Isto implica a existência de uma constante, C, tal que ∥π −1 x∥ # C∥x∥H1
Consequentemente,
∥(x, Ax)∥2H = ∥x∥2H + ∥Ax∥2H # C 2 ∥x∥2H ,

1 ×H2 1 2 1
ou
∥Ax∥H2 # C∥x∥H1 ,
para todo x ∈ Dom(A).
Uma segunda demonstração do Teorema 4.13 (Royden). Defina uma nova norma em H1 por
Q
∥|x|∥H1 = ∥Ax∥2H + ∥x∥2H , ∀ x ∈ Dom(A) .
2 1
Então, H1 é completo segundo a norma ∥| · |∥H1 . Com efeito, se ∥|xm − xn |∥ → 0, então

∥Axm − Axn ∥H2 → 0 e ∥xm − xn ∥H1 → 0. Portanto, pela completeza de H1 e H2 temos
que se x ∈ H1 e y ∈ H2 , então ∥xn − x∥ → 0 e ∥Axn − y∥ → 0. Mas, por hipótese do
178
nosso teorema, como A é fechado, segue do Teorema 4.12 que o gráfico de A é um subespaço
fechado em H1 × H2 . Isto implica que y = Ax. Assim, ∥|xn − x|∥H1 → 0 e H1 é completo
segundo a norma ∥| · |∥H1 . De acordo com a Definição 2.16 (veja também a Proposição 1.10), as
normas ∥ · ∥H1 e ∥| · |∥H1 são equivalentes, logo existe uma constante C > 0 tal que
∥|x|∥2H = ∥x∥2H + ∥Ax∥2H # C 2 ∥x∥2H .

1 1 2 1
Consequentemente,
∥Ax∥H2 # C∥x∥H1 ,
para todo x ∈ Dom(A).
Nota 4.23. O Teorema 4.13 poderia também ter sido enunciado da seguinte forma:
TEOREMA 4.11a. Sejam H1 e H2 espaços de Hilbert e A um operador linear de H1 em H2 ,
com Dom(A) ⊂ H1 . Então, A é limitado se, e somente se, o gráfico de A é fechado.
Do Teorema 4.13 podemos, imediatamente, deduzir o seguinte

TEOREMA 4.14 (Teorema de Hellinger-Toeplitz). Seja A um operador linear que tem todo o
espaço de Hilbert H como domínio. Assuma que ⟨y, Ax⟩ = ⟨Ay, x⟩ para todo x, y ∈ H .
Então, A é necessariamente limitado e auto-adjunto.
Demonstração. Para mostrar que A é limitado basta mostrar que A possui um gráfico fechado.
Aqui, o domínio Dom(A) é, naturalmente, fechado, já que, por hipótese, Dom(A) = H .
Seja xn → x uma sequência convergente em H tal que Axn → y para algum y ∈ H . Então,
a condição de que G(A) é fechado é equivalente a mostrar que Ax = y. Para um z ∈ H
arbitrário, temos
⟨z, y⟩ = lim ⟨z, Axn ⟩ = lim ⟨Az, xn ⟩ = ⟨Az, x⟩ = ⟨z, Ax⟩ .
n→∞ n→∞
Dessa forma, obtém-se que ⟨z, Ax − y⟩ = 0 para todo z ∈ H . Isto implica que Ax − y = 0;
portanto, Ax = y. Consequentemente, G(A) é fechado e, pelo Teorema 4.12, A é fechado
também. Logo, pelo Teorema 4.13 A é limitado. Por outro lado, pela Proposição 4.8, uma vez que
A é limitado, segue que Dom(A) ⊂ Dom(A∗ ) = H . Mas, por hipótese, Dom(A) = H .
Logo, Dom(A) = Dom(A∗ ) e isto implica que A é auto-adjunto.
O Teorema de Hellinger-Toeplitz, na versão em espaços de Hilbert, publicado em 1910, traz

consequências importantes na formulação da mecânica quântica; ele estabelece a não-existência
de operadores auto-adjuntos ilimitados que tenham como domínio de definição todos os vetores
de um espaço de Hilbert, H .
4.5.1.1 Um Interlúdio Matricial Tome,

;n como exemplo, o espaçon de Hilbert complexo H =
n
C , com produto interno ⟨y, x⟩ = i=1 y i xi , para todo x, y ∈ C . Como se sabe, quando os
espaços vetoriais têm dimensões finitas os operadores lineares possuem matrizes. Sendo assim,
considere a matriz A com elementos complexos aij = ⟨ej , Aei ⟩, com i, j = 1, . . . , n, em que
ei são elementos da base ortonormal padrão em Cn , isto é,
e1 = (1, 0, 0, . . . , 0), e2 = (0, 1, 0, . . . , 0), . . . , en = (0, 0, 0, . . . , 1) .
179
;
Logo, para x = ni=1 λi ei ∈ Cn , em que λi = ; ⟨ei , x⟩ ∈ C são as coordenadas de x com
respeito à base ortonormal ei , segue que Ax = ni=1 λi Aei . Portanto,
n
< n
<
⟨ej , Ax⟩ = λi ⟨ej , Aei ⟩ = λi aij .
i=1 i=1
Desta forma, todo operador A atuando no espaço Cn é representado por uma matriz n × n,
com os elementos aij = ⟨ej , Aei ⟩ obtidos com respeito à base ortonormal canônica em Cn .
Inversamente, toda matriz n × n define um operador em Cn . Consequentemente, temos uma
correspondência um-para-um entre operadores em espaços vetoriais n-dimensionais e matrizes
n × n.
Agora, para x, y ∈ Cn , considere o produto interno

n
<
⟨y, Ax⟩ = y i aij xj .
i=1
Isto nos leva à seguinte
DEFINIÇÃO 4.20. Seja H o espaço de Hilbert complexo Cn , com produto interno ⟨y, x⟩ =
; n ∗
i=1 y i xi . Então, a matriz adjunta de A é a transformação linear A : H → H tal que,
n
para todo x, y ∈ C , se tenha
n
< n
<
⟨y, Ax⟩ = y i aij xj = yi aij xj = ⟨A∗ y, x⟩ .
i=1 i=1
t
Na definição acima a matriz adjunta A∗ é tal que (A∗ )ij = aij , isto é, A∗ = A é a matriz
transposta conjugada, ou seja, é a matriz formada pelo complexo conjugado de cada elemento
da matriz transposta At . Lembre-se que a matriz transposta At de uma matriz A tem como
linhas as colunas de A e como colunas as linhas de A, na mesma ordem. Isto mostra que para
qualquer matriz n × n complexa A existe uma única matriz adjunta A∗ , tal que para todo
x, y ∈ Cn , tem-se ⟨y, Ax⟩ = ⟨A∗ y, x⟩.
DEFINIÇÃO
;n 4.21. Seja H o espaço de Hilbert complexo Cn , com produto interno ⟨y, x⟩ =
i=1 y i xi . A transformação linear A : H → H chama-se matriz auto-adjunta – ou matriz
hermitiana – quando A = A∗ , ou seja, quando para todo x, y ∈ Cn , tem-se ⟨y, Ax⟩ = ⟨Ay, x⟩.
Para uma matriz auto-adjunta (ou matriz hermitiana), A, devemos ter aij = aji , para
i, j = 1, . . . , n. Em particular, aii = aii para todo i = 1, . . . , n; portanto a diagonal de uma
matriz auto-adjunta, ou matriz hermitiana, só possui números reais.
Nota 4.24. Na definição acima, se H fosse tomado com sendo o espaço de Hilbert real Rn , o
termo matriz auto-adjunta, ou matriz hermitiana, é o mesmo que matriz simétrica.
Com base no Teorema de Hellinger-Toeplitz, o estudo de operadores lineares sobre espaços

de Hilbert de dimensão finita fica consideravelmente simplificado. Como qualquer operador
180
linear A sobre um espaço de Hilbert H de dimensão finita pode ser representado por uma
matriz, o domínio desses operadores é todo o espaço de Hilbert. Com efeito, se dim H = Cn ,
x é um vetor qualquer em Cn e {e1 , e2 , . . . , en } é a base ortonormal padrão em Cn , então
I n n
J n
< < <
⟨Ax, Ax⟩ = λi Aei , λj Aej = λi λj ⟨Aei , Aej ⟩ ,
i=1 j=1 i,j=1
com λi = ⟨ei , x⟩ representando, novamente, as coordenadas de x com respeito à base orto-

normal ei . Como, de acordo com a desigualdade de Cauchy-Schwarz-Bunjakowski, |⟨ei , x⟩| #
∥ei ∥∥x∥ = ∥x∥, logo,
( n )
<
∥Ax∥2 # ⟨Aei , Aej ⟩ ∥x∥2 .
i,j=1
Isto mostra que ∥Ax∥ # M∥x∥, para todo x ∈ Cn ; além disso, se o operador A é definido
pelos elementos de matriz (aij ), então
R
S<
S n
∥A∥ = T |aij |2 .
i,j=1
Isto implica que todo operador em Cn , e assim todo operador em qualquer espaço Hilbert de
dimensão finita, é limitado. Consequentemente, auto-adjunto e hermitiano são sinônimo!
Nota 4.25. Na Definição 4.20 poderíamos ter considerado uma transformação linear do tipo
A : H1 → H2 , com H1 = Cn e H2 = Cm . Neste caso, a adjunta da matriz A deve ser uma
matriz A∗ : H2 → H1 tal que, para x ∈ H1 e y ∈ H2 quaisquer se tenha ⟨y, Ax⟩ = ⟨A∗ y, x⟩.
Portanto, a imagem z = A∗ y ∈ H1 de um vetor arbitrário y ∈ H2 é, por definição, aquele vetor
de H1 tal que o produto interno de qualquer vetor x ∈ H1 por ele é igual a ⟨y, Ax⟩ = ⟨z, x⟩.
O próximo resultado mostra que, no caso de um espaço de Hilbert de dimensão infinita

ainda podemos representar um operador limitado numa forma matricial, em completa analogia
com o caso de um espaço de Hilbert de dimensão finita.
TEOREMA 4.15. Se A é um operador limitado sobre um espaço de Hilbert, H , separável de

dimensão infinita, então A pode ser representado por uma matriz infinita.
Demonstração. Seja (ei )i∈N uma sequência ortonormal completa em H . Precisamos mostrar
que A pode ser representado em termos da matriz infinita
⎛ ⎞
a11 a12 a13 · · ·
⎜a21 a22 a23 · · ·⎟
⎜ ⎟
⎜a31 a32 a33 · · ·⎟
⎝ ⎠
.. .. .. ..
. . . .
;∞ para i, j ∈ N, definimos aij = ⟨ej , Aei ⟩. Para qualquer x ∈ H , temos que

em que,
x = i=1 ⟨ei , x⟩ei . Visto que A é limitado (portanto, contínuo), então o valor de Ax pode ser
181
obtido pela passagem de um limite. Com efeito,

(∞ ) ( n
)
< <
Ax = A ⟨ei , x⟩ei = A lim ⟨ei , x⟩ei
n→∞
i=1 i=1
( n )
<
= lim A ⟨ei , x⟩ei (pela continuidade de A)
n→∞
i=1
( n
)
<
= lim ⟨ei , x⟩Aei (pela linearidade de A)
n→∞
i=1
∞
<
= ⟨ei , x⟩Aei .
i=1
Portanto,
I ∞
J ∞ ∞
< < <
⟨ej , Ax⟩ = ej , ⟨ei , x⟩Aei = ⟨ei , x⟩⟨ej , Aei ⟩ = aji ⟨ei , x⟩ .
i=1 i=1 i=1
Desta forma, todo operador linear limitado A atuando sobre um espaço de Hilbert, H , separável
de dimensão infinita, é representado por uma matriz n × n infinita, com os elementos aij =
⟨ej , Aei ⟩ obtidos com respeito à uma sequência ortonormal completa em H .
O inverso do teorema anterior representa um caso particular (importante) do Teorema de

Hellinger-Toeplitz.
PROPOSIÇÃO 4.9. Seja A um operador linear, definido em toda parte em um espaço de Hilbert,
H , separável de dimensão infinita. Assuma que A admite uma representação matricial com
respeito à uma sequência ortonormal completa em H . Então A é limitado.
Demonstração. Seja (ei )i∈N uma sequência ortonormal completa em H com respeito à qual o
operador A admite uma representação em termos de uma matriz infinita. Para todo vetor
∞
< ∞
<
H ∋x= ⟨ei , x⟩ei = xi ei ,
i=1 i=1
a série ∞
<
⟨ej , Ax⟩ = aji xi , ∀j ∈ N ,
i=1
;∞ 2
converge se i=1 |aji | < ∞. Com efeito, considere a sequência de números complexos
(σ
;j,n )n∈N , para todo j ∈ N arbitrário, porém fixo, formada pelas somas parciais σj,n =
n
i=1 aji xi . Então, para n > m temos
5 52
5 <
n 5 n
< n
<
5 5
|σj,n − σj,m |2 = 5 aji xi 5 # |aji xi |2 # |aji |2 |xi |2 .
5 5
i=m+1 i=m+1 i=m+1
182
;∞ 2
;∞ 2
Pelo Teorema
;n 3.8, i=1 |xi | < ∞; assim se i=1 |aji | < ∞ a sequência de somas parciais
σj,n = i=1 aji xi é uma sequência de Cauchy, de modo que dado ε > 0, existe N ∈ N tal que,
para todo;n, m > N, |σj,n − σj,m |2 < ε2 =⇒ |σj,n − σj,m | < ε. Isto implica a convergência
da série ∞ n=1 aji xi por causa da completeza de H ; isto é, a sequência (σj,n )n∈N possui um
limite em H , para todo j ∈ N arbitrário, porém fixo.
;
Defina ϕj (x) = ⟨ej , Ax⟩ o funcional linear de x = ∞ i=1 xi ei . Então, pela desigualdade de
Bessel,
<n < n
5 5 5 5
5ϕj (x)52 = 5⟨ej , Ax⟩52 # ∥Ax∥2 .
j=1 j=1
Note que (ϕj (x))j∈N é uma sequência crescente monótona, limitada por ∥Ax∥2 , para todo
x ∈ H . Sejam E o conjunto de valores de (ϕj (x))j∈N e ϕ(x) = supj ϕj (x), o supremo de
E. Então, para cada ε > 0 (arbitrário) existe um inteiro N tal que ϕ(x) − ε < ϕ(x)N # ϕ(x),
pois, em caso contrário, ϕ(x) − ε seria uma cota superior de E. Como (ϕj (x))j∈N é uma
sequência crescente, temos que para j " N, ϕ(x) − ε < ϕN (x) # ϕ(x), o que prova que essa
sequência converge para um número menor ou igual a ϕ(x). Assim,
R
S<
S∞5 52
ϕ(x) = sup ϕj (x) = lim ϕj (x) = T 5ϕj (x)5 = ∥Ax∥ .
j j→∞
j=1
Assuma que M é um subespaço próprio de H . Seja x0 ∈ H − M. Vamos provar que

se ϕ(x) é um funcional ilimitado sobre M, então ele será ilimitado sobre qualquer subespaço
gerado por M e {x0 }, isto é, considere M1 = M + {x0 }. Logo, todo vetor em M1 é da forma
x + αx0 , em que x ∈ M e α é um escalar. A seguir façamos uso da separabilidade assumida
de H . Neste caso, existe uma sequência (xn )n∈N que é densa em H . Construa subespaços
lineares da forma Mn+1 = {xn } + Mn , com (n = 1, 2, . . .), em que M0 = M. Assuma que
ϕ(x) é ilimitado sobre cada um desses subespaços, isto é, escolha um elemento x1 ∈ M1 tal
que ϕ(x1 ) > 1. Como ϕ(x) foi assumido ser ilimitado sobre cada um dos subespaços Mn ,
então existe um elemento x2 ∈ M2 , tal que M1 ⊂ M2 , para o qual ϕ(x2 ) > 2. Continuando
este processo, obtemos uma sequência M = M0 ⊂ M1 ⊂ M2 ⊂ · · · tal que ϕ(xn ) > n se
xn ∈ Mn . Desta forma, podemos obter um funcional linear sobre um subconjunto denso V de
H . Como V = H , existe uma sequência (xn )n∈N em V que converge para x em H . Defina
ϕ(x) = limn→∞ ϕ(xn ). Este limite existe uma vez que K é completo. Mas isto contradiz o
fato que ϕ(x) > n para cada n. Assim, ϕ(x) deve ser limitado, o que prova a proposição.
Naturalmente, a proposição acima se aplica, automaticamente, no caso de H ser de dimen-

são finita N; basta, para tanto, assumir que aji = 0 se i, j > N.
4.5.2 Operadores Auto-Adjuntos Ilimitados
O Teorema de Hellinger-Toeplitz estabelece uma relação entre duas propriedades de tipos

diferentes: as propriedades de ser definido em toda parte e de ser limitado. Esse teorema gera
algumas dificuldades técnicas na formulação matemática da mecânica quântica porque, como
já enfatizado, os observáveis na mecânica quântica devem ser representados por operadores
auto-adjuntos em algum espaço de Hilbert H . Entretanto, muitos operadores importantes
183
na mecânica quântica são ilimitados, como os operadores hamiltoniano, posição, momentum

linear e momentum angular orbital. Mas, pelo Teorema de Hellinger-Toeplitz, não podem existir
operadores auto-adjuntos ilimitados definidos em toda parte em um espaço de Hilbert H . Neste
caso, o melhor que podemos fazer é defini-los em domínios densos em H .13 Com efeito, se A
é um operador e Dom(A) ⊂ H seu domínio, então, se Dom(A) = H , isto implica que
o conjunto Dom(A) é denso em toda parte em H (veja Definição 1.38). Entre outras coisas,
isto significa que apesar de não ter um domínio definido em toda parte, o fato do subespaço
Dom(A) ser denso em toda parte em H nos dá uma “noção do todo,” ou a “noção de
um conjunto bem espalhado.” Em uma linguagem mais simples, o que estamos querendo
dizer é que para qualquer x ∈ H , qualquer vizinhança de x irá sempre conter um número
infinitamente grande de elementos do conjunto Dom(A). Isto significa que para qualquer
vetor x ∈ H existe um ε > 0, arbitrariamente escolhido (por menor que ele seja), de tal forma
que é sempre possível encontrar um x′ ∈ Dom(A) tal que a desigualdade ∥x − x′ ∥ < ε
seja satisfeita. Em resumo, se Dom(A) = H , então, Dom(A) gera todo H , no sentido
que, para todo x ∈ H , sempre existirá uma sequência de Cauchy (xn )n∈N em Dom(A)
tal que xn → x, quando n → ∞. Assim, todo vetor x ∈ H pode sempre ser aproximado
por uma sequência de elementos de Dom(A). Por causa disso, daqui para frente, estaremos
interessados principalmente nos operadores lineares, A, que sejam densamente definidos.
Para um operador linear limitado A sobre um espaço de Hilbert H o seu adjunto foi
definido, na Proposição 4.8, através da relação
⟨A∗ y, x⟩ = ⟨y, Ax⟩ .
Se exigirmos que está relação seja preservada no caso de operadores ilimitados, uma noção
mais geral do adjunto de um operador linear A deve levar em conta que A não precisa
estar definido em todo H , mas é necessário apenas que A seja um operador linear com o
domínio Dom(A) denso em H . De fato, como mostrará a Proposição 4.10 abaixo, somente
para operadores lineares densamente definidos é possível garantir que seus adjuntos estão bem
definidos, porque, caso contrário, A∗ y não seria univocamente determinado pelos valores de
⟨A∗ y, x⟩ quando x varia sobre o domínio Dom(A).
Sejam H1 e H2 espaços de Hilbert e A : Dom(A) ⊂ H1 → H2 um operador linear.

Além disso, assuma que Dom(A) = H1 . Suponha que para cada vetor y ∈ H2 seja possível
encontrar um vetor z ∈ H1 tal que
⟨y, Ax⟩H2 = ⟨z, x⟩H1 , ∀ x ∈ Dom(A) .
Naturalmente, o produto interno à esquerda é tomado em H2 , enquanto que o produto interno
à direita é tomado em H1 .
DEFINIÇÃO 4.22. O adjunto de um operador linear A : Dom(A) ⊂ H1 → H2 , não necessa-
riamente limitado, é o operador A∗ satisfazendo a relação ⟨y, Ax⟩H2 = ⟨A∗ y, x⟩H1 , para todo
x ∈ Dom(A) e para y no domínio
3 4
Dom(A∗ ) = y ∈ H2 | ∃ z ∈ H1 tal que ⟨y, Ax⟩H2 = ⟨z, x⟩H1 , ∀ x ∈ Dom(A) .
13
Na sua grande maioria, os textos sobre mecânica quântica trata esses operadores, equivocadamente, como se
fossem hermitianos, sem nem mesmo tocar na questão de seus domínios. O fato de que operadores auto-adjuntos
devem ter um domínio denso específico é completamente ignorado nos livros-texto sobre mecânica quântica, com
exceção talvez dos livros-texto de Galindo-Pascual e Capri já citados no Rodapé da pag. 175.
184
De acordo com essa definição, para encontrar o operador A∗ , é preciso encontrar todos os
pares (z, y), com z ∈ H1 e y ∈ H2 , que satisfazem a relação
⟨y, Ax⟩H2 = ⟨z, x⟩H1 , ∀ x ∈ Dom(A) .
Então, A∗ y = z(y), para todo y ∈ Dom(A∗ ). Consequentemente, o operador A∗ é o adjunto

do operador A se vale a relação.
⟨y, Ax⟩H2 = ⟨A∗ y, x⟩H1 , ∀ x ∈ Dom(A) , ∀ y ∈ Dom(A∗ ) .
A Definição 4.22 é equivalente à seguinte
DEFINIÇÃO 4.22a. O adjunto de um operador linear, não necessariamente limitado, A :

Dom(A) ⊂ H1 → H2 , é o operador A∗ satisfazendo a relação ⟨y, Ax⟩H2 = ⟨A∗ y, x⟩H1 ,
para todo x ∈ Dom(A) e para y no domínio
3 4
∗
Dom(A ) = y ∈ H2 | ∃ Cy tal que |⟨y, Ax⟩H2 | # Cy ∥x∥H1 , ∀ x ∈ Dom(A) .
Ao se assumir que ⟨y, Ax⟩H2 é limitado na Definição 4.22a entende-se que, explicitamente,
existe uma constante Cy tal que |⟨y, Ax⟩H2 | # Cy ∥x∥H1 para todo x ∈ Dom(A). Por
outro lado, pela Definição 4.22, dado um vetor y ∈ H2 , se existe um vetor z ∈ H1 tal que
⟨y, Ax⟩H2 = ⟨z, x⟩H1 para todo x ∈ Dom(A), então y pertence ao domínio Dom(A∗ ) e
A∗ y = z. Mas, pelo Teorema de Representação de Riesz-Fréchet, tal z existirá se, e somente se,
⟨y, Ax⟩H2 for limitado, o que mostra que, de fato, as Definições 4.22 e 4.22a são equivalentes!
O próximo resultado estabelece um critério para a existência do operador adjunto, A∗ , de

um operador linear A; mais especificamente, A deve, necessariamente, ser densamente definido
em H1 . Em outras palavras, para o vetor z na Definição 4.22 ficar determinado univocamente
precisamos que o subespaço Dom(A) seja denso em H1 .
PROPOSIÇÃO 4.10. Sejam H1 e H2 espaços de Hilbert e A : Dom(A) ⊂ H1 → H2 um

operador linear com domínio Dom(A) denso em H1 . Então, o operador A∗ é bem definido.
Demonstração. Como um mapeamento, devemos mostrar que A∗ associa a cada y ∈ Dom(A∗ ) ⊂

H2 exatamente um, e somente um, elemento z ∈ H1 . Assuma que
⟨w, x⟩H1 = ⟨z, x⟩H1 ,
tal que
⟨y, Ax⟩H2 = ⟨z, x⟩H1 , ∀ x ∈ Dom(A) ⊂ H1 .
Logo, pela linearidade do produto interno
⟨(w − z), x⟩H1 = ⟨y, Ax⟩H2 − ⟨y, Ax⟩H2 = 0 , ∀ x ∈ Dom(A) .
185
Isto implica que w − z ∈ Dom(A)⊥ ; mas como, por hipótese, Dom(A) é denso em H1 ,
então, pela Proposição 3.14, w − z é identicamente igual ao vetor nulo. Portanto, w = z e
é univocamente determinado por y ∈ Dom(A∗ ). Consequentemente, o operador A∗ é bem
definido. Por outro lado, se A não for densamente definido em H1 , então Dom(A) ̸= H1 , e
o complemento ortogonal de Dom(A) em H1 contém pelo menos um vetor não-nulo w1 tal
que ⟨w1 , x⟩H1 = 0, para todo x ∈ Dom(A). Logo,
⟨w, x⟩H1 = ⟨z, x⟩H1 + ⟨w1 , x⟩H1 = ⟨(z + w1 ), x⟩H1 ,
que mostra a não-unicidade se A não for densamente definido em H1 .
Nota 4.26. O domínio Dom(A∗ ) do operador A∗ na Definição 4.22 pode não ser denso. Com
efeito, é possível que Dom(A∗ ) = {0}!
PROPOSIÇÃO 4.11. O operador A∗ é linear.
Demonstração. Sejam y1 , y2 ∈ Dom(A∗ ) ⊂ H2 tais que
⟨y1 , Ax⟩H2 = ⟨z1 , x⟩H1 e ⟨y2, Ax⟩H2 = ⟨z2 , x⟩H1 ,
para todo x ∈ Dom(A) ⊂ H1 .
Para dois escalares α e β considere a combinação linear αy1 + βy2. Então, pela condição
de adjunção de A, segue que
⟨(αy1 + βy2 ), Ax⟩H2 = ⟨A∗ (αy1 + βy2), x⟩H1 , ∀ x ∈ Dom(A) .
Por outro lado,
⟨(αy1 + βy2), Ax⟩H2 = ⟨αy1 , Ax⟩H2 + ⟨βy2, Ax⟩H2
= α⟨y1 , Ax⟩H2 + β⟨y2, Ax⟩H2
= α⟨A∗ y1 , x⟩H1 + β⟨A∗ y2 , x⟩H1
= α⟨z1 , x⟩H1 + β⟨z2 , x⟩H1
= ⟨(αz1 + βz2 ), x⟩H1 , ∀ x ∈ Dom(A) .
Aqui, usamos a linearidade do produto interno na primeira linha, o Corolário 3.1 na segunda
linha e a condição de adjunção de A na terceira linha. Logo, (αy1 + βy2 ) ∈ Dom(A∗ ) ⊂ H2
e A∗ (αy1 + βy2 ) = αA∗ y1 + βA∗ y2 = αz1 + βz2 . Isto completa a prova.
PROPOSIÇÃO 4.12. O operador A∗ é fechado.
Demonstração. Assuma que (yn )n∈N é uma sequência de vetores em Dom(A∗ ) ⊂ H2 , tal que
yn → y e A∗ yn → z. Então, para cada n, segue que
⟨yn , Ax⟩H2 = ⟨A∗ yn , x⟩H1 = ⟨zn , x⟩H1 .
186
Portanto,
lim ⟨yn , Ax⟩H2 = lim ⟨zn , x⟩H1 ,
n→∞ n→∞
e pela continuidade do produto interno (Proposição 3.13), segue que
⟨y, Ax⟩H2 = ⟨z, x⟩H1 , ∀ x ∈ Dom(A) ⊂ H1 .
Consequentemente, y ∈ Dom(A∗ ) e A∗ y = z, o que prova que A∗ é fechado.
Note que, de acordo com as Proposições 4.8 e 4.12, se A é um operador limitado, então nós
temos o seguinte
TEOREMA 4.16. Sejam H1 e H2 espaços de Hilbert e A : Dom(A) ⊂ H1 → H2 um operador
N Além
linear limitado, com domínio denso em H1 e norma ∥A∥. Então, A admite um fecho A.
disso, Dom(A) N = Dom(A) = H1 e ∥A∥ N = ∥A∥.
PROPOSIÇÃO 4.13. Sejam H1 e H2 espaços de Hilbert e A : Dom(A) ⊂ H1 → H2 um

operador linear. Assuma que A−1 existe e que Dom(A) e Dom(A−1 ) são densos em H1 e
H2 , respectivamente. Então, (A−1 )∗ = (A∗ )−1 .
Demonstração. Para mostrar que (A−1 )∗ = (A∗ )−1 , devemos mostrar que
. / . /
Dom (A−1 )∗ = Dom (A∗ )−1 .
. /
Para isto, assuma que x ∈ Dom(A) e que y ∈ Dom (A−1 )∗ . Assim,
⟨y, x⟩H1 = ⟨y, A−1Ax⟩H1 = ⟨(A−1 )∗ y, Ax⟩H2 .
Então, por definição, segue que (A−1 )∗ y ∈ Dom(A∗ ) e que A∗ (A−1 )∗ y = y. Mas, esta
última igualdade mostra que se A∗ (A−1 )∗ y = 0, então y = 0. Logo, pelo Lema 4.1, o operador
(A∗ )−1 existe. Isto implica
. −1 que
/ (A∗ )−1 A∗ (A−1 )∗ y = (A∗ )−1 y, ou que (A−1 )∗ y = (A∗ )−1 y,
para todo
. −1y ∈ /Dom (A )∗ . Em outras palavras, todo . elemento
/ que pertence.ao conjunto
/
Dom.(A ) / também pertence ao conjunto Dom (A ) , ou seja, Dom (A−1 )∗ ⊂
∗ ∗ −1
Dom (A∗ )−1 .
Por outro lado, assuma que x ∈ Dom(A−1 ) e que y ∈ Dom(A∗ ). Assim,
⟨y, x⟩H2 = ⟨y, AA−1x⟩H2 = ⟨A∗ y, A−1x⟩H1 .

. /
Consequentemente, por definição, segue que A∗ y ∈ Dom (A−1 )∗ e que (A−1 )∗ A∗ y = y.
∗ −1
Mas, esta última igualdade mostra que para o operador
. ∗(A )/ existir a restrição de (A−1 )∗
∗ −1
ao Ran(A ) deve ser exatamente . o ∗conjunto
/ Dom (A ) . Isto implica que todo . −1elemento
/
−1
que pertence. ao conjunto
/ Dom . (A ) / também pertence ao conjunto Dom (A
. )∗ /, ou
∗ −1
seja, Dom
. −1 (A /) ⊂ Dom (A−1 )∗ . Consequentemente, segue que Dom (A∗ )−1 =
∗
Dom (A ) , o que finaliza a prova.
Existe uma relação simples (bastante útil em muitas aplicações) entre o conjunto imagem de
um operador linear A, densamente definido, e o espaço nulo de seu adjunto, A∗ , como mostra
a seguinte
187
PROPOSIÇÃO 4.14. Seja A : Dom(A) ⊂ H1 → H2 um operador densamente definido. O

complemento ortogonal do conjunto imagem de A é igual ao espaço nulo do seu adjunto A∗ , isto
é, Ran(A)⊥ = Ker(A∗ ).
Demonstração. Uma vez que Ax ∈ Ran(A), então y ∈ Ran(A)⊥ se, e somente se,
⟨y, Ax⟩H2 = 0 para todo x ∈ Dom(A). Mas, por definição, nós temos que ⟨y, Ax⟩H2 =
⟨A∗ y, x⟩H1 para todo x ∈ Dom(A) e y ∈ Dom(A∗ ). Logo, segue que ⟨A∗ y, x⟩H1 = 0
para todo y ∈ Dom(A∗ ). Por outro lado, uma vez que Dom(A) é denso em H1 , pela
Proposição 3.14, Dom(A)⊥ = {0}. Assim, y ∈ Ran(A)⊥ se, e somente se, A∗ y = 0, ou
seja, y ∈ Ker(A∗ ).
A Proposição 4.10 estabeleceu um critério para a existência do operador adjunto, A∗ , de um

operador linear A: a densidade de Dom(A) em H . Um outro critério para a existência do
operador adjunto pode ser estabelecido por meio do conceito do gráfico do operador A∗ . Com
efeito, se A : Dom(A) ⊂ H1 → H2 é um operador densamente definido, podemos identificar
o gráfico de A∗ como consistindo de todos aqueles pares ordenados (y, z) ∈ H2 × H1 tais
que
⟨y, Ax⟩H2 = ⟨z, x⟩H1 , ∀ x ∈ Dom(A) ,
e, então, escrever
⟨y, Ax⟩H2 = ⟨A∗ y, x⟩H1 , ∀ x ∈ Dom(A) e y ∈ Dom(A∗ ) .
Observe que podemos descrever o gráfico G(A∗ ) de A∗ , como sendo o complemento ortogonal
do subespaço
3 4
def.
M = (Ax, −x) | x ∈ Dom(A) .
De fato, a condição de que (y, z) seja ortogonal a M é

⟨(y, z), (Ax, −x)⟩H2 ×H1 = ⟨y, Ax⟩H2 + ⟨z, −x⟩H1 = 0 ,
ou seja, ⟨y, Ax⟩H2 = ⟨z, x⟩H1 para todo x ∈ Dom(A) que é precisamente a condição para
que o par ordenado (y, z) pertença ao gráfico de A∗ . Podemos sistematizar isto definindo um
operador U : H1 × H2 → H2 × H1 da seguinte forma: seja (x, y) ∈ G(A), com y = Ax;
então,
U(x, y) = (y, −x) .
O operador U é isométrico (veja a definição na Seção 4.6) sobre o espaço produto H1 × H2 :
∥U(x, y)∥2H ×H = ∥x∥2H + ∥y∥2H = ∥(x, y)∥2H ×H . Além disso, U 2 = −1I, com 1I sendo
2 1 1 2 1 2
o operador identidade em H1 × H2 . Logo, U 2 M = −1IM = M, com a segunda igualdade
seguindo do fato que qualquer subespaço M de H1 × H2 é invariante se cada elemento de M
é multiplicado por −1, isto é, −M = M.
PROPOSIÇÃO 4.15. Seja A um operador densamente definido de H1 em H2 . Denote por UG(A)
o conjunto de todos os pares (Ax, −x) = U(x, Ax), com x ∈ Dom(A). Então,
G(A∗ ) = (H2 × H1 ) ⊖ UG(A) ,
isto é, o gráfico do operador A∗ é o complemento ortogonal do subespaço UG(A), o fecho do
conjunto UG(A), em H2 × H1 .
188
Demonstração. Pela definição de A∗ , temos que

3 4
G(A∗ ) = (y, z) ∈ H2 × H1 | ⟨y, Ax⟩H2 = ⟨z, x⟩H1 , ∀ x ∈ Dom(A)
3 4
= (y, z) ∈ H2 × H1 | ⟨(y, z), (Ax, −x)⟩H2 ×H1 = 0, ∀ (x, Ax) ∈ G(A) .
Observe que
0 = ⟨(y, z), (Ax, −x)⟩H2 ×H1 = ⟨(y, z), U(x, Ax)⟩H2 ×H1 .
B CD E
U G(A)
. /⊥
Isto implica que G(A∗ ) = UG(A) . Por outro lado,
0 = ⟨(y, z), U(x, Ax)⟩H2 ×H1 = −⟨(z, −y), (x, Ax)⟩H1 ×H2
= −⟨ U(y, z) , (x, Ax)⟩H1 ×H2 ,

B CD E
U (G(A)⊥ )
. /⊥ . / . /⊥ . /
ou seja, UG(A) = U G(A)⊥ . Portanto, G(A∗ ) = UG(A) = U G(A)⊥ . Contudo,
uma vez que G(A) é o gráfico do operador A, pelo Lema 4.4, se a sequência (xn )n∈N ⊂
Dom(A) é tal que xn → 0, então Axn → 0 também. Logo, U(xn , Axn ) = (Axn , −xn ) →
(0, 0). Isto implica que UG(A) é um subespaço fechado em H2 × H1 , ou seja, UG(A) =
UG(A). Obviamente, UG(A) = UG(A). Portanto, pelo Teorema 3.5, segue que
G(A∗ ) = (H2 × H1 ) ⊖ UG(A) .
Isto prova a proposição e mostra que y ∈ Dom(A∗ ) e que z = A∗ y.
TEOREMA 4.17. Sejam H1 e H2 espaços de Hilbert e A : Dom(A) ⊂ H1 → H2 um operador
linear. Se A é fechado e seu domínio é denso em H1 , então, o domínio de A∗ é denso em H2 .
N
Portanto, (A∗ )∗ = A∗∗ existe; além disso, A∗∗ = A = A.
Demonstração. Para provar que A∗ é denso em H2 , assuma o contrário, isto é, suponha

que Dom(A∗ ) ̸= H2 . Uma vez que H2 é um espaço de Hilbert, então, pelo Teorema 3.4
(Teorema da Projeção; veja também o Teorema 3.5), dado que Dom(A∗ ) é um subespaço
fechado de H2 , então, todo vetor w ∈ H2 tem uma única representação w = y + z, em que
. /⊥
y = y(w) ∈ Dom(A∗ ) e z = z(w) ∈ Dom(A∗ ) . Portanto, deve existir um elemento
v ̸= 0 ortogonal a Dom(A∗ ), isto é, ⟨v, y⟩H2 = 0 para todo y ∈ Dom(A∗ ). Por outro lado,
uma vez que por hipótese Dom(A) é denso em H1 , então, o vetor nulo é o único elemento
de Dom(A)⊥ ; logo, temos que ⟨0, A∗ y⟩H1 = 0 para todo y ∈ Dom(A∗ ). Desse modo,
reunindo essas informações, escrevemos
⟨0, A∗y⟩H1 + ⟨v, −y⟩H2 = 0 .
Em termos do produto interno em H1 × H2 , a relação a acima implica que
⟨(0, v), (A∗y, −y)⟩H1×H2 = ⟨0, A∗y⟩H1 + ⟨v, −y⟩H2 = 0 , (4.5.2)
para todo y ∈ Dom(A∗ ). O conjunto de pares ordenados
3 4
(A∗ y, −y) ∈ H1 × H2 | y ∈ Dom(A∗ ) ⊂ H1 × H2 , (4.5.3)
189
é o conjunto de todos os pontos que satisfazem a relação ⟨y, Ax⟩H2 = ⟨u, x⟩H1 = ⟨A∗ y, x⟩H1 ,
para todo x ∈ Dom(A), já que A∗ existe. Em outras palavras, este conjunto consiste de todos
os elementos em H1 × H2 que satisfazem a relação
⟨(u, −y), (x, Ax)⟩H1×H2 = ⟨A∗ y, x⟩H1 + ⟨−y, Ax⟩H2 = 0 , (4.5.4)
para todo x ∈ Dom(A), isto é, que são ortogonais ao gráfico, G(A), de A. Mas, pelo Teorema
4.12, sendo A fechado G(A) é um subespaço fechado de H1 × H2 . Logo, o conjunto de pares
ordenados (4.5.3) pertence ao complemento ortogonal G(A)⊥ do subespaço fechado G(A) de
H1 × H2 . De (4.5.2), (0, v) ∈ G(A). Isto implica que v = A0, isto é, v = 0, contradizendo
a hipótese que v ̸= 0. Isto estabelece que Dom(A∗ ) é denso em H2 . Como A∗ é denso em
H2 , (A∗ )∗ = A∗∗ existe pela Proposição 4.10.
. /⊥
A seguir, considere A∗ no lugar de A na Proposição 4.15. Então, G(A∗∗ ) = UG(A∗ ) .
. /⊥
Mas, G(A∗ ) = UG(A) . Portanto,
. . / ⊥ /⊥ . 2 . /⊥ /⊥
G(A∗∗ ) = U UG(A) = U G(A) .
. /⊥
Isto implica que G(A∗∗ ) = G(A)⊥ = G(A), já que G(A) é um subespaço fechado de
H1 × H2 . Mas, se os gráficos de quaisquer dois operadores são iguais, os operadores devem
ser idênticos; logo, A∗∗ = A e como A é fechado, segue que A∗∗ = A = A. N
Vamos agora considerar, principalmente, operadores lineares do seguinte tipo:

A
H ⊃ Dom(A) −→ H
Lembramos que se A e B são dois operadores lineares de H em H , então, A = B se,

e somente se, Dom(A) = Dom(B) e Ax = Bx para todo x ∈ Dom(A) = Dom(B).
Além disso, B é uma extensão de A, ou A é uma restrição de B, e escreveremos A ⊂ B,
ou equivalentemente B ⊃ A, quando Dom(A) ⊂ 5Dom(B) e Ax = Bx para todo x ∈
Dom(A). Ou seja, A ⊂ B se, e somente se, A = B 5Dom(A) .
DEFINIÇÃO 4.23. Sejam H um espaço de Hilbert e A : Dom(A) ⊂ H → H um operador

em H . Então,
(a) diz-se que A é hermitiano se ⟨Ay, x⟩ = ⟨y, Ax⟩ para todo x, y ∈ Dom(A).
(b) A é simétrico se (i) A é hermitiano e (ii) Dom(A) é denso em H . Consequentemente,

A é simétrico se, e somente se, (i)′ Dom(A) = H e (ii)′ A ⊂ A∗ .14
14
Existem alguns textos que definem a relação de “intensidade” entre ser hermitiano e simétrico contrária àquela
adotada aqui, que é a de M.A. Naimark, “Linear Differential Operators in Hilbert Spaces,” Frederick Ungar Publishing
Co., 1968. Por exemplo nos livros de C.R. de Oliveira, “Intermediate Spectral Theory and Quantum Dynamics,”
Progress in Mathematical Physics 54, Birkhäuser, 2009 e de B. Simon, “Operator Theory: A Comprehensive Course
in Analysis,” Part 4, American Mathematical Society, 2015, um operador linear A : Dom(A) ⊂ H → H é
simétrico se ⟨Ay, x⟩ = ⟨y, Ax⟩ para qualquer x, y ∈ Dom(A) e será hermitiano se é simétrico e Dom(A) é
denso em H .
190
PROPOSIÇÃO 4.16. Sejam A e B operadores simétricos densamente definidos em um espaço de

Hilbert H . Se A ⊂ B, então, B ∗ ⊂ A∗ .
Demonstração. Como A ⊂ B significa que Dom(A) ⊂ Dom(B) e Bx = Ax, para todo

x ∈ Dom(A), então, nossa tarefa resume-se à demonstração de duas coisas, a saber: (i)
Dom(B ∗ ) ⊂ Dom(A∗ ) e (ii) A∗ x = B ∗ x, para todo x ∈ Dom(B ∗ ).
Seja x um vetor arbitrário em Dom(B ∗ ). Se y ∈ Dom(A), por hipótese, temos também

que y ∈ Dom(B). Logo, podemos escrever
⟨B ∗ x, y⟩ = ⟨x, By⟩ (Dom(A) ⊂ Dom(B))
= ⟨x, Ay⟩ (A ⊂ B) ,
de onde se conclui que
⟨x, Ay⟩ = ⟨B ∗ x, y⟩ , ∀y ∈ Dom(A) e ∀x ∈ Dom(B ∗ ) . (4.5.5)
De (4.5.5), da unicidade do operador adjunto e da maximalidade do seu domínio, conclui-se que

Dom(B ∗ ) ⊂ Dom(A∗ ) e A∗ x = B ∗ x , ∀x ∈ Dom(B ∗ ) .
Portanto, temos que B ∗ ⊂ A∗ , como desejado.
A Proposição 4.14 tem uma generalização importante, como mostra o seguinte

TEOREMA 4.18. Sejam A : Dom(A) ⊂ H → H um operador simétrico em um espaço de
Hilbert complexo H e λ ∈ C\R. Então, Ran(A−λ1I)⊥ = Ker(A∗ −λ1I) e Ran(A−λ1I)⊥ =
Ker(A∗ − λ1I).
Demonstração. Considere os conjuntos imagens dos operadores (A − λ1I) e (A − λ1I), respecti-

vamente; isto é, Ran(A−λ1I) e Ran(A−λ1I). Note que, Ran(A−λ1I) e Ran(A−λ1I) são
subespaços de H , que não são necessariamente fechados. Como Dom(A − λ1I) = Dom(A)
e Dom(A) é denso em H , pela Proposição 4.14 segue que Ran(A−λ1I)⊥ = Ker(A∗ −λ1I).
Com efeito, como (A − λ1I)x ∈ Ran(A − λ1I), então y ∈ Ran(A − λ1I)⊥ se, e somente se,
⟨y, (A − λ1I)x⟩ = 0 para todo x ∈ Dom(A); ou seja,
0 = ⟨y, (A − λ1I)x⟩ = ⟨y, Ax⟩ − ⟨y, λ1Ix⟩
= ⟨A∗ y, x⟩ − λ⟨y, 1Ix⟩
= ⟨A∗ y, x⟩ − ⟨λy, 1Ix⟩
= ⟨(A∗ − λ1I)y, x⟩ .
Aqui, usamos o fato que, por definição, ⟨y, Ax⟩ = ⟨A∗ y, x⟩ para todo x ∈ Dom(A) e
y ∈ Dom(A∗ ). Logo, segue que ⟨(A∗ − λ1I)y, x⟩ = 0 para todo x ∈ Dom(A) e y ∈
Dom(A∗ ). Por outro lado, uma vez que Dom(A) é denso em H , pela Proposição 3.14,
Dom(A)⊥ = {0}. Assim, y ∈ Ran(A − λ1I)⊥ se, e somente se, (A∗ − λ1I)y = 0, ou seja,
y ∈ Ker(A∗ − λ1I). Da mesma forma, prova-se que Ran(A − λ1I)⊥ = Ker(A∗ − λ1I).
191
DEFINIÇÃO 4.24. Sejam H um espaço de Hilbert e A : Dom(A) ⊂ H → H um operador

simétrico em H . Então,
(a) A é auto-adjunto se (i) Dom(A) é denso e (ii) A = A∗ .
N é auto-adjunto.
(b) A é essencialmente auto-adjunto se seu fecho A
PROPOSIÇÃO 4.17. Se A é um operador auto-adjunto, então, A não possui uma extensão própria
que seja auto-adjunta.
Demonstração. Assuma que B é um operador auto-adjunto e que A ⊂ B. Então, de acordo

com a Proposição 4.16, B ∗ ⊂ A∗ e isto implica que B ⊂ A, já que por hipótese A e B são
auto-adjuntos. Portanto, A = B.
Observe que pela Proposição 4.16 uma extensão de um operador simétrico A não somente
amplia o conjunto Dom(A), mas também reduz o conjunto Dom(A∗ ). Isto implica que
quanto maior for o domínio de um operador simétrico, menor será o domínio do seu adjunto.
Assim, escolhendo-se um domínio de B adequadamente podemos obter uma extensão B de
A tal que B = B ∗ . Neste caso, B é auto-adjunto e pela Proposição 4.17 o operador B não
possuirá uma extensão própria que seja auto-adjunta. Portanto, um problema fundamental é
entender sob quais condições um operador simétrico tem uma extensão auto-adjunta. Isto será
discutido na Seção 4.8.
Neste ponto, deve ficar claro que no caso de operadores ilimitados, a hermiticidade e a auto-
adjunção são duas propriedades bem distintas. A auto-adjunção é uma propriedade mais forte
e será necessária como premissa em muitos resultados importantes na teoria quântica, como na
dinâmica quântica discutida no Capítulo 8. Hermiticidade geralmente é uma suposição muito
fraca. Assim, as Definições 4.23 e 4.24 nos permite definir a seguinte ordem de “intensidade”
para um operador linear:
auto-adjunto =⇒ simétrico =⇒ hermitiano .
Por outro lado, para operadores limitados que têm todo o espaço de Hilbert H como domínio
e que são simétricos, o Teorema de Hellinger-Toeplitz garante que as duas noções coincidem,
isto é, a ordem de intensidade acima colapsa, implicando a relação
auto-adjunto ⇐⇒ simétrico ⇐⇒ hermitiano .
Exemplo 4.7. Seja H um espaço de Hilbert. Tome o operador identidade 1I definido num
domínio denso, mas não-fechado, Dom(1I) ⊂ H . Obviamente, o operador 1I é simétrico e
limitado, mas não é auto-adjunto. Se fosse auto-adjunto, coincidiria com seu adjunto que é
fechado, donde se concluiria que seu domínio Dom(1I) seria fechado. Assim, mesmo quando
falamos em operadores limitados, dizer que o operador é simétrico não garante automatica-
mente que o mesmo seja auto-adjunto. Em contrapartida, se tivéssemos assumido o operador
identidade definido em todo o espaço de Hilbert H ele seria, de acordo com o Teorema de
Hellinger-Toeplitz, naturalmente auto-adjunto.
192
Exemplo 4.8. Seja H um espaço de Hilbert complexo de dimensão finita n, isto é, H = Cn .

Este espaço é fisicamente importante no tratamento do spin de uma partícula, ou no tratamento
de um sistema quântico de dois níveis. Neste caso, um operador A em H pode ser expresso
em termos de uma matriz complexa n × n e seu adjunto por uma matriz conjugada hermitiana.
Ambas matrizes estão definidas em todo o espaço de Hilbert H = Cn . Não existem subespaços
próprios densos em H = Cn . Com efeito, se Dom(A) é um subespaço de H = Cn de
dimensão m, então, m # n. Se m < n, segue que Dom(A) " Cn . Nesse caso, sabemos
de nosso estudo no Capítulo 3 que Cn = Dom(A) + Dom(A)⊥ , em que Dom(A)⊥ é
o subespaço de Cn consistindo de todos os vetores ortogonais a cada vetor de Dom(A). A
dimensão do subespaço Dom(A)⊥ é n − m. Selecione um vetor x′ ∈ Dom(A)⊥ tal que
∥x′ ∥ = 1. Então, nenhum vetor x em Dom(A) pode estar próximo do vetor x′ mais do que
1 unidade de distância porque ⟨x′ , x⟩ = 0, o que implica que ∥x′ − x∥2 = ∥x′ ∥2 + ∥x∥2 "
∥x′ ∥2 = 1. Consequentemente, nenhum subespaço próprio de um espaço de Hilbert de
dimensão finita pode ser denso. Se m = n, então, Dom(A) = H e Dom(A) é certamente
denso em H = Cn . Dessa forma, auto-adjunção e hermiticidade são sinônimo. O espectro de
A é simplesmente o conjunto de todos os seus auto-valores, ou seja, o espectro é puramente
discreto.
É importante estarmos cientes das diferenças entres as várias classes de operadores lineares
que introduzimos. O resultado a seguir traz mais estrutura para as Definições 4.23 e 4.24 e
fornece uma fonte útil para se entender o que é um operador linear A densamente definido.
PROPOSIÇÃO 4.18. Um operador simétrico A em um espaço de Hilbert H é sempre fechável.
Além disso, as seguintes afirmações acontecem:
N = A∗∗ ⊂ A∗ .
1. A é simétrico se, e somente se, A ⊂ A
N = A∗∗ ⊂ A∗ .
2. A é simétrico e fechado se, e somente se, A = A
N = A∗∗ = A∗ .
3. A é auto-adjunto se, e somente se, A = A
N = A∗∗ = A∗ .
4. A é essencialmente auto-adjunto se, e somente se, A ⊂ A
Demonstração. Lembremos que de acordo com a Definição 4.18, um operador linear A em H

é fechável se, e somente se, A tem uma extensão que é um operador linear fechado em H .
Por outro lado, por definição, A∗ é uma extensão de A e, pela Proposição 4.12, A∗ é fechado.
Logo, A é fechável. Agora, como A é um operador fechável, ele admite um fecho, A, N que, pelo
∗∗ ∗
Teorema 4.17, é igual a A . Portanto, sendo A uma extensão fechada de A e A N a menor delas,
N ∗∗ ∗ N
segue que A ⊂ A = A ⊂ A . Isto prova (1). Se A é fechado, então, A = A e, pelo Teorema
4.17, o domínio de A∗ é denso em H , (A∗ )∗ = A∗∗ existe e A∗∗ = A. N Isto prova (2). Se A é
∗
auto-adjunto, então, A = A e de imediato obtemos (3). (Nos três casos, a recíproca é trivial).
Finalmente, assuma que A é essencialmente auto-adjunto. Então, o seu fecho A N é auto-adjunto,
N = (A)
isto é, A N . Como A
∗ N é fechado, pelo Teorema 4.17, segue que (A)
N = (A∗∗ )∗ . Mas, pelo
∗
Teorema 4.17, isto implica que (A)N ∗ = (A∗∗ )∗ = (A∗ )∗∗ . Novamente usando o Teorema 4.17,
! !
segue que (A∗ )∗∗ = (A∗ ) e como A∗ é fechado, então, (A∗ ) = A∗ . Portanto, nós temos a
seguinte sequência de igualdades:
N = (A) !
N ∗ = (A∗∗ )∗ = (A∗ )∗∗ = (A
A∗∗ = A ∗
) = A∗ .
193
Isto prova a ida de (4). A volta, como nos outros casos, é imediata.
COROLÁRIO 4.3. Um operador simétrico fechado A em um espaço de Hilbert H é auto-adjunto
se, e somente se, A∗ é simétrico.
A Proposição 4.18 nos ajuda a responder a seguinte questão: o fecho de um operador

simétrico é simétrico? A resposta é dada no seguinte
COROLÁRIO 4.4. Seja A um operador simétrico em um espaço de Hilbert H . Então, seu fecho
N também é um operador simétrico.
A
Demonstração. Pela Proposição 4.18 o operador A é fechável, uma vez que A ⊂ A∗ e A∗ é

fechado. Suponha que x, y ∈ Dom(A). N Então, como Dom(A) é denso, existem sequências
(xn )n∈N e (yn )n∈N em Dom(A) que convergem para x e y, respectivamente. Pela definição
de AN dada na página 174, isto implica que Ax
N = limn→∞ Axn e Ay N = limn→∞ Ayn . Assim,
como A é simétrico e o produto interno contínuo, temos que
N = lim ⟨yn , Axn ⟩ = lim ⟨Ayn , xn ⟩ = ⟨Ay,
⟨y, Ax⟩ N x⟩ .
n→∞ n→∞
N é denso, o operador A
Como Dom(A) N é simétrico.
Uma observação simples, mas útil, sobre a relação entre fecho e adjunto é dada na seguinte
N
PROPOSIÇÃO 4.19. Seja A um operador simétrico em um espaço de Hilbert H , com fecho A.
N ∗ ∗
Então, o adjunto do fecho é igual ao adjunto: (A) = A .
!
Demonstração. Como A∗ é fechado, segue que A∗ = (A∗ ) = (A∗ )∗∗ = (A∗∗ )∗ . Mas, como
N que, pelo Teorema 4.17, é igual a A∗∗ . Logo, temos
A é fechável, ele admite um fecho, A,
! N ∗.
A∗ = (A∗ ) = (A∗ )∗∗ = (A∗∗ )∗ = (A)
N a definição do adjunto de A fornece a seguinte caracteri-

Levando em conta que A∗∗ = A,
N
zação útil de A:
PROPOSIÇÃO 4.20. Seja A um operador simétrico em um espaço de Hilbert H . Então, x ∈
Dom(A)N se, e somente se, x ∈ Dom(A∗ ) e
⟨y, A∗x⟩ = ⟨A∗ y, x⟩ , ∀ y ∈ Dom(A∗ ) .
Demonstração. Como A N é uma extensão simétrica fechada de A, (A)

N ∗ existe e está bem
N têm o mesmo adjunto, segue que
definido. Por outro, como A e A
N = ⟨(A)
⟨y, Ax⟩ N ∗ y, x⟩ = ⟨A∗ y, x⟩ , N , ∀ y ∈ Dom(A∗ ) .
∀ x ∈ Dom(A)
N ⊂ A∗ , temos que para todo x ∈ Dom(A),
Como A N segue que x ∈ Dom(A∗ ). Isto implica
que
⟨y, A∗x⟩ = ⟨A∗ y, x⟩ , ∀ y ∈ Dom(A∗ ) .
194
Reciprocamente, tome um vetor x ∈ Dom(A∗ ) e assuma que
⟨y, A∗x⟩ = ⟨A∗ y, x⟩ , ∀ y ∈ Dom(A∗ ) . (4.5.6)
Tomando os conjugados complexos em (4.5.6), temos
⟨x, A∗ y⟩ = ⟨A∗ x, y⟩ , ∀ y ∈ Dom(A∗ ) .
Pelo Teorema 4.17, uma vez que AN é fechado e seu domínio é denso em H , o domínio de A∗
N Logo,
é denso em H . Portanto, (A∗ )∗ = A∗∗ existe e A∗∗ = A.
N y⟩ ,
⟨x, A∗ y⟩ = ⟨A∗ x, y⟩ = ⟨A∗∗ x, y⟩ = ⟨Ax, ∀ y ∈ Dom(A∗ ) .
N
Isto implica que x ∈ Dom(A).
PROPOSIÇÃO 4.21. Assuma que A : Dom(A) ⊂ H → H é um operador simétrico. Então, se
A1 e A2 são extensões auto-adjuntas de A tal que Dom(A1 ) ⊂ Dom(A2 ), então A1 = A2 .
N é a única extensão auto-
Se A é um operador essencialmente auto-adjunto, então seu fecho A
adjunta de A.
Demonstração. Para todo x ∈ Dom(A1 ) ⊂ Dom(A2 ) e para todo y ∈ Dom(A) ⊂

Dom(A1 ) ⊂ Dom(A2 ) segue que
⟨A2 x, y⟩ = ⟨x, A2 y⟩ = ⟨x, Ay⟩ = ⟨x, A1 y⟩ = ⟨A1 x, y⟩ .
Como Dom(A) é denso em H , segue que A2 x = A1 x para todo x ∈ Dom(A1 ), isto é,

A1 ⊂ A2 . Mas, sendo A1 e A2 extensões auto-adjuntas de A, pela Proposição 4.16, segue que
A1 ⊂ A2 = A∗2 ⊂ A∗1 = A1 . Logo, A1 = A2 .
Agora, assuma que A é essencialmente auto-adjunto e que B = B ∗ é uma extensão auto-

adjunta de A. Como B é fechado, e sendo uma extensão de A, ele é também uma extensão de
N Assim, A ⊂ A
A. N ⊂ B = B ∗ ⊂ (A)N ∗ ⊂ A∗ . Mas, como A é essencialmente auto-adjunto, por
N = (A)
definição, segue que A N ∗ . Portanto, A
N ⊂ B = B ∗ ⊂ A,
N isto é, A
N = B.
Naturalmente, de acordo com a proposição acima, todo operador que já é auto-adjunto sobre
seu domínio de definição também é essencialmente auto-adjunto!
TEOREMA 4.19. Sejam A um operador simétrico fechado e x, y vetores em Dom(A∗ ). Suponha
que a condição ⟨y, A∗x⟩ = ⟨A∗ y, x⟩ falhe, para todo y ∈ Dom(A∗ ). Então, x, y ∈ / Dom(A).
Além disso, se ⟨x, A∗ x⟩ e ⟨A∗ y, y⟩ são reais, então, x, y são linearmente independentes em
Dom(A∗ ) \ Dom(A).
Demonstração. Se x ∈ Dom(A) a condição ⟨y, A∗x⟩ = ⟨A∗ y, x⟩ é válida, para todo y ∈

Dom(A∗ ), uma vez que, por definição, Dom(A) ⊂ Dom(A∗ ). Então, se esta condição
falhar x ∈
/ Dom(A). Uma vez que esta condição é simétrica em x e y, então, y ∈
/ Dom(A)
∗
também. Agora, assuma que x, y são linearmente dependentes em Dom(A ) \ Dom(A).
Como Dom(A) ⊂ Dom(A∗ ), podemos assumir que
6 7
Dom(A∗ ) = Dom(A) + Dom(A∗ ) \ Dom(A) .
195
Assim, dados dois números complexos λ, η ∈ C, não nulos, e um vetor z ∈ Dom(A),

considere a combinação linear λx + ηy + z = 0 ∈ Dom(A∗ ).15 Sem perda de generalidade,
suponha que λ = 1 ou que η = 1. Se λ = 1, x = −ηy − z; assim,
⟨y, A∗x⟩ − ⟨A∗ y, x⟩ = −η[⟨y, A∗ y⟩ − ⟨A∗ y, y⟩] = 0 .
Portanto, a condição ⟨y, A∗x⟩ = ⟨A∗ y, x⟩ acontece, para todo y ∈ Dom(A∗ ). O caso para
η = 1 é similar. Assim sendo, se ⟨x, A∗ x⟩ e ⟨A∗ y, y⟩ são reais, para que a condição ⟨y, A∗x⟩ =
⟨A∗ y, x⟩ falhe, para todo y ∈ Dom(A∗ ), x, y devem ser linearmente independentes em
Dom(A∗ ) \ Dom(A).
DEFINIÇÃO 4.25. Sejam A um operador simétrico fechado em espaço de Hilbert H e Ω ⊂

! 5
Dom(A). O subconjunto Ω é chamado de core de A se Ω é um subespaço e A5Ω = A. Em
outras palavras, Ω ⊂ Dom(A) é um core para o operador A se, e somente se, a seguinte
condição é satisfeita:
. 5 /
(x0 , Ax0 ) ⊥ x, A5Ω x , ∀ x ∈ Ω =⇒ x0 = 0 . (4.5.7)
A condição (4.5.7) basicamente vem da decomposição ortogonal para subespaços fechados,

. 5 / . 5 /⊥
G(A) = G A5Ω ⊕ G A5Ω .
se Ω ⊂ Dom(A). Assim, na definição acima, Ω é um core de A se os elementos (x, Ax),

com x ∈ Ω, é denso em G(A). Para isto é necessário que Ω seja denso em Dom(A)
(uma condição que é necessária, mas em geral não suficiente). Equivalentemente, para qualquer
x ∈ Dom(A) deve existir uma sequência (xn )n∈N) ⊂ Ω tal que ∥x−xn ∥ + ∥Ax−Axn ∥ → 0
quando n → ∞. Mas, é preciso estar ciente de que o operador deve ser fechado para que
A fechado =⇒ G(A) fechado =⇒ G(A) completo .
A importância desse conceito é óbvia quando estão envolvidos mais de um operador ilimi-
tado, como no caso do operador de Schrödinger da mecânica quântica. O método padrão para
provar a auto-adjunção de um operador da forma A + B, em que A é auto-adjunto, é baseado
em um resultado provado por Kato-Rellich (veja o Teorema 4.35 mais adiante), para qual a noção
de core do operador é relevante. No entanto, deve-se enfatizar que um mesmo operador pode
ter muitos cores.
PROPOSIÇÃO 4.22. Sejam A um operador auto-adjunto em um espaço Hilbert

5 H e Ω um
5
subconjunto de Dom(A). Então, Ω é um core para A se, e somente, A Ω é essencialmente
auto-adjunto.
15
Neste ponto, lembramos que os subespaços M1 , M2 , . . . , Mn são linearmente independentes se a equação
x1 + x2 + · · · + xn = 0 , xj ∈ Mj , j = 1, 2, . . . , n ,
é satisfeita se, e somente se, x1 = x2 = · · · = xn = 0. Se os subespaços M1 , M2 , . . . , Mn são linearmente

independentes, então qualquer vetor x na soma direta M1 ⊕ M2 ⊕ . . . ⊕ Mn pode ser univocamente representado
da forma x = x1 + x2 + · · · + xn .
196
Demonstração. Pela definição do operador adjunto, segue que ⟨y, Ax⟩ = ⟨A∗ y, x⟩, para todo
[x ∈ 5Dom(A)
\ e para todo y ∈ Dom(A∗ ). Por hipótese, como Ω ⊂ Dom(A), então,
y, A5Ω x = ⟨A∗ y, x⟩, para todo x ∈ Ω e para todo y ∈ Dom(A∗ ). Isto implica que,
@ . 5 /A @ . 5 /A
∗ 5
0 = (y, A y), A Ω x, −x = (y, A y), U x, A5Ω x
∗
,
H ×H B .CD5 / E H ×H
U G A5
Ω
ou seja,
6 . 5 /7⊥ 6. 5 / 7
∗
G(A∗ ) = G(A) = UG A5Ω = G A5Ω .
A primeira igualdade segue do fato do operador A ser auto-adjunto, enquanto que a terceira
5 . 5 /∗ ! 5
segue da Proposição 4.15. Agora, se A5Ω é essencialmente auto-adjunto, então, A5Ω = A5Ω .
!5
Logo, A = A5 e Ω é um core para A. Reciprocamente, se Ω é um core para A, o fecho de
5 Ω 5
A5Ω é auto-adjunto porque coincide com o operador auto-adjunto A. Pela Definição 4.24 A5Ω
é essencialmente auto-adjunto.
Já vimos que, como consequência do Teorema de Hellinger-Toeplitz, se um operador linear

e simétrico, A, tem todo o espaço de Hilbert H como domínio, então, A é limitado e auto-
adjunto. Vamos, agora, apresentar um outro resultado que estabelece a auto-adjunção de um
operador simétrico, A, não necessariamente limitado.
TEOREMA 4.20. Seja A um operador simétrico, não necessariamente limitado, em um espaço de

Hilbert H . Se Ran(A) = H , então, A é auto-adjunto.
Demonstração. Basta mostrar que Dom(A) = Dom(A∗ ). Por definição, sabemos que
Dom(A) ⊂ Dom(A∗ ). Logo, com base na hipótese acima, basta mostrar que Dom(A) ⊃
Dom(A∗ ). Efetivamente, se y ∈ Dom(A∗ ) e z = A∗ y, então em virtude da condição
Ran(A) = H existe pelo menos um vetor w ∈ Dom(A) para o qual z = Aw. Assim, para
um vetor arbitrário x ∈ Dom(A) nós temos que
⟨y, Ax⟩ = ⟨z, x⟩ = ⟨A∗ y, x⟩ = ⟨A∗ w, x⟩ = ⟨Aw, x⟩ .
Mas, como A ⊂ A∗ , segue que Aw = A∗ w para w ∈ Dom(A); portanto, temos que

5
∗ 5
⟨A w, x⟩5 = ⟨z, x⟩ = ⟨w, Ax⟩ = ⟨y, Ax⟩ =⇒ ⟨y − w, Ax⟩ = 0 .
Dom(A)
Assim, y − w ∈ Ran(A)⊥ . Mas, por hipótese Ran(A) = H ; logo, pelo Lema 3.2 (Item 1)
segue que Ran(A)⊥ = {0}, ou seja, y − w = 0 =⇒ y = w ∈ Dom(A). Consequentemente,
Dom(A) ⊃ Dom(A∗ ), o que prova o teorema.
COROLÁRIO 4.5. Sejam A um operador simétrico em um espaço de Hilbert H e λ um elemento

de C \ R. Se Ran(A − λ1I) = Ran(A − λ1I) = H , então, A é auto-adjunto.
Demonstração. Novamente, uma vez que A é simétrico, basta mostrar que o domínio do adjunto
está contido no domínio de A, já que Dom(A − λ1I) = Dom(A − λ1I) = Dom(A).
197
Com efeito, se y ∈ Dom(A∗ ) e z = (A∗ − λ1I)y, então em virtude da condição que

Ran(A − λ1I) = H existe pelo menos um vetor w ∈ Dom(A) para o qual z = (A − λ1I)w.
Assim, para um vetor arbitrário x ∈ Dom(A) nós temos que
⟨y, (A − λ1I)x⟩ = ⟨y, Ax⟩ − ⟨y, λx⟩
= ⟨A∗ y, x⟩ − λ⟨y, x⟩
= ⟨A∗ y, x⟩ − ⟨λy, x⟩
= ⟨(A∗ − λ1I)y, x⟩
= ⟨z, x⟩
= ⟨(A − λ1I)w, x⟩ .
Da primeira para a segunda linha usamos o fato que, por definição, ⟨y, Ax⟩ = ⟨A∗ y, x⟩ para
todo x ∈ Dom(A) e y ∈ Dom(A∗ ). Mas, como A ⊂ A∗ , segue que (A − λ1I)w =
(A∗ − λ1I)w para w ∈ Dom(A); portanto, temos que
5
5
⟨(A∗ − λ1I)w, x⟩5 = ⟨z, x⟩ = ⟨w, (A − λ1I)x⟩ = ⟨y, (A − λ1I)x⟩ .
Dom(A)
Logo, temos que
⟨y − w, (A − λ1I)x⟩ = 0 .
Assim, y − w ∈ Ran(A − λ1I)⊥ . Mas, por hipótese Ran(A − λ1I) = H , e isto implica que
Ran(A − λ1I)⊥ = {0}, ou seja, y − w = 0, isto é, y = w ∈ Dom(A). Consequentemente,
Dom(A) ⊃ Dom(A∗ ). A mesma análise se aplica ao conjunto Ran(A − λ1I).
A propriedade de auto-adjunção depende da forma como um operador A atua sobre os veto-

res sobre os quais ele é pemitido atuar e, principalmente, depende do seu domínio Dom(A).
Como já enfatizado na Seção 4.1, uma mesma regra formal considerada em domínios diferentes
pode conduzir a operadores com propriedades completamente diferentes: uma mesma regra
pode definir um operador auto-adjunto em um domínio Dom1 (A), ou pode representar um
operador apenas simétrico em um domínio Dom2 (A). Neste último caso podemos tentar
encontrar a sua extensão auto-adjunta. Em aplicações na mecânica quântica a condição de
um operador ser simétrico (ou hermitiano) é muitas vezes fácil de se verificar. No entanto, às
vezes, os físicos não estão cientes da importância da distinção entre um operador simétrico (ou
hermitiano) e um auto-adjunto. A condição A = A∗ é muito forte. Extensões auto-adjuntas
de um operador simétrico é um tópico importante na mecânica quântica. Já vimos que se um
operador simétrico tem uma, e somente uma, extensão auto-adjunta ele é chamado operador
essencialmente auto-adjunto. No entanto, um operador simétrico pode ter várias extensões auto-
adjuntas. De fato, como veremos mais adiante, o problema uni-dimensional para uma partícula
não-relativística movendo-se em uma “caixa,” descrita pelo intervalo (0, 1), nos revelará que o
operador momentum P = −i#d/dx pode possuir uma infinidade de extensões auto-adjuntas.
Neste caso, a escolha de qual das extensões é a mais apropriada para o sistema sob investigação
não pertence ao domínio da matemática, mas ao domínio da física.
198
Vamos finalizar esta seção retornando ao diálogo entre Heisenberg e Friedrichs, tentando
justificar ainda mais a importância de se compreender a diferença entre operadores hermitianos,
simétricos e auto-adjuntos na mecânica quântica. A quantização de sistemas físicos deve incluir
uma definição correta dos observáveis físicos (como o hamiltoniano e o momentum) como
operadores auto-adjuntos em um espaço de Hilbert, H , apropriado e sua análise espectral
adequada. Uma solução deste problema não é um procedimento direto e livre de ambiguidades
para sistemas quânticos não-triviais, mesmo os mais simples (veja a discussão do operador
momentum na Seção 4.7). No caso da análise espectral, veremos que para operadores meramente
simétricos o espectro não é composto exclusivamente por números reais. Em contrapartida, o
espectro de um operador auto-adjunto é sempre composto por números reais (veja o Teorema
5.4). Lembremos que na mecânica quântica toda grandeza física mensurável está associada
com um certo operador A. O espectro de A é, então, composto pelo conjunto dos possíveis
valores de medição do observável, e os valores medidos devem ser reais. Lembremos, ainda,
que na mecânica quântica, os estados de um sistema físico são vetores em um espaço de
Hilbert, H , e que a dinâmica do sistema é descrita por um operador H em H , chamado
operador hamiltoniano (ou operador energia). A evolução temporal do sistema é descrita pela
equação diferencial de Schrödinger, com a solução sendo descrita pelo semi-grupo unitário
uni-paramétrico t !→ eitH , gerado por H. A exponenciação de H só é possível se H for
auto-adjunto, isto é, pode-se afirmar que a existência da dinâmica na mecânica quântica é
“equivalvante” a provar que o operador hamiltoniano é auto-adjunto (isto será abordado no
Capítulo 8). E mais, no estudo da dinâmica quântica, toda vez que você precisar levar em conta
a imposição de condições de contorno diferentes, você está, efetivamente, se preocupando com
diferentes extensões auto-adjuntas sem se dar conta disso. As extensões auto-adjuntas de um
operador hamiltoniano simétrico é um problema relevante, pois extensões distintas definem leis
dinâmicas distintas. Portanto, apesar de todo desdém de Heisenberg (talvez receando que a
essência “etérea” da matemática pudesse macular-se no simples contato com as “realidades” da
mecânica quântica), a distinção entre operadores hermitianos, simétricos e auto-adjuntos é, sim,
crucial para a mecânica quântica!
4.6 Operador Unitário

Um operador unitário é um operador limitado e sobrejetivo (não confunda com um operador
identidade) em um espaço de Hilbert que preserva o produto interno. Os operadores unitários
geralmente operam em um espaço de Hilbert, mas a mesma noção é usada para definir o
conceito de isomorfismo entre os espaços de Hilbert.
DEFINIÇÃO 4.26. Sejam H1 e H2 dois espaços de Hilbert. Um operador V com domínio
Dom(V ) = H1 e conjunto imagem Ran(V ) = H2 é isométrico se
⟨V x, V y⟩ = ⟨x, y⟩ , ∀ x, y ∈ H1 .
Por sua vez, um operador unitário é definido da seguinte forma:

DEFINIÇÃO 4.27. Seja H um espaço de Hilbert. Um operador U que tem como domínio
Dom(U ) = H e conjunto imagem Ran(U ) = H é unitário se
⟨U x, U y⟩ = ⟨x, y⟩ , ∀ x, y ∈ H .
199
Note que, pela definição acima, um operador unitário em um espaço de Hilbert H é um

caso especial de um operador isométrico se assumimos que H1 = H2 = H .
A próxima definição é equivante à definição acima.
DEFINIÇÃO 4.27a. Diz-se que um operador linear limitado U em um espaço de Hilbert H é

unitário se ele satisfaz a condição U ∗ U = U U ∗ = 1I, em que U ∗ é o adjunto de U .
A condição mais fraca U ∗ U = 1I define uma isometria. A outra condição, U U ∗ = 1I,

define uma coisometria. Assim, um operador unitário é um operador linear limitado, que é
tanto uma isometria e uma coisometria.
Uma outra definição equivalente à Definição 4.27 é a seguinte
DEFINIÇÃO 4.27b. Diz-se que um operador linear limitado U em um espaço de Hilbert H é

unitário se ele é sobrejetivo e preserva o produto interno do espaço de Hilbert H .
Com efeito, usando a identidade de polarização, para todo x, y ∈ H temos que
1 1 i i
⟨U y, U x⟩ = ∥U y + U x∥2 − ∥U y − U x∥2 − ∥U y + iU x∥2 + ∥U y − iU x∥2
4 4 4 4
1 1 i i
= ∥U (y + x)∥2 − ∥U (y − x)∥2 − ∥U (y + ix)∥2 + ∥U (y − ix)∥2
4 4 4 4
1 1 i i
= ∥y + x∥2 − ∥y − x∥2 − ∥y + ix∥2 + ∥y − ix∥2
4 4 4 4
= ⟨y, x⟩ .
A seguinte definição (aparentemente mais fraca) também é equivalente:
DEFINIÇÃO 4.27c. Diz-se que um operador linear limitado U em um espaço de Hilbert H é

unitário se seu conjunto imagem, Ran(U ), é denso em H e se ele preserva o produto interno
do espaço de Hilbert H .
Para ver que as definições acima são equivalentes, observe que devido à identidade de
polarização, U preserva o produto interno e isto é equivalente a preservar a norma. Com
efeito, se y = x, então ∥U x∥ = ∥x∥. Isto implica que U é também um operador isométrico
(portanto, um operador linear limitado ∥U ∥ = 1). O fato de que o Ran(U ) é denso em H
assegura que U tem um inverso limitado U −1 . Neste caso, denotamos U −1 = U ∗ . Assim,
um operador unitário é um automorfismo de espaços de Hilbert, isto é, ele conserva a estrutura
(neste caso, a estrutura de espaço linear, o produto interno, e, portanto, a topologia) do espaço
sobre o qual ele atua.
Nota 4.27. A condição da linearidade na definição de um operador unitário pode ser omitida
sem alterar o significado, porque ela pode ser derivada da linearidade e positividade-definida
200
do produto escalar:
∥λU x − U(λx)∥2 = ⟨λU x − U (λx), λU x − U (λx)⟩
= ∥λU x∥2 + ∥U (λx)∥2 − ⟨U (λx), λU x⟩ − ⟨λU x, U (λx)⟩
= |λ|2 ∥U x∥2 + ∥U (λx)∥2 − λ⟨U (λx), U x⟩ − λ⟨U x, U (λx)⟩
= |λ|2 ∥x∥2 + ∥λx∥2 − λ⟨λx, x⟩ − λ⟨x, λx⟩
=0.
Analogamente, obtemos
∥U (y + x) − (U y + U x)∥ = 0 .
4.6.1 A Transformada de Cayley
Sejam A um operador simétrico fechado em um espaço de Hilbert H e λ ∈ C \ R (isto é,

λ é um número complexo não-real). Tome um x ∈ Dom(A) e assuma que
e (A − λ1I)x = z ,
(A − λ1I)x = y
. /
em que, y ∈ Ran(A − λ1I) = (A − λ1I) Dom(A) e z ∈ Ran(A − λ1I) = (A −
. /
λ1I) Dom(A) .
PROPOSIÇÃO 4.23. Seja A um operador simétrico fechado em um espaço de Hilbert complexo
H ̸= {0} e λ um elemento de C \ R. Suponha que existe ε > 0 tal que
∥(A − λ1I)x∥ " ε∥x∥ e ∥(A − λ1I)x∥ " ε∥x∥ , ∀ x ∈ Dom(A) . (4.6.1)
Então, Ran(A − λ1I) e Ran(A − λ1I) são subespaços fechados de H .
Demonstração. Prova completamente análoga à prova da Proposição 4.6.
Agora, observe que se A é um operador simétrico, então,
∥(A − λ1I)x∥2 = ⟨Ax, Ax⟩ − ⟨Ax, λx⟩ − ⟨λx, Ax⟩ + ⟨λx, λx⟩
= ∥Ax∥2 − (λ + λ)⟨x, Ax⟩ + |λ|2 ∥x∥2
= ∥Ax∥2 − 2(Re λ)⟨x, Ax⟩ + |λ|2∥x∥2
" (Im λ)2 ∥x∥2 .
Aqui, levamos em conta o fato que ⟨x, Ax⟩ = ⟨Ax, x⟩ = ⟨x, Ax⟩, para todo x ∈ Dom(A).
Isto mostra que se (A − λ1I)x = 0, então x = 0. Logo, pelo Lema 4.1, o inverso (A − λ1I)−1
existe. Além disso, o operador (A − λ1I)−1 é limitado; com efeito, segue, imediatamente do
desenvolvimento acima, que
∥y∥ " (Im λ)∥(A − λ1I)−1 y∥ =⇒ ∥(A − λ1I)−1 ∥ # (Im λ)−1 .
201
O mesmo raciocínio se aplica ao operador (A − λ1I). Em outras palavras, isto implica que
por meio das relações (A − λ1I)x = y e (A − λ1I)x = z, o conjunto Dom(A) é mapeado
injetivamente sobre Ran(A − λ1I) e Ran(A − λ1I), respectivamente. Ou seja, para cada
y ∈ Ran(A − λ1I) existe um, e somente um, elemento x ∈ Dom(A) que satisfaz a
relação (A − λ1I)x = y. Por sua vez, tendo encontrado este elemento x, determinamos o
elemento z pela relação (A − λ1I)x = z. Desta forma, todo elemento z ∈ Ran(A − λ1I)
está associado a um único elemento y ∈ Ran(A − λ1I). Isto implica a existência de um
operador V que relaciona esses elementos, isto é, V z = y, com V tendo como domínio
Dom(V ) = Ran(A − λ1I) e conjunto imagem Ran(V ) = Ran(A − λ1I). Assim, segue
que (A − λ1I)−1 z = x. Isto implica que (A − λ1I)(A − λ1I)−1 z = (A − λ1I)x, que por sua
vez implica que (A − λ1I)(A − λ1I)−1 z = y. Consequentemente, temos que
V = (A − λ1I)(A − λ1I)−1 .
O operador V assim definido é chamado a transformada de Cayley do operador A.
Seja z um vetor arbitrário no domínio de definição do operador V , então V z = (A − λ1I)x,

para x no domínio de definição do operador A. Logo,
∥V z∥ = ∥(A − λ1I)x∥ = ∥Ax∥2 − 2(Re λ)⟨x, Ax⟩ + |λ|2∥x∥2 .
Por sua vez, por definição, z = (A − λ1I)x. Logo,
∥z∥ = ∥(A − λ1I)x∥ = ∥Ax∥2 − 2(Re λ)⟨x, Ax⟩ + |λ|2 ∥x∥2 .
Isto nos mostra que ∥V z∥ = ∥z∥, ou seja que o operador V é isométrico. Além disso,
segue das relações V z = (A − λ1I)x e z = (A − λ1I)x que, para todo x ∈ Dom(A),
(V − 1I)z = (λ − λ)x. Portanto,
, -
1
Dom(A) = Ran(V − 1I) ,
λ−λ
ou seja, o conjunto Ran(V −1I) formado por todos os vetores (V −1I)z, com z ∈ Dom(V ),
coincide com o conjunto Dom(A) que é denso em H . Estas propriedades do operador V
provam o seguinte
TEOREMA 4.21. Seja A um operador simétrico em um espaço de Hilbert complexo H ̸= {0}.
A transformada de Cayley de A é um operador isométrico. Além disso, o conjunto de todos os
vetores (V − 1I)z, com z ∈ Dom(V ), é denso em H .
Por causa do teorema acima, em muitas situações podemos reduzir o estudo de um operador
não limitado a um operador limitado utilizando a transformada de Cayley.
Voltemos à definição do operador V . A partir dela, segue que
V = (A − λ1I)(A − λ1I)−1 = (A − λ1I − λ1I + λ1I)(A − λ1I)−1

. /
= (A − λ1I) + (λ − λ)1I (A − λ1I)−1
= 1I + (λ − λ)(A − λ1I)−1 .
202
Logo,
1
V − 1I = (λ − λ)(A − λ1I)−1 =⇒ (A − λ1I)−1 = (V − 1I) .
(λ − λ)
Assim,
1
V = (A − λ1I)(V − 1I) ,
(λ − λ)
ou,
λV − λV = (A − λ1I)(V − 1I) = A(V − 1I) − λV + λ1I ,
ou seja,
λV − λ1I = A(V − 1I) .
Agora, para um vetor arbitrário z no domínio de definição do operador V , segue que

(V − 1I)z = 0 se, e somente se, z = 0. Com efeito, assuma que V z = z. Então, para todo
vetor z ′ ̸= 0 no domínio de definição do operador V , segue que
⟨(V − 1I)z ′ , z⟩ = ⟨V z ′ , z⟩ − ⟨z ′ , z⟩ = ⟨V z ′ , V z⟩ − ⟨z ′ , z⟩ = 0 ,
uma vez que V é uma isometria e, portanto, preserva o produto interno. Isto implica que z
seria ortogonal ao conjunto Ran(V − 1I) que é denso em H , pelo Teorema 4.21, o que é
impossível. Logo, devemos ter z = 0. Portanto, pelo Lema 4.1, o operador (V − 1I)−1 existe.
Consequentemente,
A = (λV − λ1I)(V − 1I)−1 .
Exemplo 4.9. No caso particular em que λ = i, segue que
V = (A − i1I)(A + i1I)−1 ,
e
A = −i(V + 1I)(V − 1I)−1 .
O próximo resultado é a recíproca do Teorema 4.21.
TEOREMA 4.22. Seja V um operador isométrico em um espaço de Hilbert complexo H ̸= {0}.

Assuma que o conjunto de todos os vetores (V − 1I)z, com z ∈ Dom(V ), é denso em H .
Então, V é a transformada de Cayley de um operador simétrico A.
Demonstração. Defina A através da relação
λV − λ1I = A(V − 1I) .
Então, para z ∈ Dom(V ), segue que
A(V z − z) = λV z − λz .
203
Isto implica que o vetor V z − z ∈ Dom(A). Mas, por hipótese, o conjunto composto por
todos os vetores (V − 1I)z, com z ∈ Dom(V ), é denso em H . Isto implica que Dom(A)
é denso em H . Além disso, para Dom(A) ∋ x = V z − z, segue que
Ax = λV z − λz .
Portanto,
Ax − λx = (λ − λ)z e Ax − λx = (λ − λ)V z .
Mas, como Dom(A) é denso em H , então o único vetor ortogonal ao conjunto Dom(A) é
o vetor nulo. Logo, para operador (A − λ1I), nó temos que (A − λ1I)x = 0 se, e somente se,
x = 0; assim, pelo Lema 4.1, o operador (A − λ1I)−1 existe. Consequentemente,
x = (λ − λ)(A − λ1I)−1 z e (λ − λ)(A − λ1I)(A − λ1I)−1 z = (λ − λ)V z ,
o que implica que V é a transformada de Cayley do operador A.
Finalmente, precisamos mostrar que A é simétrico. Para isto, tome z1 , z2 ∈ Dom(V ).

Logo,
⟨(V z1 − z1 ), A(V z2 − z2 )⟩ = ⟨(V z1 − z1 ), λV z2 − λz2 ⟩
= ⟨V z1 , λV z2 ⟩ − ⟨V z1 , λz2 ⟩ − ⟨z1 , λV z2 ⟩ + ⟨z1 , λz2 ⟩
= λ⟨V z1 , V z2 ⟩ − λ⟨V z1 , z2 ⟩ − λ⟨z1 , V z2 ⟩ + λ⟨z1 , z2 ⟩
= (λ + λ)⟨z1 , z2 ⟩ − λ⟨V z1 , z2 ⟩ − λ⟨z1 , V z2 ⟩ .
Da mesma forma
⟨A(V z1 − z1 ), (V z2 − z2 )⟩ = ⟨λV z1 − λz1 , (V z2 − z2 )⟩
= ⟨λV z1 , V z2 ⟩ − ⟨λV z1 , z2 ⟩ − ⟨λz1 , V z2 ⟩ + ⟨λz1 , z2 ⟩
= λ⟨V z1 , V z2 ⟩ − λ⟨V z1 , z2 ⟩ − λ⟨z1 , V z2 ⟩ + λ⟨z1 , z2 ⟩
= (λ + λ)⟨z1 , z2 ⟩ − λ⟨V z1 , z2 ⟩ − λ⟨z1 , V z2 ⟩ .
Consequentemente,
⟨(V z1 − z1 ), A(V z2 − z2 )⟩ = ⟨A(V z1 − z1 ), (V z2 − z2 )⟩ ,
isto implica que A é simétrico.

TEOREMA 4.23. Um operador simétrico A é fechado se, e somente se, sua transformada de
Cayley, V , é um operador fechado.
Demonstração. Assuma que V é fechado. Logo, por definição, toda sequência (zn )n∈N ⊂
Dom(V ) = Ran(A−λ1I) converge para um vetor z ∈ Dom(V ), enquanto que a sequência
de imagens (V zn )n∈N ⊂ Ran(V ) = Ran(A − λ1I) converge para um vetor y = V z ∈
204
Ran(V ). Mas, isto implica que z ∈ Ran(A − λ1I) e y ∈ Ran(A − λ1I), isto é, existe um
vetor x ∈ Dom(A) tal que z = (A − λ1I)x e y = (A − λ1I)x. Para isto ser verdade deve
existir uma sequência (xn )n∈N ⊂ Dom(A) tal que xn → x. Assim,
Axn = yn + λxn → y + λx = Ax .
Pela definição de um operador fechado, como xn → x ∈ Dom(A) e Axn = yn + λxn →

Ax = y + λx, então A é fechado.
Reciprocamente, assuma que A é fechado. Logo, toda sequência (xn )n∈N ⊂ Dom(A)
converge para um vetor x ∈ Dom(A), enquanto que a sequência de imagens (Axn )n∈N ⊂
Ran(A) converge para um vetor u = Ax ∈ Ran(A). Obviamente, λxn → λx e λxn → λx.
Assim, se definirmos zn = (A − λ1I)xn ⊂ Ran(A − λ1I), então a sequência (zn )n∈N converge
para um vetor z = (A−λ1I)x ∈ Ran(A−λ1I), enquanto que a sequência (Axn −λxn )n∈N ⊂
Ran(A − λ1I) converge para um vetor y = (A − λ1I)x ∈ Ran(A − λ1I). Mas, por
definição, Ran(A − λ1I) = Dom(V ) e Ran(A − λ1I) = Ran(V ). Assim, a sequência
(zn )n∈N ⊂ Dom(V ) converge para z ∈ Dom(V ) e V zn → y = V z ∈ Ran(V ). Logo,
V é fechado.
TEOREMA 4.24. Se A é um operador auto-adjunto em um espaço de Hilbert complexo H ̸= {0},

sua transformada de Cayley, V , é unitária.
Demonstração. Assuma que A é auto-adjunto. Então, usando a Proposição 4.13 e as Propriedades

4 e 5 do Exercício 4.9, segue que
8 9∗ 8 9∗
V ∗ = (A − λ1I)(A − λ1I)−1 = (A − λ1I)−1 (A − λ1I)∗
8 9−1
= (A − λ1I)∗ (A∗ − λ1I)
= (A∗ − λ1I)−1 (A∗ − λ1I)
= (A − λ1I)−1 (A − λ1I) .
Logo,
V ∗ V = (A − λ1I)−1 (A − λ1I)(A − λ1I)(A − λ1I)−1 .
Uma vez que Dom(A − λ1I) = Dom(A − λ1I) = Dom(A), os operadores (A − λ1I) e
(A − λ1I) comutam;16 portanto, obtém-se que V ∗ V = 1I. Por outro lado,
V V ∗ = (A − λ1I)(A − λ1I)−1 (A − λ1I)−1 (A − λ1I) .

16
A noção de que dois operadores A e B comutam significa que eles têm um domínio comum e que ABx =
BAx para todo x no domínio. Com efeito, no caso aqui tratado, para todo x ∈ Dom(A), segue que
(A − λ1I)(A − λ1I)x = (AA − λA − λA + |λ|2 )x ,
e
(A − λ1I)(A − λ1I)x = (AA − λA − λA + |λ|2 )x .
Logo, (A − λ1I) e (A − λ1I) comutam!
205
Por sua vez, os operadores (A − λ1I)−1 e (A − λ1I)−1 são limitados e têm como o domínio
Ran(A−λ1I) e Ran(A−λ1I), respectivamente. Mas, de acordo com o Corolário 4.5, sendo A
auto-adjunto, então, Ran(A − λ1I) = Ran(A − λ1I) = H , isto é, os operadores (A − λ1I)−1
e (A − λ1I)−1 têm todo o espaço de Hilbert H como domínio. Logo, eles comutam e isto
implica que V V ∗ = 1I. Assim, a transformada de Cayley, V , é unitária.
Nota 4.28 (Breve comentário sobre o teorema acima). Observe que, pela Definição 4.22’, o
operador limitado V é unitário se ele é sobrejetivo e preserva o produto interno do espaço de
Hilbert H . Uma vez que A é auto-adjunto, então, Ran(V ) = Ran(A − λ1I) = H , pelo
Corolário 4.5. Portanto, V é sobrejetivo. Além disso, preservar o produto interno é equivalente
a preservar a norma, e como V é uma aplicação isométrica, o operador V preserva a norma.
Logo, de acordo com a Definição 4.22’, o operador V é unitário. Em resumo, o Teorema 4.24 é
apenas uma consequência do critério fundamental de que A é auto-adjunto se, e somente se,
Ran(A − λ1I) = Ran(A − λ1I) = H .
4.7 Operadores Multiplicação e Diferenciação

Nesta seção, vamos considerar algumas propriedades dos operadores multiplicação e dife-
renciação. Esses dois operadores desempenham um papel importante na mecânica quântica.
O primeiro desempenha o papel do operador posição, enquanto que o segundo o papel do
operador momentum.
4.7.1 Operador Posição
Vamos considerar o seguinte operador:
X : Dom(X) → L2 (−∞, ∞)
Ψ(x) 3−→ x Ψ(x) , (4.7.1)
em que Dom(X) ⊂ L2 (−∞, ∞). O domínio de Dom(X) consiste de todas as funções

Ψ ∈ L2 (−∞, ∞) tal que XΨ ∈ L2 (−∞, ∞), isto é,
$ ∞
dx x2 |Ψ(x)|2 < ∞ .
−∞
Obviamente, Dom(X) ̸= L2 (−∞, ∞). Com efeito, considere a função Ψ ∈ L2 (−∞, ∞)

definida da seguinte forma:
⎧
⎨1/x , se x " 1
Ψ(x) = .
⎩ 0 , se x < 1
Esta função não pertence ao domínio Dom(X). Em contrapartida, Dom(X) contém todas
as funções Ψ ∈ L2 (−∞, ∞) que se anulam fora de um intervalo compacto e este conjunto de
funções é denso em L2 (−∞, ∞). Portanto, Dom(X) é denso em L2 (−∞, ∞).
PROPOSIÇÃO 4.24. O operador posição X definido pela Eq.(4.7.1) é ilimitado.
206
Demonstração. Considere a função, indexada por n, dada abaixo

⎧
⎨1 , se n # x < n + 1
Ψn (x) = .
⎩0 , caso contrário
A função Ψn é representada abaixo.
n n+1 x
Note que, ∥Ψn ∥2 = 1 e

,$ n+1 -1/2
2
∥XΨn ∥2 = dx x >n.
n
Certamente não existe uma constante C que satisfaça

∥XΨn ∥2
C" >n,
∥Ψn ∥2
para todo n = 1, 2, . . .; logo, o operador X é ilimitado.
Deve-se enfatizar que, na proposição acima, a não limitação do operador posição X é

resultado do fato de termos considerado funções definidas sobre toda a reta real. Em contraste
com esta situação, no caso de um intervalo finito [a, b] ⊂ R o operador
X1 : Dom(X1 ) → L2 [a, b]
Ψ(x) 3−→ x Ψ(x) , (4.7.2)

é limitado. De fato,
,$ b -1/2
2 2
∥X1 Ψ∥2 = dx x |Ψ(x)| # max {|a|, |b|}∥Ψ∥2 .
a
Este resultado também mostra que X1 Ψ ∈ L2 [a, b], para toda função Ψ ∈ L2 [a, b]. Portanto,
Dom(X1 ) = L2 [a, b], ou seja, o operador X1 está definido em todo o espaço L2 [a, b]. Isto
reflete um fato já enfatizado algumas vezes ao longo deste capítulo: a mesma regra formal con-
siderada em domínios diferentes pode representar operadores diferentes em domínios diferentes.
No caso em questão, a regra XΨ = x Ψ pode representar um operador ilimitado no domínio
L2 (−∞, ∞), ou pode representar um operador limitado no domínio L2 [a, b].
Exemplo 4.10 (Operador posição na mecânica quântica). Se Ω = [a1 , b1 ] × · · · × [an , bn ]
é um subconjunto próprio e compacto de Rn , então, o operador Xj , com j = 1, . . . , n, é
definido para toda função Ψ ∈ L2 (Ω) pela equação
Xj : Dom(Xj ) → L2 (Ω)
Ψ(x1 , . . . , xn ) 3−→ xj Ψ(x1 , . . . , xn ) . (4.7.3)
207
Neste caso, Xj é um operador auto-adjunto limitado, com a norma ∥Xj ∥ sendo dada pelo
maior dos números |aj | e |bj |. Se cada intervalo [aj , bj ], com j = 1, . . . , n, é infinito, então
Ω = Rn e Xj é definido pela Eq.(4.7.3) com domínio de definição
! "
Dom(Xj ) = Ψ ∈ L2 (Rn ) | xj Ψ(x1 , . . . , xn ) ∈ L2 (Rn ) . (4.7.4)
O domínio acima é certamente denso em H pois contém o espaço C0∞ (Rn ) das funções
infinitamente diferenciáveis de suporte compacto e também o espaço das funções de Schwartz
S (Rn ) (esses espaços são tratados com detalhes no Capítulo 6), ambos densos em L2 (Rn ).17
Assim, o operador Xj admite um adjunto. Por definição de Xj e seu domínio, temos que
⟨Φ, Xj Ψ⟩ = ⟨Xj Φ, Ψ⟩ se Ψ, Φ ∈ Dom(Xj ). Por conseguinte, Xj é simétrico. Vamos
mostrar que ele é auto-adjunto também.
Seja Λ ∈ Dom(Xj∗ ) tal que Λ = Xj∗ Φ. Então, para toda função Ψ no domínio (4.7.4),
segue que
⟨Φ, Xj Ψ⟩ = ⟨Λ, Ψ⟩ ,
ou seja, isto é equivalente à relação
$ ∞] n $ ∞ n
]
dxj Φ(x1 , . . . , xn )xj Ψ(x1 , . . . , xn ) = dxj Λ(x1 , . . . , xn )Ψ(x1 , . . . , xn ) ,
−∞ j=1 −∞ j=1
ou seja, segue que

$ ∞] n 6 7
dxj xj Φ(x1 , . . . , xn ) − Λ(x1 , . . . , xn ) Ψ(x1 , . . . , xn ) = 0 .
−∞ j=1
Naturalmente, a equação acima acontece para toda função Ψ ∈ L2 (Rn ) que desaparece fora
de qualquer conjunto compacto [α1 , β1 ] × · · · × [αn , βn ] ⊂ Rn ,
$ βj ]n 6 7
dxj xj Φ(x1 , . . . , xn ) − Λ(x1 , . . . , xn ) Ψ(x1 , . . . , xn ) = 0 .
αj j=1
Logo, para todo xj ∈ [αj , βj ], segue que Λ(x1 , . . . , xn ) = xj Φ(x1 , . . . , xn ). Isto implica que
xj Φ(x1 , . . . , xn ) ∈ L2 (Rn ), Φ ∈ Dom(Xj ) e Λ = Xj∗ Φ. Isto mostra que Dom(Xj∗ ) ⊂
Dom(Xj ). Como, por definição, Dom(Xj ) ⊂ Dom(Xj∗ ), então Dom(Xj∗ ) = Dom(Xj )
e Xj é auto-adjunto.
Uma outra forma de se analisar a auto-adjunção do operador Xj é através do uso da

transformada de Cayley. Seja
V = (Xj − i1I)(Xj + i1I)−1 ,
a transformada de Cayley do operador posição Xj . Considerando que
Ran(Xj ± i) = L2 (Rn ) ,
então, se Φ ∈ L2 (Rn ), podemos escrever
Φ(x1 , . . . , xn ) = (xj + i)Ψ(x1 , . . . , xn ) , ∀ Ψ ∈ Dom(Xj ) ,

17
Como Ω = Rn então é evidente que Xj é um operador ilimitado.
208
com Dom(Xj ) representado pela Eq.(4.7.4). Isto implica que
Φ(x1 , . . . , xn )
Ψ(x1 , . . . , xn ) = .
(xj + i)
Além disso, o operador V definido acima é isométrico. Com efeito,

? ?
∥V Ψ∥2 = ?(Xj − i1I)(Xj + i1I)−1 Ψ?2
($ n 5 5 )1/2
∞ ] 5 xj − i 52
= dxj 55 5 |Ψ(x1 , . . . , xn )|2
−∞ j=1 xj + i 5
($ n
)1/2
∞ ]
= dxj |Ψ(x1 , . . . , xn )|2
−∞ j=1
= ∥Ψ∥2 .
Ainda, pela definição de Xj e seu domínio, o adjunto Xj∗ deve satisfazer
Ker(Xj∗ ± i1I) = {0} ,
e como o domínio e o conjunto imagem de V são Dom(V ) = Ran(Xj +i1I) e Ran(V ) =

Ran(Xj −i1I), respectivamente, V tem todo o espaço de Hilbert H = L2 (Rn ) como domínio
e, assim, é unitário. Portanto, pelo Teorema 4.24, Xj é auto-adjunto.
4.7.2 Operador Momentum
Vamos analisar o problema da auto-adjunção do operador momentum, P , na mecânica

quântica, definido pela expressão
dΨ(x)
P Ψ(x) = −i# , (4.7.5)
dx
para cada função Ψ em seu domínio Dom(P ).18 Uma função Ψ pertencerá ao domínio
Dom(P ) se certas condições são satisfeitas. Como já enfatizado, um operador não pode ser
considerado como totalmente caracterizado até que o seu domínio de definição fique estabele-
cido. No caso do operador momentum (ou mesmo no caso do operador hamiltoniano) devemos
ficar atentos para mais um detalhe sobre o domínio: P é um operador diferencial, e como tal
gerará uma equação diferencial. Entretanto, uma equação diferencial não estará completamente
estabelecida até que especifiquemos as condições de contorno que as soluções devem satisfa-
zer. Assim, para uma função Ψ pertencer ao domínio Dom(P ), não apenas a expressão P Ψ
deve ser definida, mas também as condições de contorno que Ψ deve satisfazer. Se as condi-
ções de contorno são muito restritivas, então podemos ter Dom(P ) ⊂ Dom(P ∗ ), mas com
Dom(P ) ̸= Dom(P ∗ ), de modo que o operador momentum P não pode ser auto-adjunto.
18
Aqui,
h
#= = 1, 05457 × 10−34 Js ,
2π
em que h = 6, 62608 × 10−34 Js é a constante de Planck.
209
De fato, o operador momentum pode ser simétrico ou auto-adjunto dependendo da escolha do

seu domínio. De forma a tornar isto claro, vamos considerar, em particular, o problema uni-
dimensional de uma partícula não-relativística movendo-se sobre um intervalo (a, b). Para o
espaço de estados do sistema tomamos o espaço de Hilbert L2 (a, b), cujos vetores são funções
de onda Ψ(x), com x ∈ (a, b). Seguindo a apresentação do livro-texto de Akhiezer-Glazman,
consideraremos o operador momentum P em três situações distintas: num intervalo finito, no
semi-eixo e na reta real completa.
Exemplo 4.11 (Primeiro Caso – O Intervalo Finito (0, 1)). Sem perda de generalidade, vamos
tomar a = 0 e b = 1. Vamos considerar o problema uni-dimensional de uma partícula, não-
relativística, movendo-se em uma “caixa,” descrita pelo intervalo 0 # x # 1. Nesta situação,
podemos imaginar a partícula movendo-se na presença de um potencial V que é zero para x
entre 0 e 1 e que toma valores infinitamente grandes no restante da reta real. Isto significa que
Ψ ≡ 0 fora do intervalo. Matematicamente, satisfazemos essa exigência impondo a seguinte
condição de contorno de Dirichlet:
5
Ψ5∂(0,1) = 0 =⇒ Ψ(0) = Ψ(1) = 0 . (4.7.6)
Vamos tomar o operador momentum P em L2 (0, 1) com o domínio

3 4
Dom(P ) = Ψ ∈ AC[0, 1] ⊂ L2 (0, 1) | Ψ(0) = Ψ(1) = 0 ,
em que AC[0, 1] é o espaço das funções absolutamente contínuas Ψ no intervalo [0, 1].19 Então,
tanto Ψ como dΨ/dx pertencem ao espaço L2 (0, 1). Queremos investigar se P é auto-adjunto.
Primeiro, vamos mostrar que P = −i#d/dx é simétrico. De fato, para Φ, Ψ ∈ Dom(P ),
segue que
$ 1 , - $ 1 , -
# dΨ(x) # dΦ(x)
⟨Φ, P Ψ⟩ − ⟨P Φ, Ψ⟩ = dx Φ(x) − dx Ψ(x)
0 i dx 0 i dx
$ ( , - )
# 1 dΨ(x) dΦ(x)
= dx Φ(x) + Ψ(x)
i 0 dx dx
$
# 1
d . / #. /551
= dx Φ(x)Ψ(x) = Φ(x)Ψ(x) 5 = 0 .
i 0 dx i 0
Consequentemente, pela condição de contorno (4.7.6) imposta sobre a função Ψ, o operador P

é simétrico. Note que, P é simétrico mesmo que a função Φ satisfaça somente a condição de
ser absolutamente contínua no intervalo [0, 1]!
19
Diz-se ;
que uma função Ψ em5 [a, b] ⊂ R é absolutamente contínua se, dado um ε > 0, existe um δ >
n 55 5
0 tal que Ψ(y j ) − Ψ(xj ) < ε, para toda coleção finita de intervalos disjuntos [xj , yj ] satisfazendo
;n 55 5
j=1
5
j=1 yj − xj < δ. Funções absolutamente contínuas são da forma
$ x
Ψ(x) = dy Φ(y) + Ψ(0) , com Φ integrável .
0
Para tais funções, usando o Teorema Fundamental do Cálculo (veja nota de roda-pé na página 211), segue que
dΨ/dx = Φ em quase-toda-parte (q.t.p.). Em resumo, se Ψ é absolutamente contínua em [a, b], então Ψ é
diferenciável em q.t.p., dΨ/dx ∈ L1 [a, b], e Ψ é a integral indefinida de dΨ/dx. Em outras palavras, ao
assumirmos o espaço das funções absolutamente contínuas garantimos que a operação de integração por partes
está sempre bem definida. Além disso, o subespaço AC[a, b] é denso em L2 (a, b).
210
A seguir, vamos mostrar que P é também fechado. De acordo com o Teorema 4.17, a
menor extensão fechada P ∗∗ de P deve estar contida em P ∗ , ou seja, P ⊂ P ∗∗ ⊂ P ∗ .
Consequentemente, P será um operador simétrico fechado se P = P ∗∗ . Como P ∗∗ representa
uma extensão fechada de P , então P ⊂ P ∗∗ . As funções Φ ∈ Dom(P ∗∗ ) são funções
absolutamente contínuas no intervalo [0, 1] e
dΦ(x)
P ∗∗ Φ(x) = −i# ∈ L2 (0, 1) .
dx
Portanto, para toda função Ψ ∈ Dom(P ∗), segue que
$ 1 , - $ 1 , -
∗∗ ∗ # dΦ(x) # dΨ(x)
⟨Ψ, P Φ⟩ − ⟨P Ψ, Φ⟩ = dx Ψ(x) − dx Φ(x)
0 i dx 0 i dx
$ ( , - )
# 1 dΦ(x) dΨ(x)
= dx Ψ(x) + Φ(x)
i 0 dx dx
$
# 1
d . / #. /551
= dx Ψ(x)Φ(x) = Ψ(x)Φ(x) 5 = 0 .
i 0 dx i 0
Uma vez que os valores de Ψ(0) e Ψ(1) são arbitrários, a equação acima será satisfeita se, e
somente se, Φ(0) = Φ(1) = 0, mas isto implica que Φ ∈ Dom(P ). Isto mostra que P ∗∗ ⊂ P .
Como, pelo Teorema 4.17, P ⊂ P ∗∗ ; logo P = P ∗∗ e, portanto, P é fechado!
Vamos, agora, mostrar que P ̸= P ∗. Para isto, devemos encontrar os pares (Ω, Φ) de
elementos de AC[0, 1] ⊂ L2 (0, 1) de tal forma que
⟨Φ, P Ψ⟩ = ⟨Ω, Ψ⟩ .
Esta relação pode ser escrita da seguinte forma:
$ 1 , - $ 1
# dΨ(x)
dx Φ(x) = dx Ω(x)Ψ(x) , (4.7.7)
0 i dx 0
para toda função Ψ ∈ Dom(P ) e para toda função Φ ∈ Dom(P ∗ ). Para Φ ∈ Dom(P ∗ ),
segue que Ω = P ∗ Φ ∈ L2 (0, 1) ⊂ L1 (0, 1). Considere a função
$ x
Λ(x) = dy Ω(y) + C , (C é uma constante arbitrária) .
0
Ela é absolutamente contínua e, pelo Teorema Fundamental do Cálculo,20 dΛ/dx = Ω em quase

toda parte. Assim, a Eq.(4.7.7) pode ser escrita da seguinte forma
$ 1 , - $ 1 , -
# dΨ(x) i # dΛ(x)
dx Φ(x) = dx Ψ(x)
0 i dx 0 # i dx
$ 1 , ,$ x --
i # d
=− dx dy Ω(y) + C Ψ(x) ,
# 0 i dx 0
20
Lembramos que, pelo Teorema Fundamental do Cálculo, se Ω é uma função suave e se a função Λ é definida
pela integral
$ x
dΛ(x)
Λ(x) = dy Ω(y) (em que a é constante) =⇒ = Ω(x) .
a dx
211
para toda função Ψ ∈ Dom(P ). Fazendo uma integração por partes, levando em conta a
condição de contorno (4.7.6), obtemos
$ 1 , $ -, -
i x i # dΨ(x)
dx Φ(x) − dy Ω(y) − C = 0 , ∀ Ψ ∈ Dom(P ) .
0 # 0 # i dx
Isto implica que

, $ x -
i i
Φ(x) − dy Ω(y) + C = 0 ,
# 0 #
B CD E
i
!
Λ(x)
e, para quase todo x,
dΦ(x) dΛ(x)
−i# = = Ω(x) .
dx dx
Dado que Ω = P ∗Φ, com P ∗ = −i#d/dx, mostramos que o domínio do operador P ∗ é
Dom(P ∗ ) = AC[0, 1], ou seja, é o conjunto de todas as funções Φ absolutamente contínuas
e que P ∗ Φ = −i#dΦ/dx. Por outro lado, as funções no domínio Dom(P ) além de terem
sido assumidas serem absolutamente contínuas, elas devem também satisfazer a condição de
contorno (4.7.6), enquanto que as funções no domínio Dom(P ∗ ) devem satisfazer somente a
condição de serem absolutamente contínuas. Desta análise fica evidente que
P ̸= P ∗ =⇒ P não é auto-adjunto!
Mas, por que o operador P é apenas simétrico? Como a condição de contorno (4.7.6)
influencia neste resultado? Para responder estas questões, primeiro observamos que, de acordo
com o Corolário 4.5, sendo P apenas simétrico, então, Ran(P + i1I) ̸= H e também
Ran(P − i1I) ̸= H . Isto significa que existe pelo menos uma função Φ ∈ Ran(P + i1I)⊥ =
Ker(P ∗ − i1I) não nula, tal que
⟨Φ, (P + i1I)Ψ⟩ = 0 =⇒ ⟨Φ, P Ψ⟩ = −i⟨Φ, Ψ⟩ = ⟨iΦ, Ψ⟩ .
Logo, P ∗Φ = iΦ. Da mesma forma, para uma função Φ ∈ Ran(P − i1I)⊥ = Ker(P ∗ + i1I)
não nula, segue que
⟨Φ, (P − i1I)Ψ⟩ = 0 =⇒ ⟨Φ, P Ψ⟩ = i⟨Φ, Ψ⟩ = ⟨−iΦ, Ψ⟩ .
e P ∗ Φ = −iΦ. Portanto, a ação do operador P ∗ sobre o domínio AC[0, 1], representado pela
equação diferencial
# dΦ(x)
P ∗ Φ(x) = = ±iΦ(x) ,
i dx
−1
tem soluções Φ(x) = Ce±# x , em que C é uma constante, com auto-valores ±i. A única
maneira da equação diferencial acima satisfazer as condições de contorno (4.7.6) é se C = 0;
isto implica que Φ é a função identicamente nula. Assim, P ∗ não possuiria auto-funções.
Além disso, como já vimos, tomar o fecho de P não ajuda, porque as condições de contorno
sobrevivem tomando-se o fecho. Podemos entender isto, em termos práticos, como uma falha do
teorema espectral. Com efeito, operadores auto-adjuntos têm um espectro puramente real (veja
212
o Teorema 5.4). Assim, os auto-valores imaginários, ±i, estão em desacordo com a condição de
auto-adjunção. Não é difícil ver que aqui Dom(P ∗ )\Dom(P ) é bidimensional e, portanto, os
dois “auto-espaços imaginários” são responsáveis pela diferença entre os domínios Dom(P ∗ )
e Dom(P ). De fato, a análise realizada na Seção 4.8 nos mostrará que
Dom(P ∗ ) = Dom(P ) ⊕ K+ ⊕ K− ,
em que K± = Ker(P ∗ ∓ i1I) são os auto-espaços com auto-valores ±i. As dimensões

n± = dim K± são chamadas de “índices de deficiência” e existirá uma extensão auto-adjunta
de P se, e somente se, n+ = n− , com n+ ̸= 0 e n− ̸= 0 (veja o Teorema 4.31).
Nosso objetivo, então, é encontrar um subespaço M ⊂ K+ ⊕ K− tal que P seja auto-

adjunto em Dom(P )⊕M . Como não deve haver números imaginários no espectro, precisamos
que M ∩ K± = {0}. Assim, as funções não-nulas de M são combinações lineares do tipo
Θ+ + Θ− , com Θ± ∈ K± sendo funções não-nulas. Para cada função Θ+ só pode haver uma
função Θ− , com Θ+ + Θ− ∈ M , caso contrário a diferença também estaria em M e em K− .
Além disso, como ⟨Θ+ , P ∗ Θ− ⟩ e ⟨P ∗Θ+ , Θ− ⟩ não são reais, pelo Teorema 4.19, segue que Θ+
e Θ− não são linearmente independentes. Portanto, existe um operador linear V : K+ → K−
tal que apenas combinações lineares do tipo Θ+ + V Θ+ estão em M . Na Seção 4.8, quando
discutirmos toda a maquinaria desenvolvida por von Neumann sobre operadores simétricos e
suas extensões, veremos que o operador V tem que ser uma isometria para que P tenha uma
chance de ser auto-adjunto. Esta condição é de fato também suficiente: para n+ = n− , com
n+ ̸= 0 e n− ̸= 0, cada escolha de uma isometria V : K+ → K− determina um domínio
! "
Dom(P ) ⊕ Θ+ + V Θ+ | Θ+ ∈ K+ ,
sobre o qual P é um operador auto-adjunto. Isto responde porque o operador P é apenas

simétrico!
É evidente de toda discussão acima que o número de soluções linearmente independentes da

equação P ∗ Φ(x) = ±iΦ(x) indica que K+ e K− são subespaços unidimensionais; portanto,
seus índices de deficiência são n+ = n− = 1. Assim, o operador P admite extensões auto-
adjuntas. Mas, como podemos encontrar um domínio maior que inclui Dom(P ) como um
subconjunto, de tal forma a permitir que a regra −i#d/dx defina um operador auto-adjunto?
Para responder esta questão, suponha que P ′ seja uma extensão simétrica de P . Portanto, para
todas as funções Φ, Ψ ∈ Dom(P ′), uma integração por partes nos fornece a seguinte relação:
#. /
⟨Φ, P ′ Ψ⟩ − ⟨P ′ Φ, Ψ⟩ = Φ(1)Ψ(1) − Φ(0)Ψ(0) . (4.7.8)
i
Mas, como P ′ é simétrico, o lado direito da equação acima deve satisfazer a relação
. /
Φ(1)Ψ(1) − Φ(0)Ψ(0) = 0 . (4.7.9)
Naturalmente, o fato de P ′ representar uma extensão simétrica de P indica que P ⊂ P ′ . Isto

por sua vez indica que o conjunto Dom(P ′ ) deve conter pelo menos alguma função Ψ0 que
não satisfaz a condição (4.7.6). Logo, tomando Ψ = Ψ0 em (4.7.9), tal que Ψ0 (0) = Ψ0 (1) ̸= 0,
obtemos para cada função Φ ∈ Dom(P ′ ) a relação
Ψ0 (0)
Φ(1) = αΦ(0) , com α= . (4.7.10)
Ψ0 (1)
213
Uma vez que a relação (4.7.10) é satisfeita, obviamente, para Φ = Ψ0 , devemos ter |α| = 1.
Isto implica que toda função Φ ∈ Dom(P ′ ) deve satisfazer a condição (mais fraca) de ser
quase-periódica:
|Φ(1)|2 − |Φ(0)|2 = 0 =⇒ Φ(1) = eiβ Φ(0) , para algum β ∈ [0, 2π) . (4.7.11)
Defina
Φ(x) = Ψ(x) − λΨ0 (x) ,
com λ sendo uma constante. Podemos selecionar a constante λ exigindo que
Ψ(0) − λΨ0 (0) = 0 .
Então, é fácil ver que, com esta definição e escolha de λ, Φ satisfaz a condição (4.7.6); portanto,
Φ ∈ Dom(P ). Por outro lado, como Dom(P ) ⊂ Dom(P ′ ), temos que Φ ∈ Dom(P ′ ), de
maneira que a função
Ψ(x) = Φ(x) + λΨ0 (x) ,
também pertence ao domínio Dom(P ′ ).
Vamos, agora, mostrar que P ′ = P ′∗ . Faremos isto aplicando o mesmo raciocínio usado
anteriormente, isto é, partimos considerando a relação
⟨Φ, P ′Ψ⟩ = ⟨Ω, Ψ⟩ , ∀ Ψ ∈ Dom(P ′ ) e ∀ Φ ∈ Dom(P ′∗ ) ,
ou seja, temos
$ 1 , - $ 1
# dΨ(x)
dx Φ(x) = dx Ω(x)Ψ(x) . (4.7.12)
0 i dx 0
Como para Φ ∈ Dom(P ′∗ ), temos que Ω = P ′∗ Φ ∈ L2 (0, 1) ⊂ L1 (0, 1), então,

$ x
Λ(x) = dy Ω(y) + C ,
0
é absolutamente contínua e satisfaz dΛ/dx = Ω em quase toda parte. Assim, a Eq.(4.7.12) pode
ser escrita da seguinte forma
$ 1 , - $ , ,$ x --
# dΨ(x) i 1 # d
dx Φ(x) =− dx dy Ω(y) + C Ψ(x) ,
0 i dx # 0 i dx 0
para toda função Ψ ∈ Dom(P ′ ). Integrando por partes o lado direito da equação acima,
obtemos
$ 1 , ,$ x -- , $ x - 51
# d # 5
5
dx dy Ω(y) + C Ψ(x) = dy Ω(y) + C Ψ(x)5
0 i dx 0 i 0 5
0
$ , $ x
1 -, -
# dΨ(x)
− dx dy Ω(y) + C
0 i 0 dx
51 $ 1 , -
# 5 # dΨ(x)
5
= − Λ(x)Ψ(x)5 + dx Λ(x) .
i 0 0 i dx
214
Disso segue que

$ , -, -
1
i # dΨ(x) 51
dx Φ(x) + Λ(x) = Λ(x)Ψ(x)50 , (4.7.13)
0 # i dx
para toda função Ψ ∈ Dom(P ′ ). Note que, para qualquer função Ψ ∈ Dom(P ′ ), o lado
direito da equação acima pode ser escrito como
. /
Λ(1)Ψ(1) − Λ(0)Ψ(0) = Λ(1)eiβ − Λ(0) Ψ(0) .
Então, o lado direito da Eq.(4.7.13) será nulo se
Λ(1) = e−iβ Λ(0) =⇒ Λ(1) = eiβ Λ(0) , para algum β ∈ [0, 2π) .
Por sua vez, isto implica que o lado esquerdo da Eq.(4.7.13) será nulo se
i i
Φ(x) + Λ(x) = 0 =⇒ Φ(x) − Λ(x) = 0 ,
# #
e
dΦ(x) dΛ(x)
−i# = = Ω(x) ,
dx dx
Uma vez que Ω = P ′∗ Φ, em que P ′∗ = −i#d/dx, mostramos que P ′∗ foi definido de
tal forma que toda função Φ ∈ Dom(P ′∗ ) deve satisfazer a condição que sua derivada
dΦ/dx ∈ L2 (0, 1), mais a condição de fronteira Φ(1) = eiβ Φ(0), para algum β ∈ [0, 2π). Ou
seja, toda função Φ ∈ Dom(P ′∗ ) deve também ser uma função quase-periódica. Dessa forma,
Dom(P ′ ) e Dom(P ′∗ ) coincidem; isto implica que P ′ é auto-adjunto sobre a classe de
funções quase-periódicas, para alguma fase eiβ . Note que a escolha da fase tem consequências
observáveis, uma vez que P ′ tem auto-valores Z + β/2π, que são os possíveis resultados das
medições do observável P ′ . Assim, cada fase eiβ corresponde a um tipo diferente de extensão
auto-adjunta de P e, portanto, temos uma infinidade delas, que denotamos por Pβ′ ao invés de
P ′ , com domínio (de funções absolutamente contínuas)
! "
Dom(Pβ′ ) = Φ ∈ AC[0, 1] ⊂ L2 (0, 1) | Φ(1) = eiβ Φ(0) . (4.7.14)
para algum β ∈ [0, 2π). Note que, quando β = 0, recuperamos as condições de contorno
periódicas (4.7.6).
Assim, vimos que as condições de contorno sobre as funções no domínio Dom(P ) são tão
∗
fortes que nenhuma condição
. de contorno sobre
/ as funções no domínio Dom(P ) é necessária
para assegurar que Φ(1)Ψ(1) − Φ(0)Ψ(0) = 0. Então, vimos que é possível estender
o conjunto das funções no domínio Dom(P ) para um domínio Dom(Pβ′ ) ⊃ Dom(P ),
.
permitindo condições de contorno mais gerais, de tal forma que a igualdade Φ(1)Ψ(1) −
/
Φ(0)Ψ(0) = 0 seja satisfeita com mesmas condições de contorno sobre as funções no domínio
Dom(Pβ′∗ ). Isto significa que a fase β em (4.7.14) deve ser a mesma para as funções no
domínio Dom(Pβ′ ) e no domínio Dom(Pβ′∗ ). Isto responde como a condição de contorno
(4.7.6) influencia na não auto-adjunção do operador P !
Note que, efetivamente, pela análise acima, nós temos um círculo completo de diferentes
extensões auto-adjuntas, Pβ′ , cada uma vindo precisamente da imposição de uma condição de
215
contorno quase-periódica da forma Φ(1) = eiβ Φ(0), escolhendo-se um β ∈ [0, 2π). Além
disso, de acordo com as Proposições 4.16 e 4.21, segue que
P ⊂ Pβ′ = Pβ′∗ ⊂ P ∗ , para algum β ∈ [0, 2π) .
Por sua vez, cada operador Pβ′ é estendido por P ∗ . As extensões do operador momentum P
no intervalo [0, 1] estão representadas na figura abaixo:
P∗
Pβ′
O operador Pβ′ discutido acima não é essencialmente auto-adjunto, porque, para cada valor
do parâmetro β utilizado para definir Dom(Pβ′ ∗ ) obtemos uma extensão auto-adjunta diferente.
Assim, P possui infinitas extensões que são auto-adjuntas, porém, de acordo com a Proposição
4.17, cada uma delas não possui nenhuma extensão própria que seja auto-adjunta. Isto significa
que os resultados físicos que obtemos para diferentes valores de β são diferentes. Em outras
palavras, diferentes extensões auto-adjuntas nos dão resultados físicos diferentes. Ao invés de
ser um problema, isso faz com que a estrutura da mecânica quântica seja muita mais rica em
possibilidades. A escolha de qual dessas extensões é a mais apropriada para o sistema sob
investigação não pertence ao domínio da matemática, mas ao domínio da física!
Exemplo 4.12 (Segundo Caso – O Semi-Eixo R+ ). Esta situação descreve uma partícula
confinada à semi-reta (0, ∞) por uma barreira de potencial infinitamente alta em x = 0.
Neste caso, vamos tomar o operador momentum P em L2 (R+ ) com o domínio Dom(P ) =
S (R+ ) ⊂ L2 (R+ ), em que S (R+ ) é o espaço de todas as funções que vão a zero, juntamente
com todas as suas derivadas, mais rápido do que qualquer potência inversa de |x|, quando
x → ∞, isto é,21 5 β 5
5 5
α 5 d Ψ(x) 5
sup |x| 5 <∞.
x∈R+ dx 5
O espaço S (R+ ) é denso em L2 (R+ ). Com esta escolha, segue que limx→∞ Ψ(x) = 0, para
toda função Ψ ∈ Dom(P ). Como uma segunda condição sobre Dom(P ), vamos assumir
que Ψ(0) = 0, para toda função Ψ ∈ Dom(P ). Portanto, se Φ, Ψ ∈ Dom(P ), então,
$ ∞ , -- $ ∞ ,
# dΨ(x)
# dΦ(x)
⟨Φ, P Ψ⟩ − ⟨P Φ, Ψ⟩ = dx Φ(x) − dx Ψ(x)
0 0 i dx
i dx
$ ( , - )
# ∞ dΨ(x) dΦ(x)
= dx Φ(x) + Ψ(x)
i 0 dx dx
$
# ∞
d . / #. /55∞
= dx Φ(x)Ψ(x) = Φ(x)Ψ(x) 5 = 0 .
i 0 dx i 0
21
Este espaço é também conhecido como espaço de Schwartz. Ele será rigorosamente definido no Capítulo 6.
216
Logo, P é um operador simétrico. No entanto, não é difícil mostrar que

P ̸= P ∗ =⇒ P não é auto-adjunto!
De fato, as funções Ψ ∈ Dom(P ) além da condição limx→∞ Ψ(x) = 0, elas devem também
satisfazer a condição de contorno Ψ(0) = 0, enquanto que as funções Φ ∈ Dom(P ∗ ) devem
satisfazer somente a condição limx→∞ Φ(x) = 0.
Em comparação com o caso do intervalo finito, o operador diferencial sobre o semi-eixo não
tem uma extensão simétrica própria. Para mostrar isso vamos usar o fato do espaço S (R+ )
ser fechado sob a operação de multiplicação: se Φ, Ψ ∈ S (R+ ), então, ΦΨ ∈ S (R+ ). Agora,
suponha que P ′ seja uma extensão simétrica de P . Logo, o conjunto Dom(P ′ ) deve conter
pelo menos uma função Φ que é diferente de zero quando x = 0. Mas isto implicaria que
$ ∞ , - $ ∞ , -
′ ′ # dΦ(x) # dΦ(x)
⟨Φ, P Φ⟩ − ⟨P Φ, Φ⟩ = dx Φ(x) − dx Φ(x)
0 i dx 0 i dx
$ ( , - )
# ∞ dΦ(x) dΦ(x)
= dx Φ(x) + Φ(x)
i 0 dx dx
$ ∞
# d . /
= dx Φ(x)Φ(x)
i 0 dx
#. /55∞
= Φ(x)Φ(x) 5 = |Φ(0)|2 ̸= 0 ,
i 0
já que se Φ ∈ S (R+ ), então, o produto Φ · dΦ/dx também pertence ao espaço S (R+ ).

Consequentemente, o operador diferencial sobre o semi-eixo é um operador maximalmente
simétrico (este conceito vai ficar claro na próxima seção) e não tem qualquer extensão auto-
adjunta. Portanto, o operador momentum na semi-reta (0, ∞) não deve aparecer em problemas
físicos na mecânica quântica. A razão para a não-auto-adjunção está baseada no fato de que a
propriedade Ψ(0) = 0 é muito restritiva (no entanto, essa propriedade é necessária para provar
a simetria de P na semi-reta). Tal condição de contorno é conveniente no máximo quando o
operador diferencial contém a derivada segunda, d2 Ψ/dx2 (veja o Exercício 4.18).
Exemplo 4.13 (Terceiro Caso – A Reta Real Inteira). Esta situação descreve uma partícula
livre em 1-dimensão. Neste caso, vamos tomar o operador momentum P em L2 (R) com o
domínio Dom(P ) = S (R) ⊂ L2 (R), em que S (R) é o espaço de todas as funções que vão
a zero, juntamente com todas as suas derivadas, mais rápido do que qualquer potência inversa
de |x|, quando x → ∞, sobre toda a reta real. Em outras palavras, toda função Ψ ∈ Dom(P )
satisfaz a condição
lim Ψ(x) = lim Ψ(x) = 0 .
x→∞ x→−∞
Assim, o conjunto Dom(P ) é definido por esta única exigência e não é difícil mostrar que P
é auto-adjunto.
4.8 Operadores Simétricos e suas Extensões

Vimos ao longo de toda discussão realizada na Seção 4.5 que um operador simétrico den-
samente definido é sempre fechável, com A∗ sendo uma extensão fechada de A. Logo, de
217
acordo com a Proposição 4.18, a menor extensão fechada A∗∗ de A deve estar contida em A∗ .
Consequentemente, para operadores simétricos, temos que A ⊂ A∗∗ ⊂ A∗ , para operadores si-
métricos fechados, A = A∗∗ ⊂ A∗ e para operadores auto-adjuntos, A = A∗∗ = A∗ . Por causa
disso, ao estudarmos o problema da extensão auto-adjunta de um operador simétrico podemos
nos concentrar, sem perder a generalidade, na análise das extensões de operadores simétricos
fechados, já que todo operador simétrico densamente definido tem um fecho, e o operador e seu
fecho têm as mesmas extensões. Nesta seção, estudamos o problema da existência de extensões
auto-adjunta de um operador simétrico.
4.8.1 Critérios Fundamentais para a Auto-Adjunção
A prova direta da auto-adjunção de um determinado operador linear é, geralmente, difícil.

Felizmente, existem alguns critérios muito gerais disponíveis que nos ajudam a caracterizar
operadores auto-adjuntos, como o seguinte
TEOREMA 4.25 (Critério fundamental para a auto-adjunção). Seja A um operador simétrico

em um espaço de Hilbert complexo H . Então as seguintes propriedades são equivalentes:
1. A é auto-adjunto;
2. A é fechado e Ran(A ± i1I)⊥ = Ker(A∗ ∓ i1I) = {0};
3. Ran(A ± i1I) = H .
Demonstração. De fato, este teorema é uma versão particular do Corolário 4.5. Vamos começar
mostrando que (1) =⇒ (2). Assuma que A é auto-adjunto. Uma vez que o operador A∗ é
sempre fechado e A = A∗ , então A é fechado. A seguir, tome um vetor x ∈ Dom(A∗ ) =
Dom(A), tal que A∗ x = ix. Então, x ∈ Ker(A∗ − i1I) e como A é auto-adjunto segue que
Ax = ix. Assim,
i⟨x, x⟩ = ⟨x, ix⟩ = ⟨x, Ax⟩ = ⟨Ax, x⟩ = ⟨A∗ x, x⟩ = ⟨ix, x⟩ = −i⟨x, x⟩ .
Logo x = 0. Da mesma forma, tome um vetor y ∈ Dom(A∗ ) = Dom(A), tal que

A∗ y = −iy; isto implica que y ∈ Ker(A∗ + i1I). Então, usando o mesmo raciocínio acima,
segue que y = 0. Portanto, Ker(A∗ ± i1I) = {0}.
(2) =⇒ (3). Primeiro, devemos observar que Dom(A ± i1I) = Dom(A). Agora, assuma
que A é fechado e que Ker(A∗ ∓ i1I) = {0}; então, pelo Teorema 4.18, Ker(A∗ ∓ i1I) =
Ran(A ± i1I)⊥ . Assim, Ran(A ± i1I) são densos em H , pela Proposição 3.14; ou seja
Ran(A ± i1I) = H . Agora, basta mostrar que os conjuntos Ran(A ± i1I) são fechados.
Para isto, considere as sequências (xn )n∈N e (yn )n∈N no Dom(A). Como A é fechado, as
sequências (xn )n∈N e (yn )n∈N devem convergir para um x e um y no Dom(A), enquanto que
as a sequências de imagens (Axn )n∈N e (Ayn )n∈N devem convergir para w1 = Ax e w2 = Ay
no Ran(A). Obviamente, ixn → ix e −ixn → −ix. Agora, assuma que (A + i1I)xn → z1 e
que (A − i1I)yn → z2 . Logo,
(A + i1I)xn = Axn + ixn → z1 = w1 + ix = (A + i1I)x ,
218
e
(A − i1I)yn = Ayn − ixn → z2 = w2 − iy = (A − i1I)y .
Isto prova que z1 ∈ Ran(A + i1I) e z2 ∈ Ran(A − i1I) e que os conjuntos Ran(A + i1I)
e Ran(A − i1I) são fechados; ou seja, Ran(A ± i1I) = Ran(A ± i1I) = H .
(3) =⇒ (1). Isto é apenas uma reafirmação do Corolário 4.5 de que A é auto-adjunto se
Ran(A + i1I) = Ran(A − i1I) = H .
COROLÁRIO 4.6. Sejam H um espaço de Hilbert complexo, A : Dom(A) → H um operador

simétrico e V = (A − i1I)(A + i1I)−1 a transformada de Cayley de A. Então as seguintes
propriedades são equivalentes:
1. A é auto-adjunto;
2. V é unitária;
3. Dom(V ) = H = Ran(V );
4. Dom(V ⊥ ) = {0} = Ran(V ⊥ ).
TEOREMA 4.26 (Critério fundamental para a auto-adjunção essencial). Seja A um ope-

rador simétrico em um espaço de Hilbert complexo H . Então as seguintes propriedades são
equivalentes:
1. A é essencialmente auto-adjunto;
2. Ker(A∗ ± i1I) = {0};
3. Ran(A ± i1I) são densos em H .
Demonstração. (1) =⇒ (2). Assuma que A é essencialmente auto-adjunto, de modo que seu
N é auto-adjunto. Então, pela Proposição 4.18, segue que A∗ = (A)
fecho A N∗=A
N e assim
N + i1I) = {0} ,
Ran(A − i1I)⊥ = Ker(A∗ + i1I) = Ker(A
uma vez que, pelo Teorema 5.4, o espectro de A está contido no conjunto R. A mesma análise
se aplica ao conjunto Ran(A + i1I).
(2) =⇒ (3). Assuma que Ker(A∗ ∓ i1I) = {0}. Então, pelo Teorema 4.18, Ker(A∗ ∓ i1I) =
Ran(A ± i1I)⊥ . Logo, Ran(A ± i1I) são densos em H , pela Proposição 3.14.
(3) =⇒ (1). Assuma que Ran(A + i1I) é denso em H ; logo, Ran(A + i1I) = H .
Então, pela definição de conjunto denso, para todo y = (A + i1I)x ∈ H , com x ∈ Dom(A),
existe uma sequência yn = (A + 1I)xn em Ran(A + i1I), para alguma sequência (xn )n∈N no
Dom(A), que converge para y. Isto implica que
Axn = yn − ixn → y − ix .
219
Pela definição de um operador fechado, como x ∈ Dom(A) e Ax = y + ix, então A é

fechado. Assim, Ran(A + i1I) = Ran(A N + i1I) = Ran(A + i1I) = H . Portanto, pelo
N é auto-adjunto; ou seja, A é essencialmente auto-adjunto. A mesma análise se
Corolário 4.5, A
aplica ao conjunto Ran(A − i1I).
TEOREMA 4.27. Seja A : Dom(A) ⊂ H → H um operador simétrico. Assuma que os
auto-vetores de A em Dom(A) formam um sistema ortonormal completo em H . Então, A é
essencialmente auto-adjunto.
Demonstração. De acordo com o Teorema 4.26 temos que mostrar que os conjuntos Ran(A ±
i1I) são densos em H . Sejam x1 , x2 , . . . os auto-vetores de A em Dom(A), com xj associado
ao auto-valor λj ; portanto, Axj = λj xj . Uma vez que A é assumido ser simétrico, então, todo
λj é real (veja a Proposição 5.3). De acordo com a Definição 3.11a, na página 115, um sistema
ortonormal {xj }j∈I em H é completo se todo x ∈ H tem uma única representação
<
x= αj xj ,
j∈I
em que C ∋ αj = ⟨xj , x⟩. Assuma que I = N.22 Defina uma sequência (yn )n∈N ⊂ Dom(A)
tal que
<n
αj
yn = xj .
λ +1
j=1 j
Fazendo zn = (A + i1I)yn , encontramos que

n
< < n
αj
zn = (A + i1I)xj = αj xj .
j=1
λj + 1 j=1
Para um x ∈ H arbitrário temos que

? ∞ ?2
?< ? ∞
<
? ?
∥x − zn ∥2 = ∥x − (A + i1I)yn ∥2 = ? αj xj ? = |αj |2 .
? ?
j=n+1 j=n+1
;
Pelo Teorema 3.9, ∞ 2
j=n+1 |αj | é convergente para um sistema ortonormal completo. Portanto,
para todo ε > 0, segue que
∥x − zn ∥ < ε ∀ n > N(ε) ,
o que implica que Ran(A + i1I) é denso em H . Da mesma forma, mostra-se que o conjunto
Ran(A − i1I) é denso em H .
4.8.2 Espaços e Índices de Deficiência de um Operador Simétrico
Os Teoremas 4.25 e 4.26 estabeleceram os critérios básicos que devem ser satisfeitos por um
operador para que ele seja auto-adjunto. Mas isto não nos dá informações suficientes para
responder a seguinte questão fundamental: quando um operador simétrico tem uma extensão
22
Naturalmente, o teorema permanecerá verdadeiro para um sistema ortonormal finito!
220
auto-adjunta? Para tratar com esta questão recorremos aos conceitos, introduzidos por von
Neumann, de espaços de deficiência e índices de deficiência de um operador simétrico. A
ideia é a seguinte, pelos Teoremas 4.25 e 4.26, um operador simétrico A é auto-adjunto se
Ran(A ± i1I) = H ou essencialmente auto-adjunto se os subespaços Ran(A ± i1I) são
densos em H , respectivamente. Sendo assim, isto nos dá uma indicação que os complementos
ortogonais Ran(A ± i1I)⊥ dos espaços Ran(A ± i1I) podem, de certa forma, indicar em que
medida um operador simétrico A não pode ser auto-adjunto. Com base nisso, iniciamos com a
seguinte
DEFINIÇÃO 4.28. Seja A um operador simétrico sobre um espaço de Hilbert H . Defina
Kλ = Ran(A − λ1I)⊥ e Kλ = Ran(A − λ1I)⊥ ,
em que λ é um número não-real arbitrário. Diz-se que Kλ e Kλ são os espaços de deficiência

do operador A e suas dimensões os índices de deficiência, isto é, (m, n) = (dim Kλ , dim Kλ ),
com Im λ > 0.
Deve-se enfatizar que é possível que os índices de deficiência sejam qualquer par de número
de inteiros não-negativos e, além disso, é possível que m ou n (ou ambos) sejam iguais a
infinito.
De acordo com a Definição 4.28, segue que
Kλ = H ⊖ Ran(A − λ1I) e Kλ = H ⊖ Ran(A − λ1I) .
Além disso, temos que Kλ = Ker(A∗ − λ1I) e Kλ = Ker(A∗ − λ1I), respectivamente, pelo
Teorema 4.18. Isto nos leva à seguinte
PROPOSIÇÃO 4.25. Os espaços de deficiência Kλ e Kλ são os espaços das soluções linearmente
independentes do operador A∗ associados aos auto-valores λ e λ, respectivamente.
Demonstração. Se y ∈ Kλ , então para todo x ∈ Dom(A), segue que
⟨y, (A − λ1I)x⟩ = 0 ,
isto implica que
⟨y, Ax⟩ = ⟨y, λx⟩ = λ⟨y, x⟩ = ⟨λy, x⟩ .
Logo, pela definição do operador adjunto, A∗ y = λy, isto é, y é um auto-vetor de A∗ com

auto-valor λ. Reciprocamente, assuma que A∗ y = λy, então para um x qualquer no Dom(A),
segue, novamente pela definição do operador adjunto, que
⟨y, Ax⟩ = ⟨A∗ y, x⟩ = ⟨λy, x⟩ = λ⟨y, x⟩ = ⟨y, λx⟩ .
Isto implica que ⟨y, (A−λ1I)x⟩ = 0, isto é, y ∈ Kλ . A análise para o espaço Kλ é análoga.
TEOREMA 4.28 (Primeira fórmula de von Neumann). Seja A um operador simétrico fechado,
então os subespaços Dom(A), Kλ e Kλ são linearmente independentes e
Dom(A∗ ) = Dom(A) ⊕ Kλ ⊕ Kλ . (4.8.1)
221
Ou seja, w ∈ Dom(A∗ ) se w = x + y + z, com x ∈ Dom(A), y ∈ Kλ e z ∈ Kλ . Além disso,

A∗ w = Ax + λy + λz .
Demonstração. Primeiro, lembremos que os subespaços Dom(A), Kλ e Kλ são linearmente

independentes se mostrarmos que a equação x+y +z = 0, com x ∈ Dom(A), y ∈ Kλ e z ∈
Kλ , tem solução somente se x = y = z = 0. Como, por definição, Dom(A) ⊂ Dom(A∗ ),
Kλ = Ker(A∗ −λ1I) e Kλ = Ker(A∗ −λ1I), respectivamente, então se aplicarmos o operador
(A∗ − λ1I) a ambos lados da equação x + y + z = 0, para x ∈ Dom(A), y ∈ Kλ e z ∈ Kλ ,
obtemos que
0 = (A∗ − λ1I)(x + y + z)
= (A∗ − λ1I)x + (A∗ − λ1I)y + (A∗ − λ1I)z .

Pela Proposição 4.25, A∗ y = λy e A∗ z = λz. Portanto, segue que
0 = (A∗ − λ1I)x + (λ − λ1I)y + (λ − λ1I)z
= (A∗ − λ1I)x + (λ − λ1I)y . (4.8.2)
Mas, (A∗ −λ1I)x = (A−λ1I)x ∈ Ran(A−λ1I) e (λ−λ)y ∈ Kλ = Ran(A−λ1I)⊥ . Uma

vez que esses subespaços são ortogonais, a Eq.(4.8.2) é satisfeita somente se (A∗ − λ1I)x = 0
e (λ − λ)y = 0, isto é, somente se x = 0 e y = 0. Note que aqui, temos x = 0 porque
λ ∈ C \ R não pode ser um auto-valor de um operador simétrico (veja a Proposição 5.3).
Portanto, a equação x + y + z = 0, para x ∈ Dom(A), y ∈ Kλ e z ∈ Kλ , é satisfeita se
z = 0 também. Isto prova a independência linear dos subespaços Dom(A), Kλ e Kλ .
Resta provar a Eq.(4.8.1). Uma vez que Dom(A) ⊂ Dom(A∗ ) e as inclusões Ker(A∗ −
λ1I) ⊂ Dom(A∗ ) e Ker(A∗ − λ1I)) ⊂ Dom(A∗ ) são óbvias, segue que
Dom(A) ⊕ Kλ ⊕ Kλ ⊂ Dom(A∗ ) .
Temos, agora, de provar a inclusão inversa. Para isto, usando o mesmo raciocínio usado no
Teorema 4.25 para provar que os conjuntos Ran(A + i1I) e Ran(A − i1I) são fechados,
mostra-se que os conjuntos Ran(A − λ1I) e Ran(A − λ1I) são fechados. Por outro lado,
como Ran(A − λ1I)⊥ = Ker(A∗ − λ1I) e Ran(A − λ1I)⊥ = Ker(A∗ − λ1I), então,
por exemplo, qualquer vetor v ∈ H pode ser escrito como a soma v = v1 + v2 , em que
v1 ∈ Ran(A − λ1I) e v2 ∈ Ran(A − λ1I)⊥ , já que
H = Ran(A − λ1I) ⊕ Ran(A − λ1I)⊥ .
Então, assuma que, v = (A∗ −λ1I)w, para w ∈ Dom(A∗ ). Uma vez que v1 ∈ Ran(A−λ1I),
segue que v1 = (A − λ1I)x, para x ∈ Dom(A). Também assuma que v2 = (λ − λ)y, para
y ∈ Ran(A − λ1I)⊥ = Ker(A∗ − λ1I) = Kλ . Portanto, segue que
(A∗ − λ1I)w = (A − λ1I)x + (λ − λ)y
= (A − λ1I)x + (A∗ − λ1I)y
= (A∗ − λ1I)x + (A∗ − λ1I)y .
222
Isto implica que,
(A∗ − λ1I)(w − x − y) = 0 ,
ou seja, o vetor (w − x − y) ∈ Ker(A∗ − λ1I) = Kλ . Defina esse vetor com sendo z; logo,
w = x + y + z. Isto prova a inclusão inversa e que todo vetor w ∈ Dom(A∗ ) pode ser escrito
como uma combinação única do tipo w = x + y + z, com x ∈ Dom(A), y ∈ Kλ e z ∈ Kλ .
Aém disso, é imediato ver que
A∗ w = A∗ (x + y + z) = Ax + λy + λz .
Isto completa a prova do teorema.
Note que, pelo Teorema 4.28, se assumirmos que A = A∗ , então se x ∈ Ker(A∗ − λ1I), com
Im λ ̸= 0, segue que A∗ x = λx e isto implica que ⟨A∗ x, x⟩ = ⟨Ax, x⟩ = ⟨x, Ax⟩ = λ∥x∥2 .
Como, pela Proposição 5.3, ⟨x, Ax⟩ é real, nesse caso ∥x∥ = 0; ou seja, Ker(A∗ − λ1I) = {0}.
Portanto, m = dim Kλ = 0. Raciocínio análogo mostra que Ker(A∗ − λ1I) = {0} e isto
implica que n = dim Kλ = 0. Assim, os índices de deficiência de A são (0, 0).
Por outro lado, assuma que A é simétrico fechado e que seus índices de deficiência sejam
(0, 0). Uma vez que m = dim Kλ = 0 e n = dim Kλ = 0, então Ran(A − λ1I) =
Ran(A − λ1I) = H . Assim, para todo x1 , x2 ∈ Dom(A∗ ) podemos encontrar vetores
y1 , y2 ∈ Dom(A) tais que
(A − λ1I)y1 = (A∗ − λ1I)x1 e (A − λ1I)y2 = (A∗ − λ1I)x2 .
Contudo, A ⊂ A∗ e (y1 − x1 ), (y2 − x2 ) ∈ Dom(A∗ ). Logo,
(A∗ − λ1I)(y1 − x1 ) = (A∗ − λ1I)y1 − (A∗ − λ1I)x1
= (A − λ1I)y1 − (A∗ − λ1I)x1 = 0 ,
(A∗ − λ1I)(y2 − x2 ) = (A∗ − λ1I)y2 − (A∗ − λ1I)x2
= (A − λ1I)y2 − (A∗ − λ1I)x2 = 0 .
Nesse caso, (y1 − x1 ) ∈ Ker(A∗ − λ1I) = {0} e (y2 − x2 ) ∈ Ker(A∗ − λ1I) = {0}, já que
m = dim Kλ = 0 e n = dim Kλ = 0. Consequentemente, y1 = x1 ∈ Dom(A) e y2 =
x2 ∈ Dom(A). Isto prova que Dom(A∗ ) ⊂ Dom(A); assim, Dom(A∗ ) = Dom(A) e
A = A∗ .
4.8.3 Correspondência entre as Extensões de Operadores Simétricos e as

Extensões da Transformada de Cayley
Neste ponto, queremos responder as seguintes questões fundamentais: (i) quando opera-
dores simétricos têm extensões auto-adjuntas e (ii) como essas extensões, quando existirem,
podem ser caracterizadas? Estas questões podem ser respondidas observando-se que o estudo
223
de operadores simétricos pode ser reduzido ao estudo das isometrias. Em outras palavras,
vamos mostrar que a questão sobre as extensões simétricas de operadores simétricos fechados
pode ser reduzida à questão sobre as extensões isométricas de suas transformadas de Caley, o
que define uma correspondência entre as respectivas extensões. Isto vai nos permitir caracteri-
zar completamente todas as extensões simétricas fechadas de um operador simétrico fechado.
Começamos com o seguinte
TEOREMA 4.29. Sejam A e A′ operadores simétricos fechados e V e V ′ suas respectivas trans-

formadas de Cayley. Então, o operador A′ é uma extensão do operador A se, e somente se, o
operador V ′ é uma extensão do operador V .
Demonstração. Seja A′ uma extensão simétrica fechada do operador A. Então, Ran(A −

λ1I) ⊂ Ran(A′ − λ1I) e Ran(A − λ1I) ⊂ Ran(A′ − λ1I). Pela definição da transformada
de Cayley o inverso do operador (A − λ1I) existe e, por isso, para cada y ∈ Ran(A − λ1I)
existe um único x ∈ Dom(A) tal que y = (A − λ1I)x e V y = (A − λ1I)x. Dado que
Dom(A) ⊂ Dom(A′ ), isto é, A ⊂ A′ , segue que y = (A′ − λ1I)x e V ′ y = (A′ − λ1I)x.
Portanto, Dom(V ) ⊂ Dom(V ′ ), isto é, V ⊂ V ′ .
Reciprocamente, assuma que V ⊂ V ′ . Então, para todo x ∈ Dom(A), segue, do Teorema

4.22, que x = V y − y para um único y ∈ Ran(A − λ1I). Mas, como V ⊂ V ′ , segue que
Ran(A − λ1I) ⊂ Ran(A′ − λ1I) e Ran(A − λ1I) ⊂ Ran(A′ − λ1I). Finalmente, também
pelo Teorema 4.22, segue que Ax = λV y − λy = λV ′ y − λy = A′ x. Logo, A ⊂ A′ .
O próximo passo consiste em compreender a correspondência entre as extensões de ope-

radores simétricos e as extensões da transformada de Cayley. Para isto, tome dois operadores
simétricos A e A′ satisfazendo as condições do Teorema 4.29. Então, se V e V ′ são as
transformadas de Cayley de A e A′ , segue que V ⊂ V ′ . Portanto, Dom(V ) ⊂ Dom(V ′ )
e Ran(V ) ⊂ Ran(V ′ ). A seguir, considere os conjuntos M e N definidos da seguinte
forma:
Dom(V ′ ) = Dom(V ) ⊕ M e Ran(V ′ ) = Ran(V ) ⊕ N ,
respectivamente, e assuma que existe um operador VN tal que
VNz = V ′ z , ∀z ∈ M .
Observe que M ⊥ Dom(V ) e N ⊥ Ran(V ). Além disso, como Dom(V ) = Ran(A −

λ1I) e Ran(V ) = Ran(A − λ1I), segue que M ⊂ Kλ e N ⊂ Kλ . Podemos resumir a
situação acima através do seguinte diagrama:
224
Dom(A′ )
+
A′ − λ Dom(A) A′ − λ
A−λ A−λ
Dom(V ) Ran(V )
V
+
+
Dom(V ′ ) Ran(V ′ )
′
V
V
Dom(V ′ ) = Dom(V ) ⊕ M Ran(V ′ ) = Ran(V ) ⊕ N
VN
Com as definições dos conjuntos M e N e do operador VN, podemos agora caracterizar,

completamente, todas as extensões simétricas fechadas de um operador simétrico fechado.
TEOREMA 4.30 (Segunda fórmula de von Neumann). Sejam M e N como definidos acima.
Então, toda extensão simétrica fechada A′ de um dado operador simétrico fechado A é determi-
nada por um certo operador isométrico VN cujo domínio de definição é M ⊂ Kλ e cujo conjunto
imagem é N ⊂ Kλ . O conjunto Dom(A′ ) consiste de todos os vetores
x′ = x + VNz+ − z+ ,
com x ∈ Dom(A) e z+ ∈ M . Além disso, a seguinte relação acontece:
A′ x′ = Ax + λVNz+ − λz+ .
Em particular, isso implica que os espaços de deficiência do operador A′ são
Kλ′ = Kλ − M e Kλ′ = Kλ − N ,
respectivamente.
Demonstração. Seja V ′ uma extensão da transformada de Cayley, V , do operador simétrico

fechado A. Defina o operador VN da seguinte forma:
VNz = V ′ z , ∀z ∈ M .
Visto que V ′ é um mapeamento isométrico sobrejetivo de Dom(V ′ ) em Ran(V ′ ), ele é,

pela definição de VN, também um mapeamento isométrico sobrejetivo de M em N . Então, VN
é um operador isométrico com domínio de definição M e conjunto imagem N . Em particular,
isto implica que
V ′ : Dom(V ) ⊕ M → Ran(V ) ⊕ N ,
é uma extensão isométrica de V se, e somente se, dim M = dim N (uma vez que VN não é
um operador de projeção).
225
Agora, tome qualquer z ∈ Dom(V ) ⊕ M , isto é, assuma que z = z0 + z+ , com z0 ∈

Dom(V ) e z+ ∈ M . Então, segue que
V ′ z = V ′ (z0 + z+ ) = V z0 + VNz+ .
De acordo com o Teorema 4.29, o conjunto Dom(A′ ) consiste de todos os vetores da forma
x′ = V ′ z − z = V ′ (z0 + z+ ) − (z0 + z+ )
= V z0 + VNz+ − (z0 + z+ )
= V z0 − z0 + VNz+ − z+ .
Mas, pelo Teorema 4.21, o conjunto Ran(V − 1I) formado por todos os vetores x = V z0 − z0 ,
com z0 ∈ Dom(V ), coincide com o conjunto Dom(A). Portanto, o conjunto Dom(A′ )
consiste de todos os vetores
x′ = x + VNz+ − z+ , com x ∈ Dom(A) , z+ ∈ M .
Além disso, uma vez que
Dom(A′ ) ⊂ Dom(A∗ ) , VNz+ ∈ Kλ , z+ ∈ Kλ ,
segue que
A′ x′ = Ax + λVNz+ − λz+ .
Finalmente, como toda extensão simétrica de um operador simétrico A é uma restrição do

operador A∗ , segue que
Dom(A∗ ) = Dom(A) ⊕ Kλ ⊕ Kλ e Dom(A∗ ) = Dom(A′ ) ⊕ Kλ′ ⊕ Kλ′ ,
e como Dom(A) ⊂ Dom(A′ ), a igualdade entre os conjuntos acima implica que devemos
ter
Kλ′ ⊕ Kλ′ ⊂ Kλ ⊕ Kλ .
Em particular, isso implica que os espaços de deficiência do operador A′ são
Kλ′ = Kλ − M e Kλ′ = Kλ − N ,
respectivamente. Isto prova o teorema.

Nota 4.29. Pela análise acima, deve estar claro para o leitor que as dimensões
(m, n) = (dim Kλ , dim Kλ ) ,
dos espaços de deficiência Kλ e Kλ de um operador simétrico A não são necessariamente

iguais, enquanto que pela definição do operador isométrico VN as dimensões dos conjuntos
M e N são iguais. Vamos definir, então, dim M = dim N = q. Com isto, as dimensões
(m′ , n′ ) = (dim Kλ′ , dim Kλ′ ) dos espaços de deficiência de toda extensão simétrica fechada
A′ de um operador simétrico fechado A são
m′ = m − q e n′ = n − q ,
226
respectivamente. Portanto, procedendo-se recursivamente da mesma maneira como no Teorema

4.30 até que se obtenha índices de deficiência (r, 0) ou (0, r), nenhuma extensão simétrica
a mais será possível. Neste caso, a extensão simétrica fechada é chamada de maximalmente
simétrica, já que ela própria não possui extensões simétricas. Na mecânica quântica, o caso
mais importante é quando A′ é uma extensão auto-adjunta de A. Todo operador auto-adjunto
A é um operador simétrico maximal,23 já que A∗ = A e isso implica que A′ = A; ou seja,
toda extensão simétrica A′ de A coincide com A. Então, pelo Teorema 4.28, segue que uma
extensão simétrica A′ é um operador auto-adjunto se, e somente se, Kλ′ = {0} e Kλ′ = {0},
isto é,
M = Kλ e N = Kλ .
Neste caso, para o operador isométrico VN existir é necessário e suficiente que os subespaços
Kλ e Kλ tenham as mesmas dimensões. Com efeito, se V ′ é uma extensão de V , A′ uma
extensão de A e se A′ é auto-adjunto, então m − q = n − q = 0; logo m = n = q. Todas estas
observações resultam no seguinte
TEOREMA 4.31. Uma extensão simétrica A′ é auto-adjunta se, e somente se, o domínio de
definição do operador VN coincide com Kλ e seu conjunto imagem com Kλ . Um operador A
tem uma extensão auto-adjunta – possivelmente mais de uma – se, e somente se, seus espaços
de deficiência Kλ e Kλ têm a mesma dimensão, isto é, se seus índices de deficiência são iguais e
finito (m = n < ∞). Um operador simétrico fechado A é maximal se, e somente se, no mínimo
um dos seus espaços de deficiência é igual a {0}, isto é, se seus índices de deficiência são (r, 0)
ou (0, r).
Com base nos conceitos de espaços de deficiência e índices de deficiência, o Teorema 4.25
pode ser refraseado da seguinte forma:
TEOREMA 4.32 (Versão II do critério fundamental para a auto-adjunção). Um operador
simétrico fechado, A, é auto-adjunto se, e somente se, seus dois espaços de deficiência são cons-
tituídos apenas pelo vetor nulo do espaço H , ou seja, se seus índices de deficiência são (0, 0).
COROLÁRIO 4.7. Um operador simétrico, A, é essencialmente auto-adjunto se, e somente se, seus
dois espaços de deficiência são constituídos apenas pelo vetor nulo do espaço H , ou seja, se seus
índices de deficiência são (0, 0).
Demonstração. Pelo Teorema 4.31, se m ̸= n ou se m = n " 1, então, a primeira possibili-

dade implica que A não possui extensões auto-adjuntas, enquanto que a segunda possibilidade
implica a existência de extensões auto-adjuntas de A (que pode ser infinitas, como já vimos).
Assim, se m = n = 0 o operador simétrico A é auto-adjunto e, portanto, ele é essencialmente
auto-adjunto. Reciprocamente, se A é um operador essencialmente auto-adjunto, pela Proposi-
N é a sua única extensão auto-adjunta. Portanto, seus índices de deficiência
ção 4.21, seu fecho A
são (0, 0).
O próximo resultado nos fornece um critério útil e simples para um operador simétrico ter
extensões auto-adjuntas.
23
Em certos textos anteriores à 1960, o que chamamos de auto-adjunto era chamado simétrico hipermaximal,
um termo que foi cunhado por J. von Neumann.
227
TEOREMA 4.33 (Critério de von Neumann). Sejam A um operador simétrico e C : Dom(A) →

Dom(A) um operador anti-unitário, tal que C 2 = 1I. Assuma que os operadores A e C comu-
tam. Então, A tem índices de deficiência iguais e, portanto, tem extensões auto-adjuntas.
Demonstração. Por hipótese, temos que C[Dom(A)] ⊂ Dom(A), uma vez que C : Dom(A) →
Dom(A). Além disso, já que C 2 = 1I, segue que
8 9
Dom(A) = C 2 [Dom(A)] = C C[Dom(A)] ⊂ C[Dom(A)] .
Portanto, C[Dom(A)] = Dom(A) (o conjunto imagem de C restrito a Dom(A) é todo

Dom(A), ou seja, C é sobrejetivo).
A seguir, tome um vetor y ∈ Kλ = Ran(A − λ1I)⊥ (em que λ é um número não-

real arbitrário) e um vetor x ∈ Dom(A). Então, ⟨y, (A − λ1I)x⟩ = 0,24 pois y está no
complemento ortogonal de Ran(A − λ1I), já que (A − λ1I)x ∈ Ran(A − λ1I). Por outro
lado, como C é anti-unitário e comuta com A, então
0 = ⟨y, (A − λ1I)x⟩ = ⟨Cy, C(A − λ1I)x⟩ = ⟨Cy, (A − λ1I)Cx⟩ .
Logo, Cy ∈ Kλ = Ran(A − λ1I)⊥ (o outro subespaço de deficiência). Consequentemente,

C : Kλ → Kλ . Um raciocínio análogo mostra que C : Kλ → Kλ . Como C também preserva
as normas, segue que dim Kλ = dim Kλ , ou seja, os índices de deficiência são iguais. Logo,
pelo Teorema 4.31, A tem extensões auto-adjuntas.
O formalismo até agora descrito tem-se revelado bastante abstrato. Vamos, então, ilustrar, em
exemplos, como funciona na prática essa teoria revisitando os casos já estudados, na Seção 4.7,
sobre os operadores posição e momentum na mecânica quântica. Comecemos com o Exemplo
4.10. Lá o operador posição Xj foi definido pela Eq.(4.7.3) com domínio de definição
3 4
Dom(Xj ) = Ψ ∈ L2 (Rn ) | xj Ψ(x1 , . . . , xn ) ∈ L2 (Rn ) .
Para tornar as coisas compatíveis com os Teoremas 4.25 e 4.26, vamos tomar λ = i. Assim,
de acordo com a Proposição 4.25, os espaços de deficiência Ki e K−i são os espaços das
soluções linearmente independentes do operador Xj∗ que pertencem aos auto-valores −i e i,
respectivamente. Logo, as equações
Xj∗ Ψ(x1 , . . . , xn ) = −i Ψ(x1 , . . . , xn ) , Xj∗ Ψ(x1 , . . . , xn ) = i Ψ(x1 , . . . , xn ) ,
têm as formas
(xj + i)Ψ(x1 , . . . , xn ) = 0 , (xj − i)Ψ(x1 , . . . , xn ) = 0 .
Suas soluções são Ψ ≡ 0. Consequentemente, Ki = {0} e K−i = {0}, isto é, seus índices de
deficiência são (0, 0). Logo, Xj é auto-adjunto.
Passemos para o operador momentum. Vamos mostrar como a maquinaria desta seção nos
leva aos mesmos resultados encontrados nos Exemplos 4.11, 4.12 e 4.13. Considere o espaço
24
Tomamos o conjugado complexo do produto interno apenas por conveniência técnica!
228
Hilbert L2 (a, b). No subespaço das funções absolutamente contínuas, defina o operador P ,
como antes, por
dΨ(x)
P Ψ(x) = −i# .
dx
A integração por partes mostrou que P é simétrico. No caso do Exemplo 4.11, em que 0 #
x # 1, impusemos a condição de contorno de Dirichlet, Ψ(0) = Ψ(1) = 0. Além disso,
mostramos que o adjunto P ∗ , com P ∗ = −i#d/dx, tem como domínio o conjunto das funções
absolutamente contínuas Ψ que satisfazem a condição −i#dΨ/dx ∈ L2 (0, 1), sem precisar
satisfazer a condição de fronteira Ψ(0) = Ψ(1) = 0. Vimos que P é também fechado.
A seguir, veremos que toda extensão P ′ de P representa uma modificação das condições de
contorno, ampliando o conjunto Dom(P ) e reduzindo o conjunto Dom(P ∗ ), até que os dois
domínios coincidam. Considere as equações
. ∗ / . /
P − i1I Ψ(x) = 0 , P ∗ + i1I Ψ(x) = 0 ,
ou seja,
dΨ(x) dΨ(x)
−i# = iΨ(x) , −i# = −iΨ(x) ,
dx dx
que têm como soluções
−1 x −1 x
Ψ1 (x) = C e−# ∈ K−i , Ψ2 (x) = C e# ∈ Ki ,
em que C é uma constante de normalização. É fácil ver que as funções Ψ1 e Ψ2 pertencem

a L2 (0, 1). Isto mostra que Ki e K−i são subespaços unidimensionais; portanto, seus índices
de deficiência são (1, 1). Pela definição do operador VN : K−i → Ki , segue que VNΨ1 (x) deve
ser um múltiplo de Ψ2 (x), isto é, VNΨ1 (x) = κΨ2 (x) e como VN é isométrico, devemos ter
∥Ψ1 ∥ = ∥κΨ2 ∥. Vamos calcular estas normas (em L2 (0, 1)).
$ 1
2 −1 #6 −1
7 # −1
6 −1 7
∥κΨ1 ∥ = |C| dx e−2# x = |C|2 1 − e−2# = |C|2 e−2# e2# − 1 ,
0 2 2
enquanto
$
2 2
1
−1 x # 6 2#−1 7
∥Ψ2 ∥ = |κ| |C| dx e2# = |κ|2 |C|2 e −1 .
0 2
−1 −1
Isto implica que κ = e−# . Portanto, se definirmos κ = βe−# com |β| = 1, existirá uma
extensão Pβ′ de P para cada valor β, com domínio
3 6 −1 −1
7 4
Dom(Pβ′ ) = Φ(x) = Ψ(x) + α βC e# (x−1) − C e−# x | Ψ ∈ Dom(P ), β ∈ C ,
em que α é uma constante arbitrária.
Para todas as funções Φ, Ψ ∈ Dom(Pβ′ ), uma integração por partes nos fornece a seguinte
relação:
#. /
⟨Φ, Pβ′ Ψ⟩ − ⟨Pβ′ Φ, Ψ⟩ = Φ(1)Ψ(1) − Φ(0)Ψ(0) . (4.8.3)
i
229
Mas, como toda extensão Pβ′ é um operador simétrico, o lado direito da equação acima deve
satisfazer a relação
. /
Φ(1)Ψ(1) − Φ(0)Ψ(0) = 0 . (4.8.4)
Entretanto, as funções Φ, Ψ ∈ Dom(Pβ′ ) não necessariamente satisfazem a condição de

contorno de Dirichlet, Ψ(0) = Ψ(1) = 0. Defina
−1 (x−1) −1 x
Ψβ (x) = βC e# − C e−# ∈ Dom(Pβ′ ) ,
Logo, tomando Ψ = Ψβ em (4.8.4), obtemos para cada função Φ ∈ Dom(Pβ′ ) a relação

−1
Ψβ (0) βe−# − 1
Φ(1) = γ(β)Φ(0) , com γ(β) = = . (4.8.5)
Ψβ (1) β − e−#−1
Uma vez que a relação (4.8.5) é satisfeita, naturalmente, para Φ = Ψβ , devemos ter |γ(β)| = 1.
Isto implica que γ(β) = eiξ(β) , com ξ(β) ∈ [0, 2π) (os valores de ξ podem ser determinados
pelos valores de β). Assim, toda função Φ ∈ Dom(Pβ′ ) deve satisfazer a condição (mais fraca)
|Φ(1)|2 − |Φ(0)|2 = 0 =⇒ Φ(1) = eiξ(β) Φ(0) , com ξ(β) ∈ [0, 2π) .
Portanto, se Φ é absolutamente contínua e Φ(1) = γ(β)Φ(0), com |γ(β)| = 1, então Φ ∈

Dom(Pβ′ ). Ainda,
Pβ′ Φ(x) = P Ψ(x) − i#VNΨ1 (x) − i#Ψ1 (x)
dΨ(x) 6 −1 −1
7
= −i# − i#α βC e# (x−1) − C e−# x ,
dx
de forma que
dΦ(x) d
Pβ′ Φ(x) = −i# =⇒ Pβ′ = −i# .
dx dx
Ou seja, as extensões Pβ′ têm a mesma ação do operador P , mas com domínio dado por
# %
dΦ(x)
Dom(Pβ′ ) = Φ ∈ AC[0, 1] ⊂ L2 (0, 1) | Φ(1) = e iξ(β)
Φ(0) , ∈ L2 (0, 1) ,
dx
para algum ξ(β) ∈ [0, 2π).
Finalmente, considere a equação

. /
Pβ′∗ − 1Ii Φ(x) = 0 ,
ou seja,
dΦ(x)
−i#− iΦ(x) = 0
dx
6 −1 −1
7 6 −1 −1
7
−i#α βC e# (x−1) − C e−# x − iα βC e# (x−1) − C e−# x = 0 ,
230
que tem solução somente se C = 0. O mesmo raciocínio mostra que a equação

. ′∗ /
Pβ + i1I Φ(x) = 0 ,
também tem a mesma solução. Consequentemente, K ′ i = {0} e K ′ −i = {0}, isto é, os
índices de deficiência são (0, 0). Logo, Pβ′ é auto-adjunto! Este resultado coincide com o
resultado da Seção 4.7.
Vejamos os casos restantes. Considere o Exemplo 4.13 primeiro. Neste caso, para −∞ <
x < ∞, as funções Ψ1 e Ψ2 pertencem a L2 (−∞, ∞) somente se C = 0, ou seja, se
Ψ1 = Ψ2 ≡ 0. Consequentemente, Ki = {0} e K−i = {0}, isto é, os índices de deficiência
são (0, 0). Logo, P é auto-adjunto (e maximalmente simétrico). Por outro lado, no caso do
Exemplo 4.12, para 0 # x < ∞, segue que Ψ1 ∈ L2 (0, ∞), enquanto que Ψ2 ∈ / L2 (0, ∞).
Portanto, neste caso, os índices de deficiência são (0, 1). Assim, P é maximalmente simétrico
e não tem qualquer extensão auto-adjunta.
4.8.4 Extensão de Friedrichs de Operadores Simétricos Semi-Limitados
Como argumentamos anteriormente, um operador simétrico pode ter, em alguns casos,

muitas extensões auto-adjuntas. Um operador simétrico vai ter uma única extensão auto-adjunta
se, e somente se, ambos os índices de deficiência forem iguais a zero. Neste caso, tal operador
é essencialmente auto-adjunto. Por outro lado, para operadores simétricos positivos pode-se
construir uma única extensão canonicamente definida, chamada extensão de Friedrichs. Antes
de apresentarmos este resultado, vamos introduzir dois conceitos importantes relacionados com
operadores que atuam sobre um espaço de Hilbert, H .
Para operadores simétricos positivos, pode-se construir uma extensão auto-adjunta "menor",
DEFINIÇÃO 4.29. Diz-se que um operador A é não-negativo (ou é positivo) – denotado por
A " 0 – se, se somente se, ⟨x, Ax⟩ " 0 para todo x ∈ Dom(A). Diz-se que A majora B
– denotado por A " B – se, e somente se, ⟨x, (A − B)x⟩ " 0 para todo x ∈ Dom(A) ∩
Dom(B).
DEFINIÇÃO 4.30. Um operador linear A : Dom(A) ⊂ H → H é limitado inferiormente
se, e somente se, existe um número γ ∈ R tal que A − γ1I é um operador positivo, isto é, se
⟨x, Ax⟩ " γ∥x∥2 , para todo x ∈ Dom(A). O maior número γ com esta propriedade é o limite
inferior de A.
Segue da definição acima o seguinte

COROLÁRIO 4.8. Um operador A é limitado inferiormente se, e somente se,
∥Ax∥ " γ∥x∥ , ∀ x ∈ Dom(A) .
Demonstração. Basta usar a desigualdade de Cauchy-Schwarz-Bunjakowski. Com efeito,

∥Ax∥∥x∥ " |⟨x, Ax⟩| " ⟨x, Ax⟩ " γ∥x∥2 .
Assim, ∥Ax∥ " γ∥x∥, para todo x ∈ Dom(A).
231
Nota 4.30. Da mesma forma, define-se a noção de um operador limitado superiormente. Um

operador simétrico que é limitado inferiormente ou superiormente é dito ser semi-limitado.
Se A é limitado inferiormente e superiormente, então A é limitado, com o majorante sendo
igual ao maior dos valores absolutos dos limites inferior e superior. Além disso, todo operador
semi-limitado A pode ser obtido de um operador positivo B por uma ou outra das fórmulas
A = B + γ1I ou A = −B + γ1I .
Por exemplo, para um operador limitado inferiormente, temos
⟨x, Ax⟩ = ⟨x, (B + γ1I)x⟩ = ⟨x, Bx⟩ + γ∥x∥2 " γ∥x∥2 .
Dessa forma, na sequência será suficiente considerar operadores positivos.
O próximo resultado estabelece que todo operador A em Dom(A) que é simétrico e

limitado inferiormente ou é auto-adjunto em Dom(A) ou pode ser estendido a um operador
auto-adjunto A N que é limitado inferiormente, tendo o mesmo limite inferior que o operador A.
Esta extensão é conhecida na literatura como extensão de Friedrichs.
TEOREMA 4.34 (Teorema de Friedrichs). Seja A um operador simétrico e limitado inferior-

mente em um espaço de Hilbert, H , isto é, ⟨x, Ax⟩ " γ∥x∥2 , para todo x ∈ Dom(A). Então,
existe um único operador auto-adjunto A N com domínio Dom(A) N que é limitado inferiormente,
com o mesmo limite inferior γ, e que é uma extensão de A em Dom(A), isto é, AxN = Ax para
todo x ∈ Dom(A).
Antes de provarmos o Teorema 4.34, vamos provar o seguinte
LEMA 4.5. Seja A em Dom(A) um operador simétrico e estritamente positivo em um espaço

de Hilbert, H , isto é, ⟨x, Ax⟩ " γ∥x∥2 para todo x ∈ Dom(A), com γ > 0 fixo. Então, existe
um operador auto-adjunto e estritamente positivo AN em Dom(A), N com o mesmo limite inferior
γ, e que é uma extensão de A em Dom(A) e tal que A N−1 existe em H .
Demonstração. Será suficiente provar o lema tomando γ = 1. A demonstração será dividida

em duas etapas:
Etapa 1: Construção de um outro espaço de Hilbert H ′ . Em Dom(A) introduzimos

um novo produto escalar
⟨⟨x, y⟩⟩ = ⟨x, Ay⟩ = ⟨Ax, y⟩ para todo x, y ∈ Dom(A) .
Como a nova norma definimos

H H
∥|x|∥ = ⟨⟨x, x⟩⟩ = ⟨x, Ax⟩ .
Este produto escalar e esta norma satisfazem as propriedades usuais do produto escalar e da
norma (verifique!). Em particular, ∥|x|∥ = 0 se, e somente se, x é o vetor nulo. Note que,
∥|x|∥2 = ⟨⟨x, x⟩⟩ = ⟨x, Ax⟩ " ⟨x, x⟩ = ∥x∥2 =⇒ ∥|x|∥ " ∥x∥ .
232
O domínio Dom(A) com o novo produto escalar satisfaz todos os axiomas para um espaço de
Hilbert,25 exceto talvez o axioma da completeza. No entanto, como sabemos, podemos sempre
completá-lo adicionando certos elementos ideais, x∗ , obtidos por certas sequências de Cauchy
(xn )n∈N ⊂ Dom(A) que não tem como limite um elemento em Dom(A). Por conveniência
do leitor, repetimos brevemente este procedimento: seja (xn )n∈N uma sequência de Cauchy em
Dom(A), isto é, ∥xm − xn ∥ → 0 quando m, n → ∞. Se em Dom(A) existe um elemento
x∗ para o qual limn→∞ ∥xn − x∗ ∥ = 0, então, x∗ é o limite (determinado univocamente de
acordo com a Proposição 1.15) da sequência (xn )n∈N ⊂ Dom(A). Se não existe tal elemento
x∗ ∈ Dom(A), então, associamos à esta sequência de Cauchy um elemento ideal x∗ , de forma
que este elemento é o limite de uma sequência de Cauchy equivalente. Lembramos que duas
sequências (xn )n∈N e (x′n )n∈N são ditas equivalentes com respeito a nova norma∥| · |∥ se
lim ∥|xn − x′n |∥ = 0 .

n→∞
Se x1 , x2 , . . . e y1 , y2, . . . são duas sequências de Cauchy com limites x∗ e y ∗, em que x∗ e y ∗

podem ser elementos de Dom(A) ou elementos ideais, definimos
⟨⟨x∗ , y ∗⟩⟩ = lim ⟨⟨xn , yn ⟩⟩ , (4.8.6)

n→∞
O limite acima só depende de x∗ e y ∗, isto é, eles permanecem invariantes quando substituímos

as sequências de Cauchy em questão por outras que são equivalentes. Se x∗ e y ∗ são ambos
ideiais, o limite (4.8.6) serve como definição de ⟨⟨x∗ , y ∗ ⟩⟩. Assim, adicionando-se tais elementos
ideais a Dom(A), obtemos um espaço de Hilbert completo H ′ com produto escalar ⟨⟨· , ·⟩⟩.
Este é o procedimento usual para completar um espaço de Hilbert incompleto; mas, no caso
que estamos considerando, algo mais pode ser dito: mais especificamente, os elementos ideais
podem ser identificados com certos elementos de um subespaço H0 de H . Assim, o próximo
passo será identificar os elementos de H ′ com os elementos de H0 . Seja (xn )n∈N uma
sequência de Cauchy em H ′ com elementos de Dom(A). Então, por causa da desigualdade
∥|xm − xn |∥ " ∥xm − xn ∥ ,
esta sequência também é uma sequência de Cauchy em H . Além disso, se x1 , x2 , . . . e

y1 , y2, . . . são duas sequências de Cauchy equivalentes em H ′ , então, elas também são equi-
valentes em H . Consequentemente, as duas sequências de Cauchy convergem em H ′ para o
mesmo limite x∗ . Por sua vez, em H , ambas sequências convergem para o mesmo limite que
chamaremos x. Com isto, podemos associar com cada elemento x∗ ∈ H ′ (ideal ou não) um
elemento bem-definido x ∈ H . São estes elementos de H que compõem o espaço H0 .
Esta correspondência, que é obviamente linear, é simples se a sequência (xn )n∈N ⊂

Dom(A) é de Cauchy segundo a nova norma ∥| · |∥, com elemento limite x∗ ∈ Dom(A),
isto é,
lim ∥|xn − x∗ |∥ = 0 .
n→∞
Se x ∈ H é o correspondente limite da mesma sequência (xn )n∈N ⊂ Dom(A), de maneira

que
lim ∥xn − x∥ = 0 ,
n→∞
25
Este espaço de Hilbert não é necessariamente separável, mas, isto não é importante aqui.
233
então, x∗ = x. Isto segue, imediatamente, do limite acima e da relação
0 = lim ∥|xn − x∗ |∥2 = lim ⟨(xn − x∗ ), A(xn − x∗ )⟩ " lim ∥xn − x∗ ∥2 .

n→∞ n→∞ n→∞
No caso geral, se a sequência (xn )n∈N ⊂ Dom(A) é de Cauchy segundo a nova norma
∥| · |∥, com elemento limite x∗ ∈ H ′ , isto é, limn→∞ ∥|xn − x∗ |∥ = 0, e se x ∈ H0 é o
correspondente elemento associado a x∗ , então, para todo x′ ∈ Dom(A), segue que
|⟨⟨x∗ , x′ ⟩⟩ − ⟨x, Ax′ ⟩| = |⟨⟨(x∗ − xn ), x′ ⟩⟩ + ⟨⟨xn , x′ ⟩⟩ − ⟨x, Ax′ ⟩|
= |⟨⟨(x∗ − xn ), x′ ⟩⟩ + ⟨xn , Ax′ ⟩ − ⟨x, Ax′ ⟩|
= |⟨⟨(x∗ − xn ), x′ ⟩⟩ + ⟨(xn − x), Ax′ ⟩|
# |⟨⟨(x∗ − xn ), x′ ⟩⟩| + |⟨(xn − x), Ax′ ⟩|
# ∥|(x∗ − xn )|∥∥|x′|∥ + ∥(xn − x)∥∥Ax′ ∥ → 0 ,
quando n → ∞. Isto implica que
⟨⟨x∗ , x′ ⟩⟩ = ⟨x, Ax′ ⟩ , para todo x′ ∈ Dom(A) . (4.8.7)
A correspondência entre H ′ e H0 tem a propriedade que dois elementos diferentes de H ′

não podem ser representados por um mesmo elemento x ∈ H0 , ou equivalentemente, que
x = 0 implica que x∗ = 0. De fato, pela Eq.(4.8.7), se ⟨⟨x∗ , x′ ⟩⟩ = ⟨x, Ax′ ⟩ = 0, para todo
x′ ∈ Dom(A), pela simetria de A como o domínio Dom(A) é denso em H , segue que
x = 0; mas, Dom(A) também é denso em H ′ com respeito à nova norma ∥| · |∥ (após o
completamento de H ′ ). Portanto, x∗ = 0. Assim, a correspondência entre os elementos de
H ′ e H0 é completa e não faremos qualquer distinção entre H ′ e H0 . Isto implica que
Dom(A) ⊂ H0 ⊂ H ,
e a desigualdade ∥|x|∥ " ∥x∥ permanece válida para todo x ∈ H0 .
Etapa 2: Construção da extensão auto-adjunta de A. Para dois elementos arbitrários y ∈

H e x ∈ H0 , segue, pela desigualdade de Cauchy-Schwarz-Bunjakowski e pelo desenvolvimento
da Etapa 1, que
|⟨y, x⟩| # ∥y∥∥x∥ # ∥y∥∥|x|∥ .
Logo, para um elemento arbitrário fixo y ∈ H , o funcional ϕy (x) = ⟨y, x⟩ é limitado em

H0 , com a norma ∥ϕy ∥ não excedendo a norma ∥y∥. Pelo Teorema de Representação de
Riesz-Fréchet (Teorema 4.9), existe um único elemento z ∈ H0 para o qual ϕy (x) = ⟨⟨z, x⟩⟩ e
cuja norma ∥|z|∥ é igual à norma do funcional ∥ϕy ∥. Portanto,
∥z∥ # ∥|z|∥ # ∥y∥ . (4.8.8)
Dessa forma, z é univocamente determinado pelo funcional e, portanto, por y. Assim, se

escrevemos z = By, definimos um operador linear que tem H como domínio de definição
234
e cujo conjunto imagem Ran(B) ⊂ H0 . Além disso, By = 0 implica que y = 0, já que

⟨y, x⟩ = ⟨⟨z, x⟩⟩ = ⟨⟨By, x⟩⟩ = 0 para todo x ∈ H0 . Como Dom(A) ⊂ H0 ⊂ H e
Dom(A) é denso em H0 , com respeito à norma ∥| · |∥ (e também com respeito à norma ∥ · ∥),
e denso em H , com respeito à norma ∥ · ∥, segue que H0 é denso em H . Portanto, B −1
N = B −1 , então, Dom(A)
existe. Definindo A N = Ran(B) ⊂ H0 e Ran(A) N =H.
Assumindo que x = Bx′ , em que x′ é novamente um elemento arbitrário de H , obtemos
⟨y, Bx′ ⟩ = ⟨⟨By, Bx′ ⟩⟩ = ⟨⟨Bx′ , By⟩⟩ = ⟨x′ , By⟩ = ⟨By, x′⟩ ,
para todo y, x′ ∈ H . Em particular, para x′ = y
⟨y, By⟩ = ⟨⟨By, By⟩⟩ = ∥|By|∥ " ∥By∥ " 0 .
Logo, B é um operador simétrico e positivo no espaço H . Que o operador B é limitado (com

norma # 1) segue imediatamente da desiguadade (4.8.8) tomando z = By. Note que, como
N o operador A
x, z ∈ Dom(A), N também é simétrico, já que
N x⟩ = ⟨y, Bx′ ⟩ = ⟨By, x′⟩ = ⟨z, Ax⟩

⟨Az, N .
N com domínio Dom(A),

Resta-nos mostrar que A, N é uma extensão de A. Por definição,
para x, y ∈ Dom(A), temos
⟨y, Ax⟩ = ⟨⟨y, x⟩⟩ .
Por outro lado, da relação Dom(A) ⊂ H0 ⊂ H , temos
⟨y, Ax⟩ = ⟨⟨y, BAx⟩⟩ .
Como Dom(A) é denso em H0 , com respeito à norma ∥| · |∥, a igualdade
⟨⟨y, x⟩⟩ = ⟨⟨y, BAx⟩⟩ ,
é possível para todo y ∈ Dom(A) somente se BAx = x. Isto mostra que x pertence ao
domínio de A N e que AxN = Ax. Assim, provamos que Dom(A) ⊂ Dom(A) N e que Ax
N = Ax
para todo x ∈ Dom(A). Portanto, A N é uma extensão de A. Além disso, como B é simétrico e
limitado, tendo todo o espaço de Hilbert H como domínio, ele é auto-adjunto pelo Teorema de
N = B −1 é simétrico e Ran(B −1 ) = H ,
Hellinger-Toeplitz (Teorema 4.14). Além disso, como A
pelo Teorema 4.20 segue que B −1 também é auto-adjunto.
N é limitado inferiormente por 1 da seguinte forma: se x ∈

Finalmente, asseguramos que A
Dom(A)N e y = Ax,
N de maneira que x = A N−1 y = By, então, temos
N = ⟨Ax,
⟨x, Ax⟩ N x⟩ = ⟨y, By⟩ = ⟨⟨By, By⟩⟩
= ∥|By|∥2 " ∥By∥2 = ∥x∥2 .
Isto completa a prova do lema.
235
Demonstração do Teorema 4.34. Precisamos tratar somente o caso quando γ # 0. Isto implica
que A + γ1I " 0. Defina B = A + (1 + γ)1I em Dom(A). Então,
⟨x, Bx⟩ = ⟨x, Ax⟩ + (1 + γ)⟨x, x⟩
" −γ⟨x, x⟩ + (1 + γ)⟨x, x⟩ =⇒ ⟨x, Bx⟩ " ∥x∥2 .
Assim B é estritamente positivo, com limite inferior 1. B em Dom(A) é automaticamente

simétrico e, de acordo com o Lema 4.5, existe um operador auto-adjunto e estritamente positivo
BN em Dom(B), N com o mesmo limite inferior 1. Portanto, por argumentos muito gerais que
aparecem no Teorema 4.35, o operador A N=B N − (1 + γ)1I dá o resultado desejado. É possível
que A tenha ainda um outro operador auto-adjunto como extensão. No entanto, entre esses
operadores existe somente um, o operador A N que construímos, cujo domínio está contido em
^ outra extensão auto-adjunta com Dom(A)
H0 . Para ver essa unicidade, seja A ^ ⊂ H0 . Escolha
x ∈ Dom(A) e y ∈ Dom(A). Então,^
^ = ⟨Ax, y⟩ = ⟨y, Ax⟩ = ⟨⟨y, x⟩⟩ = ⟨⟨x, y⟩⟩ ,

⟨x, Ay⟩
^ = ⟨⟨x, y⟩⟩ para todo x ∈ H0 . Logo, para y ∈

e por continuidade obtemos que ⟨x, Ay⟩
Dom(A) N temos que Ay
N = Ay,
^ isto é, A
^ ⊂ A.
N Mas os operadores auto-adjuntos são maximais
^ = A.
e, portanto, A N
4.9 Perturbações Relativamente Limitadas de Operadores

Auto-Adjuntos
Um aspecto importante da teoria dos operadores auto-adjuntos diz respeito à estabilidade
da auto-adjunção sob a soma de operadores auto-adjuntos atuando sobre um espaço de Hilbert
H . Se A é um operador auto-adjunto (não necessariamente limitado) e B é limitado, então é
fácil ver que A + B também é auto-adjunto
. /no domínio Dom(A + B) = Dom(A). De fato,
∗
suponha que o vetor y ∈ Dom (A + B) e que o vetor z ∈ H é tal que
⟨y, (A + B)x⟩ = ⟨z, x⟩ , ∀ x ∈ Dom(A) .
Então,
⟨y, (A + B)x⟩ = ⟨y, Ax⟩ + ⟨y, Bx⟩ = ⟨y, Ax⟩ + ⟨By, x⟩ = ⟨z, x⟩ .
Logo, segue que ⟨y, Ax⟩ = ⟨z − By, x⟩, para todo x ∈ Dom(A). Pela definição de operador
adjunto, uma vez que z − By ∈ H , então y ∈ Dom(A∗ ) = Dom(A) e A∗ y = z − By.
Assim, a propriedade de ser auto-adjunto é estável sob a soma de um operador auto-adjunto
limitado B e um operador auto-adjunto A (não necessariamente limitado). No entanto, em
muitas situações encontradas na mecânica quântica considera-se a soma de um operador auto-
adjunto A e um operador ilimitado B. Mesmo que separadamente A e B sejam auto-adjuntos,
o operador soma A + B, em geral, não será necessariamente auto-adjunto (será só simétrico).
Portanto, é importante conhecer os critérios que implicam a auto-adjunção da soma A+B. Esta
seção é dedicada a este assunto. A princípio poderíamos, em determinadas situações, pensar em
considerar B como uma “perturbação” de A; isso significa que, em um certo sentido, B deve
ser pequeno em comparação com A. Mas isto, levanta a seguinte questão: em que condições
a auto-adjunção é preservada sob uma “pequena” perturbação? Em outras palavras, sob qual
236
condição é possível provar a auto-adjunção da soma A + B em um domínio adequado (por

exemplo no domínio Dom(A)) para um certo tipo de perturbação B? A principal motivação
para se responder esta questão vem da mecânica quântica, em que A = −∇2 é o operador
laplaciano, B = V é um potencial e A + B = −∇2 + V é um operador de Schrödinger.
4.9.1 O Método de Tosio Kato
Como veremos, a auto-adjunção da soma A + B é garantida por meio de uma expansão de

uma série geométrica convergente (a séria de Neumann). Mas, para se obter essa convergência
é necessário termos uma noção do que se entende por B ser relativamente pequeno em
comparação com A. Para isso, um critério fundamental é dado pela seguinte
DEFINIÇÃO 4.31 (Critério de Kato). Sejam A e B dois operadores lineares densamente definidos
em um espaço de Hilbert H . Então, B é chamado uma perturbação de Kato de A se, e somente
se, Dom(A) ⊂ Dom(B) e se existem números reais 0 # a < 1 e b ∈ (0, ∞) tais que
∥Bx∥ # a∥Ax∥ + b∥x∥ , ∀ x ∈ Dom(A) . (4.9.1)
Neste caso, B é chamado A-limitado. O maior limite inferior dos números a satisfazendo (4.9.1),
para algum b, é chamado o limite relativo de B em relação a A. Se o limite relativo é zero, B
é dito infinitesimalmente pequeno em relação a A.
Geralmente, na Definição 4.31, b deve ser escolhido tanto maior, quanto menor for a. Isto
significa que, podemos aumentar b se diminuirmos a, mas não podemos tomar a = 0 para
qualquer b finito, a menos que B seja um operador limitado (neste caso b = ∥B∥). Por esse
motivo, escrevemos b = b(a).
LEMA 4.6. A seguinte desigualdade é equivalente à desigualdade (4.9.1):
∥Bx∥2 # a20 ∥Ax∥2 + b20 ∥x∥2 , ∀ x ∈ Dom(A) . (4.9.2)
Demonstração. Que (4.9.2) =⇒ (4.9.1) é imediato, basta tomar a0 = a e b0 = b. Com efeito,

assumindo a validade de (4.9.2), então, para todo x ∈ Dom(A), segue que
∥Bx∥2 # a20 ∥Ax∥2 + b20 ∥x∥2
# a20 ∥Ax∥2 + b20 ∥x∥2 + 2a0 b0 ∥Ax∥∥x∥

. /2
= a0 ∥Ax∥ + b0 ∥x∥ .
Para mostrar que (4.9.1) =⇒ (4.9.2), note que
∥Bx∥2 # a2 ∥Ax∥2 + b2 ∥x∥2 + 2ab∥Ax∥∥x∥ .
Seja ε > 0. Então, para x ∈ Dom(A), segue que
(aε1/2 ∥Ax∥ − bε−1/2 ∥x∥)2 = a2 ε∥Ax∥2 + b2 ε−1 ∥x∥2 − 2ab∥Ax∥∥x∥ " 0 .
237
Isto implica que

a2 ε∥Ax∥2 + b2 ε−1 ∥x∥2 " 2ab∥Ax∥∥x∥ .
Portanto,
∥Bx∥2 # a2 (1 + ε)∥Ax∥2 + b2 (1 + ε−1)∥x∥2 .
√ √
Consequentemente, obtemos (4.9.2) definindo a0 = a 1 + ε e b0 = b 1 + ε−1 . Note que,
como ε é um número positivo arbitrário, o menor dos a0 ’s para qual a desigualdade (4.9.2)
acontece é igual ao menor dos a’s para qual a desigualdade (4.9.1) acontece, basta tomar
ε << 1.
Nota 4.31. Para verificar (4.9.1) ou (4.9.2), basta fazê-lo para todo vetor x que pertence a um core
de A!
LEMA 4.7. Sejam A e B dois operadores lineares densamente definidos em um espaço de Hilbert
H . Se A é um operador auto-adjunto e B é um operador simétrico, tal que Dom(A) ⊂
Dom(B), então, B é A-limitado.
Demonstração. Uma vez que o operador A é auto-adjunto, ele é também fechado. Logo, segue
da Nota 4.20, na página 172, que Dom(A) é um espaço de Hilbert segundo a norma do gráfico
6 71/2
∥(x, Ax)∥H ×H = ∥x∥2H + ∥Ax∥2H .
A seguir, vamos mostrar que B, considerado como um mapeamento de Dom(A) em H ,

é fechado. Suponha que xn → x em Dom(A) e que Bxn → y em H . Então, x ∈
Dom(A) ⊂ Dom(B) e para todo z ∈ Dom(B ∗ ), segue que
⟨z, Bxn ⟩ = ⟨B ∗ z, xn ⟩ → ⟨z, y⟩ = ⟨B ∗ z, x⟩ = ⟨z, Bx⟩ .
Agora, B é fechável, já que B ∗ é fechado. Seja B N o fecho de B; pelo Corolário 4.4, B N é

simétrico. Assim, como B N é fechado e simétrico seu domínio é denso em H e, pelo Teorema
N ∗
4.17, (B ) é denso em H . Mas, pela Proposição 4.19, (B N ∗ ) = B ∗ ; logo, B ∗ é denso em H .
Portanto, a igualdade ⟨z, y⟩ = ⟨z, Bx⟩, para todo z ∈ Dom(B ∗ ), implica que y = Bx. Isso
prova que B : Dom(A) → H é fechado. Consequentemente, do Teorema do Gráfico Fechado,
página 177 (veja também a Nota 4.23, na página 179), concluímos que B : Dom(A) → H é
contínuo. Portanto, B é A-limitado.
A razão pela qual operadores relativamente limitados são tão importantes se deve ao cele-
brado
TEOREMA 4.35 (Teorema de Kato-Rellich). Sejam A um operador auto-adjunto e B um ope-

rador simétrico, ambos atuando sobre um espaço de Hilbert H . Assuma que Dom(A) ⊂
Dom(B). Então, se B é uma perturbação de Kato de A, a soma A + B é um operador
auto-adjunto no domínio Dom(A) e essencialmente auto-adjunto em qualquer core de A.
Além disso,! se A é limitado inferiormente
" por M, então A + B é limitado inferiormente por
M − max b/(1 − a), aM + b , em que 0 # a < 1 e b > 0.
238
Demonstração. Prova que A + B é auto-adjunto no domínio Dom(A): Pelo Teorema 4.25,

parte 3, basta mostrar que Ran(A + B ± iβ1I) = H . Comecemos com β > 0. Tome
x ∈ Dom(A) e β ∈ R. Primeiro, observe que
[ \
∥(A + iβ1I)x∥2 = (A + iβ1I)x, (A + iβ1I)x
[ \ [ \ [ \ [ \
= Ax, Ax + iβ1Ix, iβ1Ix + Ax, iβ1Ix + iβ1Ix, Ax
=[ \ [ \>
2 2 2
= ∥Ax∥ + |β| ∥x∥ + iβ Ax, x − x, Ax .
B CD E
= 0, já que A é simétrico!
Consequentemente,
1
∥Ax∥ # ∥(A + iβ1I)x∥ e ∥x∥ # ∥(A + iβ1I)x∥ .
|β|
Combinando este resultado com (4.9.1), obtemos

, -
b
∥Bx∥ # a + ∥(A + iβ1I)x∥ , ∀ x ∈ Dom(A) . (4.9.3)
|β|
. /−1
Agora, observe que, o operador resolvente de A em β é Rβ (A) = A + iβ1I . Uma vez
que A é auto-adjunto, segue, do Teorema 4.25, que Ran(A + iβ1I) = H . Como o conjunto
Ran(A + iβ1I), que é o domínio de Rβ (A), é denso em H , então, Ker(A + iβ1I) = {0}.
Lembre-se que
3 4
Ker(A + iβ1I) = x ∈ Dom(A) | (A + iβ1I)x = 0 .
Neste caso, como Ker(A + iβ1I) = {0}, isto implica que −iβ não é um auto-valor de A. Logo,
. / . /−1
−iβ ∈ ρ(A) e A+iβ1I admite um inverso. Assim, tomando x = A+iβ1I y ∈ Dom(A)
para algum y ∈ H e inserindo esse x em (4.9.3), obtemos
, -
−1 b
∥B(A + iβ1I) y∥ # a + ∥y∥ , y ∈ H . (4.9.4)
|β|
Note que, se tomarmos um |β| = |β0 | > b/(1 − a), então a + b/|β0 | < 1. Dessa forma,
def. . /−1
∥B(A + iβ0 1I)−1 ∥ < 1. Assim, C = B A + iβ0 1I é um operador limitado com ∥C∥ < 1
e, portanto, o operador 1I +;
C tem inverso, com o operador inverso sendo obtido pela série
de Neumann (1I + C)−1 = ∞ n
n=0 (−C) . Isto significa, em particular, que o operador 1I + C
tem como conjunto imagem todo H , isto é Ran(1I + C) = H . Além disso, para qualquer
x ∈ Dom(A) temos
. /
(A + B + iβ0 1I)x = 1I + B(A + iβ0 1I)−1 (A + iβ0 1I)x .
No lado direito da equação acima temos a composição de dois operadores sobrejetivos; portanto,
(A + B + iβ0 1I) é sobrejetivo também. Isto implica que, Ran(A + B + iβ0 1I) = H .
Usando o mesmo argumento, mostra-se que (A + B − iβ0 1I) também é sobrejetivo, isto é,
Ran(A + B − iβ0 1I) = H . Portanto, pelo Teorema 4.25, temos que A + B é auto-adjunto.
239
Prova que A + B é essencialmente auto-adjunto em qualquer core de A: Se Ω for um

core de A, então, para qualquer x ∈ Dom(A), deve haver uma sequência (xn )n∈N ⊂ Ω tal
que xn → x e Axn → Ax quando n → ∞. Mas, então,
∥B(x − xn )∥ # a∥A(x − xn )∥ + b∥x − xn ∥ → 0 ,

! 5
de modo que o domínio do fecho (A + B)5Ω de A + B restrito ao subconjunto Ω ⊂ Dom(A)
! 5
contenha o domínio do fecho A5Ω = A. Uma vez que Dom(A + B) = Dom(A) e A + B
! 5
é auto-adjunto, segue que (A + B)5Ω = A + B, isto é, Ω é um core de A + B.
! "
Prova que se A " M, então A + B " M − max b/(1 − a), aM + b : De acordo com
a Dedinição 4.30, o operador A é limitado inferiormente por M se, e somente se, ⟨x, Ax⟩ "
M∥x∥2 , para todo x ∈ Dom(A). O maior número M com esta propriedade é o limite inferior
de A, isto é,
inf ⟨x, Ax⟩ = M .
x∈Dom(A)
Assim, sob o hipótese que A " M, queremos mostrar que

# %
b
⟨x, (A + B)x⟩ " M − max , aM + b ,
1−a
isto é, que para qualquer dado t ∈ R satisfazendo
# %
b
−t < M − max , aM + b ,
1−a
o operador A+ B + t1I tem um inverso limitado. Observe que inf x∈Dom(A) ⟨x, Ax⟩ = M > −t,
de modo que o operador A + t1I tem um inverso limitado e para tal t, Ran(A + t1I) = H .
Logo, . /
(A + B + t1I)x = 1I + B(A + t1I)−1 (A + t1I)x , ∀x ∈ Dom(A) .
Portanto, como na primeira parte, definindo C = B(A + t1I)−1 , temos que mostrar que 1I + C
admite inverso. Para isto, observe que
?. / ? [. / . / \
? A + t1I x?2 = A + t1I x, A + t1I x
[ \ [ \ [ \ [ \
= Ax, Ax + t1Ix, t1Ix + Ax, tx + tx, Ax
[ \
= ∥Ax∥2 + t2 ∥x∥2 + 2t x, Ax
" ∥Ax∥2 + (t2 + 2tM)∥x∥2 .

. / . /−1
Como A + t1I é invertível, então, tomando x = A + t1I y ∈ Dom(A) para algum
y ∈ H e inserindo esse x na expressão acima, obtemos
? ?2 ? ?2
∥y∥2 " ?A(A + t1I)−1 y ? + (t2 + 2tM)?(A + t1I)−1 y ? .
Isto implica que

? ? ? ?
?A(A + t1I)−1 y ?2 # ∥y∥2 − (t2 + 2tM)?(A + t1I)−1 y ?2 , para algum y ∈ H .
240
Por outro lado, como

[ \
x, (A + t)x " (M + t)∥x∥2 , ∀x ∈ Dom(A) ,
então, usando a desigualdade de Cauchy-Schwarz-Bunjakowski, segue que

5[ \5 [ \
∥x∥∥(A + t)x∥ " 5 x, (A + t)x 5 " x, (A + t)x " (M + t)∥x∥2 , ∀x ∈ Dom(A) ,
ou que
∥(A + t)x∥ " (M + t)∥x∥ , ∀x ∈ Dom(A) .
. /−1
Assim, para x = A + t1I y ∈ Dom(A), segue que
∥y∥ " (M + t)∥(A + t1I)−1 y∥ , para algum y ∈ H .
Consequentemente, temos
1
∥(A + t1I)−1 y∥ # ∥y∥ ,
M +t
e
# %
−1 2t2 + 2tM
∥A(A + t1I) y∥ # 1 − ∥y∥2
(M + t)2
⎧
⎨∥y∥2 se t2 + 2tM " 0
# ,
⎩ M 2 ∥y∥2 se t2
+ 2tM < 0
(M +t)2
ambas relações valendo para algum y ∈ H . Combinando estes resultados com (4.9.1), obtemos
? ? ? ?
∥B(A + t1I)−1 y∥ # a?A(A + t1I)−1 y ? + b?(A + t1I)−1 y ?
⎧. /
⎨ a + Mb+t ∥y∥2 se t2 + 2tM " 0
# . .
⎩ aM + b / ∥y∥2 se t 2
+ 2tM < 0
M +t M +t
? ?
Dessa relação podemos concluir que ?B(A + t1I)−1 ? < 1 se
b
M− > −t para t2 + 2tM " 0 ,
1−a
ou
M − (aM + b) > −t para t2 + 2tM < 0 .
Portanto, 1I + C é invertível se
# %
b
−t < M − max , aM + b .
1−a
Para tal t, Ran(A + B + t1I) = H e (A + B + t1I)x = (1I + C)(A + t1I)x, para todo
x ∈ Dom(A); isto implica que −t ∈ ρ(A + B).
241
O Teorema de Kato-Rellich apareceu pela primeira vez no artigo de F. Rellich, “Störungstheorie

der Spektralzerlegung. III,” Math. Ann. 116 (1939) 555 e foi redescoberto por T. Kato no artigo
“On Finite-Dimensional Perturbations of Self-Adjoint Operators,” J. Math. Soc. Japan 9 (1957)
239. Na teoria quântica, esse teorema tem-se revelado fundamental no estudo da auto-adjunção
(ou da auto-adjunção essencial) dos operadores de Schrödinger e de Dirac. Com efeito, o
hamiltoniano de um sistema quântico é geralmente descrito como a soma da energia cinética
H0 (o operador hamiltoniano livre) mais um operador V correspondente à energia potencial.
Uma vez que H0 é fácil de investigar (os detalhes da construção do operador hamiltoniano
livre como um operador auto-adjunto em L2 (Rn ) são considerados no Capítulo 10), geralmente
tenta-se considerar V como uma perturbação de H0 . Isso só funcionará se V for pequeno em
relação a H0 de acordo com o critério de Kato. Estudaremos essas perturbações no Capítulo 10;
mostraremos que o Teorema de Kato-Rellich é aplicável àlguns casos específicos de interações
de importância na mecânica quântica (veja o Teorema 10.1). No entanto, o método de Kato não
abrange todos os exemplos de interesse físico, como os potenciais mais singulares do que r −2
na origem.26
Nota 4.32. No Teorema 4.35 foi crucial assumir que a < 1. De fato, esta condição foi necessária
def. . /−1
para garantir que o operador C = B A + iβ0 1I seja um operador limitado com ∥C∥ < 1
e, portanto, para garantir que o operador 1I + C tenha
; um inverso, com o operador inverso
sendo obtido pela série de Neumann ((1I + C)−1 = ∞ n=0 (−C) n
). Isto, em particular, garantiu
que Ran(1I + C) = H , condição necessária para provar que a soma A + B é um operador
auto-adjunto. Se admitíssemos que a = 1 no Teorema 4.35, então a soma A + B não seria
necessariamente um operador auto-adjunto. Com efeito, se tomarmos a = 1 e B = −A, então
teríamos
∥ − Ax∥ = ∥Ax∥ # ∥Ax∥ + b∥x∥ =⇒ 0 # b∥x∥ ,
e como b > 0, segue que a igualdade é obtida somente se x = 0. Em outras palavras, A + B,

com B = −A, seria a restrição própria do operador O ao domínio Dom(A) e a soma A + B
não seria um operador auto-adjunto.
O próximo resultado estende o Teorema de Kato-Rellich para o caso quando a = 1.

TEOREMA 4.36 (Teorema de Wüst). Sejam A um operador essencialmente auto-adjunto e B
um operador simétrico, com Dom(A) ⊂ Dom(B), ambos atuando sobre um espaço de Hilbert
H . Suponha que para algum b ∈ (0, ∞),
∥Bx∥ # ∥Ax∥ + b∥x∥ , ∀ x ∈ Dom(A) . (4.9.5)
Então, A + B é essencialmente auto-adjunto no domínio Dom(A) ou em qualquer core de A.
Demonstração. Naturalmente, sem perda de generalidade, podemos assumir que A é auto-

adjunto. Assim, segue do Teorema 4.35 e da condição (4.9.5) que A+ tB também é auto-adjunto
para 0 < t < 1. Com efeito, considerando o mesmo raciocínio que nos levou até a Eq.(4.9.4),
mais a condição (4.9.5), segue que
, -
−1 b
∥B(A + iβ1I) y∥ # 1 + ∥y∥ , y ∈ H .
|β|
26
Veja o Capítulo X, do Volume II de Reed-Simon para uma revisão de alguns desses casos.
242
Observe que, se reescrevermos a equação acima da seguinte forma

? ? , -
?1 . /−1 ? b
? · tB A + iβ1I y ? # 1 + ∥y∥ , y ∈ H .
?t ? |β|
ou
, -
−1 b
∥tB(A + iβ1I) y∥ # t 1 + ∥y∥ , y∈H ,
|β|
então, como na prova do Teorema de Kato-Rellich, A + tB será auto-adjunto se tomarmos um
|β| = |β0 | > tb/(1 − t), com 0 < t < 1.
O próximo e decisivo passo é mostrar que Ran(A + B + iβ1I) é denso em H . Para

isto, para todo x ∈ Dom(A), escolha um z ∈ H que .seja ortogonal
/ a todo vetor do tipo
(A + B + iβ1I)x. Levando em conta que (A + tB + iβ1I) Dom(A) = H para 0 < t < 1,
existe um xt ∈ Dom(A) tal que
(A + tB + iβ1I)xt = z , 0<t<1. (4.9.6)
Da condição de ortogonalidade ⟨z, (A + B + iβ1I)x⟩ = 0, para todo x ∈ Dom(A), segue que
para 0 < t < 1
∥z∥2 = ⟨z, (A + tB + iβ1I)xt ⟩
= ⟨z, (A + tB + B − B + iβ1I)xt ⟩
= ⟨z, (A + B + iβ1I)xt ⟩ + ⟨z, −(1 − t)Bxt ⟩
= 0 + ⟨z, −(1 − t)Bxt ⟩ .

Portanto, para 0 < t < 1, (1 − t)Bxt = −z + yt , com yt ⊥ z. Uma vez que A + tB é
simétrico, segue de (4.9.6) que
∥z∥2 = ∥(A + tB)xt ∥2 + |β|2 ∥xt ∥2 .
Logo,
1
∥(A + tB)xt ∥ # ∥z∥ e ∥xt ∥ # ∥z∥ .
|β|
Além disso, pela hipótese do teorema, como xt ∈ Dom(A), então,
∥Bxt ∥ # ∥Axt ∥ + b∥xt ∥ # ∥(A + tB)xt ∥ + ∥tBxt ∥ + b∥xt ∥ .
Assim, temos que
, -
b
(1 − t)∥Bxt ∥ # ∥(A + tB)xt ∥ + b∥xt ∥ # 1 + ∥z∥
|β|
, -
1 b
= ·t 1+ ∥z∥
t |β|
1
< ∥z∥ .
t
243
Consequentemente, (1−t)∥Bxt ∥ e, portanto, ∥yy ∥ são limitados para 0 < t < 1. Para finalizar,
tome um vetor w ∈ Dom(A). Então,
lim ⟨(yt − z), w⟩ = lim− ⟨(1 − t)Bxt , w⟩ = 0 .

t→1− t→1
Como Dom(A) é denso em H , o limite acima vale para todo w ∈ H . Pela Propriedade 1 do
Lema 3.2, necessariamente devemos ter yt − z = 0 para todo w ∈ H , quando t → 1− . Mas,
então, ⟨z, z⟩ = limt→1− ⟨yt , z⟩ = 0, já que yt ⊥ z. Logo, z = 0. Desse modo, provamos que
Ran(A + B + iβ1I) é denso em H . Usando a mesma linha de raciocínio acima, mostra-se
que (A + B − iβ0 1I) também é denso em H . Portanto, pelo Teorema 4.26, temos que A + B
é essencialmente auto-adjunto.
4.9.2 O Método das Formas Quadráticas
O método de Kato tratou o caso em que dois operadores A e B têm um domínio comum
no qual a soma A + B é bem definida e auto-adjunta. Um processo alternativo para o estudo
de perturbações relativamente limitadas de operadores auto-adjuntos baseia-se no conceito de
formas quadráticas, uma ferramenta poderosa e muito utilizada na construção de operadores
auto-adjuntos, em particular em situações em que a estratégia natural falha (por exemplo, para
a adição de operadores lineares via o método de Kato), mas ainda é possível adicionar as
formas quadráticas correspondentes. Nesta subseção, desenvolvemos a teoria de perturbação
de operadores lineares deste ponto de vista. Nosso objetivo é mostrar que sob condições
adequadas, a forma-soma quadrática de A e B dará origem a um operador auto-adjunto via a
extensão de Friedrichs. Iremos denotar a forma-soma por A+̇B quando quisermos enfatizar o
caráter da forma-soma, caso contrário, escreveremos A + B. Normalmente, na teoria quântica,
a construção da forma-soma é usada na teoria dos operadores de Schrödinger e Dirac nos
casos em que o potencial V tem uma singularidade local muito forte que impede que V seja
localmente de quadrado integrável.
Começamos coletando os conceitos básicos da teoria das formas quadráticas em um espaço

de Hilbert.
DEFINIÇÃO 4.32. Seja H um espaço de Hilbert complexo com produto interno. Uma forma
quadrática q com domínio forma Quad(q) = D, em que D é um subespaço linear de H é
um mapeamento q : D × D → C que é anti-linear no primeiro argumento e linear no segundo
argumento. Uma forma quadrática q em H é chamada
(a) simétrica se, e somente se, q(x, y) = q(y, x) para todo x, y ∈ Quad(q);
(b) densamente definida se, e somente se, seu domínio forma Quad(q) é denso em H ;
(c) semi-limitada (inferiormente) se, e somente se, houver um γ ∈ R tal que para todo
x ∈ Quad(q)
q(x, x) " γ∥x∥2 ,
com o número γ sendo chamado de limite inferior de q;
244
(d) positivo se, e somente se, q é semi-limitado com limite inferior γ = 0;
(e) contínua se, e somente se, houver uma constante C tal que
|q(x, y)| # C∥x∥∥y∥ , ∀ x, y ∈ Quad(q) .
Nota 4.33. Em vários textos, exceto pelo item (c), o termo usado na definição acima é forma
sesquilinear. O termo forma quadrática é usado somente para o item (c). Neste caso, muitas
vezes se escreve q(x) = q(x, x) para enfatizar isto. No entanto, vários autores não fazem
distinção entre formas sesquilineares e formas quadráticas e chamam indiferentemente uma
forma quadrática ambas as funções q(·, ·) e q(·). Estamos adotando esta prática.
Com base na Definição 4.32, introduzimos vários outros conceitos importantes: (i) podemos
associar um produto escalar
⟨y, x⟩q = q(y, x) + (1 − γ)⟨y, x⟩ γ ∈ R e x, y ∈ Quad(q) ,
e norma-forma
H
∥|x|∥q = q(x, x) + (1 − γ)∥x∥2 . (4.9.7)
O produto escalar ⟨ · , · ⟩q garante que sequências que são de Cauchy em relação a este produto
escalar, também são de Cauchy em relação ao nosso produto escalar original, já que a norma-
forma (4.9.7) satisfaz ∥|x|∥q " ∥x∥. Chamaremos q fechável se para cada sequência de Cauchy
(xn )n∈N ⊂ Quad(q) com respeito à norma ∥| · |∥q , ∥|xn |∥q → 0 implica que ∥xn ∥ → 0.
Neste caso, temos Hq ⊂ H , em que Hq é o completamento de Quad(q) com respeito
à norma ∥| · |∥q . Então, segue que Quad(q) ⊂ Hq ⊂ H . Chamamos a extensão de q
para Hq o fecho de q. Em particular, uma forma quadrática q limitada inferiormente, com
limite inferior γ é chamada fechada se, e somente se, o domínio forma Quad(q) é completo
quando for equipado com a norma-forma (4.9.7), isto é, se Quad(q) = Hq . (ii) Uma forma
quadrática q 1 com domínio Quad(q 1 ) é chamada de extensão de uma forma quadrática q
com domínio Quad(q) se, e somente se, Quad(q) ⊂ Quad(q 1 ) e q 1 (x, y) = q(x, y) para
todo x, y ∈ Quad(q). (iii) Uma forma quadrática é chamada de fechável se, e somente se,
tiver uma extensão fechada. (iv) Um subconjunto D ′ ⊂ Quad(q) do domínio de uma forma
quadrática fechada q é chamado de core se, e somente se, D ′ for denso no domínio forma
Quad(q) equipado com a forma norma ∥| · |∥q .
Vamos agora introduzir as formas quadráticas que nos interessam. Suponha que A seja um
operador linear no espaço de Hilbert complexo H com domínio Dom(A). De uma forma
natural, podemos associar com A duas formas quadráticas com o domínio forma sendo o
próprio domínio Dom(A):
q 1 (y, x) = ⟨y, Ax⟩ e q 2 (y, x) = ⟨Ay, Ax⟩ .
A forma q 2 é sempre positiva e simétrica. As formas quadráticas são densamente definidas

se, e somente se, o operador A também o é. Note que, a forma quadrática q 1 implica que o
operador A é automaticamente simétrico para todo x, y ∈ Dom(A), já que
⟨y, Ax⟩ = q 1 (y, x) = q 1 (x, y) = ⟨x, Ay⟩ = ⟨Ay, x⟩ .
245
Assim, q 1 é densamente definida e simétrica. A forma q 1 é semi-limitada inferiormente se, e

somente se, o operador A for limitado inferiormente, ou seja, se, e somente se, existir algum
γ ∈ R tal que ⟨x, Ax⟩ " γ⟨x, x⟩ para todo x ∈ Dom(A). Como a norma-forma ∥| · |∥q2
é igual à norma do gráfico do operador A, a forma quadrática q 2 é fechada se, e somente
se, o operador A for fechado. É importante notar que mesmo para um operador fechado A, a
forma quadrática q 1 não é necessariamente fechada. Ambas as formas quadráticas q 1 e q 2 são
contínuas se A for contínuo, isto é, se existir alguma constante C tal que ∥Ax∥ # C∥x∥ para
todo x ∈ Dom(A).
DEFINIÇÃO 4.33. Sejam A um operador auto-adjunto e limitado inferiormente e q A (x, x) sua

forma quadrática associada. Então, um operador simétrico B, com forma quadrática associada
q B (x, x), é dito ser uma forma quadrática A-limitada se, e somente se,
(i) Quad(A) ⊂ Quad(B);
(ii) existem constantes 0 # a < 1 e b > 0 tais que
|q B (x, x)| # a q A (x, x) + b ∥x∥2 para todo x ∈ Quad(A) . (4.9.8)
O ínfimo de todos os valores de a é chamado de limite da forma quadrática B.
O próximo resultado é a contrapartida em termos das formas quadráticas do Teorema de

Perturbação de Kato-Rellich e a usamos para definir a forma-soma de operadores auto-adjuntos.
O teorema é aplicável quando a forma quadrática q B (x, x) “não é muito grande” em comparação
com forma quadrática q A (x, x), no sentido acima, embora B possa não ser A-limitado segundo
o critério de Kato. Este resultado foi chamado de Teorema KLMN por J.T. Cannon em 1968, em
sua tese intitulada “Field Theoretic Properties of Nelson’s Model,” Princeton Thesis,27 já que o
teorema foi desenvolvido por Kato, Lions, Lax-Milgram e Nelson.
TEOREMA 4.37 (Teorema KLMN). Suponha que A seja auto-adjunto e limitado inferiomente e
que B seja simétrico e A-limitado, com um limite forma < 1. Então,
(i) a soma das formas quadráticas de A e B é uma forma quadrática simétrica fechada em
Quad(A) e limitada inferiormente;
(ii) Existe um único operador auto-adjunto associado a esta forma, que chamamos a forma-
soma de A e B.
Demonstração. Sem perda de generalidade, consideramos apenas o caso q A (x, x) " 0. Uma
estimativa direta usando (4.9.8) mostra que
q A (x, x) + q B (x, x) " (1 − a) q A (x, x) − b ∥x∥2 " −b ∥x∥2 ,
27
Veja também J.T. Cannon, “Quantum Field Theoretic Properties of a Model of Nelson: Domain and Eigenvector
Stability for Perturbed Linear Operators,” J. Func. Anal 8 (1971) 101.
246
ou seja, q A + q B é limitada inferiormente por −b. Além disso, por (4.9.7) e (4.9.8), temos
∥|x|∥2qA +qB = q A (x, x) + q B (x, x) + (1 + b)∥x∥2
# (1 + a) q A (x, x) + (1 + 2b)∥x∥2
= (1 + a) q A (x, x) + (1 + a) ∥x∥2 + (2b − a) ∥x∥2
= (1 + a) ∥|x|∥2qA + (2b − a) ∥x∥2
# (1 + 2b) ∥|x|∥2qA ,
∥|x|∥2qA = q A (x, x) + ∥x∥2
1 . /
# q A (x, x) + q B (x, x) + b ∥x∥2 + ∥x∥2
1−a
1 . /
= q A (x, x) + q B (x, x) + (1 + b) ∥x∥2 − ∥x∥2 + ∥x∥2
1−a
1 a
= ∥|x|∥2qA +qB − ∥x∥2
1−a 1−a
# ∥|x|∥2qA +qB .
Portanto, as normas ∥| · |∥qA e ∥| · |∥qA +qB são equivalentes. Logo, q A + q B é fechada e o

resultado segue do Teorema 4.34.
247
Capítulo 5
Análise Espectral em Espaços de Hilbert
“Se as pessoas não acreditam que a matemática é simples, é só porque elas não percebem o quão complicado é a
vida.”
J. von Neumann
Na teoria dos operadores lineares e suas aplicações, um papel central é desempenhado

pela noção do “espectro” de um operador. O principal objetivo deste capítulo é o estudo
das propriedades mais elementares da teoria espectral dos operadores lineares em espaços
de Hilbert. O nome teoria espectral foi introduzido por David Hilbert, quando este provou o
teorema da decomposição espectral para operadores auto-adjuntos limitados em sua formulação
original da teoria do espaço que leva seu nome, moldando-o em termos de formas quadráticas
de infinitas variáveis. Em certo sentido, a história do teorema espectral começou com o
problema de encontrar os eixos principais de um elipsóide em um cenário infinito-dimensional;
na linguagem moderna, seria o problema relacionado à diagonalização de matrizes simétricas
de dimensão infinita. A extensão do teorema espectral para operadores auto-adjuntos ilimitados
foi realizada no final dos anos vinte independentemente por J. von Neumann e M.H. Stone. Essa
extensão foi motivada pela então nova teoria quântica. A descoberta que na teoria quântica o
teorema espectral poderia explicar características de espectros atômicos foi, portanto, fortuita.
O próprio Hilbert ficou surpreso com a aplicação inesperada dessa teoria, observando que “eu
desenvolvi minha teoria de infinitas variáveis a partir de interesses puramente matemáticos, e até
a chamei de ‘análise espectral’ sem qualquer pressentimento de que ela iria mais tarde encontrar
aplicação no espectro real da física.”
249
5.1 Um Prelúdio Matricial

Começamos com uma breve revisão do caso de dimensão finita. Seja A um operador linear
atuando no espaço de Hilbert H = Cn , cuja representação em termos de uma base escolhida
x1 , . . . , xn é a matriz A que mapeia Cn no subespaço linear Ran(A) de Cn composto de
todos os vetores da forma
y = Ax .
O elemento zero é deixado invariante por A. Existem outros elementos invariantes? Via de
regra não, mas se exigirmos apenas que
Ax = λx . (5.1.1)
para alguma constante λ e algum vetor x com ∥x∥ = 1, então, surge uma situação mais
favorável e interessante. Vamos escrever a Eq.(5.1.1) da seguinte forma:
(A − λ1I)x = 0 . (5.1.2)
Assim, escrita dessa forma, descobrimos que a matriz A − λ1I deve “aniquilar” um vetor x
diferente de zero e isso pode acontecer se a matriz for singular. Agora, se A − λ1I é singular,
então, seu determinante é zero,
def.
∆(λ) = det (A − λ1I) = 0 ,
ou, em mais detalhes,

5 5
5a11 − λ a12 ··· a1n 55
5
5 5
5 a21 a − λ · · · a 5
5 12 2n 5
5
∆(λ) = 5 5=0. (5.1.3)
. . . . 5
5 .. .. .. .. 5
5 5
5 5
5 an1 an2 · · · ann − λ5
A expansão fornece uma equação algébrica em λ de grau n que tem um número total de n
raízes complexas. Suponha; que existam p raízes distintas
_p λ1 , λ2 , . . .k,j λp e que a multiplicidade
p
de λj é kj . Aqui, p # n, j=1 kj = n e ∆(λ) = j=1 (λ − λj ) . Segue-se que o número
λ em (5.1.1) deve ser uma das raízes λj . A Eq.(5.1.3) é conhecida como a equação característica
da matriz A. Observe que estamos tratando com matrizes e vetores sobre Cn . Sobre Rn e
para n par (5.1.3) pode não ter nenhuma raiz. As raízes são conhecidas por vários nomes:
raízes características, valores característicos e auto-valores são os mais comuns. Adotaremos
este útimo. O conjunto de raízes para o qual (5.1.2) tem uma solução não-trivial é chamado de
espectro de A e será denotado por σ(A).
Se λ tem um valor distinto de todas as raízes, então, A − λ1I é regular, ou seja, tem um
inverso e definimos
Rλ (A) = (A − λ1I)−1 ,
250
conhecido como o resolvente de A. Sabemos como formar o inverso de uma matriz regular.
Aplicado ao presente caso, isso dá como o elemento do resolvente no local (j, k)
Akj (λ)
rjk (λ) =
∆(λ)
em que Ajk (λ) é o cofator de ajk − λδjk no determinante ∆(λ). Assim, Akj (λ) é um
polinômio em λ com coeficientes complexos e de grau # n − 1. Segue-se que rjk (λ) é uma
função racional de λ com pólos incluídos no conjunto de zeros de ∆(λ) e rjk (λ) → 0 quando
λ → ∞. Portanto,
P(A; λ)
Rλ (A) = ,
∆(λ)
em que P(A; λ) é um polinômio em λ de grau # n − 1 cujos coeficientes são matrizes
constantes.
PROPOSIÇÃO 5.1. Para valores grandes de |λ|
Rλ (A) = λ−1 1I + λ−2 A + . . . + λ−k−1Ak + . . . .
Em particular, a série converge e a expansão acima é válida para |λ| > ∥A∥.
Demonstração. Primeiro, vamos considerar o espaço vetorial Mn de n2 dimensões sobre o corpo

dos complexos, com as operações de adição e a multiplicação por um escalar, respectivamente,
definidas da seguinte forma:
A + B = ajk + bjk e αA = αajk .
A seguir, vamos equipar Mn com a métrica definindo
R
S<
S n < n
∥A∥2 = T |ajk | . (5.1.4)
j=1 k=1
Essa norma é conhecida como a norma Frobenius-Wedderhurn [G. Frobenius (1849-1917) e J. H.

Maclagan Wedderburn (1882-1948)]. A norma (5.1.4) tem a desvantagem de atribuir a norma n à
matriz unitária. Uma vez que isto é indesejável, podemos usar em seu lugar
n
<
∥A∥1 = max |ajk | , (5.1.5)
j
k=1
que dá ∥1I∥ = 1. Vamos usar essas normas para mostrar que a norma do produto de duas
matrizes é no máximo igual ao produto das normas. Com efeito, usando a norma ∥ · ∥1 , segue
que
5 5
<n 5< n 5 <n n
<
5 5
∥AB∥1 = max 5 a b
jm mk 5 # max |a jm | |bmk |
j 5 5 j
k=1 k=m k=1 k=m
n
<
# max |ajm |∥B∥1
j
k=1
= ∥A∥1 ∥B∥1 .
251
Logo, temos ∥Ak ∥ # ∥A∥k (este resultado é válido tanto para a norma (5.1.5) bem como para a
norma (5.1.4)). Isso prova a afirmação sobre a convergência da série para |λ| > ∥A∥. Para tais
valores, podemos multiplicar a série convergente a esquerda ou a direita por A − λ1I e reunir
os termos. Todos eles se cancelam, exceto o termo constante, que é 1I, como deveria ser.
Deve-se ressaltar que o lema não afirma que o raio de convergência da série é ∥A∥, uma
expressão que tem pelo menos dois significados diferentes. Na verdade, a série converge para
|λ| > maxj |λj |, e este é sempre o raio exato de convergência (consulte o livro de Einar Hille,
“Methods in Classical and Functional Analysis,” Addison-Wesley, 1972).
A seguir, vamos estender a apresentação acima para o caso de um operador linear atuando
sobre um espaço de Hilbert qualquer.
5.2 O Espectro de um Operador

Dado um operador linear A sobre um espaço de Hilbert H , um dos problemas fundamentais
na mecânica quântica é determinar todos os elementos x ∈ H que permanecem invariantes,
ou que no mínimo não mudam de direção, sob a ação de A, isto é, que satisfazem a relação
Ax = λx , ∀ x ∈ Dom(A) , (5.2.1)
em que λ é um escalar. Cada um destes elementos são chamados auto-vetores de A e os

correspondentes escalares λ os auto-valores.1 Em um espaço de Hilbert de dimensão finita a
noção de auto-valores (juntamente com a noção de auto-vetores), culmina com os conhecidos
teoremas de diagonalização. Neste caso, o conjunto de elementos x soluções da Eq.(5.2.1) que
correspondem ao mesmo auto-valor λ formam um conjunto linear, e se A é limitado (portanto,
contínuo) este conjunto forma um subespaço de H . A multiplicidade de um auto-valor define a
dimensão do correspondente subespaço característico.2 Em particular, diz-se que o auto-valor é
simples se os correpondentes auto-vetores são múltiplos numéricos de um dos auto-vetores. No
caso de A ser um operador ilimitado em um espaço de Hilbert de dimensão infinita a solução
Eq.(5.2.1) vai depender fortemente do domínio e da definição precisa do operador A. Além
disso, a noção de auto-valor tem de ser substituída por uma noção mais abrangente, o espectro
do operador. Este espectro tem uma estrutura mais complicada do que apenas ser a lista de
auto-valores do operador, mas é ainda a noção fundamental para o estudo dos operadores e da
sua “diagonalização.”
5.2.1 Operador Resolvente e o Espectro
O formalismo resolvente é uma técnica que aplica conceitos de análise complexa no estudo
do espectro de operadores em espaços de Hilbert e em espaços mais gerais. O resolvente
captura as propriedades espectrais de um operador com base na estrutura analítica do funci-
onal. Especificamente, dados um operador linear A em um espaço de Hilbert complexo e um
parâmetro complexo λ, escrevendo
(A − λ1I)x = y ,
1
Um termo antigo denomina x de vetor-característico e λ de valor-característico.
2
Veja a definição de multiplicidade de um auto-valor no rodapé da pg.276.
252
um valor de λ será chamado regular se (A − λ1I)−1 existir. Neste caso, chamamos (A − λ1I)−1
o operador resolvente de A em λ. Os valores não-regulares de λ são chamados singulares. O
conjunto de singularidades do operador resolvente foi chamado de “espectro” por Hilbert, porque
ele viu uma semelhança entre os valores singulares discretos e as linhas espectrais atômicas. A
seguir, vamos introduzir algumas propriedades do operador resolvente e suas relações com o
espectro de um operador auto-adjunto em um espaço de Hilbert.
Dado um ponto λ ∈ C, em geral não é fácil decidir quando o operador (A − λ1I) tem um
inverso. O conceito auxiliar de um ponto regular é uma boa ajuda.
DEFINIÇÃO 5.1. Seja A um operador linear em um espaço de Hilbert complexo H com domínio
Dom(A). O conjunto de pontos regulares de A é o conjunto
3 4
ρr (A) = λ ∈ C | ∃ C(λ) tal que ∥(A − λ1I)x∥ " C(λ)∥x∥, ∀ x ∈ Dom(A) . (5.2.2)
PROPOSIÇÃO 5.2. Seja A um operador linear em um espaço de Hilbert complexo H e λ ∈ C.

Então, λ ∈ ρr (A) se, e somente se, (A − λ1I) tiver um inverso limitado (A − λ1I)−1 definido em
Ran(A − λ1I). Neste caso, a desigualdade em (5.2.2) acontece com C(λ) = ∥(A − λ1I)−1 ∥−1 .
Demonstração. Inicialmente, suponha que λ ∈ ρr (A). Então, Ker(A − λ1I) = {0} por (5.2.2),
uma vez que (A − λ1I)x = 0 implica que x = 0. Logo, pelo Lema 4.1, o inverso (A − λ1I)−1
existe. Seja y ∈ Dom(A − λ1I)−1 = Ran(A − λ1I). Então, temos y = (A − λ1I)x para
algum x ∈ Dom(A) e, portanto,
∥(A − λ1I)−1 y∥ = ∥x∥ # C −1 (λ)∥(A − λ1I)x∥ = C −1 (λ)∥y∥ ,
por (5.2.2), isto é, (A − λ1I)−1 é limitado e ∥(A − λ1I)−1 ∥ # C −1 (λ). A seguir, suponha que
(A − λ1I) tem um inverso limitado. Então, com x e y como definidos acima, segue que
∥x∥ = ∥(A − λ1I)−1 y∥ # ∥(A − λ1I)−1 ∥∥y∥ = ∥(A − λ1I)−1 ∥∥(A − λ1I)x∥ .
Assim, a desigualdade em (5.2.2) acontece com C(λ) = ∥(A − λ1I)−1 ∥−1 .

DEFINIÇÃO 5.2. Seja H ̸= {0} um espaço de Hilbert complexo e A : Dom(A) ⊂ H → H
um operador linear com domínio denso, com seu conjunto imagem denotado por Ran(A) =
ADom(A). Considere o seguinte operador A − λ1I associado ao operador A. Então,
1. o espectro de A no espaço de Hilbert H é o subconjunto de C

! "
σ(A) = λ ∈ C | A − λ1I não tem inverso .
2. se o operador A − λ1I tem um inverso o chamamos operador resolvente de A em λ,

def.
denotado-o por Rλ (A) = (A − λ1I)−1 . O conjunto resolvente de A é o conjunto ρ(A) de
elementos λ ∈ C tal que:
(i) (A − λ1I) : Dom(A) → H é injetivo, isto é, se (A − λ1I)x1 = (A − λ1I)x2 implica
que x1 = x2 , ou que (A − λ1I)x = 0 implica que x = 0, ou seja, 0 não é um auto-valor
A;
253
(ii) Rλ (A) : Ran(A − λ1I) → Dom(A) é limitado;

(iii) Dom(A − λ1I)−1 = Ran(A − λ1I) é denso em toda parte em H . Em outras
palavras, Ran(A − λ1I) = H . Isto significa que o conjunto Ran(A − λ1I) é denso em
H , mas não é todo H .
Nota 5.1. Das Definições 5.1 e 5.2 fica óbvia a relação entre pontos regulares e pontos do
conjunto resolvente: ρ(A) ⊆ ρr (A). Com efeito, se λ ∈ ρ(A), então o resolvente é um
operador linear limitado Rλ (A) : H → Dom(A) tal que x = Rλ (A)(A − λ1I)x para todo
x ∈ Dom(A); portanto ∥x∥ # ∥Rλ (A)∥∥(A − λ1I)x∥ para todo x ∈ Dom(A). Para um
. /−1
ε > 0 arbitrário defina C(λ) = ∥Rλ (A)∥ + ε . Com esta escolha de C(λ) segue que
λ ∈ ρr (A). Em síntese, o conjunto resolvente não faz parte do espectro de A e, portanto, o
conjunto resolvente compõe o conjunto de pontos regulares.
Nota 5.2. De acordo com da Definição 5.2, a correspondência entre os conjuntos Dom(A) e
Ran(A − λ1I), determinada pelo operador (A − λ1I), é um-para-um se, e somente, λ não
é um auto-valor do operador A. Com efeito, se o operador (A − λ1I) não é injetivo, então
existem elementos x1 , x2 ∈ Dom(A) tais que x1 ̸= x2 , (A − λ1I)x1 = y e (A − λ1I)x2 = y.
Logo, (A − λ1I)x = 0, em que x = x1 − x2 ̸= 0, de maneira que λ é um auto-valor do
operador A. Reciprocamente, a equação (A − λ1I)x = 0 tem solução se x ≡ 0, ou se dado
dois elementos x1 , x2 ∈ Dom(A), com x1 ̸= x2 , nós temos que x = x1 − x2 = 0. Neste
último caso, (A − λ1I)x1 = (A − λ1I)x2 , ou seja, (A − λ1I) não seria injetivo e, portanto, não
teria um inverso. Assim, se λ não é um auto-valor do operador A, então, (A − λ1I)−1 y = 0 se,
e somente se, y = 0 (veja o Lema 4.1).
PROPOSIÇÃO 5.3. Seja A um operador auto-adjunto, não necessariamente limitado, em um
espaço de Hilbert complexo H . Logo, (i) para todo x ∈ Dom(A), a quantidade ⟨x, Ax⟩ é
real. Em geral, se os vetores x, Ax, . . . , Am−1 x ∈ Dom(A), então ⟨x, Am x⟩ é real. (ii) Se
x ∈ Dom(A) é um auto-vetor de A, isto é, Ax = λx, então λ ∈ R.
Demonstração. (i) Com efeito, se x1 , x2 ∈ Dom(A), então, como A é auto-adjunto, ele é

simétrico; logo,
⟨x1 , Ax2 ⟩ = ⟨Ax1 , x2 ⟩ = ⟨x1 , Ax2 ⟩ .
Portanto, tomando x1 = x2 = x, temos que
⟨x, Ax⟩ = ⟨Ax, x⟩ = ⟨x, Ax⟩ ⇒ ⟨x, Ax⟩ é real para todo x ∈ Dom(A) .
Da mesma forma, se x, Ax, . . . , Am−1 x ∈ Dom(A), podemos usar a simetria de A repetida-

mente para mostrar que
⟨x, Am x⟩ = ⟨x, A(Am−1 x)⟩ = ⟨A(Am−1 x), x⟩ = ⟨Am x, x⟩ = ⟨x, Am x⟩ ,
isto implica que ⟨x, Am x⟩ é real para todo Am−1 x ∈ Dom(A).
(ii) Se x é um auto-vetor de A com auto-valor λ, então
λ⟨x, x⟩ = ⟨x, Ax⟩ = ⟨Ax, x⟩ = λ⟨x, x⟩ .
Como x é assumido como sendo não-nulo, isso implica que λ = λ.
254
PROPOSIÇÃO 5.4. Seja A um operador auto-adjunto em um espaço de Hilbert complexo H .

Então, o número λ é um auto-valor de A se, e somente se, o fecho do conjunto Ran(A − λ1I)
não igual a H , isto é, se Ran(A − λ1I) ̸= H .
Demonstração. Se λ é um auto-valor de A, então, Ax = λx, com x ̸= 0. Portanto, para todo

y ∈ Dom(A), segue que
⟨x, (A − λ1I)y⟩ = ⟨(A − λ1I)x, y⟩ = 0 .
Mas, isto implica que x ⊥ Ran(A − λ1I). Porém, como x ̸= 0, pela Proposição 3.14 isto é
possível somente se Ran(A − λ1I) ̸= H .
Reciprocamente, assuma que Ran(A − λ1I) ̸= H . Então, existe um vetor não-nulo x que
é ortogonal ao conjunto Ran(A − λ1I). Assim, para todo y ∈ Dom(A)
⟨x, (A − λ1I)y⟩ = 0 .
Pelo Teorema 4.18, segue que x ∈ Ker(A∗ − λ1I); ou seja, (A∗ − λ1I)x = 0, ou A∗ x = λx. No
entanto, A∗ = A, de forma que Ax = λx, isto é, λ é um auto-valor do operador A. Mas, pela
Proposição 5.3, λ = λ. Isto finaliza a prova da proposição.
A seguir, vamos colecionar algumas propriedades importantes sobre o operador resolvente,

que serão muito úteis para o estudo de equações de operadores.
PROPOSIÇÃO 5.5. Sejam A e B um operadores auto-adjuntos em um espaço de Hilbert complexo

H . Então, as seguintes identidades operatoriais acontecem:
• Primeira Identidade do Resolvente: para λ, µ ∈ ρ(A) segue que
Rλ (A) − Rµ (A) = (λ − µ)Rλ (A)Rµ (A) ;
• Segunda Identidade do Resolvente: para λ ∈ ρ(A) ∩ ρ(B) e Dom(B) ⊂ Dom(A)

segue que
Rλ (A) − Rλ (B) = Rλ (A)(B − A)Rλ (B) .
Demonstração. A primeira identidade do resolvente (também chamada de relação de Hilbert)

segue observando que se λ, µ ∈ ρ(A) e x ∈ H , temos Rλ (A)x, Rµ (A)x ∈ Dom(A) e
Rλ (A)x − Rµ (A)x = Rλ (A)1Ix − 1IRµ (A)x
= Rλ (A)(A − µ1I)Rµ (A)x − Rλ (A)(A − λ1I)Rµ (A)x

8 9
= Rλ (A) (A − µ1I) − (A − λ1I) Rµ (A)x
= (λ − µ)Rλ (A)Rµ (A)x ,
o que prova a primeira identidade.
255
Já a segunda identidade é obtida observando que se λ ∈ ρ(A) ∩ ρ(B) e x ∈ H , temos

Rλ (B)x ∈ Dom(B) ⊂ Dom(A) e
8 9
Rλ (A)(B − A)Rλ (B)x = Rλ (A) (B − λ1I) − (A − λ1I) Rλ (B)x
= Rλ (A)x − Rλ (B)x ,
o que prova a segunda identidade.
Observe que, na primeira identidade do resolvente µ e λ são variáveis essenciais, enquanto

o operador A desempenha papel secundário. Já na segunda identidade, as coisas se invertem:
agora os operadores A e B são essenciais, enquanto λ é secundário.
COROLÁRIO 5.1. Rλ (A)Rµ (A) = Rµ (A)Rλ (A).
Demonstração. A comutatividade entre Rλ (A) e Rµ (A) segue imediatamente da primeira iden-

tidade do resolvente trocando-se λ por µ e somando as duas expressões.
PROPOSIÇÃO 5.6. Sejam A um operador auto-adjunto em um espaço de Hilbert complexo H e

λ ∈ C. Então, (A − λ1I) é invertível para todo λ se Im λ ̸= 0, e o resolvente Rλ (A) satisfaz a
estimativa
1
∥Rλ (A)∥ # .
|Im λ|
Demonstração. Para x ∈ Dom(A), assuma que Ran(A − λ1I) ∋ y = (A − λ1I)x e que

λ = µ + iν, com µ, ν ∈ R, com ν ̸= 0. Logo, o número λ não pode ser um auto-valor do
operador A. Como todo operador auto-adjunto também é simétrico, segue que
∥(A − λ1I)x∥2 = ⟨(A − λ1I)x, (A − λ1I)x⟩
= ∥⟨(A − µ1I)x∥2 + ⟨(A − µ1I)x, iνx⟩ + ⟨iνx, (A − µ1I)x⟩ + ∥νx∥2
= ∥⟨(A − µ1I)x∥2 + iν⟨(A − µ1I)x, x⟩ − iν⟨x, (A − µ1I)x⟩ + |ν|2 ∥x∥2
= ∥⟨(A − µ1I)x∥2 + |ν|2 ∥x∥2 .
Portanto, ∥(A − λ1I)x∥ " |Im λ|∥x∥. Por outro lado, sendo A auto-adjunto, de acordo com
o Corolário 4.5, temos que Ran(A − λ1I) = H e Ran(A − λ1I)⊥ = {0}. Logo, pelo
Lema 4.1, (A − λ1I) tem um inverso (veja também a Nota 5.2). Assim, podemos assumir que
x = (A − λ1I)−1 y. Dessa forma, a desigualdade ∥(A − λ1I)x∥ " |Im λ|∥x∥ implica que
|Im λ|∥(A − λ1I)−1 y∥ # ∥y∥. Visto que esta relação é válida para todo y ∈ Ran(A − λ1I), o
operador Ran(A − λ1I)−1 é limitado e definido em todo espaço H , ou seja,
1
∥(A − λ1I)−1 ∥ # , ∀λ ∈ C \ R .
|Im λ|
Isto prova a proposição.
256
TEOREMA 5.1. Seja A um operador auto-adjunto, não necessariamente limitado, em um espaço

de Hilbert complexo H . Então, o conjunto resolvente ρ(A) é um subconjunto aberto de C.
Demonstração. De acordo com o Lema 1.2, Capítulo 1, o conjunto ρ(A) é aberto se, e somente se,
todo λ0 ∈ ρ(A) é centro de um disco aberto D(λ0 ; |Im λ0 |), com ε > 0 arbitrário, inteiramente
contido em ρ(A). Para isso, tome um λ ∈ C tal que |λ − λ0 | < ε, com ε < |Im λ0 |. Agora,
suponha que x ∈ Dom(A). Então,
. / . /
(A − λ1I)x = A − λ1I + λ0 1I − λ0 1I x = (A − λ0 1I)x − λ − λ0 1Ix .
Portanto, 5 5
∥(A − λ1I)x∥ " ∥(A − λ0 1I)x∥ − 5λ − λ0 5∥x∥ .
Como λ0 ∈ ρ(A), segue que A − λ0 1I tem inverso e
1
∥x∥ = ∥(A − λ0 1I)−1 (A − λ0 1I)x∥ # ∥(A − λ0 1I)x∥ ,
|Im λ0 |
de acordo com a Proposição 5.6. Consequentemente,
. 5 5/
∥(A − λ1I)x∥ " |Im λ0 | 1 − |Im λ0 |−1 5λ − λ0 5 ∥x∥ .
Esta última desigualdade nos mostra que x = 0 se (A − λ1I)x = 0. Logo, pelo Lema 4.1,
. / . /−1
A − λ1I tem um inverso. Assim, se escrevemos y = A − λ1I x, ou x = A − λ1I y, temos
que
. 5 5/−1
∥(A − λ1I)−1 y∥ # |Im λ0 |−1 1 − |Im λ0 |−1 5λ − λ0 5 ∥y∥ .
Isto mostra que (A − λ1I)−1 é limitado, uma vez que |λ − λ0 ||Im λ0 |−1 < 1. Logo, se
λ ∈ D(λ0 ; ε), com ε < |Im λ0 |, isto implica que λ ∈ ρ(A). Assim, ρ(A) é aberto.
COROLÁRIO 5.2. Seja A um operador auto-adjunto, não necessariamente limitado, em um
espaço de Hilbert complexo H . Então, o conjunto σ(A) é um subconjunto fechado de C.
COROLÁRIO 5.3. A norma de Rλ (A) é uma função contínua de λ em todo ponto regular λ0 .
Demonstração. Segue, da Proposição 5.6, que

. 5 5/−1 . 5 5/−1
∥Rλ0 (A)∥ 1 − ∥Rλ0 (A)∥5λ − λ0 5 # |Im λ0 |−1 1 − |Im λ0 |−1 5λ − λ0 5 ,
então,
. 5 5/−1
∥Rλ (A)∥ # ∥Rλ0 (A)∥ 1 − ∥Rλ0 (A)∥5λ − λ0 5 .
Logo,
5 5 5. 5 5/ 5
5∥Rλ (A)∥ − ∥Rλ0 (A)∥5 # ∥Rλ0 (A)∥ 55 1 − ∥Rλ0 (A)∥5λ − λ0 5 −1 − 155
5 5 . 5 5/−1
= 5λ − λ0 5∥Rλ0 (A)∥2 1 − ∥Rλ0 (A)∥5λ − λ0 5 .
Portanto, ∥Rλ (A)∥ → ∥Rλ0 (A)∥, quando λ → λ0 .
257
A seguir, usaremos a noção de funções analíticas definidas em subconjuntos abertos de

C tomando valores em um espaço de Hilbert complexo. A teoria das funções analíticas nos
espaços de Hilbert funciona, essencialmente, da mesma forma como a teoria para as funções
holomorfas no espaço C (que assumimos como conhecida), a única diferença é que a norma de
Hilbert substitui o módulo dos números complexos.3 Com esta condição, definições, teoremas e
provas são as mesmas que no caso das funções holomorfas
TEOREMA 5.2. Seja A um operador auto-adjunto, não necessariamente limitado, em um espaço
de Hilbert complexo H . Então, o mapeamento ρ(A) ∋ λ 3→ Rλ (A) é uma função analítica.
Demonstração. Tome λ0 em ρ(A) e um λ ∈ C tal que |λ − λ0 | < |Im λ0 |. Suponha que

x ∈ Dom(A). Então,
. /
(A − λ1I)x = A − λ1I + λ0 1I − λ0 1I x
! 8 9"
= (A − λ0 1I) 1I − (A − λ0 1I)−1 (λ − λ0 ) x .
Ignorando por um momento qualquer questão relativa à convergência, assuma que
8 9−1
(A − λ1I)−1 = 1I − (A − λ0 1I)−1 (λ − λ0 ) (A − λ0 1I)−1 .
8 9−1
Então, usando a série de Neumann para o operador 1I − (A − λ0 1I)−1 (λ − λ0 ) (veja o
Teorema 4.8 e a Nota 4.13), obtemos que
(∞ )
<
−1 n −n
(A − λ1I) = (λ − λ0 ) (A − λ0 1I) (A − λ0 1I)−1
n=0
∞
<
= (λ − λ0 )n (A − λ0 1I)−n−1 ,
n=0
ou seja,
∞
<
Rλ (A) = (λ − λ0 )n Rλn+1
0
(A) . (5.2.3)
n=0
Pode-se facilmente verificar que a expansão acima é convergente absolutamente segunda a

norma do operador, e por isso temos a analiticidade em λ0 ∈ ρ(A). De fato,
∞
< ∞
< ∞
<
|λ − λ0 |n ∥Rλn+1
0
(A)∥ # |λ − λ0 |n ∥Rλ0 (A)∥n+1 # |λ − λ0 |n |Im λ0 |−(n+1) .
n=0 n=0 n=0
3
Com efeito, temos a seguinte
DEFINIÇÃO 5.3. Seja (H , ∥ · ∥) um espaço de Hilbert sobre C e Ω ⊂ C um conjunto aberto não vazio. Uma
função f : Ω → H é chamada analítica se para qualquer z0 ∈ Ω existe ε > 0 tal que
∞
<
f (z) = an (z − z0 )n , para todo z ∈ B(z0 ; ε) ,
n=0
em que B(z0 ; ε) é uma bola aberta de centro z0 e raio ε contida em Ω, an ∈ H para qualquer n ∈ N e a série
converge segundo a norma ∥ · ∥.
258
;
A última série converge porque |λ − λ0 ||Im λ0 |−1 < 1. Consequentemente, a série ∞
n=0 |λ −
λ0 |n ∥Rλ0 (A)∥n+1 também converge. Assim, Rλ (A) tem uma expansão em série de potências,
isto é, Rλ (A) é uma função analítica na vizinhança de qualquer λ0 ∈ ρ(A). Isto conclui a
prova.
Nota 5.3. De acordo com o teorema acima, como Rλ (A) é holomorfa em λ, então,
dn Rλ (A)
= n! Rλn+1 (A) n = 1, 2, 3, . . . . (5.2.4)
dλn 0
Nota 5.4. Observe que nos Teoremas 5.1 e 5.2 assumimos que A é um operador auto-adjunto
em um espaço de Hilbert complexo. Se tivéssemos assumido que A é um operador em um
espaço de Hilbert complexo, não necessariamente auto-adjunto, as provas dos dois teoremas
seriam as mesmas, bastando para isto assumir que |λ − λ0 |∥Rλ0 (A)∥ < 1. Isto significa que,
se λ0 ∈ ρ(A) e |λ − λ0 |∥Rλ0 (A)∥ < 1, então, λ ∈ ρ(A). Por outro lado, se λ ∈ σ(A)
necessariamente |λ − λ0 |∥Rλ0 (A)∥ " 1, isto é,
1
∥Rλ0 (A)∥ " , ∀ λ ∈ σ(A) .
|λ − λ0 |
Isto prova a seguinte
PROPOSIÇÃO 5.7 (Resolvente e distância do espectro). Seja A um operador auto-adjunto. Se

λ ∈ ρ(A), então
1
∥Rλ (A)∥ " .
d(λ, σ(A))
. /
em que d λ, σ(A) = inf µ∈σ(A) |λ − µ|.4
Usando a Segunda Identidade do Resolvente, inferimos que se λ ∈ ρ(A)∩ρ(B), C = B −A

e Dom(B) ⊂ Dom(A), imediatamente temos
Rλ (B) = Rλ (A) − Rλ (A)CRλ (B) ,
sempre que Im λ ̸= 0. Após n iterações sucessivas da relação acima, obtemos

n
<
Rλ (B) = Rλ (A) (−1)k (CRλ (A))k + Rn , (5.2.5)
k=0
com o resto Rn dado por
Rn = (−1)k+1 (Rλ (A)C)k+1Rλ (B) .
Se o resto acima converge para zero, em algum sentido, quando n → ∞, então (5.2.5) nos
fornece um meio de calcular Rλ (B) quando Rλ (A) é conhecido:
Rλ (B) = Rλ (A) − Rλ (A)CRλ (A) + Rλ (A)CRλ (A)CRλ (A) ± · · · .

4
Note que, “min” poderia ter sido escrito no lugar de “inf,” porque o espectro σ(A) é fechado no plano
complexo, de acordo com o Corolário 5.2.
259
Sabemos que, de acordo com a Nota 4.13, o resto acima convergirá para zero se ∥CRλ (A)∥ < 1,
quando n → ∞. Em outras palavras, o operador 1I + CRλ (A) admite um inverso, pela série
de Neumann, quando ∥CRλ (A)∥ < 1. Neste caso, segue que
∞
<
Rλ (B) = Rλ (A) (−1)k (CRλ (A))k = Rλ (A)(1I + CRλ (A))−1 .
k=0
Em resumo, isto prova a seguinte

PROPOSIÇÃO 5.8. Suponha que A e B sejam dois operadores, não necessariamente auto-
adjuntos, com Dom(B) ⊂ Dom(A) e que o número complexo λ pertence ao conjunto re-
solvente de A. Se ∥CRλ (A)∥ < 1, em que C = B − A, então λ pertence também ao conjunto
resolvente de B e
Rλ (B) = Rλ (A)(1I + CRλ (A))−1 .
5.2.2 Decomposição do Espectro
A decomposição espectral reformula um operador em termos de seus auto-valores e auto-

vetores. Essa representação é extremamente útil. Se levarmos em conta a Definição 5.2, o
Teorema 5.1 e o Corolário 5.2, imediatamente obtemos
σ(A) ∪ ρ(A) = C e σ(A) ∩ ρ(A) = ∅ .
Por sua vez, de acordo também com a Definição 5.2, o espectro de A pode ser classificado da
seguinte forma:
• σpont (A) (espectro pontual): λ ∈ σpont (A) se (A−λ1I) não é injetivo, isto é, (A−λ1I)−1
não existe. Assim, (A − λ1I)x = 0 tem solução não-trivial; λ é então chamado um auto-
valor de A e x um auto-vetor.
• σcont (A) (espectro contínuo): λ ∈ σcont (A) se (A − λ1I) é injetivo e Ran(A − λ1I) =
H , mas (A − λ1I)−1 não é limitado.
• σres (A) (espectro residual): λ ∈ σres (A) se (A−λ1I) é injetivo e Ran(A − λ1I) ̸= H ,
isto é, (A − λ1I)−1 existe, mas Dom(A − λ1I)−1 = Ran(A − λ1I) não é denso em
toda parte em H , isto é, o fecho de Ran(A − λ1I) é um subconjunto próprio de H .
A última afirmação implica que existe pelo menos um vetor x em H e uma vizinhança-ε
de x, denotada por Vε , tal que (A − λ1I)y nunca está em Vε .
Além disso, os conjuntos σpont (A), σcont (A) e σres (A) são mutuamente disjuntos e
σ(A) = σpont (A) ∪ σcont (A) ∪ σres (A) .
Pode-se mostrar que para uma ampla classe de operadores (incluindo aqueles de interesse
na mecânica quântica) o conjunto σres (A) é vazio. Por exemplo, na mecânica quântica o
hamiltoniano, H, é um operador auto-adjunto ilimitado sobre um espaço de Hilbert com o
conjunto σres (H) = ∅. Por outro lado o conjunto σpont (H) corresponde aos níveis de energia
dos estados ligados do sistema descrito por H, enquanto que o conjunto σcont (H) desempenha
um papel importante na teoria de espalhamento do sistema.
260
Exemplo 5.1. Se H = Cn , então qualquer operador auto-adjunto A é limitado e representado

por uma matriz hermitiana, com os elementos denotados por aij . Quando procuramos pelos
auto-vetores e pelos correspondentes auto-valores de A, tal que Ax = λx, sabemos que os auto-
valores serão reais e que podemos encontrar uma base ortonormal de auto-vetores associados
com os esses auto-valores. Os auto-valores de A são obtidos como as raízes da equação
algébrica, chamada equação característica (ou secular) da matriz A (veja Seção 5.1):
det(aij − λδij ) = 0 .
Neste caso, σ(A) = σpont (A), isto é, σcont (A) = σres (A) = ∅!
A possibilidade de um operador ter um espectro contínuo ou residual é uma característica

da teoria dos operadores em espaços de dimensão infinita, distinguindo-o do caso de dimensão
finita, como mostrado no exemplo acima. Além disso, o espectro de um operador em um
espaço de dimensão infinita pode depender drasticamente da topologia associada ao domínio
atribuído a ele. Isso é ilustrado pelo próximo
Exemplo 5.2 (Operador multiplicação no espaço C[0, 1]). Considere X = C[0, 1], o espaço
de todas as funções contínuas no intervalo 0 # x # 1. Este é um espaço vetorial, uma vez que
a soma das funções contínuas é contínua, e qualquer múltiplo escalar de uma função contínua
é uma função contínua.
Na teoria dos operadores, um operador multiplicação é um operador Aµ definido em algum

espaço vetorial de funções e cujo valor em uma função ϕ é dado pela multiplicação por uma
função fixa µ. No caso em questão, uma função µ ∈ C[0, 1], fixa no intervalo [0, 1], induz um
operador multiplicação Aµ : C[0, 1] → C[0, 1] definido por
Aµ ϕ(x) = µ(x)ϕ(x) .
Tome λ ∈ C; então, o operador (Aµ − λ1I) definido por
(Aµ − λ1I)ϕ(x) = (µ(x) − λ)ϕ(x) ,
é injetivo se, e somente se, para toda função ϕ ∈ C[0, 1] temos que (µ(x) − λ)ϕ(x) = 0. Isto
implica que ϕ(x) = 0 se, e somente se, (µ(x) − λ) ̸= 0. Portanto,
! "
σpont (Aµ ) = λ ∈ C | µ(x) = λ ,
isto é, o espectro pontual de Aµ consiste de todo λ tal que a diferença µ(x) − λ é zero
para algum x ∈ [0, 1]. Assim, o espectro pontual é o conjunto imagem da função µ(x). Se
λ ∈ C \ σpont (Aµ ), então, Aµ − λ1I tem um operador inverso, que agora determinamos:
, -
1
(Aµ − λ1I)ϕ(x) = Ψ(x) ⇐⇒ (µ(x) − λ)ϕ(x) = Ψ(x) ⇐⇒ ϕ(x) = Ψ(x) .
µ(x) − λ
1
Sendo assim, (Aµ − λ1I)−1 é o operador multiplicação por µ(x)−λ
, isto é,
, -
−1 1
(Aµ − λ1I) Ψ(x) = Ψ(x) ,
µ(x) − λ
261
com domínio
# , - %
−1 1
Dom(Aµ − λ1I) = Ψ ∈ C[0, 1] | Ψ(x) ∈ C[0, 1] .
µ(x) − λ
1
Este é um operador limitado se, e somente se, existir uma constante K > 0 tal que |µ(x)−λ|
#
K. Assim,
! "
ρ(Aµ ) = λ ∈ C | ∃ ε > 0 tal que |µ(x) − λ| " ε .
Desejamos determinar se o conjunto Ran(Aµ − λ1I) = Dom(Aµ − λ1I)−1 é denso. Para isto,
precisamos definir uma norma para o espaço C[0, 1]. Vamos assumir a norma do supremo, isto
é,
∥ϕ∥∞ = sup |ϕ(x)| < ∞ , ∀ ϕ ∈ C[0, 1] . (5.2.6)

x∈[0,1]
Essa norma também é chamada de norma uniforme, norma de Chebyshev ou norma do infinito.5
A convergência de funções na norma do supremo equivale à convergência uniforme, isto é, uma
sequência de funções (ϕn )n∈N converge para uma função ϕ sob a métrica derivada da norma
do supremo se, e somente se, ϕn convergir para ϕ uniformemente.
De acordo com a topologia gerada pela norma ∥ · ∥∞ não é difícil ver que a função constante
Ψ(x) = 1, que pertence ao espaço C[0, 1], não está no fecho do domínio Dom(Aµ − λ1I)−1 .
Com efeito, para todo λ ∈ / Ran(µ) e para toda função ϕ ̸= 0 em C[0, 1] podemos tomar
|µ(x) − λ| # 2∥ϕ∥∞ . Por conseguinte, isto implica que |1 − (µ(x) − λ)ϕ| " 12 e que o conjunto
1
Ran(Aµ − λ1I) não é denso em toda parte em X .
Por outro lado, de acordo com o Exemplo 1.3, podemos definir uma outra norma em C[0, 1]
pela fórmula
$ 1
∥ϕ∥1 = dx |ϕ(x)| .
0
Vamos mostrar que, de acordo com a topologia gerada pela norma ∥ · ∥1 , o conjunto
Ran(Aµ − λ1I) é denso em toda parte em X . Para isto, escolha uma função qualquer ϕ ∈
C[0, 1]. Temos que mostrar que ϕ é o limite
! de uma sequência (ϕn )n∈N
" ∈ Ran(Aµ − λ1I).
Para cada n ∈ N, tome o conjunto En = x ∈ [0, 1] | |µ(x)−λ| " 1/n . Note que o conjunto
Ran(Aµ − λ1I) contém {χEn ϕ | ϕ ∈ C[0, 1], n ∈ N}, pois para toda função ϕ ∈ C[0, 1] e
1
todo n ∈ N, χEn ϕ é a imagem sob Aµ − λ1I de (µ(x)−λ) χEn ϕ ∈ C[0, 1]. Além disso, temos
que χEn ϕ → ϕ segundo a norma ∥ · ∥1 , quando n → ∞.
5
Como C[0, 1] é um espaço composto por funções contínuas no intervalo fechado [0, 1], que é um conjunto
compacto, então as funções em C[0, 1] são limitadas e o supremo na definição acima é alcançado pelo Teorema
do Valor Extremo de Weierstrass, em vista disso podemos substituir o supremo pelo máximo na Eq.(5.2.6) (veja o
Exemplo 1.3).
262
Podemos resumir a análise acima da seguinte forma:

! "
ρ(Aµ ) = λ ∈ C | ∃ ε > 0 tal que |µ(x) − λ| " ε ,
! "
σ(Aµ ) = λ ∈ C | $ ε > 0 tal que |µ(x) − λ| " ε ,
! "
σpont (Aµ ) = λ ∈ C | µ(x) = λ ,
⎧
⎨∅ , se ∥ · ∥1
σres (Aµ ) = ! ,
⎩ λ ∈ C | $ ε > 0 tal que |µ(x) − λ| " ε" \ σ (A ) , se ∥ · ∥∞
pont µ
⎧! "
⎨ λ ∈ C | $ ε > 0 tal que |µ(x) − λ| " ε \ σpont (Aµ ) , se ∥ · ∥1
σcont (Aµ ) = .
⎩∅ , se ∥ · ∥∞
Para finalizar este exemplo, note que se tomamos µ(x) = x, então, o espectro é exatamente
todo o intervalo [0, 1]. Por outro lado, obviamente não existem auto-valores. Assim, o operador
A definido por Aϕ(x) = xϕ(x) é um exemplo de um operador com um espectro puramente
contínuo. Abordaremos com mais detalhes este caso na Seção 5.5.
Nota 5.5 (Sobre as topologias geradas pelas normas ∥ · ∥∞ e ∥ · ∥1 ). Suponha que duas
funções ϕ e Ψ em C[0, 1] estejam suficientemente próximas uma da outra usando a norma
∥ · ∥∞ . Diz-se que Ψ está localizada na vizinhança de ϕ. A vizinhança-ε de ϕ, denotada por
[∞]
Vε (ϕ), é um conjunto de funções vizinhas a ϕ, usando a norma ∥ · ∥∞ , e é expressa como
! "
Vε[∞] (ϕ) = Ψ ∈ C[0, 1] | ∥ϕ − Ψ∥∞ = sup |ϕ(x) − Ψ(x)| < ε . (5.2.7)
x∈[0,1]
[∞]
A Figura 5.1 dá uma explicação gráfica de Vε (ϕ). Observe que no gráfico todas as funções
Ψ devem estar contidas na região entre as duas curvas y = ϕ(x) ± ε para qualquer x arbitrário
[∞]
em [0, 1]. Para que Ψ pertença a Vε (ϕ), mesmo uma pequena porção da curva y = Ψ(x)
não pode se desviar da região ±ε.
ϕ(x)
Ψ(x)
Figura 5.1: Na convergência uniforme para ϕ(x), qualquer função Ψ(x) deve estar contida
na região entre as duas curvas y = ϕ(x) ± ε. Figura retirada, e adptada, do livro-texto de
Hiroyuki Shima, “Functional Analysis for Physics and Engineering: An Introduction,” CRC Press,
2016. Todos os Direitos Reservados.
263
Considere agora a norma ∥ · ∥1 . Neste caso, dizemos que Ψ está próximo de ϕ com a
[1]
distância definida pela norma ∥ · ∥1 , queremos dizer que Ψ ∈ Vε (ϕ) ou, equivalentemente,
$ 1
∥ϕ − Ψ∥1 = dx |ϕ(x) − Ψ(x)| < ε .
0
Essa desigualdade implica que a área da região entre as curvas y1 = ϕ(x), y2 = Ψ(x) e as
linhas verticais x = 0 e x = 1 é menor que ε. Deve ser enfatizado que, neste caso, a distância
entre as funções é medida usando integração. Esta regra para distância é completamente
diferente daquela no caso da distância gerada pela norma ∥ · ∥∞ . Assim, a função constante
[∞] [1]
Ψ(x) = 1, que foi excluída da Vε (ϕ) em C[0, 1], pode ser um membro de Vε (ϕ).
PROPOSIÇÃO 5.9. Seja A um operador auto-adjunto em um espaço de Hilbert complexo e
λi ∈ σpont (A), i = 1, 2 são dois auto-valores. Se λ1 ̸= λ2 , então os espaços Ker(A − λ1 1I) e
Ker(A − λ2 1I) são ortogonais.
Demonstração. Se Axi − λi xi = 0, para i = 1, 2, então (λ1 − λ2 )⟨x1 , x2 ⟩ = ⟨λ1 x1 , x2 ⟩ −

⟨x1 , λ2 x2 ⟩ = ⟨Ax1 , x2 ⟩ − ⟨x1 , Ax2 ⟩ = 0. Portanto ⟨x1 , x2 ⟩ = 0, uma vez que λ1 ̸= λ2 .
TEOREMA 5.3. Seja A um operador fechado em um espaço de Hilbert complexo H ̸= {0}.
Então, λ ∈ ρ(A) se, e somente se, A − λ1I é uma bijeção de Dom(A) em H .
Demonstração. Se λ ∈ ρ(A), é suficiente mostrar que Ran(A − λ1I) = H . Com efeito, uma
vez que (A − λ1I)−1 é contínuo, existe um C > 0 tal que ∥(A − λ1I)−1 y∥ # C∥y∥ para todo
y = (A − λ1I)x ∈ Ran(A − λ1I). Assim, para qualquer x ∈ Dom(A), segue que
∥x∥ # C∥(A − λ1I)x∥ . (5.2.8)
Como, por definição, Ran(A − λ1I) = H , então, se y ∈ H existe uma sequência (xn )n∈N ⊂
Dom(A) tal que (A − λ1I)xn → y, quando n → ∞. Aplicando (5.2.8) com x = xn − xm
mostra que ∥xn − xm ∥ # C∥yn − ym ∥ concluimos que (xn )n∈N é uma sequência de Cauchy
e, assim, admite um limite x ∈ H . Sendo A um operador fechado, x ∈ Dom(A) e
(A − λ1I)x = y; portanto, y ∈ Ran(A − λ1I). Consequentemente, Ran(A − λ1I) = H ,
como afirmado.
Nota 5.6. O Teorema 5.3 também pode ser enunciado da seguinte forma: Sejam A um operador
fechado em um espaço de Hilbert complexo H ̸= {0} e λ um elemento de C. Suponha que
exista um C > 0 tal que
∥x∥ # C∥(A − λ1I)x∥ .
para todo x ∈ Dom(A). Então, o Ran(A − λ1I) é um subespaço fechado de H .
O próximo resultado estabelece que se o espectro σ(A) de um operador simétrico A, num

espaço de Hilbert complexo H , está confinado no conjunto dos reais, R, então, o operador
deve, necessariamente, ser auto-adjunto ou essencialmente auto-adjunto. Isto implica que se
um operador A for apenas simétrico, ou seja, se ele não é auto-adjunto nem essencialmente
auto-adjunto, seu espectro σ(A) contém elementos do conjunto dos complexos, C. Isto tem
um impacto direto na teoria quântica porque os observáveis nessa teoria devem ter um espectro
real. Portanto, na teoria quântica os observáveis devem ser representados por operadores auto-
adjuntos e não por operadores que sejam apenas simétricos!
264
TEOREMA 5.4. Seja A um operador simétrico fechado em um espaço de Hilbert complexo H . (i)
Então, o espectro de A é uma das seguintes possibilidades, mutuamente excludentes: σ(A) = C,
ou σ(A) = C+ , ou σ(A) = C− , ou σ(A) ⊂ R. (ii) O operador A é auto-adjunto se, e somente
se, seu espectro σ(A) é um subconjunto de R.
Demonstração. Tome C ∋ λ = ν + iµ, tal que µ ̸= 0. Se A um operador simétrico em um

espaço de Hilbert complexo H , então, o resultado estabelecido na Proposição 5.6 se aplica ao
operador A, já que todo operador auto-adjunto também é simétrico; ou seja, segue que
∥(A − λ1I)x∥ " |µ|∥x∥ e ∥(A − λ1I)x∥ " |µ|∥x∥ , ∀ x ∈ Dom(A) .
Destas desigualdades e do fato que A é fechado, segue, da Proposição 4.23, que os subespaços
Ran(A − λ1I) e Ran(A − λ1I) são fechados no espaço de Hilbert H . Então, pelo Teorema
3.5, segue que
H = Ran(A − λ1I) ⊕ Ran(A − λ1I)⊥ = Ran(A − λ1I) ⊕ Ran(A − λ1I)⊥ ,
e, pelo Teorema 4.18, que
Ran(A − λ1I)⊥ = Ker(A∗ − λ1I) e Ran(A − λ1I)⊥ = Ker(A∗ − λ1I) .
Além disso, como os inversos dos operadores A − λ1I e A − λ1I existem e são limitados, isto é,
∥(A − λ1I)−1 ∥ = ∥(A − λ1I)−1 ∥ # |µ|−1 , segue que (A − λ1I)−1 e (A − λ1I)−1 estão definidos
em toda parte em H se, e somente se, Ker(A∗ − λ1I) = {0} e Ker(A∗ − λ1I) = {0}.
Portanto, cada um dos semi-planos C+ e C− está inteiramente no espectro de A, ou está
inteiramente no conjunto resolvente de A em λ. Isto prova a primeira parte.
Para provar a segunda parte, assuma que A é auto-adjunto e que existe um x ∈ Dom(A)
tal que A∗ x = λx, com C ∋ λ = ν + iµ, tal que µ ̸= 0. Logo, Ax = λx e
λ⟨x, x⟩ = ⟨λx, x⟩ = ⟨A∗ x, x⟩ = ⟨Ax, x⟩ = ⟨x, Ax⟩ = λ⟨x, x⟩ .
Assim, necessariamente, x = 0, já que λ − λ ̸= 0. Um raciocínio similar mostra que A∗ x = λx

também não tem solução não-trivial. Consequentemente, os números λ e λ não são auto-valores
de A e, pelo Teorema 4.25 e pela Proposição 5.4, segue que Ran(A−λ1I) = Ran(A − λ1I) =
H e Ran(A − λ1I) = Ran(A − λ1I) = H . Finalmente, como A é fechado e A − λ1I
e A − λ1I são bijeções de Dom(A) em H , pelo Teorema 5.3, λ, λ ∈ ρ(A). Isto finaliza a
prova.
Nota 5.7. No Teorema 5.4 assumimos que A é um operador simétrico fechado. Não existe
nenhuma perda de generalidade nisso, uma vez que todo operador simétrico tem um fecho, e o
operador e seu fecho têm as mesmas extensões.
De acordo com o Teorema 5.4, se A é um operador apenas simétrico, então o espectro de

A deve conter pontos fora da reta dos reais. De fato, os Teoremas 4.25 e 4.26 mostraram que
pelo menos um dos operadores (A − i1I) e (A + i1I) não deve ser sobrejetivo e, portanto, pelo
menos um dos números i e −i pertence ao espectro de A. No entanto, um operador simétrico
não pode ter auto-valores não-reais, como mostrou a Proposição 5.3.
O próximo resultado pode ser visto como uma consequência direta do Teorema 5.4.
265
PROPOSIÇÃO 5.10. Seja A um operador auto-adjunto em um espaço de Hilbert complexo H .

Então, σres (A) = ∅.
Demonstração. Por definição, λ ∈ σres (A) se (A − λ1I) é injetivo e Ran(A − λ1I) ̸= H , isto
é, (A−λ1I)−1 existe, mas não é denso em H . Tome um λ ∈ σ(A) tal que Ker(A−λ1I) = {0};
mas pelo Teorema 4.18, isto implica que
Ran(A − λ1I)⊥ = Ker(A∗ − λ1I) = Ker(A∗ − λ1I) = Ker(A − λ1I) = {0} ,
de maneira que Ran(A − λ1I) é denso em H . Logo, λ ∈
/ σres (A).
Assim, com base no resultado estabelecido na proposição acima, a maneira pela qual o re-
solvente Rλ (A) = (A − λ1I)−1 de um operador auto-adjunto A depende do valor do parâmetro
λ pode ser resumida na tabela a seguir:
λ é um auto-valor do operador A. Rλ (A) é um operador limitado e definido

em todo H .
λ ∈ σpont (A), mas λ ∈
/ σcont (A). Rλ (A) é um operador limitado definido
sobre um conjunto que não é denso em
H.
λ ∈ σcont (A), mas λ ∈
/ σpont (A). Rλ (A) é um operador ilimitado definido
sobre um conjunto que é denso em H .
λ ∈ σpont (A) e λ ∈ σcont (A). Rλ (A) é um operador ilimitado definido
sobre um conjunto que não é denso em
H.
Para todo operador auto-adjunto limitado, a norma do operador pode expressar o “tamanho”
do seu espectro de acordo com o seguinte
TEOREMA 5.5. Um operador auto-adjunto A em8 um espaço de 9 Hilbert complexo H é limitado
se o seu espectro é limitado. Neste caso, σ(A) ⊂ −∥A∥, ∥A∥ .
Demonstração. Tome λ ∈ C e assuma que |λ| > ∥A∥, então λ está no conjunto resolvente de
A. Com efeito, como por hipótese ∥λ−1 A∥ < 1, escrevendo-se
A − λ1I = −λ(1I − λ−1 A) ,
a série de Neumann pode ser usada para encontrar o inverso limitado do operador A − λ1I,
isto é,
<∞
−1 −1 −1 −1 −1
Rλ (A) = (A − λ1I) = −λ (1I − λ A) = −λ An λ−n .
n=0
Em outras palavras, para todo λ ∈ C tal que |λ| > ∥A∥, segue que o resolvente Rλ (A) é
limitado, isto é,
<∞
1
∥Rλ (A)∥ # ∥A∥n |λ|−1−n = .
n=0
|λ| − ∥A∥
266
Assim, λ ∈ ρ(A). Além disso, note que, ∥Rλ (A)∥ → 0, quando λ → ∞. Isto estabelece
que se |λ| # ∥A∥, então σ(A) ⊂ {λ ∈ C | |λ| # ∥A∥} e mostra que o espectro σ(A)
de A é um subconjunto fechado, limitado e não-vazio de C. Portanto, o raio espectral de
A, denotado por r(A), é o raio do menor disco centrado em zero que contém σ(A), isto é,
r(A) = sup {|λ| | λ ∈ σ(A)}. Neste caso, r(A) = ∥A∥.
COROLÁRIO 5.4. O espectro σ(U ) de um operador unitário U em um espaço de Hilbert com-

plexo H está contido no círculo unitário {λ ∈ C | |λ| = 1}.
Demonstração. Se |λ| < 1, então escrevemos U − λ1I = U (1I − λU −1 ). Uma vez que o
operador λU −1 tem norma menor do que 1, usamos novamente a série de Neumann para
determinar o inverso limitado de U − λ1I. Da mesma forma, para |λ| > 1, escrevemos
U − λ1I = −λ(1I − λ−1 U ). Desta vez, é a série de Neumann para o operador λ−1 U que
permite-nos determinar o inverso limitado de U − λ1I. Consequentemente, todo elemento
λ ∈ C com |λ| < 1 ou |λ| > 1 pertence ao conjunto resolvente de A e o espectro de A está
contido no círculo unitário {λ ∈ C | |λ| = 1}.
Uma vez que os pontos regulares têm uma caracterização simples, gostaríamos de saber
quando um ponto regular pertence ao conjunto resolvente. A resposta é dada pelo seguinte
TEOREMA 5.6. Para um operador auto-adjunto A em um espaço de Hilbert complexo H o

conjunto resolvente ρ(A) e o conjunto ρr (A) de pontos regulares coincidem.
Demonstração. Partimos lembrando que um operador A densamente definido tem um único

adjunto A∗ e que a relação Ran(A − λ1I)⊥ = Ker(A∗ − λ1I) acontece. Portanto, ρr (A) ⊆
ρ(A) se, e somente se, Ker(A∗ − λ1I) = {0}. Com efeito, assuma que λ ∈ ρr (A) e que
x ∈ Ker(A∗ − λ1I), isto é, A∗ x = λx. Mas, como A é auto-djunto, então x ∈ Dom(A) e
Ax = λx. Isto implica que
λ⟨x, x⟩ = ⟨λx, x⟩ = ⟨A∗ x, x⟩ = ⟨Ax, x⟩ = ⟨x, Ax⟩ = λ⟨x, x⟩ .
Pela Proposição 5.3, segue que λ = λ; em outras palavras, temos que Ax = λx, ou que
(A − λ1I)x = 0. Mas, isto contradiz a hipótese que λ ∈ ρr (A). Portanto, devemos ter x = 0.
Isto, mais a análise na Nota 5.1, prova o teorema.
Com base no resultado acima e no conceito de índices de deficiência, o Teorema 5.4 pode
ser resumido da seguinte forma: seja A um operador simétrico fechado. Se m = 0, então
Ran(A − λ1I) = H para todo λ, com Im λ > 0; portanto o semi-plano superior do plano
complexo pertence ao conjunto resolvente ρ(A). Em contrapartida, se m > 0, todo o semi-plano
superior do plano complexo C pertence ao espectro de A. Resultados semelhantes acontece
para n e pontos λ no semi-plano inferior do plano complexo C. Assim, isto nos leva à seguinte
caracterização do espectro de um operador simétrico fechado A – lembrando que o espectro é
um subconjunto fechado do plano complexo C:
(i) m = n = 0. Todos os números não-reais pertencem ao conjunto resolvente ρ(A); o

espectro σ(A) é um subconjunto dos números reais e A é auto-adjunto;
267
(ii) m = 0, n > 0. O conjunto resolvente

! ρ(A) é o semi-plano
" superior aberto Im λ > 0 e
σ(A) é o semi-plano inferior fechado λ ∈ C | Im λ # 0 ;
(iii) m > 0, n = 0. O conjunto resolvente

! ρ(A) é o semi-plano
" inferior aberto Im λ > 0 e
σ(A) é o semi-plano superior fechado λ ∈ C | Im λ # 0 ;
(iv) m > 0, n > 0. ρ(A) = ∅ e σ(A) = C.
5.2.3 Operador Resolvente e a Aproximação de Yosida
O objetivo desta subseção é ressaltar o papel desempenhado pelo operador resolvente na teo-
ria de evolução de um sistema físico, particularmente sua relação com a conhecida aproximação
de Yosida.
Iniciamos lembrando que, a evolução de um sistema físico no tempo é usualmente descrita

por um problema de valor inicial para uma equação diferencial (ordinária ou parcial). Por
exemplo, considere um espaço de Hilbert H e o mapeamento x : [0, ∞) → H . Seja A um
operador linear limitado ou ilimitado cujo domínio é densamente definido em H . Estamos
interessados no seguinte problema:
d
x(t) = Ax(t) com t " 0 ,
dt
x(0) = x0 . (5.2.9)
O problema acima é referido como equação de evolução, ou como “o problema de Cauchy.” A
equação dx/dt = Ax, para todo x ∈ Dom(A), parece indicar que a solução do problema
acima é
x(t) = eAt .
No entanto, esta solução, a princípio, parece de pouco ou nenhum valor. O que significa
exponenciar um operador? Responder esta questão nos conecta à noção de um semi-grupo
uni-paramétrico fortemente contínuo de operadores lineares limitados em um espaço de Hilbert
H . Tal semi-grupo é chamado simplesmente de semi-grupo-C0 , uma terminologia introduzida
por Einar Hille que acabou tornando-se padrão. Em particular, estaremos interessados na classe
chamada semi-grupo-C0 de contração. A definição de tal semi-grupo é a seguinte:6 uma família
T = {T (t) | t ∈ [0, ∞)} de operadores lineares limitados de H em H é chamada um
semi-grupo-C0 se
1. ∥T (t)∥ < ∞, isto é, sup {∥T (t)x∥ | x ∈ H , ∥x∥ # 1} < ∞ para todo t " 0;
2. T (t + s)x = T (t)T (s)x, para todo x ∈ H e para todo t, s " 0;
3. T (0)x = x, para todo x ∈ H ;
4. t 3→ T (t)x é contínuo para t " 0, para todo x ∈ H ;
5. Além disso, se ∥T (t)x∥ # ∥x∥, para todo x ∈ H e para todo t " 0, indicando que
∥T (t)∥ # 1, T é chamado de semi-grupo de contração.
6
Mais detalhes sobre um semi-grupos-C0 de contração aparecerá no Capítulo 8.
268
O seguinte resultado é básico:

TEOREMA 5.7. O problema de valor inicial (5.2.9), com A sendo um operador linear, é “bem-
posto” se, e somente se, A é o gerador infinitesimal de um semi-grupo-C0 . Neste caso, a única
solução de (5.2.9) é dada por x(t) = T (t)x0 = etA x0 , para x0 ∈ Dom(A).
No teorema acima dizemos que A é o gerador infinitesimal de um semi-grupo-C0 se

1. /
Ax = lim+ T (t) − 1I x , para todo x ∈ Dom(A) ,
t→0 t
isto é, o operador A é o gerador infinitesimal de um semi-grupo-C0 quando o limite acima
existe!
O Teorema 5.7 nos leva ao seguinte questionamento: Que operadores A geram semi-grupos-
C0 ? Para responder esta questão, partimos com o caso mais simples de um operador linear
limitado, A, e então generalizamos. Considere a fórmula
$ ∞
1
= dt e−λt etA ,
λ−A 0
que é válida quando A é um número real e λ > A. Esta fórmula sugere a seguinte versão
operatorial no caso de A ser um operador limitado, com Re λ > ∥A∥:
$ ∞
−1
(λ1I − A) x = dt e−λt etA x , ∀ x ∈ H . (5.2.10)
0
O vetor x na expressão acima torna o integrando contínuo e limitado na norma pela função
integrável e−λt ∥x∥. De fato, como (λ1I − A)−1 = −Rλ (A), segue da Proposição 5.6 que o
operador (λ1I − A)−1 é limitado. Assim, a estimativa
?$ ∞ ? $ ∞
? ? ? ?
−1
∥(λ1I − A) x∥ = ? ? −λt tA ?
dt e e x? # dt e−Re λt ?etA x?
0 0
$ ∞
∥x∥
# dt e−Re λt ∥x∥ = ,
0 Re λ
sugere que
⎧
⎪
⎪para todo Re λ > 0 ,
⎪
⎨
(A − λ1I) mapea o domínio de A em todo H , (5.2.11)
⎪
⎪
⎪
⎩
e ∥(A − λ1I)−1 x∥ # (Re λ)−1 ∥x∥ para todo x ∈ H .
Nota 5.8 (O resolvente do semi-grupo). Observe que a partir da Eq.(5.2.10) podemos ver que
$ ∞ $ ∞
−λt tA
(A − λ1I) dt e e x = dt (A − λ1I)e(A−λ1I)t x
0 0
$ r
d . (A−λ1I)t /
= lim dt
e x
r→∞ 0 dt
. /
= lim e(A−λ1I)r x − 1Ix , ∀ x ∈ H .
r→∞
269
O termo e(A−λ1I)r x → 0, quando r → ∞, uma vez que Re λ > ∥A∥. Com efeito,
? (A−λ1I)r ? ? (A−λ1I)r ?
?e x? # ?e ? ∥x∥ # e(∥A∥−Re λ)r ∥x∥ → 0 ,
quando r → ∞. Assim, segue que

$ ∞
(A − λ1I) dt e−λt etA x = −1Ix , ∀x ∈ H .
0
Portanto, se A é um operador linear limitado, então, para Re λ > ∥A∥ o resolvente do semi-
grupo de contração T é dado pela seguinte expressão:
$ ∞
Rλ (A) = − dt e−λt etA . (5.2.12)
0
No Capítulo 8 mostraremos que Rλ (A) como definido em (5.2.12) é de fato o resolvente de

A (veja a prova do Teorema de Hille-Yosida, na pg.557).
TEOREMA 5.8 (Teorema de Hille-Yosida). Um operador linear A, não necessariamente limitado,

é o gerador infinitesimal de um semi-grupo-C0 de contração T (t), com t " 0, se, e somente se, o
domínio de A for denso em H e se as condições (5.2.11) forem satisfeitas.
Nota 5.9 (O semi-grupo do resolvente). Podemos recuperar o semi-grupo T do gerador A da

seguinte forma: seja C um círculo de raio R > ∥A∥ centrado na origem. Então, afirmamos
que
`
tA 1
e =− dλ eλt Rλ (A) . (5.2.13)
2πi C
Com efeito, das expansões em série de potências para a exponencial eλt e para o resolvente
Rλ (A) (veja o Teorema 4.8), a integral de contorno acima assume a forma:
∞ ∞ ` ∞ ∞ `
1 < tk < k −(n+1) n
< tk < n 1
dλ λ λ A = A dλ λk−n−1 .
2πi k=0 k! n=0 C k=0
k! n=0
2πi C
1
a
Pela Fórmula Integral de Cauchy, 2πi C
dλ λk−n−1 = 0, a não ser que n = k e neste caso a
integral é 1. Logo, segue que
<∞
tA (tA)n
e = .
n=0
n!
A convergência da série acima é discutida, em detalhes, no Capítulo 8, pg.563.
Isto tudo indica que se A é o gerador infinitesimal de um semi-grupo-C0 de contração,

então, a fórmula T (t) = etA admite uma interpretação que faz sentido quando A é limitado.
No caso do operador A ser ilimitado teremos que olhar para a exponencial etA de uma maneira
diferente. Sabemos que se A ∈ C, então das definições elementares da função exponencial,
270
temos 4 maneiras de definir etA :
<n
tA 1
(I) e = lim (tA)ℓ ;
n→∞
ℓ=0
ℓ!
, -n
tA t
(II) e = lim 1 + A ;
n→∞ n
, -−n
t
(III) etA = lim 1 − A ;
n→∞ n
(IV ) etA = lim etAλ em que lim Aλ = A .

λ→∞ λ→∞
Para operadores limitados a exponencial etA está bem definida pelas foŕmulas (I) e (II).
No entanto, nem todos os operadores são limitados. É aqui que entram em cena as fórmulas
(III) (usada por Hille) e (IV ) (usada por Yosida). A fórmula (IV ) está relacionada à chamada
aproximação de Yosida. Vamos usar (IV ) para definir a exponencial etA quando A é um
operador ilimitado e Aλ ∈ Lb (H ). Neste caso, dizemos que um operador ilimitado A em um
espaço de Hilbert H pode ser “regularizado” por meio da aproximação de Yosida, através dos
operadores limitados Aλ definidos em termos do operador resolvente Rλ (A) e que convergem
para A no domínio deste último. Para mostrarmos isto, primeiro, preparamos o seguinte7
LEMA 5.1. Seja A um operador auto-adjunto em um espaço de Hilbert complexo H . Se λ é um

/ σ(A), então, ∥(A − λ1I)x∥ " λ∥x∥ para todo x ∈ Dom(A) se A é
real positivo tal que λ ∈
positivo. Além disso, ∥(A − λ1I)−1 ∥ # λ−1 .
Demonstração. A condição que λ2 ∥x∥2 # ∥(A − λ1I)x∥2 = ∥Ax∥2 − 2λ⟨x, Ax⟩ + λ2 ∥x∥2
2
H − 2λ⟨x, Ax⟩ " 0, usando-se a simetria de A. Isto, por sua vez, implica
implica que ∥Ax∥
que ∥Ax∥ " 2λ⟨x, Ax⟩. Por definição, ∥Ax∥ " 0. Logo, como λ > 0 e ⟨x, Ax⟩ ∈ R,
segue que ⟨x, Ax⟩ " 0. A seguir, considere a equação (A − λ1I)x = y. Como λ ∈ / σ(A) o
inverso do operador (A − λ1I) existe e está bem definido. Isto implica que (A − λ1I)−1 y = x.
Consequentemente, a condição que λ∥x∥ # ∥(A−λ1I)x∥ implica que λ∥(A−λ1I)−1 y∥ # ∥y∥;
ou seja, ∥(A − λ1I)−1 ∥ # λ−1 para λ > 0.
Os operadores de Yosida Aλ são obtidos da seguinte forma: primeiro, dado um operador

auto-adjunto A (não necessariamente limitado) em um espaço de Hilbert H , decompomos o
operador resolvente Rλ (A) associado ao operador A como segue:
Rλ (A) = −λ−1 1I + λ−1 ARλ (A) . (5.2.14)
7
No restante desta subseção, consideramos somente o caso de operadores auto-adjuntos.
271
De fato,
Rλ (A) = −λ−1 1I + λ−1 ARλ (A)
= −λ−1 Rλ−1 (A)Rλ (A) + λ−1 ARλ (A)

6 7
−1 −1
= −λ (A − λ1I) + λ A Rλ (A)
= Rλ (A) .
Agora, assuma que A é positivo (veja a Definição 4.29). Então, de acordo com o Lema
5.1, para todo x ∈ Dom(A) e para todo 0 < λ ∈ R que não pertence ao espectro de A,
∥Rλ (A)∥ # λ−1 .
def.
A seguir, defina o operador Bλ = −Rλ (A) = (λ1I − A)−1 e multiplique a Eq.(5.2.14) por
2
λ . Logo, a decomposição (5.2.14) assume a seguinte forma:
λ2 Bλ = λ1I + λABλ . (5.2.15)
Naturalmente, ∥Bλ ∥ = ∥Rλ (A)∥ # λ−1 !
DEFINIÇÃO 5.4. Seja A um operador auto-adjunto positivo, não necessariamente limitado, atu-
ando em um espaço de Hilbert complexo H . Para todo λ > 0, definimos a aproximação de
Yosida, ou regularização de Yosida, de A por Aλ = λABλ .
Note que, a partir da decomposição (5.2.15) podemos escrever

Aλ = λ2 Bλ − λ1I . (5.2.16)
Nota 5.10 (“Justificando” a Eq.(5.2.16)). Qualquer leitor pode argumentar, em uma primeira
leitura, que a Eq.(5.2.16) foi obtida de uma forma um tanto arbitrária. Por exemplo, ele pode
se perguntar: por que a expressão para o operador Bλ foi multiplicada por λ2 ? Vamos tentar
“justificar” isto a partir da representação em série de potências do operador resolvente associada
à um operador auto-adjunto limitado A. De acordo com a prova do Teorema 5.5, se assumirmos
que λ > 0 e que λ > ∥A∥, então λ está no conjunto resolvente de A. Isto implica que
∥λ−1 A∥ < 1 e escrevendo-se
A − λ1I = −λ(1I − λ−1 A) ,
a série de Neumann pode ser usada para encontrar o inverso limitado do operador A − λ1I,
isto é,
∞
<
−1
Rλ (A) = −λ An λ−n .
n=0
Note que, o primeiro termo sempre é igual a −λ−1 . Como A é limitado, em primeira ordem
em A, o operador resolvente Rλ (A) é frequentemente escrito como Rλ (A) = −λ−1 1I − λ−2 A.
def.
Logo, segue que A = −λ2 Rλ (A) − λ1I e definido Bλ = −Rλ (A), obtemos que o operador
auto-adjunto limitado A pode ser escrito como
A = λ2 Bλ − λ1I , (5.2.17)
272
similar à Eq.(5.2.16). É importante observar que aqui assumimos que A é limitado para mostrar
a similaridade entre as Eq.(5.2.16) e Eq.(5.2.17)! Com efeito, na Proposição 5.11 abaixo coletamos
alguns fatos sobre Aλ ; provaremos que Aλ é limitado independentemente se o operador auto-
adjunto A é limitado ou não!
PROPOSIÇÃO 5.11. Sejam A um operador auto-adjunto, não necessariamente limitado, atuando

em um espaço de Hilbert complexo H e Aλ a aproximação de Yosida de A. Então,
1. ABλ x = Bλ Ax, para todo x ∈ Dom(A) e para todo λ > 0;
2. limλ→∞ λBλ x = x, para todo x ∈ H ;
3. limλ→∞ Aλ x = Ax, para todo x ∈ Dom(A);
4. ⟨x, Aλ x⟩ " 0, para todo x ∈ H e para todo λ > 0;
5. ∥Aλ x∥ # λ∥x∥, para todo x ∈ H e para todo 0 < λ < ∞.
6. Aλ é auto-adjunto.
Demonstração. Prova do item 1. Primeiro, lembremos que como A foi assumido ser auto-
adjunto, sabemos do Corolário 4.5 que Ran(λ1I − A) = Ran(A − λ1I) = H . Além disso,
Ran(Bλ ) = Ran(Rλ (A)) = Dom(A − λ1I) = Dom(A). Tudo isto implica que
Bλ (λ1I − A) = 1IDom(A) e (λ1I − A)Bλ = 1IH .
Consequentemente, partindo da definição do operador Aλ , obtemos, imediatamente para todo

x ∈ H e para todo λ > 0, que
Aλ x = λABλ x .
Aqui, usamos o fato que Dom(Bλ ) = Ran(λ1I − A) = H .
Por outro lado, para todo x ∈ Dom(A) e para todo λ > 0, obtemos que
Aλ x = λ2 Bλ x − λ1Ix
= λ2 Bλ x − λBλ Bλ−1 x
6 7
= λBλ λ1I − (λ1I − A) x
= λBλ Ax .
Finalmente,
5 como Dom(A) ⊂ H , isto implica que Dom(A) ⊂ Dom(Bλ ). Logo, para
Bλ 5Dom(A) , obtemos
8 9
Aλ x = λBλ Ax = λABλ x =⇒ A, Bλ x = 0 .
273
Prova do item 2. Assuma primeiro que x ∈ Dom(A). De acordo com a definição do

operador Bλ , segue que
1
∥λBλ x − x∥ = ∥Bλ Ax∥ # ∥Ax∥ → 0 quando λ→∞.
λ
Suponha agora que x é um elemento qualquer em H . Então, existe sempre uma sequência
(xn )n∈N ⊂ Dom(A) tal que xn → x quando n → ∞, uma vez que Dom(A) é denso em
H . Logo,
∥λBλ x − x∥ = ∥λBλ x − x + λBλ xn − λBλ xn + xn − xn ∥
# ∥λBλ (x − xn )∥ + ∥λBλ xn − xn ∥ + ∥x − xn ∥
# ∥λBλ xn − xn ∥ + 2∥x − xn ∥
1 1
# ∥Axn ∥ + 2∥x − xn ∥ → ∥Ax∥ quando n→∞.
λ λ
Aqui, usamos o fato que A é fechado (já que todo operador auto-adjunto é fechado, veja a
Proposição 4.12). Assim,
lim ∥λBλ x − x∥ = 0 , ∀x ∈ H .
λ→∞
Prova do item 3. Basta aplicar os itens 1 e 2; ou seja, para todo x ∈ Dom(A), segue que
6 7
lim Aλ x = lim λBλ Ax = lim λABλ x = A lim λBλ x = Ax .
λ→∞ λ→∞ λ→∞ λ→∞
Prova do item 4.
⟨x, Aλ x⟩ = ⟨(x + λBλ x − λBλ x), Aλ x⟩
= ⟨(x − λBλ x), Aλ x⟩ + ⟨λBλ x, Aλ x⟩
= ⟨λ−1 Aλ x, Aλ x⟩ + ⟨λBλ x, Aλ x⟩
= λ−1 ∥Aλ x∥2 + ⟨λBλ x, Aλ x⟩ " λ−1 ∥Aλ x∥2 .
Prova do item 5. Isto é uma consequência direta do item 4 e da desigualdade Cauchy-

Schwarz-Bunjakowski. Com efeito, para 0 < λ < ∞, temos
∥x∥∥Aλ x∥ " ⟨x, Aλ x⟩ " λ−1 ∥Aλ x∥2 =⇒ ∥x∥λ " ∥Aλ x∥ =⇒ λ " ∥Aλ ∥ .
Portanto, Aλ é limitado, apesar de A não ser necessariamente limitado.
Prova do item 6. A auto-adjunção do operador Aλ é estabelecida partindo-se da identidade

de polarização na forma
3
<
4⟨y, Ax⟩ = in ⟨x + in y, A(x + in y)⟩ .
n=0
274
Tomando A = Aλ na expressão acima, obtemos que
4⟨y, Aλx⟩ = ⟨x + y, Aλ(x + y)⟩ + ⟨x − y, Aλ(x − y)⟩
+ i⟨x + iy, Aλ(x + iy)⟩ − i⟨x − iy, Aλ (x − iy)⟩ , (5.2.18)
4⟨Aλ y, x⟩ = ⟨Aλ (x + y), x + y⟩ + ⟨Aλ (x − y), x − y⟩
+ i⟨Aλ (x + iy), x + iy⟩ − i⟨Aλ (x − iy), x − iy⟩ . (5.2.19)
Como Aλ é positivo, pelo item 4, segue que R ∋ ⟨x, Aλ x⟩ = ⟨Aλ x, x⟩ = ⟨Aλ x, x⟩, para todo
x ∈ H . Assim, comparando as partes real e imaginária do lado direito das Eqs.(5.2.18) e (5.2.19),
podemos concluir que ⟨y, Aλx⟩ = ⟨Aλ y, x⟩ para todo x, y ∈ H . Logo, Aλ é simétrico. Além
disso, como Aλ é um operador que tem todo o espaço de Hilbert H como domínio, então, Aλ
é necessariamente auto-adjunto, pelo Teorema 4.14.
Os itens 3 e 5 da Proposição 5.11 estabelecem que {Aλ }λ>0 é uma família de operadores
limitados que “aproximam” o operador auto-adjunto A quando λ → ∞, mesmo que A seja
ilimitado. É esse tipo de aproximação que será usada para resolver o problema da existência
da dinâmica quântica no Capítulo 8, representado pela equação de Schrödinger ∂Ψ∂t
= HΨ,
com t ∈ [0, +∞), submetida à condição inicial Ψ(0) = Ψ0 , em que H é o operador energia.
De fato, essa aproximação é usada com muita frequência para resolver também vários outros
problemas de evolução dΨdt
= AΨ, com t ∈ [0, +∞) e condição inicial Ψ(0) = Ψ0 , em que A
é um operador ilimitado.
5.3 O Espectro Essencial de Weyl

Neste ponto, queremos colocar as seguintes questões: (i) Como podemos caracterizar o
espectro contínuo de um operador auto-adjunto? (ii) Existe uma caracterização de σcont (A)
similar àquela de σpont (A) (como no exemplo da matriz) em termos de algum tipo de problema
de auto-valores?
Para responder as questões acima algumas observações se fazem necessárias. Vimos que a
Proposição 5.10 estabeleceu que para um operador A auto-adjunto o espectro residual é vazio.
Neste caso, o espectro de A divide-se na união do espectro pontual e contínuo: σ(A) =
σpont (A) ∪ σcont (A). No entanto, a terminologia espectro contínuo é um tanto inapropriada
uma vez que ela é bastante enganosa como nos mostra o seguinte
Exemplo 5.3 (Blanchard-Brüning). Sejam en , com n ∈ N uma base ortonormal do espaço
de Hilbert complexo, H , e {λn | n ∈ N} ⊂ C alguma sequência de números complexos.
Considere o conjunto
b ∞
c
<
2 2
D= x∈H | |λn | |⟨en , x⟩| < ∞ .
n=1
275
Para um vetor x ∈ D defina a ação do operador linear A da seguinte forma:

∞
<
Ax = λn ⟨en , x⟩en .
n=1
O operador A é fechado e densamente definido (verifique!), com seu adjunto sendo

∞
<
∗
A x= λn ⟨en , x⟩en , ∀y ∈ D .
n=1
Vamos mostrar que o espectro de A é o conjunto
σ(A) = {λn | n ∈ N} .
. /
Com efeito, assuma que λ0 ∈ C e que λ0 ∈
/ {λn | n ∈ N}; logo, d λ0 , σ(A) = inf λn ∈σ(A) |λn −
λ0 | > 0 e para todo x ∈ D
∞
<
2
∥(A − λ0 1I)x∥ = |λn − λ0 |2 |⟨en , x⟩|2
n=1
∞
. . //2 <
" d λ0 , σ(A) |⟨en , x⟩|2
n=1
. . //2
= d λ0 , σ(A) ∥x∥2 .
Assim, como A é um operador fechado no espaço de Hilbert complexo, H , segue, pela

Proposição 5.3, que λ0 ∈ ρ(A) e A − λ0 1I é uma bijeção de D em H , com o inverso de
A − λ0 1I dado por
< ∞
−1 1
(A − λ0 1I) x = ⟨en , x⟩en .
λ − λ0
n=1 n
Portanto, concluímos que ρ(A) = C \ {λn | n ∈ N} e isso prova nossa afirmação.
Agora, considere a sequência λn = 1/n. Então, o espectro do operador A definido acima é

# % # %
1 1 1
σ(A) = |n∈N = 1, , , . . . , 0 ,
n 2 3
enquanto que o espectro de pontos é
# %
1 1
σpont (A) = 1, , , . . . .
2 3
Portanto, o espectro contínuo é apenas um ponto: σcont (A) = σ(A) \ σpont (A) = {0}.
O Exemplo 5.3 revela o quão é inapropriado a terminologia espectro contínuo. Por este
motivo, vamos introduzir um outra maneira de decompor o espectro de um operador auto-
adjunto.
276
DEFINIÇÃO 5.5. Seja A um operador auto-adjunto. Denota-se por σdisc (A) o conjunto dos
pontos isolados de σ(A) que são auto-valores de multiplicidade finita. Este conjunto é cha-
mado espectro discreto. O conjunto restante σess (A) = σ(A) \ σdisc (A) é chamado espectro
essencial de A. Ele é composto por todos os pontos de acumulação de σ(A) junto com os
auto-valores de A de multiplicidade infinita.
Obviamente σdisc (A) e σess (A) são disjuntos e σ(A) = σdisc (A) ∪ σess (A) por definição.
Se σess (A) = ∅, então, diz-se que A tem espectro puramente discreto; se σdisc (A) = ∅, então,
diz-se que A tem espectro puramente essencial. Na mecânica quântica, em certo sentido,
os pontos do conjunto σdisc (A) corresponderiam melhor à noção de estados ligados do que
os pontos do conjunto σpont (A). Por sua vez, matematicamente, o espectro essencial é mais
fácil de manusear do que o espectro contínuo, pois é bastante “insensível” à perturbação (ver
Teorema 5.37 mais adiante). Mas, σess (A) e σcont (A) coincidem em muitos casos de interesse
prático.
TEOREMA 5.9. Sejam A um operador auto-adjunto e λ um ponto isolado de σ(A). Se para
algum ε > 0 existe algum x ∈ Dom(A) tal que
∥(A − λ)x∥ # ε∥x∥ , (5.3.1)
então, σ(A) ∩ (λ − ε, λ + ε) = {λ}.
Demonstração. Suponha o contrário que (λ − ε, λ + ε) ⊂ ρ(A). Logo, pela Proposição 5.7,

temos
∥Rλ (A)∥ # ε−1 , (5.3.2)
uma vez que ρ(A) é aberto e , portanto, d(λ, σ(A)) > ε. Para qualquer y ∈ H , defina
x = Rλ (A)y. Então, x ∈ Dom(A) e (5.3.2) implica que
∥Rλ (A)y∥ # ε−1 ∥y∥ ,
ou seja,
∥x∥ # ε−1 ∥(A − λ1I)x∥ ,
para todos x ∈ Dom(A). Isso contradiz (5.3.1), e como λ é um ponto isolado, pela noção de
sequências e limites, um elemento λ de σ(A) é um ponto isolado de σ(A) se, e somente se,
não for um ponto limite de σ(A). Isto implica que σ(A) ∩ (λ − ε, λ + ε) = {λ}.
Nota 5.11. Pelo Teorema 5.9, λ é um ponto isolado do conjunto σ(A) se para tal elemento existe
uma vizinhança que não contém outros pontos de σ(A). Por sua vez, por multiplicidade de um
auto-valor, λ, entende-se o número de auto-vetores linearmente independentes correspondente
a esse auto-valor. Isto é, diz-se que o auto-valor λ tem multiplicidade n se existe n, porém
não n + 1, vetores linearmente independentes x1 , . . . , xn ∈ Dom(A) tal que Axj = λxj ,
j = 1, . . . , n. Se n = 1, nós chamamos o auto-valor
! λ de "simples. Em resumo, se λ é um
auto-valor de multiplicidade finita, então, dim x | Ax = λx < ∞.
De acordo com a Definição 5.5 e a Nota 5.11, um ponto λ0 ∈ σess (A) se λ0 é um ponto
limite de σ(A) e um auto-valor de multiplicidade infinita de A; mais precisamente, λ é um
277
! "
ponto limite de σpont (A) e dim x | Ax = λx = ∞. Note que, a Definição 5.5 não entra em
conflito com o Exemplo 5.3, pois 0 é um ponto limite de σ(A). Portanto, o espectro essencial
de um operador consiste de todos os pontos do espectro, exceto os auto-valores isolados de
multiplidade finita. Dessa forma, adicionamos ao espectro contínuo (1) quaisquer auto-valores
contidos no ou nas fronteiras do espectro contínuo (2) quaisquer pontos limites do espectro e (3)
auto-valores, se houver, de multiplicidade infinita. Isto deixa claro a diferença entre o “espectro
pontual” e o “espectro contínuo” de “espectro discreto” e “espectro essencial.”
Vamos caracterizar o espectro essencial de forma mais explícita. Para isto, observamos que
existe uma outra condição para o operador A − λ1I não ter inverso como mostra o seguinte
Exemplo 5.4 (Sequências de auto-vetores aproximados – Shima). Assuma que R ∋ λ > 0
por conveniência. Embora não exista um vetor x ̸= 0 que satisfaça exatamente Ax = λx,
podemos encontrar um vetor x ̸= 0 que satisfaça
∥(A − λ1I)x∥ # ε∥x∥ ,
não importa quão pequeno ε seja. Em outras palavras, é possível fazer Ax ser quase (não
exatamente) idêntico a λx, dentro da margem de erro de ε∥x∥. Um exemplo é uma função
x(t) ∈ L2 [0, 1] definida por
⎧
⎨̸= 0 se λ − ε # t # λ
x(t) = .
⎩= 0 caso contrário
x(t)
λ−ε λ t
Figura 5.2: Perfil de um exemplo de função x(t) que se desvia de zero somente dentro de um
intervalo [λ − ε, λ]. Figura retirada, e adptada, do livro-texto de Hiroyuki Shima, “Functional
Analysis for Physics and Engineering: An Introduction,” CRC Press, 2016. Todos os Direitos
Reservados.
Observe que, como tx(t) = 0 para t ∈

/ [λ − ε, λ], então
$ λ $ λ
2 2 2 2
∥(A − λ1I)x∥ = dt (t − λ) |x(t)| # ε dt |x(t)|2 = ε2 ∥x∥2 , (5.3.3)
λ−ε λ−ε
ou seja, ∥(A − λ1I)x∥ # ε∥x∥. Portanto, a função x(t) que se desvia do zero apenas na
vizinhança de t = λ se comporta efetivamente como uma auto-função do operador contínuo
A : x(t) ∈ L2 [0, 1] → tx(t) ∈ L2 [0, 1].
278
De acordo com o exemplo acima, podemos afirmar que (A − λ1I)x é quase zero. Isto
significa que λ ∈ R deve pertencer ao espectro de A se, e somente se, λ é “quase um auto-
valor,” no sentido que existe um vetor x ̸= 0 para o qual Ax é igual a λx mais um erro que é
pequeno comparado à norma de x. Assim, com base no exemplo acima, usaremos a seguinte
caracterização do espectro de um operador auto-adjunto:
PROPOSIÇÃO 5.12 (Auto-valores aproximados). Seja A um operador auto-adjunto em um

espaço de Hilbert H . Então o número real λ ∈ σ(A) se, e somente se, existe uma (xn )n∈N ⊂
Dom(A) para A e λ tal que ∥xn ∥ = 1 e ∥(A − λ1I)xn ∥ → 0 quando n → ∞.
Demonstração. Por definição, se λ não pertence ao espectro de A então, pela Proposição 5.6, o
operador (A − λ1I)−1 existe e é limitado, de maneira que
∥(A − λ1I)x∥ " |Im λ|∥x∥ , ∀ x ∈ Dom(A) .
Logo, se ∥xn ∥ = 1, segue que ∥(A − λ1I)xn ∥ " |Im λ| e não pode se aproximar de zero.
Portanto, se existe uma (xn )n∈N ⊂ Dom(A) para A e λ tal que ∥xn ∥ = 1 e ∥(A−λ1I)xn ∥ →
0 quando n → ∞, então λ deve pertencer ao espectro de A.
Por outro lado, assuma que tal sequência não existe. Então, pelo Teorema 5.3, Eq.(5.2.8), deve
existir uma constante C > 0 tal que
∥x∥ # C∥(A − λ1I)x∥ , ∀ x ∈ Dom(A) . (5.3.4)
Caso contrário, deveria existir uma sequência (yn )n∈N de elementos não-nulos de Dom(A),
com
∥(A − λ1I)yn ∥
→0.
∥yn ∥
Substituindo yn por xn = yn /∥yn ∥ obtemos uma sequência de vetores unitários em Dom(A)
com ∥(A − λ1I)xn ∥ → 0. Isto estabelece (5.3.4).
De volta ao Exemplo 5.4, podemos aplicar a proposição acima ao operador A visto como um
operador multiplicação por t. De fato, se λ " 0, vimos que podemos encontrar, para qualquer
ε > 0, uma função limitada x(t) com suporte na região |t − λ| # ε com ∥x∥ = 1. Deste modo,
∥(A − λ1I)x∥ # ε. Então, tomando ε = 1/n obtemos xn correspondente como na proposição.
Portanto, a proposição implica que [0, ∞) está no espectro do operador multiplicação A.
Vamos refinar um pouco mais o resultado estabelecido na Proposição 5.12. Para isto, assuma
que λ é um ponto isolado do espectro do operador A. Defina por Hλ o subespaço de H com
auto-valor λ. De acordo com a Definição 5.5, Hλ dever ter dimensão finita. Decomponha H
na soma direta
H = Hλ ⊕ Hλ⊥ .
Para ε > 0 arbitrário, o intervalo (λ − ε, λ + ε) situa-se no conjunto resolvente da restrição
de A ao espaço Hλ⊥ . Portanto, a restrição de (A − λ1I) ao espaço Hλ⊥ tem inverso limitado.
Logo, se (xn )n∈N ⊂ Dom(A) é uma sequência de elementos de H tal que ∥xn ∥ = 1 e
∥(A − λ1I)xn ∥ → 0, então as componentes-Hλ⊥ dos elementos xn da sequência acima devem
tender a zero. Por conseguinte, as componentes-Hλ formam uma sequência limitada em um
279
espaço de dimensão finita. Isto implica que podemos extrair uma subsequência convergente
(xnκ )k∈N da sequência (xn )n∈N que também converge para zero. Consequentemente, com base
na Proposição 5.12 e na discussão acima, estabelecemos o seguinte
TEOREMA 5.10. Seja A um operador auto-adjunto em um espaço de Hilbert H . Então o número
real λ ∈ σess (A) se existe uma sequência (xn )n∈N ⊂ Dom(A) de elementos de H para A e λ
tal que
1. ∥xn ∥ = 1 para todo n,
2. (xn )n∈N não tem uma subsequência convergente,
3. ∥(A − λ1I)xn ∥ → 0 quando n → ∞.
A segunda condição no teorema acima pode ser substituída por uma condição mais fraca:
a convergência fraca para zero da sequência (xn )n∈N ⊂ Dom(A). De fato, se a sequência
w
(xn )n∈N ⊂ Dom(A) satisfaz as condições ∥xn ∥ = 1 e xn −→ 0, então ela não pode conter
uma subsequência (fortemente) convergente porque o limite forte de qualquer subsequência
dever ser igual ao limite fraco, isto é, igual a zero. Mas isto contradiz a hipótese que ∥xn ∥ = 1.
w
Assim, se xn −→ 0 devemos suspeitar que λ ∈ σess (A). Isto é o que está por trás da ideia do
critério de Weyl para o espectro essencial. Ele é baseado na seguinte noção:
DEFINIÇÃO 5.6. Diz-se que a sequência (xn )n∈N ⊂ H é uma sequência de Weyl para A e λ,
se as seguintes condições são satisfeitas:
1. ∥xn ∥ = 1 para todo n,
2. ∥(A − λ1I)xn ∥ → 0 quando n → ∞,
3. (xn )n∈N converge fracamente para zero, isto significa que ⟨y, xn ⟩ → 0 para todo y ∈ H .
TEOREMA 5.11 (Critério de Weyl). Seja A um operador auto-adjunto em um espaço de Hilbert

H . Então o número real λ ∈ σess (A) se, e somente se, existe uma sequência de Weyl (xn )n∈N ⊂
Dom(A) para A e λ.
Demonstração. Seja (xn )n∈N ⊂ Dom(A) uma sequência de Weyl. Assuma que λ pertence ao
conjunto resolvente ρ(A). Como A é auto-adjunto, segue que A é fechado. Logo, pelo Teorema
5.3, Eq.(5.2.8), temos que
1 = ∥xn ∥ # C∥(A − λ1I)xn ∥ → 0 quando n→∞.
Mas isto é um absurdo. Portanto, se (xn )n∈N ⊂ Dom(A) é uma sequência de Weyl, devemos
ter λ ∈ σess (A). Reciprocamente, assuma que λ um é ponto em σ(A). Como A é auto-adjunto,
lembre-se que σ(A) é um subconjunto fechado de R. Além disso, .como ρ(A) = / C \ σ(A),
então, ρ(A) ̸= ∅. Portanto, não é difícil ver que C ∋ B(λ; ε) ∩ σ(A) − {λ} ̸= ∅. Isto
implica, de acordo com a Definição 1.34, que todo ponto λ ∈ σ(A) é um ponto de acumulação
280
do plano complexo (mesmo que λ seja um ponto isolado em σ(A), veja Nota 1.29, na página
37). Assim, porque λ é um ponto de acumulação, toda bola aberta B(λ; ε) no plano complexo,
C, centrada em λ e de raio ε contém pontos de ρ(A) (veja a figura abaixo).
λ1 λ2
λn0
λ Re λ
Logo, para toda bola centrada em λ com raio ε = 1/n, selecionamos pontos λn ∈ ρ(A)
que estão dentro dessa bola de tal forma a obter uma sequência (λn )n∈N ⊂ ρ(A). A sequência
resultante convirgirá para λ. Com esta escolha os operadores (A − λn 1I) são invertíveis. Então,
como A é um operador fechado, pelo Teorema 5.3, (A − λn 1I) é uma bijeção de Dom(A)
em H e pela Proposição 5.7, para todo y ∈ H , temos que ∥(A − λn 1I)−1 y∥ → ∞ quando
λn → λ. A seguir, tome uma sequência (yn )n∈N ⊂ H e associe com cada vetor dessa
sequência o vetor xn da sequência (xn )n∈N ⊂ Dom(A) da seguinte forma:
(A − λn 1I)−1 yn
xn = .
∥(A − λn 1I)−1 yn ∥
Naturalmente, o vetor xn assim definido tem norma ∥xn ∥ = 1. Então,
∥(A − λ1I)xn ∥ = ∥(A − λ1I)xn + λn xn − λn xn ∥
# ∥(A − λn 1I)xn ∥ + |λn − λ|
∥yn ∥
= + |λn − λ| → 0 quando n→∞.
∥(A − λn 1I)−1 yn ∥
Resta mostrar que xn → 0 fracamente. Como A é auto-adjunto segue, de acordo com

o Corolário 4.5, que Ran(A − λ1I) = H . Assim, considere ⟨y, xn ⟩, com y sendo um
vetor arbitrário em H . Naturalmente, podemos assumir que y = (A − λ1I)x para algum
x ∈ Dom(A). Logo, como λ ∈ σ(A), temos que
⟨y, xn ⟩ = ⟨(A − λ1I)x, xn ⟩ = ⟨x, (A − λ1I)xn ⟩ , ∀y ∈ H .
Portanto, usando a desigualdade Cauchy-Schwarz-Bunjakowski, segue que
⟨y, xn ⟩ # |⟨y, xn ⟩| # ∥x∥∥(A − λ1I)xn ∥ → 0 quando n→∞.

w
Isto significa que ⟨y, xn ⟩ → 0 para todo y ∈ H , o que implica que xn −→ 0 quando n → ∞.
Logo, a sequência (xn )n∈N ⊂ Dom(A) é uma sequência de Weyl para A e λ. Isto implica
que λ ∈ σess (A).
O resultado acima responde as questões da página 275: quando A é auto-adjunto, o espectro

essencial é caracterizado via sequências de Weyl!
281
COROLÁRIO 5.5. Seja A um operador auto-adjunto em um espaço de Hilbert H . Se λ ∈ σ(A),

mas λ ∈
/ σess (A), então λ é um auto-valor de A.
Demonstração. Como λ ∈ σ(A) existe, de acordo com a Proposição 5.12, uma sequência
(xn )n∈N ⊂ Dom(A) tal que ∥xn ∥ = 1 e ∥(A − λ1I)xn ∥ → 0. Essa sequência deve ter
uma subsequência (xnκ )κ∈N convergente; caso contrário, teríamos λ ∈ σess (A) (Teorema 5.10).
Então, xnκ → x. Como A é fechado, x ∈ Ker(A − λ1I). Além disso, x ̸= 0 já que ∥x∥ = 1.
Portanto, λ é um auto-valor de A.
Em resumo, levando em conta as Definições 5.5 e 5.6, o Teorema 5.11 e o Corolário 5.5
podemos afirmar que (i) λ é um auto-valor de A com multiplicidade finita se, e somente
se, existe um número finito de vetores linearmente independentes xn ∈ Dom(A) tal que
(A − λ)xn = 0; (ii) λ é um auto-valor de A com multiplicidade infinita se, e somente
se, existe uma sequência de vetores linearmente independentes (xn )n∈N ∈ Dom(A) tal que
(A − λ)xn = 0. Naturalmente, se em (i) formarmos uma sequência infinita, os vetores não
serão linearmente independentes. Podemos usar este fato para separar σdisc (A) de σ(A). Já no
caso (ii) é possível pelo procedimento de Gram-Schmidt escolher elementos xn da sequência
que sejam ortonormais. Então, se y é um vetor qualquer no espaço de Hilbert H , pela
desigualdade de Bessel temos que
∞
<
|⟨y, xn ⟩|2 < ∞ ,
n=1
e, portanto,
lim |⟨y, xn ⟩| = 0 .
n→∞
Isto implica que a sequência (xn )n∈N ∈ Dom(A) converge fracamente para zero.
Observe que, de acordo com a Definição 4.30 e o Teorema 5.4, como ⟨x, Ax⟩ é real se A
é auto-adjunto, então, se A é limitado inferiormente, isto é, existe um número γ ∈ R tal que
⟨x, Ax⟩ " γ∥x∥2 , para todo x ∈ Dom(A), (−∞, γ) ∈ ρ(A). Isto implica que σ(A) ⊂
[γ, +∞). Com efeito, suponha que A é limitado inferiormente por inf x∈Dom(A) ⟨x, Ax⟩ = γ e
que λ é um ponto no espectro de A. Se (xn )n∈N é uma sequência de Weyl, então
lim |⟨xn , (A − λ1I)xn ⟩| # lim ∥(A − λ1I)xn ∥ = 0 .

n→∞ n→∞
Por outro lado, A = λ1I + (A − λ1I), e assim
⟨xn , Axn ⟩ = ⟨xn , λ1Ixn ⟩ + ⟨xn , (A − λ1I)xn ⟩ .
Consequentemente, ⟨xn , Axn ⟩ converge para λ quando n → ∞. Uma vez que A é limitado
inferiormente por γ, devemos ter λ " γ. De fato, se x é um auto-vetor associado ao auto-valor
λ, então
λ⟨x, x⟩ = ⟨x, λx⟩ = ⟨x, Ax⟩ " γ⟨x, x⟩ =⇒ λ " γ , ∀ x ∈ Dom(A) .
Isso estabelece o resultado para operadores limitados inferiormente por γ. Se γ = 0, imediata-

mente, obtemos como resultado que A é um operador positivo. Isto prova o seguinte
282
TEOREMA 5.12. Seja A um operador auto-adjunto ilimitado em um espaço de Hilbert H . Se

A é não-negativo, então o espectro de A está contido em [0, +∞). De modo mais geral, se A é
limitado inferiormente por γ, então, o espectro de A está contido em [γ, +∞), isto é
σ(A) = σdisc (A) ∪ σess (A) = [γ, +∞) .
Demonstração Alternativa do Teorema 5.12. Seja A um operador auto-adjunto com σ(A) ⊂

[γ, ∞). Temos que mostrar que A " γ, ou seja, que ⟨x, Ax⟩ " γ∥x∥2 para todo x ∈
Dom(A). Sem perda de generalidade, podemos assumir γ = 0 (caso contrário, podemos
considerar A − γ1I em vez de A). Primeiro, assuma que A é limitado (passaremos ao caso
ilimitado posteriormente). Se λ > 2∥A∥, então, o operador (A + λ1I)−1 é positivo, como segue
da série de Neumann
∞
<
−1 −1 −1 −1 −1
(A + λ1I) = λ (1I + λ A) =λ (−λ−1 A)n .
n=0
Para todo λ > 0, o operador (A + λ1I)−1 é limitado, auto-adjunto e diferenciável em λ (na

verdade, é analítico – consulte o Teorema 5.2). Portanto, segue que
d
(A + λ1I)−1 = −(A + λ1I)−2 < 0 .
dλ
Assim, para qualquer 0 < λ1 < λ
$ λ
−1 −1
(A + λ1 1I) = (A + λ1I) + dµ (A + µ1I)−2 ,
λ1
e, dessa forma, (A + λ1 1I)−1 > (A + λ1I)−1 > 0. Agora qualquer x ∈ Dom(A) pode ser
escrito na forma x = (A + λ1 1I)−1 y para algum y ∈ H . Uma vez que
⟨x, x = (A + λ1 1I)x⟩ = ⟨y, x = (A + λ1 1I)−1 y⟩ > 0 ,
para qualquer λ1 > 0, concluímos que ⟨x, Ax⟩ " 0 para todo x ∈ Dom(A), conforme
desejávamos mostrar.
Para passar para o caso dos operadores ilimitados, procedemos da seguinte forma. Sejam
λ1 > 0 e B = (A + λ1 1I)−1 um operador limitado, já que −λ1 ∈ / σ(A). Para qualquer λ ̸= 0,
temos
B + λ1I = (A + λ1 1I)−1 + λ1I = λ(A + λ1 1I)−1 (A + λ1 1I + λ−1 1I) . (5.3.5)
Portanto, para λ > 0, o operador B + λ é invertível e, então, σ(B) ⊂ [0, ∞) (de fato, pode-se
ver em (5.3.5) que B + λ também é invertível se λ < −λ−1 −1
1 e, então, σ(A) ⊂ [0, λ1 ]). Pela
prova acima, B = (A + λ1 1I)−1 " 0. Repetindo o argumento no final desta prova, descobrimos
que A + λ1 1I " 0. Como o último é verdadeiro para qualquer λ1 > 0, concluímos que
A " 0.
283
O resultado estabelecido no Teorema 5.12 é fundamental na mecânica quântica. Com efeito,

se um operador auto-adjunto A é limitado inferiormente seus auto-valores não podem ser es-
tendidos indefinidamente para −∞. Em outras palavras, o espectro discreto de A (que pode
ser vazio) não se estende para −∞. Isto está no cerne da prova da estabilidade da matéria: um
operador de energia não-relativística fisicamente aceitável não deve ter um espectro de energia
estendido para −∞; ou seja, o hamiltoniano H deve ser limitado por baixo ⟨Ψ, HΨ⟩ " γ∥Ψ∥2 ,
com Ψ ∈ Dom(H). Sabe-se hoje que um sistema formado de N elétrons e K núcleos é
estável quando governado pela mecânica quântica não-relativística. Por exemplo, no Capítulo 10,
como uma aplicação direta da auto-adjunção do hamiltoniano atômico, vamos analisar a esta-
bilidade do átomo de hidrogênio com base no fato que o hamiltoniano do átomo de hidrogênio
é limitado inferiormente. Aqui, pela frase “estabilidade do átomo de hidrogênio” entende-se
que a energia do estado fundamental desse átomo é finita. Mas, esta estabilidade depende
fundamentalmente da caracterização do auto-valor mais baixo. O problema de obter limites
inferiores para o auto-valor mais baixo de um operador auto-adjunto é notoriamente difícil.
Uma estimativa útil, que depende apenas da auto-adjunção do operador e do “isolamento” do
auto-valor mais baixo do resto do espectro, é devido a G. Temple.
TEOREMA 5.13 (Desigualdade de Temple). Seja A um operador auto-adjunto em um espaço

de Hilbert. Suponha que A tenha um auto-valor mais baixo λ0 isolado do resto do espectro e
defina 8 9
β = inf σ(A) \ {λ0 } .
Seja x um vetor normalizado no domínio de A, tal que ⟨x, Ax⟩ < β. Então,
, -
∥Ax∥2 − (⟨x, Ax⟩)2
λ0 " ⟨x, Ax⟩ − .
β − ⟨x, Ax⟩
Demonstração. Uma vez que λ0 é um auto-valor discreto e σ(A) \ {λ0 } ⊂ [β, ∞), segue que
(A − λ0 1I)(A − β1I) " 0. Assim,
⟨x, (A − β1I)Ax⟩ " λ0 ⟨x, (A − β1I)x⟩ .
Por hipótese, ⟨x, (A − β1I)x⟩ < 0, logo

, -
β⟨x, Ax⟩ − ⟨x, A2 x⟩ ∥Ax∥2 − (⟨x, Ax⟩)2
λ0 " = ⟨x, Ax⟩ − .
β − ⟨x, Ax⟩ β − ⟨x, Ax⟩
8 9
Nota 5.12. Na prática, β = inf σ(A) \ {λ0 } pode não ser conhecido e,8 portanto, é comum
9
ver este teorema afirmado para β qualquer número menor ou igual a inf σ(A) \ {λ0 } , mas
maior do que λ0 . Um β mais baixo dá uma desigualdade mais fraca.
Tosio Kato, no artigo “On the Upper and Lower Bounds of Eigenvalues,” J. Phys. Soc. Japan 4
(1949) 334, encontrou uma generalização da desigualdade de Temple para auto-valores arbitrários,
que tem a virtude adicional de ser simétrica nos limites superior e inferior. A prova da versão
seguinte desse teorema enfatiza a ideia geométrica que também é a chave para a generalização.
A versão a seguir é devido E.M. Harrell II, “Generalizations of Temple’s Inequality,” Proceedings
of the American Mathematical Society 69 (1978) 271.
284
TEOREMA 5.14 (Generalização da desigualdade de Temple). Sejam A um operador auto-

adjunto em um espaço de Hilbert H e x um vetor em Dom(A), com ∥x∥ = 1. Defina
λ = ⟨x, Ax⟩ e β = ∥(A − λ(1I))x∥ .
Portanto, β 2 = ∥Ax∥2 − λ2 . Se β 2 < (λ2 − λ)(λ − λ1 ), para números reais λ1 < λ2 , então,
σ(A) ∩ (λ1 , λ2 ) ̸= ∅. Além disso, se o único ponto do espectro no intervalo (λ1 , λ2 ) é um
auto-valor λ0 , então,
β2 β2
λ− # λ0 # λ + (5.3.6)
λ2 − λ λ − λ1
Demonstração. Suponha, ao contrário, que σ(A) ∩ (λ1 , λ2 ) = ∅. Então, se µ ∈ σ(A), segue

que
|µ − (λ2 + λ1 )/2| " (λ2 − λ1 )/2 ,
(esta é apenas a afirmação de que a distância de µ ao centro do intervalo é pelo menos tão
grande quanto metade da largura do intervalo) e
µ2 − λ2 " (λ2 + λ1 )µ − λ1 λ2 − λ2 .
Pelo teorema espectral existe um vetor x normalizado tal que µ = ⟨x, Ax⟩ e µ2 = ∥Ax∥2 .
Portanto,
∥Ax∥2 − λ2 " (λ2 + λ1 )λ − λ1 λ2 − λ2 = (λ2 − λ)(λ − λ1 ) ,
contradizendo a hipótese que β 2 < (λ2 − λ)(λ − λ1 ). Assim, σ(A) ∩ (λ1 , λ2 ) ̸= ∅. A
desigualdade (5.3.6) segue observando que a hipótese que β 2 < (λ2 − λ)(λ − λ1 ) ainda é válida
quando λ1 é aumentado para qualquer valor menor que λ − β 2 /(λ2 − λ), ou λ2 é diminuído
para qualquer valor maior que λ + β 2 /(λ − λ1 ).
Nota
8 5.13. A desigualdade
9 de Temple é um corolário do Teorema 5.14, com λ1 = ∞ e λ2 =
inf σ(A) \ {λ0 } .
O próximo resultado mostra que para cada λ ∈ ρ(A) existe uma relação canônica entre o
espectro de um operador auto-adjunto A e o espectro do operador resolvente Rλ (A).
TEOREMA 5.15 (Teorema do Mapeamento Espectral para o Resolvente). Seja A um operador
auto-adjunto em um espaço de Hilbert complexo H ̸= {0}, com conjunto resolvente ρ(A) não
vazio. Então,
3 4
1
(i) σ(Rµ (A)) \ {0} = (µ − σ(A))−1 = µ−λ | λ ∈ σ(A) para todo µ ∈ ρ(A),
(ii) afirmações análogas são válidas para os espectros discreto e essencial de A e Rµ (A).
Demonstração. Ambas as afirmações são consequências da seguinte identidade: para 0 ̸=∈ C

e µ ∈ ρ(A) segue
= >
(A − λ1I)x = (µ − λ) Rµ (A) + (µ − λ)−1 1I (A − µ1I)x para x ∈ Dom(A)
= >
= (µ − λ)(A − µ1I) Rµ (A) + (µ − λ)−1 1I x para x∈H .
285
Esta identidade mostra que
Ran(A − λ1I) = Ran(Rµ (A) + (µ − λ)−1 1I) ,
e que
Ker(A − λ1I) = Ker(Rµ (A) + (µ − λ)−1 1I) .
Logo, vemos que λ ∈ σdisc (A) se, e somente se, (µ − λ)−1 ∈ σdisc (Rµ (A)) e da mesma forma
para o espectro de auto-valores aproximados. Isto prova a afirmação (ii) e, portanto, (i).
5.4 Caracterização Variacional de Auto-Valores

Nesta seção, apresentamos uma técnica poderosa para provar a existência de auto-vetores
correspondentes aos auto-valores isolados. Seja A um operador auto-adjunto, agindo em um
espaço de Hilbert H . O principal resultado desta seção é a seguinte caracterização importante
dos auto-valores de A em termos do problema de minimização do funcional ⟨x, Ax⟩.
TEOREMA 5.16. Para qualquer x ∈ Dom(A) temos que
1. Princípio variacional de Ritz: inf ∥x∥=1 ⟨x, Ax⟩ = inf σ(A),
2. O lado esquerdo tem um minimizador x se, e somente se, Ax = λx, com λ = inf σ(A),
3. Se existe um x ∈ Dom(A) – chamado de vetor-teste – com ∥x∥ = 1 e ⟨x, Ax⟩ <

inf σess (A), então, A tem pelo menos um auto-valor abaixo de seu espectro essencial.
Antes de darmos a prova deste teorema, precisaremos de um resultado auxiliar.
LEMA 5.2. Defina S(x) = ⟨x, Ax⟩ para x ∈ Dom(A), com ∥x∥ = 1. Então, inf σ(A) =
inf S. Além disso, λ = inf σ(A) é um auto-valor de A se, e somente se, existir um minimizador
para S(x) entre os vetores x ∈ Dom(A), com a restrição que ∥x∥ = 1.
Demonstração. Como na prova da Proposição 5.6, calculamos, para x ∈ Dom(A) e µ ∈ R

satisfazendo µ < inf S = γ,
∥(A − µ1I)x∥2 = ⟨(A − µ1I)x, (A − µ1I)x⟩
= ⟨(A − µ1I + γ1I − γ1I)x, (A − µ1I + γ1I − γ1I)x⟩
= ∥⟨(A − γ1I)x∥2 + 2(γ − µ)⟨x, (A − γ1I)x⟩ + |γ − µ|2 ∥x∥2 .
Como ⟨x, (A − γ1I)x⟩ " 0, isso implica que
∥(A − µ1I)x∥2 " |γ − µ|2∥x∥2 .
Como na prova da Proposição 5.6, isso mostra que o operador A − µ1I é invertível e, portanto,
/ σ(A). Assim, inf S # inf σ(A). Agora, defina λ = inf σ(A). Pelo Teorema 5.12,
µ ∈
286
⟨x, Ax⟩ " λ∥x∥2 para qualquer x ∈ Dom(A). Logo, inf S " λ = inf σ(A) e, portanto,
inf S = inf σ(A) conforme exigido.
Agora, se λ = inf σ(A) é um auto-valor de A, com auto-vetor normalizado x0 , então,
S(x0 ) = ⟨x0 , Ax0 ⟩ = λ = inf S ,
e, portanto, x0 é um minimizador de S. Por outro lado, se x0 é um minimizador de S, entre

os vetores x ∈ Dom(A), com a restrição que ∥x∥ = 1, então, ele satisfaz a equação de
Euler-Lagrange
5
dS(x) 55
5 = 2λx0 ,
dx 5
x=x0
para algum λ. Como S ′ (x) = 2Ax, isso significa que x0 é um auto-vetor de A com auto-valor
λ. Além disso,
S(x0 ) = ⟨x0 , Ax0 ⟩ = λ∥x0 ∥2 = λ .
Como S(x0 ) = inf S = inf σ(A), conclu ımos que λ = inf σ(A) é um auto-valor de A, com
auto-vetor x0 .
Demonstração do Teorema 5.16. O Lema 5.2 dá a prova das duas primeiras partes do teorema -
o princípio variacional de Ritz: para qualquer x ∈ Dom(A),
⟨x, Ax⟩ " λ = inf σ(A) ,
e a igualdade é válida se, e somente se, Ax = λx.
Para obter a terceira parte do teorema, afirmando que se podemos encontrar x com ∥x∥ = 1
e ⟨x, Ax⟩ < inf σess (A), então, sabemos que A tem pelo menos um auto-valor abaixo de seu
espectro essencial, notamos que, pelo Lema 5.2,
inf σ(A) = inf S < ⟨x, Ax⟩ < inf σess (A) ,
então, λ = inf σ(A) deve ser um auto-valor (isolado) de A.
O princípio variacional acima pode ser estendido para auto-valores mais altos (cf. os Teoremas
5.29 e 5.39).
5.5 Espectro de Alguns Operadores da Mecânica Quântica

No caso em que λ ∈ σess (A), mas λ não é um auto-valor de A, podemos pensar nos
elementos xn de uma sequência de Weyl para A e λ como sendo auto-vetores aproximados.
Ou seja, para qualquer ε > 0, podemos encontrar um N ∈ N tal que para todo n " N,
∥(A−λ)xn ∥ < ε. Mostraremos a seguir que essa ideia é familiar da mecânica quântica. Vamos
analisar o espectro dos operadores posição, momentum e energia em 1-dimensão. Comecemos
com o
287
Exemplo 5.5 (Espectro do operador posição X). Vamos mostrar que o operador posição X
em H = L2 (R) não tem auto-valores e que σ(X) é todo R. Por questão de completeza,
vamos primeiro mostrar que X é auto-adjunto.
Para qualquer x ∈ R, assuma que XΨ(x) = xΨ(x), com domínio natural de X sendo o
subespaço
# $ ∞ %
2 2
Dom(X) = Ψ ∈ L2 (R) | dx x |Ψ(x)| < ∞ , (5.5.1)
−∞
que é denso em L2 (R). De fato, para qualquer Ψ ∈ L2 (R) tome Φ ∈ C0∞ (R) tal que Φ(x) = 1,
quando x ∈ [−1, 1], e desaparece fora desse intervalo. Considere Ψn (x) = Ψ(x)Φ(x/n); então
é claro que Ψn ∈ Dom(X). Por outro lado,
$
5 . /52
2
∥Ψ − Ψn ∥2 = dx 5Ψ(x) 1 − Φ(x/n) 5 = 0 .
|x|#n
Logo Ψn → Ψ em L2 (R), quando n → ∞, estabelecendo que Dom(X) é denso. Note que,

(5.5.1) sinaliza que podemos tomar como domínio natural de X o espaço de Schwartz, S (R)
(veja a Definição 6.7, na página 389).
O operador X é naturalmente simétrico8 uma vez que a equação

$ ∞
⟨Φ, XΨ⟩ = dx Φ∗ (x) x Ψ(x)
−∞
$ ∞
= dx (x Φ(x))∗ Ψ(x)
−∞
= ⟨XΦ, Ψ⟩ ,
é satisfeita para qualquer par de funções Φ, Ψ ∈ Dom(X).
Para mostrar que X é auto-adjunto, tome Φ ∈ Dom(X ∗ ), Φ1 ∈ L2 (R) e defina Φ1 =

X ∗ Φ. Então, por definição, ⟨Φ, XΨ⟩ = ⟨Φ1 , Ψ⟩, para todo Ψ ∈ Dom(X). Logo, expressando
os dois produtos escalares como integrais, obtemos:
$ ∞ = >
0= dx (x Φ(x))∗ − Φ∗1 (x) Ψ(x) , ∀ Ψ ∈ Dom(X) . (5.5.2)
−∞
Em particular, a Eq.(5.5.2) acontece para qualquer função Ψ ∈ L2 (R) que desaparece fora de
um intervalo finito [−n, n],
. já que toda função
/ de suporte compacto é um elemento de S (R).
Logo, tomando Ψ(x) = x Φ(x) − Φ1 (x) Ω(x/n), em que Ω(x/n) = 1 quando |x| # n, e
desaparece se |x| > n, então
$ n 5 52
5 5
0= dx 5x Φ(x) − Φ1 (x)5 .
−n
Assim, Φ1 (x) = x Φ(x) em quase toda parte em [−n, n], e, portanto, em quase toda parte
em R, uma vez que n pode ser tomado arbitrariamente grande. Isto significa que x Φ(x) é
8
Isto é, Dom(X) ⊂ Dom(X ∗ )!
288
igual a Φ1 (x) como um elemento de L2 (R). Portanto, Φ ∈ Dom(X) e Φ1 (x) = X Φ(x),

completando a prova da auto-adjunção de X.
Finalmente, para mostrar que o operador posição X, em H = L2 (R), não tem auto-
valores e que σ(X) é todo R, assuma, para qualquer λ ∈ R, que Ψ ∈ Dom(X) tal que
XΨ(x) = λΨ(x). Isto implica que (X − λ1I)Ψ(x) = 0. Portanto, pela definição de X
$ ∞
2
0 = ∥(X − λ1I)Ψ(x)∥2 = dx |x − λ|2 |Ψ(x)|2 .
−∞
Uma vez que |x − λ| > 0, para todo λ ̸= x, temos que Ψ = 0 para quase todo x ∈ R, isto
é, Ψ = 0. Isto mostra que Ψ não é um auto-vetor, e λ não é um auto-valor de X. Como λ é
arbitrário, X não tem auto-valores!
Para mostrar que σ(X) é todo R, tomamos uma sequência de funções contínuas Ψn : R →
R, com as seguintes propriedades:
1. Ψn (x) " 0;
$ ∞
2. dx Ψn (x) = 1;
−∞
$
3. dados ε > 0 e δ > 0, existe um n0 tal que, para n " n0 , dx Ψn (x) > ε.
|x|>δ
Uma sequência de funções contínuas Ψn : R → R satisfazendo às condições acima é

chamada uma identidade aproximada, ou sequência de núcleos de Dirac (veja a Definição 6.12,
na página 407).
Não é difícil mostrar (verifique isso!) que a sequência composta pelas funções
2 (x−λ)2 /2
Ψn (x) = C(n)e−n ∈ S (R) ⊂ L2 (R) ,
com C(n) = n1/2 π −1/4 satisfaz as condições exigidas para ser um núcleo de Dirac.9 Note que
Ψn ∈ Dom(X). Além disso,
$ ∞
2
∥(X − λ1I)Ψn ∥2 = dx |(X − λ1I)|2 |Ψn (x)|2
−∞
$ ∞
2 (x−λ)2
= C(n) dx (x − λ)2 e−n
−∞
$ ∞
2 y2
= C(n) dy y 2e−n = 2−1 n−5/2 π 1/4 ;
−∞
ou seja, ∥(X − λ1I)Ψn ∥22 = 2−1 n−5/2 π 1/4 → 0, quando n → ∞. Assim, (Ψn )n∈N é uma
sequência de Weyl e como λ é número real qualquer, segue do Teorema 5.11 que o espectro de
X consiste na totalidade dos números reais: σ(X) = σess (X) = R.
9
É sempre importante enfatizar que o espaço S (R) é denso em L2 (R).
289
Exemplo 5.6 (Espectro do operador momentum P ). Vamos agora considerar o operador

momentum P atuando em H = L2 (R). Para estudar o espectro de P vamos usar o método
da transformada de Fourier inversa (veja a Seção 6.6). Isto nos permite transformar a equação
diferencial
dΨ(x)
−i# = λΨ(x) .
dx
na seguinte equação algébrica (adotando-se as convenções da Seção 6.6):
^
k Ψ(k) ^
= −λΨ(k) .
Isto significa que, no espaço de Fourier, o operador P^ se comporta como um operador multi-
plicação com domínio natural
# $ ∞ %
Dom(P^) = Ψ ^ ∈ L2 (R) | 2 ^
dk k |Ψ(k)| 2
<∞ ,
−∞
que é denso em L2 (R). Logo, podemos usar toda a análise adotada anteriormente no estudo do
espectro do operador posição para concluir que σ(P ) = σess (P )R. De fato, se considerarmos,
como antes, uma sequência composta pelas funções
^ n (k) = C(n)e−n2 (k+λ)2 /2 ∈ S (R) ⊂ L2 (R) ,
Ψ
^ n ∥2 = 1 e ∥(k + λ)Ψ
com C(n) = n1/2 π −1/4 , segue que ∥Ψ ^ n ∥2 → 0, quando n → ∞. Então,
2
tomando α = n /2 na segunda parte do Lema 6.6, segue que no espaço das coordenadas
2 /2n2
Ψn (x) = C(n)n−1 (2π)−1/2 e−(x+λ) → 0 quando n→0.
Por outro lado, pelo Teorema 6.14 (Teorema de Parseval-Plancherel) nós temos que ∥Ψn ∥2 =
∥Ψ^ n ∥2 = 1. Assim, ∥(P − λ)Ψn ∥2 = ∥(k + λ)Ψ ^ n ∥2 → 0. Isto mostra que (Ψn )n∈N é uma
sequência de Weyl e que o espectro de P também consiste na totalidade dos números reais:
σ(P ) = σess (P ) = R. Além disso, assim como na análise do espectro do operador posição,
podemos concluir que P não tem auto-valores.
A seguir, vamos determinar o espectro do operador P na situação quando ele atua no espaço
H = L2 (0, 2π). Considere a equação
dΨ(x)
−i# = λΨ(x) . (5.5.3)
dx
sujeita à condição de fronteira Ψ(0) = Ψ(2π). Podemos, facilmente, concluir que a solução da
equação de auto-valor (5.5.3) tem como solução a função
1
Ψ = Ψm = √ eimx , m∈Z.
2π
Portanto, λ = λm = m. Não é difícil verificar que para λ ̸= λm a equação (P − λ1I)Ψ = Φ
ou, equivalentemente,
dΨ(x)
−i# − λΨ(x) = Φ(x) , com Ψ(0) = Ψ(2π) ,
dx
tem solução para toda função Φ ∈ L2 (0, 2π). Neste caso, σess (P ) = ∅.
290
Exemplo 5.7 (Espectro do operador energia H). Considere o operador hamiltoniano
#2 d 2
H0 = − ,
2m dx2
atuando em H = L2 (R). Para estudar seu espectro, considere a equação
(H0 − λ)Ψ(x) = 0 .
Assuma que λ = #2 γ 2 /2m. Assim, a equação acima é equivalente à equação
d2 Ψ(x)
+ γ 2 Ψ(x) = 0 ,
dx2
cuja solução geral é
Ψ(x) = C1 eiγx + C2 e−iγx .
É evidente que esta solução não pertence ao domínio Dom(H0 ), uma vez que |e±iγx | = 1,
a não ser que as constantes C1 = C2 = 0, caso em que Ψ(x) ≡ 0. Portanto, H0 não tem
auto-valores.
Vamos examinar o espectro de H0 . Para isto, vamos reescrever a equação
(H0 − λ)Ψ(x) = 0 ,
da seguinte forma:
#2 6 √ 76 √ 7
(H0 − λ1I)Ψ(x) = − P + 2m#−1 λ1I P − 2m#−1 λ1I Ψ(x) = 0 .
2m
Note
√ que, neste caso, o domínio de ambos operadores é Dom(H0 ). Note também que,
± 2m#−1 λ pertencerá ao conjunto resolvente de P a não ser que λ " 0. No entanto, já
vimos no Exemplo 4.13, na página 217, que o operador P é auto-adjunto em L2 (R). Isto implica,
pelo Teorema 5.4, que λ deve ser " 0. Desta forma, λ ∈ ρ(H0 ) se λ é negativo!
Para determinarmos o espectro de H0 podemos usar o seguinte método: considerando λ > 0,

defina
Ψn (x) = Φn (x)eiγx ,
em que
2 /n2
Φn (x) = C(n)n−1 π 1/2 e−x ∈ S (R) ⊂ L2 (R) .
A constante C(n) é escolhida de tal forma que
$ ∞
dx |Φn (x)|2 = 1 .
−∞
Logo, ∥Ψn ∥2 = 1 . Com esta escolha, segue que
dΨn (x) . /
= iγ − 2n−2 x Ψn (x) ,
dx
e
d2 Ψn (x) . 2 /
2
= −γ − 2n−2 − i4γn−2 x + 4x2 n−4 Ψn (x) .
dx
291
Desta última equação segue que

?, 2 - ?
? d ?
? + γ 2
Ψ ? # 2n−2 ∥Φn ∥2 + 4γn−2 ∥xΦn ∥2 + 4n−4 ∥x2 Φn ∥2 .
? dx2 n ?
2
Aqui, devemos ressaltar que como Φn ∈ S (R), então, xα Φn ∈ S (R), para qualquer potência
α de x, devido às propriedades do espaço de Schwartz (veja detalhes no Capítulo 6). Logo, isto
mostra que
∥(H0 − λ)Ψn ∥ → 0 quando n → ∞ .
Portanto, (Ψn )n∈N é uma sequência de Weyl e λ ∈ σ(H0 ). Visto que λ > 0, podemos concluir
que o eixo real positivo está contido em σ(H0 ). Em contrapartida, como pelo Corolário 5.2,
σ(H0 ) é um conjunto fechado, o valor λ = 0 deve também estar em σ(H0 ), mas não pode
ser um auto-valor já que H0 Ψ = 0 implica que Ψ = 0. Isto prova que o espectro do operador
energia, H0 , consiste dos números reais não-negativos: σ(H0 ) = σess (H0 ) = [0, ∞).
Os Exemplos 5.5 e 5.7 evidenciam um fato importante: os auto-vetores associados com o

espectro contínuo de um operador auto-adjunto não pertencem ao espaço de Hilbert. Assim,
para considerar adequadamente o espectro contínuo de um operador auto-adjunto é necessário,
de algum modo, ir para além dos limites restritos da teoria dos espaços de Hilbert. Para
isto, devemos recorrer à uma construção conhecida como tripleto de Gel’fand, uma idealização
que vincula a teoria das distribuições e o espaço L2 (Rn ). Tal construção foi introduzida para
estudar a teoria espectral num sentido mais amplo. Ela trata os espectros pontual e contínuo de
forma unificada. Como veremos no Capítulo 6, as equações de auto-valores para os operadores
X e P admitem soluções no sentido distribucional.
Exemplo 5.8 (Espectro quando um operador é estendido). Se um operador linear A é
substituído por A′ , uma extensão de A, então os conjuntos σdisc (A), σcont (A), σres (A) e
ρ(A) no plano complexo são modificados. Por exemplo, embora o espectro discreto σdisc (A)
não possa diminuir, ele pode aumentar, porque um auto-vetor de A′ pode não pertencer ao
domínio Dom(A). O espectro residual σres (A) não pode aumentar (porque Dom(A−λ1I)−1
está contido em Dom(A′ − λ1I)−1 , e se este último não é denso, então, também não o é o
primeiro) mas pode diminuir. Vamos ilustrar uma situação, novamente, considerando o operador
momentum P , mas desta vez atuando em L2 (R+ ) com domínio
3 4
Dom(P ) = Ψ ∈ S (R+ ) ⊂ L2 (R+ ) | Ψ′ (x) ∈ L2 (R+ ), Ψ(0) = 0 ,
O operador adjunto P ∗ é uma extensão de P e, como já vimos, seu domínio inclui elementos
de S (R+ ) que não satisfazem a condição de contorno; isto é,
3 4
Dom(P ∗) = Ψ ∈ S (R+ ) ⊂ L2 (R+ ) | Ψ′ (x) ∈ L2 (R+ ) .
Isto implica que P , apesar de ser simétrico, não é auto-adjunto e, como vimos, não tem extensão
auto-adjunta.
Agora, assuma que λ ∈ C, com Im λ > 0. Se λ é um auto-valor de P ou P ∗ , então, a

auto-função, Ψ, é a solução da equação
dΨ(x)
−i# = λΨ(x)
dx
292
Logo,
−1 x
Ψ = Ceiλ# ,
é uma auto-função de P ∗ , para Im λ > 0, mas não de P , pois não pertence ao domínio
Dom(P ) a menos que a constante C seja zero, caso em que Ψ(x) ≡ 0. No entanto, λ está
no conjunto resolvente ρ(P ) de P , como pode ser visto resolvendo a equação
dΨ(x)
−i# − λΨ(x) = Φ(x) ,
dx
para uma dada função Φ ∈ S (R+ ). A solução da equação acima é
$ x
−1
Ψ(x) = dy eiλ# (x−y) Φ(y) ,
0
como se pode verificar. Com efeito, usando-se a fórmula de Leibnitz, obtemos que
$ x $ x
d iλ#−1 (x−y) −1
−i# dy e Φ(y) = λ dy eiλ# (x−y) Φ(y) + Φ(x) .
dx 0
B CD E B0 CD E
Ψ(x) Ψ(x)
Além disso, essa solução é única, devido à condição de contorno Ψ(0) = 0. A função Ψ é
contínua, e como Φ ∈ S (R+ ) e Im λ > 0, então, Ψ ∈ S (R+ ) também, portanto está em
L2 (R+ ). As funções em S (R+ ) são densas em L2 (R+ ), logo (P − λ1I)−1 existe e possui
domínio denso. Consequentemente, a desigualdade
1
∥Rλ (P )Φ∥ # ∥Φ∥ ,
Im λ
aplica-se, porque P é simétrico, portanto (P − λ1I)−1 é limitado. A conclusão é que o semi-
plano superior do plano complexo está no conjunto resolvente ρ(P ) de P , mas no espectro
discreto σdisc (P ∗ ) de P ∗ .
Um exemplo típico que analisaremos no Capítulo 10 é o espectro do átomo do hidrogênio.

Todas as energias não negativas constituem o espectro contínuo, correspondendo aos possíveis
estados quânticos do elétron livre que foi “arrancado” do campo elétrico do próton (o estado
livre do elétron é chamado estado espalhado). Além disso, existe um número infinito de estados
com energia negativa no espectro discreto, correspondendo aos estados em que o elétron está
ligado ao campo elétrico do próton (esses níveis de energia são limitados inferiormente e têm
o zero como um ponto de acumulação por cima). O espectro do operador hamiltoniano, H,
do átomo do hidrogênio consiste, portanto, em uma integraão sobre o espectro contínuo, σcont ,
mais uma soma sobre o espectro discreto, σdisc .
5.6 Teorema da Decomposição Espectral para Operadores

Auto-Adjuntos Limitados
Em um curso de Álgebra Linear um teorema frequentemente discutido é o teorema que esta-
belece que qualquer matriz n × n hermitiana pode ser representada como uma matriz diagonal
em alguma base, com os seus auto-valores sendo os elementos da diagonal. Este teorema,
293
frequentemente denominado Teorema Espectral, é extremamente útil porque os cálculos envol-

vendo uma matriz diagonalizável podem ser reduzidos a cálculos muito mais simples envolvendo
a matriz diagonal correspondente. O conceito de diagonalização é relativamente simples para
operadores em espaços vetoriais de dimensão finita, mas requer alguma modificação para ope-
radores em espaços de dimensão infinita. Resumidamente, o Teorema Espectral estabelece
d que
qualquer operador auto-adjunto A pode ser representado por uma integral A = dE(λ) λ
com respeito àlgumad medida espectral E (que é única). Isto nos dá a possibilidade de definir
funções f (A) = dE(λ) f (λ) do operador. Existem várias provas disponíveis desse teorema
na literatura, muitas altamente complexas, longas e com algumas variações espalhadas entre as
diferentes provas.10 Na análise abaixo, apresentaremos o Teorema Espectral para o caso de um
operador auto-adjunto limitado arbitrário, A, operando em um espaço de Hilbert, H , com-
plexo, separável e de dimensão infinita (a discussão do mesmo teorema no caso de um operador
auto-adjunto ilimitado será deixada para a Seção 5.10).
Nota 5.14. Em sua forma embrionária, o Teorema Espectral apareceu no problema elementar de
Geometria, relacionado com a redução de uma cônica a seus eixos principais. Uma importante
aplicação desta ideia surge no estudo da dinâmica rotacional de um corpo rígido. Pode-se provar
que para todo corpo rígido, qualquer que seja sua forma, existem (pelo menos) três direções
mutuamente perpendiculares para as quais o momento angular é paralelo ao eixo de rotação.
Eles são chamados de eixos principais de inércia e os momentos de inércia correspondentes são
chamados de momentos principais de inércia. Por esta razão, e para evitar torques transversais
(que são tão danosos, por serem responsáveis por vibrações destrutivas), os eixos rotativos de
qualquer mecanismo devem ser montados em um eixo principal.
5.6.1 Operadores de Projeções Ortogonais
Como preparação para a nossa discussão sobre o Teorema da Decomposição Espectral,

iniciamos obtendo alguns resultados sobre projeções ortogonais. Sejam H um espaço de
Hilbert e M um subespaço fechado de H ; então, de acordo com o Teorema 3.5, segue que
H = M ⊕ M ⊥ . Ou seja, cada vetor x ∈ H escreve-se de maneira única como x = y + z,
com y ∈ M e z ∈ M ⊥ . O operador P : H → M definido por P x = y denomina-se
projeção ortogonal de H sobre M. Note que, P atua como o operador identidade em M e
como o operador nulo sobre Ran(P )⊥ . No Exemplo 4.2 nós generalizamos esta decomposição
escrevendo
<
H = Mi , Mi ∩ Mj = {0} , i ̸= j , (5.6.1)
i∈I
em que os Mi são subespaços lineares fechados, e

<
x= xi , xi ∈ Mi , ⟨xi , xj ⟩ = 0 , i ̸= j ,
i∈I
(a soma acima é finita ou infinita contável), então, a decomposição (5.6.1) nos permite definir,
naturalmente, operadores de projeções ortogonais, Pi , sobre cada subespaço Mi ,
Pi : H → Mi , Pi (H ) = Mi ,
10
Observações históricas sobre algumas provas do teorema Espectral podem ser encontradas no livro-texo de
César R. de Oliveira, “Intermediate Spectral Theory and Quantum Dynamics,” Progress in Mathematical Physics 54,
Birkhäuser, 2009, na pag.225.
294
com a composição Pi Pj = O, se i ̸= j. Isto significa que se x é um elemento de H , então,

x = x1 + · · · + xn , em que xi ∈ Mi . Diz-se que (x1 + · · · + xn ) é a decomposição ortogonal
de x em relação a Mi , e Pi (x) = xi é a componente ortogonal, ou projeção ortogonal, de x
em Mi .
TEOREMA 5.17. Sejam H um espaço de Hilbert e PM o operador de projeção associado com o

subespaço fechado M de H . Então,
(i) PM é linear e simétrico,
2
(ii) PM é limitado, com ∥PM ∥ = 1, e PM = PM (idempotente), com PM |M = 1I (identidade
em M),
(iii) PM é sobrejetor, isto é, o conjunto imagem de PM é todo M,
(iv) M ⊥ = Ker(PM ) e PM ⊥ = 1I − PM (1I sendo a identidade em H ),
(v) PM PM ⊥ = PM ⊥ PM = O (operador nulo),
(vi) PM é auto-adjunto,
∗ ∗
(vii) PM é normal, isto é, PM PM = PM PM ,
(viii) ∥PM x∥2 = ⟨x, PM x⟩, para todo x ∈ H ; isto é, PM em H é positivo.
Demonstração. Item (i). Sejam x1 , x2 ∈ H . Assuma que x1 = y1 + z1 e x2 = y2 + z2 , com

y1 , y2 ∈ M e z1 , z2 ∈ M ⊥ . Então, x1 + x2 = (y1 + z1 ) + (y2 + z2 ) e
PM (x1 + x2 ) = y1 + y2 = PM x1 + PM x2 .
Analogamente, temos que para qualquer número complexo α, PM (αx) = αPM x. Além disso,
⟨x2 , PM x1 ⟩ = ⟨(y2 + z2 ), y1 ⟩ = ⟨y2, y1 ⟩ + ⟨z2 , y1 ⟩ = ⟨y2 , y1 ⟩
= ⟨y2 , (y1 + z1 )⟩ = ⟨y2, x1 ⟩ = ⟨PM x2 , x1 ⟩ .
Item (ii). Para x ∈ H , assuma que x = y + z, com y ∈ M e z ∈ M ⊥ . Então, temos que

PM PM x = PM (PM x) = PM y = y = PM x. Isto implica que PM |M = 1I (identidade em M).
Além disso,
∥x∥2 = ⟨x, x⟩ = ⟨(y + z), (y + z)⟩ = ∥y∥2 + ∥z∥2 ,
ou seja, ∥x∥ " ∥y∥ = ∥PM x∥, de forma que ∥PM ∥ # 1. Se x ∈ M, então, a decomposição
x = x + 0 acontece; portanto, ∥x∥ = ∥PM x∥. Consequentemente, para ∥x∥ " ∥PM x∥ a
igualdade acontece se x ∈ M. Assim, mostramos que ∥PM ∥ = 1.
Item (iii). Temos que mostrar M = PM H é um subespaço fechado. Seja (yn )n∈N uma
sequência arbitrária em M, tal que limn→∞ yn = y. Devemos mostrar que y ∈ M. Como
295
yn ∈ PM H , existem vetores xn ∈ H para os quais PM xn = yn . Além disso, pelo Item (ii),

PM PM xn = PM (PM xn ) = PM yn = yn = PM xn e, assim,
PM y − yn = PM y − PM yn = PM (y − yn ) .
Pela limitação de PM , segue que
∥PM y − yn ∥ # ∥y − yn ∥ .
Tomando o limite n → ∞, obtemos que ∥PM y − y∥ # 0, ou seja, que PM y = y. Portanto,

y ∈ PM H = M. Além disso, provamos que PM y = y para todo y ∈ M. Logo, Ran(PM ) =
M.
Item (iv). Sabemos que cada vetor x ∈ H escreve-se de maneira única como x = y + z,
com y ∈ M e z ∈ M ⊥ . Logo,
x = y + z = PM x + PM ⊥ x = (PM x + PM ⊥ )x =⇒ PM x + PM ⊥ = 1I .
Logo, temos que PM ⊥ = 1I − PM . Além disso,
⟨PM x, (1I − PM )x⟩ = ⟨x, PM (1I − PM )x⟩ = ⟨x, (PM − PM PM )x⟩ = 0 .
Portanto, isto implica que M ⊥ = Ker(PM ).
Item (v). Como todo vetor não-nulo x ∈ H pode ser escrito de maneira única como
x = y + z, com y ∈ M e z ∈ M ⊥ , então,
0 = ⟨y, z⟩ = ⟨PM x, PM ⊥ x⟩ .
Como PM e PM ⊥ são simétricos, segue que
0 = ⟨PM x, PM ⊥ x⟩ = ⟨x, PM PM ⊥ x⟩ = ⟨PM ⊥ PM x, x⟩ .
Logo, temos que PM PM ⊥ = PM ⊥ PM = O, sendo O o operador nulo.
Item (vi). Como PM é simétrico, limitado e tem como domínio todo o espaço de Hilbert
H , então, de acordo com o Teorema de Hellinger-Toeplitz (Teorema 4.14), PM é auto-adjunto.
Item (vii). Isto é uma consequência imediata do fato de PM ser idempotente e auto-adjunto.
Item (viii). Para todo x ∈ H segue que
⟨x, PM x⟩ = ⟨x, PM PM x⟩ = ⟨PM x, PM x⟩ = ∥PM x∥2 " 0 .
Exemplo 5.9. Em H = R2 , a matriz

( )
1 1
E= ,
0 0
296
é idempotente, mas não ortogonal, já que

( )
0 −1
E∗ = .
0 1
Por outro lado, em H = R2 , a matriz

( )
cos θ − sin θ
F = ,
sin θ cos θ
é auto-adjunta, mas não é idempontente.
TEOREMA 5.18. Sejam H um espaço de Hilbert e P1 , P2 dois operadores de projeções ortogonais.
Então, as seguintes propriedades são equivalentes:
(i) P1 # P2 ,
(ii) ∥P1 x∥ # ∥P2 x∥, para todo x ∈ H ,
(iii) M1 = P1 H ⊂ M2 = P2 H ,
(iv) P1 P2 = P2 P1 = P1 .
Demonstração. Item (i) =⇒ Item (ii). Por serem idempotentes P1 e P2 , segue imediatamente
que (i) implica (ii). Com efeito, temos que ⟨x, P1 x⟩ # ⟨x, P2 x⟩, para todo x ∈ H . Logo,
seguindo o mesmo desenvolvimento da demonstração do Item (viii), do Teorema 5.17, segue
que ∥P1 x∥ # ∥P2 x∥, para todo x ∈ H .
Item (ii) =⇒ Item (iii). Tome y ∈ M1 ; logo, ∥P2 y∥ = ∥y∥, já que

∥y∥2 = ⟨y, y⟩ = ⟨y, P1y⟩ = ⟨y, P1P1 y⟩ = ⟨P1 y, P1y⟩ = ∥P1 y∥2 # ∥P2 y∥2 .
Portanto, ∥y∥ # ∥P2 y∥. Por outro lado, pelo desenvolvimento da demonstração do Item (ii),
do Teorema 5.17, sabemos que para y ∈ M temos que ∥y∥ = ∥P2 y∥. Disto e observando que
∥y∥2 = ∥P2 y∥2 + ∥(1I − P2 )y∥2, resulta que (1I − P2 )y = 0. Assim, P2 y = y, isto é, y ∈ M2 .
Item (iii) =⇒ Item (iv). Para todo x, y ∈ H segue que P2 P1 x = P1 x. Com efeito,
⟨y, P2P1 x⟩ = ⟨P2 y, P1x⟩ = ⟨P1 P2 y, x⟩| = ⟨P1 y, x⟩ = ⟨y, P1x⟩ .
Item (iv) =⇒ Item (i). Observamos que 1I−P1 também é uma projeção ortogonal, portanto
positiva. Para x ∈ H resulta que
⟨x, (P2 − P1 )x⟩ = ⟨x, P2 x⟩ − ⟨x, P1 x⟩ = ⟨x, P2 x⟩ − ⟨x, P2 P1 x⟩ = ⟨x, P2 (1I − P1 )x⟩ " 0 ,
pois P2 comuta com 1I − P1 e ambos são positivos.
COROLÁRIO 5.6. Sejam H um espaço de Hilbert e P1 , P2 e P3 operadores de projeções ortogo-
nais. Assuma que P1 x + P2 x = P3 x, para todo x ∈ H . Então, P1 H ⊕ P2 H = P3 H . Esta
igualdade implica que P1 H ⊂ P2 H ⊂ P3 H .
297
Demonstração. De acordo com o Teorema 5.17, para todo x ∈ H temos que
∥x∥2 " ⟨P3 x, P3 x⟩ = ⟨x, P3 x⟩ = ⟨x, (P1 + P2 )x⟩
= ⟨x, P1 x⟩ + ⟨x, P2 x⟩
= ⟨P1 x, P1 x⟩ + ⟨P2 x, P2 x⟩
= ∥P1 x∥2 + ∥P2 x∥2 .
Suponha, em particular, que x = P1 y, com y ∈ H arbitrário, então,
∥P1 y∥2 " ∥P1 P1 y∥2 + ∥P2 P1 y∥2 = ∥P1 y∥2 + ∥P2 P1 y∥2 ,
ou seja, P2 P1 y = 0 para todo y ∈ H . Portanto, P1 H e P2 H são ortgonais e o corolário

segue.
TEOREMA 5.19. Sejam H um espaço de Hilbert e (Pn )n∈N uma sequência de operadores de pro-
jeções ortogonais em H , com ⟨x, Pm x⟩ # ⟨x, Pn x⟩ ou ⟨x, Pm x⟩ " ⟨x, Pn x⟩, respectivamente,
para todo m # n, com m, n ∈ N. Então, para todo x ∈ H existe um operador de projeção
ortogonal P em H tal que limn→∞ Pn x = P x e ⟨x, Pn x⟩ # ⟨x, P x⟩ ou ⟨x, Pn x⟩ " ⟨x, P x⟩,
respectivamente, para n ∈ N.
Demonstração. O segundo caso, quando ⟨x, Pm x⟩ " ⟨x, Pn x⟩, pode ser reduzido ao primeiro
simplesmente considerando a sequência 1I − P1 , 1I − P2 , . . . Portanto, basta considerarmos o
primeiro caso. Logo, para todo m # n, obtemos, pelo Teorema 5.18, que ∥Pm x∥ # ∥Pn x∥. A
seguir, vamos primeiro mostrar que Pn − Pm atuando em H é um operador de projeção. A
simetria de Pn − Pm em H é óbvia. Com efeito, sendo Pm e Pn projetores ortogonais segue
que
⟨x, (Pn − Pm )x⟩ = ⟨x, Pn x⟩ − ⟨x, Pm x⟩ = ⟨Pn x, x⟩ − ⟨Pm x, x⟩ = ⟨(Pn − Pm )x, x⟩ .
Resta somente mostrar que Pn − Pm é idempotente. Como ∥Pm x∥ # ∥Pn x∥, para todo
x ∈ H , então, definindo x = (1I − Pn )y, com y ∈ H arbitrário, então,
∥Pm (1I − Pn )y∥ # ∥Pn (1I − Pn )y∥ = ∥(Pn − Pn )y∥ = 0 ,
isto implica que Pm = Pm Pn em H . Além disso, temos que para todo x, y ∈ H
⟨y, Pmx⟩ = ⟨Pm y, x⟩ = ⟨Pm Pn y, x⟩ = ⟨Pn y, Pmx⟩ = ⟨y, Pn Pm x⟩ .
Portanto, Pm = Pn Pm em H também. Logo, tudo isto reunido nós dá
(Pn − Pm )2 = Pn − Pn Pm − Pm Pn + Pm = Pn − Pm .
Consequentemente, Pn − Pm é um operador de projeção.
Observe que, a sequência numérica (∥Pn x∥)n∈N é limitadad e monótona crescente, já que
∥Pn x∥ # ∥x∥ e ∥Pm x∥ # ∥Pn x∥. Assim, limn→∞ ∥Pn x∥ existe. Como Pn − Pm é um
298
operador de projeção, pelo Teorema 5.17 ele é positivo; portanto,

0 # ∥(Pn − Pm )x∥2 = ⟨(Pn − Pm )x, (Pn − Pm )x⟩
= ⟨(Pn − Pm )x, x⟩
= ⟨Pn x, x⟩ − ⟨Pm x, x⟩
= ∥Pn x∥2 − ∥Pm x∥2 < ε2 para todo m, n > N(ε) e n " m .
Como H é completo, para todo x ∈ H existe um y ∈ H tal que limn→∞ Pn x = y. Se
assumirmos que y = P x, vemos imediatamente que P em H é um operador linear simétrico
que satisfaz a condição P 2 = P . A simetria de P segue da relação
⟨z, P x⟩ = lim ⟨z, Pn x⟩ = lim ⟨Pn z, x⟩ = ⟨P z, x⟩ ,
n→∞ n→∞
para todo x, z ∈ H . Além disso, temos que
⟨z, P 2 x⟩⟨P z, P x⟩ = lim ⟨Pn z, Pn x⟩ = lim ⟨Pn2 z, x⟩ = lim ⟨Pn z, x⟩ = ⟨P z, x⟩ ,
n→∞ n→∞ n→∞
de forma que P 2 = P . Portanto, P é um operador de projeção. Ainda, ∥Pn x∥ # ∥P x∥ implica

que
⟨x, Pn x⟩ = ⟨x, Pn Pn x⟩ = ⟨Pn x, Pn x⟩ = ∥Pn x∥2 # ∥P x∥ = ⟨P x, P x⟩ = ⟨x, P x⟩ .
Para finalizar, precisamos garantir que P é auto-adjunto. Usando o mesmo raciocínio apli-
cado ao Item (ii), do Teorema 5.17, mostra-se que ∥P ∥ = 1. Então, como P é simétrico,
limitado e tem como domínio todo o espaço de Hilbert H , então, de acordo com o Teorema
de Hellinger-Toeplitz (Teorema 4.14), P é auto-adjunto. Dessa forma, o teorema está demons-
trado.
Exemplo 5.10 (Espaços de Hilbert de dimensão finita). Considere um operador auto-adjunto
limitado A atuando em um espaço de Hilbert complexo H de dimensão finita. Neste
caso, existe uma base ortonormal {xi }ni=1 consistindo de auto-vetores do operador A cor-
n
respondente;naos auto-valores reais λi . Visto que {xi }i=1 é uma base ortonormal temos
que x = i=1 ⟨xi , x⟩xi , para todo x ∈ H . Note que, se definirmos o operador Pi por
Pi x = ⟨xi , x⟩xi , então, segue que
<n n
< n
<
x= ⟨xi , x⟩xi = Pi x =⇒ 1I = Pi . (5.6.2)
i=1 i=1 i=1
Como já enfatizado, a expressão na implicação acima é chamada resolução da identidade.
Verifica-se facilmente que Pi ;é um operador de projeção. Além disso, o operador auto-adjunto
A tem a representação A = ni=1 λi Pi . Com efeito,
< n n
<
Ax = ⟨xi , Ax⟩xi = ⟨Axi , x⟩xi
i=1 i=1
n
<
= λi ⟨xi , x⟩xi
i=1
n
< n
<
= λi Pi x =⇒ A = λi Pi . (5.6.3)
i=1 i=1
299
Em resumo nos temos o seguinte

TEOREMA 5.20 (Teorema espectral para dimensões finitas). Seja A um operador auto-
adjunto em um espaço de Hilbert complexo H de dimensão finita. Então, A tem uma base
ortonormal de auto-vetores, isto é, existe uma base ortonormal, {xj }nj=1, e {λj }nj=1 em R, de tal
que Axj = λj xj .
Este teorema é um caso especial do análogo para operadores auto-adjuntos limitados ou não
que discutiremos a partir de agora.
5.6.2 Operadores Compactos
Ao passarmos para situação em que A é um operador linear em um espaço de Hilbert

complexo H de dimensão infinita espera-se que a soma finita seja substituída por uma sé-
rie convergente. De fato, para uma certa classe especial de operadores limitados chamados
operadores compactos, ou completamente contínuos, as Eqs.(5.6.2) e (5.6.3) são generalizadas di-
retamente. Neste caso, veremos que existe uma relação muito estreita e que é possível resolver
problemas de dimensão infinita por técnicas de dimensão finita. Efetivamente, uma grande
parte da análise espectral é baseada nesses operadores. Operadores compactos em espaços de
Hilbert de dimensão infinita comportam-se como se fossem “quase operadores” em um espaço
de dimensão finita (por exemplo, eles não têm espectro contínuo). Consequentemente, as pro-
priedades espectrais de um operador compacto simulam, tanto quanto possível, as propriedades
de uma matriz simétrica.
DEFINIÇÃO 5.7. Sejam H um espaço de Hilbert complexo e A : H → H um operador linear.
Diz-se que A é compacto, ou absolutamente contínuo se toda sequência limitada (xn )n∈N em
H contém uma subsequência (xnk )k∈N para a qual a sequência (Axnk )k∈N converge fortemente
para algum vetor x ∈ H .11
A definição acima é equivalente a afirmar que se (xn )n∈N é uma sequência em H e

w s
xn −→ 0, então, Axn −
→ 0, ou seja, ∥Axn ∥ → 0.
O uso da terminologia operador compacto é bastante claro a partir da sua definição. Um

operador limitado mantém o status quo em relação às sequências convergentes; isto é, se
(xn )n∈N converge, o mesmo acontece com a sequência (Axn )n∈N se A for contínuo. Mas um
operador compacto “força” as sequências a convergirem, mesmo que elas não tenham convergido
originalmente. Para que a definição de compacidade seja interessante, deve ser possível escolher
uma sequência infinita de vetores que tenha uma subsequência que não convirja. Em um
espaço de dimensão finita, é impossível encontrar tal sequência devido à existência do Teorema
de Bolzano-Weierstrass, que estabelece que para toda sequência limitada de pontos no espaço
euclidiano n-dimensional, é sempre possível selecionar uma subsequência convergente. Assim,
a definição é vazia em um espaço de dimensão finita; ou, em outras palavras, pode-se dizer
que em um espaço vetorial de dimensão finita todos os operadores são compactos.
TEOREMA 5.21. Seja H um espaço de Hilbert complexo. Se um operador linear A : H → H
é compacto, então, A é limitado.
11
Lembramos que uma sequência de vetores (xn )n∈N é dita limitada quando ∥xn ∥ # C, para alguma constante
C > 0 e para todo n.
300
Demonstração. Se A em H não é limitado, então, deve existir uma sequência (xn )n∈N ⊂ H ,
com ∥xn ∥ # C, para alguma constante C > 0 e para todo n, tal que ∥Axn ∥ > n∥x∥. Vamos
definir yn = xn /∥xn ∥. Então, ∥yn ∥ = 1 e ∥Ayn ∥ > n. Logo, ∥Ayn ∥ → ∞ quando n → ∞.
Deste modo, a sequência (yn )n∈N não pode conter uma subsequência (ynk )k∈N para qual o
limite limk→∞ Aynk existe, o que contradiz a Definição 5.7. Portanto, A deve ser limitado.
Nota 5.15. Ao contrário do que ocorre em um espaço de Hilbert de dimensão finita em que a
noções de um operador ser limitado ou compacto coincidem, como mencionado acima, no caso
de um espaço de Hilbert de dimensão infinita isto não é verdade. De fato, o Teorema 5.21 não
tem um inverso, isto é, se um operador linear A em espaço de Hilbert complexo H é limitado,
ele não é necessariamente compacto. Curiosamente, o operador identidade é um dos exemplos
mais típicos de operadores limitados que não é compacto. Com efeito, considere o espaço ℓ2
(veja Exemplo 2.5) e um sistema ortonormal infinito de vetores {x1 , x2 , . . .} ⊂ ℓ2 . Seja 1I o
operador identidade em ℓ2 . Uma vez que 1Ixn = xn para qualquer n, certamente√1I é limitado,
uma vez que ∥1I∥ = 1. Entretanto, como ∥1Ixn − 1Ixm ∥ = ∥xn − xm ∥ = 2, para todo
n, m (com n ̸= m), é impossível extrair uma subsequência convergente da sequência (1Ixn )n∈N .
Assim, 1I não é compacto. É interessante observar que a ausência dessa subsequência é apenas
uma outra forma de estabelecer o Teorema 3.13, que afirma que a bola unitária fechada em
espaços de Hilbert de dimensão infinita não é compacta. Portanto, em espaços de Hilbert de
dimensão infinita, operadores compactos preenchem uma posição que é totalmente contrária à
do operador identidade.
Uma outra definição (equivalente à Definição 5.7) que exibe uma propriedade importante
dos operadores compactos, e muitas vezes mais conveniente em certas aplicações, é dada pela
seguinte
PROPOSIÇÃO 5.13. Sejam H um espaço de Hilbert complexo e A : H → H um operador

linear compacto. Então, dada uma sequência de vetores (xn )n∈N ⊂ H que converge fracamente
para x ∈ H , a sequência dos vetores transformados (Axn )n∈N converge fortemente para Ax,
isto é, ∥Axn − Ax∥ → 0.
w
Demonstração. Suponha que xn −→ x. Logo, ∥xn ∥ # C, para alguma constante C > 0 e para
todo n. Seja yn = Axn . Então, segue que
⟨z, yn ⟩ − ⟨z, y⟩ = ⟨z, Axn ⟩ − ⟨z, Ax⟩
= ⟨z, A(xn − x)⟩
= ⟨A∗ z, (xn − x)⟩ para qualquer z ∈ H .
Isto implica que limn→∞ |⟨A∗ z, (xn − x)⟩| = 0. Assim, a sequência (yn )n∈N converge fraca-
mente para y = T x em H . Suponha que a sequência (yn )n∈N não converge para y na norma.
Então, existe um ε > 0 e uma subsequência (ynk )k∈N de (yn )n∈N tal que ∥ynk − y∥ " ε.
Mas, como a sequência (xn )n∈N é limitada e A é compacto, pela Definição 5.7, a sequência
(yn )n∈N dever conter uma subsequência que converge fortemente para algum vetor y1 ∈ H ,
com y1 ̸= y. Como, pela Proposição 3.12, a convergência forte implica na convergência fraca,
esta subsequência deve convergir fracamente para y1 . Mas, isto é impossível já que a sequência
(yn )n∈N converge fracamente para y. Portanto, como todo espaço de Hilbert é Hausdorff, pela
301
Proposição 1.15, limites de sequências devem ser únicos, ou seja, devemos ter y1 = y. Logo, a
sequência (yn )n∈N converge para y na norma.
A teoria dos operadores compactos tem muitas utilidades na teoria quântica, algumas das
quais nós vamos encontrar no Capítulo 7. Por esse motivo, alguns resultados relacionados com
os operadores compactos merecem atenção especial. Comecemos com o seguinte
TEOREMA 5.22. Sejam H um espaço de Hilbert complexo, A1 , A2 : H → H operadores

lineares compactos e B : H → H um operador linear limitado. Então, (a) αA1 + βA2 é
compacto; (b) os produtos Aj B e BAj (j = 1, 2) são compactos.
Demonstração. (a) Se (xn )n∈N é qualquer sequência limitada em H , existe uma constante
C > 0 tal que ∥xn ∥ # C para todo n ∈ N. Logo, uma vez que A1 é compacto, existe
uma subsequência (xnk )k∈N da sequência (xn )n∈N tal que a sequência (A1 xnk )k∈N converge
(fortemente) para algum vetor x1 ∈ H . Além disso, a sequência (xnk )k∈N também é limitada e
deve conter uma subsequência (xnℓ )ℓ∈N , tal que a sequência (A2 xnℓ )ℓ∈N converge (fortemente)
para um vetor x2 ∈ H , visto que A2 é compacto. Consequentemente, a sequência αA1 xn1 +
βA2 xn1 + · · ·+ αA1 xnk + βA2 xnk + · · · é convergente. Assim, pela linearidade dos operadores
A1 , A2 , obtemos que αA1 +βA2 é compacto e que o espaço dos operadores lineares compactos
é um espaço vetorial.
w
(b) Pela Proposição 5.13, se xn −→ x, então, ∥BAj xn − BAj x∥ = ∥B(Aj xn − Ax)∥ #
∥B∥∥Aj xn − Aj x∥ → 0, para j = 1, 2. Logo, Aj B é compacto. Da mesma forma, como B
é limitado, a sequência (Bxn )n∈N é limitada em H , isto é, temos que ∥Bxn ∥ # C1 , para
alguma constante C1 > 0 e para todo n, já que a sequência (xn )n∈N é limitada. Mas, pela
w
Proposição 5.13, isto implica que Bxn −→ Bx e ∥Aj Bxn −Aj Bx∥ → 0, para j = 1, 2. Assim,
BAj é compacto.
TEOREMA 5.23. Sejam H um espaço de Hilbert complexo e A um operador linear limitado

definido em todo H . Se A∗ A é compacto, também o é A.
Demonstração. Seja (xn )n∈N uma sequência limitada em H , isto é, ∥xn ∥ # C, para uma
constante C > 0 e para todo n. Então, existe uma subsequência (xnk )k∈N tal que a sequência
(A∗ Axnk )k∈N converge (fortemente) para algum vetor x ∈ H . Visto que
∥Axn − Axm ∥2 = ⟨A(xn − xm ), A(xn − xm )⟩
= ⟨A∗ A(xn − xm ), (xn − xm )⟩
# |⟨A∗ A(xn − xm ), (xn − xm )⟩|
# ∥A∗ Axn − A∗ Axm ∥∥xn − xm ∥

. /
# ∥A∗ Axn − A∗ Axm ∥ ∥xn ∥ + ∥xm ∥
# 2C∥A∗ Axn − A∗ Axm ∥ → 0 , quando n, m → 0 .
302
Então,
lim ∥Axn − Axm ∥ = 0 ,
n,m→∞
de maneira que a sequência (Axnk )k∈N é de Cauchy em H . Mas, como H é completo, existe
um vetor y ∈ H tal que limn,m→∞ ∥Axn − y∥ = 0. Logo, A é compacto.
COROLÁRIO 5.7. Sejam H um espaço de Hilbert complexo e A um operador linear compacto

definido em todo H . Então, o operador A∗ é compacto.
Demonstração. Uma vez que A é compacto, segue que ele é limitado. Então, pela Proposição
4.8, uma vez que A é limitado, segue que Dom(A) ⊂ Dom(A∗ ) = H . Mas, por hipótese,
Dom(A) = H . Logo, Dom(A) = Dom(A∗ ), e como Ax = A∗ x para cada x no domínio
comum, isto implica que A é auto-adjunto. Portanto, pelo teorema que acabamos de provar,
segue que
lim ∥A∗ xn − A∗ xm ∥ = lim ∥Axn − Axm ∥ = 0 .
n,m→∞ n,m→∞
Logo, A∗ também é compacto.
O seguinte teorema é muitas vezes usados para provar que um dado operador é compacto e
desempenhará um papel fundamental no Capítulo 7, em particular, na prova da estabilidade do
espectro essencial do operador de Schrödinger.
TEOREMA 5.24 (Critério de compacidade de um operador). Dado uma sequência (Am )m∈N
de operadores lineares compactos e um um espaço de Hilbert H tal que Am : H → H ,
suponha que (Am )m∈N converge uniformemente para um operador A, isto é, suponha que ∥A −
Am ∥ → 0 quando m → ∞. Então, A é compacto.
Demonstração. Para provar que A é compacto, precisamos somente mostrar que a sequência
(Axn )n∈N contém uma subsequência convergente, quando a sequência for (xn )n∈N ⊂ H for
limitada, isto é, quando ∥xn ∥ # C, para alguma constante C > 0 e para todo n. Deste
modo, suponha que a sequência (xn )n∈N converge a para um vetor x ∈ H e que (xnk1 )k1 ∈N
seja uma subsequência da sequência (xn )n∈N . Então, pelo Teorema 1.8, para qualquer bola
aberta B(x; ε), de centro x e raio ε, existe, por definição, um n0 ∈ N tal que todos os
termos da sequência (xn )n∈N com n > n0 pertencem à bola B(x; ε). Ora, neste caso,
todos os termos da subsequência (xnk1 )k1 ∈N , com nk1 > n0 também pertencem a B(x; ε).
Logo, limk→∞ xnk1 = x. Da mesma forma, seja (xnk2 )k2 ∈N uma subsequência da sequência
(xnk1 )k1 ∈N . Usando o mesmo raciocínio acima, mostra-se que limk→∞ xnk2 = x. Continuando
este processo recursivamente, obtemos uma sequência infinita de sequências (xnkℓ )kℓ ∈N , de
modo que cada uma seja uma subsequência da precedente. Isto implica que
(xn )n∈N ⊃ (xnk1 )k1 ∈N ⊃ (xnk2 )k2 ∈N ⊃ · · · ⊃ (xnkℓ )kℓ ∈N ⊃ · · · .
Pela condição de compacidade dos elementos Am da sequência (Am )m∈N , para toda subsequên-
cia (xnkℓ )kℓ ∈N a sequência (Am xnkℓ )kℓ ∈N converge fortemente. Sendo assim, assuma que para
o elemento A1 a subsequência (xnk1 )k1 ∈N seja mapeada por A1 em uma sequência fortemente
303
convergente, que para o elemento A2 a subsequência (xnk2 )k2 ∈N seja mapeada por A2 em uma
sequência fortemente convergente, e assim por diante. Então, da desigualdade
∥Axnki − Axnkj ∥ = ∥A(xnki − xnkj ) − Am (xnki − xnkj ) + Am (xnki − xnkj )∥
# ∥(A − Am )(xnki − xnkj )∥ + ∥Am (xnki − xnkj )∥
# ∥(A − Am )∥∥(xnki − xnkj )∥ + ∥Am (xnki − xnkj )∥

. /. /
# ∥(A − Am )∥ + ∥Am ∥ ∥xnki ∥ + ∥xnkj ∥
. /
# 2C ∥(A − Am )∥ + ∥Am ∥ ,
inferimos que a sequência (Axnki )ki ∈N é fortemente convergente. Com feito, dado que ∥(A −
Am )∥ → 0, podemos escolher um m suficientemente grande tal que ∥(A − Am )∥ < ε/(4C),
para qualquer ε > 0 arbitrário. Da mesma forma, como todo operador Am é compacto, portanto,
é limitado, segue que podemos tomar ∥Am ∥ # 1/m. Logo, para o mesmo m suficientemente
grande, podemos tomar ∥Am ∥ < ε/(4C). Portanto, temos que
∥Axnki − Axnkj ∥ < ε .
Assim, a sequência (Axnkℓ )kℓ ∈N é de Cauchy e, portanto, é convergente, pois H é completo.

Isto prova que A é compacto.
5.6.3 Decomposição Espectral de Operadores Compactos
A teoria espectral de operadores compactos tem muitas similaridades com a teoria espectral
de operadores atuando em um espaço de Hilbert de dimensão finita. A seguir, vamos explorar
estas similaridades. Iniciamos dando uma expressão para a norma de um operador auto-adjunto
limitado A operando em um espaço de Hilbert complexo H que será útil na sequência.
LEMA 5.3. Seja H um espaço de Hilbert complexo e A : H → H um operador auto-adjunto

limitado. Então,
∥A∥ = sup |⟨x, Ax⟩| = sup ∥Ax∥ .

∥x∥=1 ∥x∥=1
Além disso, ∥A∗ ∥ = ∥A∥ e ∥A2 ∥ = ∥A∥2 .
Demonstração. Assuma que M = sup∥x∥=1 |⟨x, Ax⟩| sobre a bola ∥x∥ = 1. Então, pela
desigualdade de Cauchy-Schwarz-Bunjakowski, segue que
|⟨x, Ax⟩| # ∥x∥∥Ax∥ # ∥x∥∥x∥∥A∥ = ∥A∥ se ∥x∥ = 1 .
Logo, M # ∥A∥. Por outro lado, de acordo com a Nota 4.5,
∥A∥ = sup |⟨y, Ax⟩| .

∥x∥=∥y∥=1
304
Tomando y = αx, segue que
∥A∥ = sup |⟨y, Ax⟩| = sup |⟨αx, Ax⟩| = |α| sup |⟨x, Ax⟩| " M .
∥x∥=∥y∥=1 ∥x∥=1 ∥x∥=1
Assim, ∥A∥ = M. Note que este resultado vale mesmo se A não é auto-adjunto!
Vamos provar as outras propriedades.
∥A∗ ∥ = sup |⟨y, A∗x⟩| = sup |⟨Ay, x⟩| = sup |⟨x, Ay⟩| = ∥A∥ .
∥x∥=∥y∥=1 ∥x∥=∥y∥=1 ∥x∥=∥y∥=1
Enquanto isso, ∥A∗ A∥ # ∥A∗ ∥∥A∥ = ∥A∥2 . Por outro lado, como antes, tomando y = αx,
segue que
∥A∗ A∥ = sup |⟨y, A∗Ax⟩| = sup |⟨Ay, Ax⟩| = |α| sup |⟨Ax, Ax⟩| " ∥A∥2 .
∥x∥=∥y∥=1 ∥x∥=∥y∥=1 ∥x∥=1
Isto prova que ∥A∗ A∥ = ∥A∥2 . Mas, dado que A∗ = A, temos que ∥A2 ∥ = ∥A∥2 .
Nota 5.16. De acordo com o lema acima,
−∥A∥⟨x, x⟩ # ⟨x, Ax⟩ # ∥A∥⟨x, x⟩ . (5.6.4)
Sejam λ1 , λ2 , . . . auto-valores de A em H e x1 , x2 , . . ., com ∥xi ∥ = 1 e ⟨xi , xj ⟩ = δij , os

correpondentes auto-vetores. Então, conforme a Eq.(5.6.4), temos que
−∥A∥ = −∥A∥⟨xi , xi ⟩ # ⟨xi , Axi ⟩ = λi # ∥A∥⟨xi , xi ⟩ = ∥A∥ . (5.6.5)
Podemos tornar a desigualdade acima mais fraca escolhendo dois números m, M de forma que
m(A) < −∥A∥ e M(A) > ∥A∥. Assim,
m(A) < λi < M(A) . (5.6.6)
As possibilidades m(A) = −∞ e M(A) = ∞ não estão excluídas.
TEOREMA 5.25. Seja A um operador auto-adjunto. Sejam m = inf ∥x∥=1 ⟨x, Ax⟩ e M =
sup∥x∥=1 ⟨x, Ax⟩, respectivamente, os limites inferior e superior de A. Então, m1I # A # M1I.
Demonstração. Vamos provar que A # M1I. Para todo y ∈ H , com y ̸= 0, tomando

x = y/∥y∥ temos ⟨x, Ax⟩ # M; isto é, ⟨y, Ay⟩ # M∥y∥2 = M⟨y, 1Iy⟩. Como a última
relação vale também para y = 0, segue que M1I − A " 0. A prova que m1I # A é similar.
Observe que sendo ∥A∥ = sup∥x∥=1 |⟨x, Ax⟩|, pelo Lema 5.3, ∥A∥ é o maior dos dois
números |m| e |M|.
O Lema 5.3 é útil na prova da existência de auto-vetores de um operador compacto, como

mostra o seguinte
TEOREMA 5.26. Todo operador compacto A operando em um espaço de Hilbert complexo H

tem no mínimo um auto-vetor unitário x
N1 correspondente ao auto-valor λ1 .
305
Demonstração. Assuma que M = sup∥x∥=1 |⟨x, Ax⟩| sobre a bola ∥x∥ = 1. Claramente
M > 0. Da definição de supremum deve existir uma sequência de vetores (xn )n∈N , com
∥xn ∥ = 1 para todo n, tal que o limite
lim ⟨xn , Axn ⟩ ,

n→∞
existe e é igual a +M ou −M.12 Denotemos este limite por λ. Como A é compacto, a sequên-
cia de vetores normalizados (xn )n∈N , que obviamente é limitada, contém uma subsequência
(ynk )k∈N para a qual a sequência (Aynk )k∈N converge para algum x ∈ H , isto é,
lim Aynk = w . (5.6.7)

k→∞
Da equação
∥Aynk − λynk ∥2 = ∥Aynk ∥2 − 2λ⟨ynk , Aynk ⟩ + λ2 ∥ynk ∥ ,
segue que
lim ∥Aynk − λynk ∥2 = ∥w∥2 − 2λ2 + λ2 = ∥w∥2 − λ2 . (5.6.8)

k→∞
Por outro lado, como A é limitado, segue que
∥Aynk ∥ # ∥A∥∥ynk ∥ = M∥ynk ∥ = |λ| .
Logo, a Eq.(5.6.7) implica que ∥w∥ # |λ|. Mas, o membro esquerdo da Eq.(5.6.8) não é negativo
e isto, por sua vez, implica que ∥w∥ = |λ|. Assim, a Eq.(5.6.8) torna-se
lim (Aynk − λynk ) = 0 . (5.6.9)

k→∞
Das Eqs.(5.6.7) e (5.6.9) segue que o limite limk→∞ ynk existe e é igual w/λ. Redefinindo
λ = λ1 , w = x1 e x N1 = x1 /λ1 , então, ∥N
x1 ∥ = 1. Finalmente, como A foi assumido ser
compacto, podemos deduzir da Eq.(5.6.9) que13
. /
lim Aynk − λynk = lim Aynk − lim λynk
k→∞ k→∞ k→∞
6 7 6 7
= A lim ynk − λ lim ynk
k→∞ k→∞
= AN N1 = 0 ,
x1 − λ1 x
de maneira que AN N1 . Isto completa a prova.

x1 = λ1 x
12
. /
Naturalmente, pela definição de M = sup∥x∥=1 |⟨x, Ax⟩|, a sequência de números ⟨xn , Axn ⟩ n∈N deve
aproximar-se de M por baixo, isto é, ⟨xn , Axn ⟩ = M − εn , em que εn é um número positivo arbitrariamente
pequeno, que depende de n, tal que εn → 0 quando n → ∞.
13
Se A não fosse compacto não poderíamos ter deduzido que
, - , -
A lim ynk = λ lim ynk ,
k→∞ k→∞
porque a sequência (ynk )k∈N poderia não ser convergente!
306
PROPOSIÇÃO 5.14 (Teorema do Mapeamento Espectral). Seja A um operador; limitado, não

necessariamente compacto, em um espaço de Hilbert complexo H e p(A) = ni=1 ak Ak , com
ak sendo números complexos. Então,
! "
σ(p(A)) = p(λ) | λ ∈ σ(A) ⊆ p(σ(A)) ,
isto é, o espectro de p(A) consiste precisamente nos números da forma p(λ), com λ no espectro
de A.
Demonstração. Obviamente, podemos supor que n = deg p > 0. Primeiro mostraremos que
p(σ(A)) ⊂ σ(p(A)). Então, assuma que λ ∈ σ(A). Observe que
p(A) − p(λ)1I = an (An − λn 1I) + an−1 (An−1 − λn−1 1I) + · · · + a0 1I − a0 1I .
Por sua vez,

6 7
n n n−1 n−2 2 n−3 n−1
(A − λ 1I) = (A − λ1I) A + λA +λ A + · · · + λ 1I .
Assim, podemos extrair um fator de (A−λ1I) de cada termo diferente de zero para p(A)−p(λ)1I,
dando
p(A) − p(λ) = (A − λ1I)q(A) ,
em que q é um polinômio (dependendo de λ). Como (A − λ1I) não tem inverso e como
(A − λ1I) comuta com q(A), (A − λ1I)q(A) também não tem inverso e, portanto, também
p(A) − p(λ)1I. Isto implica que p(λ) ∈ σ(p(A)).
Agora, mostraremos que σ(p(A)) ⊂ p(σ(A)). Assuma que γ ∈ σ(p(A)). Pelo teorema
fundamental da álgebra, existem números complexos λ1 , . . . , λn que são as raízes da equação
p(z) − γ = a(z − λ1 )(z − λ2 ) · · · (z − λn ) . (5.6.10)
Então,
p(A) − γ1I = a(A − λ1 1I)(A − λ2 1I) · · · (A − λn 1I) . (5.6.11)
Se λ1 , . . . , λn ∈ ρ(A), então, o lado direito de (5.6.11) tem um inverso limitado, e assim o

tem p(A) − γ1I. Logo, γ ∈ ρ(p(A)). Isto é uma contradição, visto que foi assumido que
γ ∈ σ(p(A)). Consequentemente, pelo menos um λk está em σ(A). Então, (5.6.10) estabelece
que p(λk ) − γ = 0, indicando que γ ∈ p(σ(A)), isto é, p(λ) = γ para algum λ ∈ σ(A).
Exemplo 5.11. A Proposição 5.14 tem um análogo bem conhecido se H = Cn , que é o teorema
sobre a diagonalização de uma matriz auto-adjunta. Neste caso, Dom(A) = Cn e podemos
representar A por uma matriz n × n auto-adjunta. Então, A − λ1I também é representado por
uma matriz e σ(A) é composto por escalares λ que são raízes da Eq.(5.1.3). Como discutido
na Seção 5.1, o determinante da matriz A − λ1I é um polinômio de grau n em λ. Portanto, se
os escalares associados com H são complexos, então σ(A) contém pelo menos um ponto, ou
pode conter tantos quanto, mas não mais que, n pontos distintos.14
14
Se os escalares são reais pode acontecer de σ(A) ser vazio!
307
Nota 5.17 (Um comentário sobre o Teorema do Mapeamento Espectral). Como consequência
da representação espectral de A em (5.6.11), em geral, pode-se fazer uma definição razoável para
A 3→ f (A) se f for analítica em uma vizinhança de σ(A). Isso foi elaborado em toda a sua
generalidade por N. Dunford no artigo “Spectral Theory I, Convergence to Projections,” Trans.
Amer. Math. Soc. 54 (1943) 185. Dunford mostrou que, dado um operador auto-adjunto A
sobre um espaço de Hilbert H , existe um mapeamento contínuo f : σ(A) → C tal que entre
o espectro de A e sua “função” f (A) existe a relação
σ(f (A)) = f (σ(A)) . (5.6.12)
Aqui, σ(f (A))

! é o espectro de f (A) e f (σ(A)) é a imagem
" do espectro de A sob f , isto é,
f (σ(A)) = µ ∈ C | µ = f (λ) para algum λ ∈ σ(A) . Este é o Teorema do Mapeamento
Espectral de Dunford. Prova-se o teorema da seguinte forma. Denote por Ω ⊂ C o conjunto de
definição de f , tal que σ(A) ⊂ Ω. Assuma que µ ∈ σ(f (A)). Se tivéssemos µ ∈ / f (σ(A)), ou
seja, µ−f (λ) ̸= 0 para todo λ ∈ σ(A), então µ1I−f (A) teria um inverso em contradição com a
hipótese. Assim, σ(f (A)) ⊂ f (σ(A)). Agora vamos, inversamente, assumir que µ ∈ f (σ(A)),
ou seja, µ = f (ζ) com ζ ∈ σ(A). A função g definida em Ω por
f (λ) − f (ζ)
g(λ) = , para λ ̸= ζ ,
λ−ζ
é analítica em uma vizinhança de σ(A). De g(λ)(λ − ζ) = f (λ) − f (ζ) segue, portanto, que
g(A)(A − ζ1I) = f (A) − f (ζ)1I. Se µ estivesse em ρ(f (A)), então teríamos
8 9 8 9
(f (A) − µ1I)−1 g(A) (A − ζ1I) = (A − ζ1I) (f (A) − µ1I)−1 g(A) = 1I .
Logo, A − ζ1I teria uma inversa, especificamente (f (A) − µ1I)−1 g(A), o que é impossível
porque por hipótese ζ está em σ(A). Portanto, µ ∈ σ(f (A)) o que implica que temos também
f (σ(A)) ⊂ σ(f (A)). Isto completa a prova.
LEMA 5.4. Seja H um espaço de Hilbert complexo de dimensão infinita. Se A é um operador

auto-adjunto e compacto, então, 0 ∈ σ(A).
Demonstração. Assuma que λ ∈ / σ(A). Então, pela Proposição 5.6, o resolvente (A − λ1I)
do operador auto-adjunto A tem um inverso limitado, isto é, ∥(A − λ1I)−1 ∥ # |Im λ|−1 .
Assim, para um operador auto-adjunto e compacto o operador (A − λ1I)−1 é contínuo se
λ ∈/ σ(A). No caso particular em que λ = 0 isto não se aplica. Com efeito, suponha que
−1
A é limitado, então, se (en )n∈N é uma sequência ortonormal arbitrária em H , pelo Teorema
s
5.22(b), nós teríamos que A−1 Aen −→ 0 e isto implicaria, por sua vez, que o operador
s
identidade A−1 Aen = 1Ien −→ 0 deveria ser compacto. Mas, isto é impossível como discutido
na Nota 5.15. Consequentemente, A não é continuamente invertível e, portanto, 0 ∈ σ(A).
O próximo teorema, conhecido como Teorema da Decomposição Espectral para Operadores

Compactos, é um resultado fundamental para um operador auto-adjunto compacto operando
em espaços de Hilbert.
TEOREMA 5.27 (Teorema de Hilbert-Schmidt-Riesz-Schauder). Seja A um operador auto-

adjunto compacto, não nulo, operando em um espaço de Hilbert complexo H . Então, A possui
308
uma sequência finita ou infinita de auto-vetores ortonormais, com os correspondentes auto-

valores reais λi ̸= 0 organizados em ordem decrescente (|λ1 | " |λ2 | " |λ3 | " · · · ). Todo
auto-valor que é diferente de zero tem multiplicidade finita15 e limi→∞ |λi | = 0 se o sistema
ortonormal for infinito. Além disso, se o sistema ortonormal é completo em H , λ = 0 não pode
ser um auto-valor de A em H e todo elemento y = Ax, com x ∈ H pode ser representado na
forma
< < <
y = Ax = ⟨xi , Ax⟩xi = ⟨Axi , x⟩xi = λi ⟨xi , x⟩xi , (5.6.13)
i∈I i∈I i∈I
com a soma sendo estendida sobre a sequência inteira, se finita ou infinita. Isto implica que
< <
A= λi Pi = λi Pi , (5.6.14)
λi ∈σ(A) i∈I
em que Pi é um operador de projeção.
Demonstração. A prova da existência dos auto-valores λ1 , λ2 , . . . é garantida aplicando-se o

Teorema 5.26 repetidamente. Com efeito, pelo Teorema 5.26, A admite pelo menos um auto-
vetor x
N1 = x1 /λ1 , com ∥N
x1 ∥ = 1, que corresponde ao auto-valor λ1 , em que
λ1 = ± sup |⟨x, Ax⟩| .

∥x∥=1
!
Seja M1 o subespaço
" gerado por todos vetores ortogonais ao vetor N
x1 , isto é, M1 = y|y∈
N1⟩ = 0 . O subespaço M1 = H ⊖ x
H , ⟨y, x N1 é invariante sob a ação de A. Na prática, como
A é auto-adjunto segue que
N1⟩ = ⟨y, AN
⟨Ay, x N1 ⟩ = 0 ∀ y ∈ M1 .
x1 ⟩ = λ1 ⟨y, x
Portanto, Ay ∈ M1 . Além disso, a restrição de A ao espaço M1 é ainda um operador auto-

adjunto compacto. Se a restrição de A ao espaço M1 não é o operador nulo, então, podemos
usar novamente o Teorema 5.26 para obter um novo auto-vetor x
N2 = x2 /λ2 que corresponde
ao auto-valor λ2 , tal que
|λ2 | = sup |⟨y, Ay⟩| # sup |⟨x, Ax⟩| = |λ1 | ,

∥y∥=1,y∈M1 ∥x∥=1
e um subespaço M2 = H ⊖ x N2 , invariante sob a ação de A, formado por todos os

N1 ⊖ x
vetores ortogonais aos vetores x
N1 e x
N2 . Podemos continuar este processo e obter um vetor
Nn = xn /λn ∈ Mn−1 = H ⊖ x
x N1 ⊖ x
N2 ⊖ · · · ⊖ xNn−1 , tal que
! "
Mn−1 = z | z ∈ H , ⟨z, x Ni ⟩ = 0, i = 1, . . . , n − 1 ,
e AN xn ∥ = 1. Isto implica que |λ1 | " |λ2 | " |λ3 | " · · · , com
Nn e ∥N
xn = λn x
|λk | = sup |⟨z, Az⟩| ,

∥z∥=1,z∈Hk
15
Lembre-se que, se corresponder a λj auto-vetores linearmente independentes x1 , x2 , . . . , xn , então, dizemos
que λj tem multiplicidade n, e devemos escrever nλj vezes na ordenação acima.
309
uma vez que H ⊃ M1 ⊃ M2 ⊃ · · · Se este processo pára com λn+1 , xn+1 e Hn devido ao
fato da restrição de A a Mn ser zero, então, a Ran(A) situa-se no subespaço gerado pelos
vetores x Nn , associados aos auto-valores não-nulos
N1 , . . . , x
λ1 , λ2 , . . . , λn ,
em que
|λ1 | " |λ2 | " · · · " |λn | ,
e
|λj | = sup |⟨y, Ay⟩| .
∥y∥=1,y∈Hk
Logo, se x ∈ H e y ∈ Mn segue que

n
<
y = x− ⟨N
xi , x⟩N
xi . (5.6.15)
i=1
Portanto, ⟨N
xi , y⟩ = 0 se i = 1, . . . , n, de forma que Ay = 0, ou
n
<
Ax = ⟨N
xi , x⟩N
xi .
i=1
Isto acontece, mesmo que H seja de dimensão infinita. Efetivamente, se o processo não chegar
ao fim após um número finito de etapas, então, o resultado é um sistema ortonormal infinito e
limn→∞ |λn | = 0 pela seguinte razão: se isto não fosse verdade, então, x N2 , . . . seria uma
N1 , x
sequência infinita em H com
? ?
? xn ? 1
xn ∥ = ?
∥N ?
? λn ? = |λn | ∥xn ∥ = 1 .
Uma vez que A é compacto, esta sequência deveria conter uma subsequência (N ynk )k∈N para
a qual a sequência (AN ynk )k∈N converge para vetor x em H . Isto é um absurdo,√ uma vez
que a ortonormalidade do sistema yNn1 , yNn2 , . . . implica que ∥N
ynk − yNnℓ ∥ = 2 para todo
k ̸= ℓ. Note que, um auto-valor não pode ter um multiplicidade infinita na sequência de
auto-valores (λn )n∈N por causa do limite limn→∞ |λn | = 0. De fato, suponha que λk tem uma
multiplicidade r. Então, o subespaço formado pelos auto-vetores correspondentes ao auto-valor
λk tem dimensão finita r. Esse subespaço não pode ter uma dimensão maior que r pois isto
implicaria a existência de um vetor x tal que Ax = λk x, com ∥x∥ = 1 e ⟨x, x Ni ⟩ = 0, para
todo i. Mas, isto é impossível pelos mesmos argumentos usados acima.
Ainda assumindo que o processo não chega ao fim após um número finito de etapas, pela
Eq.(5.6.15) segue que
<n
2 2
∥y∥ = ∥x∥ − xi , x⟩|2 # ∥x∥2 .
|⟨N
i=1
Como y ∈ Hn e |λn | é a norma da restrição de A a Hn , segue que
∥Ay∥ # |λn |∥y∥ # |λn |∥x∥ .
310
Portanto, Ay → 0, quando n → ∞. Consequentemente,

n
< ∞
<
Ay = Ax − ⟨N
xi , x⟩AN
xi =⇒ Ax = λi ⟨N
xi , x⟩N
xi quando n→∞.
i=1 i=1
Vamos provar que a sequência (N xn )n∈N forma um sistema ortonormal completo se, e somente
16
se, 0 não é um auto-valor de A. Primeiro, vamos mostrar que o método acima só produz
auto-valores de A em H que são diferentes de zero. Para isto, assuma que λ∗ é um auto-valor
não-nulo que não está presente na sequência (λn )n∈N , então, existe um correspondente auto-
vetor z de norma um, e este vetor deve ser ortogonal a todos os auto-vetores x Ni , para todo i
(pela Proposição 5.9). Colocando x = z na série (5.6.13), obtemos que Az = 0, contradizendo a
hipótese que Az = λ∗ z ̸= 0. Levando em conta este fato, admita que o subespaço
<
M= ⊕ Ker(A − λi 1I)
λi ∈σdisc (A)
λi ̸=0
de H gerado pelos auto-vetores ortonormais x N2 , . . . seja fechado. Note que, os subespaços

N1 , x
Ker(A − λi 1I) são mutuamente ortogonais e têm dimensão finita por causa da multiplicidade
finita de λi . Então, de acordo com o Teorema 3.5, H = M ⊕ M ⊥ . Precisamos mostrar que
M ⊥ = Ker(A). Obviamente, segue da série (5.6.13) que M ⊥ ⊂ Ker(A). Por outro lado, se
x ∈ Ker(A), então
xi , x⟩ = λ−1
⟨N xi , x⟩ = λ−1
i ⟨AN i ⟨N xi , Ax⟩ = 0 .
Isto implica que x ∈ M ⊥ . Portanto, concluímos que M ⊥ = Ker(A). Pelo Teorema 3.9 o
sistema ortonormal construído acima é completo se, e somente se, M ⊥ = {0}, o que
. significa
que /0 não pode ser um auto-valor de A em H . Como H é. completo,
5 / H = M ⊕ Ker(A) =
{0} , pelos Teoremas 3.5 e 3.9. Note que, pelo Lema 5.4, σ A5M ⊥ = {0} e que
σ(A) = σdisc (A) ∪ {0} . (5.6.16)
Só resta provar (5.6.14). Uma vez que a família {Ker(A − λi 1I)}λj ∈σdisc (A)⊂R é uma família
ortogonal, se definirmos o operador de projeção ortogonal Pi sobre cada subespaço Ker(A −
λi 1I) por Pi x = ⟨N xi , então, podemos escrever
xi , x⟩N
<
A= λi Pi .
i∈I
Precisamos garantir que a série acima converge fortemente se I = N0 . Mais do que isso, vamos
mostrar que essa série converge uniformemente. Como o sistema ortonormal construído acima
é completo, pela Definição 3.11a, todo vetor x ∈ H pode ser escrito na forma
∞
<
x = α0 x0 + Ni
αi x com α∈C,
i=1
16
Neste caso, como 0 não é um auto-valor de A, então, dizemos que matematicamente 0 é um ponto de
acumulação do espectro de A (veja a definição de ponto de acumulação na pg.36).
311
em que x0 ∈ Ker(A) (com ∥x0 ∥ = 1) e x

Ni ∈ Ker(A − λi 1I), segue que
∞
< ∞
< n
<
A= λi Pi ⇔ Ax = λi Pi x = lim λi Pi x , ∀x ∈ H .
n→∞
i=1 i=1 i=1
Defina
n
<
An = λi Pi .
i=1
Vamos provar que An converge fortemente para A. Para isto, começamos computando Ax e
An x:
∞
< ∞
<
Ax = 0 + αi AN
xi = Ni ,
αi λ i x
i=0 i=0
e
∞ ∞
( n
) n
< < < <
An x = 0 + Ni =
αi An x αi Ni
λi Pi x = Ni ,
αi λ i x
i=0 i=0 i=1 i=0
Logo,
∞
<
∥An x − Ax∥ = |αi |2 |λi |2 ,
i=n+1
Uma vez que a sequência (|λi |)i∈N converge monotonicamente para zero, podemos escolher um
N tal que para i > N segue que |λi | < ε, para um ε > 0 arbitário. Tomando n maior que N
na expressão acima, podemos garantir que
∞
<
2
∥An x − Ax∥ # ε |αi |2 ,
i=n+1
que pela ortogonalidade,

∞
<
∥x∥2 = |α0 |2 + |αi |2 ,
i=1
é menor ou igual a ε2 ∥x∥2 . Portanto, para n > N, segue que
∥An x − Ax∥ = ∥(An − A)x∥
# ∥(An − A)∥∥x∥
# ε∥x∥ =⇒ ∥(An − A)∥ # ε =⇒ An → A .
Portanto, de acordo com o Corolário 4.2, se uma sequência de operadores converge uniforme-
mente (ou converge na norma do operador), então, ela converge fortemente. Isto finaliza a prova
do teorema.
312
Se a soma (5.6.13) é finita o operador A é dito ser de rank finito, isto é, se Ran(A) é de
dimensão finita; nesse caso, de acordo com o Capítulo 4, a dimensão de Ran(A) é denotada
por rank(A). Com esta definição, podemos reunir os resultados estabelecidos no Lema 5.4 e
no Teorema 5.27 no teorema a seguir, que é verdadeiro para um operador compacto arbitrário,
mas o provamos aqui para operadores compactos auto-adjuntos.
TEOREMA 5.28. Suponha que A seja o limite na norma de operadores auto-adjuntos An tal que
rank(An ) < ∞. Então, σess (A) ⊂ {0} com a igualdade se, e somente se, H for de dimensão
infinita.
Demonstração. Já vimos na prova do Teorema 5.27 que σ(A) = σdisc (A)∪{0} (veja a Eq.(5.6.16).
Como para um operador auto-adjunto σ(A) = σdisc (A)∪σess (A), basta mostrar que σess (A) =
{0}. Com efeito, se λ0 ̸= 0 é um ponto de acumulação de auto-valores de A, então, pela
Definição 5.5, λ0 ∈ σess (A). Assuma que λ ∈ σess (A). Logo, pelo Critério de Weyl, Teorema
w
5.11, existe uma sequência de Weyl (xn )n∈N para A e λ, ou seja, xn −→ 0, ∥xn ∥ = 1 e
s s s
(A − λ1I)xn −→ 0. Como A é compacto, Axn −→ 0 e, portanto, λ1Ixn −→ 0. Mas,
∥xn ∥ = 1; assim, λ = 0 e σess (A) ⊂ {0}. Por outro lado, se H for dimensão infinita, pelo
Lema 5.4, 0 ∈ σ(A), e pelo Teorema 5.27, 0 ∈ / σdisc (A); dessa forma, {0} ⊂ σess (A). Isto
implica que σess (A) = {0}.
COROLÁRIO 5.8. Se A é compacto e 0 ∈ / σ(A), então, A é um operador de rank finito, isto é, a

soma (5.6.13) é de ordem n < ∞ e λi = 0 para todo i > n.
Nota 5.18. Neste ponto, é interessante destacar que no Teorema 5.27, na Eq.(5.6.13), os auto-
valores são univocamente determinados por A, mas não os auto-vetores. Com efeito, se xi é
um auto-vetor correspondente ao auto-valor λi , então, ao invés de xi , podemos também usar
Ni = eiϕ xi , com 0 # ϕ < 2π, como um auto-vetor. A situação fica mais nítida ainda se λ é
x
um auto-valor múltiplo. Se xi , xj são auto-vetores de A, com ∥xi ∥ = ∥xj ∥ = 1 e ⟨xi , xj ⟩ = 0,
correspondentes a λ, então, ao invés de xi , xj , poderíamos também usar os auto-vetores x Ni , x
Nj
que obtemos de xi , xj através de uma transformação unitária
⎧ 2
( ) ( )( ) ⎪
⎪ |a| + |b|2 = 1
Ni
x a b xi ⎪
⎨
= com |c|2 + |d|2 = 1 .
Nj
x c d xj ⎪
⎪
⎪
⎩
ac + bd = 0
Nota ;5.19 (Decomposição espectral e funções de operadores). A representação de A por

A = i∈I λi Pi é chamada decomposição espectral. Em virtude do Teorema 5.27, um operador
auto-adjunto compacto A sobre um espaço de Hilbert H pode ser expresso como uma soma
ponderada de projeções. O operador A2 = AA também é um operador compacto. Além disso,
313
para todo vetor x ∈ Dom(A2 ),17 temos

( ) ( )
< < <
A2 x = A(Ax) = A λj Pj x = λi Pi λj Pj x
j∈I i∈I j∈I
<<
= λi λj Pi Pj x
i∈I j∈I
<
= λ2i Pi x .
i∈I
Da mesma forma, podemos mostrar, para qualquer s " 0, que

<
As = λsi Pi .
i∈I
E mais, o inverso de A é representável na forma

<
A−1 = λ−1
i Pi .
i∈I
Assim,
<
A−s = λ−s
i Pi .
i∈I
Tudo isto sugere que quando um operador auto-adjunto compacto A é representável como
uma soma ponderada de projeções, é possível desenvolver um “cálculo operacional” através de
um conjunto apropriado de operações sobre os pesos λi . De fato, para levar essa ideia mais
adiante, denotamos (vamos ver no Capítulo 8 que está expansão é bem definida porque A é
limitado)
<∞
A A2 A3 An
e = 1I + A + + +··· = .
2! 3! n=1
n!
Então,
∞
< ∞
< ∞ ∞
1 < 2 1 < 3
eA = Pn + λn Pn + λn Pn + λ Pn + · · ·
n=1 n=1
2! n=1 3! n=1 n
<∞ , - <∞
λ2n λ3n
= 1 + λn + + + · · · Pn = eλn Pn .
n=1
2! 3! n=1
Similarmente, pode-se mostrar que

∞
< ∞
<
−A −λn ±iA
e = e Pn e = e±iλn Pn .
n=1 n=1
Consequentemente,
∞
< ∞
<
sin A = (sin λn )Pn cos A = (cos λn )Pn .
n=1 n=1
Assim, um número de outras identidades operacionais podem ser obtidas.

17
Assumir que x ∈ Dom(A2 ) significa assumir que x e Ax estão em Dom(A).
314
5.6.4 Caracterização Variacional de Auto-Valores (Continuação I)
A prova do Teorema 5.27 estabelece a existência e algumas das propriedades dos auto-
valores de um operador auto-adjunto compacto. No entanto, os auto-valores são notoriamente
difíceis de computar. A maneira mais simples de estimar os auto-valores é através do princípio
clássico do minimax de Courant-Weyl-Fischer-Poincaré-Rayleigh-Ritz que agora descrevemos. O
Teorema Minimax é um resultado que fornece uma caracterização variacional dos auto-valores
de operadores auto-adjuntos compactos em espaços de Hilbert. Pode ser visto como o ponto de
partida de muitos resultados de natureza semelhante.
TEOREMA 5.29 (Teorema minimax). Sejam H um espaço de Hilbert separável e A um operador
auto-adjunto positivo em H com espectro σ(A) = {λj | j ∈ N} ordenado de acordo com o
tamanho, λj # λj+1 e contando a multiplicidade. Para n = 1, 2, . . . denote por Xn a família
de todos os subespaços n-dimensionais Xn de H . Então,
, -
λn = min max⟨y, Ay⟩ .
Xn ∈Xn y∈Xn
Demonstração. A prova é obtida determinando-se o limite inferior para os valores do quociente

de Rayleigh R(y) = ⟨y, Ay⟩/⟨y, y⟩. Para fazer isso, expandimos todo y ∈ H em termos dos
auto-vetores ortonormais xj de A. Isso dá, para J finito ou infinito,
J
< J
<
y= αj xj e ⟨y, y⟩ = |αj |2 .
j=1 j=1
Denote por Vn o subespaço linear gerado pelos primeiros n auto-vetores de A (naturalmente, o

conjunto {x1 , . . . , xn } forma uma base para Vn ). Logo,
λ1 |α1 |2 + · · · + λn |αn |2 λn (|α1 |2 + · · · + |αn |2 )
max R(y) = max = = λn .
y∈Vn (α1 ,...,αn )∈Rn |α1 |2 + · · · + |αn |2 |α1 |2 + · · · + |αn |2
Neste ponto, vamos observar que o subespaço n-dimensional Xn de H não necessariamente
coincide com Vn . Em outras palavras, a base de Xn não é necessariamente composta pelos
primeiros n auto-vetores de A. Assim, quaisquer n auto-vetores de A pode formar uma base
para Xn . Portanto, se Xn ̸= Vn , segue que maxy∈Xn R(y) " λn para todo subespaço
Xn ∈ Xn . Além disso, se Xn ̸= Vn , tal que a interseção Xn ∩ Vn⊥ é não-trivial, isto é,
Xn ∩ Vn⊥ ̸= {0}, então, maxy∈Xn R(y) " maxy∈Xn ∩Vn⊥ R(y). Todo y ∈ Xn ∩ Vn⊥ pode ser
;
escrito como y = 2n j=n+1 αj xj e para tais vetores temos
λn+1 |αn+1 |2 + · · · + λ2n |α2n |2 λn+1 (|αn+1 |2 + · · · + |α2n |2 )

R(y) = " = λn+1 " λn .
|αn+1 |2 + · · · + |α2n |2 |αn+1 |2 + · · · + |α2n |2
Consequentemente, o max é exatamente alcançado quando Xn = Vn . Isto completa a prova.
5.6.5 Decomposição Espectral de Operadores Auto-Adjuntos Limitados
Vamos considerar agora um operador auto-adjunto limitado A arbitrário (não necessaria-

mente compacto) em um espaço complexo de Hilbert H . Nosso objetivo é obter generalizações
315
das fórmulas (5.6.13) e (5.6.14). Naturalmente, o sucesso do procedimento anterior dependia

totalmente do fato do operador auto-adjunto A ser compacto. Isto nos leva ao seguinte questi-
onamento: o que acontece no caso do operador A não ser compacto? Vamos dar uma olhada
mais de perto nessa questão considerando o caso do operador posição X operando no espaço
de Hilbert L2 [α, β]. Como discutido na página 207, X em L2 [α, β] é auto-adjunto e limitado.
No entanto, X não é compacto. A não compacidade do operador X está relacionada, de certa
forma, à não compacidade do operador identidade 1I. Para ver isto, lembre-se que X é um
operador multiplicação; ou seja,
X : Dom(X) → L2 [α, β]
Ψ(x) 3−→ x Ψ(x) ,
com Dom(X) = L2 [α, β]. Então, note que, podemos escrever x Ψ(x) = 1Ix Ψ(x). Como 1I
não é compacto, segue que X também não o é. A não compacidade de X torna-se mais clara se
tomamos uma base de vetores de L2 [α, β] composta por funções normalizadas {Ψn (x)}n∈N .
Através do operador X, os vetores dessa base são mapeados em xΨn (x). Uma vez que
a # x # b, temos que √
∥xΨn − xΨm ∥ " ∥Ψn − Ψm ∥ = 2 ,
para quaisquer pares de n e m (com n ̸= m). Portanto, é impossível extrair uma subsequência
convergente de {xΨn (x)}n∈N . Uma consequência notável da não compacidade do operador X
é que nenhum número real λ pode ser um auto-valor de X. Em outras palavras, ao contrário
do caso dos operadores compactos, não existem suficientes auto-vetores para o operador X.
Este exemplo deixa claro que os métodos usados na análise do espectro de operadores não
compactos devem ser bem diferentes daqueles usados para os operadores compactos, pois agora
não assumimos a compacidade dos operadores e o espectro pode ser muito mais complicado.
Para estender o teorema da decomposição espectral para um operador auto-adjunto limitado

arbitrário precisamos, primeiro, generalizar o conceito de resolução da identidade – veja a
Eq.(5.6.2). Começamos lembrando que, de acordo com o Teorema 5.17, dado um espaço de
Hilbert H , um operador linear limitado E : H → H é chamado um idempotente se
E 2 = E. Uma projeção é um idempotente E se Ker(E) = Ran(E)⊥ . Além disso, se
E = E ∗ , então, E é chamado operador de projeção ortogonal. Vamos considerar em particular
a função dependendo do parâmetro µ ∈ R definida da seguinte forma:
⎧
⎨1 se λ # µ
eµ (λ) = , −∞ < µ < ∞ . (5.6.17)
⎩0 se λ > µ
Esta função é obviamente descontínua. Dessa forma, podemos fazer corresponder a ela uma
função eµ (A) do operador A que é uma projeção e que denotaremos por E(µ). Uma vez
que eµ (λ)eν (λ) = eµ (λ) se µ < ν, segue que E(µ)E(ν) = E(ν)E(µ) = E(µ) e, portanto,
E(µ) # E(ν). Além disso, uma vez que sobre o intervalo a # λ # b, eµ (λ) = 0 se µ < a e
eµ (λ) = 1 se µ " b, temos que E(µ) = O e µ < a e E(µ) = 1I se µ " b. Tudo isto nos leva
à seguinte
DEFINIÇÃO 5.8 (Família espectral). Seja λ um número real variando através de um inter-
valo finito ou infinito [α, β]. Uma resolução da identidade em um espaço de Hilbert H é
316
uma família uni-paramêtrica {E(λ)}λ∈R de projeções ortogonais em H , denominada família

espectral, que satisfaz as seguintes propriedades:
(i) Monotonicidade: E(λ) # E(µ) se λ # µ; isto é, E(µ) − E(λ) é um operador positivo.
(ii) Continuidade forte pela direita: E(λ + 0)x = lim+ E(λ + ε)x = E(λ)x, para todo
ε→0
x ∈ H , λ ∈ R e ε > 0 arbitrário; isto é,18
∥E(λ + ε)x − E(λ)x∥ → 0 , quando ε → 0+ .
(iii) Completeza: Se α # λ # β, então, E(λ)x = 0 para λ # α e E(λ)x = x para λ " β,

para todo x ∈ H . Se o intervalo [α, β] é infinito, então, lim E(λ)x = 0 e lim E(λ)x = x,
λ→−∞ λ→∞
para todo x ∈ H .
A propriedade (i) na Definição 5.8 é um requisito essencial, estabelecendo que {E(λ)}λ∈R

é uma família uni-paramêtrica monótona crescente de projeções ortogonais em H . Ainda,
essa propriedade implica que para todo λ0 ∈ R e ε > 0 arbitrário, o limite forte E(λ0 ) =
s−limε→0− E(λ0 − ε) existe e é novamente uma projeção ortogonal satisfazendo
E(λ) # E(λ0 − ε) # E(µ) se λ < λ0 # µ .
Como os operadores E(λ) são projeções ortogonais, pelo Teorema 5.18, a propriedade (i) na
Definição 5.8 equivale à propriedade
(i′ ) E(λ)E(µ) = E(min{λ, µ}) para λ, µ ∈ R.
Da propriedade (i′ ) segue que duas projeções E(λ) e E(µ), para λ, µ ∈ R, comutam.
Além disso, se λ = µ, então, E 2 (λ) = E(λ) e Ker(E) = Ran(E)⊥ . A propriedade (ii) é
apenas uma condição de normalização. Além disso, poderíamos ter exigido uma continuidade
forte pela esquerda, em vez de uma continuidade forte pela direita. De fato, a propriedade (ii)
não é essencial, sendo necessária apenas no estabelecimento da unicidade da medida espectral
(meramente representando uma normalização da função espectral). A continuidade pela direita
pode ser substituída pela continuidade pela esquerda; então, temos que substituir limε→0+
por limε→0− na prova da unicidade (veja a nota abaixo). Por fim, a propriedade (iii) é uma
condição de completeza. Se (iii) não é satisfeita, então temos uma resolução da identidade no
. / def.
espaço de Hilbert E(+∞) − E(−∞) H , em que E(±∞) = s−limλ→±∞ E(λ).
Nota 5.20 (Sobre a continuidade lateral da família espectral). Para qualquer família espectral
{E(λ)}λ∈R também existe o limite forte pela esquerda em λ ∈ R,
E(λ − 0)x = lim− E(λ − ε)x , ∀ x ∈ H .

ε→0
É fácil ver que E(λ − 0) é uma projeção. É possível que E(λ − 0) ̸= E(λ), e o motivo é
o seguinte: sabemos que E : R → R é uma função monótona limitada; uma vez que toda
18
Esta propriedade poderia também ser escrita da seguinte forma: E(λ + 0)x = lim E(µ)x = E(λ)x, com
µ→λ+0
µ → λ + 0 indicando que µ se aproxima de λ pela direita.
317
sequência limitada crescente ou decrescente de números reais tem um limite, todos os seguintes
limites existem (λ ∈ R):
E(λ − 0) = lim− E(λ − ε) , E(λ + 0) = lim+ E(λ + ε) ,

ε→0 ε→0
E(−∞) = lim E(λ) , E(+∞)x = lim E(λ) .

λ→−∞ λ→+∞
Se E é contínua no ponto λ, então, E(λ−0) = E(λ+0); caso contrário, se E é descontínua

no ponto λ, então, E(λ − 0) ̸= E(λ + 0) e E é dito ter uma descontinuidade de salto em λ.
Aqui, adotamos a convenção de que, se λ é um ponto de descontinuidade de E, então, o valor
de E no ponto λ é escolhido de forma que seu salto neste ponto já esteja incluído neste valor
E(λ), isto é, tal que E(λ) = E(λ + 0) (veja a Figura 5.3).
E E
E
E
Figura 5.3: Descontinuidade da função E no ponto λ.
Se E tem mais do que um número finito de descontinuidade, o conjunto de todos os

pontos de descontinuidade é um subconjunto contável de R (cf. o Teorema 5.30). Mais adiante,
mostraremos que as descontinuidades de uma família espectral correspondem ao espectro
discreto do operador auto-adjunto associado A, enquanto que a continuidade forte de E(λ) em
λ0 ∈ σ(A) implica em λ0 pertence ao espectro contínuo (e vice-versa).
Agora, formulamos uma definição que será importante para o que vamos estudar.
DEFINIÇÃO 5.9 (A medida de um intervalo). Sejam ϱ : R → R uma função monótona

crescente e I um intervalo com pontos finais µ, λ, com µ < λ. Definimos a ϱ-medida de I,
denotada por mϱ (I), como segue mϱ ([µ, λ]) = ϱ(λ + 0) − ϱ(µ − 0), mϱ ((µ, λ]) = ϱ(λ + 0) −
ϱ(µ + 0), mϱ ([µ, λ)) = ϱ(λ − 0) − ϱ(µ − 0) e mϱ ((µ, λ)) = ϱ(λ − 0) − ϱ(µ + 0).
O “intervalo de aberto” (µ, µ) é, naturalmente, o conjunto vazio, e definimos mϱ ((µ, µ))

como zero para qualquer µ ∈ R (o conjunto dos números reais estendido). Os intervalos (µ, µ]
e [µ, µ) são também vazios, mas, nesses casos, o fato de sua ϱ-medida ser zero segue da
definição geral e não precisa ser especificado separadamente. Sendo ϱ uma função monótona
crescente, segue que ϱ(λ − 0) # ϱ(λ) # ϱ(λ + 0); além disso, se µ, λ ∈ R, com µ < λ, segue
que ϱ(µ + 0) # ϱ(λ − 0). Consequentemente, temos que mϱ (I) > 0 para qualquer intervalo
I, e se I e J são intervalos com I ⊆ J, então, mϱ (I) # mϱ (J). Portanto, se µ é um ponto de
descontinuidade de ϱ(λ), então, mϱ ({µ}) = ϱ(µ + 0) − ϱ(µ − 0) é positiva.
318
Se µ e λ são finitos, e ϱ é contínua em µ e λ, então, temos ϱ(µ − 0) = ϱ(µ + 0) = ϱ(µ)

e ϱ(λ − 0) = ϱ(λ + 0) = ϱ(λ), e assim mϱ (I) = ϱ(λ) − ϱ(µ) em todos os quatro casos
na definição acima. Em particular, se ϱ(λ) = λ para todo λ ∈ R, então, mϱ (I) = λ − µ
é o comprimento ordinário do intervalo I. Em geral, a ϱ-medida de um intervalo é apenas a
mudança no valor de ϱ sobre o intervalo em questão; pode ser pensado como uma generalização
da noção de comprimento.
Exemplo 5.12. Seja ϱ : R → R definida por (cf. a Figura 5.4).

ϱ(λ)
⎧
⎪
⎪ 0 se λ<1
⎪
⎪
⎪
⎪
⎪
⎨λ2 − 2λ + 2 se 1#λ<2
ϱ(λ) =
⎪
⎪ 3 se λ=2
⎪
⎪
⎪
⎪
⎪
⎩
λ+2 se λ>2
Figura 5.4: Gráfico da função ϱ.
Então,
mϱ ([1, 2]) = ϱ(2 + 0) − ϱ(1 − 0) = 4 − 0 = 4 ,
mϱ ((1, 2]) = ϱ(2 + 0) − ϱ(1 + 0) = 4 − 1 = 3 ,
mϱ ([1, 2)) = ϱ(2 − 0) − ϱ(1 − 0) = 2 − 0 = 2 ,
mϱ ((1, 2)) = ϱ(2 − 0) − ϱ(1 + 0) = 2 − 1 = 1 ,
mϱ ([2, 3]) = ϱ(3 + 0) − ϱ(2 − 0) = 5 − 2 = 3 ,
mϱ ((2, 3)) = ϱ(3 − 0) − ϱ(2 + 0) = 5 − 4 = 1 ,
mϱ ([2, 2]) = ϱ(2 + 0) − ϱ(2 − 0) = 4 − 2 = 2 ,
mϱ ((−1, 3)) = ϱ(3 − 0) − ϱ(−1 + 0) = 5 − 0 = 5 ,
mϱ ([−8, 1/2]) = ϱ(1/2 + 0) − ϱ(−8 − 0) = 0 − 0 = 0 .
Pode-se ver a partir do exemplo acima que a ϱ-medida de um intervalo leva em consideração
um salto no valor de ϱ em um ponto final se, e somente se, esse ponto final estiver incluído
no intervalo. Observe também que são os limites esquerdo e direito de ϱ nos pontos finais
que determinam a medida, não o valor de ϱ nos pontos finais. Observe finalmente que, como
ilustram os exemplos a seguir, um intervalo que tem um ou ambos os pontos finais infinitos
319
pode ter, mas não necessariamente tem, medida infinita: Então,
mϱ ([2, ∞)) = ϱ(∞ − 0) − ϱ(2 − 0) = ∞ − 2 = ∞ ,
mϱ ((−∞, ∞)) = ϱ(∞ − 0) − ϱ(−∞ + 0) = ∞ − 0 = ∞ ,
mϱ ((−∞, 2]) = ϱ(2 + 0) − ϱ(−∞ + 0) = 4 − 0 = 4 .
Com base nas observações acima, podemos deduzir várias propriedades envolvendo os mem-
bros da família espectral {E(λ)}λ∈R . Com efeito, se −∞ < α < β < +∞ e se I é um dos
intervalos (α, β), [α, β), (α, β], [α, β], podemos definir em analogia com a Definição 5.9 os
operadores P(I)
P(α,β) = E(β − ε) − E(α + ε) , P[α,β) = E(β − ε) − E(α − ε) ,
P(α,β] = E(β + ε) − E(α + ε) , P[α,β] = E(β + ε) − E(α − ε) .
Em virtude da condição (ii) da Definição 5.8, esses operadores podem também ser escritos da
seguinte forma:
P(α,β) = E(β − 0) − E(α) , P[α,β) = E(β − 0) − E(α − 0) ,
P(α,β] = E(β) − E(α) , P[α,β] = E(β) − E(α − 0) .
Claramente, se (α, β] e (β, λ] são dois intervalos adjacentes, então, P (α, µ] = P (α, β] +
P (β, λ]. Se (α, β] e (λ, µ] são dois intervalos arbitrários, então, a propriedade (i′ ) implica que
8 98 9
P(α,β] P(λ,µ] = E(β) − E(α) E(µ) − E(λ)
= E(min{β, µ}) − E(min{β, λ}) − E(min{α, µ}) + E(min{α, λ}) .
Disto, temos que se (α, β] ∩ (λ, µ] = ∅, por exemplo, se α < β # λ < µ, então,
P(α,β] P(λ,µ] = E(β) − E(β) − E(α) + E(α) = O . (5.6.18)
Por outro lado, se (α, β] ⊆ (λ, µ], se λ # α < β # µ, então,
P(α,β] P(λ,µ] = E(β) − E(λ) − E(α) + E(λ) = P(α,β] . (5.6.19)
Além disso, se (α, β] e (λ, µ] se sobrepõem sem que um deles seja um subconjunto do outro,
por exemplo, se α < λ < β < µ, então,
P(α,β] P(λ,µ] = E(β) − E(λ) − E(α) + E(α) = P(λ,β] . (5.6.20)
As fórmulas (5.6.18), (5.6.19) e (5.6.20) podem ser combinadas na seguinte (com a convenção
de que P (∅) = O):
P(α,β] P(λ,µ] = P(α,β]∩(λ,µ] . (5.6.21)
320
P(α,β]∪(λ,µ] = P(α,β] + P(λ,µ] − P(α,β]∩(λ,µ] . (5.6.22)
Finalmente, observe que (i) se P(λ,µ] = O e (α, β] ⊆ (λ, µ], então, P(α,β] = O; (ii) P(α,β] é
uma projeção, já que P(α,β] é auto-adjunta porque E(α) e E(β) são auto-adjunto, e a relação
2
P(α,β] = P(α,β] é obtida tomando-se α = λ e β = µ em (5.6.19).
Nota 5.21. Note que, se tomarmos α = β − ε e o limite ε → 0+ , obtemos a projeção P{β} =
E(β) −E(β −0) associada ao conjunto {β} consistindo no único ponto β – equivalentemente,
podemos tomar α = β em P[α,β] = E(β) − E(α − 0). P{β} é uma projeção, uma vez que é o
limite forte de uma sequência de projeções (cf. o Teorema 5.19). Tem-se:
1. P{β} = O (medida espectral do ponto β igual a zero) se, e somente se, a família espectral
{E(λ)}λ∈R é (fortemente) contínua no ponto λ = β;
2. P{β} ̸= O (medida espectral do ponto β diferente de zero) se, e somente se, a família
espectral {E(λ)}λ∈R é descontínua no ponto λ = β.
PROPOSIÇÃO 5.15. Seja {E(λ)}λ∈R uma família uni-paramêtrica de projeções ortogonais de H

em Ran(E). Então, cada membro dessa família é um operador (i) com norma ∥E(λ)∥ = 1,
(ii) auto-adjunto e (iii) ⟨x, E(λ)x⟩ " 0, para todo x ∈ H .
Demonstração. (i) Primeiro observamos que operadores de projeção ortogonais são lineares e
têm como domínio todo o espaço de Hilbert H . Então, se x é um vetor em H , segue que x
pode ser escrito univocamente na forma x = E(λ)x + (x − E(λ)x), com E(λ)x ∈ Ran(E)
e x − E(λ)x ∈ Ran(E)⊥ . Assim, ∥x∥2 = ∥E(λ)x∥2 + ∥(x − E(λ)x)∥2 " ∥E(λ)x∥2 .
Isto implica que ∥x∥ " ∥E(λ)x∥, para x ∈ H ; portanto, ∥E(λ)∥ # 1. Por outro lado, se
y ∈ Ran(E), então, existe um x ∈ H tal que
∥y∥ = ∥E(λ)x∥ = ∥E(λ)E(λ)x∥ = ∥E(λ)y∥ =⇒ ∥E(λ)∥ = 1 .
(ii) Assuma que x, y ∈ H , com x = x1 + x2 e y = y1 + y2 tal que x1 , y1 ∈ Ker(E) =

Ran(E)⊥ e x2 , y2 ∈ Ran(E). Se x2 ∈ Ran(E), podemos encontrar uma sequência
(xn )n∈N ⊂ H tal que E(λ)xn → x2 quando n → ∞. Logo, segue que
6 7
⟨y, E(λ)x⟩ = ⟨y, E(λ)x2⟩ = lim ⟨y, E(λ)xn ⟩ = lim ⟨y1, E(λ)xn ⟩ + ⟨y2 , E(λ)xn ⟩ .
n→∞ n→∞
Mas, como y1 ∈ Ker(E), então, ⟨y1 , E(λ)xn ⟩ = 0. Portanto,
⟨y, E(λ)x⟩ = lim ⟨y2 , E(λ)xn ⟩ = ⟨y2 , x2 ⟩ .

n→∞
Nós podemos utilizar o mesmo raciocínio para y para mostrar que ⟨E ∗ (λ)y, x⟩ = ⟨y2, x2 ⟩.
Logo, encontramos ⟨E ∗ (λ)y, x⟩ = ⟨y, E(λ)x⟩ para x, y ∈ H . Portanto, como E(λ) é
limitado e Dom(E) = H , segue do Teorema de Hellinger-Toeplitz (Teorema 4.14) que E(λ) é
auto-adjunto.
321
(iii) Como E(λ) é uma projeção e E(λ) = E ∗ (λ), então,
0 # ∥E(λ)x∥2 = ⟨E(λ)x, E(λ)x⟩ = ⟨x, E(λ)E(λ)x⟩ = ⟨x, E(λ)x⟩ ,
para qualquer vetor x ∈ H . Assim, ⟨x, E(λ)x⟩ " 0.

PROPOSIÇÃO 5.16. Seja {E(λ)}λ∈R uma família espectral e x um vetor fixo em um espaço de
Hilbert H . Considere a função ϱ(λ) = ∥E(λ)x∥2 = ⟨x, E(λ)x⟩,19 definida em R. A função ϱ
é monótona crescente e contínua pela direita, isto é, limε→0+ ϱ(λ + ε) = ϱ(λ) para todo λ ∈ R
e ε > 0 arbitrário. Além disso, ϱ(a) = 0 e ϱ(b) = ∥x∥2 se a # λ # b ou ϱ(−∞) = 0 e
ϱ(∞) = ∥x∥2 se o intervalo [a, b] é infinito.
Demonstração. Para todo λ, µ ∈ R, com µ # λ, pela Propriedade (i′ ) da Definição 5.8 e pelo
Teorema 5.17, segue que
ϱ(µ) = ⟨x, E(µ)x⟩ = ⟨x, E(µ)E(µ)x⟩ = ⟨E(µ)x, E(µ)x⟩ = ∥E(µ)x∥2 = ∥E(µ)E(λ)x∥2
# ∥E(µ)∥2 ∥E(λ)x∥2 # ∥E(λ)x∥2 = ⟨E(λ)x, E(λ)x⟩ = ⟨x, E(λ)E(λ)x⟩ = ⟨x, E(λ)x⟩ = ϱ(λ) .
Portanto, ϱ(µ) # ϱ(λ). Além disso, pela linearidade do produto interno, pela desigualdade de
Cauchy-Schwarz-Bunjakowski e pela Propriedade (ii) da Definição 5.8, temos
|ϱ(λ + ε) − ϱ(λ)| = |⟨x, (E(λ + ε)x − E(λ)x)⟩| # ∥x∥∥(E(λ + ε)x − E(λ)x∥ → 0 .
Logo, a função ϱ é monótona crescente e contínua pela direita. As outras propriedades seguem
imediatamente da Propriedade (iii) da Definição 5.8. Com efeito, pela continuidade do produto
interno, segue que limλ→−∞ ϱ(λ) = limλ→−∞ ⟨x, E(λ)x⟩ = ⟨x, limλ→−∞ E(λ)x⟩ = 0 e
limλ→∞ ϱ(λ) = limλ→∞ ⟨x, E(λ)x⟩ = ⟨x, limλ→∞ E(λ)x⟩ = ∥x∥2 .
PROPOSIÇÃO 5.17. Para qualquer x, y ∈ H , a função ϱ(λ) = ∥E(λ)x∥2 = ⟨x, E(λ)x⟩ é,
como uma função de λ, de variação limitada.
Antes de provarmos a proposição, lembramos que a função ϱ tem variação limitada20 no

intervalo [a, b] se existe uma uma constante C tal que
n
< 5 5
5ϱ(λk ) − ϱ(λk−1 )5 # C ,
k=1
para toda partição

a = λ0 < λ1 < · · · < λn−1 < λn = b ,
do intervalo [a, b] por pontos de subdivisão λ0 , λ1 , . . . , λn . Com efeito, como a função ϱ :
[a, b] ⊂ R → R é monótona crescente, então, para qualquer partição P = {λ0 , λ1 , . . . , λn }
de [a, b]
n
< n
5 5 < . /
5ϱ(λk ) − ϱ(λk−1 )5 = ϱ(λk ) − ϱ(λk−1 ) = ϱ(λn ) − ϱ(λ0 ) = ϱ(b) − ϱ(a) = ∥x∥2 .
k=1 k=1
19
Se E for uma projeção ortogonal, então, ∥E(λ)x∥2 = ⟨E(λ)x, E(λ)x⟩ = ⟨x, E ∗ (λ)E(λ)x⟩ =
⟨x, E(λ)E(λ)x⟩ = ⟨x, E(λ)x⟩.
20
Detalhes sobre funções de variação limitada podem ser encontrados no livro de A. N. Kolmogorov e S. V.
Fomin “Introductory Real Analysis,” Dover Publications, 1975.
322
A função ϱ tem variação limitada mesmo que o intervalo [a, b] seja infinito. Isto é uma
consequência imediata da noção de variação total de ϱ em [a, b] definida como sendo
b n c
<5 5
V b (ϱ) = sup 5ϱ(λk ) − ϱ(λk−1 )5 | P = {λ0 , λ1 , . . . , λn } é uma partição de [a, b] .
a
k=1
Logo, quando o intervalo [a, b] é infinito ϱ será de variação limitada se existir uma constante C
tal que Vab (ϱ) # C para qualquer par de números a e b, com a < b. Assim, não é difícil ver
que a quantidade
lim Vab (ϱ) = ϱ(∞) − ϱ(−∞) = ∥x∥2 .
a→−∞
b→∞
∞
Logo, a variação total de ϱ no intervalo (−∞, ∞), denotada por V−∞ (ϱ), é limitada; isto
implica que ϱ é de variação limitada. Em particular, uma função de variação limitada pode ter
descontinuidades, mas no máximo enumeráveis. A capacidade das funções de variação limitada
para lidar com descontinuidades tornou seu uso importante na teoria espectral.
Demonstração da Proposição 5.17. Seja a = λ0 < λ1 < · · · < λn−1 < λn = b. Então, pela
propriedade (i′ ), E(a, b] = E(b) − E(a) é uma projeção. Assim, pela desigualdade de Cauchy-
Schwarz-Bunjakowski, temos
n
< n
<
|⟨y, E((λj−1 − λj ])x⟩| = |⟨E((λj−1 − λj ])y, E((λj−1 − λj ])x⟩|
j=1 j=1
n
<
# ∥E((λj−1 − λj ])y∥∥E((λj−1 − λj ])x∥
j=1
( n
)1/2 ( n
)1/2
< <
2 2
# ∥E((λj−1 − λj ])y∥ ∥E((λj−1 − λj ])x∥
j=1 j=1
. /1/2 . /1/2
= ∥E((λ1 − λn ])y∥2 ∥E((λ1 − λn ])x∥2 # ∥y∥∥x∥ .
Pela ortogonalidade
E((λj−1 − λj ]) · E((λk−1 − λk ]) = 0 , para j ̸= k ,
implícita em (i′ ), temos, para n > m,
n−1
<
2 2
∥x∥ " ∥E((λm − λn ])x∥ = ∥E((λj − λj+1])x∥2 .
j=m
Isto finaliza a prova da proposição.

Nota 5.22 (Sobre a decomposição de uma função monótona). Um resultado chave, devido a
H. Lebesgue, sobre uma função monótona ϱ : R → R produz uma decomposição de ϱ como
uma soma de uma função descontínua por saltos ϱpont e uma função absolutamente contínua
ϱacont .
ϱ(λ) = ϱpont (λ) + ϱacont (λ) . (5.6.23)
323
Quanto à componente absolutamente contínua, podemos aplicar o Teorema Fundamental do

Cálculo $ λ
def.
ϱ1 (λ) = dµ ϱ′acont (µ) .
λ0
Defina
ϱ2 (λ) = ϱpont (λ) − ϱ1 (λ) .
Então, ϱ2 é uma função contínua de variação limitada tal que
$ λ
d
ϱ′2 (λ) = ϱ′acont (λ) − dµ ϱ′acont (µ) = 0 ,
dλ λ0
em quase toda parte. Uma função contínua de variação limitada é considerada singular se
sua derivada se anula em quase toda parte. Por exemplo, a função de Cantor é singular.21
Combinando estas observações, descobrimos que uma função ϱ monótona pode ser representada
como uma soma
ϱ(λ) = ϱpont (λ) + ϱacont (λ) + ϱscont (λ) , (5.6.24)
de uma função descontínua por saltos ϱpont , uma função absolutamente contínua ϱacont e
função singular ϱscont . A fórmula (5.6.24) é conhecida como decomposição de Lebesgue. Observe
que, derivando a fórmula (5.6.24), obtemos
ϱ′ (λ) = ϱ′acont (λ) ,
em quase toda parte. Assim, a integração da derivada de uma função monótona não restaura
a própria função, mas apenas sua “componente” absolutamente contínua, enquanto as outras
duas componentes, ou seja, a função singular e a função descontínua por saltos, “desaparecem
sem deixar vestígios.”
Vamos finalizar esta nota com um resultado importante relacionado com ⟨x, E(λ)x⟩.
TEOREMA 5.30. Como a função ϱ(λ) = ∥E(λ)x∥2 = ⟨x, E(λ)x⟩ é monótona crescente, então,
o conjunto de pontos em que ϱ é descontínua é vazio, finito ou infinito contável.
Demonstração. Seja Ω o conjunto de pontos nos quais ϱ é descontínua e suponha que Ω não
é vazio. Então, para λ ∈ Ω temos ϱ(λ − 0) < ϱ(λ + 0), então, existe um número racional rλ
tal que ϱ(λ − 0) < r < ϱ(λ + 0). Agora, pela Proposição 5.16 temos que µ < λ implica que
ϱ(µ + 0) # ϱ(λ − 0), e segue que se µ, λ ∈ Ω são tais que µ < λ, então, rµ < rλ ; assim,
associamos a cada λ ∈ Ω um número racional distinto. Uma vez que o conjunto de todos os
números racionais pode ser listado como uma sequência, segue que o conjunto {rλ | λ ∈ Ω}
também pode ser listado como uma sequência (finita ou infinita). Dessa forma, podemos então
listar os elementos de Ω na mesma ordem que seus números racionais associados. Assim, Ω
(se não for vazio) é finito ou infinito contável.
21
Cf. os detalhes no livro de A. N. Kolmogorov e S. V. Fomin “Introductory Real Analysis,” Dover Publications,
1975.
324
Com estes preparativos, estamos agora em posição de discutir o Teorema Espectral para
um operador auto-adjunto limitado (não necessariamente compacto). Como mencionado ante-
riormente, existem várias provas desse teorema disponíveis na literatura, com muitas nuances
espalhadas entre diferentes apresentações da prova. Aqui, como estratégia, em vez de uma
prova detalhada do teorema espectral (que pode ser encontrada em qualquer texto sobre análise
espectral em espaços de Hilbert), faremos uma discussão de ideias envolvidas na prova através
de dois exemplos. Iniciamos com o
Exemplo 5.13 (Uma nova versão da decomposição espectral de operadores compactos).
Vamos considerar o caso de um operador A auto-adjunto e compacto. Primeiro, note que a
série (5.6.13) permanece convergente, com a mesma soma, independentemente da ordem de
como estão arranjados os termos da série. De acordo com o Teorema 5.27, se A é auto-adjunto
e compacto, mas de dimensão infinita, ele deve ter um espectro discreto infinito de pontos.
Sabemos que σdisc (A) ⊂ σ(A) e 8que σ(A) é um 9 conjunto limitado – pelo Teorema 5.5 ele se
situa dentro do intervalo fechado −∥A∥, ∥A∥ . Além disso, vimos também que zero deve ser
um ponto limite de σdisc (A). Logo, vamos arranjar os termos da série (5.6.13) de tal forma que
os auto-valores de A estejam organizados numa ordem decrescente de seus valores absolutos;
isto é, escrevemos λ1 , λ2 , . . . , λn , . . ., com
|λ1 | " |λ2 | " · · · " |λn | " · · · .
Seja (Pi )i∈N uma sequência de projeções ortogonais6 no espaço 7 de Hilbert H , tal que Pi x =
;∞
⟨xi , x⟩xi , Pi Pi x = Pi x, Pi Pj x = 0 para i ̸= j e i=1 Pi x = 1Ix (lembre-se do Exemplo
4.2 que qualquer soma infinita de projeções mutuamente ortogonais converge fortemente). Se
usamos a decomposição H ; = M ⊕ Ker(A) e escrevemos x = y + z, y ∈ M e z ∈ Ker(A),
temos Pi x = Pi y e y = ′ Pi x. Definindo por P0 a projeção ortogonal de H sobre o núcleo
de A, isto é, P0 x = z, segue que P0 Pi = Pi P0 = O se j ̸= 0. Logo, temos
<′
x = P0 x + Pi x .
Com isto, introduzimos a família de operadores E(λ) em H , com m(A) < λ < M(A) (veja
a Nota 5.16), definida por
⎧<
⎪
⎪ Pi x se λ < 0
⎪
⎪
⎨λi #λ
E(λ)x = com x ∈ H . (5.6.25)
⎪
⎪ <
⎪
⎪x − Pi x se λ " 0
⎩
λi >λ
Neste caso, E(λ) é, como função de λ, constante entre dois auto-valores consecutivos de A,
igual ao operador nulo O quando λ é menor do que todos os auto-valores, e igual ao operador
identidade 1I quando λ é maior do que o último auto-valor. O salto de E(λ) quando λ passa
por um auto-valor µ, mais especificamente E(µ) = E(λ) − E(λ − 0), é a projeção sobre o
auto-espaço associado a µ.
<
E(µ)x = Pi x , para µ ̸= 0 ,
λi =µ
<
E(0)x = x − Pi x .
λi >µ
325
Além disso, nas somas acima devemos contar cada auto-valor quantas vezes forem exigidas pela
sua multiplicidade. Note que, no caso particular em que x = xk , a condição ⟨xi , xk ⟩ = δik ,
implica que a Eq.(5.6.25) assume a seguinte forma simples:
⎧
⎨xk se λk # λ < 0
E(λ)xk = . (5.6.26)
⎩0 se λ > λ " 0
k
A família de operadores E(λ) tem propriedades interessantes. Todo membro da família ao

operar em H é um operador linear e simétrico. Para vermos isto, assuma que x, y ∈ H e
que α, β ∈ C; então, para λ < 0 segue que
< < <
E(λ)(αx + βy) = Pi (αx + βy) = α Pi x + β Pi y = αE(λ)x + βE(λ)y .
λi #λ λi #λ λi #λ
A prova da linearidade de E(λ) para λ " 0 é similar. Para mostrar que E(λ) é simétrico
usamos o fato que qualquer vetor x ∈ H pode ser escrito como a combinação
< < <
x= Pi x = Pi x + Pi x . (5.6.27)
i∈I λi #λ λi >λ
Uma vez que os auto-valores λi > λ correspondem aos auto-vetores que são ortogonais àqueles
auto-vetores correspondentes aos auto-valores λi # λ, segue que para λ < 0
I J I J
< < < < <
⟨y, E(λ)x⟩ = Pi y + Pi y, Pi x = Pi y, Pi x .
λi #λ λi >λ λi #λ λi #λ λi #λ
Pelas mesmas razões, segue que

I J I J
< < < < <
⟨E(λ)y, x⟩ = Pi y, Pi x + Pi x = Pi y, Pi x .
λi #λ λi #λ λi >λ λi #λ λi #λ
Logo, E(λ) é simétrico. A prova da simetria de E(λ) para λ " 0 é similar.
Agora, vamos provar que a família de operadores E(λ) satisfaz os postulados da Definição
5.8. Partimos observando que, em conformidade com a Eq.(5.6.6), E(λ) será o operador nulo
se λ # m(A) e será o operador identidade se λ " M(A) (aqui, pela Nota 5.16, m(A) e M(A)
são os limites de A). Agora, separamos os casos quando λ < 0 e λ " 0. É fácil verificar que
em ambos os casos E(λ) # E(µ) se λ # µ. Com efeito, se λ # µ < 0, então,
8 9 < 8 9 <
E(µ) − E(λ) x = Pi x =⇒ E(µ) − E(λ) = Pi " 0 .
λ<λi #µ λ<λi #µ
Se 0 # λ # µ, então,
8 9 < <
E(µ) − E(λ) x = x − Pi x − x + Pi x
λi >µ λi >λ
< < 8 9 <

=− Pi x + Pi x =⇒ E(µ) − E(λ) = Pi " 0 .
λi >µ λi >λ λ<λi #µ
326
Isto verifica (i). Além disso,

( )
< <<
E(λ)E(µ)x = E(λ) Pi x = Pj Pi x .
λi #µ λj #λ λi #µ
Assuma que µ > λ; então, por causa das propriedades Pi Pi x = Pi x e Pi Pj x = 0 para i ̸= j,

todos os termos da segunda soma para os quais λi > λ não contribuem para a soma dupla.
Da mesma forma isto vai acontecer se λ > µ. Logo, podemos concluir que
<
E(λ)E(µ)x = Pi x = E(min{λ, µ})x .
λi #min{λ,µ}
′
Isto verifica (i ). Em particular, se λ = µ, então, E(λ)E(λ)x = E(λ)x.
Para provar a propriedade (ii) tome λ < 0 e ε > 0 (arbitário). Logo,

<
∥E(λ + ε)x − E(λ)x∥2 = ∥Pi x∥2 .
λ<λi #λ+ε
;∞
Por causa da expansão (5.6.27), a série i=1 ∥Pi x∥2 é convergente; portanto, existe um N(ε) ∈
N tal que para i > N(ε) todos os elementos λi da sequência (|λi |)i∈N de auto-valores
eventualmente (com exceção dos elementos λ1 , . . . , λN (ε) ) estão no intervalo (λ, λ + ε]. Assim,
<
∥E(λ + ε)x − E(λ)x∥2 = ∥Pi x∥2 < ε2 → 0 quando ε → 0+ .
λ<λi #λ+ε
Isto, por sua vez, implica que a propriedade (ii) é satisfeita para λ < 0 e da mesma forma para
λ > 0. Por outro lado, se λ = 0, segue que
<
E(0)x = x − Pi x ,
λi >0
e para λ > 0
< < <
∥E(λ)x − E(0)x∥2 = ∥Pi x∥2 # ∥Pi x∥2 + ∥Pi x∥2 .
λ"λi >0 λ"λi >0 −λ#λi <0
;∞
Novamente, devido ao fato da série i=1 ∥Pi x∥2 ser convergente e da sequência (|λi |)i∈N
convergir monotonicamente para zero, existe para λ > 0 arbitrário um N ∈ N tal que para
i > N todos os elementos λi da sequência de auto-valores estão no intervalo [−λ, λ] e
< <
ε2 > ∥Pi x∥2 + ∥Pi x∥2 ,
λi >0 λi <0
em que ε > 0 é arbitrário. Logo, quando λ → 0+ , ∥E(λ)x − E(0)x∥ → 0. Isto implica que a
propriedade (ii) também é satisfeita para λ = 0.
A prova que a propriedade (iii) é satisfeita pela família de operadores E(λ) é alcançada
usando-se um argumento análogo ao da prova da existência do limite forte pela direita. Com
efeito, se λ, λ′ ∈ R são escolhidos de tal modo que λ1 , . . . , λN (ε) < λ e λ′ < λ1 , . . . , λN (ε) ,
então, para todo i > N(ε), segue que
< <
∥x − E(λ)x∥2 = ∥Pi x∥2 < ε2 e ∥E(λ′ )x∥2 = ∥Pi x∥2 < ε2 .
λi >λ λi #λ′
Assim, a propriedade (iii) é válida.
327
PROPOSIÇÃO 5.18. Sejam A um operador auto-adjunto compacto e E(λ) a resolução da iden-

tidade dada pela Eq.(5.6.25). Então, AE(λ)x = E(λ)Ax.
Demonstração. Começamos computando AE(λ)x para λ < 0.

( ) ( )
< < < <
AE(λ)x = A Pi x = A ⟨xi , x⟩xi = ⟨xi , x⟩Axi = λi ⟨xi , x⟩xi .
λi #λ λi #λ λi #λ λi #λ
Computemos E(λ)Ax.
(∞ ) ( )
< < <
E(λ)Ax = E(λ) λi ⟨xi , x⟩xi = E(λ) λi ⟨xi , x⟩xi + λi ⟨xi , x⟩xi
i=1 λi #λ λi >λ
<
= λi ⟨xi , x⟩xi ,
λi #λ
por causa de (5.6.26). Logo, AE(λ)x = E(λ)Ax, para λ < 0. Para o caso em λ " 0, segue
que
( ) ∞
< < <
AE(λ)x = A x − Pi x = λi ⟨xi , x⟩xi − λi ⟨xi , x⟩xi
λi >λ i=1 λi >λ
< < <

= λi ⟨xi , x⟩xi + λi ⟨xi , x⟩xi − λi ⟨xi , x⟩xi
λi #λ λi >λ λi >λ
<
= λi ⟨xi , x⟩xi .
λi #λ
A computação de E(λ)Ax é idêntica ao caso para λ < 0.
A seguir, para m(A) # λ # M(A) (veja a Nota 5.16) e usando a decomposição (5.6.27),
vamos considerar a função
I J
< < <
ϱ(λ) = ⟨x, E(λ)x⟩ = ⟨xi , x⟩xi + ⟨xi , x⟩xi , ⟨xi , x⟩xi
λi #λ λi >λ λi #λ
I J
< < <5 5
= ⟨xi , x⟩xi , ⟨xi , x⟩xi = 5⟨xi , x⟩52 ,
λi #λ λi #λ λi #λ
definida para todo x ∈ H e λ < 0. Por sua vez, se λ " 0, não é difícil verificar que
<5 5
ϱ(λ) = ∥x∥2 − 5⟨xi , x⟩52 , ∀ x ∈ H .
λi >λ
Note que, de acordo com a Proposição 5.16, para o intervalo m(A) # λ # M(A), devido ao
fato já verificado que E(λ)x = 0 para λ # m(A) e E(λ)x = x para λ " M(A), temos
que ϱ(λ) = 0 para λ # m(A) e ϱ(λ) = ∥x∥2 para λ " M(A). Além disso, vale destacar
328
que ϱ, como função de λ, é constante entre dois auto-valores consecutivos de A e tem um

número contável de descontinuidades por saltos. Os auto-valores de A em H estão localizados
exatamente nos pontos onde a função ϱ tem uma descontinuidade por salto, para no mínimo
um vetor x ∈ H . Também não é difícil ver que a função ϱ é monótona crescente, tem variação
limitada no intervalo [m(A), M(A)] e é contínua pela direita, isto é, limε→0+ ϱ(λ + ε) = ϱ(λ)
para todo λ ∈ R e ε > 0 arbitrário.
Nota 5.23. Observe que pelas discussões acima, podemos organizar a família {E(λ)}λ∈R de
projetores ortogonais de H para −∞ < λ < ∞ da seguinte forma:
⎧
⎪
⎪ O se λ < λ1 = m(A)
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪ P1 se λ1 # λ < λ2
⎪
⎪
⎪
⎪
⎪
⎨ P1 + P2 se λ2 # λ < λ3
E(λ) = . (5.6.28)
⎪
⎪ .. ..
⎪
⎪ . .
⎪
⎪
⎪
⎪
⎪
⎪ P1 + P2 + . . . + Pr−1 se λr−1 # λ < λr
⎪
⎪
⎪
⎪
⎪
⎩P + P + . . . + P = 1I se λ " λ = M(A)
1 2 r r
Portanto, inversamente,
P1 = E(λ1 ) e Pj = E(λj ) − E(λj−1 ) , para j = 2, 3, . . . .
Uma vez que E(λ) permanece o mesmo para λ no intervalo [λj−1 , λj ), pela Nota 5.21, isso
pode ser escrito como Pj = E(λj ) − E(λj−0 ). Assim, segue que para x ∈ Dom(A)
< <
x= Pj x = (E(λj ) − E(λj−0))x ,
j∈J j∈J
e isto implica que

< <
Ax = λj Pj x = λj (E(λj ) − E(λj−0 ))x ,
j∈J j∈J
com a soma sendo estendida sobre a sequência inteira, se finita ou infinita.
Pela Nota 5.23, se deixamos de lado o vetor x chegamos em

<
A= λj (E(λj ) − E(λj−0 )) ,
j∈J
com esta igualdade sendo garantida pela convergência na;norma do operador. Se escrevemos
δE(λ) = E(λj ) − E(λj−0 ), então, temos que A = j∈J λj δE(λ). Esta representação
espectral do operador auto-adjunto compacto A mostra que para qualquer x ∈ Dom(A),
temos
<
⟨x, Ax⟩ = λj ⟨x, δE(λ)x⟩ .
j∈J
Antecipando uma definição rigorosa da integral de Riemann-Stieltjes com uma função inte-
gradora com valor de operador, a representação espectral acima nos leva ao principal resultado
deste exemplo:
329
TEOREMA 5.31. Para todo operador auto-adjunto compacto A operando em um espaço de Hilbert
complexo H , com limites inferior e superior iguais a m e M, definidos de acordo com o Teorema
5.25, podemos associar uma família espectral {E(λ)}λ∈R de tal forma que para σ(A) ⊆ [m, M]
e para todo x ∈ Dom(A), nós temos a seguinte representação:
$ $ M $ M
⟨x, Ax⟩ = dϱ(λ) λ = dϱ(λ) λ = d⟨x, E(λ)x⟩ λ .
σ(A) m−0 m−0
Nota 5.24. Aqui, m − 0 significa um número arbitrário menor do que m; é escrito para indicar
que deve-se levar em consideração uma contribuição em λ = µ < m. Assim, usando qualquer
µ < m, podemos escrever simbolicamente
$ M $ M $ M
A= dE(λ) λ = dE(λ) λ = (m − 0)E(m − 0) + dE(λ) λ .
µ m−0 m
Em outras palavras, trata-se de fato de uma integral de m até M, mas com respeito à função
E(λ) que foi modificada no ponto m pela substituição de E(m) por E(m − 0), ou seja, pelo
operador nulo O. Se a condição de continuidade pela direita for omitida, podemos assumir
E(m) = O por definição.
Antes de provarmos o Teorema 5.31, precisamos da seguinte
DEFINIÇÃO 5.10 (Integral de Riemann-Stieltjes). Sejam f e ϱ duas funções sobre o intervalo

[a, b], em que ϱ é de variação limitada e contínua pela direita. Seja
a = λ0 < λ1 < · · · < λn−1 < λn = b ,
uma partição do intervalo [a, b] por pontos de subdivisão λ0 , λ1 , . . . , λn−1 , λn . Tome um ponto
arbitrário ξk em cada subintervalo [λk , λk+1] e forme a soma
n−1
< . /
ZP = ϱ(λk+1 ) − ϱ(λk ) f (ξk ) . (5.6.29)
k=0
Suponha que quando a partição é refinada,22 isto é, que quando a quantidade
∥P∥ = max{λ1 − λ0 , λ2 − λ1 , . . . , λn − λn−1 } ,
aproxima-se de zero, a soma (5.6.29) aproxima-se de um limite, independentemente da escolha

dos pontos λk e ξk . Então, este limite é chamado integral de Riemann-Stieltjes de f com respeito
à função integradora ϱ e é denotada por
$ b
lim ZP = dϱ(λ) f (λ) . (5.6.30)
∥P∥→0 a
22
Sejam P = {λ0 , λ1 , . . . , λn−1 , λn } e P ′ = {λ′0 = λ0 , λ′1 , . . . , λ′n−1 , λ′n = λn } partições do mesmo
intervalo [a, b]. Então, dizemos que P ′ é um refinamento de P se todo ponto de P é ponto de P ′ .
330
A expressão (5.6.30) significa que para cada ε > 0 arbitrário existe um número η(ε) tal que
5 $ b 5
5 5
5 ZP − dϱ(λ) f (λ) 5<ε,
5 5
a
para toda partição P do intervalo [a, b] com norma ∥P∥ < η(ε) e cada escolha admissível
de ξk . Observe que para ϱ(λ) = λ, a integral (5.6.30) é a familiar integral de Riemann de f
sobre [a, b]. Além disso, se f é contínua em [a, b] e ϱ tem uma derivada que é integrável em
[a, b], então
$ b $ b
dϱ(λ) f (λ) = dλ ϱ′ (λ)f (λ) ,
a a
em que ϱ′ denota a diferenciação em relação a λ.
Demonstração do Teorema 5.31. Primeiro, observamos que pelo Teorema 5.27

I∞ ∞
J
< < < 5 52
⟨x, Ax⟩ = ⟨xi , x⟩xi , λj ⟨xj , x⟩xj = λi 5⟨xi , x⟩5 . (5.6.31)
i=1 j=1 i∈I
; 2
Agora, uma vez que ϱ(λ) = ⟨x, E(λ)x⟩ = λj #λ |⟨xj , x⟩| é monótona crescente em λ,
db db
a
dϱ(λ) λ = a d⟨x, E(λ)x⟩ λ existe. Seja P uma partição do intervalo [m − 0, M]:
P: a = µ0 < m < µ1 < · · · < µn−1 < M # µn = b ,
Então, pela Definição 5.10, temos que
$ b n−1
< . /
dϱ(λ) λ = lim ZP = lim ϱ(µk+1 ) − ϱ(µk ) ξk
a ∥P∥→0 ∥P∥→0
k=0
⎛ ⎞
n−1
< < 5 5
= lim ⎝ 5⟨xi , x⟩52 ⎠ ξk .
∥P∥→0
k=0 µk <λi #µk+1
Agora, considere todas as partições P do intervalo [m − 0, M], e para um η > 0 arbitrário,

assuma que ∥P∥ < η. Tome cada auto-valor λk do operador A como sendo um ponto
arbitrário em cada subintervalo [µk , µk+1] (por que isso é possível?) e forme a soma
⎛ ⎞
<n−1 < 5 5
ZP′
= ⎝ 5⟨xi , x⟩52 ⎠ λk .
k=0 µk <λi #µk+1
Então,
⎛ ⎞
n−1
< < 5 5
′
|ZP − ZP |# ⎝ 5⟨xi , x⟩52 ⎠ |ξk − λk |
k=0 µk <λi #µk+1
n−1
< < <5
5 5 5
#η 5⟨xi , x⟩52 = η 5⟨xi , x⟩52 = η∥x∥2 .
k=0 µk <λi #µk+1 i∈I
331
Assim, segue que

′
lim (ZP − ZP )=0.
∥P∥→0
Finalmente, temos que

$ b
′ ′
dϱ(λ) λ = lim ZP = lim (ZP − ZP + ZP )
a ∥P∥→0 ∥P∥→0
⎛ ⎞
n−1
< < 5 5
′
= lim ZP = lim ⎝ 5⟨xi , x⟩52 ⎠ λk
∥P∥→0 ∥P∥→0
k=1 µk <λi #µk+1
<5 5
= 5⟨xi , x⟩52 λi = ⟨x, Ax⟩ .
i∈I
dM
Um outro esquema de como proceder com a prova da expressão A = m−0 dE(λ) λ pode
ser encontrado no livro de F. Riesz e B. Sz-Nagy, “Functional Analysis,” Dover, 1990, pg. 272. O
método parece produzir a abordagem mais elementar do Teorema Espectral e, portanto, por uma
questão de completeza, vamos apresentá-la. Novamente, tome uma partição P do intervalo
[m − 0, M]:
µ0 < m < µ1 < µ2 < · · · < µn−1 < µn = M ,
e assuma que
n
∥P∥ = max(µk − µk−1) .
k=1
Por λk denotamos pontos intermediários de forma que µk−1 # λk # µk . Exigimos que λ1 > m.
Sejam f uma função de valor real em [m − 0, M], E(λ) a família espectral de A e suponha
que existe um operador compacto B tal que o seguinte vale: para um ε > 0 arbitrário existe
um η > 0 tal que
? ?
? <n ?
? ?
? B − f (λ k )(E(µ k ) − E(µ k−1 ? # ε ,
))
? ?
k=1
para cada partição P, com ∥P∥ < η, e cada escolha de pontos intermediários λk . Se
aumentarmos indefinidamente o número n de intervalos de ; decomposição (µk−1 , µk ), de tal
n
modo que seu comprimento máximo tenda a 0, a soma k=1 f (λk )(E(µk ) − E(µk−1 ))
tenderá, portanto, a B na norma dos operadores limitados de H . Como E(λ) é constante
dM
para λ " M e para λ < m, dizemos, então, que a integral de Stieltjes m−0 dE(λ) f (λ) existe
e é igual a B.
Consideremos agora em particular a função f (λ) = λ. Levando em conta a Eq.(5.6.17) e as

observações feitas logo abaixo dela, obtemos as seguintes desigualdades:
µk−1(eµk (λ) − eµk−1 (λ)) # λk (eµk (λ) − eµk−1 (λ)) # µk (eµk (λ) − eµk−1 (λ)) ,
µk−1(eµk (λ) − eµk−1 (λ)) # λ(eµk (λ) − eµk−1 (λ)) # µk (eµk (λ) − eµk−1 (λ)) ,
332
que são válidas para todo λ ∈ R. Dessas desigualdades obtemos imediatamente as desigualda-
des
µk−1(E(µk ) − E(µk−1 )) # λk (E(µk ) − E(µk−1)) # µk (E(µk ) − E(µk−1 )) ,
µk−1 (E(µk ) − E(µk−1 )) # A(E(µk ) − E(µk−1)) # µk (E(µk ) − E(µk−1 )) ,

Somando membro a membro de k = 1 até k = n as desigualdades acima, e com o auxílio das
abreviações,
n
<
R= µk−1(E(µk ) − E(µk−1 )) ,
k=1
n
<
S= λk (E(µk ) − E(µk−1)) ,
k=1
n
<
T = µk (E(µk ) − E(µk−1)) ,
k=1
obtemos que
R#S#T e R#A#T . (5.6.32)
Para um ε > 0 tomado arbitrariamente, defina η = ε/2. Para toda partição P do intervalo
[m − 0, M] com ∥P∥ < η temos
n
<
T −R= (µk − µk−1 )(E(µk ) − E(µk−1))
k=1
n
<
#η (E(µk ) − E(µk−1 ))
k=1
= η(E(µn ) − E(µ0 ))
= η(1I − O) = η1I .
Logo, segue que O # T − R # η1I. Neste ponto, observe que como E(m) nem sempre é igual
ao operador nulo, para obter o resultado acima precisamos que E(µ0 ) = O; por esta razão
somos obrigados a trabalhar no intervalo [m − 0, M] como enfatizado na Nota 5.24. Agora, por
causa das desigualdades (5.6.32), segue que
O # T − S # η1I e O # T − A # η1I ,
portanto,
∥T − S∥ # η e ∥T − A∥ # η ,
(cf. a Nota 5.16). Consequentemente,
∥A − S∥ # ∥A − T ∥ + ∥T − S∥ # η + η = ε ,
dM
e assim A = m−0
dE(λ) λ. Com isto finalizamos a prova do teorema e do Exemplo 5.13.
333
Nota 5.25 (Teoremas fundamentais sobre a integral de Riemann-Stieltjes). Tendo trabalhado

de forma breve a teoria básica da integral de Riemann-Stieltjes, a seguir apresentamos alguns
resultados, cujas as provas podem ser encontradas na maioria dos textos sobre integração. Em
todos eles, assumimos que ϱ : R → R. é uma função monótona crescente.
TEOREMA 5.32. Se o intervalo I é uma união de um número finito de intervalos disjuntos aos
pares I = I1 ∪ I2 ∪ · · · ∪ In , então,
$ n $
<
dϱ(λ) f (λ) = dϱ(λ) f (λ) ,
I j=1 Ij
no sentido de que, se um lado existe, o outro também existe, e os dois são iguais.
TEOREMA 5.33. (i) Se ϱ é contínua em a, então,

$ $
dϱ(λ) f (λ) = dϱ(λ) f (λ) ,
[a,b] (a,b]
e $ $
dϱ(λ) f (λ) = dϱ(λ) f (λ) ,
[a,b) (a,b)
no sentido de que, se um lado da equação existe, o outro também existe, e os dois são iguais.
(ii) Se ϱ é contínua em b, então,

$ $
dϱ(λ) f (λ) = dϱ(λ) f (λ) ,
[a,b] [a,b)
e $ $
dϱ(λ) f (λ) = dϱ(λ) f (λ) ,
(a,b] (a,b)
no sentido de que, se um lado da equação existe, o outro também existe, e os dois são iguais.
TEOREMA 5.34. (i) Para qualquer intervalo I,

$
dϱ(λ) 1 = mϱ (I) .
I
(ii) Se ϱ é constante em um intervalo aberto I, então,

$
dϱ(λ) f (λ) = 0 .
I
(iii) Para qualquer função f definida em a,

$
8 9
dϱ(λ) f (λ) = f (a) ϱ(a + 0) − ϱ(a − 0) .
[a,a]
334
Exemplo 5.14 (O caso do operador posição X em L2 [a, b] revisitado). Vamos continuar

considerando o exemplo do operador posição X operando no espaço de Hilbert L2 [a, b]. A
análise abaixo é devido a H. Shima.23 Para começar, nós definimos o espaço
3 4
E(λ) = Ψ ∈ L2 [a, b] | x > λ =⇒ Ψ(x) = 0 (q.t.p) . (5.6.33)
Obviamente, E(λ) é um subespaço de L2 [a, b]. Além disso, E(λ) é um espaço fechado. Com
efeito, o fechamento de E(λ) é provado usando como auxílio a função característica χ(λ,b]
associada ao intervalo (λ, b], isto é,
⎧
⎨1 se x ∈ (λ, b]
χ(λ,b] (x) = .
⎩0 se x ∈
/ (λ, b]
Suponha que a sequência (Ψn )n∈N ∈ E(λ) converge para Ψ quando n → ∞. Então, segue
que ∥χ(λ,b] Ψn − χ(λ,b] Ψ∥ # ∥Ψn − Ψ∥ → 0 quando n → ∞. Além disso, χ(λ,b] Ψn = 0 q.t.p,
como facilmente se vê representado na Figura 5.5 (com a parte de cima da figura mostrando
um conjunto de funções que estão contidas no espaço E(λ) enquanto a parte de baixo da
mesma figura está mostrando uma função degrau Ψλ (x) com um salto descontínuo em λ).
Isso significa que χ(λ,b] Ψ = 0 q.t.p. Portanto, Ψ ∈ E(λ). Como (Ψn )n∈N ∈ E(λ) implica que
Ψ ∈ E(λ), segue que E(λ) é fechado.
E(λ)
a x
λ b
Ψλ (x)
1
x
a λ b
Figura 5.5: Na parte de cima, temos um conjunto de funções que estão contidas no espaço
definido pelo conjunto (5.6.33). Na parte de baixo, temos a função-degrau Ψλ (t) com um salto
descontínuo em λ. Figura retirada, e adptada, do livro-texto de Hiroyuki Shima, “Functional
Reservados.
Ao contrário do caso de um operador auto-adjunto compacto, para o operador posição X, os
membros da família espectral, E(λ), como função de λ, podem crescer de maneira contínua.
Então, assuma que λ cresce de a até b de maneira contínua. Esse aumento provoca uma
23
H. Shima,“Functional Analysis for Physics and Engineering: An Introduction,” CRC Press, 2016, pg. 214.
335
mudança gradual nos espaços E(λ). Todos os espaços produzidos pelo aumento contínuo em
λ resultam em uma família de subespaços fechados, {E(λ)}λ∈[a,b] . Os elementos dessa família
satisfazem as relações de inclusão
{0} = E(a) ⊂ · · · ⊂ E(µ) ⊂ · · · ⊂ E(λ) ⊂ · · · ⊂ E(b) = L2 [a, b] . (5.6.34)
Estamos assumido que µ < λ. A Figura 5.6 fornece uma ilustração esquemática dessa relação
de inclusão. Observe que na figura, Ψ pertence a E(λ), mas não pertence a E(µ).
E(λ)
E(µ)
Ψ(x)
a µ λ b x
Figura 5.6: Diagrama da relação de inclusão do conjunto de funções em (5.6.33). A desigualdade

µ < λ implica E(µ) ⊂ E(λ) e, portanto, existe uma função Ψ que pertence a E(λ), mas
é excluída de E(µ). Figura retirada, e adptada, do livro-texto de Hiroyuki Shima, “Functional
Reservados.
A relações de inclusão da família {E(λ)}λ∈[a,b] , dada por (5.6.34), implicam que E(λ) pode
ser decomposto da seguinte forma:
E(λ) = E(µ) ⊕ E ⊥ (λ) , (5.6.35)
em que E ⊥ (λ) é o espaço ortogonal ao espaço E(µ). A seguir, defina o operador
def.
(E(λ)Ψ) (x) = χ[a,λ] (x)Ψ(x) para x ∈ [a, b] , λ ∈ R , Ψ ∈ L2 [a, b] ,
isto é, E(λ) é o operador de multiplicação pela função característica do intervalo [a, λ]. Pode-se
mostrar que {E(λ)}λ∈R é uma resolução da identidade. Com efeito, se λ # µ, então, pela
definição de função característica, temos que
. /
(E(µ)E(λ)Ψ) (x) = χ[a,µ] (x) χ[a,λ] (x)Ψ(x) = (E(λ)Ψ) (x) ,
para toda função Ψ ∈ L2 [a, b]. Isto também implica que
(E(µ)E(λ)Ψ) (x) = (E(min{λ, µ})Ψ) (x) ,
Ainda, se λ = µ, segue que (E 2 (λ)Ψ) (x) = (E(λ)Ψ) (x); isto implica que E(λ) é idempo-
tente. Sendo idempotente, E(λ) é uma projeção.
Com essa definição, segue que a Eq.(5.6.35) pode ser equacionada da seguinte forma:
8 9
χ[a,λ] (x)Ψ(x) = χ[a,µ] (x)Ψ(x) + χ[a,λ] (x) − χ[a,µ] (x) Ψ(x) , (5.6.36)
336
para toda função Ψ ∈ L2 [a, b]. A implicação geométrica de (5.6.36) é plotada na Figura 5.7.
a µ x
λ b
E(λ)Ψ
a µ x
λ b
8 9
E(λ) − E(µ) Ψ
E(µ)Ψ
a µ x a µ x
λ b λ b
Figura 5.7: Ilustração esquemática da decomposição de E(λ)Ψ na soma de E(µ)Ψ e [E(λ) −

E(µ)]Ψ representada por (5.6.36). Figura retirada, e adptada, do livro-texto de Hiroyuki Shima,
“Functional Analysis for Physics and Engineering: An Introduction,” CRC Press, 2016. Todos os
Direitos Reservados.
8 9
Se definirmos Φ = χ[a,λ] (x) − χ[a,µ] (x) Ψ, uma discussão paralela que nos levou a (5.3.3),
no Exemplo 5.4, produzirá ∥(X − λ1I)Φ∥ # (λ − µ)∥Φ∥. Ou seja, a função “pontiaguda” Φ,
que é produzida pela operação χ[a,λ] (x) − χ[a,µ] (x) em Ψ, se comporta como uma auto-função
aproximada para o auto-valor efetivo λ. Para melhorar a precisão da aproximação, temos apenas
que diminuir o valor do intervalo [µ, λ], ou equivalentemente, aproximar µ de λ. Para refinar
esta ideia, vamos introduzir uma sequência de pontos {λk }0#k#n no intervalo fechado de [a, b]
de forma que a = λ0 < · · · < λk−1 < λk < · · · < λn = b. Isto nos leva à decomposição da
função Ψ mostrada na Figura 5.8.
a = λ0 λ1 λ2 λ3 λ4 λ5 λk−1 λk λn = b x
Figura 5.8: Decomposição de Ψ em um conjunto de funções, [E(λk ) − E(λk−1)]Ψ, de k = 0

até k = n. Figura retirada, e adptada, do livro-texto de Hiroyuki Shima, “Functional Analysis for
Physics and Engineering: An Introduction,” CRC Press, 2016. Todos os Direitos Reservados.
Usando a família de operadores de projeção {E(λk )}λ∈[a,b] , uma dada função Ψ ∈ L2 [a, b]
337
é decomposta em um conjunto de funções Φk definidas da seguinte forma:

⎧
8 9 ⎨Ψ dentro do intervalo [λk−1 , λk ]
Φk (x) = χ[a,λk ] (X) − χ[a,λk−1] (X) Ψ(x) = .
⎩0 caso contrário
Somando todas as funções Φk de k = 0 até k = n, a função original Ψ é reproduzida como

n
< n
< 8 9
Ψ(x) ≈ Φk (x) = χ[a,λk ] (X) − χ[a,λk−1] (X) Ψ(x) .
k=1 k=1
Portanto, operando com o operador posição X em Ψ, obtemos

n
< 8 9
XΨ(x) ≈ X χ[a,λk ] (X) − χ[a,λk−1] (X) Ψ(x) .
k=0
Consequentemente,
8 quando o9 máximo das amplitudes λk − λk−1 tende para zero, o operador
X χ[a,λk ] (X) − χ[a,λk−1] (X) que aparece no lado direito da equação acima torna-se próximo
8 9
o suficiente de λk χ[a,λk ] (X) − χ[a,λk−1] (X) . Este fato nos motiva a escrever
n
< $ b
8 9
X≈ λk χ[a,λk ] (X) − χ[a,λk−1] (X) −→ dE(λ) λ , para a, b ∈ R . (5.6.37)
k=0 a
A integral na última expressão é a integral de Riemann-Stieltjes. Em outras palavras, a inte-

gral em (5.6.37) deve-se à analogia com a integração elementar já discutida no Exemplo 5.13.
Baseia-se na conjectura de que a soma finita em (5.6.37) é reduzida à integral sob um certo
procedimento de tomar o limite; isto é, segmentando o intervalo [λk−1 , λk ] muito finamente e
tomando-se o limite de λk − λk−1 → 0. A representação integral formal apresentada acima tem
significado importante para qualquer operador auto-adjunto atuando em espaços de Hilbert.
PROPOSIÇÃO 5.19. A igualdade (E(λ)Ψ) (x) = χ[a,λ] (x)Ψ(x) para Ψ ∈ L2 [a, b] e λ ∈ R,

com x ∈ [a, b], define uma família espectral em L2 [a, b].
Demonstração. A monotonicidade já foi provada. Vamos provar a continuidade forte pela direita:
sejam λ ∈ R, Ψ ∈ L2 [a, b] e (εn )n∈N uma sequência nula de números positivos.24 Então,
$ b
. / 2
8 9
∥ E(λ + εn ) − E(λ) Ψ∥ = dx χ[a,λ+εn] (x) − χ[a,λ] (x) |Ψ(x)|2 .
a
Por causa das relações 0 # χ[a,λ+εn] (x) − χ[a,λ] (x) # 1 e χ[a,λ+εn] (x) − χ[a,λ] (x) → 0 quando
n → ∞ para todo x ∈ [a, b], segue pelo Teorema de Lebesgue que
. /
E(λ + εn ) − E(λ) Ψ → 0 quando n → ∞ .
24
Lembremos que, uma sequência (xn )n∈N é uma sequência nula se, para cada intervalo aberto contendo 0, a
sequência estiver, em última análise, nesse intervalo. Em símbolos: para todo ε > 0 existe um N tal que |xn | < ε
quando n " N . Em linguagem simples, uma sequência nula é toda aquela que converge para zero.
338
Como isso vale para toda sequência nula (εn )n∈N , a propriedade de continuidade forte pela
direita segue. Podemos provar a última propriedade de forma semelhante, uma vez que temos
χ[a,λ] (x) → 1 para todo x ∈ [a, b], quando λ → ∞ ,
χ[a,λ] (x) → 0 para todo x ∈ [a, b], quando λ → −∞ .
Com isto finalizamos a prova da proposição e o nosso Exemplo 5.14.
Levando em conta o conjunto de ideias discutidas nos Exemplos 5.13 e 5.14 o teorema
anunciado é o seguinte:
TEOREMA 5.35 (Decomposição espectral). Sejam A um operador auto-adjunto limitado em

um espaço de Hilbert H e [m, M] ⊂ R um intervalo compacto tal que σ(A) ⊆ [m, M]. Então,
existe uma famíla espectral de operadores de projeções ortogonais {E(λ)}λ∈R em H tal que
para todo x ∈ Dom(A) e y ∈ H , temos
$ M
⟨y, Ax⟩ = d⟨y, E(λ)x⟩ λ ,
m−0
ou simbolicamente $ M
A= dE(λ) λ .
m−0
Além disso, para toda função contínua f (λ) no intervalo m − 0 < λ # M

$ M $ M
f (A) = dE(λ) f (λ) e ⟨y, f (A)x⟩ = d⟨y, E(λ)x⟩ f (λ) .
m−0 m−0
No teorema acima, a família {E(λ)}λ∈R satisfaz a condição que λ < m ⇒ E(λ) = O e λ "
dM dM
M ⇒ E(λ) = 1I. Note que, x = 1Ix = m−0 dE(λ) x e ∥x∥2 = ⟨x, x⟩ = m−0 d⟨x, E(λ)x⟩.
Nota 5.26. Neste ponto é interessante destacar a importância da representação espectral via as
integrais de Riemann-Stieltjes.
; Estas integrais não são senão a soma de certas séries particulares,
como a série Ax = i∈I λi ⟨xi , x⟩xi . Como os números λi são reais, estão em um intervalo
finito e podem ter como ponto limite apenas um único ponto, o ponto 0, enumerá-los na ordem
de magnitude crescente ou decrescente só é possível se eles forem finitos em número, ou se
todos têm um sinal. Portanto, os termos da série acima seguem não em sua ordem natural, mas
na ordem determinada
; pela enumeração do conjunto de auto-valores. Este defeito da repre-
sentação Ax = i∈I λi ⟨xi , x⟩xi pode ser removido usando-se a integral de Riemann-Stieltjes.
Além disso, a representação integral generaliza-se para operadores auto-adjuntos arbitrários (não
necessariamente compactos) em H . Mais do que isto, para operadores auto-adjuntos ilimitados,
que por causa do Teorema de Hellinger-Toeplitz não podem ser definidos em todo o espaço de
Hilbert H , pode-se também construir uma família E(λ) de projetores ortogonais, que é defi-
nida para todo λ real, monótona crescente e contínua à direita, qued ∞tende a O para λ → −∞
e a 1I para λ → ∞, e com a qual a decomposição espectral A = −∞ dE(λ) λ acontece (cf. a
Seção 5.10).
339
5.7 Perturbações Relativamente Compactas de Operadores

Auto-Adjuntos
Nesta seção, vamos provar alguns resultados sobre a invariância do espectro essencial sob
perturbações compactas. O principal resultado desta seção é o teorema de perturbação de
Weyl que estabelece que o espectro essencial de um operador auto-adjunto é invariante sob
perturbações simétricas e compactas. Lembramos que, em um espaço de Hilbert H , um
operador A : Dom(A) → H é dito ser compacto se toda sequência limitada (xn )n∈N ⊂
Dom(A) contiver uma subsequência (xnk )k∈N para a qual (Axnk )k∈N é convergente, ou
equivalentemente, A é compacto se dada uma sequência de vetores (xn )n∈N ⊂ Dom(A) que
converge fracamente para x ∈ H , a sequência dos vetores transformados (Axn )n∈N converge
fortemente para Ax, isto é, ∥Axn − Ax∥ → 0. Além disso, pelo Teorema 5.21, todo operador
compacto é limitado.
DEFINIÇÃO 5.11. Sejam A um operador fechado em um espaço de Hilbert H e ∥ · ∥A a norma
do gráfico de A definida por 25
∥x∥A = ∥x∥ + ∥Ax∥ , x ∈ Dom(A) . (5.7.1)
Um operador linear B em H é chamado relativamente A-compacto se Dom(A) ⊂ Dom(B)

e se B é um mapeamento compacto de B : Dom(A) → H com respeito a norma ∥ · ∥A , isto
é, existe uma constante C tal que para todo x ∈ Dom(A),
. /
∥Bx∥ # C ∥x∥ + ∥Ax∥ . (5.7.2)
Note que, se a desigualdade (5.7.2) não se mantiver, seria possível encontrar uma sequência
(xn )n∈N ⊂ Dom(A) com ∥xn ∥ + ∥Axn ∥ = 1 e ∥Bxn ∥ → ∞; logo a sequência (Bxn )n∈N
não teria uma subsequência (Bxnk )k∈N que converge em H . Assim, de acordo com a definição
acima, a compacidade de B : Dom(A) → H é garantida se para cada sequência (xn )n∈N ⊂
Dom(A) tivermos ∥xn ∥ + ∥Axn ∥ < C ′ , para uma outra constante C ′ = 1/C, já que
isto garante que ∥Bxn ∥ < 1 e, portanto, que a sequência (Bxn )n∈N tem uma subsequência
(Bxnk )k∈N que converge em H . Por exemplo, se B é um operador compacto em H com
Dom(B) = H , então B é, obviamente, A-compacto para qualquer operador fechado A.
O próximo resultado estabelece que se A e B são operadores fechados em um espaço

de Hilbert H e se Dom(A) ⊂ Dom(B), então existem constantes a, b ∈ R+ tais que
(4.9.1) é satisfeita. O que fizemos na Definição 4.31 foi assumir que a < 1, e isso assegurou
a validade do Teorema de Kato-Rellich, como explicado na Nota 4.32. Lembre-se que todo
operador auto-adjunto é fechado.
LEMA 5.5. Sejam A e B operadores fechados em um espaço de Hilbert H . Assuma que B
é A-compacto. Então, dado a > 0, existe uma constante b = b(a) tal que para todo vetor
x ⊂ Dom(A),
∥Bx∥ # a∥Ax∥ + b∥x∥ . (5.7.3)
25
Veja a Nota 4.20, Eq.(4.4.3), na pg.172.
340
Demonstração. Suponha que (5.7.3) seja falsa. Então, para algum a > 0 e para cada número
inteiro positivo n, existe uma sequência (xn )n∈N ⊂ Dom(A) tal que
∥Bxn ∥ > a∥Axn ∥ + n∥xn ∥ .
Defina yn = xn /∥xn ∥A , em que ∥ · ∥A é a norma do gráfico de A. Então, a partir de (5.7.3)

temos que
∥Byn ∥ > a∥Ayn ∥ + n∥yn ∥ . (5.7.4)
Agora, ∥yn ∥A = 1 e B é A-compacto. Portanto, existe uma subsequência (ynk )k∈N de (yn )n∈N
tal que (Bynk )k∈N converge em H . Como ∥ynk ∥ < ∥Bynk ∥/n e a sequência (∥Bynk ∥)k∈N
é limitada (veja a Definição 5.7), ynk → 0 no domínio Dom(A). Partindo do pressuposto de
que B é fechado, segue-se que Bynk → 0. Assim, pela Eq.(5.7.4) segue que Aynk → 0. Mas
isso é impossível, já que 1 = ∥ynk ∥A = ∥ynk ∥ + ∥Aynk ∥ → 0.
A noção de compacidade relativa de um operador linear em relação a outro é um pouco

mais forte que a noção de limitação relativa de um operador como definido anteriormente na
Definição 4.31, como mostra o seguinte
TEOREMA 5.36. Suponha que A seja um operador auto-adjunto em um espaço de Hilbert H
e que B seja um operador simétrico e relativamente A-compacto. Então, B é relativamente
A-limitado com o limite relativo zero.
Para provar o Teorema 5.36 precisamos de uma outra noção de compacidade.

DEFINIÇÃO 5.12. Seja A um operador auto-adjunto em um espaço de Hilbert H . Um operador
B em H com Dom(A) ⊂ Dom(B) é dito ser A-compacto se, e somente se, B(A − iλ)−1 é
compacto para algum λ no conjunto resolvente de A.
Demonstração do Teorema 5.36. De acordo com a definição acima, se B é A-compacto, então,

para qualquer ε > 0 podemos escolher um λ no conjunto resolvente de A tal que
∥B(A − λ1I)−1 xn ∥ # ε , (5.7.5)
para toda sequência (xn )n∈N ⊂ H com a seguinte propriedade: ∥xn ∥ # 1. Com efeito, como
B é compacto, ele é limitado pelo Teorema 5.21. Também é limitado o operador (A − λ1I)−1 , de
acordo com a Proposição 5.6. Assim, a Eq.(5.7.5) segue se tomarmos ε = M/|Im λ|. Portanto,
para qualquer x ∈ Dom(A), temos
∥Bx∥ = ∥B(A − λ1I)−1 (A − λ1I)x∥ # ε∥(A − λ1I)x∥
# ε∥Ax∥ + ε|λ|∥x∥ .
Como ε > 0 é arbitrário, B será infinitesimalmente pequeno em relação a A se tomarmos

|Im λ| suficientemente grande.
Se combinarmos o Teorema 5.36 com o Teorema de Kato-Rellich (Teorema 4.35), obteremos

o seguinte corolário sobre perturbações relativamente compactas de operadores auto-adjuntos.
341
COROLÁRIO 5.9. Suponha que A seja um operador auto-adjunto em um espaço de Hilbert H e

que B seja simétrico e relativamente A-compacto. Então, A + B é auto-adjunto em Dom(A).
Demonstração. Como B é compacto, ele é limitado pelo Teorema 5.21. Logo, A + B é definido
em Dom(A + B) = Dom(A) e B é obviamente A-limitado pelo Teorema 5.36. Assim, o
critério de Kato (4.9.1) é satisfeito com a = 0 e b = ∥B∥, isto é, B é infinitesimalmente pequeno
em relação a A. Portanto, pelo teorema de perturbação de Kato-Rellich, A + B é auto-adjunto
para B simétrico e relativamente A-compacto.
Passemos agora à questão sobre a estabilidade do espectro essencial sob perturbações rela-
tivamente compactas. Nosso primeiro resultado importante é estabelecido no seguinte
LEMA 5.6. Sejam A e B operadores auto-adjuntos em um espaço de Hilbert H . Assuma que
µ ∈ ρ(A) ∩ ρ(B). Se Rµ (A) − Rµ (B) é compacto, então, σess (A) = σess (B).
Demonstração. Primeiro, observamos que a seguinte identidade acontece para o operador resol-
vente:
Rλ (A)(A − µ1I) = Rλ (A)(A − µ1I + λ1I − λ1I) = 1I + (λ − µ)Rλ (A) .
Assuma que µ ∈ σess (A). Portanto, existe uma sequência de Weyl (xn )n∈N para A e µ, tal que
(A − µ1I)xn converge para zero fortemente. Isto implica que
?8 9 ?
? 1I + (λ − µ)Rλ (A) xn ? → 0 .
Para provar que µ ∈ σess (B), basta mostrar que existe uma sequência de Weyl (yn )n∈N para
B e µ, tal que (B −µ1I)yn converge para
8 zero fortemente.
9 Como, por hipótese, Rλ (A)−Rλ (B)
é compacto, sabemos que limn→∞ ∥ Rλ (A) − Rλ (B) xn ∥ = 0; logo
?8 9 ? ?8 9 ?
? 1I + (λ − µ)Rλ (A) xn ? → 0 =⇒ ? 1I + (λ − µ)Rλ (B) xn ? → 0 .
Em particular, ∥Rλ (B)xn ∥ → (λ − µ)−1 ̸= 0. Agora, note que,

8 9 8 9
1I + (λ − µ)Rλ (B) xn = (B − λ1I)Rλ (B) + (λ − µ)Rλ (B) xn = (B − µ1I)Rλ (B)xn .
Consequentemente, a sequência (yn )n∈N ⊂ Dom(B) com yn = Rλ (B)xn (após uma norma-
lização inócua) é uma sequência de Weyl para B e µ. Assim, σess (A) ⊂ σess (B). Trocando-se
os papeis de A e B na análise acima, encontramos que σess (B) ⊂ σess (A). Isto prova o
lema.
PROPOSIÇÃO 5.20. Sejam A e B operadores auto-adjuntos em um espaço de Hilbert H . Assuma
que Rλ (A) − Rλ (B) é compacto para algum λ0 ∈ ρ(A) ∩ ρ(B), então, Rλ (A) − Rλ (B) é
compacto para todo λ ∈ ρ(A) ∩ ρ(B).
Demonstração. Este resultado segue imediatamente da primeira identidade do resolvente. Com

efeito, se A e B são operadores auto-adjuntos em um espaço de Hilbert H , a primeira
identidade do resolvente estabelece que para λ0 , λ ∈ ρ(A) ∩ ρ(B), segue que
Rλ (A) − Rλ0 (A) = (λ − λ0 )Rλ (A)Rλ0 (A) ,
342
e
Rλ (B) − Rλ0 (B) = (λ − λ0 )Rλ (B)Rλ0 (B) .
Destas identidades obtemos que
8 9 8 9
Rλ (A) − Rλ (B) = 1I + (λ − λ0 )Rλ (A) Rλ0 (A) − 1I + (λ − λ0 )Rλ (B) Rλ0 (B) .
Agora, suponha que a sequência (xn )n∈N ⊂ H converge fracamente para zero. Vamos
assumir, além disso, que ∥xn ∥ → 0. Então, considere as sequências (yn )n∈N ⊂ Dom(A) e
(zn )n∈N ⊂ Dom(B) (apropriadamente normalizadas) como definidas abaixo:
Rλ0 (A)xn Rλ0 (B)xn

yn = e zn = .
∥Rλ0 (A)xn ∥ ∥Rλ0 (B)xn ∥
O fato da sequência (xn )n∈N convergir fracamente para zero implica que (xn )n∈N é limitada em
H (pelo Teorema 1.7). Por outro lado, de acordo com a Proposição 5.6 os operadores Rλ0 (A)
e Rλ0 (B) são limitados. Portanto, as sequências (yn )n∈N e (zn )n∈N também são limitadas em
H e convergem fracamente para zero em H . Efetivamente, tome a sequência (yn )n∈N e note
que para todo w ∈ H temos que
1
⟨w, yn⟩ = ⟨w, Rλ0 (A)xn ⟩
∥Rλ0 (A)xn ∥
1
# ∥w∥∥xn ∥ → 0 quando n→∞.
|Im λ|∥Rλ0 (A)xn ∥
O mesmo raciocínio se aplica à sequência (zn )n∈N . Logo, as sequências (yn )n∈N e (zn )n∈N
convergem fracamente.
Prosseguindo, admita que λ0 ∈ σess (A), então, λ0 ∈ σess (B), pelo Lema 5.6. Logo, as
sequências (yn )n∈N e (zn )n∈N são sequências de Weyl para A e B em λ0 , pois
∥xn ∥ = ∥(A − λ0 1I)Rλ0 (A)xn ∥ = ∥(A − λ0 1I)yn ∥ → 0 ,
e
∥xn ∥ = ∥(B − λ0 1I)Rλ0 (B)xn ∥ = ∥(B − λ0 1I)zn ∥ → 0 ,
já que ∥xn ∥ → 0. Portanto, usando um raciocínio análogo ao usado no Lema 5.6, segue que
8 9 8 9 8 9
∥ Rλ (A) − Rλ (B) xn ∥ = ∥ 1I + (λ − λ0 )Rλ (A) yn − 1I + (λ − λ0 )Rλ (B) zn ∥
8 9 8 9
# ∥ 1I + (λ − λ0 )Rλ (A) yn ∥ + ∥ 1I + (λ − λ0 )Rλ (B) zn ∥
→ 0 quando n→∞.
Isto prova que Rλ (A) − Rλ (B) é compacto para todo λ ∈ ρ(A) ∩ ρ(B).
TEOREMA 5.37 (Estabilidade do Espectro Essencial: Teorema de Weyl). Sejam A um ope-

rador auto-adjunto em um espaço de Hilbert H e B um operador simétrico e compacto. Então,
σess (A + B) = σess (A).
343
Demonstração. Vamos mostrar que (xn )n∈N é uma sequência de Weyl para A e λ se, e somente
se, (xn )n∈N é uma sequência de Weyl para A + B e λ. Seja (xn )n∈N ⊂ Dom(A) =
Dom(A + B) uma sequência com ∥xn ∥ = 1, xn → 0 (fracamente) e (A − λ)xn → 0
(fortemente). Como B é compacto, Bxn → 0 (fortemente) e, portanto, (A + B − λ)xn → 0
(fortemente), isto é, (xn )n∈N é uma sequência de Weyl para A+B e λ. A outra direção é provada
da mesma forma. Portanto, mostramos que λ ∈ σess (A) ⇐⇒ existe uma sequência de Weyl
para A e λ ⇐⇒ existe uma sequência de Weyl para A + B e λ ⇐⇒ λ ∈ σess (A + B).
5.8 Sobre o Espectro Discreto de um Operador

Auto-Adjunto Limitado Inferiormente
De acordo com a Definição 5.5, se A é um operador auto-adjunto e se λ ∈ σdisc (A), então,
λ é um ponto isolado de σ(A). Além disso, se A for limitado inferiormente, o resultado
estabelecido pelo Teorema 5.12 nos mostrou que o espectro de A está contido em [λ, +∞), isto
é,
σ(A) = σdisc (A) ∪ σess (A) = [λ, +∞) .
Nesta seção, vamos desenvolver um método para obter informações sobre cada auto-valor
λ de um operador auto-adjunto A, limitado inferiormente, situado em σdisc (A) (naturalmente
abaixo do limite inferior do espectro essencial de A) a partir do conhecimento dos valores
esperados da forma quadrática ⟨x, Ax⟩ em certos subespaços de um espaço de Hilbert H .
5.8.1 Projetores de Riesz
Para iniciar, precisaremos de uma ferramenta poderosa frequentemente usada no estudo do

espectro discreto de um operador fechado, chamada projeções de Riesz.
DEFINIÇÃO 5.13. Sejam A um operador fechado em um espaço de Hilbert H e λ0 um ponto

isolado de σ(A). Para um contorno admissível Cλ0 , defina
`
1
Pλ0 ≡ dµ Rµ (A) .
2πi Cλ0
A integral do lado direito da expressão acima é chamada integral de Riesz para A e Cλ0 ,
enquanto que o operador Pλ0 a esquerda é chamado de projetor de Riesz.
Neste ponto, devemos fazer algumas observações preliminares sobre a técnica de integração
acima (as observações seguem diretamente da Análise Complexa). Diz-se que uma região
Ω ⊂ C é admissível (em relação a A) se o seguinte for válido: (a) σ(A) ⊂ Ω; (b) Ω é aberta
e limitada; (c) a fronteira ∂Ω de Ω consiste de um número grande, porém finito, de curvas
de Jordan retificáveis C1 , . . . , Cn que são mutuamente disjuntas e (d) a orientação (positiva)
de ∂Ω é dada pela orientação de cada C: descreveremos Cj no sentido anti-horário se os
pontos de Ω adjacentes a Cj estiverem no interior de Cj , caso contrário, Cj será orientado no
sentido horário (veja a Figura 5.9). É fácil ver que os pontos de Cj não podem se aproximar
arbitrariamente do espectro de A. Assim Cj está completamente no conjunto resolvente ρ(A).
344
C3
C1 C1
C2
Figura 5.9: Exemplos de domínios admissíveis Ω, suas fronteiras Cj e suas orientações. Nas
figuras acima, Ω é hachurado simplesmente, enquanto σ(A) é hachurado duplamente. Figura
retirada, e adptada, do livro-texto de Harro G. Heuser, “Functional Analysis,” Wiley, 1982. Todos
os Direitos Reservados.
Na Definição 5.13, se o operador A além de ser fechado for também auto-adjunto (lembre-se
que todo operador auto-adjunto é fechado), as projeções de Riesz têm a propriedade adicional
de serem ortogonais e projetarem sobre o subespaço gerado pelos auto-vetores de A para um
determinado auto-valor discreto como mostra o seguinte
LEMA 5.7. Sejam A um operador auto-adjunto em um espaço de Hilbert H e λ um ponto

isolado de σ(A). Suponha que
! "
D(λ; r) = µ ∈ C | |µ − λ| < r ∩ σ(A) = {λ} ,
em que D(λ; r) ⊂ C é um disco aberto de centro λ e raio r separando λ do resto do espectro

discreto – veja uma representação desta situação na Figura 5.10. Então,
σ(A) =
R
λ0 λ1 λ2 Σ = inf σess (A)
Figura 5.10: Disco aberto em C de raio r centrado em λ1 . Note que o disco D(λ1 ; r) separa o
ponto λ1 ∈ σ(A) do resto do espectro discreto.
(i) para qualquer r1 tal que 0 < r1 < r a integral de Riesz

`
1
Pλ = dµ Rµ (A) ,
2πi |µ−λ|=r1
existe e é independente de r1 ;
(ii) Pλ é uma projeção ortogonal sobre Ker(A − λ1I).
345
Demonstração. Item (i). Tome µ ∈ ρ(A). Pelo Teorema 5.2, sabemos que Rµ (A) é uma função
analítica em C \ σ(A) = ρ(A). Assim, a integral existe como uma integral valorada em um
espaço de Hilbert (veja a Definição 5.3, na nota da página 258). Que a integral é independente de
r1 é uma consequência do Teorema Integral de Cauchy. De fato, na integral de Riesz tomamos
um círculo C = |µ − λ| = r1 , mas poderíamos ter tomado qualquer curva orientada retificável
fechada simples. De acordo com o Teorema da Integral de Cauchy tomar qualquer um destes
caminhos fechados nos dá o mesmo resultado, já que a integral sobre qualquer curva orientada
retificável fechada simples é igual à mesma integral obtida sobre um círculo arbitrariamente
pequeno em torno de λ.
Item (ii). Primeiro, vamos provar que Pλ é idempotente, isto é, que Pλ2 = Pλ . Para isto,
usando a primeira identidade do resolvente Rµ (A)Rν (A) = (µ − ν)−1 Rµ (A) − Rν (A), se
µ ̸= ν, escolhemos, repectivamente, para r1 < R < r dois círculos C1 = {µ | |µ − λ| = r1 } e
C2 = {ν | |ν − λ| = R} (veja a Figura 5.11).
Im µ, ν
r1
R
λ Re µ, ν
C1
C2
Figura 5.11: Círculos C1 e C2 concêntricos, centrados em λ e de raios r e R, respectivamente.
Com esta escolha escrevemos

, -2 ` `
2 1
Pλ = dµ dν Rµ (A)Rν (A)
2πi C1 C2
, -2 ` `
1 Rµ (A) − Rν (A)
= dµ dν
2πi C1 C2 (µ − ν)
⎧ ⎫
, ⎪
-2 ⎪ F` G ` F` G⎪
⎪
1 ⎨` 1 1 ⎬
= dµ Rµ (A) dν − dν Rν (A) dµ .
2πi ⎪ ⎪ C1 C2 (µ − ν) C2 C1 (µ − ν) ⎪
⎪
⎩ B CD E B CD E⎭
=2πi =0
Observe que a integral interna do segundo termo desaparece pelo Teorema de Cauchy, pois
346
ν está fora do círculo C1 . Por outro lado, pela Fórmula Integral de Cauchy, a integral interna do
primeiro termo é 2πi. Logo, obtemos que
`
2 1
Pλ = dµ Rµ (A) = Pλ
2πi C1
A seguir, temos que mostrar que Pλ = Pλ∗. Isso pode ser obtido diretamente através de uma
parametrização µ(s) = λ + r1 eis em que −π # s # π e r1 é o raio do círculo. Assim, a
expressão para o integral de Riesz assume a seguinte forma:
$ π
1
Pλ = ds r1 eis (A − λ + r1 eis )−1 .
2π −π
Por sua vez, a expressão para Pλ∗ tem a seguinte forma:

$ π
∗ 1
Pλ = ds r1 e−is (A − λ + r1 e−is )−1 .
2π −π
Fazendo a mudança de variável s → −s na equação, obtemos imediatamente que Pλ = Pλ∗ .
Finalmente, temos que mostrar que Ran(Pλ ) = Ker(A − λ1I). Para isto, assuma que
x ∈ Ker(A − λ1I) =⇒ (A − λ1I)x = 0; logo λ é um auto-valor. Então, para µ ̸= λ, existe um
vetor y ∈ Ran(A − µ1I) tal que y = (A − µ1I)x. Logo, x = (A − µ1I)−1 y = Rµ (A)y. Além
disso, observe que
y = (A − µ1I)x = (A − µ1I + λ1I − λ1I)x = (A − λ1I)x +(λ − µ)x .

B CD E
=0
Portanto, x = (λ − µ)−1 y. Isto implica a seguinte identidade: se y ∈ Ran(A − µ1I), então,
Rµ (A)y = (λ − µ)−1y , se µ ̸= λ . (5.8.1)
Consequentemente, para cada ν no interior de |µ − λ| = r1 , segue, pela definição de Pλ e

(5.8.1), que
, ` - , ` -
1 1
Pλ x = dµ Rµ (A) x = dµ Rµ (A) Rν (A)y
2πi |µ−λ|=r1 2πi |µ−λ|=r1
, ` -
1 Rµ (A)
= dµ y
2πi |µ−λ|=r1 ν−µ
= Rν (A)y = x .
Aqui, usamos o fato que Rµ (A) é uma função analítica em C \ σ(A) = ρ(A). Em outras
palavras, como Rµ (A) é holomorfa para cada ν no interior do círculo |µ − λ| = r1 , centrado
em λ, segue, pelo Teorema Integral de Cauchy, que
`
1 Rµ (A)
Rν (A) = dµ .
2πi |µ−λ|=r1 ν −µ
347
Isto mostra que Pλ x = x. Assim, x ∈ Ran(Pλ ), e isto implica que
Ker(A − λ1I) ⊂ Ran(Pλ ) . (5.8.2)
Agora, assuma que x ∈ Ran(Pλ ) =⇒ x = Pλ x. Deste modo,

, ` -
1
(A − λ1I)Pλ x = dµ (A − λ1I) Rµ (A) x
2πi |µ−λ|=r1
Suponha que Ax = νx. Então, observe que

⎧
, ` - , ` - ⎨x se ν=λ
1 1 1
Pλ x = dµ Rµ (A) x = dµ x= .
2πi |µ−λ|=r1 2πi |µ−λ|=r1 ν −µ ⎩0 se ν ̸= λ
Portanto,
,` -
1
(A − λ1I)Pλ x = (A − λ1I) dµ Rµ (A) x
2πi |µ−λ|=r1
, ` -
1 1
= (ν − λ) dµ x=0.
2πi |µ−λ|=r1 ν −µ
Isto mostra que Pλ ∈ Ker(A − λ1I), e isto implica que
Ran(Pλ ) ⊂ Ker(A − λ1I) . (5.8.3)
Logo, pelas Eqs.(5.8.2) e (5.8.3), segue que Ran(Pλ ) = Ker(A − λ1I). Isto finaliza a prova do
lema.
Nota 5.27. No lema acima, se o operador A fosse apenas fechado, ao invés de ser auto-adjunto,
o operador de Riesz Pλ ainda seria um projetor, mas não necessariamente ortogonal!
Agora aplicamos o resultado obtido acima e provamos que os operadores de rank-finito são
densos na norma no conjunto de operadores compactos.
TEOREMA 5.38 (Hislop-Sigal, Teorema 9.15). Os operadores de rank-finito formam um subcon-
junto denso dos operadores compactos; ou seja, qualquer operador compacto pode ser aproximado
arbitrariamente por um operador de rank-finito.
Demonstração no caso auto-adjunto. Seja A um operador compacto auto-adjunto. Se 0 ̸=

σ(A), A é de rank-finito pelo Corolário 5.8. Portanto, assumimos 0 ∈ σ(A). Fixe qualquer
ε > 0. Defina σε = σ(A) ∩ {λ | |λ| " ε}. Pelo Teorema de Hilbert-Schmidt-Riesz-Schauder,
Teorema 5.27, σε consiste de um número finito de auto-valores isolados de A com multiplicidade
finita. Seja Pε a projeção de Riesz no auto-espaço correspondente a σε
`
1
Pε = dµ Rµ (A) .
2πi Cε
em que σε é a união de duas curvas fechadas simples mostradas na Figura 5.12.
348
(2) (1)
Cε Cε
−∥A∥ ∥A∥
(1) (2)
Cε = Cε ∪ Cε
Figura 5.12: O espectro de A. Figura retirada, e adptada, do livro-texto de P.D. Hislop e I.M.
Sigal, “Introduction to Spectral Theory,” Springer, 1996. Todos os Direitos Reservados.
Uma vez que A é auto-adjunto, segue do Lema 5.7 que Ran(Pε ) é o span dos auto-espaços
de A correspondendo a todos os auto-valores em σε . Este espaço é de dimensão finita e,
portanto, Pε é um operador de rank-finito.
Agora, APε = Pε A é um operador de rank-finito, uma vez que Ran(APε ) é finito.

Escrevemos A = Pε A + (1I − Pε )A e mostramos que ∥(1I − Pε )AI∥ < ε. Mas, pelo Teorema
5.5,
∥(1I − Pε )A∥ # raio espectral (1I − Pε )A # ε .
Assim, A é aproximado dentro de ε pelo operador de rank-finito Pε A.
A seguir, vamos discutir as desigualdades variacionais que permitem estimar os auto-valores

de um operador auto-adjunto (não necessariamente limitado). Começamos com um teorema
que expressa cada auto-valor de um operador auto-adjunto, localizado abaixo do limite inferior
do espectro essencial, como o mínimo de uma forma quadrática sobre certos subespaços do
espaço de Hilbert, H . Essas caracterizações dos auto-valores permitem estimar os auto-valores
através do uso de vetores-teste.
TEOREMA 5.39 (Caracterização Variacional de Auto-Valores (Continuação II)). Seja A um
operador auto-adjunto em um espaço de Hilbert H , limitado inferiormente por uma constante
finita γ. Seja Σ = inf σess (A). Suponha que A tenha auto-valores λ0 < λ1 < λ2 < · · · < Σ,
como representado na Figura 5.13. Então, temos
⟨x, Ax⟩
λ0 = inf ,
x∈Dom(A) ⟨x, x⟩
⟨x, Ax⟩
λ1 = inf ,
x∈Dom(A)∩K0⊥ ⟨x, x⟩
e para j " 2,
⟨x, Ax⟩
λj = inf ,
⊥
x∈Dom(A)∩Kj−1 ⟨x, x⟩
em que Ki = ∪0#j#i Ker(A − λj 1I), com Ker(A − λj 1I) sendo os auto-espaços de A para os
auto-valores λj . O ínfimo é todo vetor x não-nulo.
349
σ(A) =
R
λ0 λ1 λ2 Σ = inf σess (A)
Figura 5.13: O espectro σ(A) como na Proposição 5.39.
Demonstração. Lembremos que uma condição necessária e suficiente para λj ser um auto-valor
de A é que exista em H um vetor x ̸= 0 com (A − λj 1I)x = 0, ou seja, Ax = λj x. O
espaço Ker(A − λj 1I) é chamado de auto-espaço de A correspondente ao auto-valor λj e
dim Ker(A − λj 1I) é a multiplicidade de λj (neste caso, por definição, necessariamente finita).
Claramente Ker(A − λj 1I) \ {0} é o conjunto de todos os auto-vetores de A correspondentes
ao auto-valor λj . Levando em conta estas observações, considere o auto-valor mais baixo λ0 .
Observe que para qualquer y ∈ Dom(A)
⟨x, Ax⟩ ⟨y, Ay⟩
µ0 = inf # . (5.8.4)
x∈Dom(A) ⟨x, x⟩ ⟨y, y⟩
Seja x0 um elemento de Ker(A − λ0 1I); isto implica que Ax0 = λ0 x0 . Então, por (5.8.4),
segue que µ0 # λ0 . Para mostrar o inverso, observe que se λ0 ∈ σ(A), então, existe um
x ∈ Dom(A) tal que Ax = λ0 x. Consequentemente, ⟨x, (A − λ0 1I)x⟩ " 0 e, portanto,
A − λ0 1I " 0. Deste modo, obtemos um limite inferior,
⟨x, (A − λ0 1I)x⟩ ⟨x, Ax⟩
inf = inf − λ0 " 0 ,
x∈Dom(A) ⟨x, x⟩ x∈Dom(A) ⟨x, x⟩
isto é, µ0 " λ0 . Logo, segue que, µ0 = λ0 .
Para tratar o próximo auto-valor, a ideia é remover o auto-espaço correspondente ao auto-

valor λ0 e reiniciar o processo considerado no caso do auto-valor λ0 . Seja Pλ0 a projeção de
Riesz para λ0 . Como, pelo lema anterior, os operadores Pλj , com j = 0, 1, 2, . . ., são projetores
ortogonais, podemos escrever
1I = Pλ0 + Pλ1 + Pλ2 + · · · ,
e reescrevendo
1I − Pλ0 = Pλ1 + Pλ2 + · · · ,
segue que σ(A(1I − Pλ0 )) = {λ1 , λ2 , . . .} ∪ σess (A). Tome um vetor z ∈ Ran(1I − Pλ0 ) tal
que z = (1I − Pλ0 )y com y ∈ Dom(1I − Pλ0 ). Aplicando o mesmo raciocínio usado no caso
do auto-valor λ0 , segue que
⟨z, Az⟩ ⟨z, Az⟩
λ1 # inf = inf ,
z∈Ran(1I−Pλ0 ) ⟨z, z⟩ z∈Ker(A−λ0 1I) ⟨z, z⟩
já que Ran(Pλ0 ) = Ker(A − λ0 1I). Por outro lado, tome um vetor y1 ∈ Dom(A) tal que
Ay1 = λ1 y1 . Então, pela Proposição 5.9, Ker(A − λ1 1I) ⊥ Ker(A − λ0 1I). Assim, o princípio
em (5.8.4) implica que
⟨z, Az⟩ ⟨y1, Ay1 ⟩
inf # = λ1 .
z∈Ker(A−λ0 1I) ⟨z, z⟩ ⟨y1 , y1 ⟩
350
verificando o resultado para o segundo auto-valor. A prova do teorema é completada por

indução.
As desigualdades variacionais estão contidas no seguinte
COROLÁRIO 5.10. Seja A um operador auto-adjunto satisfazendo as hipóteses do Teorema 5.13.

O auto-valor mais baixo de A satisfaz
⟨x, Ax⟩
λ0 # ,
⟨x, x⟩
para qualquer x ̸= 0 em Dom(A). Da mesma forma, para j " 1, segue que
⟨x, Ax⟩
λj # ,
⟨x, x⟩
⊥
para qualquer x ̸= 0 em Dom(A) ∩ Kj−1 .
No Capítulo 10, nós usaremos o resultado acima para estimar a energia do estado funda-
mental dos átomos do hidrogênio e do hélio.
5.8.2 Auto-Valores Imersos no Espectro Essencial
Seja A um operador auto-adjunto em um espaço de Hilbert H . Um auto-valor λ de A,

com multiplicidade mλ " 1, é denominado um auto-valor imerso de A se λ não é um ponto
isolado de σ(A). Neste caso, o operador de projeção Pλ sobre o auto-espaço mλ -dimensional
Eλ , gerado pelos auto-vetores {xi | i = 1, . . . , mλ } para A e λ, não pode ser obtido como uma
projeção de Riesz conforme discutido acima para auto-valores isolados. Isso acontece porque
não existe um contorno fechado simples Cλ ⊂ ρ(A) de modo que o único ponto do espectro
de A no interior de Cλ seja λ. Em outras palavras, os auto-valores de A que não são pontos
isolados devem estar localizados acima do limite inferior do espectro essencial ou, como é dito,
estão imersos no espectro essencial.
Nós podemos, no entanto, obter uma expressão para a projeção no auto-espaço em termos
do resolvente de A. Seguiremos a apresentação de P.D. Hislop e I.M. Sigal, em “Introduction to
Spectral Theory with Applications to Schrödinger Operators,” Springer Verlag, 1996. Uma vez que
o operador A é auto-adjunto, a projeção Pλ , correspondendo a um auto-valor imerso de A, é
uma projeção ortogonal. Vamos denotar a projeção ortogonal a Pλ por Pλ⊥ = 1I − Pλ .
TEOREMA 5.40 (Hislop-Sigal, Teorema 6.10). Seja A um operador auto-adjunto no espaço de

Hilbert H com um auto-valor imerso λ. A projeção Pλ no auto-espaço Eλ é dada por
Pλ = s − lim± (−iε)(A − (λ + iε)1I)−1 .

ε→0
Demonstração. Vamos definir Pε = (−iε)(A − (λ + iε)1I)−1 . Pela Proposição 5.6, este é um

operador limitado, desde que ε ̸= 0, e ∥Pε ∥ # 1. Uma vez que Eλ é um subespaço A-invariante
351
5
e A5E = λ, segue que Pε Pλ = Pλ . Portanto, para qualquer vetor x ∈ H temos que
λ
∥Pε Pλ⊥ x∥2 = ⟨Pε (1I − Pλ )x, Pε (1I − Pλ )x⟩
= ⟨Pε x, Pε x⟩ − ⟨Pε Pλ x, Pλ x⟩ − ⟨Pλ x, Pε Pλ x⟩ + ⟨Pλ x, Pλ x⟩
= ∥Pε x∥2 − ∥Pλ x∥2 .
Isto implica que
lim ∥Pε Pλ⊥ x∥2 = 0 ,

ε→0
para todo x ∈ H . Assim, pela ortogonalidade das projeções Pλ e Pλ⊥ segue do limite acima e
da condição Pε Pλ = Pλ que
⎧
⎨1 em Eλ
s − lim Pε = .
ε→0 ⎩0 em P ⊥ H
λ
Isso mostra que o limite forte é uma projeção ortogonal e igual a Pλ .
Talvez seja importante ressaltar que a fórmula para Pλ no teorema acima é independente do
sinal de ε (verifique!).
Nota 5.28 (O papel dos auto-valores imersos na teoria quântica). Os auto-valores imersos
desempenham um papel importante na teoria das ressonâncias quânticas. Ao contrário dos auto-
valores isolados, que são relativamente estáveis sob perturbações (como veremos na próxima
seção), em geral, os auto-valores imersos no espectro essencial são instáveis e desaparecem do
espectro de um operador auto-adjunto sob pequenas perturbações. A ausência de tais auto-
valores imersos foi provada para uma grande classe de potenciais “fisicamente aceitáveis” (o
leitor deve consultar os Capítulos 16-23 do livro de Hislop-Sigal citado acima e os seguintes
artigos e as referências contidas nos mesmos: S. Agmon, I. Herbst e E. Skibsted, “Perturbation
of Embedded Eigenvalues in the Generalized N-Body Problem,” Commun. Math. Phys. 122
(1989) 411 e J. Cruz-Sampedro, I. Herbst e R. Martínez-Avendaño, “Perturbations of the Wigner-von
Neumann Potential Leaving the Embedded Eigenvalue Fixed,” Ann. Henri Poincaré 3 (2002)
331.
5.9 Perturbações do Espectro Discreto

Até agora discutimos dois aspectos da teoria de perturbação de operadores auto-adjuntos:
perturbações de operadores auto-adjuntos que preservam a auto-adjunção (Teorema de Kato-
rellich) e perturbações de operadores auto-adjuntos que preservam o espectro essencial (Teorema
de Weyl). Este último resultado faz parte do que chamamos de estabilidade espectral. Nesta
seção, faremos uma discussão sobre a estabilidade espectral do espectro discreto. Discutiremos
brevemente o comportamento do espectro discreto de operadores auto-adjuntos sob pequenas
perturbações.
Para começar, assuma que A é um operador auto-adjunto em um espaço de Hilbert com-

plexo H , sobre o qual temos muitas informações sobre seus auto-valores. Assuma que B é um
352
operador simétrico tal que Dom(A) ⊂ Dom(B). Vamos considerar os efeitos sobre o espec-
tro discreto de A causados pela adição de uma pequena correção εB, para ε suficientemente
def.
pequeno. Portanto, somos levados a considerar uma família de operadores Aε = A + εB,
quando ε varia de ε = 0 (onde temos muita informação) até ε = ε0 (onde desejamos obter infor-
mações). Assim, nossa primeira tarefa é dar um critério para a “pequenez” de uma perturbação
εB em relação a A, para ε suficientemente pequeno. Para isto, defina {Bε = εB}, com ε ∈ R,
como sendo uma família de operadores simétricos tal que Dom(A) ⊂ Dom(Bε ), de forma
que para algum λ0 ∈ ρ(A) os operadores Bε (A − λ0 1I)−1 sejam limitados e continuamente
dependentes de ε e que
lim ∥Bε (A − λ0 1I)−1 ∥ = 0 . (5.9.1)

ε→0
O mesmo vale para qualquer λ ∈ ρ(A)! Segue do Teorema de Kato-Rellich que, para
ε suficientemente pequeno, os operadores Aε = A + Bε são auto-adjuntos no domínio
Dom(Aε ) = Dom(A). Um exemplo canônico é quando Bε = εB com B sendo simé-
trico e A-limitado.
PROPOSIÇÃO 5.21. Suponha que Ω ⊂ ρ(A) é compacto. Então, Ω ⊂ ρ(Aε ) para ε suficiente
pequeno e
lim sup ∥(Aε − λ1I)−1 − (A − λ1I)−1 ∥ = 0 . (5.9.2)

ε→0 λ∈Ω
Demonstração. Denote por Cε = Bε (A − λ0 1I)−1 , para algum λ0 ∈ ρ(A). Para x ∈ Dom(A)

e para qualquer λ ∈ Ω ⊂ ρ(A), temos que
(Aε − λ1I)x = (A + Bε − λ1I)x = (A + Cε (A − λ0 1I) − λ1I)x

= >
= 1I + Cε (A − λ0 1I)(A − λ1I)−1 (A − λ1I)x (5.9.3)
= >
−1
= 1I + Cε + (λ − λ0 )Cε (A − λ1I) (A − λ1I)x .
Pela Proposição 5.6, sabemos que ∥(A − λ)−1 ∥ # |Im λ|−1 . Por outro lado, de acordo com a
Nota 5.4, como λ0 ∈ ρ(A), então, para qualquer λ ∈ Ω ⊂ ρ(A) temos que
|λ − λ0 |∥(A − λ1I)−1 ∥ < 1 .
Isto significa que podemos encontrar um d > 0 tal que
∥1I + (λ − λ0 )(A − λ1I)−1 ∥ # d ,
para todo λ ∈ Ω. Devido à hipótese (5.9.1), pode-se encontrar um ε0 > 0 tal que para
ε ∈ (−ε0 , ε0 ) nós temos
def.
dε = sup ∥Cε + (λ − λ0 )Cε (A − λ1I)−1 ∥ # 1 ,
λ∈Ω
353
e segue de (5.9.3) que, para o mesmo ε, o operador Aε − λ1I tem um inverso limitado para todo
λ ∈ Ω, dado por
= >−1
(Aε − λ1I)−1 = (A − λ1I)−1 1I + Cε + (λ − λ0 )Cε (A − λ1I)−1 .
Definindo
Dε = Cε + (λ − λ0 )Cε (A − λ1I)−1 ,
e usando a série de Neumann para o operador (1I + Dε )−1 obtemos, para ε ∈ (−ε0 , ε0 ), que
(Aε − λ1I)−1 − (A − λ1I)−1 = (A − λ1I)−1 (1I + Dε )−1 − (A − λ1I)−1
∞
<
−1
= (A − λ1I) (−Dε )−n − (A − λ1I)−1
n=0
∞
<
−1
= (A − λ1I) (−Dε )−n .
n=1
Portanto, para λ ∈ Ω, segue que

∞
< , -
−1 −1 −1 dε
∥(Aε − λ1I) − (A − λ1I) ∥ # |Im λ| d−n
ε = |Im λ| −1
.
n=1
1 − dε
Observando que limε→0 dε = 0 obtemos (5.9.2).

TEOREMA 5.41 (Perturbações dos auto-valores discretos). Seja λ ∈ σdisc (A) e mλ =
dim Ker(A − λ1I). Então, para qualquer δ > 0 tal que [λ − δ, λ + δ] ∩ σ(A) = {λ}
existe ε(δ) > 0 tal que
8 9
dim Ker χ(λ−δ,λ+δ) (Aε ) = mλ , ∀ ε ∈ (−ε0 , ε0 ) ,
em que χ(λ−δ,λ+δ) (Aε ) é a função característica de (λ − δ, λ + δ)
Demonstração. Seja Cλ o círculo complexo de raio δ centrado em λ. Pela Proposição 5.21,

para ε suficientemente pequeno temos Cλ ⊂ ρ(Aε ). O desenvolvimento da Seção 5.8.1 dá a
representação do Projetor de Riesz
`
1
Pε = χ(λ−δ,λ+δ) (Aε ) = dµ (Aε − λ1I)−1 .
2πi Cλ
Usando argumentos semelhantes àqueles na demonstração da Proposição 5.21, pode-se mostrar
que Pε depende continuamente de ε se ε estiver próximo de 0. Ao mesmo tempo, a Eq.(5.9.2)
mostra que P0 = limε→0 Pε . Denote agora Qε = 1I − Pε e considere os operadores
Sε = Qε Q0 + Pε P0 e Tε = Q0 Qε + P0 Pε .
É claro que esses dois operadores dependem continuamente de ε próximo a ε = 0. Como
S0 =8T0 = 1I, ambos9 Sε e Tε são invertíveis para
8 ε pequeno. 9 Por outro lado, Sε mapeia
Ran χ(λ−δ,λ+δ) (A) ≡ Ker(A − λ1I) em Ran χ(λ−δ,λ+δ) (Aε ) , enquanto que Tε mapeia
8 9
Ran χ(λ−δ,λ+δ) (Aε ) em Ker(A − λ1I). Como ambos Sε e Tε são bijetivos para ε pequeno,
8 9
os subespaços Ran χ(λ−δ,λ+δ) (Aε ) e Ker(A − λ1I) têm a mesma dimensão mλ .
354
Informalmente, o teorema anterior mostra que sob pequenas perturbações um auto-valor

isolado de multiplicidade mλ se divide em exatamente mλ auto-valores (contando as multipli-
cidades), mas nenhuma parte adicional do espectro pode aparecer. Se a perturbação é analítica
com respeito a ε, então, pode-se mostrar que os auto-valores perturbados adequadamente nu-
merados também são funções analíticas de ε. Referimo-nos ao livro fundamental de Tosio Kato,
“Perturbation Theory for Linear Operators,” Springer Verlag, Second Edition, 1980, que fornece
um estudo detalhado de questões relacionadas.
5.10 Teorema da Decomposição Espectral para Operadores

Auto-Adjuntos Ilimitados
Nesta seção, nós vamos mostrar como o teorema da decomposição espectral para operadores
auto-adjuntos limitados (em particular o Teorema 5.35) pode ser estendido para operadores auto-
adjuntos ilimitados. Neste caso, como o operador A não precisa ser limitado, não podemos
dizer que seu espectro está totalmente contido em algum intervalo fechado no eixo real e, como
resultado, não seremos capazes de colocar limites finitos na integral de A, isto é, a fómula de
decomposição espectral do operador A deve ter a integração sendo estendida sobre todo o eixo
real. O que faremos é obter a seguinte representação para A:
$ ∞ # $ ∞ %
2
Ax = dE(λ) λ x , Dom(A) = x ∈ H | d⟨x, E(λ)x⟩ λ < ∞ .
−∞ −∞
A integral acima será justificada no Teorema 5.42, enquanto que o Dom(A) no Teorema 5.43.
TEOREMA 5.42. Sejam A um operador auto-adjunto ilimitado em um espaço de Hilbert H .
Então, existe uma famíla apropriada de operadores de projeções ortogonais {E(λ)}λ∈R em H
tal que para todo x ∈ Dom(A) temos que
$ ∞
Ax = dE(λ) λ x , (5.10.1)
−∞
ou simbolicamente $ ∞
A= dE(λ) λ .
−∞
Justificando a integral (5.10.1). Uma maneira clássica para se chegar à decomposição espectral
de A acima é obtida reduzindo-se o estudo do espectro de A ao caso de um operador limitado
V , representando a transformada de Cayley de A, obter a decomposição espectral de V e,
então, usar a transformada inversa de Cayley para traduzir isto de volta para uma decomposição
espectral para o operador A (veja por exemplo, F. Riesz e B. Sz-Nagy. “Functional Analysis,”
Dover, 1990, Seção 121, pg.320). Foi desta maneira que J. von Neumann provou pela primeira vez
a decomposição espectral de operadores auto-adjuntos ilimitados. Em vez disso, vamos usar
o conceito de uma aproximação tipo-Yosida de A para dar uma argumentação que sustenta
a validade da decomposição (5.10.1). Com efeito, seja Aµ uma aproximação de Yosida de A.
Então, pela Proposição 5.11, Aµ é um operador auto-adjunto limitado e ⟨x, Aµ x⟩ " 0 para
todo x ∈ Dom(A) e µ > 0. Se tomarmos µ = n, com n ∈ N, e n = sup∥x∥=1 ⟨x, An x⟩,
então, pela Proposição 5.11, −n1I < 01I # An # n1I. Portanto, pelo Teorema 5.35, An tem uma
355
família espectral no intervalo finito [0, n]; ou seja, existe uma medida auto-adjunta En ( · ) que
desaparece em R− , de modo que podemos escrever (trata-se de fato de uma integral de 0 até
n, como explicado na Nota 5.24)
$ n
⟨x, An x⟩ = d⟨x, En (λ)x⟩ λ .
−n
Pela Proposição 5.11, Item 3, limn→∞ ⟨x, An x⟩ = ⟨x, Ax⟩, para todo x ∈ Dom(A). Por outro
lado, pelo Teorema 5.19, limn→∞ dEn (λ)x = dE(λ)x (com λ fixado), para todo x ∈ H . Logo,
$ n $ ∞
n→∞
⟨x, An x⟩ = d⟨x, En (λ)x⟩ λ −−−→ ⟨x, Ax⟩ = d⟨x, E(λ)x⟩ λ .
−n −∞
em que E(λ) é uma família de projetores ortogonais, definida para todo λ real, monótona
crescente e contínua pela direita, que tende E(λ) → O quando λ → −∞ e E(λ) → 1I
quando λ → ∞. Isto completa o esboço da demonstração da validade da fórmula fundamental
(5.10.1).
Nota 5.29. A integral (5.10.1) é entendida como uma integral imprópria de Riemann-Stieltjes,
isto é, existem os seguinte limites em H :
$ µ $ β
lim dE(λ) λ x e lim dE(λ) λ x ,
α→−∞ α β→∞ µ
em que µ é um número real arbitrário, e

$ ∞ $ µ $ β
dE(λ) λ x = lim dE(λ) λ x + lim dE(λ) λ x ,
−∞ α→−∞ α β→∞ µ
TEOREMA 5.43. Seja H um espaço de Hilbert complexo. Para um dado vetor x ∈ H , as

seguintes três condições são mutuamente equivalentes:
$ ∞
dE(λ) λ x , existe , (5.10.2)
−∞
$ ∞
d∥E(λ)x∥2 λ2 < ∞ , (5.10.3)
−∞
$ ∞
⟨y, Ax⟩ = d⟨y, E(λ)x⟩ λ , ∀ x ∈ Dom(A) , ∀ y ∈ H . (5.10.4)
−∞
Demonstração. Vamos provar as implicações (5.10.2) =⇒ (5.10.4) =⇒ (5.10.3) =⇒ (5.10.2).
(5.10.2) =⇒ (5.10.4). Para y ∈ H , considere o produto interno de y com (5.10.1), isto é,

$ ∞ $ ∞ $ ∞
⟨y, Ax⟩ = d⟨y, E(λ)x⟩ λ = d⟨y, E(λ)E(λ)x⟩ λ = d⟨E(λ)y, E(λ)x⟩ λ .
−∞ −∞ −∞
356
A convergência da integral acima segue da estimativa de Hölder (cf. o Lema 6.9)

5$ ∞ 5 ,$ ∞ -1/2 ,$ ∞ -1/2
5 5
|⟨y, Ax⟩| = 55 d⟨E(λ)y, E(λ)x⟩ λ55 = d∥E(λ)y∥ 2 2
d∥E(λ)x∥ λ ,
−∞ −∞ −∞
e da argumentação usada para sustentar a validade da decomposição (5.10.1). Portanto, obtemos

(5.10.4).
(5.10.4) =⇒ (5.10.3). Em (5.10.4), para x ∈ Dom(A), tome y = Ax. Então, usando

E(λ)E(µ) = E(min{λ, µ}), temos
$ ∞ $ ∞ ,$ ∞ -
2
∥Ax∥ = d⟨Ax, E(λ)x⟩ λ = dλ dµ ⟨E(µ)x, E(λ)x⟩ µ λ
−∞ −∞ −∞
$ ∞ ,$ ∞ -
= dλ dµ ⟨x, E(µ)E(λ)x⟩ µ λ
−∞ −∞
$ ∞ ,$ λ $ ∞ -
= dλ dµ ⟨x, E(µ)E(λ)x⟩ µ + dµ ⟨x, E(µ)E(λ)x⟩ µ λ
−∞ −∞ λ
⎛ ⎞
$ ⎜$ λ
∞ $ ∞ ⎟
⎜ ⎟
= dλ ⎜ dµ ⟨x, E(µ)x⟩ µ + dµ ⟨x, E(λ)x⟩ µ ⎟ λ .
−∞ ⎝ −∞ ⎠
Bλ CD E
se anula pelo Teorema 5.34, item (ii)
Observe que aqui a notação dλ foi adotada para evitar ambiguidades, uma vez que não estaria
claro se d é com respeito a λ ou µ. Daqui para frente, em todos esses casos, usaremos a
variável correspondente como índice em d. Assim,26
$ ∞ ,$ λ - $ ∞ $ ∞
2 2
∥Ax∥ = dλ dµ ⟨x, E(µ)x⟩ µ = d⟨x, E(λ)x⟩ λ = d∥E(λ)x∥2 λ2 .
−∞ −∞ −∞ −∞
Isto implica que Dom(A) também pode ser representado como

# $ ∞ %
2
Dom(A) = x ∈ H | d⟨x, E(λ)x⟩ λ < ∞ .
−∞
Dessa forma (5.10.4) implica (5.10.3).
(5.10.3) =⇒ (5.10.2).
?$ ?2 $
? ∞ ? ∞
∥Ax∥ = ?
?
2
dE(λ) λ x?
? = d∥E(λ)x∥2 λ2 ,
−∞ −∞
d∞ d∞
como acima. Portanto, se −∞
d∥E(λ)x∥2 λ2 < ∞, isto implica que −∞
dE(λ) λ x existe.
26
Estamos usando o Teorema Fundamental do Cálculo. Defina
$ λ ($ )
λ
2 dΦ(λ) d 2
Φ(λ) = dµ |Ψ(µ)| =⇒ = dµ |Ψ(µ)| = |Ψ(λ)|2 =⇒ dΦ(λ) = dλ |Ψ(λ)|2 .
a dλ dλ a
357
COROLÁRIO 5.11. Sejam A um operador auto-adjunto e H um espaço de Hilbert complexo.

Então, E(λ)A ⊂ AE(λ), isto é, AE(λ) é uma extensão E(λ)A.
Demonstração. Tome x ∈ Dom(A) e aplique E(µ) ao vetor Ax. Logo,

$ ∞ $ ∞
E(µ)Ax = dE(µ)E(λ) λ x = dE(λ)E(µ) λ x = AE(λ)x .
−∞ −∞
d ∞Observe que pelos Teoremas 5.42 e 5.43 segue imediatamente que se A = 1I, então, x =
−∞
dE(λ) x e
$ ∞ $ ∞
d⟨x, E(λ)x⟩ = d∥E(λ)x∥2
−∞ −∞
$ β
= lim lim d∥E(λ)x∥2 (5.10.5)
α→−∞ β→∞ α
= >
= lim lim ∥E(β)x∥ − ∥E(α)x∥ = ∥x∥2 .
2 2
α→−∞ β→∞
Nota 5.30. A decomposição espectral (5.10.1) para operadores auto-adjuntos no espaço de Hilbert
resulta em uma “diagonalização” de A, em analogia às transformações dos eixos principais
para matrizes simétricas. Além disso, uma aplicação importante do teorema espectral para
operadores auto-adjuntos em um espaço de Hilbert é a opção de estudar funções de operadores
auto-adjuntos:27 para certas classes de funções f , a fórmula de decomposição espectral nos dá
$ ∞
f (A) = dE(λ) f (λ) , (5.10.6)
−∞
com domínio
# $ ∞ %
2
Dom(f (A)) = x∈H | d⟨x, E(λ)x⟩ |f (λ)| < ∞ .
−∞
Por exemplo, para todo µ ∈ ρ(A) o operador resolvente de A é dado por

$ ∞ $
−1 1 1
(A − µ1I) = dE(λ) ≡ dE(λ) .
−∞ λ−µ σ(A) λ−µ
A fórmula (5.10.6) pode também ser aplicada, em particular, quando f (λ) é uma função a
valores complexos. Neste caso, dois exemplos importantes são os operadores
$ ∞ $ ∞
iA iλ −1 λ+i
e = dE(λ) e e (A + i1I)(A − i1I) = dE(λ) ,
−∞ −∞ λ−i
27
Veja K. Yosida, “Functional Analysis,” Springer Verlag, 1980, pg.338.
358
são unitários. Veremos no Capítulo 8 que eitH , t ∈ R, gera um grupo fortemente contínuo
de operadores unitários e que Ψ(t) = e−itH Ψ0 resolve a equação de Schrödinger desde que
H = −∇2 + V seja auto-adjunto. Por outro lado, e−tH , t " 0 e H " 0, é um semi-grupo
fortemente contínuo de operadores e Ψ(t) = e−tH Ψ0 é uma solução para a equação do calor
desde que H seja uma extensão auto-adjunta de −∇2 . Por sua vez, como já vimos, as funções
características χ(a, b](H) = P (a, b] = E(b) − E(a) produzem projeções espectrais associadas
a intervalos.
Um outra outra aplicação do Teorema 5.43 é a possibilidade que nós temos de definir a raiz
quadrada de um operador não-negativo. Com efeito, seja A " 0 auto-adjunto com a família
espectral {E(λ)}λ∈R . Defina um operador B da seguinte forma:
# $ ∞ %
Dom(B) = x ∈ H | d⟨x, E(λ)x⟩ λ < ∞ .
0
e
$ ∞ √
def.
B = dE(λ) λ,
0
isto é,
$ ∞ √
⟨y, Bx⟩ = d⟨y, E(λ)x⟩ λ, ∀ x ∈ Dom(B) , ∀ y ∈ H .
0
2
Então, B é um operador
√ não-negativo auto-adjunto com B = A e B é a raiz quadrada de A,
denotado como B = A.
Exemplo 5.15 (O operador posição X em L2 (−∞, ∞)). É fácil verificar que o doperador mul-
∞
tiplicação XΨ(x) = xΨ(x) em L2 (−∞, ∞) admite a resolução espectral X = −∞ dE(λ) λ,
em que
⎧
⎨Ψ(λ) se µ # λ
[E(λ)Ψ](µ) = eλ (µ)Ψ(λ) = .
⎩0 se µ > λ
Com efeito,
$ ∞ $ ∞ ,$ λ - $ ∞
2 2 2 2
d∥E(λ)Ψ∥ λ = dλ dx |Ψ(x)| λ = dλ |Ψ(λ)|2 λ2 = ∥XΨ∥2 ,
−∞ −∞ −∞ −∞
e
$ ∞ $ ∞ ,$ λ - $ ∞
d⟨Ψ, E(λ)Ψ⟩ λ = dλ dx Ψ(x)Ψ(x) λ = dλ Ψ(λ)Ψ(λ) λ = ⟨Ψ, XΨ⟩ .
−∞ −∞ −∞ −∞
5.11 Algumas Aplicações da Representação Espectral

Embora a determinação explícita da família espectral {E(λ)}λ∈R de um operador auto-
adjunto seja, em geral, muito difícil, a mera existência da decomposição espectral é suficiente
para a obtenção de importantes resultados. Ilustramos isso com alguns resultados. Nosso
principal objetivo é apresentar uma caracterização detalhada das diferentes partes do espectro
359
de um operador auto-adjunto em termos de sua família espectral. As diferentes partes do

espectro são identificadas pelas propriedades da medida d⟨x, E(λ)x⟩ e isso leva aos diferentes
subespaços espectrais do operador.
Antes de apresentarmos o primeiro resultado, precisaremos de um refinamento de ideias e

conceitos já vistos. Seja H um espaço de Hilbert complexo, e suponha que existe uma família
não-decrescente {M(λ)}λ∈R de subespaços fechados de H dependendo de um parâmetro λ,
com −∞ < λ < +∞, tal que a interseção de todos os M(λ) é {0} e sua união é densa
em H . Por “não-decrescente” queremos dizer que M(λ1 ) ⊂ M(λ2 ) para λ1 < λ2 . Então,
para qualquer λ fixo, a interseção M(λ + 0) de todos os M(λ′ ) com λ′ > λ contém M(λ).
Da mesma forma, temos M(λ) ⊃ M(λ − 0), em que M(λ − 0) é o fecho da união de
todos M(λ′ ) com λ′ < λ. Diz-se que a família {M(λ)}λ∈R é contínua pela direita em λ
se M(λ + 0) = M(λ), contínua pela esquerda se M(λ − 0) = M(λ) e contínua se for
contínua pela direita e também pela esquerda. Todas estas propriedades da família {M(λ)}λ∈R
podem ser traduzidas em propriedades da família espectral associada{E(λ)}λ∈R de projeções
ortogonais em M(λ).
As projeções E(λ + 0) em M(λ + 0) são dadas por
E(λ + 0) = s − lim+ E(λ + ε) . (5.11.1)

ε→0
Assim, {M(λ)}λ∈R é contínua pela direita se, e somente se, {E(λ)}λ∈R é contínuo fortemente
pela direita.
Para qualquer intervalo semifechado I = (λ′ , λ′′ ] da reta real, já definimos
P(I) = E(λ′′ ) − E(λ′ ) , (5.11.2)
em que P(I) é a projeção no subespaço M(I) = M(λ′′ ) ⊖ M(λ′ ).28 Se dois desses intervalos
I1 e I2 não têm ponto em comum, M(I1 ) e M(I2 ) são ortogonais; pois, se I1 está à esquerda
de I2 ,
M(I2 ) = M(λ′′2 ) ⊖ M(λ′2 ) ⊥ M(λ′2 ) ⊃ M(λ′′1 ) ⊃ M(I1 ) .
Como já vimos, a correspondente relação para as projeções é
P(I1 ) P(I2 ) = P(I2 ) P(I1 ) , para I1 e I2 disjuntos .
Isto pode ser verificado usando a propriedade E(λ)E(µ) = E(min{λ, µ}) para λ, µ ∈ R.
A projeção sobre M(λ) ⊖ M(λ − 0) é
P{λ} = E(λ) − E(λ − 0) .
Como acima temos, segue que
P{λ} P{µ} = P{µ} P{λ} , para λ ̸= µ .

28
Aqui, M ⊖ N = M ∩ N ⊥ é o complemento ortogonal de N em M .
360
P{λ} ̸= O se, e somente se, E(λ) é descontínua em λ (cf. a Nota 5.21). Neste caso, pode-se
associar ao ponto λ um subespaço M({λ}) de dimensão diferente de zero, isto é,
3 4
M({λ}) = x ∈ H | P{λ} x = x = Ran(P{λ} ) . (5.11.3)
A interpretação deste subespaço será discutida mais a frente. Vamos lembrar aqui que, pelo
Teorema 5.30, as descontinuidades de uma família espectral formam um subconjunto contável de
R. Dessa forma, se λ ̸= µ são dois pontos de descontinuidade, então, P{λ} P{µ} = O por (5.6.21);
portanto, M({λ}) é ortogonal a M({µ}). Se escolhermos em cada ponto de descontinuidade
λ um vetor não-nulo x(λ), obteremos uma família {x(λ)} de vetores diferentes de zero que
são ortogonais aos pares; esta família é contável uma vez que o espaço de Hilbert é assumido
como separável. Assim, existe no máximo um número contável de pontos de descontinuidade
de E(λ) em um espaço separável.
DEFINIÇÃO 5.14. Seja A um operador auto-adjunto em um espaço de Hilbert complexo H e
{E(λ)}λ∈R , sua família espectral.
1. Diz-se que λ é um ponto de constância em relação a {E(λ)}λ∈R , se E(λ) é constante em

uma vizinhança de λ, isto é, E(λ + ε) = E(λ − ε), para todo ε > 0. Neste caso, λ é um ponto
interno de um intervalo máximo no qual E(λ) é constante e E(λ + ε) − E(λ − ε) é igual ao
operador nulo O. Caso contrário, diz-se que λ é um ponto de crescimento de E(λ).
2. Diz-se que λ é um ponto de descontinuidade por salto de E(λ) se E(λ+ε)−E(λ−ε) ̸=

O.
3. Diz-se que λ é um ponto de continuidade de E(λ) se E(λ + ε) − E(λ − ε) = O.
4. Pontos de continuidade que ao mesmo tempo são pontos de crescimento são chamados
pontos de crescimento contínuo.
Depois destes preparativos, estamos em posição para anunciar o primeiro resultado.

TEOREMA 5.44. Sejam A um operador auto-adjunto com a família espectral {E(λ)}λ∈R e λ0
um ponto isolado de σ(A). Tome ε > 0 tal que
(λ0 − 2ε, λ0 + 2ε) ∩ σ(A) = {λ0 } .
Além disso, seja C = ∂B(λ0 ; ε) ⊂ C o disco em C com centro λ0 e raio ε. Então,

`
1
dγ (A − γ)−1 = E(λ0 ) − E(λ0 − 0) = PKer(A−λ0 ) .
2πi C
Demonstração. Isto segue imediatamente do Lema 5.7.
Muitas vezes encontra-se famílias espectrais que são limitadas por baixo. Isto é, uma família
espectral {E(λ)}λ∈R é limitada por baixo se existir um número µ ∈ R tal que E(λ) = O para
todo λ < µ. Tal número µ é um limite inferior para {E(λ)}λ∈R , e o supremo de todos os
números µ com esta propriedade é chamado de limite inferior de {E(λ)}λ∈R .
361
TEOREMA 5.45. Seja A um operador auto-adjunto no espaço de Hilbert H com a família

espectral {E(λ)}λ∈R . Então, A é limitado inferiormente, isto é, ⟨x, Ax⟩ " µ∥x∥, se, e somente
se, o espectro de A é vazio para λ < µ.
Demonstração. Primeiro, uma vez que A é limitado inferiormente, temos

$ ∞
0 # ⟨x, (A − µ1I)x⟩ = d⟨x, E(λ)x⟩ (λ − µ)
−∞
$ µ $ ∞
= d⟨x, E(λ)x⟩ (λ − µ) + d⟨x, E(λ)x⟩ (λ − µ) .
−∞ µ
Para todo y ∈ Dom(A), E(µ)y ∈ Dom(A); portanto, podemos tomar x = E(µ)y, e usar a
propriedade E(λ)E(µ) = E(min{λ, µ}), para obter
$ µ $ ∞
0#= dλ ⟨E(µ)y, E(λ)E(µ)y⟩ (λ − µ) + dλ ⟨E(µ)y, E(λ)E(µ)y⟩ (λ − µ)
−∞ µ
$ µ $ ∞
= dλ ⟨E(µ)y, E(λ)y⟩ (λ − µ) + dλ ∥E(µ)y∥2 (λ − µ) .
−∞ µ
B CD E
Logo, temos
$ µ $ µ
0# dλ ⟨E(λ)E(µ)y, y⟩ (λ − µ) = dλ ⟨E(λ)y, y⟩ (λ − µ)
−∞ −∞
$ µ−0
= dλ ∥E(λ)y∥2 (λ − µ) .
−∞
Uma vez que λ < µ, devemos ter ∥E(λ)y∥ = const. (já que a função integradora é monótona
crescente como função de λ de acordo com a Proposição 5.16), caso contrário teríamos
$ µ−0
0# dλ ∥E(λ)y∥2 (λ − µ) < 0 .
−∞
Logo, para ∥E(λ)y∥ = const. segue que E(λ) é independente de λ para λ < µ. Dessa forma,
o espectro é vazio para λ < µ.
Reciprocamente, se o espectro é vazio para λ < µ, então, E(λ) é independente de λ para

λ < µ. Visto que limλ→−∞ ∥E(λ)x∥ = 0, conclui-se que E(λ) = O para λ < µ. Assim,
$ ∞
⟨x, Ax⟩ = d⟨x, E(λ)x⟩ λ
−∞
$ ∞
= d⟨x, E(λ)x⟩ λ
µ−0
$ ∞
"µ d⟨x, E(λ)x⟩
µ−0
= µ⟨x, x⟩ = µ∥x∥2 (pelo Teorema 5.43 - cf. a Equação (5.10.5)) ,

o que conclui a prova do teorema.
362
TEOREMA 5.46. Seja A um operador auto-adjunto em um espaço de Hilbert complexo H e

{E(λ)}λ∈R , sua família espectral. Então, o seguinte é válido: λ ∈ σ(A) se, e somente se,
E(λ + ε) − E(λ − ε) ̸= O, para todo ε > 0.
Demonstração. Suponha que existe um ε > 0 tal que P = E(λ + ε) − E(λ − ε) = O. Então,
pela Definição 5.14 E( · ) deve ser constante sobre os intervalos (λ − ε, λ) e [λ, λ + ε) e para
todo x ∈ Dom(A) com ∥x∥ = 1 encontramos pelo Teorema 5.43 que
$ ∞
2
∥(A − λ1I)x∥ = d⟨x, E(µ)x⟩ |µ − λ|2
−∞
,$ $ -
= + d⟨x, E(µ)x⟩ |µ − λ|2
∥µ−λ∥<ε ∥µ−λ∥"ε
,$ λ−ε $ λ+ε $ ∞-
= + + d⟨x, E(µ)x⟩ |µ − λ|2
−∞ λ−ε λ+ε
,$ λ−ε $ ∞-
2
"ε + d⟨x, E(µ)x⟩
−∞ λ+ε
= >
= ε2 ⟨x, E(λ − ε)x⟩ + ε2 ∥x∥2 − ⟨x, E(λ + ε)x⟩
= . / >
= ε2 ∥x∥2 − ε2 ⟨x, E(λ + ε) − E(λ − ε) x⟩
= ε2 ∥x∥2 = ε2 > 0 .
Aqui, usamos o fato que limµ→−∞ ∥E(µ)x∥ = 0 e limµ→∞ ∥E(µ)x∥ = ∥x∥, para todo
x ∈ Dom(A). Assim, nenhuma sequência de vetores unitários em Dom(A) pode satisfazer
o critério estabelecido pela Proposição 5.12, portanto, λ ∈
/ σ(A). De fato, isso pode ser visto
substituindo-se x por xn na equação acima e tomando-se o limite.
Por outro lado, assuma que Pn = E(λ + 1/n) − E(λ − 1/n) ̸= O, para todo n ∈ N e
que (xn )n∈N é uma sequência em Dom(A), com ∥xn ∥ = 1, tal que xn = Pn xn . Para esta
sequência temos pelo Teorema 5.43
$ ∞
2
∥(A − λ1I)xn ∥ = d⟨xn , E(µ)xn ⟩ |µ − λ|2
−∞
,$ $ -
= + d⟨xn , E(µ)xn ⟩ |µ − λ|2
∥µ−λ∥<1/n ∥µ−λ∥"1/n
$
1 1
= d⟨xn , E(µ)xn ⟩ |µ − λ|2 # 2
∥xn ∥2 = 2 .
∥µ−λ∥<1/n n n
Assim, esta sequência satisfaz o critério estabelecido pela Proposição 5.12 e, portanto, λ pertence
ao espectro de A.
TEOREMA 5.47. Seja A um operador auto-adjunto no espaço de Hilbert H com a família
espectral {E(λ)}λ∈R .
363
1. Para λ ∈ R, λ ∈ ρ(A) se, e somente se, existe ε > 0 tal que E(λ + ε) = E(λ − ε).
2. Para λ ∈ ρ(A)
1
∥(A − λ1I)−1 ∥ = .
dist(λ, σ(A))
Demonstração. A Parte 1 segue imediatamente do Teorema 5.46, já que se E(λ+ε) ̸= E(λ−ε),

então, λ ∈ σ(A). Para provar a Parte 2, usamos o Teorema 5.43 e escrevemos
$ ∞
−1 2 1
∥(A − λ1I) x∥ = d⟨x, E(µ)x⟩ ∀x ∈ H ,
−∞ (µ − λ)2
para concluir que

1
∥(A − λ1I)−1 ∥ # .
dist(λ, σ(A))
Como σ(A) é fechado, dado λ ∈ ρ(A), podemos encontrar alguns λ0 ∈ σ(A) tal que
|λ0 − λ| = dist(λ, σ(A)) .

. /
Da Parte 1, sabemos que, dado um ε > 0, existe 0 ̸= xε ∈ Ran E(λ0 + ε) − E(λ0 − ε) .
Logo,
$ λ0 +ε
−1 2
∥(A − λ1I) xε ∥ = d⟨xε , E(µ)xε ⟩ |µ − λ|−2
λ0 −ε
$ λ0 +ε
" d⟨xε , E(µ)xε ⟩ (|λ0 − λ| + ε)−2
λ0 −ε
$ λ0 +ε
−2
= (|λ0 − λ| + ε) d∥E(µ)xε ∥2
λ0 −ε
= >
= (|λ0 − λ| + ε)−2 ∥E(λ0 + ε)xε ∥2 − E(λ0 + ε)xε ∥2
. /
= (|λ0 − λ| + ε)−2 ∥ E(λ0 + ε) − E(λ0 + ε) xε ∥2 (verifique!)
= (|λ0 − λ| + ε)−2 ∥xε ∥2 .
uma vez que |µ − λ| # |λ0 − λ| + |µ − λ0 | # |λ0 − λ| + ε.
PROPOSIÇÃO 5.22. Tome λ < µ. Se E(µ) − E(λ) ̸= O, então, (λ, µ] ∩ σ(A) ̸= ∅. Além disso,
(λ, µ) ∩ σ(A) ̸= ∅ se, e somente se, E(µ − 0) − E(λ) ̸= O
Demonstração. Suponha que (λ, µ] ⊂ ρ(A). Então, pelo Teorema 5.46, a família espectral
{E(λ)}λ∈R é constante em alguma vizinhança de η para cada η ∈ (λ, µ]. Consequentemente,
{E(λ)}λ∈R é constante em (λ, µ] , e, portanto,
. /
E(µ) − E(λ) = s − lim+ E(µ) − E(λ + ε) = O .
ε→0
364
Por outro lado, se (λ, µ) ∩ σ(A) ̸= ∅, então, podemos provar, como acima, que {E(λ)}λ∈R é
constante em (λ, µ), ou seja, que
. /
E(µ − 0) − E(λ) = s − lim+ E(µ − ε) − E(λ + ε) = O .
ε→0
Se η ∈ (λ, µ) ∩ σ(A) e ε > 0 é tão pequeno que (η − ε, η + ε] ⊂ (λ, µ), então, E(η − ε) −
E(η + ε) ̸= O de modo que E(µ − 0) − E(λ) ̸= O.
O próximo resultado refina o Teorema 5.46. Ele mostra que as descontinuidades de uma
família espectral correspondem ao espectro de pontos do operador auto-adjunto associado,
enquanto a continuidade forte dos E(λ) em λ0 ∈ σ(A) implica λ0 ∈ σcont (A) (e vice-versa).
TEOREMA 5.48. Para µ ∈ σ(A) temos que
1. µ ∈ σpont (A) se, e somente se, E( · ) não é fortemente contínua em λ0 .
2. µ ∈ σcont (A) se, e somente se, E( · ) é fortemente contínua em λ0 .
Demonstração. Primeiro, assuma que µ é um auto-valor de A. Então, existe um vetor x ∈

Dom(A), com x ̸= 0, tal que Ax = µx, ou equivalentemente, ⟨y, (A − µ1I)x⟩ = 0 para todo
y ∈ H . Pelo Teorema 5.43, temos
$ ∞
0 = ⟨y, (A − µ1I)x⟩ = d⟨y, E(λ)x⟩ (λ − µ) , ∀ y ∈ H . (5.11.4)
−∞
Considere y = E(µ)x; logo de (5.11.4) segue que

$ ∞
0= dλ ⟨E(µ)x, E(λ)x⟩ (λ − µ)
−∞
$ ∞
= dλ ⟨x, E(µ)E(λ)x⟩ (λ − µ) (usando E(λ)E(µ) = E(min{λ, µ}), segue que)
−∞
$ µ $ ∞
= dλ ⟨x, E(λ)x⟩ (λ − µ) + dλ ⟨x, E(µ)x⟩ (λ − µ) .
−∞ µ
B CD E
Dessa forma, segue que

$ µ $ µ
0= dλ ⟨x, E(λ)x⟩ (λ − µ) = dλ ∥E(λ)x∥2 (λ − µ) . (5.11.5)
−∞ −∞
A seguir, suponha que y = x, então, obtemos de (5.11.4) que

$ ∞ $ ∞
0= dλ ⟨x, E(λ)x⟩ (λ − µ) = dλ ⟨x, E(λ)E(λ)x⟩ (λ − µ)
−∞ −∞
$ µ
= dλ ∥E(λ)x∥2 (λ − µ) . (5.11.6)
−∞
365
Multiplicamos (5.11.5) por −1 e subtraímos (5.11.5) de (5.11.6). O resultado é

$ µ $ ∞
2
0= dλ ∥E(λ)x∥ (µ − λ) e 0 = dλ ∥E(λ)x∥2 (λ − µ) .
−∞ µ
A expressão (µ − λ) na primeira integral e (λ − µ) na segunda integral são " 0, e a função

integradora é monótona crescente como função de λ de acordo com a Proposição 5.16. Portanto,
para um ε > 0 arbitrário seguem as estimativas
$ µ $ µ−ε
2
0= dλ ∥E(λ)x∥ (µ − λ) " dλ ∥E(λ)x∥2 (µ − λ)
−∞ −∞
$ µ−ε
"ε dλ ∥E(λ)x∥2
−∞
= ε∥E(µ − ε)x∥2 ,
e
$ ∞ $ ∞
2
0= dλ ∥E(λ)x∥ (µ − λ) " dλ ∥E(λ)x∥2 (µ − λ)
µ µ+ε
$ ∞
"ε dλ ∥E(λ)x∥2
µ+ε
= >
= ε ∥x∥2 − ∥E(µ + ε)x∥2
= ε∥x − E(µ + ε)x∥2 (verifique!) .
Portanto, as estimativas acima implicam que E(µ + ε)x = x e E(µ − ε)x = 0, e por causa da
continuidade pela direita, temos, para ε → 0, E(µ)x = x. Assim, E(µ) − E(µ − ε) ̸= O e
µ é um ponto de descontinuidade por salto de E(λ), pela Definição 5.14. Observamos que isto
prova que E(λ)x = x para λ " µ e E(λ) = O para λ < µ, uma vez que ε é arbitrário.
Reciprocamente, assuma que µ é um ponto de descontinuidade por salto de E(λ), de

.forma que E(µ + ε) − / E(µ − ε) ̸= O. Então, existe. no mínimo um vetor/x ∈ H tal que
E(µ + ε) − E(µ − ε) x ̸= 0. Para tal x suponha que E(µ + ε) − E(µ − ε) x = y. Portanto,
pelo Teorema 5.43, para z ∈ H , segue que
$ ∞
⟨z, (A − µ1I)y⟩ = dλ ⟨z, E(λ)y⟩ (µ − λ)
−∞
$ ∞ . /
= dλ ⟨z, E(λ) E(µ + ε) − E(µ − ε) x⟩ (µ − λ)
−∞
$ µ−ε . /
= dλ ⟨z, E(λ) − E(λ) x⟩ (µ − λ)
−∞
$ ∞ . /
+ dλ ⟨z, E(µ + ε) − E(µ − ε) x⟩ (µ − λ) = 0 .
µ+ε
366
Dessa forma, y/∥y∥ é um auto-vetor de A associado com o auto-valor µ. Isso prova a Parte 1.
Obviamente, E(λ) é fortemente contínuo em µ se, e somente se, E(µ + ε) = E(µ − ε), ou
seja, se, e somente se, E(λ) = E(λ − 0). Isto prova a Parte 2.
PROPOSIÇÃO 5.23. Qualquer ponto isolado λ do espectro de um operador auto-adjunto A é um
auto-valor de A.
Demonstração. Pelo Teorema 5.9 existe um ε > 0 tal que [λ −ε, λ + ε] ∩σ(A) = {λ}. Portanto,
pela Proposição 5.22, E é constante em [λ − ε, λ) e em (λ, λ + ε]. Como λ ∈ σ(A), pelo
Teorema 5.46, temos
E(λ) − E(λ − 0) = E(λ + ε) − E(λ − ε) ̸= O ,
isto é, λ é um auto-valor de A.
Nota 5.31 (Partes espectrais de um operador auto-adjunto). Pelo Teorema 5.48, o conjunto
! "
D = x ∈ Dom(A) | x ̸= 0, Ax = λx para algum λ ∈ R ,
de todos os auto-vetores do operador auto-adjunto A gera o subespaço fechado Hpont ⊂ H
⊥
chamado o subespaço descontínuo de A. Seu complemento ortogonal Hpont é o subespaço
contínuo Hcont de A, e, portanto, temos a decomposição
H = Hpont ⊕ Hcont ,
do espaço de Hibert H . O subespaço Hpont é caracterizado pela seguinte relação:
x ∈ M({λ}) ⇐⇒ x ∈ Dom(A) e Ax = λx . (5.11.7)
A relação (5.11.7) expressa o fato de que um número λ ∈ R é um auto-valor de A se, e
somente se, dim M({λ}) ̸= 0, e neste caso M({λ}) é o subespaço de H gerado pelo
conjunto de auto-vetores de A associados ao auto-valor λ. Uma vez que o conjunto de pontos
de descontinuidade de uma família espectral {E(λ)}λ∈R é contável, os auto-valores de um
operador auto-adjunto formam um subconjunto contável de R.29 Na sequência, nós denotamos
os auto-valores por {λ1 , λ2 , . . .}. O conjunto de todos os auto-valores de A compõe o espectro
de pontos de A. Assim, define-se Hpont como o subespaço de H gerado pelo conjunto de
todos os auto-vetores de A, isto é,
h
Hpont = M({λj }) , (5.11.8)
em que a soma se estende

; por todos os auto-valores de;
A. Assim, um vetor x pertence a Hpont
se, e somente se, x = j xj , com Axj = λj xj e com j ∥xj ∥2 < ∞. É claro que x ∈ Hpont
se, e somente se, existe um conjunto contável Ω de números reais tal que E(Ω)x = x.
Por sua vez, Hcont é definido da seguinte forma:

! "
Hcont = x ∈ H | a função λ 3→ ∥E(λ)x∥2 é contínua
! "
= x ∈ H | a função λ 3→ E(λ)x é fortemente contínua .
29
Isso também segue da Proposição 5.9 (ortogonalidade dos auto-vetores associados a diferentes auto-valores)
porque assumimos que cada base de H é contável – pela condição de separabilidade de H .
367
Contudo, uma decomposição adicional do subespaço contínuo de um operador auto-adjunto A

é necessária para uma análise ainda mais precisa. Aprendemos que com cada família espectral
{E(λ)}λ∈R , podemos associar uma família de medidas espectrais dϱ(λ) em R, definida por
db
a
dϱ(λ) = ⟨x, E(a, b]x⟩, para todo x ∈ H . De acordo com a Nota 5.22, o teorema de
decomposição de Lebesgue para tais medidas estabelece que dϱ(λ) tem uma decomposição
única nas medidas
dϱ(λ) = dϱpont (λ) + dϱacont (λ) + dϱscont (λ) ,
com a seguinte especificação das três medidas: dϱpont (λ) é uma medida de ponto puro,
dϱacont (λ) é uma medida absolutamente contínua em relação à medida de Lebesgue e dϱscont (λ)
é uma medida contínua e singular em relação à medida de Lebesgue. Em termos dessas medidas
espectrais, os subespaços contínuos e descontínuos são caracterizados por
H = Hpont ⊕ Hacont ⊕ Hscont . (5.11.9)
O último resultado permite a definição daquelas partes do espectro de um operador auto-

adjunto A que correspondem aos vários subespaços espectrais.
⎧
⎪
⎪ σpont espectro de pontos
⎪
⎪
⎪
⎪
⎪
⎪
⎪
⎪ σcont espectro contínuo
⎪
⎨
espectro de A σacont espectro absolutamente contínuo
⎪
⎪
⎪
⎪
⎪
⎪ σscont espectro singularmente contínuo
⎪
⎪
⎪
⎪
⎪
⎩σ
singt espectro singular
O leitor pode encontrar uma discussão mais detalhada sobre esta decomposição nos seguintes
textos: M. Reed e B. Simon, “Methods of Modern Mathematical Physics. Functional Analysis,” Vol.
I, Academic Press, Second Edition, 1980; P. Blanchard e E. Brüning, “Mathematical Methods in
Physics. Distributions, Hilbert Space Operators and Variational Methods,” Birkhäuser, 2003; W.O.
Amrein, “Hilbert Space Methods in Quantum Mechanics,” CRC Press, 2009.
Na teoria quântica, a decomposição do espaço de Hilbert na forma (5.11.9) nos leva ao conceito
de estados ligados e estados de espalhamento. Com efeito, se H é o operador hamiltoniano
de Schrödinger com a família espectral {E(λ)}λ∈R , os elementos Ψ ∈ H = L2 (Rn ) para
os quais ⟨Ψ, E(λ)Ψ⟩ é absolutamente contínuo correspondem aos estados de espalhamento,
enquanto que os elementos Ψ ∈ H tais que ⟨Ψ, E(λ)Ψ⟩ é uma função descontínua por saltos
correspondem aos estados ligados.
Já vimos que existe uma outra maneira de decompor o espectro de um operador auto-adjunto
em duas partes: remova do espectro σ(A) todos os pontos isolados que são auto-valores com
multiplicidade finita; isto dá σdisc (A), o espectro discreto de A. O conjunto restante, contendo
os auto-valores de multiplicidade infinita e os pontos de acumulação do espectro, é σess (A),
o espectro essencial de A. Pode-se caracterizar os pontos no espectro discreto e aqueles no
espectro essencial da seguinte forma em termos da família {M(λ)}λ∈R de subespaços fechados
de H associados à família espectral de A:
368
. /
(i) λ ∈ σdisc (A) se, e somente se, existe ε0 > 0 tal que dim M (λ − ε, λ + ε) < ∞ para
todo ε ∈ (0, ε0).
. /
(ii) λ ∈ σess (A) se, e somente se, dim M (λ − ε, λ + ε) = ∞ para todo ε > 0.
O teorema a seguir caracteriza os espectros discreto e essencial de um operador auto-adjunto

com o auxílio de sua família espectral.
TEOREMA 5.49. Um número λ ∈ R pertence a σdisc (A) se, e somente se, as seguintes duas
propriedades são satisfeitas:
1. Existe um ε > 0 tal que E( · ) é constante em (λ − ε, λ) e [λ, λ + ε);
2. 0 < dim Ran(E(λ) − E(λ − 0)) < ∞.
Além disso, λ ∈ σess (A) se, e somente se, dim Ran(E(λ + ε) − E(λ − ε)) = ∞ para todo
ε > 0.
Demonstração. O Item 1 segue imediatamente das Proposições 5.22 e 5.23. Para provar o Item
2, basta mostrar que se λ < µ e dim Ran(E(µ − 0) − E(λ)) = m (m ∈ N), então,
(λ, µ) ∩ σ(A) consiste apenas de auto-valores isolados de multiplicidade finita. A soma das
multiplicidades desses auto-valores sendo igual a m. Com efeito, se (λ, µ) ∩ σess (A) = ∅,
segue que (λ, µ) ∩ σ(A) = σdisc (A). Seja γ1 , γ2 , . . . os auto-valores de A em (λ, µ) – existe
no máximo um número contáveis deles, uma vez que eles não podem se acumular no interior
de (λ, µ). Então,
n
< . /
E(µ − 0) − E(λ) " E(λj ) − E(λj − 0) , para todo n ∈ N .
j=1
Portanto, apenas um nú mero finitamente grande de auto-valores γ1 , γ2 , pode estar em (λ, µ)

e
k
< . /
dim Ran(E(µ − 0) − E(λ)) = E(λj ) − E(λj − 0) .
j=1
O lado direito é igual à soma das multiplicidades dos auto-valores γ1 , γ2, . . . , γk .
Para provar a segunda parte, suponha que σess (A) ∩ [λ − ε, λ + ε] = ∅; então, para todo
γ ∈ [λ −ε, λ + ε] deve existir um δ > 0 tal que dim Ran(E(γ + δ) −E(γ −δ)) < ∞. Assim,
γ é um auto-valor de multiplicidade finita que é um ponto isolado de σ(A). Portanto, pela
primeira parte, o intervalo [λ − ε, λ + ε] poderia ser coberto por um número finito de intervalos
desse tipo, o que implica que dim Ran(E(λ + ε) − E(λ − ε)) < ∞. Consequentemente, se
dim Ran(E(λ + ε) − E(λ − ε)) = ∞, então, σess (A) ∩ [λ − ε, λ + ε] ̸= ∅.30
30
A segunda parte poderia também ser justificada observando que se dim Ran(E(λ) − E(λ − 0)) = ∞,
então, pela primeira parte, λ é um auto-valor de multiplicidade infinita. Portanto, λ ∈ σess (A). Suponha que
dim Ran(E(λ) − E(λ − 0)) < ∞, mas que dim Ran(E(λ + ε) − E(λ − ε)) = ∞, para todo ε > 0. Logo,
o conjunto (λ − ε, λ) ∪ (λ, λ + ε] contém pelo menos um ponto espectral para cada ε > 0 pela Proposição 5.22;
portanto, λ é um ponto de acumulação de σ(A).
369
Podemos ilustrar os diferentes tipos de espectros por meio de exemplos de auto-adjuntos

operadores. Comecemos com o
Exemplo 5.16 (Operador matricial em R3 ). Tome o operador A representado pela matriz
⎛ ⎞
λ1 0 0
⎜ ⎟
A=⎜
⎝ 0 λ2 0⎟
⎠ .
0 0 λ3
em que
;3λ1 , λ2 e λ3 são números reais e λ1 < λ2 < λ3 . Esta matriz pode ser escrita como
A = i=1 λi Pi , tal que
⎛ ⎞ ⎛ ⎞ ⎛ ⎞
1 0 0 0 0 0 0 0 0
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
P1 = ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝0 0 0⎠ , P2 = ⎝0 1 0⎠ , P3 = ⎝0 0 0⎠ .
0 0 0 0 0 0 0 0 1
Para todo vetor x = (x1 , x2 , x3 ), temos
⟨x, Ax⟩ = λ1 |x1 |2 + λ2 |x2 |2 + λ3 |x3 |2 .
Pela Eq.(5.6.28), segue que
E(λ) = 0 para λ < λ1 ,
E(λ) = P1 para λ 1 # λ < λ2 ,
E(λ) = P1 + P2 para λ2 # λ < λ3 ,
E(λ) = P1 + P2 + P3 = 1I para λ2 # λ .
Portanto, a função monótona crescente ϱ(λ) = ⟨x, E(λ)x⟩ tem três descontinuidades de
magnitude ⟨x, P1 x⟩, ⟨x, P2 x⟩ e ⟨x, P3 x⟩, respectivamente, nos pontos λ1 , λ2 e λ3 e constantes.
Disto segue a fórmula
$ λ3
dϱ(λ) = λ1 ⟨x, P1 x⟩ + λ2 ⟨x, P2 x⟩ + λ3 ⟨x, P3 x⟩ = ⟨x, Ax⟩ .
λ1 −0
Neste caso, dizemos que o espectro de A é discreto, e entenderemos por isso que o operador
E(λ) ainda é contínuo pela direita, mas é descontínuo pela esquerda nos pontos λ1 , λ2 e λ3 .
Diremos que esses pontos formam o espectro discreto de A.
Exemplo 5.17 (Operador com espectro de ponto puro). Pela Proposição 5.23 σdisc (A) é o
conjunto daqueles auto-valores de multiplicidade finita que são pontos isolados de σ(A). Diz-
se que A tem um espectro discreto puro se σess (A) é vazio. Veremos no Capítulo 10 que
o hamiltoniano do oscilador harmônico H = P 2 + X 2 em L2 (R) tem espectro puramente
discreto. Os auto-valores (cada um deles de multiplicidade 1) são os números λn = 2n + 1 com
n = 0, 1, 2, . . .
370
Exemplo 5.18 (O operador posição X em L2 [a, b] mais uma vez). Observe que, o operador
E(λ) coincide com o operador de multiplicação por eλ (µ), isto é,
⎧
⎨Ψ(λ) se µ # λ
[E(λ)Ψ](µ) = eλ (µ)Ψ(λ) = .
⎩0 se µ > λ
Então, temos
$ b
⟨Ψ, XΨ⟩ = dλ |Ψ(λ)|2 λ
a
$ b ,$ λ -
2
= d dµ |Ψ(µ)| λ (pelo Teorema Fundamental do Cálculo)
a a
$ b ,$ b -
2
= d dµ eλ (µ)|Ψ(µ)| λ
a a
$ b
= d⟨Ψ, E(λ)Ψ⟩ λ .
a
O número real λ, que aparece na expressão acima, varia continuamente dentro do intervalo
[a, b] (por isto entendemos que o operador E(λ) é contínuo também pela esquerda), tem
multiplicidade infinita e, assim, pertence ao espectro essencial do operador X. A continuidade
de λ está em contraste com a discretização dos auto-valores de uma matriz finito dimensional,
como a que encontramos no Exemplo 5.16.
Exemplo 5.19 (Parte do Teorema de Kato-Rellich revisitado – cf. o Teorema 4.35). Seja A
um operador auto-adjunto ilimitado; então, seu espectro σ(A) é um conjunto ilimitado. No
entanto, o conjunto σ(A) ⊂ R pode ainda ser limitado inferiormente. Neste caso, denotamos
por MA o maior limite inferior do conjunto σ(A): MA = inf λ∈σ(A) λ. Lembramos de passagem
que A é limitado por baixo se, e somente se, o conjunto
3 4
⟨x, Ax⟩/∥x∥2 | x ∈ Dom(A), x ̸= 0 , (pela Definição 4.30)
é limitado inferiormente, com o mesmo maior limite inferior. Suponha que A e B sejam dois
operadores auto-adjuntos com domínios de definição idênticos, que A é limitado inferiormente
e que para 0 # a < 1 e b > 0 temos
∥Cx∥ # a∥Ax∥ + b∥x∥ , C =B−A , (5.11.10)
para todo x ∈ Dom(A) = Dom(B). Então, B também é limitado inferiomente por

# %
b
MB " MA − max , aMA + b . (5.11.11)
1−a
Provamos essa afirmação, mostrando que para qualquer real

# %
b
ξ < MA − max , aMA + b , (5.11.12)
1−a
371
temos ∥CRξ (A)∥ < 1 e, consequentemente, de acordo com a Proposição 5.8, tal ξ pertence ao
conjunto resolvente de B. Isso significa que o espectro de B contém apenas os pontos que não
satisfazem (5.11.12); isto é, B é limitado inferiormente e seu maior limite inferior MB satisfaz
(5.11.11).
Uma vez que σ(A) ⊂ [MA , ∞), para qualquer y ∈ H , x ∈ Dom(A) e ξ < MA , segue
que
(A − ξ1I)x = y e Rξ (A)y = (A − ξ1I)−1 y = x .
Para provar que ∥CRξ (A)∥ < 1 usamos os fatos acima em (5.11.10) para derivar a desigualdade
∥CRξ (A)y∥ # a∥ARξ (A)y∥ + b∥Rξ (A)y∥ .
Levando em conta que pelo Teorema 5.45 o espectro de A é vazio para ξ < MA , segue que
E(λ) é independente de ξ, para ξ < MA ; isto é, E(λ) = O para ξ < MA . Assim, assumindo
que ξ < MA , temos que ξ ∈ σ(Rξ (A)), e de acordo com as Notas 5.24 e 5.30, obtemos
$ ∞
2 1
∥Rξ (A)y∥ = d∥E(λ)y∥2
−∞ (λ − ξ)2
$ β
1
= lim d∥E(λ)y∥2
β→∞ MA −0 (λ − ξ)2
$ β
1
# lim d∥E(λ)y∥2
(MA − ξ)2 β→∞ MA −0
1
= ∥y∥2 (pelo Teorema 5.43 - cf. a Equação (5.10.5)) .
(MA − ξ)2
Assim,
, -
1
∥Rξ (A)y∥ # ∥y∥ .
MA − ξ
Da mesma forma, temos

$ β
2 λ2
∥ARξ (A)y∥ = lim d∥E(λ)y∥2
β→∞ MA −0 (λ − ξ)2
$ β
λ2
# sup 2
lim d∥E(λ)y∥2
MA #λ<∞ (λ − ξ) β→∞ MA −0
, -
λ2
= sup 2
∥y∥2 ,
MA #λ<∞ (λ − ξ)
ou seja,
, - # %
λ MA
∥ARξ (A)y∥ # sup ∥y∥ # max 1, ∥y∥ .
MA #λ<∞ λ − ξ MA − ξ
372
Reunindo todas estas informações, obtemos

# %
aMA 1
∥CRξ (A)∥ # max a, +b .
MA − ξ MA − ξ
Aqui, para provar que ∥CRξ (A)∥ < 1, temos duas situações para serem analisadas. Primeira,
se
1 b
a+b <1 =⇒ ξ < MA − .
MA − ξ 1−a
Segunda, se
aMA 1
+b <1 =⇒ ξ < MA − (aMA + b) .
MA − ξ MA − ξ
Portanto, é facilmente visto que ∥CRξ (A)∥ < 1 quando ξ satisfaz (5.11.12), e pela Proposição
5.8 tal ξ está no conjunto resolvente de B. Consequentemente, B é limitado inferiormente pela
expressão do lado direito de (5.11.11).
Exemplo 5.20 (Operador hamiltoniano atômico). Outro hamiltoniano que analisaremos em
detalhes no Capítulo 10 é o hamiltoniano atômico. Por exemplo, veremos que o espectro do
hamiltoniano do átomo do hidrogênio H = −∇2 + e/∥x∥ em L2 (R3 ) (em que ∇2 é o
laplaciano) contém uma parte absolutamente contínua igual a [0, ∞) e, se e < 0, um número
infinito de auto-valores negativos λj = −e2 /(4j 2 ), onde j = 1, 2, 3, . . . Esses auto-valores se
acumulam em λ = 0, e cada um deles é de multiplicidade finita. Assim, temos: (i) se e > 0,
então, σ(H) = σacont (H) = σess (H) = [0, ∞) e σpont (H) = σscont (H) = σdisc (H) = ∅;
(ii) se e < 0, então, σ(H) = [0, ∞) ∪ {λj | j = 1, 2, 3 . . .}, σacont (H) = σess (H) = [0, ∞),
σpont (H) = σdisc (H) = {λj | j = 1, 2, 3 . . .} e σscont (H) = ∅.
Nota 5.32 (O papel da família espectral na teoria quântica). Como comentário final, gosta-
ríamos de destacar o papel desempenhado pela família espectral na teoria quântica. Veremos
no Capítulo 7 que a teoria quântica está fundamentada sobre um conjunto de postulados.31
Um dos postulados exige que um operador A, que é atribuído à uma quantidade λ da teoria
deve ser auto-adjunto. A importância desta exigência reside no fato de que se pode descrever
as grandezas da mecânica quântica por meio dos operadores de projeções E(λ). Portanto, a
probabilidade que a desigualdade α # λ # β aconteça é dada por ⟨x, (E(β) − E(α))x⟩. Além
disso, um outro postulado estabelece que a expectativa matemática Ex (λ) desta quantidade λ
no estado x é expressa na forma
$ ∞
Ex (λ) = ⟨x, Ax⟩ = d⟨x, E(λ)x⟩ λ ,
−∞
e ⟨x, E(λ)x⟩ é a lei da distribuição da quantidade λ no estado x. Todos os valores possíveis de

λ são precisamente aqueles pontos λ em que E(λ) cresce, ou seja, todos os pontos do espectro
de A em Dom(A).
31
O conjunto de postulados é apresentado de formas diferentes, por diferentes autores. No Capítulo 7 são
destacados aqueles postulados que formam os pilares centrais da teoria.
373
Terceira Parte:
Elementos de Teoria de Distribuições
375
Capítulo 6
Teoria de Distribuições e Análise de
Fourier
“Se um método tem sido utilizado pelos físicos, sem muitos erros por um longo período de tempo, então deve ser
matematicamente justificável de uma forma ou de outra.”
L. Schwartz referindo-se à “função” delta de Dirac
Este capítulo é devotado a uma introdução às noções básicas sobre distribuições, trans-
formada de Fourier e análise microlocal, onde são apresentados muitos resultados importantes.
Mesmo que esses resultados não capacitem imediatamente o leitor a computar melhor os efeitos
físicos, a apresentação dos conceitos ligados com a teoria da distribuição é fundamental para
todo o mecanismo da mecânica quântica.
6.1 Distribuições: Um Conceito Matemático Generalizando o

Conceito Clássico de Função
Na Física-Matemática, muitas vezes nos deparamos com dificuldades técnicas causadas pela
não-diferenciabilidade de certas funções. A teoria das distribuições (ou funções generalizadas)
permite remediar essas dificuldades. O conceito de distribuições torna possível expressar de uma
forma matematicamente correta conceitos idealizados como a densidade de um ponto material
de massa, uma carga discreta, a intensidade de uma fonte instantânea, um ponto espalhador,
etc. Por outro lado, o conceito de distribuição reflete o fato que, na realidade, quando uma
quantidade física (como temperatura, pressão, campo eletromagnético, etc), representada por
uma função f em Rn , é medida em um ponto x0 com a ajuda de algum dispositivo (termômetro,
manômetro, medidor de campo eletromagnético, etc) obtém-se como resposta somente o valor
377
Teoria de Distribuições e Análise de Fourier
d
médio de f sobre uma vizinhança de x0 , que é uma integral da forma dx f (x)ϕ(x), em
que ϕ é uma função que caracteriza o aparelho de medição e “manuseia” de alguma forma a
vizinhança de x0 . Isto nos obriga a abandonar completamente a ideia de encarar f como uma
função que representa uma quantidade física, como o campo eletromagnético, e considerar, em
vez disso, f como um funcional linear, atribuindo a cada função teste ϕ o número
$ ∞
f (ϕ) = dx f (x)ϕ(x) .
−∞
O conceito de distribuição apareceu pela primeira vez no final da década de 1920 no trabalho
de P.M.A. Dirac sobre Mecânica Quântica, quando ele usou sistematicamente o conceito da
função δ definida como
R ∋ x 3−→ δ(x − x0 ) ∈ R ∪ {∞} ,
satisfazendo as seguintes propriedades:
⎧
⎨ 0 se x ̸= x0
δ(x − x0 ) = , (6.1.1)
⎩+∞ se x = x
0
e
$ ∞
dx δ(x − x0 )f (x) = f (x0 ) . (6.1.2)
−∞
Rigorosamente, resultados da teoria de integração nos mostram que, na verdade, as condições

(6.1.1) e (6.1.2) se contradizem. De fato, de acordo com a teoria de medida de Lebesgue, a
condição (6.1.1) implica que δ(x − x0 )f (x) = 0 para quase todo x ∈ R e pela teoria de
integração de Lebesgue a integral de δ(x − x0 )f (x) deve ser zero. Em outras palavras, a
integral de qualquer função que desaparece em quase toda parte, exceto em um ponto, deve
ser zero. Assim, nenhuma “função” que satisfaz a Eq.(6.1.1) pode satisfazer a Eq.(6.1.2). Por outro
lado, (6.1.2) nos permite interpretar dx δ(x − x0 )f (x) como uma medida de “massa” total 1 que
está concentrada em x0 ; porém isto está em conflito com (6.1.1).1
Como, então, podemos dar sentido à expressão (6.1.2), que funciona tão bem na Mecânica
Quântica? Isto é estabelecido de modo satisfatório, e rigoroso, através da Teoria das Distribuições,
criada por Laurent Schwartz2 nos anos de 1940,3 que também explica outras expressões formais
como (6.1.2) envolvendo as derivadas de δ
$
dx δ (n) (x)f (x) = f (n) (0) .
1
Justiça seja feita; estava claro para Dirac, desde o início, que a função delta não podia ser uma função no
sentido clássico. O mais importante, Dirac, como um eminente físico e matemático, sabia que a função delta
atuava como um operador (mais precisamente, como um funcional) que relaciona, por meio das fórmulas (6.1.1) e
(6.1.2), a cada função contínua f um número f (x0 ), que é o seu valor no ponto x0 .
2
Laurent-Moïse Schwartz foi um matemático francês. Seu trabalho sobre a teoria das distribuições lhe rendeu
a Medalha Fields em 1950.
3
Os fundamentos matemáticos da teoria das distribuições parecem ter sido primeiro formulados pelo matemático
russo Sergei Sobolev nos anos de 1930, quando este estudava soluções fracas de EDP’s. Os russos denominam a
teoria de Sobolev de Funções Generalizadas.
378
Neste sentido, a Teoria das Distribuições é uma generalização da noção de função, permitindo
tornar preciso várias manipulações matemáticas que não seriam possíveis via cálculo diferencial
usual, como, por exemplo, a operação de diferenciação: o espaço das distribuições é, essencial-
mente, a menor extensão do espaço de funções contínuas onde a diferenciação é sempre bem
definida.
A expressão (6.1.2) é um exemplo de um funcional linear. Ao contrário de uma função

f em Rn , que associa a cada ponto dx ∈ Rn um número y = f (x) (o valor de f em x),
uma distribuição associa um número dx f (x)ϕ(x) para toda função ϕ pertencendo a uma
certa classe K . As funções em K são chamadas funções teste. Assim, em (6.1.2), a “função”
δ, ou suas derivadas, desempenha o papel de um funcional linear associando um número a
cada função teste ϕ “suficientemente bem comportada.” Agora, o quanto uma função teste
deve ser suficientemente bem comportada, depende do conjunto de distribuições que atuam
sobre classes específicas dessas funções. Em outras palavras, classes diferentes
d de distribuições
exigem classes diferentes de funções teste, para que a integral do tipo dx f (x)ϕ(x) seja bem
definida.
Neste ponto, cabe ressaltar que as propriedades das funções teste devem refletir as proprie-
dades das distribuições. Como uma regra, é suficiente analisar o comportamento da distribuição
no infinito. Quanto mais “crítico” for o comportamento de uma distribuição no infinito, mais
bem comportada deve ser a função teste. Por exemplo, se considerarmos o espaço das distri-
buições formado por funções sem qualquer restrição ao seu crescimento no infinito, então esse
espaço é o dual (ou o conjugado) do espaço composto por funções teste ϕ ∈ C0∞ (Rn ), isto é, o
espaço das funções infinitamente diferenciáveis sobre Rn e que se anulam fora de alguma região
limitada. O espaço das distribuições pertencendo a esta classe é simbolizado por D ′ (Rn ), e
por D(Rn ) representamos o espaço das funções de suporte compacto ϕ ∈ C0∞ (Rn ).4
Uma classe mais ampla de funções teste, simbolizada por S (Rn ), é formada por funções
ϕ(x) que, ao invés de serem identicamente nulas fora de uma região limitada, decaem rapida-
mente a zero quando x → ∞. Os correspondentes funcionais são chamados de distribuições
temperadas. O espaço das distribuições temperadas é simbolizado por S ′ (Rn ). Deve-se res-
saltar que o nome distribuição “temperada” é motivado por um teorema de estrutura (veja o
Teorema 6.2) que diz que toda distribuição em S ′ (Rn ) pode ser representada por uma soma
finita de derivadas de funções contínuas limitadas polinomialmente.
Por outro lado, se consideramos o espaço das distribuições de suporte compacto, simbolizado
por E ′ (Rn ), então, o espaço sobre o qual essas distribuições atuam é composto por funções
teste infinitamente diferenciáveis sobre Rn . Representamos o espaço dessas funções por E (Rn ).
Assim, por definição temos E ′ ⊂ S ′ ⊂ D ′ e D ⊂ S ⊂ E .
6.1.1 Notação de Multi-índices
A notação matemática de multi-índices simplifica as fórmulas usadas no cálculo de multiva-

riáveis, equações diferenciais parciais e na teoria das distribuições, através da generalização do
conceito de um índice inteiro para um vetor de índices.
4
Veja na Nota 6.2 a definição de suporte de uma função.
379
Um multi-índices n-dimensional é um vetor α = (α1 , . . . , αn ) ∈ Nn0 para o qual definimos:
• Soma e diferença
α ± β = (α1 ± β1 , α2 ± β2 , . . . , αn ± βn ) .
• Ordem parcial
α#β ⇐⇒ αi # βi ∀ i ∈ {1, . . . , n} .
• Fatorial
α! = α1 ! · α2 ! · · · αn ! .
• Coeficiente binomial , - , -, - , -
α α1 α2 αn
= ··· ,
β β1 β2 βn
em que
, -
αi αi !
= , ∀ i = 1, . . . , n .
βi βi !(αi − βi )!
Para x = (x1 , x2 , . . . , xn ) ∈ Rn , definimos:
• Soma e diferença
x ± y = (x1 ± y1 , x2 ± y2 , . . . , xn ± yn ) .
• Potência
xα = xα1 1 xα2 2 · · · xαnn .
• Produto interno
def.
⟨x, y⟩ = xy = x1 y1 + · · · + xn yn
• Derivada parcial de ordem superior

, -α1 , -α2 , -αn
α ∂ ∂ ∂ ∂ |α|
D = ··· = , (6.1.3)
∂x1 ∂x2 ∂xn ∂xα1 1 ∂xα2 1 · · · ∂xαnn
em que D α é a derivada monomial de ordem |α| = α1 + · · · + αn . Por exemplo, para

f ∈ C 7 (R3 ), se α1 = 2, α2 = 0, α3 = 5, isto é, se α = (2, 0, 5), então |α| = 7 e
7f
D α f = ∂x∂2 ∂x ∂f
5 ; se α = (1, 0, 0), então |α| = 1 e Df = ∂x ; se α = (1, 1, 0), então
1
1 3
∂2f ∂2f
|α| = 2 e D α f = ∂x1 ∂x2
; se α = (0, 2, 0), então |α| = 2 e D α f = ∂x22
; se α = (1, 1, 1),
α ∂3f
então |α| = 3 e D f = ∂x1 ∂x2 ∂x3
. Atenção: o leitor deve ficar atento para a diferença
entre |α| e |x|.
• Além disso, define-se: λx = (λx1 , . . . , λxn ) e x " 0 significa x1 " 0, . . . , xn " 0.
380
Exemplo 6.1. A notação multi-índices permite a extensão de muitas fórmulas do cálculo elemen-
tar no caso de muitas variáveis, como mostram os exemplos abaixo. Em todos eles x, y, h ∈ Rn
(ou Cn ), α, β, ν ∈ Nn0 e f , aα : Rn → R (ou Cn → C).
Teorema Binomial. α , -
< α β α−β
α
(x + y) = x y .
β=0
β
Teorema Multinomial (generalização do Teorema Binomial)

,<
n -k < k!
xi = xα .
i=1
α!
|α|=k
Regra de Leibniz (regra do produto generalizado). Para funções suaves f , g, segue que
< ,α-
α
D (f g) = D β f D α−β g . (6.1.4)
β#α
β
Séries de Taylor. Para uma função analítica f de n variáveis tem-se

< D α f (x)
f (x + h) = hα .
α∈Nn
α!
0
De fato, para uma função suave, temos uma expansão de Taylor similar
< D α f (x)
f (x + h) = hα + Rn (x, h) ,
α!
|α|#n
em que o último termo (o resto) depende da versão exata da fórmula de Taylor. Por exemplo,
para a fórmula de Cauchy, segue que
< hα $ 1
Rn (x, h) = (n + 1) dt (1 − t)n D α f (x + th) .
α! 0
|α|=n+1
Operador diferencial parcial. Um operador diferencial partial de N-ésima ordem em n

variáveis é escrito como <
P (D) = aα (x)D α .
|α|#N
Integração por partes. Para funções suaves de suporte compacto em um domínio limitado
Ω ⊂ Rn tem-se $ $
α |α|
dx u(D v) = (−1) dx (D α u)v .
Ω Ω
Esta fórmula é usada para a definição de distribuição e derivada fraca!
381
PROPOSIÇÃO 6.1. Se α, β ∈ Nn0 são multi-índices e x = (x1 , . . . , xn ), então

⎧
β!
⎨ (β−α)! xβ−α se α # β ,
α β
D x =
⎩ 0 caso contrário .
Demonstração. A prova segue da regra de potência para o cálculo diferencial ordinário; se α e

β pertencem ao conjunto {0, 1, 2, . . .}, então
⎧
β!
d β ⎨ (β−α)! x
β−α
α se α # β ,
x = (*)
dxα ⎩ 0 caso contrário .
Suponha α = (α1 , . . . , αn ), β = (β1 , . . . , βn ) e x = (x1 , . . . , xn ). Então temos que
∂ |α|
α β
D x = α1 α1 α
xβ1 1 xβ2 2 · · · xβnn
∂x1 ∂x2 · · · ∂xn n
∂ α1 β1 ∂ αn βn
= α1 x1 · · · αn xn ,
∂x1 ∂xn
Para cada i ∈ {1, . . . , n}, a função xβi i só depende de xi . Logo, como acima, cada derivada
parcial ∂/∂xi reduz-se à correspondente derivada ordinária d/dxi . Portanto, da equação (*),
segue que D α xβ desaparece se αi > βi para no mínimo um i ∈ {1, . . . , n}. Se este não é o
caso, isto é, se α # β como multi-índice, então
dαi βi βi !
αi xi = xβi i −αi
dxi (βi − αi )!
para cada i e isto completa a prova.
Ainda definimos
R
S n n
S< <
∥x∥ = T x2i , |x| = |xi | .
i=1 i=1
2
;n 2
Note que,
; ∥x∥ # |x|. Com
; efeito, prova-se isto notando que ∥x∥ = i=1 xi , enquanto que
|x|2 = ni=1 x2i + 2 i̸=j |xi | · |xj |. Usaremos este fato em várias oportunidades ao longo
deste capítulo.
Por fim, um elemento de volume em Rn será denotado por dx = dx1 dx2 · · · dxn , de
forma que a integral múltipla (de Riemann) de uma função f em Rn será muitas vezes escrita
abreviadamente como
$ $
dx f (x) = dx1 dx2 · · · dxn f (x1 , x2 , . . . , xn ) .
382
6.2 As Célebres Distribuições de Schwartz D ′ , E ′ e S ′

Nesta seção, concentraremos toda a nossa discussão nos três espaços de distribuições de
Schwartz, que são, por assim dizer, os mais “populares.” Para lidar com certos problemas
particulares em aplicações, foram propostas várias generalizações dos espaços tipo Schwartz. O
leitor interessado deve consultar o Volume II da obra de Gel’fand-Shilov.5
6.2.1 O Espaço D e seu Dual D ′
Seja Ω ⊆ Rn um conjunto aberto não-vazio. Para cada conjunto compacto K ⊂ Ω, denote

por DK (Ω) o espaço de toda f ∈ C ∞ (Rn ) cujo suporte situa-se em K, isto é, supp f ⊆ K.
Introduza em DK (Ω) a seguinte base contável de vizinhanças de zero:
3 1 4
UKi ,mi ;ε (0) = f ∈ DK (Ω) | sup |D α f (x)| < com i, ε = 1, 2, 3, . . . .
x∈Ki ε
|α|#mi (Ki )
A união dos espaços DK (Ω) é o espaço de funções teste D(Ω) = ∪DK (Ω), em que
Ω = ∪Ki , i = 1, 2, 3, . . ., com a condição que Ki situa-se no interior de K1+i .6 Portanto, o
espaço D(Ω) consiste de todas as funções infinitamente diferenciáveis e de suporte compacto
em Ω.
A topologia de D(Ω) pode ser definida com a ajuda da base de vizinhanças de zero definida
acima. Para cada função em D(Ω), existe um índice j tal que para todo j " i a função tem
suporte em Kj . Assim, uma sequência (fn (x))n∈N converge para f ∈ D(Ω), se existe um
conjunto compacto K ⊂ Ω tal que supp fn ⊂ K, supp f ⊂ K e todas as derivadas de fn
convergem uniformemente em K com respeito a x. Desta forma, o espaço de funções teste
D(Ω) de funções de classe C ∞ de suporte compacto é definido como o limite indutivo dos
epaços DK (Ω), com K ⊂ Ω sendo compacto.
Exemplo 6.2. Um exemplo de uma função teste pertencendo ao espaço D é dado por
⎧ 6 7
⎨ exp − 2 α2 2 se ∥x∥ # α
α −∥x∥
fα (x) = ,
⎩ 0 se ∥x∥ > α
H
em que ∥x∥ = x21 + · · · + x2n e α é um número real.
DEFINIÇÃO 6.1. Diz-se que uma distribuição T pertence ao espaço dual topológico de D se
1. T é linear, isto é, se T (αf1 + βf2 ) = αT (f1) + βT (f2) para todo α, β ∈ C e para todo
f1 , f2 ∈ D,
5
I.M. Ge’fand e G.E. Shilov, “Generalized Functions. Spaces of Fundamental and Generalized Functions,” Vol.2,
Academic Press, 1968.
6
Por exemplo, podemos tomar
# %
1
Ki = x ∈ Ω | |x| # i e dist(x, !Ω) " .
i
383
2. limn→∞ |T (fn ) − T (f )| = 0, para toda sequência (fn )n∈N em D.
O espaço de todas as distribuições que estão definidas sobre D é denotado por D ′ .

DEFINIÇÃO 6.2. Diz-se que um funcional T ∈ D ′ é limitado se, e somente se, para cada
subconjunto compacto K ⊂ Rn , existe um número M, que depende de K, e um inteiro m(K) "
0 tal que 5 5
5T (f )5 # MK ∥f ∥K,m
em que
∥f ∥K,m = sup |D α f (x)| .
x∈K
|α|#m(K)
Exemplo 6.3 (δ ∈ D ′ ). Um exemplo de uma distribuição pertencendo ao espaço D ′ é a

“função” delta de Dirac. Com efeito, δ define uma distribuição por meio da equação
$ $
Tδ (f ) = dx δ(x − x0 )f (x) = dx δ(x − x0 )f (x) ,
Rn K
para toda função f ∈ D com suporte em K.7 A linearidade de Tδ é óbvia da linearidade da

D
integral. Para checar a continuidade, assuma que fn −→ f e que K é grande o suficiente para
conter o suporte de f e de todas as fn . Então,
5$ 5
5 5 5 . /5
5Tδ (fn ) − Tδ (f )5 = 5 dx δ(x − x0 ) fn (x) − f (x) 5
5 5
K
$
5. /5
# dx |δ(x − x0 )|5 fn (x) − f (x) 5
K
,$ -
# dx δ(x − x0 ) sup |fn (x) − f (x)|
K x∈K
= 1 · ∥fn − f ∥K,∞ ,
D
se x0 ∈ K. Mas como fn −→ f , então, ∥fn −f ∥K,∞ → 0 quando n → ∞. Portanto, “função”
delta de Dirac define uma distribuição em D ′ .
DEFINIÇÃO 6.3 (Funções em Lloc 1 (Ω)). Seja Ω um subconjunto não vazio e aberto de R
n
n
com fecho Ω e fronteira ∂Ω; em particular Ω pode ser o próprio R . Diz-se que uma função
f : Ω ⊆ Rn → C é localmente integrável, se f é absolutamente integrável em qualquer
subconjunto compacto K de Ω. Equivalentemente, o espaço Lloc
1 (Ω) consiste de funções que são
absolutamente integráveis em qualquer bola fechada em Ω ⊆ Rn , mas não necessariamente em
todo o conjunto Ω.
Nota 6.1. Em geral, dado um conjunto aberto Ω ⊆ Rn , diz-se que uma função f : Ω ⊆ Rn → C
é localmente p-integrável ou p-localmente integrável se
,$ -1/p
p
dx |f (x)| < ∞ , ∀0 # p < ∞ ,
K
7
Observe que os limites de integração podem ser alterados para valores finitos, uma vez que f tem suporte
compacto!
384
em que K é qualquer subconjunto compacto de Ω. O espaço composto por todas as funções

localmente p-integrável é denotado por Lloc loc
p (Ω). Ou seja, podemos dizer que o espaço Lp (Ω)
consiste de funções que são p-integrável em qualquer bola fechada em Ω ⊆ Rn , mas não
necessariamente em todo o conjunto Ω. Assim, uma função Lloc n
p (Ω) ∋ f : Ω ⊆ R → C não
está, em geral, em Lp (Ω). Por outro lado, f ∈ Lp (Ω) =⇒ f ∈ Lloc p (Ω):
,$ -1/p ,$ -1/p
p p
dx |f (x)| < ∞ =⇒ dx |f (x)| <∞.
Ω K
Exemplo 6.4. Seja Ω = (0, 1) e f (x) = 1/x. Então,

$ 1 $ 1 , -
1 1 1
dx = lim+ dx = lim+ ln =∞.
0 x ε→0 ε x ε→0 ε
Portanto, f (x) = 1/x ∈
/ L1 (Ω), já que f (x) = 1/x não é localmente integrável em x = 0.
Por outro lado, f é localmente integrável “próximo” desse ponto, já que sua integral sobre
todo conjunto compacto que não o inclui é finita. Com efeito, seja K = [a, b] ⊂ (0, 1), com
0 < a < b < 1, então,
$ $ b 6a7
1 1
dx = dx = ln <∞.
K x a x b
Neste caso, f (x) = 1/x ∈ Lloc loc
1 (Ω). Formalmente falando, f (x) = 1/x ∈ L1 (R \ {0}). No
entanto, como veremos mais adiante, esta função pode ser estendida a uma distribuição em
todo R como um valor principal de Cauchy.
Funções em Lloc n ′
1 (R ) definem, naturalmente, distribuições em D . De fato, seja f ∈
Lloc n
1 (R ) e defina Tf : D → C pela equação
$
Tf (ϕ) = dx f (x)ϕ(x) , ∀ ϕ ∈ D(Rn ).
Rn
A linearidade de Tf é clara, novamente pela linearidade da integral. Temos que mostrar que Tf
é um funcional contínuo. Para isto, fixe um conjunto compacto K em Rn . Agora, tome toda
função ϕ ∈ D(Rn ) tal que supp ϕ ⊆ K. Então, temos que
5$ 5 $
5 5 5 5
5Tf (ϕ)5 = 5 dx f (x)ϕ(x)5 # dx |f (x)||ϕ(x)|
5 5
K K
,$ -
# dx |f (x)| sup |ϕ(x)|
K x∈K
= MK ∥ϕ∥K,∞ .
Portanto, Tf é um funcional contínuo e define uma distribuição em D ′ .
6.2.2 Localização e Suporte de uma Distribuição
Uma distribuição sobre um aberto Ω ⊂ Rn foi definida como um funcional linear contínuo
sobre o espaço de funções teste D(Ω) sobre Ω, porém não diretamente em pontos de Ω, isto é,
a distribuição não toma qualquer valor em um ponto fixo de Ω. Contudo, podemos falar sobre
a localização de uma distribuição, como ficará claro abaixo.
385
DEFINIÇÃO 6.4. Se T ∈ D ′ (Rn ), dizemos que x ∈ Rn é um ponto regular de T se, e somente

se, existeduma vizinhança U de x e uma função g de classe C ∞ sobre U, tal que a integral
T (f ) = dx g(x)f (x) é bem definida para todo f ∈ D(Rn ) com supp f ⊂ U. O complemento
dos pontos regulares de T é chamado suporte singular de T . Em outras palavras, diz-se que uma
distribuição T é regular se ela está associada à uma função g localmente integrável. Todas as
outras distribuições são singulares.
A Definição 6.4 reflete uma propriedade da teoria das distribuições: embora não possamos
falar do valor de uma distribuição em um dado ponto x de seu argumento, podemos discutir
suas propriedades locais em qualquer vizinhança arbitrariamente pequena de x. Não podemos,
por exemplo, dizer que uma distribuição T é igual a zero em x0 . Contudo, podemos dizer que
uma distribuição é igual a zero em uma vizinhança U de x0 . Isso significa que, se T ∈ D ′ (Ω),
U é um subconjunto aberto de Ω e se T (f ) = 0 para cada f ∈ D(Ω) com suporte em
U, então T anula-se em U. Por exemplo, a distribuição T correspondendo a uma função
ordinária g desaparecerá na vizinhança U de x0 se a própria g se anula, em quase toda parte,
nessa vizinhança. A distribuição δ(x − x0 ) desaparece na vizinhança de todo ponto x ̸= x0 .
Dizer que uma distribuição T desaparece sobre algum conjunto aberto Ω significa dizer que
ela desaparece na vizinhança de cada ponto desse conjunto. Se T é uma distribuição que não
desaparece na vizinhança de x0 , então x0 é chamado ponto essencial do funcional T . Assim,
o ponto x0 = x é o ponto essential do funcional δ(x − x0 ). O conjunto de todos os pontos
essenciais de uma distribuição é chamado o seu suporte.
DEFINIÇÃO 6.5. Sejam Ω ⊆ Rn um conjunto aberto e T ∈ D ′ (Ω). O suporte de T é o conjunto
de todo x ∈ Ω para os quais não existe uma vizinhança U de x tal que T = 0 em U.
Nota 6.2. Neste ponto, lembramos que no estudo das funções o suporte de uma função f é o
menor subconjunto fechado do domínio de f em que f assume valores diferentes de zero,
isto é, se f : X → Y é uma função definida em um espaço X com imagem em um espaço Y ,
então definimos o suporte de f como:
! "
supp f = x ∈ X | f (x) ̸= 0 .
Seja V = Ω − supp T o complemento de supp T em Ω. Este é um conjunto aberto de

Ω. Por definição, para todo x ∈ V existe uma vizinhaça U de x em Ω com T = 0 sobre
U, o que implica que U ⊂ V . Além disso, se U é aberto em Ω e T = 0 sobre U, então
U ∩ supp T = ∅, que é equivalente a U ⊂ V . Em outras palavras, V é o maior subconjunto
aberto de Ω sobre o qual T se anula. Além disso, tem-se
T (f ) = 0 se T ∈ D ′ (Ω) , f ∈ D(Ω) e supp T ∩ supp f = ∅ ,
e se (T − S)(f ) = 0, quando supp f ⊂ Ω, então T = S sobre Ω. De fato, T = S sobre Ω
para toda função teste f , se (T − S)(f ) = 0, quando supp f ⊂ Ω.
Nota 6.3. É importante entender o que a definição acima não diz: uma vez que o suporte de
f ∈ D é um conjunto fechado e Ω é um conjunto aberto, a afirmativa que supp f ⊆ Ω é mais
forte do que dizer que f desaparece em cada ponto x ∈ / Ω; ela diz que f desaparece em uma
vizinhança de cada ponto x ∈ / Ω. Por exemplo, se Ω = (0, 1) em R, então f deve desaparecer
fora do intervalo (ε, 1 − ε), para um ε > 0 arbitrário, para podermos afirmar que supp f ⊆ Ω
(veja Figura 6.1).
386
f ∈D
f∈
/D
f∈
/D
Figura 6.1: A primeira função está em D, pois ela se anula na vizinhança de 0 e 1. A segunda
não está em D, pois ela não se anula na vizinhança de 0 e 1. A terceira também não está em
D, pois não é diferenciável em 3 pontos.
Uma distribuição é determinada univocamente por suas propriedades locais como mostra o
LEMA 6.1. Sejam Ω ⊆ Rn um conjunto aberto e T ∈ D ′ (Ω). Se T se anula sobre cada conjunto
aberto Uj ⊂ Ω, j = 1, . . . , n, então T se anula sobre o conjunto W = ∪nj=1 Uj .
Demonstração. Temos que mostrar que T (f ) = 0 para toda f cujo suporte está contido em
W . Assuma que f = f1 + · · · + fn tal que supp fj ⊂ Uj , com j = 1, . . . , n. Visto que cada
ponto x ∈ supp f pertence ao menos a um dos conjuntos Uj , construimos a função auxiliar
ηx com as seguintes propriedades:
• ηx (y) " 0 para todo y,
• ηx é de classe C ∞ ,
• ηx (x) > 0,
• o suporte de ηx situa-se em pelo menos um dos conjuntos Uj .
O conjunto em que ηx > 0 é um conjunto aberto contendo x. A união desses abertos cobre o
suporte de f . Por sua vez, a compacidade do suporte de f , nos permite tomar uma subcobertura
finita desses abertos que também cobre o suporte de f .8 Denote por ηj a soma de ;todas as
n
funções ηx dessa cobertura finita cujo suporte situa-se em Uj . Então, a soma j=1 ηj é
positiva sobre o suporte de f . Defina
ηj
fj = f .
η1 + · · · + ηn
8
Lembramos ao leitor que todo subconjunto Y de um espaço topológico X é compacto se, e somente se, toda
cobertura de Y por conjuntos abertos em X contém uma subcobertura finita cobrindo Y .
387
;n
Note que, o supp fj ⊂ Uj , fj ∈ C0∞ e j=1 fj = f . Então, pela linearidade, segue que
T (f ) = T (f1 + · · · + fn ) = T (f1 ) + · · · + T (fn ) = 0 + · · · + 0 ,
já que T é assumido ser zero em cada conjunto aberto Uj .
LEMA 6.2. Sejam Ω ⊆ Rn um conjunto aberto e T ∈ D ′ (Ω). Se η ∈ C ∞ (Ω) e η = 1 sobre um
conjunto aberto contendo o supp T , então, T = ηT .
Demonstração. Suponha que supp T ⊂ V , tal que V ⊂ Ω. Seja ϕ ∈ D(Ω). Evidentemente,

supp (1 − η)ϕ ∩ supp T = ∅. Portanto,
. /
T (1 − η)ϕ = (T − ηT )(ϕ) = 0 .
Como isso é verdade para ϕ ∈ D(Ω), segue que T = ηT .
Considere ϕ ∈ D(Rn ). Então, para qualquer α, tal que T = D α δ ∈ D ′ (Rn ), temos

$
T (ϕ) = dx D α δ(x)ϕ(x)
$
|α|
= (−1) dx δ(x)D α ϕ(x)
= (−1)|α| D α ϕ(0) . (6.2.1)

Assim, toda derivada da “função” δ de Dirac concentra-se na origem. O mesmo é verdade para
combinações lineares das derivadas de δ.
6.2.3 O Espaço E e seu Dual E ′
O espaço (linear) de todas as funções infinitamente diferenciáveis sobre Rn a valores reais

(ou complexos) é denotado por E (Rn ), ou simplesmente E . Uma família de semi-normas sobre
E é definida da seguinte forma: para cada conjunto compacto K e cada inteiro m(K) " 0,
tem-se
∥ϕ∥K,m = sup |D α ϕ(x)| .
x∈K
|α|#m(K)
Uma sequência (ϕn )n∈N converge para zero em E (Rn ) se, e somente se, toda ϕn ∈ E e,
para cada inteiro α " 0, {D α ϕn }n∈N converge para zero uniformemente sobre todo conjunto
compacto K em Rn . Note que a convergência em D(Rn ) implica a convergência em E (Rn ).
Dito de outra forma, vemos que o espaço DK (Rn ) é equipado com a topologia relativa como
um subconjunto de E (Rn ). O espaço E (Rn ) é completo.
DEFINIÇÃO 6.6. O espaço dual de E (Rn ), denotado por E ′ (Rn ), consiste de todos funcionais
lineares tal que T : E (Rn ) → C, com T 3→ T (ϕ). Os elementos de E ′ (Rn ) são chamados
distribuições de suporte compacto.
O espaço E ′ (Rn ) pode ser visto como um subespaço de D ′ (Rn ). De fato, se T ∈ D ′ (Rn )
tem suporte compacto, então existe um único elemento de E ′ (Rn ) cuja restrição a D(Rn ) é
igual a T .
388
6.2.4 O Espaço S e seu Dual S ′
A partir de agora, vamos introduzir uma classe de distribuições, chamadas distribuições

temperadas, muito utilizada no estudo da teoria relativística dos campos quantizados sobre
um espaço-tempo de Minkowski. De fato, a teoria de tais objetos está intimamente ligada ao
crescimento da matemática aplicada ao estudo da teoria da renormalização entre as décadas
de 1950 a 1970. Isto foi motivado, principalmente, pelo fato, como veremos mais adiante, da
classe das distribuições temperadas ser invariante sob a transformada de Fourier, e por ser a
transformada de Fourier uma ferramenta importante que conecta a representação no espaço
das posições com a representação no espaço dos momenta da teoria dos campos quantizados.
DEFINIÇÃO 6.7. O espaço de Schwartz é composto pela totalidade de funções infinitamente
diferenciáveis que, juntamente com todas suas derivadas, vão mais rápido para zero, quando
|x| → ∞, do que qualquer potência inversa de x. Em outras palavras, para funções f ∈ S (Rn ),
com x = (x1 , . . . , xn ), tem-se
5 α β 5
5x D f (x)5 # C , ∀ α, β ∈ Nn0 , (6.2.2)
com a constante C = C(α, β) dependendo, em geral, da função f e de α e β. Tais funções são

chamadas de funções de decrescimento rápido.
Exemplo 6.5. Um exemplo de funções de decrescimento rápido no infinito são as funções
f ∈ C0∞ (Rn ), o espaço das funções de suporte compacto.
Exemplo 6.6. Um exemplo típico de uma função que decai rapidamente é a função gaussiana
2 2
(veja a Figura 6.2) dada por ϕ(x) = e−αx , com α > 0. De fato, o valor de e−αx aproxima-se
de zero muito rapidamente à medida que a distância de x = 0 aumenta.
ϕ
1
1
2
ϕ(x) = e−αx
0.5
0
0 x 0
−2 0 2 4 6 −5
Figura 6.2: Função gaussiana em 2D a esquerda e em 3D a direita. Por causa de sua forma, a
gaussiana também é conhecida como função “sino.”
Segue da Definição 6.7 que o espaço S é uma álgebra fechada sob a derivação e a multi-
plicação por xα , isto é,
f (x) ∈ S =⇒ D α f (x) ∈ S ,
f (x) ∈ S =⇒ xα f (x) = xα1 1 . . . xαnn f (x) ∈ S ,
é o que mostra a seguinte
389
PROPOSIÇÃO 6.2. Se f ∈ S (Rn ), então a condição (6.2.2) é equivalente à condição

lim xα D β f (x) = 0 , ∀ α, β ∈ Nn0 , (6.2.3)
|x|→∞
Demonstração. Para ver que a condição (6.2.2) implica a condição (6.2.3), tomamos em (6.2.2)
def.
uma constante C = C(α + γ, β), para todo α, γ, β ∈ Nn0 , tal que
5 α+γ β 5
5x D f (x)5 # C ,
uma vez que f ∈ S (Rn ). Mas então,

5 α β 5
5x D f (x)5 # C , (6.2.4)
|x|γ
e o lado direito de (6.2.4) tende a zero quando |x| → ∞. Por outro lado, para ver que a
condição (6.2.3) implica a condição (6.2.2), recorremos ao 5 αfatoβ que 5o limite em (6.2.3) é zero.
Neste caso, podemos achar um número N > 0 tal que 5x D f (x)5 < 1 para todo |x| > N.
Mas, sendo a função x 3→ xα D β f (x) contínua no hipercubo [−N, N]n , ela é limitada aí (por
exemplo,
5 α β veja 5 a figura da gaussiana 2-dimensional). Assim, existe um número M > 0 tal que
5x D f (x)5 < M, para |x| < N. Consequentemente, podemos tomar como constante em
! "
(6.2.2) a constante C = max 1, M . Isto finaliza a prova.
;
COROLÁRIO 6.1. Se f ∈ S (Rn ), P (D) = m β=0 aβi D
βi
é um operador diferencial linear com
coeficientes constantes e Q(x) é um polinômio, então Q(x)P (D)f (x) ∈ S (Rn ).
Demonstração. Seja C(P , Q) uma constante tal que |Q(x)P (D)f (x)| # C(P , Q). Então,
observe que Q(x)P (D)f (x) é a soma de termos da forma que satisfazem a Eq.(6.2.4).
2
Exemplo 6.7 (Função gaussiana revisitada). Se ϕ(x) = e−ax , com a > 0, então ϕ ∈ S (R).
2
É óbvio que ϕ(x) = e−ax é infinitamente diferenciável. Usando um β ∈ N0 , podemos escrever
2
D β ϕ(x) = Pβ (x)e−ax ,
em que Pβ (x) é um polinômio de x de grau β. Esta expressão implica
|Pβ (x)| # C(β)|x|β ,
com C(β) sendo uma constante positiva (que depende de β) apropriadamente escolhida. Logo,
combinando os dois resultados acima, obtemos
2 2
|xα D β ϕ(x)| = |xα Pβ (x)|e−a|x| # C(β)|x|α+β e−a|x| ,
que vale para α, β ∈ N0 arbitrários. Além disso, considerando que a taxa de crescimento de
2
ex é extremamente grande e excede a taxa de crescimento para funções de potência |x|n para
qualquer n, segue trivialmente que
2
lim |x|α+β e−a|x| = 0 .
|x|→∞
Portanto, concluímos que

lim |xα D β ϕ(x)| = 0 .
|x|→∞
390
Em geral, as melhores constantes possíveis em (6.2.2) são dadas por uma família de semi-
normas em S (Rn )
3 5 5 4
∥f ∥α,β = inf C(α, β) | sup 5xα D β f (x)5 < ∞ , ∀ α, β ∈ Nn0 , m ∈ N0 . (6.2.5)
x∈Rn
|β|#m
Nota 6.4. Na literatura, muitas vezes encontramos definido que a topologia do espaço S (Rn )
é gerada pelas semi-normas
5 5
|∥f ∥|α,β = sup (1 + |x|)α 5D β f (x)5 < ∞ , ∀ α, β ∈ Nn0 , m ∈ N0 . (6.2.6)
x∈Rn
|β|#m
Naturalmente, as semi-normas (6.2.5) e (6.2.6) são equivalentes. Com efeito, basta provar que
as quantidades |xα | e (1 + |x|)α são comparáveis, isto é, que cada uma é limitada por uma
constante que multiplica a outra. De fato, temos que
|xα | = |xα1 1 · · · xαnn | = |x1 |α1 · · · |xn |αn = |x|α
# (1 + |x1 |)α1 · · · (1 + |xn |)αn
# (1 + |x|)α = (1 + |x1 | + · · · + |xn |)α .
Assim, ∥f ∥α,β # C1 (α)|∥f ∥|α,β . Por outro lado, note que

b
2, para |xi | # 1
1 + |xi | # .
2|xi | , para |xi | " 1
Portanto,
(1 + |x1 | + · · · + |xn |)α # C(α)2nα|x1 |α1 · · · |xn |αn = C(α)2nα |x|α = C(α)2nα |xα | .
Isto implica que |∥f ∥|α,β # C2 (α)∥f ∥α,β , em que C2 (α) = C(α)2nα. Consequentemente, isto
prova que as semi-normas ∥f ∥α,β e |∥f ∥|α,β são equivalentes.9
Uma topologia ou noção de convergência no espaço S (Rn ) é definida pelo conjunto das
semi-normas (6.2.5) ou (6.2.6). Neste caso, diz-se que uma sequência de Cauchy (fk )k∈N em
S (Rn ) converge com respeito a todas as semi-normas (6.2.5) se
5 . /5
∥fk − fℓ ∥α,β = sup 5xα D β fk (x) − D β fℓ (x) 5 < ε . (6.2.7)
x∈Rn
|β|#k
para cada ε > 0 e n0 ∈ N tal que se m, n > n0 .
Em S (Rn ) a seguinte base contável de vizinhanças de zero é introduzida:

3 1 4
n
Uαi ,βi;ε (0) = f ∈ S (R ) | ∥f ∥αi ,βi < com i, ε = 1, 2, 3, . . . .
ε
9
Na prova de alguns resultados ao longo do texto usamos indistintamente as semi-normas (6.2.5) e (6.2.6).
391
O espaço vetorial S (Rn ) torna-se um espaço métrico completo quando munido da distância
< ∥f − g∥α,β
d(f , g) = 2−(|α|+|β|) ,
α,β
1 + ∥f − g∥α,β
porém, esta métrica não provém de uma norma (veja o Exercício 6.5).
O espaço C0∞ (Rn ) é um subespaço de S (Rn ) e se fk → 0 em C0∞ (Rn ), quando k → ∞,

então, fk → 0 em S (Rn ). A inclusão, além disso, é própria: C0∞ (Rn ) " S (Rn ). Por
2
exemplo, e−∥x∥ ∈ S (Rn ) \ C0∞ (Rn ). Com efeito, nós temos o seguinte
LEMA 6.3. C0∞ (Rn ) é denso em S (Rn ), isto é, para cada ϕ ∈ S (Rn ) existe uma sequência
(fk )k∈N ⊂ C0∞ (Rn ) que converge em S (Rn ) para ϕ.
Demonstração. Seja f uma função em C0∞ (Rn ) tal que

b
1 se |xi | # 1 para i = 1, . . . , n
f (x) = .
0 se |xi | > 1 para i = 1, . . . , n
Escreva fk (x) = f ( xk ) com (k = 1, 2, . . .). Logo, se ϕ ∈ S (Rn ), a função ϕfk ∈ C0∞ (Rn ).10
Vamos mostrar que a sequência (ϕfk )k∈N converge para ϕ segundo a topologia do espaço
S (Rn ). Para isso, considere a função do tipo
b
1 se |xi | # k para i = 1, . . . , n
fk (x) = .
0 se |xi | > k para i = 1, . . . , n
Para um α ∈ Nn0 arbitrário, segue que |xα ϕ(x)| é limitada sobre todo Rn , de acordo com
a Definição 6.7. Logo, as funções |xα ϕ(x)fk (x)| são uniformemente limitadas com respeito
a k sobre todo Rn e, quando k → ∞, estas funções convergem uniformemente sobre todo
subconjunto compacto K ⊂ Rn para |xα ϕ(x)|, isto é,
5 8 95
sup 5(1 + |x|)α ϕ(x)fk (x) − ϕ(x) 5 → 0 quando k → ∞ .
x∈K⊂Rn
. /
Além disso, se 1 # |β| # m, então, D β ϕ(x)fk (x) é uma soma de termos, um dos quais é
fk (x)D β ϕ(x) e todos os outros termos, pela regra de Leibniz, sendo do tipo D κ ϕ(x)D γ fk (x),
α β n
com |κ| + |γ| = |β|. Uma vez
β
. que |x D / ϕ(x)| é limitada sobre todo R , de acordo com a
Definição 6.7, as funções D ϕ(x)fk (x) são uniformemente limitadas com respeito a k sobre
todo Rn e, quando k → ∞, estas funções convergem uniformemente sobre todo subconjunto
compacto K ⊂ Rn para |xα D β ϕ(x)|, isto é,
5 8 . / 95
sup 5(1 + |x|)α D β ϕ(x)fk (x) − D β ϕ(x) 5 → 0 quando k → ∞ .
x∈K⊂Rn
|β|#m
Isto finaliza a prova do lema.

10
Em geral, se f ∈ C0∞ (Rn ) e se ϕ é uma função infinitamente diferenciável, cujo suporte não é necessa-
riamente limitado, então, f ϕ ∈ C0∞ (Rn ) e o suporte de f ϕ está contido na interseção dos suportes de f e
ϕ.
392
Nota 6.5. Por causa do lema acima, a convergência no espaço S (Rn ) pode ser definida da
seguinte forma: se f e fk , com n ∈ N, são funções teste em C0∞ (Rn ) ou em S (Rn ), então
S
fk −→ f se, para todo α e β,
5 . /5
sup 5(1 + |x|)α D β fk (x) − D β f (x) 5 → 0 quando k → ∞ .
x∈Rn
|β|#m
DEFINIÇÃO 6.8. Diz-se que uma distribuição T ∈ S ′ (Rn ) é um funcional linear contínuo
sobre o espaço S (Rn ) se o seguinte acontece:
1. T (αf1 + βf2 ) = αT (f1 ) + βT (f2 ) , α, β ∈ C , ∀f ∈ S (Rn ),
2. limn→∞ |T (fk ) − T (f )| = 0, para toda sequência (fk )k∈N em S (Rn ).
Os elementos de S ′ (Rn ) são chamados distribuições temperadas. A totalidade das distribui-

ções temperadas forma um espaço vetorial sobre os complexos.
Nota 6.6. O termo temperado é usado para indicar que os elementos de S ′ crescem de
forma controlada quando |x| → ∞, isto é, ao se evocar o crescimento lento (ou crescimento
polinomial) no infinito. Isto significa
d que para uma função f definir uma distribuição em
S (R ) pelo mapeamento ϕ 3→ f ϕ, com ϕ ∈ S (Rn ), f deve (em adição a ser localmente
′ n
integrável) satisfazer uma condição de crescimento no infinito:

d f não deve crescer no infinito
mais rápido que um polinômio, caso contrário a integral f ϕ não estará bem definida. Assim,
podemos dizer que os elementos de S ′ (Rn ) são distribuições de crescimento polinomial
quando |x| → ∞ (veja, contudo o Exemplo 6.8 abaixo). A derivada de uma distribuição
temperada é novamente uma distribuição temperada. Isto inclui todas as funções em Lp (Rn )
para p " 1. Por isto, os elementos de S ′ (Rn ) são chamados distribuições temperadas.
D S
Como para funções em C0∞ (Rn ), a convergência fk −→ f implica a convergência fk −→ f ,
então, se T é uma distribuição temperada, a restrição de T (f ) a C0∞ (Rn ) é uma distribuição.
Se duas distribuições temperadas concordarem sobre C0∞ (Rn ), elas concordam sobre S (Rn ).
Portanto, para uma distribuição temperada T , nenhuma distinção seré feita entre o funcional
T (f ) e sua restrição a C0∞ (Rn ), e uma distribuição T será chamada de “temperada” se T (f )
tiver uma extensão a S (Rn ) que seja contínua em relação à convergência em S (Rn ).
DEFINIÇÃO 6.9. Diz-se que um funcional T ∈ S ′ (Rn ) é limitado se, e somente se, existir uma
constante C tal que |T (f )| # C∥f ∥α,β para todo f ∈ S (Rn ).
LEMA 6.4. Um funcional linear T sobre S (Rn ) é contínuo se, e somente se, ele é limitado.
Demonstração. Suponha que T seja limitado. Considere uma sequência (fk )k∈N em S (Rn )
que converge para f segundo a topologia de S . Então, ∥fk ∥α,β → ∥f ∥α,β . Portanto, |T (fk )| #
Ck ∥fk ∥α,β → |T (f )| # C∥f ∥α,β , quando k → ∞. Assim, T é contínuo. Por outro lado,
considere T contínuo. Assuma que T não seja limitado. Então, para cada k pode-se achar uma
sequência de funções (fk )k∈N tal que |T (fk )| > k∥fk ∥α,β . Portanto, |T (fk )|/(k∥fk ∥α,β ) > 1
e não tende a zero quando k → ∞, o que é uma contradição. Isto prova que T é limitado.
393
Exemplo 6.8. A função f (x)5 = ex sin (e5x ), com x ∈ R, não pode ser dominada no infinito
por um polinômio P , isto é, 5f (x)/P (x)5 → ∞, para todo x ∈ R, quando x → ∞. Contudo,
se ϕ ∈ S (R), então
5$ 5 5$ 5 5$ 5
5 5 5 5 5 . / 5
5 dx f (x)ϕ(x)5 = 5 dx ex sin (ex )ϕ(x)5 = 5 d − cos (ex ) ϕ(x)5
5 5 5 5 5 5
5$ 5
5 5
= 55 dx cos (e )ϕ (x)55
x ′
$
# dx |ϕ′ (x)|
$
1
= dx |(1 + |x|)α ϕ′ (x)|
(1 + |x|)α
$
1
# dx |(1 + |x|)α ϕ′ (x)|
(1 + ∥x∥)α
# C∥ϕ∥α,1 ,
em que (levando em conta o Lema 6.5, pg.394)
$
1
C = dx <∞,
(1 + ∥x∥)α
para α > 1. Isto estabelece que f ∈ S ′ (R).
De acordo com a Nota 6.6, o Exemplo 6.8 e o Lema 6.4, podemos caracterizar as distribuições
temperadas pelo seguinte
TEOREMA 6.1. Para uma distribuição T ∈ D5′ pertencer5 ao espaço S ′ (Rn ) é necessário que
exista um polinômio P definido em R tal que 5T /P 5 seja limitado, e suficiente se que para toda
n
ϕ ∈ S (Rn ) existe uma constante positiva C tal que T seja contínuo, isto é, |T (ϕ)| # C∥ϕ∥α,β .
TEOREMA 6.2 (Teorema de estrutura das distribuições temperadas). Seja T ∈ D ′ , tal que
T é a derivada de ordem finita de uma função contínua, g, limitada polinomialmente, isto é,
|g(x)| # CN (1 + |x|)N ,
com CN > 0, N ∈ N0 . Então, T = D β g ∈ S ′ (Rn ), em que β é um multi-índice.
Para provarmos o Teorema 6.2 precisaremos de um resultado que nos será útil em várias
ocasiões.11
H
LEMA 6.5. Uma função f definida em Rn e dependendo só de r = x21 + · · · + x2n é somável
se, e somente se, r n−1 f (r) é somável sobre (0, ∞); então
$ $ ∞
dx1 dx2 · · · dxn f (x1 , . . . , xn ) = ωn−1 dr r n−1 f (r) ,
Rn 0
n−1 n 12
ωn−1 sendo a área da esfera unitária S em R .
11
Para detalhes veja L. Schwartz, “Mathematics for the Physical Sciences,” Teorema 32, pg.39.
12
A área ωn−1 da esfera unitária S n−1 em Rn é determinada no Apêndice 6A.
394
Demonstração do Teorema 6.2. Primeiro, depois de integrações por parte, temos que mostrar a
convergência da integral
$
|β|
T (f ) = (−1) dx g(x)D β f (x) , ∀ f ∈ S (Rn ) .
Com efeito,
5$ 5 $ $
5 5 5 5 5 5
5 dx g(x)D β f (x)5 # dx 5g(x)D β f (x))5 = dx |g(x)| (1 + |x|)α 5D β f (x)5
5 5 (1 + |x|)α
$ 5 5
5(1 + |x|)α+N D β f (x)5
# CN dx
(1 + |x|)α
$ 5 5
5(1 + |x|)α+N D β f (x)5
# CN dx
(1 + ∥x∥)α
# C2 (α)∥f ∥α′,β ,
em que α′ = α + N e C2 (α) = CN C1 (α), com
$ $ ∞
1 r n−1
C1 (α) = dx = ω n−1 dr ,
(1 + ∥x∥)α 0 (1 + r)α
que é finita se, e somente se, α > n, uma vez que o integrando “grosseiramente” vai com
r −α+n−1 para r muito grande. Note que, nos argumentos de prova, usamos o fato que ∥x∥ #
|x|, segundo nossas notações definidas no início deste capítulo e também o Lema 6.5. Isso
prova a convergência da integral. Que T é contínuo segue diretamente do Lema 6.4.
Nota 6.7. Nem toda distribuição temperada é da forma descrita no Teorema 6.2. O exemplo
mais conhecido deste fato é a distribuição delta de Dirac concentrada no ponto x ∈ Rn , isto é,
δx (ϕ) = ϕ(x), em que ϕ ∈ S (Rn ).
n
Seja OM o conjunto de funções infinitamente diferenciáveis sobre Rn que junto com suas
n
derivadas são polinomialmente limitadas, isto é, f ∈ OM significa que f é de classe C ∞ , e
para cada N ∈ N0 existe uma constante positiva CN tal que
5 α 5
5D f (x)5 # CN (1 + |x|)N ,
n
quando |x| → ∞. Então, OM ⊂ S ′ (Rn ).
Note que f ϕ ∈ S (Rn ) se ϕ ∈ S (Rn ) e o mapeamento f 3→ f ϕ é contínuo e mapea

S → S.
Distribuições que são concentradas em um ponto são temperadas, e podem sempre ser
escritas como uma combinação linear finita de derivadas de δ, como mostra o
TEOREMA 6.3. Seja T ∈ S ′ (Rn ) uma distribuição que é concentrada no ponto x0 , isto é, o
suporte de T é especificado por supp T = {x0 }. Então T é uma combinação linear finita de
derivadas da função delta de Dirac,
<
T = cα D α δ (x − x0 ) , (6.2.8)
|α|#m
para m = 0, 1, 2, . . . e cα apropriados.
395
Demonstração. Sendo T um funcional linear contínuo sobre S (Rn ), existe uma constante
positiva C tal que
|T (ϕ)| # C ∥ϕ∥α,β ,
em que 5 5
∥ϕ∥α,β = sup 5xα D β ϕ(x)5 .
x∈Rn
De acordo com o teorema de Taylor, todo ϕ ∈ S (Rn ) pode ser representado por
< (x − x0 )α
ϕ (x) = D α ϕ (x0 ) + χ (x) ,
α!
|α|#m
com a função χ(x) (o resto da aproximação por polinômios de Taylor de grau m de ϕ(x)
centrada em x0 ) tendo derivadas até a ordem m igual a zero em x = x0 .
∞ n
Multiplicando essa decomposição por uma! função "η(x) ∈ C0 (R ) que é igual a 1 na
vizinhança aberta de x0 , tal que supp η ⊂ x | |x| # 1 , obtemos uma nova decomposição
< (x − x0 )α
η(x)ϕ(x) = η(x) D α ϕ(x0 ) + η(x)χ(x) .
α!
|α|#m
Pelo Lema 6.2 temos que, T (ηϕ) = T (ϕ).! Para cada k" > 0, escrevemos ηk (x) = η(kx) e
ψk (x) = η(kx)χ(x), em que supp ψk (x) ⊂ x | |x| # k1 . Então,
5 5
|T (ψk )| # C sup 5xα D β ψk (x)5 → 0 quando k → ∞ .
|x|# k1
Por outro lado, para cada k, T ηk = T , novamente usando o Lema 6.2, uma vez que ηk = 1
na vizinhança aberta de x0 . Portanto,
T (ψk ) = T (ηk χ) = T ηk (χ) = T (χ) ,
que é independente de k. Como, T (ψk ) = 0 → T (χ) = 0, então:
< ,$ (x − x0 )α
-
T (ϕ) = dx T (x) D α ϕ(x0 ) .
α!
|α|#m
Escrevendo $
(−1)|α|
cα = dx T (x)(x − x0 ) ,
α!
segue que
< < $
|α| α
T (ϕ) = (−1) cα D ϕ (x0 ) = cα dx D α δ(x − x0 )ϕ(x) .
|α|#m |α|#m
Isto completa a prova do teorema.
396
6.2.5 Relação entre os Espaços D, S e E
É quase óbvio das definições que D ⊂ S ⊂ E . Vamos mostrar que estas relações também
acontecem topologicamente. A primeira inclusão já foi provada no Lema 6.3, ao mostrarmos
que D é denso em S . No entanto, vamos provar o mesmo resultado por outro argumento.
TEOREMA 6.4. As aplicações ı e ȷ do diagrama

ı ȷ
D −→ S −→ E
são contínuas.
Demonstração. Sejam Ω ⊆ Rn um conjunto aberto não-vazio e DK (Ω) o conjunto de funções

em D(Ω) com suporte em K. Introduza para as funções em D(Ω) as semi-normas
∥ϕ∥m = sup |D αϕ(x)| .

x∈Ω
|α|#m
As restrições destas semi-normas a qualquer DK (Ω) ⊂ D(Ω) induz a mesma topologia sobre
DK (Ω) gerada pelas semi-normas
∥ϕ∥K,m = sup |D α ϕ(x)| .

x∈K
|α|#m(K)
Para provar que a aplicação ı : D(Ω) → S (Ω) é contínua, basta mostrar que ela é limitada.
Note que, para todo ϕ ∈ DK (Ω), temos que
∥ı(ϕ)∥α,β = sup (1 + |x|)α |D β ϕ(x)| = sup (1 + |x|)α |D β ϕ(x)| .

x∈Ω x∈K
|β|#m |β|#m
Logo, para todo ϕ ∈ DK (Ω), com K compacto, e α, m = 0, 1, 2, . . .,
∥ı(ϕ)∥α,β # C∥ϕ∥K,m ,
em que C = supx∈K (1 + |x|)α < ∞. Assim, a aplicação ı é limitada, e portanto contínua.
Procedemos da mesma forma para a aplicação ȷ. Tome qualquer semi-norma ∥ · ∥K,m.

Então, com ϕ ∈ S (Ω), segue que
∥ȷ(ϕ)∥K,m = sup |D β ϕ(x)| # sup (1 + |x|)α |D β ϕ(x)| = ∥(ϕ)∥α,β .

x∈K x∈K
|β|#m(K) |β|#m(K)
Isto prova que a aplicação ȷ é limitada, e portanto contínua.
As imersões contínuas acima implicam que as seguintes aplicações transpostas tı e tȷ do

diagrama
t tȷ
D ′ ←−
ı
S ′ ←− E ′
397
também são injeções contínuas. Com efeito, se quisermos considerar uma topologia em D ′ , S ′
ou E ′ , normalmente será a topologia fraca, que é a mais fraca topologia em relação ao qual
todos os mapas lineares
D ′ (Ω), S ′ (Ω) ou E ′ (Ω) ∋ u 3−→ u(ϕ) ∈ C , ϕ ∈ D(Ω), S (Ω) ou E (Ω) ,
são contínuos. Como já visto, isto significa que, por exemplo, para toda distribuição u ∈ E ′ (Ω)
e para toda ϕ ∈ E (Ω), devemos ter
|u(ϕ)| # C sup |D β ϕ(x)| .

x∈K
|β|#m(K)
Assuma que supp u ⊂ K, em que K é um conjunto compacto contido em Ω. Tome ψ ∈

DK (Ω). Então, para ϕ ∈ .E (Ω), segue / que ψϕ ∈ DK (Ω) ⊂ S (Ω). Disto segue que
(1 − ψ)ϕ ∈ E (Ω \ K) e u (1 − ψ)ϕ = 0, ou seja, u(ϕ) = u(ψϕ). Visto que ψ é uma
função infinitamente diferenciável com suporte em K, D β ψ também tem suporte em K. Assim,
usando a regra de Leibniz, obtemos
, -
β
. / < β . α / . β−α /
D ψϕ = D ψ D ϕ .
α
α#β
. /
Portanto D β ψϕ tem suporte em K. Logo,
5 . / 5
|u(ϕ)| = |u(ψϕ)| # C sup 5D β ψϕ (x)5
x∈K
|β|#m(K)
5 . / 5
#C sup (1 + |x|)α 5D β ψϕ (x)5 .
x∈K
|β|#m(K)
tȷ
Isto mostra que u é contínuo em S (Ω). Logo, a aplicação transposta S ′ ←− E ′ é contínua.
Por outro lado, se tomamos uma distribuição u ∈ S ′ (Ω) e uma ϕ ∈ DK (Ω), em que K é
uma bola fechada de raio R contida em Ω, então
|u(ϕ)| # C sup (1 + |x|)α |D β ϕ(x)| # C ′ sup |D β ϕ(x)| .

x∈K x∈K
|β|#m |β|#m
em que C ′ = C(1 + R)α . Isto mostra que u é contínuo em D(Ω). Logo, a aplicação transposta
tı
D ′ ←− S ′ é contínua. Em resumo, temos que
D :→ S :→ E :→ E ′ :→ S ′ :→ D ′ ,
em que “A :→ B” significa que A é um subconjunto denso de B e que o mapeamento de

inclusão é contínuo.
Nota 6.8. As aplicações transpostas tı e tȷ não são sobrejetivas, isto é, S ′ % D ′ e E ′ % S ′ ,
2
respectivamente. Por exemplo, as funções f (x) = ex e g(x) = ex não definem distribuições
temperadas porque elas crescem muito rápido quando x → ∞, e os elementos de S não
se anulam no infinito suficientemente rápido para controlar esses crescimentos.13 Em outras
13
Como uma regra, quanto mais “singular” for uma classe de distribuições, mais “regular” tem que ser o
correspondente conjunto de funções teste.
398
2
palavras, as funções f (x) = ex e g(x) = ex não podem ser estendidas como um funcional
contínuo de S (R) em C. Vamos mostrar isto para a função f (x) = ex . Com efeito, tome a
função Ψ ∈ C0∞ (R) tal que Ψ(x) " 0 e
⎧
⎨1 , se x ∈ [−1, 1]
Ψ(x) = .
⎩0 , se x ∈ (−∞, −2) ∪ (2, ∞)
Considere a função Ψk = e−k/2 Ψ(x/k), com k ∈ N. Logo, Ψk (x) " 0 e

⎧
⎨1 , se x ∈ [−k, k]
Ψk (x) = . (6.2.9)
⎩0 , se x ∈ (−∞, −2k) ∪ (2k, ∞)
Ψk (x)
−2k −k 0 k 2k x
Figura 6.3: Uma representação gráfica da função Ψk (x).
Observe que,
dβ α
−k/2 x d
β
e−k/2 6 x 7α dβ
xα Ψ k (x) = e Ψ(x/k) = Ψ(x/k) .
dxβ k β dxβ k β−α k dxβ
Logo, 5 5
5 α dβ 5 e−k/2
5x 5#
5 dxβ Ψ k (x) 5 k β−α ∥Ψ∥α,β , x ∈ R , α, β ∈ N0 .
Portanto, ∥Ψk ∥α,β → 0 quando k → ∞, quaisquer que sejam α, β ∈ N0 . Agora, usando (6.2.9),
segue que
$ $ 2k
x
T (Ψk ) = dx e Ψk (x) = dx ex e−k/2 Ψ(x/k)
R −2k
$ k
" dx ex e−k/2 Ψ(x/k)
−k
$ k
= dx ex e−k/2
−k
. /
= e−k/2 ek − e−k → ∞ quando k→∞.
Isto prova que f (x) = ex não pode ser estendida como um funcional contínuo de S (R) em
C. Fica a cargo do leitor mostrar que, de forma similar, o mesmo acontece para a função
2
g(x) = ex .
Por fim, note que, de acordo com o Teorema 6.2, uma função constante pertence ao espaço
S , mas não ao espaço E ′ , já que não tem suporte compacto.
′
399
6.3 Operações no Espaço de Distribuições

Neste ponto algumas operações, bem definidas para funções, são generalizadas para distri-
buições. As definições são escolhidas de tal forma a preservar seu significado clássico, isto
é, reescrevemos em linguagem distribucional o que ocorre no caso de funções e usamos o
resultado como definição.
Em geral, uma operação O sobre distribuições é definida pela seguinte relação:
OT = T ◦ O ′ ,
isto é, para cada distribuição T tem-se
(OT )(f ) = T (O ′ f ) ,
em que O ′ representa a operação adjunta sobre a função teste f .

OPERAÇÃO 6.1 (Soma de distribuições). Distribuições são somadas de acordo com a seguinte
regra:
$
(T1 + T2 )(f ) = dx (T1 (x) + T2 (x))f (x)
$ $
= dx T1 (x)f (x) + dx T2 (x)f (x)
= T1 (f ) + T2 (f ) .
OPERAÇÃO 6.2 (Multiplicação por funções). Distribuições podem ser multiplicadas por fun-
ções contínuas infinitamente diferenciáveis (muitas vezes chamadas funções suaves) de acordo
com a seguinte regra:
$
(gT )(f ) = dx (gT )(x)f (x)
$
= dx T (x)(gf )(x)
= T (gf ) .
No caso em que T ∈ S ′ , g deve ter crescimento algébrico finito no infinito.

OPERAÇÃO 6.3 (Derivada de distribuições). É possível tomar a derivada de uma distribuição
para obter uma outra distribuição. Seja T ∈ S ′ (Rn ). A derivada D β T , com β ∈ Z+ , é
definida por:
(D α T ) (f ) = (−1)|α| T (D α f (x)) . (6.3.1)
Observe que o lado direito está bem definido, pois D α f (x) também pertence a S (Rn ).
Portanto todo funcional linear em S (Rn ) possui derivadas neste sentido. Com efeito, a Eq.(6.3.1)
reflete o fato que uma distribuição é tão diferenciável quanto as funções teste correspondentes.
As mesmas conclusões acima também se aplicam aos espaços D ′ (Rn ) e E ′ (Rn ).
400
Usando o Teorema Clairaut-Schwarz e o Teorema de Fubini 14 podemos mudar a ordem de

integração para obter
$ $ , -α1 , -α2 , -αn
α ∂ ∂ ∂
(D T ) ( f ) = dx2 · · · dxn dx1 ··· T (x)f (x) .
Rn−1 R ∂x1 ∂x2 ∂xn
Integrando por partes α1 vezes, e considerando que f se anula no infinito, obtemos

$ $ , -α2 , -αn , -α1
α α1 ∂ ∂ ∂
(D T ) ( f ) = (−1) dx2 · · · dxn dx1 ··· T (x) f (x) .
Rn−1 R ∂x2 ∂xn ∂x1
A Eq.(6.3.1) segue, portanto, da integração por partes das variáveis restantes, ou seja,
$ $ , -
α |α| ∂ |α|
dx (D T ) (x) f (x) = (−1) dx T (x) f (x) .
Rn Rn ∂xα1 1 . . . ∂xαnn
Assim qualquer distribuição tem derivadas que são também distribuições.
Exemplo 6.9. Considere a função
b
0 se x < 0
f (x) = , x∈R.
x se x " 0
Note que f é contínua, mas não é diferenciável, no sentido clássico, em x = 0. Não é difícil
provar que f define uma distribuição temperada através da fórmula
$ ∞
T (ϕ) = dx xϕ(x) , ∀ ϕ ∈ S (R) .
0
Com efeito,
5$ 5 $
5 5 5 ∞ 5 ∞
5T (ϕ)5 = 5 dx xϕ(x)55 # dx |xϕ(x)| # C∥ϕ∥1,0 .
5
0 0
Logo, T é um funcional contínuo. Portanto, a função f acima define uma distribuição temperada
T ∈ S ′ (R). Além disso, f como elemento de S ′ (R) também tem derivada em S ′ (R). Com
efeito, aplicando a Definição (6.3.1) e integrando por partes, segue que
$ ∞
′ ′
T (ϕ) = (−1)T (ϕ ) = − dx xϕ′ (x)
0
5∞ $ ∞
5
= −xϕ(x)5 + dx ϕ(x)
0 0
$ ∞
= dx θ(x)ϕ(x) ,
−∞
14
O Teorema de Clairaut-Schwarz é uma condição suficiente para a igualdade das derivadas parciais cruzadas
de uma função de várias variáveis. O teorema estabelece que, se as derivadas parciais cruzadas existem e são
contínuas, então, são iguais. O nome do teorema é uma referência aos não-contemporâneos Alexis Claude de
Clairaut e Hermann Amandus Schwarz. Por sua vez, o Teorema de Fubini, provado por Guido Fubini em 1907 no
caso de uma integral dupla, é um resultado que dá condições sob as quais é possível calcular uma integral de
uma função de n-variáveis usando a integral iterada. Pode-se mudar a ordem de integração se a integral der uma
resposta finita quando o integrando for substituído por seu valor absoluto. Como consequência, podemos mudar
a ordem das integrações na integral iterada. O teorema original de Fubini implica que duas integrais iteradas são
iguais à integral dupla correspondente em seus integrantes.
401
em que θ é a função degrau de Heaviside

b
1 se x > 0
θ(x) = ,
0 se x # 0
que tem uma descontinuidade em x = 0. Apesar dessa descontinuidade, θ também tem uma
derivada em S ′ (R). De fato, sua derivada como uma distribuição é dada por:
$ ∞ 5∞
′ ′ 5
θ (f ) = −θ(f ) = − dx f ′ (x) = −f (x)5 = f (0) .
0 0
Assim, θ′ = δ, e δ também tem uma derivada em S ′ (R) (verifique!). Este exemplo nos mostra
que a “função” delta de Dirac pode ser entendida como a derivada segunda de uma função
contínua, ou a derivada primeira da função degrau de Heaviside. Do ponto de vista das funções
isso não faz muito sentido pois a função degrau não é diferenciável no zero. Mas do ponto
de vista das distribuições esse conceito é bem definido. Logo, podemos concluir que θ′ = δ
somente no sentido das distribuições.
Exemplo 6.10. Como é possível tomar a derivada de uma distribuição para obter uma outra
distribuição, consequentemente, elas podem satisfazer uma equação diferencial parcial. Neste
caso, a distribuição é chamada solução fraca. Por exemplo, dada qualquer função localmente
integrável f , faz sentido procurar soluções u da equação de Poisson somente exigindo que a
equação aconteça no sentido das distribuições, ou seja, que
$ $
dx (∇ u(x))ϕ(x) = dx f (x)ϕ(x) , ∀ ϕ ∈ S (Rn ) .
2
Logo, podemos concluir que do ponto de vista distribucional ∇2 u = f . Neste caso, u é

chamada solução fraca!
OPERAÇÃO 6.4 (Transformação de variáveis). Seja A uma matriz n × n constante, com
determinante que não se anula, e a ∈ Rn um vetor qualquer. Defina a transformação σ :
Rn → Rn da seguinte forma: σ(x) = Ax + a, para todo x ∈ Rn . Considere a aplicação
Uσ−1 : S (Rn ) → S (Rn ), com (Uσ−1 f )(x) = f (A−1 (x − a)). Então,
$ $
(Uσ T )(f ) = dx (Uσ T )(x)f (x) = dx T (Ax + a)g(x)
$
1
= dx T (x)f (A−1 (x − a))
|A|
= T (Uσ−1 f ) .
Em particular, para A = 1In×n , em que 1In×n é a matriz identidade em n dimensões, a

transformação acima descreverá uma translação por a ∈ Rn . Assim, definindo Ta (x) =
T (x + a) e f−a = f (x − a), segue que
$ $
Ta (f ) = dx T (x + a)f (x) = dx T (x)f (x − a) = T (f−a ) .
Exemplo 6.11 (Distribuições invariantes por uma transf. de Lorentz). Um ponto sobre a
variedade do espaço-tempo 4-dimensional é, geralmente, representado por xµ = (x0 , x1 , x2 , x3 ),
402
com x0 = t e x1 , x2 , x3 sendo as componentes espaciais do 4-vetor xµ . Diz-se que uma

quantidade física é covariante de Lorentz se esta transforma-se segundo uma representação do
grupo de Lorentz. Transformações desse grupo são lineares sobre os 4-vetores
x′ µ = Λµ ν xν ,
deixando a forma bilinear

F (x) = x2 = xt gx , (6.3.2)
invariante, isto é,
F (x′ ) = x′ 2 = x′ t gx′ = x t Λt gΛx = xt gx = x2 = F (x) .
Portanto,
g = Λt gΛ ,
ou mais especificamente
gαβ = gµν Λµ α Λν β , (6.3.3)
em que gµν = diag(1, −1, . . . , −1) é o tensor métrico15 que funciona como um abaixador de
índices, enquanto o tensor inverso g µν funciona como um levantador de índices.
5 5
Os vínculos det Λ = ±1 e 5Λ0 0 5 " 1 definem quatro classes de transformações desconexas
no espaço dos parâmetros. Com efeito, o determinante de um produto de matrizes é o produto
dos determinantes. Portanto, tomando o determinante de (6.3.3) obtemos
[det Λ]2 = 1 ou det Λ = ±1 .
Tomando a componente “00” de (6.3.3), segue que
g00 = gµν Λµ 0 Λν 0 = g00 Λ0 0 Λ0 0 + gii Λi 0 Λi 0 = (Λ0 0 )2 − (Λi i )2 = 1 .
ou, . 0 /2 . /2
Λ 0 = 1 + Λi i .
Portanto, . 0 /2
Λ 0 " 1 −→ Λ0 0 " 1 ; Λ0 0 # −1 .
A classe para a qual o det Λ = 1 e Λ0 0 " 1 é de fundamental importância, pois ela

define um conjunto de transformações contínuas, responsável por gerar os boosts e rotações
decorrentes de uma mudança de referencial. É o único setor que na realidade constitui por si
só um grupo, o Grupo de Lorentz Restrito, designado por SO(1, 3). Além disso, é a classe que
através da adição de transformações infinitesimais à identidade nos permite construir todas as
transformações finitas desse setor, constituindo portanto um grupo de Lie.16 Isto significa que
15
Se todos os sinais fôssem iguais, então o grupo seria o SO(4), porém, a Natureza parece não revelar uma
invariância com respeito a este grupo.
16
Grupos de Lie, são grupos de operadores unitários que têm seus elementos indexados por um conjunto de
parâmetros contínuos. Qualquer elemento do grupo que pode ser obtido da identidade por mudanças contínuas
nos parâmetros pode ser escrito como ei ωa La , em que ωa são parâmetros reais e La operadores auto-adjuntos
linearmente independentes satisfazendo a seguinte álgebra: [La , Lb ] = i Cab c Lc , com as constantes reais Cab c
sendo chamadas “constantes de estrutura do grupo.” Veja o Capítulo 9 para mais detalhes sobre grupos de Lie.
403
uma transformação de Lorentz finita é obtida através da exponenciação de seus elementos no

espaço M 1,3 : , -
1 αβ
Λ(ω) = exp ω Σαβ , (6.3.4)
2
com Σαβ = −i (xα ∂β − xβ ∂α ) sendo os geradores hermitianos do grupo de Lorentz, e ω αβ
são parâmetros infinitesimais.
O grupo de Lorentz restrito, sendo um grupo de transformações contínuas, define na vizi-

nhaça da identidade, 1ISO(1,3) , uma transformação que pode ser escrita como
Λµ ν = δ µ ν + ω µ ν + O(ω 2) . (6.3.5)
Inserindo essa expressão em (6.3.3) obtemos
gαβ = gµν Λµ α Λν β
. /
= gµν (δ µ α + ω µ α ) δ ν β + ω ν β
= gµν δ µ α δ ν β + gµν δ µ α ω ν β + gµν ω µ α δ ν β
= gαβ + ωαβ + ωβα
portanto, isso implica que ωαβ = − ωβα , isto é, os parâmetros infinitesimais ω são anti-
simétricos nos índices α e β.
O grupo de Lorentz contêm um subgrupo isomórfo ao grupo de rotações 3-dimensionais.

Esse subgrupo consiste de todos Λµν da forma
, -
1 0
Λ(R) = ,
0 R
em que R é uma matriz 3 × 3, tal que RRt = Rt R = 1I. Por exemplo, uma representação
matricial explícita de uma rotação espacial no plano x1 x2 é dada por
⎛ ⎞
1 0 0 0
⎜ 0 cos u sin u 0 ⎟
Λ(12, u) = ⎜⎝ 0 − sin u cos u 0 ⎠ .
⎟
0 0 0 1
O gerador infinitesimal Σ12 para essa rotação é definido como

5
d 5
Σ12 = Λ (12, u)55 ,
du u=0
logo,
⎛ ⎞
0 0 0 0
⎜ 0 0 1 0 ⎟
Σ12 =⎜
⎝ 0
⎟ .
−1 0 0 ⎠
0 0 0 0
404
Todos os outros geradores infinitesimais para as rotações espaciais, Σij , são obtidos de maneira
semelhante.
No caso de uma transformação de um boost, por exemplo, uma transformação na direção

x1 (o que corresponde à uma “rotação hiperbólica” no plano x0 x1 ), uma representação explícita
assume a forma
⎛ ⎞
cosh u sinh u 0 0
⎜ sinh u cosh u 0 0 ⎟
Λ(10, u) = ⎜
⎝
⎟ ,
0 0 1 0 ⎠
0 0 0 1
com o gerador infinitesimal sendo dado por

⎛ ⎞
0 1 0 0
⎜ 1 0 0 0 ⎟
Σ10 = ⎜⎝ 0
⎟ ,
0 0 0 ⎠
0 0 0 0
e com todos os outros boosts, Σi0 , obtidos da mesma maneira.
DEFINIÇÃO 6.10. Uma distribuição T (x) sobre R4n é Lorentz-invariante se

$ $
(UΛ T )(f ) = dx (UΛ T )(x)f (x) = dx T (Λx)f (x)
$
= dx T (x)f (Λ−1 x) = T (UΛ−1 f )
= T (f ) ,
para qualquer função teste f (x) e para qualquer transformação de Lorentz Λ.
Segue imediatamente da definição acima que se T (x) é Lorentz-invariante, então

$ 6 7 6 7
(UΛ T − T )(f ) = dx T (Λx) − T (x) f (x) = 0 → T (Λx) − T (x) = 0 .
Usando a representação infinitesimal Λ = 1I + 12 ωΣ + O(ω 2), então em primeira ordem em ω,

obtemos que
6 7 6 . 1 / 7 1 <n
∂
T (Λx) − T (x) = T x + ωΣx − T (x) = ω xti Σt T (x) = 0 ,
2 2 i=1 ∂xi
em que Σt significa a transposta da matriz Σ.
DEFINIÇÃO 6.10a. Uma distribuição T (x) sobre R4n é invariante sob transformações de Lorentz
infinitesimais se temos
<n
∂
xti Σt T (x1 , . . . , xn ) = 0 .
i=1
∂xi
405
A proposição abaixo é trivial, mas é de grande utilidade na teoria quântica dos campos pois
estabelece uma condição necessária e suficiente para que uma distribuição seja invariante sob
transformações de Lorentz infinitesimais.
PROPOSIÇÃO 6.3. Uma distribuição T (x) sobre R4 é invariante sob transformações de Lorentz
infinitesimais se, e somente se, ela satisfaz o sistema de equações
<n , -
0 ∂ k ∂
xi k + xi 0 T (x1 , . . . , xn ) = 0 , k = 1, 2, 3,
i=1
∂xi ∂xi
<n , -
ℓ ∂ k ∂
xi k − xi ℓ T (x1 , . . . , xn ) = 0 , 1#k<ℓ#3.
i=1
∂xi ∂xi
6.4 Distribuições como o Limite de Sequências de Funções

Existe uma forma alternativa de definir uma distribuição em termos de sequências de fun-
ções ordinárias fracamente convergentes. Este formalismo, introduzido por G. Temple,17 tem a
vantagem de enfatizar a estreita relação entre funções e distribuições. Vamos restringir nossa
discussão ao espaço S (Rn ) e ao seu dual S ′ (Rn ). Uma vez que a análise desenvolvida abaixo
é similar para os espaços D(Rn ) e E (Rn ) e seus duais D ′ (Rn ) e E ′ (Rn ), vamos abster-nos
de apresentar qualquer detalhe a mais. Com efeito, as únicas mudanças são que as sequências
de funções teste devem convergir em D(Rn ) e E (Rn ), respectivamente.
Diz-se que uma sequência de funções (fk )k∈N ⊂ C ∞ (Rn ) é fracamente convergente se o
limite $
lim dx fk (x)ϕ(x) ,
k→∞
existir para toda função teste ϕ ∈ S (Rn ) – ou mesmo qualquer função contínua limitada.
Duas sequências de funções fracamente convergentes fk e hk são equivalentes se
$
lim dx (fk (x) − hk (x))ϕ(x) → 0 .
k→∞
DEFINIÇÃO 6.11 (G. Temple). Uma distribuição temperada T , é uma classe de equivalência de
sequências de funções (fk )k∈N em S (Rn ) fracamente convergente, se o limite
$
T (ϕ) = lim dx fk (x)ϕ(x) , (6.4.1)
k→∞
existir para toda função teste ϕ(x) ∈ S (Rn ). Em outras palavras, toda distribuição temperada
pode ser aproximada, no sentido de S ′ (Rn ), por uma sequência em S ′ (Rn ) proveniente de
funções em S (Rn ).
De acordo com a definição acima, qualquer sequência (fk )k∈N da classe é dita ser uma
representação de T ∈ S ′ (Rn ), e escrevemos T ∼ (fk )k∈N . Qualquer representação particular
17
G. Temple, “The Theory of Generalized Functions,” Proc. Roy. Soc. A228 (1955) 175.
406
de uma distribuição T ∈ S ′ (Rn ) é suficiente para especificar T . Assim, as distribuições

T ∈ S ′ (Rn ) são construídas a partir de funções fk ∈ S (Rn ). Ainda, de acordo com a
Definição 6.11, o espaço S (Rn ) é fracamente denso em S ′ (Rn ), ou seja, S (Rn ) ⊂ S ′ (Rn ).
Se T1 e T2 são duas distribuições temperadas com as representações
T1 ∼ (fk )k∈N e T2 ∼ (gk )k∈N ,
então podemos definir a soma T1 + T2 pela representação (fk + gk )k∈N e o produto αT

pela representação (αfk )k∈N . Como está implícito acima, duas distribuições temperadas T1 e
T2 serão ditas serem iguais se tiverem representações equivalentes, isto é, se T1 ∼ (fk )k∈N ,
T2 ∼ (gk )k∈N e [fk − gk ](ϕ) → 0, quando k → ∞, para toda ϕ ∈ S (Rn ).
A seguir, definimos a noção importante de identidade aproximada.18 Com efeito, uma

identidade aproximada é obtida através de funções suaves com propriedades especiais, usadas na
teoria da distribuição para criar sequências de funções suaves que se aproximam de distribuições
singulares. Por exemplo, isto permite dar uma “materialidade” para a expressão simbólica
$
dx δ(x − y)ϕ(x) = ϕ(y) .
Rn
Como já enfatizado, o lado esquerdo da expressão simbólica acima não tem outro significado
além do dado pelo lado direito. Existem duas maneiras de como entender esta expressão.
Uma maneira, como já mencionado, é ampliando a definição de função como foi feito por L.
Schwartz, através da noção de distribuição (ou função generalizada). A outra forma é aproximar
a delta por funções ordinárias em algum sentido. A ideia é substituir a única “função” δ por
uma coleção de funções ordinárias {fk }k tal que para toda função ϕ ∈ S (Rn ),
$
lim dx fk (x − y)ϕ(x) = ϕ(y) .
k→∞ Rn
com o limite sendo interpretado em algum sentido. No caso da “função” δ, uma sequência de
funções admissíveis fk definirá a distribuição δ, desde que tal sequência convirja fracamente
para a “função” δ.
DEFINIÇÃO 6.12. Uma sequência de funções (fk )k∈N ⊂ C ∞ (Rn ) é chamada de Identidade
Aproximada se satisfaz as seguintes condições:
1. fk (x) " 0 , x ∈ Rn , k ∈ N ;
$
2. dx fk (x) = 1 ;
Rn
$
3. dx fk (x) → 0 , quando k → ∞ ∀ α > 0 .
|x|"α
Observe que, por definição, uma identidade aproximada é uma família de funções integráveis.
18
Na literatura matemática, as identidades aproximadas são também chamadas mollifers!
407
Nota 6.9. Por razões que ficarão óbvias logo abaixo, uma sequência de funções que satisfaz as
Condições 1, 2 e 3 da definição acima é chamada, algumas vezes, de sequência de núcleos de
Dirac.
A maneira mais “fácil” de se provar a existência de identidades aproximadas é através da

dilatação de uma única função, como mostra a seguinte
PROPOSIÇÃO 6.4. Seja f qualquer função absolutamente integrável
d – à Riemann – tal que
f (x) " 0, para todo x ∈ Dom(f ) e que satisfaz a condição Rn dx f (x) = 1. Defina fk
por uma dilatação normalizada: fk (x) = k n f (kx), com k > 0. Então, a família de funções
{fk }k>0 é uma identidade aproximada.
Demonstração. Uma vez que f (x) " 0, para todo x ∈ Dom(f ), segue que fk (x) " 0, para
todo k > 0. A seguir, aplicando a mudança de variável y = kx, obtemos que
$ $ $
n
dx fk (x) = k dx f (kx) = dy f (y) = 1 .
Rn Rn Rn
Para demonstrar a Condição 3 tudo que temos que fazer é mostrar que para todo ε > 0
(arbitrário) existem um α > 0 e um k0 , tal que para todo k > k0 temos
$
dx fk (x) < ε .
|x|"α
Sendo assim, note que

$ $ $
n
dx fk (x) = k dx f (kx) = dy f (y) .
|x|"α |x|"α |y|"kα
d
Então, considerando o fato de que a integral Rn dy f (y) é convergente, isto implica que existe
um β > 0 tal que $
dy f (y) < ε.
|y|"β
Logo, a Condição 3 é satisfeita se tomamos um k0 > β/α.

COROLÁRIO 6.2. A sequência de funções
i
α −αx2
fα (x) = e , x∈R, α>0,
π
é uma identidade aproximada.
A prova deste corolário depende do resultado estabelecido abaixo.

LEMA 6.6 (Integral gaussiana ou integral de Euler-Poisson). Para todo α > 0, x ∈ R e
k ∈ R, segue que
(i) i
$ ∞
−αx2 π
dx e = ,
−∞ α
408
(ii)
$ ∞
i , -
−αx2 ikx π 1 2
dx e e = exp − k .
−∞ α 4α
Demonstração. (i) Denotando por I(α) a integral a ser calculada, podemos escrever
,$ ∞ -2 ,$ ∞ - ,$ ∞ -
. /2 −αx2 −αx2 −αy 2
I(α) = dx e = dx e dy e ,
−∞ −∞ −∞
com a variável muda x sendo substituída por y na última integral. O produto de duas integrais
pode ser expresso como uma integral dupla:
$ ∞$ ∞
. /2 2 2
I(α) = dxdy e−α(x +y ) .
−∞ −∞
O diferencial dxdy representa um elemento de área em coordenadas cartesianas, com o domínio

de integração que se estende ao longo de todo o plano-xy. Uma representação alternativa da
última integral pode ser expressa em coordenadas polares r, θ. Os dois sistemas de coordenadas
estão relacionados por x = r cos θ, y = r sin θ, com r ∈ [0, ∞) e θ ∈ [0, 2π) de modo que
r 2 = x2 + y 2 . O elemento de área em coordenadas polares é dado por r drdθ, de modo que a
integral dupla torna-se
$ ∞ $ 2π
. /2 2
I(α) = drdθ r e−αr .
0 0
Integração sobre θ dá um fator 2π. A integral sobre r pode ser realizada facilmente após a
mudança de variável u = αr 2 , du = 2αr dr. Logo,
$ ∞ $
. /2 −αr 2 π ∞ −u π −u 55∞ π
I(α) = 2π dr r e = du e = − e 5 = .
0 α 0 α 0 α
H
Portanto, I(α) = απ . Isto prova a primeira parte do lema.
Para prova a segunda parte do lema, denote por I(k) a integral a ser calculada
$ ∞
2
I(k) = dx e−αx eikx .
−∞
Derivando sob o sinal de integral, segue que

$ ∞ $ ∞ $ ∞
′ −αx2 ∂e
ikx
−αx2 ikx i . 2/
I (k) = dx e =i dx x e e =− dx −2αx e−αx eikx .
−∞ ∂k −∞ 2α −∞
Ou seja,
$ ∞ 2 F 5∞ $ ∞ G
′ i de−αx ikx i −αx2 ikx 5 −αx2 ikx
I (k) = − dx e =− e e 5 − ik dx e e ,
2α −∞ dx 2α −∞ −∞
409
com a última igualdade sendo obtida via integração por partes. Como eikx oscila entre −1 e 1
em módulo, a contribuição do termo de fronteira é zero. Logo, I(k) satisfaz a relação:
dI(k) k
= − I(k) , k ∈ R . (6.4.2)
dk 2α
Note que, pela primeira parte do lema,
i
π
I(0) = . (6.4.3)
α
Assim, a única solução da Eq.(6.4.2), que satisfaz a Eq.(6.4.3), é
i , -
π 1 2
I(k) = exp − k .
α 4α
A prova do lema está agora completa.
Demonstração do Corolário 6.2. A Condição 1, na Definição 6.12, é evidente. A Condição 2 segue

imediatamente da parte (i) do Lema 6.6. Para provar a Condição 3, temos que provar que o
limite Fi $ −s i $ ∞ G
α −αx2 α −αx2
lim dx e + dx e =0.
α→∞ π −∞ π s
Se trocarmos x por −x na primeira integral, segue que
F i $ ∞ G
α −αx2
lim 2 dx e =0.
α→∞ π s
Usando-se a mesma técnica usada no Lema 6.6, obtemos que
i $ ∞ 6 7
α 2 2 1/2
2 dx e−αx = 2 e−αs .
π s
Consequentemente,
F i $ ∞ G 6 7
α −αx2 2 1/2
lim 2 dx e = 2 lim e−αs =0,
α→∞ π s α→∞
provando o corolário.
O Lema 6.6 pode ser generalizado para o caso em que α > 0, x ∈ Rn e k ∈ Rn , como
mostra o seguinte
COROLÁRIO 6.3. Para todo α > 0, x ∈ Rn e k ∈ Rn , segue que
(i) ,i -n
$
−α∥x∥2 π
dx e = ,
Rn α
(ii) ,i -n , -
$
−α∥x∥2 ikx π 1 2
dx e e = exp − ∥k∥ .
Rn α 4α
410
Demonstração. (i) Usando o Teorema de Fubini, segue que

$ $ ∞ $ ∞
−α∥x∥2 2 2
dx e = ··· dx1 · · · dxn e−α(x1 +···+xn )
Rn −∞ −∞
,$ ∞ - ,$ ∞ -
−αx21 −αx2n
= dx1 e ··· dxn e
−∞ −∞
,i -n
π
= .
α
(ii) Da mesma forma, segue que

$ $ ∞ $ ∞
−α∥x∥2 ikx 2 2
dx e e = ··· dx1 · · · dxn e−α(x1 +···+xn ) ei(k1 x1 +···+kn xn )
Rn −∞ −∞
,$ ∞ - ,$ ∞ -
−αx21 ik1 x1 −αx2n ikn xn
= dx1 e e ··· dxn e e
−∞ −∞
,i -n ]n , - ,i -n , -
π 1 2 π 1 2
= exp − kj = exp − ∥k∥ .
α j=1
4α α 4α
Nota 6.10. No Corolário 6.3, no item (i) se trocarmos α por (4t)−1 , com t representando o
tempo, obtemos uma família de funções
(i )n , -
def. 1 1
ft (x) = K(t, x) = exp − ∥x∥ " 0 , com t > 0 , x ∈ Rn .
2
4πt 4t
Esta família de funções é chamada núcleo do calor, pois está associada com o problema da
equação do calor.19 A família do núcleo do calor também define uma identidade aproximada.
Mais precisamente, quando tomamos o limite t → 0+ , já que
$ $
dx K(t, x) = 1 e dx K(t, x) → 0 , quando t → 0+ ∀ α > 0 .
Rn |x|"α
Neste ponto, um comentário importante se faz necessário. No Corolário 6.2 a família de

funções fα foi indexada por α ∈ N. No caso do núcleo do calor a família de funções ft é
indexada por um parâmetro t que varia continuamente. No primeiro caso, a convergência em
S deve ser entendida no sentido de uma sequência convergente (fα )α∈N , já no segundo caso,
a convergência em S deve ser entendida no sentido de um conjunto direcionado convergente
{ft }t→0 .
O próximo resultado justifica porque uma sequência de funções que satisfaz as Condições 1,
2 e 3 da Definição 6.12 é chamada, algumas vezes, de sequência de núcleos de Dirac.
19
Veja uma bela e didática apresentação deste problema no excelente texto de R. Iório Jr. e V.M. Iório, “Equações
Diferenciais Parciais: Uma Introdução,” Projeto Euclides, IMPA, 1988.
411
TEOREMA 6.5 (Sequência tipo-delta). Seja fk uma família de funções como aquela da Propo-
sição 6.4. Então, para a família transladada
. /
fk (x − a) = k n f k(x − a) ,
segue que fk (ϕ) → δa (ϕ) = ϕ(a) quando k → ∞, para toda ϕ ∈ S (Rn ).
Demonstração. Primeiro, aplicando a mudança de variável y = k(x − a), obtemos que

$ $
n
. /
fk (ϕ) = k dx f k(x − a) ϕ(x) = dy f (y)ϕ(k −1x + a) .
Rn Rn
Pela Proposição 6.4, segue que

$ $
ϕ(a) · 1 = ϕ(a) dy f (y) = dy f (y)ϕ(a) .
Rn Rn
Logo,
5$ 5 $
5 . /5 5 5
5 dy f (y) ϕ(k x + a) − ϕ(a) 55 #
−1
dy |f (y)|5ϕ(k −1 x + a) − ϕ(a)5
5
Rn Rn
$
? ?
# ?ϕ(k −1 x + a) − ϕ(a)?0,0 dy f (y)
Rn
? ? k→∞
= ?ϕ(k −1 x + a) − ϕ(a)?0,0 · 1 −→ 0 .
Portanto, o limite fraco da sequência de funções transladada fk (x−a), quando k → ∞, associa

a cada função teste ϕ ∈ S (Rn ) o número ϕ(a), o valor da função no ponto x = a. É este
funcional que tomamos como a definição da densidade δ(x − a). Assim, fk (x − a) → δ(x − a),
quando k → ∞, no sentido que para qualquer função teste ϕ ∈ S (Rn ) o resultado limite
$
n
.
k dy f k(x − a)ϕ(x) → δa (ϕ) ,
Rn
existe quando k → ∞.
Observe que
d no Exemplo 6.3 já tinhamos provado (formalmente porque assumimos, na
ocasião, que K dx δ(x − x0 ) = 1) que δ ∈ D ′ . O resultado acima prova também que δ ∈ S ′ .
Isto não é novidade, já que toda distribuição em D ′ com um suporte limitado é uma distribuição
temperada. Assim, a distribuição delta e suas derivadas estão em S ′ .
Exemplo 6.12 (Sequência de funções de Breit-Wigner). A sequência de funções
1 n
fn (x) = , x∈R, n∈N,
π 1 + n2 x2
chamada de sequência de funções de Breit-Wigner, converge fracamente para δ. Com efeito,
tome g ∈ S (R) e separe a integral
$ ∞
1 n
dx g(x) ,
−∞ π 1 + n2 x2
412
em três pedaços como abaixo

$ − √1π $ √1 $ ∞
π 1 n
+ + dx g(x) ,
−∞ − √1π √1 π 1 + n2 x2
π
√ √
assumindo que g não muda de sinal no intervalo [−1/ π, 1/ π]. A primeira e a terceira
integrais vão para zero quando n → ∞. De fato,
5$ 5 $ ∞
5 ∞ 1 n 5 1 n
5 5
5 dx g(x)5 # ∥g∥0,0 dx
5 √1 π1+n x 2 2 5 √1 π 1 + n2 x2
π π
, -
1 1 √ n→∞
= ∥g∥0,0 − arctan n −→ 0 .
2 π
Para computar a segunda integral usamos o Segundo Teorema do Valor Médio para integrais
2 2 −1
definidas.√De acordo
√ com esse teorema, como a função fn (x) = (n/π)(1 + n x ) √é contínua
√
em [−1/ π, 1/ π], para cada n, e g é integrável e não muda√de sinal
√ em [−1/ π, 1/ π],
então existe um número ξ no domínio de integração ξ ∈ [−1/ π, 1/ π] tal que
$ √1 $ √1
π 1 n π 1 n
dx g(x) = g(ξ) dx
− √1π π 1 + n2 x2 − √1π π 1 + n2 x2
2 √ n→∞ √ √
= g(ξ) arctan n −→ g(0) , (−1/ π # ξ # 1/ π) .
π
Desta forma, o limite fraco da sequência de funções de Breit-Wigner, quando n → ∞, associa
a cada função teste g ∈ S (R) o número g(0), o valor da função no ponto x = 0. Portanto,
fn → δ, quando n → ∞, no sentido que para qualquer função teste g ∈ S (R) o resultado
limite $
1 n
dx g(x) → δ(g) ,
π 1 + n2 x2
existe quando n → ∞.
Nota 6.11. Uma sequência fracamente convergente pode ser ou deixar de ser convergente se-
gundo qualquer outra noção de convergência. Por exemplo, a sequência de funções de Breit-
Wigner fn (x) = (n/π)(1 + n2 x2 )−1 converge fracamente para a distribuição δ, mas não
converge ponto-a-ponto, se tomamos x = 0
n
lim fn (0) = lim =∞.
n→∞ n→∞ π
Consequentemente, segundo o exemplo acima, não faz sentido falar sobre o valor de uma
distribuição em um determinado ponto x. Uma distribuição pode somente ser localizada em
uma vizinhança de x e ter seu valor avaliado nessa vizinhança, se a multiplicarmos por uma
função teste com suporte nessa região.
Exemplo 6.13 (Ponto material de massa 1). Vamos analisar em detalhes um outro exemplo
interessante discutido por Vladimirov20 sobre a noção idealizada de densidade criada por um
ponto material de massa unitária. Considere que este ponto material coincida com a origem de
20
V.S. Vladmirov, “Equations of Mathematical Physics,” Marcel Dekker, 1971, pg.64.
413
coordenadas. Denote por δ esta densidade. A seguir, distribua esta massa uniformente dentro
de uma esfera de raio n. Como resultado, temos que
b 1
4
πn3
se |x| < n
fn (x) = 3
.
0 se |x| > n
Assuma que a densidade δ é o ponto limite da sequência de densidades fn (x), isto é,
b
∞ se x = 0
δ(x) = lim fn (x) = . (6.4.4)
n→0
0 se x ̸= 0
Naturalmente, devemos exigir que a integral da densidade δ sobre qualquer volume V dê como
resultado a massa contida neste volume, isto é,
$ b
1 se 0 ∈ V
dx δ(x) = . (6.4.5)
V 0 se 0 ∈/V
Contudo, como já enfatizado, resultados elementares da teoria de integração mostra que as
condições (6.4.4) e (6.4.5) são contraditórias. Com efeito, por (6.4.4), δ(x) = 0 para quase todo
x (com respeito à medida de Lebesgue) e, assim, a integral de Lebesgue do lado esquerdo de
(6.4.5) é de fato sempre igual a zero. Isto claramente contradiz a condição (6.4.5). Portanto, a
contradição aqui mostra que o ponto limite da sequência fn (x), quando n → 0, não pode ser
tomado como a densidade δ(x). Vamos então calcular o limite fraco da sequência de funções
fn (x), quando n → 0, isto é, queremos mostrar que
$
lim dx fn (x)g(x) = g(0) .
n→0
De fato, levando em conta a continuidade de g(x), segue que para qualquer η > 0, existe um
n0 tal que |g(x) − g(0)| < η quando |x| < n0 . Então, para todo n # n0 , obtemos que
5,$ - 5 5$ 5
5 5 1 5 . /5
5 dx fn (x)g(x) − g(0)55 = 5 dx g(x) − g(0) 55
5 4πn3 /3 5 |x|<n
$
1 5 5
# dx 5g(x) − g(0)5
4πn3 /3 |x|<n
$
1
<η dx = η .
4πn3 /3 |x|<n
Assim, como no exemplo anterior, a sequência fn → δ, neste caso quando n → 0, no sentido
que para qualquer função contínua limitada g o resultado limite
$
dx fn (x)g(x) → δ(g) ,
é válido quando n → 0. Finalmente, para recuperar a massa completa, é necessário atuar com
o funcional (densidade) δ sobre a função constante g(x) = 1.
Nota 6.12. Se a massa m está concentrada no ponto x = 0, a correspondente densidade é
igual a mδ(x). Se a massa m está concentrada no ponto x = x0 , a correspondente densidade
é igual a mδ(x − x0 )!
414
H 2
Exemplo 6.14. A sequência de funções απ e−αx (veja a Figura ??) no Corolário 6.2 define a
distribuição-δ. Com efeito, tome ϕ ∈ S (R); então,
5F$ i G 5 5$ i >55
5
5 α −αx2 5 5
5 5 α −αx2 =
5 dx e ϕ(x) − ϕ(0)5 = 5 dx e ϕ(x) − ϕ(0) 55
R π R π
$ i
α −αx2
# sup |ϕ′ (x)| dx e |x|
x∈R R π
i F $ 0 $ ∞ G
α −αx2 −αx2
= ∥ϕ∥0,1 − dx e x+ dx e x .
π −∞ 0
Se trocarmos x por −x na primeira integral, segue que

5F$ i G 5 i F $ ∞ G
5 α 2 5 α −αx2
5 dx e−αx 5
ϕ(x) − ϕ(0)5 # ∥ϕ∥0,1 2 dx e x
5 π π
R 0
i F$ ∞ G
α −αs
= ∥ϕ∥0,1 ds e
π 0
= (απ)−1/2 ∥ϕ∥0,1 → 0 quando α→∞.
Outros exemplos de sequências de funções e conjuntos direcionados que convergem para δ

aparecem nos Exercícios 6.10 e 6.11.
6.5 Abordagem Distribucional do Espaço L2(Rn)

Quando introduzimos o espaço L2 (Rn ), na Seção 3.9, logo fomos confrontados com um
fato embaraçoso. Dissemos que, tecnicamente, afirmar que a norma L2 (Rn ) é positiva, isto
é, que ∥Ψ∥2 > 0, a não ser que Ψ = 0, não era completamente correto. Naquela altura
seria impossível expor completamente aspectos fundamentais de L2 (Rn ) sem usar a teoria
de Lebesgue. Por isso, fizemos uma discussão breve, observando, no entanto, que podemos
perfeitamente usar o espaço L2 (Rn ) sem compreender todos os detalhes técnicos. O problema
é que o espaço vetorial das funções de quadrado integrável pode conter funções não-nulas
com norma zero, isto é, ∥Ψ∥2 = ⟨Ψ, Ψ⟩ = 0 não implica, necessariamente, que Ψ = 0. Isto
contradiz um dos axiomas de um espaço normado. No entanto, isto pode ser contornado
redefinindo-se L2 (Rn ) como sendo um espaço de classes de equivalência da seguinte forma:
denote por L2 (Rn ) o conjunto Ψ : Rn → K de funções mensuráveis segundo Lebesgue que
são de quadrado integrável e por M o subespaço vetorial das funções não-nulas, Ψ ∈ L2 (Rn ),
com norma zero, ou seja,
3 $ 4
n 2
M = Ψ ∈ L2 (R ) | ∥Ψ∥2 = dx |Ψ(x)| = 0 .
Agora, considere o espaço quociente com respeito ao kernel M de todas as classes de equiva-
lência 3 4
L2 (Rn ) = L2 (Rn )/M = [Ψ] = Ψ + M | Ψ ∈ L2 (Rn ) .
415
Dizemos que duas funções de quadrado integrável, Ψ e Φ, determinam a mesma classe em

L2 (Rn ) se, e somente se, $
dx |Ψ(x) − Φ(x)|2 = 0 .
Isto implica que a diferença Ψ(x) − Φ(x) desaparece em q.t.p., isto é, Ψ(x) ∼ Φ(x). Este
conceito está fundamentado na teoria de integração de Lebesgue.
! Mais precisamente, definimos
"
n
Ψ ∼ Φ se, e somente se, Ψ = Φ em q.t.p., ou seja, [Ψ] = Φ ∈ L2 (R ) | Ψ ∼ Φ denota
uma classe de equivalência que são os elementos do espaço quociente L2 (Rn ) = L2 (Rn )/M.
Esta construção apenas formaliza o fato de que identificamos duas funções que são iguais em
q.t.p. O espaço L2 (Rn ) assim definido é um espaço vetorial com as operações de linearidade e
homogeneidade
α[Ψ] + β[Φ] = [αΨ + βΦ] , ∀ α, β ∈ C ,
enquanto que
⟨[Ψ], [Φ]⟩ = ⟨Ψ, Φ⟩ ,
com Ψ, Φ ∈ L2 (Rn ) representando suas respectivas classes de equivalência, é um produto
interno em L2 (Rn ), com ∥[Ψ]∥2 = ∥Ψ∥2 definindo uma norma em L2 (Rn ). Pode-se ve-
rificar que estes conceitos estão bem definidos, isto é, independem da escolha particular do
representante de uma classe de equivalência.
Abusando-se da notação, é comum identificarmos [Ψ] com Ψ e trabalharmos com Ψ como

se fosse uma função. Isso acaba por ser muito conveniente, e depois de alguma prática quase
nos esquecemos do fato de que esses objetos não são realmente funções, mas classe de funções
equivalentes. Talvez, a consequência mais desconcertante disso é que para Ψ ∈ L2 (Rn ) falar do
valor Ψ(x0 ) de Ψ em um único ponto x0 ∈ Rn não faz sentido. De fato, se mudarmos Ψ em
um único ponto x0 , permanecemos na mesma classe de equivalência desde que a medida do
conjunto λ({x0 }) = 0 (um conjunto de medida nula). Agora, isso é, de fato, uma reminiscência
da teoria das distribuições: funções contínuas por partes que diferem apenas em um único
ponto correspondem à mesma distribuição.21 Isso sugere que podemos interpretar as classes
de equivalência de funções iguais em q.t.p. como distribuições e, portanto, considerar L2 (Rn )
como um espaço cujos elementos são distribuições.
O principal objetivo desta seção é introduzir o espaço L2 (Rn ) como um subespaço de

S (Rn ). Isto evita qualquer referência à teoria de medida e integração de Lebesgue, normal-
′
mente necessária para tratar a teoria L2 (Rn ). Portanto, todas as integrações são entendidas no
sentido de Riemann e realizadas ao longo de todo o espaço Rn , se o domínio de integração
não for especificado de outro modo. Seguiremos a abordagem realizada por Peter Werner.22 A
essência desta abordagem é que, ao se abandonar o conhecimento das funções em conjuntos
de medida de Lebesgue zero (conjuntos de medida zero em geral não tem apelo físico), abrimos
as portas para a definição correta do espectro contínuo de um operador auto-adjunto (veja a
seção sobre o tripleto de Gel’fand).
Começamos observando que toda função Lebesgue-integrável Ψ define uma distribuição TΨ

21
O leitor vai encontrar uma discussão sobre isto no livro do A.H. Zemanian, “Distribution Theory and Transform
Analysis: An Introduction to Generalized Functions with Applications,” Dover Publications, 1987, pgs.8-10.
22
P. Werner, “A Distribution-Theoretical Approach to Certain Lebesgue and Sobolev Spaces,” J. Math. Anal. Appl.
29 (1970) 18.
416
de acordo com a teoria das distribuições da seguinte forma:

$
def.
TΨ (ϕ) = ⟨Ψ, ϕ⟩ = dx Ψ(x)ϕ(x) , para ϕ ∈ S (Ω) , (6.5.1)
em que Ω ⊆ Rn é um subconjunto aberto. A integral acima é interpretada no sentido de Lebes-

gue. No restante desta seção assumiremos que os funcionais lineares são sempre gerados como
em (6.5.1). Duas funções Lebesgue-integráveis definem o mesmo funcional linear por (6.5.1) se, e
somente se, elas diferem apenas em um conjunto de medida zero. Isso implica que (6.5.1) produz
um mapeamento linear um-para-um do espaço L2 (Ω) de todas as classes de equivalência de
funções de quadrado integrável no espaço linear S ′ (Ω) de todas as distribuições temperadas
em Ω.
Nota 6.13. Intuitivamente, os elementos de L2 (Ω) são distribuições temperadas, porque o
crescimento no infinito de cada elemento de L2 (Ω) é restrito, em certo sentido, pela integração
quadrática. Para provar isso, notamos primeiro que para Ψ ∈ L2 (Ω) a definição TΨ (ϕ) =
S
⟨Ψ, ϕ⟩ pode ser estendida para todo ϕ em S (Ω) da seguinte forma: assuma que ϕk −→ ϕ;
L2
então, ϕk −→ ϕ. Com efeito, primeiro, lembremos que se (ϕk )k∈N é uma sequência em S (Ω)
S
e ϕ ∈ S (Ω), então ϕk −→ ϕ se, e somente se, limk→∞ ∥ϕk −ϕ∥α,β = 0, para todo α, β ∈ Nn0
e a sequência (ϕk )k∈N é de Cauchy em S (Ω) se, e somente se, limk,ℓ→∞ ∥ϕk − ϕℓ ∥α,β = 0,
para todo α, β ∈ Nn0 .
A nota acima nos leva ao nosso primeiro resultado:

LEMA 6.7. A convergência em S (Ω) implica a convergência em L2 (Ω)
Demonstração. Para provar que a convergência em S (Ω) implica a convergência em L2 (Ω)

basta observar que
$
5 52
∥ϕk − ϕ∥2 = dx 5ϕk (x) − ϕ(x)5
2
$
1 5
2α 5
52
= dx (1 + |x|) ϕ k (x) − ϕ(x) 5
(1 + |x|)2α
⎡ ⎤2
,$ -
1 5 5
# dx ⎣ sup (1 + |x|)α 5ϕk (x) − ϕ(x)5⎦
(1 + |x|)2α x∈Rn
|β|#m
⎡ ⎤2
,$ -
1 5 5
# dx ⎣ sup (1 + |x|)α 5ϕk (x) − ϕ(x)5⎦ .
(1 + ∥x∥)2α x∈Rn
|β|#m
O resultado segue observando-se que a integral entre parênteses é finita (na verdade é uma
constante C(α) determinada da mesma forma como na prova do Teorema 6.2), enquanto
que o fator entre colchetes representa uma combinação linear finita de semi-normas do tipo
∥ϕk − ϕ∥α,0 . Logo, segue que
H
∥ϕk − ϕ∥2 # C(α) ∥ϕk − ϕ∥α,0 → 0 , quando k → ∞ .
417
Portanto, ϕk converge para ϕ no sentido da convergência em L2 (Ω). Em resumo, segue da

análise acima o seguinte fato: se ϕ ∈ S (Ω), então, de acordo com a Proposição 6.2, segue que
para 2γ − n + 1 > 1
$ $ 5 5 $ 5 52
5 C(γ) 52 5 1 5
2
dx |ϕ(x)| # dx 55 5 # C (γ) dx 5
2 5
Ω Ω (1 + |x|)γ 5 Ω
5 (1 + ∥x∥)γ 5
$ ∞
2 r n−1
= C (γ)ωn−1 dr <∞,
0 (1 + r)2γ
em que ωn−1 é a área da esfera unitária S n−1 em Rn .
PROPOSIÇÃO 6.5. Os espaços C0∞ (Ω) e S (Ω) são subespaços de L2 (Ω).
Demonstração. Que S (Ω) é um subespaço de L2 (Ω) segue imediatamente do lema acima.

Por sua vez, como C0∞ (Ω) ⊂ S (Ω), então, C0∞ (Ω) também é subespaço de L2 (Ω).
Pela desigualdade de Hölder (veja Lema 6.9 abaixo), segue que

5$ 5 $
5 5
5 dx Ψ(x)(ϕk (x) − ϕ(x))5 # dx |Ψ(x)||ϕk (x) − ϕ(x)|
5 5
# ∥Ψ∥2 ∥ϕk − ϕ∥2 → 0 quando k → ∞ .

Em outras palavras, TΨ (ϕk ) → TΨ (ϕ), quando k → ∞. Portanto, de acordo com a Definição
6.8, item 2, TΨ é um funcional linear contínuo sobre o espaço S (Ω). Assim, ao identificarmos
a classe de equivalência [Ψ] de Ψ com o funcional TΨ , definido por (6.5.1), L2 (Ω) pode ser
considerado como um subespaço de S ′ (Ω). Isso sugere que deve ser possível definir e discutir
as operações básicas no espaço de Hilbert L2 (Ω) usando as definições correspondentes da
teoria das distribuições.
Nós vamos nos referir ao espaço L2 (Ω) como o espaço dual do espaço linear S (Ω), agora
munido da norma
,$ -1/2
1/2 2
∥ϕ∥2 = ⟨ϕ, ϕ⟩ = dx |ϕ(x)| . (6.5.2)
De acordo com a Definição 6.11, se a sequência (ψk )k∈N em S (Ω) é de Cauchy em relação à
norma acima, então, pela desigualdade de Hölder
|⟨(ψk − ψℓ ), ϕ⟩| # ∥ψk − ψℓ ∥2 ∥ϕ∥2 → 0 ,
para toda ϕ ∈ S (Ω). Portanto, a integral
$
TΨ (ϕ) = lim dx ψk (x)ϕ(x) = lim Tψk (ϕ) , ∀ ϕ ∈ S (Ω) ,
k→∞ k→∞
define um elemento Ψ ∈ S ′ (Ω). Note que, por causa desse resultado, se Ψ, Φ ∈ S ′ (Ω) e se
as as sequências (ψk )k∈N , (ϕk )k∈N em S (Ω) são de Cauchy em relação à norma ∥ · ∥2 , então,
Ψ = Φ ⇐⇒ limk→∞ ∥ψk − ϕk ∥2 = 0. Com efeito, considere a integral
$
. /
[TΨ − TΦ ](ϕ) = lim dx ψk (x) − ϕk (x) ϕ(x) .
k→∞
418
Logo, pela desigualdade de Hölder
|[TΨ − TΦ ](ϕ)| # lim ∥ψk − ϕk ∥2 ∥ϕ∥2 .

k→∞
para toda ϕ ∈ S (Ω). Assim, TΨ = TΦ ⇐⇒ limk→∞ ∥ψk − ϕk ∥2 = 0, ou seja, Ψ = Φ ⇐⇒

limk→∞ ∥ψk − ϕk ∥2 = 0! Isto implica que, do ponto de vista distribuicional, L2 (Ω) pode ser
visto como o espaço composto pela coleção de elementos Ψ ∈ S ′ (Ω) para os quais existe uma
sequência (ψk )k∈N ⊂ S (Ω) satisfazendo
$
TΨ (ϕ) = ⟨Ψ, ϕ⟩ = lim dx ψk (x)ϕ(x) = lim Tψk (ϕ) ,
k→∞ k→∞
e
lim ∥ψk − ϕℓ ∥2 = 0 .
k,ℓ→∞
Além disso, para todo ϕ ∈ S (Ω) segue, pela desigualdade de Hölder, que |TΨ (ϕ)| #
∥Ψ∥2 ∥ϕ∥2 ; portanto, TΨ ∈ L2 (Ω) e ∥TΨ ∥ # ∥Ψ∥2 . Observe que, tomando ϕ = Ψ/∥Ψ∥2
em (6.5.1), segue que ∥TΨ ∥ = ∥Ψ∥2 . Em particular, TΨ = 0 implica que Ψ = 0. Isto mostra
que Ψ → TΨ é um mapeamento linear isométrico, um-para-um, de S (Ω) para L2 (Ω). Esta
observação nos permite identificar cada Ψ ∈ S (Ω) com um funcional linear TΨ definido por
(6.5.1). Tudo isto nos leva à seguinte
DEFINIÇÃO 6.13. L2 (Ω) é o espaço vetorial de todos os funcionais lineares a valores complexos
TΨ em S (Ω) que podem ser aproximados por sequências (ψk )k∈N ⊂ S (Ω) que são de Cauchy
em relação à norma ∥ · ∥2 , tal que
3 4
∥TΨ ∥ = sup |TΨ (ϕ)| | ϕ ∈ S (Ω), ∥ϕ∥2 = 1 < ∞ , (6.5.3)
com as operações lineares definidas como de costume por
[TΨ + TΦ ](ϕ) = TΨ (ϕ) + TΦ (ϕ) , TΨ (cϕ) = cTΨ (ϕ) .
Todo elemento de L2 (Ω) é chamado de funcional-L2 .
Assuma que Ψ, Φ ∈ L2 (Ω) e que as sequências (ψk )k∈N e (ϕk )k∈N em S (Ω) convergem
para Ψ e Φ, respectivamente, segundo a norma ∥ · ∥2 . Então, um produto interno ⟨Ψ, Φ⟩ pode
ser definido por
$
⟨Ψ, Φ⟩ = lim ⟨ψk , ϕk ⟩ = lim dx ψ k (x)ϕk (x) . (6.5.4)
k→∞ k→∞
O limite do lado direito existe uma vez que, pela desigualdade de Hölder
|⟨ψk , ϕk ⟩ − ⟨ψℓ , ϕℓ ⟩| = |⟨ψk , ϕk ⟩ − ⟨ψℓ , ϕℓ ⟩ + ⟨ψk , ϕℓ ⟩ − ⟨ψk , ϕℓ ⟩|
= |⟨ψk , (ϕk − ϕℓ )⟩ − ⟨(ψℓ − ψk ), ϕℓ ⟩|

k,ℓ→∞
# ∥ψk ∥2 ∥ϕk − ϕℓ ∥2 + ∥ψℓ − ψk ∥2 ∥ϕℓ ∥2 −→ 0 .
419
Suponha que as sequências (ψk′ )k∈N e (ϕ′k )k∈N em S (Ω) também convergem para Ψ e Φ,
respectivamente, segundo a norma ∥ · ∥2 . Então, ∥ψk − ψk′ ∥2 → 0 e ∥ϕk − ϕ′k ∥2 → 0 quando
k → ∞. Portanto,
k→∞
|⟨ψk , ϕk ⟩ − ⟨ψk′ , ϕ′k ⟩| # ∥ψk ∥2 ∥ϕk − ϕ′k ∥2 + ∥ψk − ψk′ ∥2 ∥ϕℓ ∥2 −→ 0 .
Isso mostra que o limite (6.5.4) é independente das sequências escolhidas (ψk )k∈N e (ϕk )k∈N
em S (Ω) convergindo para Ψ e Φ, respectivamente. Assim, a definição do produto interno
(6.5.4) é justificada para Ψ, Φ ∈ S (Ω).
Deve-se enfatizar que o espaço S (Ω) munido da norma ∥ · ∥2 não é completo, enquanto
que o espaço vetorial normado L2 (Ω) é completo quando munido da norma (6.5.3). Isto será
mostrado na Proposição 6.6 abaixo. Antes, provaremos o seguinte
TEOREMA 6.6. Os espaços C0∞ (Ω) e S (Ω) são densos em L2 (Ω).
Demonstração. De acordo com o Lema 6.3 e com a Nota 6.5, basta provar que C0∞ (Ω) é denso
em L2 (Ω), já que a densidade de S (Ω) em L2 (Ω) segue do fato que C0∞ (Ω) é denso em
S (Ω). Para mostrar que C0∞ (Ω) é denso em L2 (Ω), introduzimos o espaço vetorial C0∞ (Ω)
consistindo de todos os funcionais-L2 , TΨ , com a propriedade de que existe uma sequência
(ψk )k∈N em C0∞ (Ω) tal que ∥TΨ − Tψk ∥ → 0, quando k → ∞.
A seguir, vamos dividir os detalhes da prova da densidade de C0∞ (Ω) em L2 (Ω) em dois
passos:
(1) No primeiro passo mostraremos que C0∞ (Ω) é completo. Com efeito, considere uma
sequência (Φk )k∈N em C0∞ (Ω) tal que ∥TΦk − TΦℓ ∥ → 0, quando k, ℓ → ∞, isto é,
5$ 5
5 . / 5
∥TΦk − TΦℓ ∥ = sup 55 dx Φk (x) − Φℓ (x) ϕ(x)55
∥ϕ∥2 =1
= sup |⟨(Φk − Φℓ ), ϕ⟩| → 0 , quando k, ℓ → ∞ , ∀ ϕ ∈ C0∞ (Ω) .

∥ϕ∥2 =1
Pela definição de C0∞ (Ω), podemos escolher funções ψk ∈ C0∞ (Ω) tais que ∥TΦk − Tψk ∥ <
1/k para todo k. Então, pela desigualdade triangular, segue que
∥Tψk − Tψℓ ∥ = ∥Tψk − Tψℓ + TΦk − TΦk + TΦℓ − TΦℓ ∥
# ∥TΦk − Tψk ∥ + ∥TΦℓ − Tψℓ ∥ + ∥TΦk − TΦℓ ∥
1 1
< + + ∥TΦk − TΦℓ ∥ → 0 quando k, ℓ → ∞ .
k ℓ
Assim, a sequência (ψk )k∈N é convergente em L2 (Ω), já que o resultado acima implica que
5$ 5
5 . / 5
∥Tψk − Tψℓ ∥ = sup 55 dx ψk (x) − ψℓ (x) ϕ(x)55
∥ϕ∥2 =1
= sup |⟨(ψk − ψℓ ), ϕ⟩| → 0 , quando k, ℓ → ∞ , ∀ ϕ ∈ C0∞ (Ω) ,

∥ϕ∥2 =1
420
e pela desigualdade de Hölder, isto implica, necessariamente, que ∥ψk − ψℓ ∥2 → 0, quando

k, ℓ → ∞. Por outro lado, como, de acordo com o Teorema 3.18, o espaço L2 (Ω) é completo
existe uma função Ψ ∈ L2 (Ω) tal que ∥Ψ − ψk ∥2 → 0, quando k → ∞. Logo, pela definição
de C0∞ (Ω),
5$ 5
5 5
∥TΨ − Tψk ∥ = sup 55 dx (Ψ(x) − ψk (x))ϕ(x)55
∥ϕ∥2 =1
= sup |⟨(Ψ − ψk ), ϕ⟩|

∥ϕ∥2 =1
# ∥Ψ − ψk ∥2 → 0 , quando k → ∞ , ∀ ϕ ∈ C0∞ (Ω) .
Isto implica que TΨ é um funcional-L2 .
Uma segunda aplicação da desigualdade triangular produz
∥TΨ − TΦk ∥ = ∥TΨ − TΦk + Tψk − Tψk ∥
# ∥TΨ − Tψk ∥ + ∥TΦk − Tψk ∥
1
< ∥TΨ − Tψk ∥ + → 0 quando k→∞.
k
Isto prova a completeza de C0∞ (Ω).
Como C0∞ (Ω) é denso em C0∞ (Ω), o produto interno em C0∞ (Ω) definido por (6.5.4) pode
ser estendido para C0∞ (Ω). De fato, suponha que Ψ e Φ pertençam a C0∞ (Ω) e que (ψk )k∈N e
(ϕk )k∈N são sequências em C0∞ (Ω) convergindo para Ψ e Φ, respectivamente. Então, seguindo
a mesma linha de raciocínio logo abaixo da Eq.(6.5.4), mostra-se que o limite em (6.5.4) é
independente das sequências escolhidas (ψk )k∈N e (ϕk )k∈N em C0∞ (Ω) convergindo para Ψ e
Φ, respectivamente. Assim, o produto interno (6.5.4) é justificado para Ψ, Φ ∈ C0∞ (Ω). Entre
outras coisas, isto mostra que a norma (6.5.3) e o produto interno (6.5.4) estão relacionados por
∥TΨ ∥ = ⟨Ψ, Ψ⟩1/2 , ∀ Ψ ∈ C0∞ (Ω) .
(2) No segundo passo mostraremos que L2 (Ω) = C0∞ (Ω). Para isso, assuma que TΨ
pertence a L2 (Ω), isto é, que TΨ é um funcional linear limitado no espaço vetorial C0∞ (Ω)
normalizado por (6.5.2). Como C0∞ (Ω) é denso em C0∞ (Ω), TΨ pode ser estendido para um
funcional linear limitado em C0∞ (Ω) definindo
$
TΨ (Φ) = ⟨TΨ , Φ⟩ = lim ⟨TΨ , ϕk ⟩ = lim dx Ψ(x)ϕk (x) , (6.5.5)
k→∞ k→∞
em que Φ ∈ C0∞ (Ω), ϕk ∈ C0∞ (Ω) e ∥Φ − ϕk ∥2 → 0 quando k → ∞. Note que, por causa
da norma 3 4
∥TΨ ∥ = sup |TΨ (ϕ)| | ϕ ∈ C0∞ (Ω), ∥ϕ∥2 = 1 < ∞ ,
o limite em (6.5.5) existe e é independente da escolha da sequência (ϕk )k∈N convergindo para
Φ. Por outro lado, como C0∞ (Ω) é um espaço de Hilbert, o Teorema de Representação de
421
Riesz-Fréchet (Teorema 4.9) estabelece que existe um funcional UΨ ∈ C0∞ (Ω) tal que
$
UΨ (Φ) = ⟨Ψ, Φ⟩ dx Ψ(x)Φ(x) para todo Φ ∈ C0∞ (Ω) . (6.5.6)
Isto, por sua vez, implica, pela definição de C0∞ (Ω), que uma sequência ψk ∈ C0∞ (Ω) deve
gerar uma sequência de funcionais Uψk tal que ∥UΨ − Uψk ∥ → 0, quando k → ∞. Pela
continuidade do produto interno, Proposição 3.13, e por (6.5.6), obtemos que TΨ deve concordar
com UΨ para todo ϕ ∈ C0∞ (Ω), isto é,
$
TΨ (ϕ) = UΨ (ϕ) = lim ⟨ψk , ϕ⟩ = lim dx ψk (x)ϕ(x) para todo ϕ ∈ C0∞ (Ω) .
k→∞ k→∞
Portanto,
5 $ 5
5 5
∥TΨ − Uψk ∥ = sup 55TΨ (ϕ) − dx ψk (x)ϕ(x)55
∥ϕ∥=1
5 5
5 5
= sup 5 lim ⟨(ψℓ − ψk ), ϕ⟩55
5
∥ϕ∥=1 k,ℓ→∞
# lim ∥ψℓ − ψk ∥ → 0 quando k, ℓ → ∞ .

k,ℓ→∞
Isso prova que TΨ é o limite da sequência ψk ∈ C0∞ (Ω) e, portanto, pertence a C0∞ (Ω). Isto
conclui a prova do teorema.
No primeiro passo da prova do Teorema 6.6 nos assumimos que o espaço L2 (Ω) era completo
de acordo com o Teorema 3.18. De fato o espaço L2 (Ω) é completo de acordo com a topologia
gerada pela norma (6.5.3) como mostra a seguinte
PROPOSIÇÃO 6.6. Como o conjugado de uma espaço vetorial normado, o espaço dos funcionais-
L2 é completo.
Demonstração. Assuma que a sequência (ψk )k∈N ⊂ S (Ω) gera uma sequência (Tψk )k∈N de
funcionais-L2 , isto é,
$
Tψk (ϕ) = dx ψk (x)ϕ(x) ∀ ϕ ∈ S (Ω) .
Assuma também que a sequência (ψk )k∈N ⊂ S (Ω) converge para a função Ψ ∈ L2 (Ω)
segundo a norma ∥ · ∥2 e que ∥Tψk − Tψℓ ∥ → 0 quando k, ℓ → ∞, segundo a norma (6.5.3),
então o funcional TΨ definido por
TΨ (ϕ) = lim Tψk (ϕ) , ∀ ϕ ∈ S (Ω) ,

k→∞
pertence também ao espaço L2 (Ω) e satisfaz ∥TΨ − Tψk ∥ → 0 quando k → ∞, segundo a

norma (6.5.3).
Coletamos os principais resultados de nossa análise no seguinte
422
TEOREMA 6.7 (Peter Werner, Teorema 2.1). Ao identificar uma função Ψ de S (Ω) com
o funcional TΨ , definido por (6.5.1), o espaço vetorial S (Ω) munido da norma (6.5.2) está
isometricamente contido no espaço vetorial L2 (Ω) introduzido pela Definição 6.13 e munido
da norma (6.5.3). S (Ω) é um subespaço denso de L2 (Ω) com respeito à norma (6.5.3). Um
produto interno pode ser introduzido em L2 (Ω) pela fórmula (6.5.4), em que ψk , ϕk ∈ S (Ω) e
∥Ψ − ψk ∥2 → 0, Φ − ϕk ∥2 → 0 quando k → ∞. A norma (6.5.3) e o produto interno (6.5.4)
estão relacionados pela fórmula
∥TΨ ∥ = ⟨Ψ, Ψ⟩1/2 , ∀ Ψ ∈ L2 (Ω) .
O teorema acima estabelece que L2 (Ω) é o completamento do espaço com produto interno
S (Ω). Isto implica, por resultados familiares da teoria de Lebesgue, que L2 (Ω) é isométrico
ao espaço clássico de classes de equivalência de funções de quadrado integrável no sentido de
Lebesgue.
6.5.1 Alguns Conjuntos Ortonormais Completos de Distribuições L2(Rn )

na Teoria Quântica
Na mecânica quântica não existe propriedade mais importante das funções que descrevem
os possíveis estados de um sistema físico do que eles formarem um conjunto completo. Por isto,
apresentamos abaixo alguns dos conjuntos ortonormais completos de funções mais frequentes
na mecânica quântica: os polinômios de Hermite, Laguerre e Legendre. Esses polinômios são
exemplos particulares de espaços L2 . Vamos começar com a seguinte
DEFINIÇÃO 6.14. Um conjunto de funções {Ψn } é ortonormal com respeito à função peso w
sobre qualquer intervalo I = [a, b], com −∞ # a < b # ∞, se
$ b
⟨Ψm , Ψn ⟩ = dx w(x)Ψm (x)Ψn (x) = δmn ,
a
sendo que sobre o intervalo I, a função peso w é estritamente positiva, isto é, w(x) > 0, para
todo x ∈ I. Se o intervalo não é limitado, então existem duas constantes positivas α e C tais
que w(x)eα|x| # C, para todo x ∈ I.
Para os intervalos I = R, I = R+ = [0, ∞) e I = [−1, 1], vamos construir explicitamente

uma base ortonormal escolhendo uma função peso adequada. Para isto, precisaremos do
seguinte
LEMA 6.8. Assuma que o sistema de polinômios {Pk : k = 0, 1, 2, . . .} é uma base ortonormal
do espaço de Hilbert L2 (I, w(x)dx). Se Qm é um polinômio de grau m, então, ⟨Qm , Pk ⟩ = 0
para todo k > m.
Demonstração. Como {Pk : k = 0, 1, 2, . . .} é uma base ortonormal do espaço de Hilbert

L (I, w(x)dx), o polinômio Qm tem uma expansão de Fourier em relação a esta base: Qm =
;2 ∞ k
n=0 cn Pn , em que cn = ⟨Pn , Qm ⟩. Como as potências x , k = 0, 1, 2, . . ., são funções
linearmente independentes no intervalo I e como o grau de Qm é m e o de ;Pn é n, os
coeficientes cn nesta expansão devem desaparecer por n > m, ou seja, Qm = m n=0 cn Pn e,
portanto, ⟨Qm , Pk ⟩ = 0 para todo k > m.
423
2 2
6.5.1.1 Polinômios de Hermite: I = R, w(x) = e−x Evidentemente, a função w(x) = e−x
é uma função peso para a linha real (veja o gráfico da função gaussiana em 1D representado
2
na Figura 6.2). Portanto, pelo Lema 6.8, o sistema de funções wn (x) = xn e−x gera o espaço
2
de Hilbert L2 (R, e−x dx). A ortonormalização de Gram-Schmidt produz uma base ortonormal
{hn : n = 0, 1, 2, . . .}, cujos os elementos têm a forma (fórmula de Rodrigues)
2 dn −x2
hn (x) = (−1)n cn e−x e = cn Hn (x) , (6.5.7)
dxn
com constantes de normalização
. √ /−1/2
cn = 2n n! π , n = 0, 1, 2, . . .
Aqui, as funções Hn são polinômios de grau n, chamados polinômios de Hermite23 e as funções

hn são as funções de Hermite da ordem n. O sistema de funções de Hermite {hn : n =
2
0, 1, 2, . . .} é uma base ortonormal do espaço de Hilbert L2 (R, e−x dx) (veja o Exercício 6.15).
Pode-se mostrar (verifique!), usando a Eq.(6.5.7), que os polinômios de Hermite satisfazem a

relação de recorrência
Hn+1 (x) − 2xHn (x) + 2nHn−1 (x) = 0 ,
e a equação diferencial (y = Hn (x))
y ′′ − 2xy ′ + 2ny = 0 .
Na teoria quântica, estas relações mostram que as funções Hermite hn são as auto-funções
do oscilador harmônico quântico representado pelo hamiltoniano H = 12 (P 2 + X 2 ), tendo os
auto-valores n + 21 , isto é,
, -
1
Hhn (x) = n + hn (x) , n = 0, 1, 2, . . .
2
Como última observação, note que as funções Hermite pertencem ao espaço de funções teste
de Schwartz S (R).
6.5.1.2 Polinômios de Laguerre: I = R+ , w(x) = e−x Sobre a linha real positiva, a função
exponencial w(x) = e−x certamente é uma função peso. Portanto, isto nos permite definir um
sistema de funções, denominado sistema de funções de Laguerre {ℓn : n = 0, 1, 2, . . .} que
é construído através do processo de ortonormalização de Gram-Schmidt do sistema {xn e−x },
para n = 0, 1, 2, . . ., em L2 (R+ , e−x dx) para se obter uma base ortonormal. As funções de
Laguerre têm a seguinte forma (fórmula de Rodrigues):
1 x dn . −x n / 1
ℓn (x) = e n
e x = Ln (x) . (6.5.8)
n! dx n!
23
Os polinômios de Hermite foram definidos por Pierre-Simon Laplace em 1810, embora em forma um pouco
diferente, e estudados detalhadamente por Pafnuty Chebyshev em 1859. O trabalho de Chebyshev foi esquecido, e
eles foram nomeados depois de Charles Hermite por polinômios de Hermite, que escreveu sobre os polinômios em
1864, descrevendo-os como novos. Portanto, eles não eram novos, embora Hermite tenha sido o primeiro a definir
os polinômios multi-dimensionais em suas publicações posteriores de 1865.
424
Aqui, as funções Ln são polinômios de grau n, chamados polinômios de Laguerre em homena-

gem ao matemático Edmond Laguerre (1834–1886).
Pode-se mostrar (verifique!), usando a Eq.(6.5.8), que os polinômios de Laguerre de diferentes

ordens estão relacionados de acordo com a identidade
(n + 1)Ln+1 (x) + (x − 2n − 1)Ln (x) + nLn−1 (x) = 0 ,
e são soluções da equação diferencial de segunda ordem (y = Ln (x))
xy ′′ + (1 − x)y ′ + ny = 0 .
Na teoria quântica, a equação de Schrödinger para o átomo do tipo hidrogênio é exatamente

solucionada pelo método de separação de variáveis em coordenadas esféricas. A equação
diferencial acima está relacionada com a equação de Schrödinger radial para o átomo de
hidrogênio, ou seja, a parte radial da função de onda é um polinômio de Laguerre (generalizado).
6.5.1.3 Polinômios de Legendre: I = [−1, +1], w(x) = 1 Os polinômios de Legendre (em

homenagem a Adrien-Marie Legendre, que os descobriram em 1782) são um sistema de po-
linômios completos e ortogonais, com um vasto número de propriedades matematicamente e
numerosas aplicações. Eles podem ser definidos de várias maneiras, e as várias definições des-
tacam diferentes aspectos, bem como sugerem generalizações e conexões a diferentes estruturas
matemáticas e aplicações físicas.
Para qualquer intervalo finito I = [a, b], com −∞ # a < b # ∞, podemos assumir qualquer
constante positiva como uma função peso. Assim, o sistema de potências {xn : n = 0, 1, 2, . . .}
é um sistema total de funções no espaço de Hilbert L2 ([a, b], dx). Segue-se que todo elemento
Ψ ∈ L2 ([a, b], dx) é o limite de uma sequência de polinômios, na norma L2 .24
Para o caso especial do intervalo I = [−1, 1] a ortonormalização de Gram-Schmidt do

sistema de potências {xn : n = 0, 1, 2, . . .} leva a um sistema bem conhecido por polinômios
de Legendre, dado pela fórmula de Rodrigues
1 dn . 2 /n
Pn (x) = n n
x −1 , x ∈ [−1, 1] , n = 0, 1, 2, . . . (6.5.9)
2 n! dx
Os polinômios de Legendre são normalizados de acordo com a relação
$ 1
2
Pm (x)Pn (x) dx = δmn .
−1 2n + 1
Esses polinômios satisfazem uma relação de recorrência (verifique!)
(n + 1)Pn+1 (x) − (2n + 1)xPn (x) + nPn−1 (x) = 0 ,
e uma equação diferencial de segunda ordem
(1 − x2 )y ′′ − 2xy ′ + n(n + 1)y = 0 ,

24
Compare isso com o Teorema de Stone-Weierstrass, que diz que toda função contínua em no intervalo [a, b]
é o limite uniforme de uma sequência de polinômios.
425
em que y = Pn (x).
Na teoria quântica, devido a simetria esférica relacionada ao grupo de Lie SO(3), os po-
linômios de Legendre estão associados com a quantização do momento angular orbital (veja os
detalhes no Capítulo 7, Seção 9.2.2).
6.5.2 Umas Poucas Palavras sobre o Espaço Lp (Rn )
A abordagem teórico-distribucional do espaço L2 (Rn ) pode ser estendida para os espaços

Lp (Rn ). De fato, extensões para os espaços Lp (Rn ) e aplicações também foram discutidas por
Werner.25
Um espaço Lp (Rn ) pode ser definido como um espaço de funções para o qual a p-ésima
potência do valor absoluto é integrável. Mais geralmente, se 1 # p < ∞, então a função
,$ -1/p
p
∥Φ∥p = dx |Φ(x)| , ∀ Φ ∈ Lp (Rn ) , (6.5.10)
Rn
define a norma-Lp . Se Ψ é essencialmente limitada, isto é, se existe uma constante C < ∞

tal que |Ψ| # C para quase todo x, então, para p = ∞, o espaço L∞ (Rn ) é definido de tal
forma que a função
3 4
∥Φ∥∞ ≡ inf R ∋ C " 0 | |Φ(x)| # C para quase todo x = sup |Φ(x)| , (6.5.11)
x∈Rn
é a norma-L∞ .
Os espaços Lp (Rn ) formam uma “escala” útil de espaços. Podemos avaliar a utilidade de
um operador linear em análise determinando quais dos espaços Lp ele preserva.
É um fato interessante e útil que os duais dos espaços Banach Lp (Rn ) possam ser calculados,
como estabelece o seguinte
TEOREMA 6.8. Seja 1 # p < ∞. Então, o dual do espaço de Banach Lp (Rn ) é Lq ((Rn )), em
que q = p/(p − 1).
Omitiremos a prova deste resultado. Não existe uma descrição simples do dual de L∞ (Rn ).
TEOREMA 6.9. Os espaços C0∞ (Ω) e S (Ω) são densos em Lp (Rn ), 1 # p < ∞.
O prova deste teorema será omitida já que basta usar os mesmos argumentos usados na
prova do Teorema 6.6.
Duas propriedades básicas dos espaços Lp (Rn ) muito usadas ao longo destas notas são
estabelecidas no seguinte
25
P. Werner, “Bemerkungen zur Theorie der Lp -Räume,” J. Reine Angew. Math. 34 (1969) 401.
426
LEMA 6.9. Tome 1 # p, q, r # ∞, tal que p−1 + q −1 = r −1 . Se Ψ ∈ Lp (Rn ) e Φ ∈ Lq (Rn ),

então,
(i) Desigualdade de Hölder Estendida:26
∥ΨΦ∥r # ∥Ψ∥p ∥Φ∥q ;
(ii) Desigualdade de Minkowski:
∥Ψ + Φ∥p # ∥Ψ∥p + ∥Φ∥p .
Demonstração. (i) Para provar a desigualdade de Hölder, primeiro precisamos de uma outra
desigualdade elementar de W.H. Young:27
1 ap/r bq/r
ab # + para a, b " 0 .
r p q
Com efeito, se
1 1 1 1 p+q
= + =⇒ = .
r p q r pq
Disto segue que
pq
=p+q ,
r
e a partir disso obtemos que 6p 7 6q 7
−1 −1 =1 .
r r
′ ′
Defina p′ = p/r e q ′ = q/r e considere a função y = xp −1 . Então, x = y 1/(p −1) e usando a
′ ′
identidade (p′ − 1)(q ′ − 1) = 1, temos x = y q −1 . Agora vamos desenhar a curva y = xp −1 ou
′
x = y q −1 no primeiro quadrante e provar a desigualdade tipo-Young. Observe que, no gráfico
′
da Figura 6.4, a área da Região I é a área delimitada pela reta y = b e a curva y q −1 de y = 0
db ′
até y = b. Isto é, 0 dy y q −1 . Por sua vez, a área da Região II é a área delimitada pela curva
′ da ′
xp −1 de x = 0 até x = a e a reta x = a; ou seja, 0 dx xp −1 . Logo, a área do retângulo de
lados a e b representado no gráfico satisfaz a desigualdade
$ a $ b ′ ′
p′ −1 ′ ap bq ap/r bq/r
ab # dx x + dy y q −1 = + = + ,
0 0 p′ q′ p/r q/r
Portanto,
1 ap/r bq/r
ab # + ,
r p q
para a, b " 0. Isto prova a desigualdade tipo-Young.
26
A desigualdade de Hölder foi provada pela primeira vez em 1888 por L. J. Rogers. Ela foi descoberta indepen-
dentemente em 1889 por Otto Hölder. Originalmente, a desigualdade de Hölder foi provada para r = 1.
27
Assim como no caso da desigualdade de Hölder, originalmente, a desigualdade de Young foi provada para
r = 1.
427
y
′
y = xp −1
I II
a x
′ ′
Figura 6.4: O gráfico de xp −1 , y q −1 .
Continuando, vamos substituir na desigualdade tipo-Young a por |Ψ|∥Ψ∥−1 −1

p e b por |Φ|∥Φ∥q .
Isto implica que,
|Ψ(x)||Φ(x)| |Ψ(x)Φ(x)| |Ψ(x)|p/r |Φ(x)|q/r
= # p/r
+ q/r
.
r∥Ψ∥p ∥Φ∥q r∥Ψ∥p ∥Φ∥q p∥Ψ∥p q∥Φ∥q
Consequentemente, pela hipótese que Ψ, Φ ∈ Lp (Rn ), segue que
F$ , -r G1/r n$ ( )r o1/r n$ ( )r o1/r
1 |Ψ(x)Φ(x)| 1 |Ψ(x)|p/r 1 |Φ(x)|q/r
dx # dx p/r
+ dx q/r
.
r ∥Ψ∥p ∥Φ∥q p ∥Ψ∥p q ∥Φ∥q
B CD E B CD E
=1 =1
Ou seja, , -
1 ∥ΨΦ∥r 1 1 1
# + = =⇒ ∥ΨΦ∥r # ∥Ψ∥p ∥Φ∥q .
r ∥Ψ∥p ∥Φ∥q p q r
(ii) Para p = 1, a desigualdade é facilmente obtida pela desigualdade triangular. Para provar
−(p−1)
a desigualdade para p > 1, defina a função Ψ∗ = |Ψ|p−1∥Ψ∥p . Note que com esta
definição, segue que
$ $ $
∗ ∗ |Ψ(x)|p ∥Ψ∥pp
dx |Ψ(x)Ψ (x)| = dx |Ψ(x)||Ψ (x)| = dx = = ∥Ψ∥p .
∥Ψ∥p−1
p ∥Ψ∥p−1p
Além disso, considerando que 1/p + 1/q = 1 para r = 1, então, q = p/(p − 1) e

F$ G1/q n$ , p−1
-p/(p−1) o(p−1)/p
|Ψ|
∥Ψ∗ ∥q = dx |Ψ∗ (x)|q = dx =1.
∥Ψ∥p−1
p
Portanto, usando a desigualdade de Hölder com r = 1, obtemos que

$ 5.
5 /5555. /∗ 55
∥Ψ + Φ∥p = dx 5 Ψ(x) + Φ(x) 55 Ψ(x) + Φ(x) 5
$ 5. $
5 /∗ 55 5.
5 /∗ 55
= dx |Ψ(x)|5 Ψ(x) + Φ(x) 5 + dx |Φ(x)|5 Ψ(x) + Φ(x) 5
?. /∗ ? ?. /∗ ?
? ? ? ?
# ∥Ψ(x)∥p ? Ψ(x) + Φ(x) ? + ∥Φ(x)∥p ? Ψ(x) + Φ(x) ?
q q
= ∥Ψ(x)∥p + ∥Φ(x)∥p .
A prova do lema está completa.
428
Nota 6.14. O primeiro dos resultados acima é um dispositivo útil para estimar o produto interno
de duas funções. Em particular, se r = 1, então p = q = 2; neste caso a desigualdade de
Hölder é exatamente a desigualdade de Cauchy-Schwarz-Bunjakowski para integrais. O segundo
destes resultados dá uma desigualdade triangular nos espaços de Banach Lp . Se p = 2 a
desigualdade de Minkowski é igual a desigualdade triangular, já provada no caso de espaços de
Hilbert.
Em virtude das duas desigualdades discutidas acima, podemos provar a completeza dos
espaços Lp (Rn ); isto é, se (Ψn )n∈N é uma sequência de Cauchy em Lp (Rn ), então a sequência
tem um limite em Lp (Rn ) (veja o Exercício 2.13 ). Além disso, todo espaço Lp (Rn ) é localmente
convexo (verifique!).
6.6 Transformada de Fourier

A transformada de Fourier é uma das ferramentas mais poderosa na Análise Clássica e
Moderna. A transformada de Fourier generaliza a teoria das séries de Fourier para uma teoria
de funções em Rn , que conduz, em particular, a uma generalização da teoria espectral de
operadores unitários e para fluxos unitários (veja o Teorema de Stone no Capítulo 7).
6.6.1 Transformada de Fourier em L1(Rn )
Vamos iniciar nosso tratamento sobre a transformada de Fourier com a seguinte análise:
para x = (x1 , . . . , xn ) ∈ Rn e k = (k1 , . . . , pn ) ∈ Rn , denote por kx = k1 x1 + · · · + kn xn o
produto interno euclidiano; então, dada uma função f (x) : Rn → C, associe à função f (x) a
função f^(k), para todo k ∈ Rn , através da seguinte expressão:
$
8 9 def. ^
F (f ) (k) = f (k) = dx f (x)eikx . (6.6.1)
Rn
Naturalmente, na expressão acima a n-upla de números k ∈ Rn está fixa, mas ao mesmo tempo
é arbitrária. Isto nos leva ao seguinte questionamento: para quais tipos de funções f a integral
(6.6.1) está bem-definida? Resposta: para funções que são absolutamente integráveis, isto é, para
funções f ∈ L1 (Rn ).28 Com efeito, se f é absolutamente integrável, então, para toda n-upla
de números k ∈ Rn fixa, a integral imprópria
$ $ m1 $ mn
ikx
dx f (x)e = lim dx1 · · · dxn f (x1 , . . . , xn )ei(k1 x1 +···+kn xn ) ,
Rn mj ,pj →∞ p1 pn
existe, visto que para x ∈ Rn tem-se |eikx | = 1 e, portanto, todas as funções x 3→ eikx f (x),
com f ∈ L1 (Rn ), são absolutamente integráveis. Efetivamente, a hipótese de que f ∈ L1 (Rn )
garante que a integral (6.6.1) converge para cada n-upla de números k ∈ Rn e esta conver-
gência acontece porque para cada n-upla de números k ∈ Rn fixa, porém arbitrária, podemos
estabelecer uma condição de Cauchy sobre os números
$ m1 $ mn
+
sm (k) = dx1 · · · dxn f (x1 , . . . , xn )ei(k1 x1 +···+kn xn )
0 0
28
Lembre-se que L1 (Rn ) denota o espaço (de classes de equivalência) de funções mensuráveis que são absolu-
tamente integráveis.
429
e $ $
0 0
s−
m (k) = dx1 · · · dxn f (x1 , . . . , xn )ei(k1 x1 +···+kn xn )
−m1 −mn
com k fixo e mj > 0, com j = 1, . . . , n. Com efeito, se mj > pj > 0, com j = 1, . . . , n,

então
5$ m1 $ mn 5
5 5
+ +
lim |sm (k) − sp (k)| = lim 5 5 dx1 · · · dxn f (x1 , . . . , xn )ei(k1 x1 +···+kn xn ) 5
m,p→∞ mj ,pj →∞ 5
p1 pn
$ $
m1 mn 5 5
# lim dx1 · · · dxn 5f (x1 , . . . , xn )ei(k1 x1 +···+kn xn ) 5
mj ,pj →∞ p1 pn
$ m1 $ mn
# lim dx1 · · · dxn |f (x1 , . . . , xn )|
mj ,pj →∞ p1 pn
=0.
Analogamente, nós temos que limm,p→∞ |s− −

m (k) − sp (k)| = 0. Por outro lado, a propri-
edade de completeza do espaço Rn garante que existem números s+ (k) e s− (k) tais que
limm→∞ s+ + − − ^ + −
m (k) = s (k) e limm→∞ sm (k) = s (k). Assim, f (k) = s (k) + s (k).
Estes fatos nos levam imediatamente à seguinte
DEFINIÇÃO 6.15. A transformada de Fourier de uma função f ∈ L1 (Rn ) é a função f^ dada

pela integral (6.6.1).
Exemplo 6.15. Seja L1 (R) ∋ f (x) = χ[−1/2,1/2] (x), com χ[−1/2,1/2] (x) sendo a função carac-
terística associada ao intervalo [−1/2, 1/2]. Não difícil ver que f^(k) = sin(k/2)/(k/2). Este
exemplo mostra que o espaço L1 (Rn ) não é invariante sob uma transformação de Fourier.
Além disso, f tem suporte compacto, enquanto que suppf^ = R. Isto ilustra o fato que quanto
mais “concentrada” uma função é, mais “espalhada” sua transformada de Fourier será. Esta pro-
priedade chamada princípio de incerteza de Heisenberg tem consequências profundas na teoria
quântica.
Note que por causa da Eq.(6.6.1), f^(k) é limitada para toda n-upla de números k ∈ Rn .
Além disso, f^ é uniformemente contínua, como mostra a seguinte
PROPOSIÇÃO 6.7. Se f ∈ L1 (Rn ), então k 3→ f^(k) é uma função contínua e ∥f^∥∞ #

∥f ∥1 . Da mesma forma, se g^ ∈ L1 (Rn ), então x 3→ g(x) é uma função contínua e ∥g∥∞ #
(2π)−n ∥^g ∥1 .
Demonstração. Escreva
5$ 5 $
5 5 5 5 5 5
5f^(k + h) − f^(k)5 = 5 dx (e i(k+h)x
−e ikx
)f (x)55 # dx 5(ei(k+h)x − eikx )5 |f (x)|
5
Rn Rn
$ 5 i(k+h)x 5
5 (e − eikx ) 55
= |h| 5
dx 5
h 5 |f (x)| .
R n
430
Considerando que f é uma função absolutamente integrável sobre Rn e que ao integrar a

derivada da função eikx obtemos a estimativa
5 i(k+h)x 5
5 (e − eikx ) 55
5
5 h 5 # |x| ,
podemos, então, aplicar o Teorema da Convergência Dominada, usando |x||f (x)| como nossa
função dominante, para obter a estimativa
5 5
5f^(k + h) − f^(k)5 # |h||x||f (x)| → 0 quando |h| → 0 .
Portanto, f^(k) é uma função contínua.
A desigualdade declarada na proposição é imediata. Com efeito, pelas propriedades da

integral é óbvio que
$ $
5 ikx 5
^
sup |f (k)| # 5 5
dx e |f (x)| = dx |f (x)| = ∥f ∥1 .
k∈Rn Rn Rn
De forma completamente análoga, podemos mostrar que se ^ g ∈ L1 (Rn ), então x 3→ g(x) é

−n
uma função contínua e ∥g∥∞ # (2π) ∥^ g ∥1 , para qualquer x, k ∈ Rn . Portanto, faz sentido
definir a transformada de Fourier e a transformada de Fourier inversa como operadores com
valores em L∞ (Rn ).
TEOREMA 6.10 (Lema de Riemann-Lebesgue). Se f é L1 em Rn , então sua transformada de
Fourier, f^, satisfaz
$
^
f (k) = dx f (x)eikx → 0 quando |k| → ∞ .
Rn
Demonstração. Primeiro suponha que f (x) = χ(a,b) (x), a função característica de um intervalo
aberto. Então,
$ $ b
ikx eikb − eika
dx f (x)e = dx eikx = → 0 quando |k| → ∞ .
a ik
Por aditividade de limites, o mesmo vale para uma função simples arbitrária. Ou seja, para
qualquer função f da forma
n
<
f= ci χ(ai ,bi ) , ci ∈ R , ai # bi ∈ R ,
i=1
nós temos, usando o Teorema de Fubini, que cada fator pode ser calculado explicitamente,
dando como resultado $
lim dx f (x)eikx = 0 .
|k|→∞ Rn
;
Como as funções do tipo f = ni=1 ci χ(ai ,bi ) são densas em L1 (Rn ) (verifique!), vai existir
sempre uma função arbitrária g ∈ L1 (Rn ) tal que
$
dx |g(x) − f (x)| < ε ,
Rn
431
para um ε > 0 arbitrário. Pelo nosso argumento anterior e pela definição de um limite de uma
função complexa, sabemos que existe N ∈ N tal que para todo |k| > N
5$ 5
5 5
5 dx f (x)eikx 5<ε.
5 5
Rn
Logo, temos que

$ $ $
ikx
. / ikx
dx g(x)e = dx g(x) − f (x) e + dx f (x)eikx .
Rn Rn Rn
Pela desigualdade triangular para integrais, segue que

5$ 5 $ 5$ 5
5 5 5 5
5 ikx 5 5 ikx 5
5 n dx g(x)e 5 = n dx |g(x) − f (x)| + 5 dx f (x)e 5 .
R R Rn
Para todo |k| > N, o lado direito é limitado por 2ε pelos nossos argumentos anteriores. Visto
que ε é arbitrário, isto estabelece que
$
lim dx g(x)eikx = 0 .
|k|→∞ Rn
para toda função g ∈ L1 (Rn ).
6.6.2 Transformada de Fourier Inversa
Esperamos que a transformada de Fourier inversa possa ser definida pela função
$
8 −1 9 def. 1
F (f ) (x) = f (x) = n
dk f^(k)e−ikx . (6.6.2)
(2π) Rn
em que (2π)−n é um fator de normalização na transformada de Fourier inversa (veja a Nota 6.17
abaixo). No entanto, a Eq.(6.6.2) requer algumas hipóteses adicionais, uma vez que a hipótese
que f ∈ L1 (Rn ) não implica, necessariamente, que f^ ∈ L1 (Rn ). Vimos no Exemplo 6.15 que
se
f (x) = χ[−1/2,1/2] (x) então f^(k) = sin(k/2)/(k/2) ,
A função f (x) = χ[−1/2,1/2] (x) é L1 em R, mas f^(k) = sin(k/2)/(k/2) não o é; de fato a

função f^ é L2 em R (verifique!). Assim, não há razão para se esperar que a transformada de
Fourier inversa seja bem definida. Consequentemente, se f^ não é absolutamente integrável, não
está claro como podemos recuperar f de f^.
A partir da definição da transformada de Fourier (6.6.1), podemos escrever

$ $ ,$ -
^
dk f (k)e −iky
= dk dx f (x)e ikx
e−iky
Rn Rn Rn
$ ,$ -
ik(x−y)
= dx f (x) dk e .
Rn Rn
432
Aqui, trocamos a ordem de integração na integral dupla. Este cálculo formal não é válido,
estritamente falando, porque a integral
$
dk eik(x−y) , (6.6.3)
Rn
não converge para qualquer valor particular de x ou y. No entanto, este cálculo fornece um
ponto de partida para investigar (6.6.2). A ideia será introduzir um “fator de convergência” em
(6.6.3) para que a integral convirja para cada valor de x e y; isto é, escrevemos em vez de (6.6.3),
$
^
dk K(k)e ik(x−y)
, (6.6.4)
Rn
para alguma função K(x) escolhida de modo que sua transformada de Fourier, K(k), ^ force
a integral em (6.6.4) a convergir e assim a igualdade se mantém em (6.6.2) para K(x). Isto é,
queremos que
$ ,$ - $
f (y) = dx f (x) ^
dk K(k)e ik(x−y)
= dx f (x)K(x − y) . (6.6.5)
Rn Rn Rn
A última integral na expressão acima é, de fato, a convolução de f com K, um processo que

discutiremos mais a frente. Se K(x − y) é uma identidade aproximada, então, (6.6.5) nos
dá uma fórmula de inversão válida para a transformada de Fourier. Só resta escolher uma
identidade aproximada que satisfaça as condições exigidas. Existem muitas opções possíveis,
mas uma muito conveniente é a gaussiana
^ α (k) = e−α∥k∥2 ,
K com α ∈ N . (6.6.6)
Isto implica, de acordo com o Corolário 6.3, que

$ (i )n
1 −α∥k∥2 1 1 2
Kα (x − y) = dk e e−ikx = e− 4α ∥x−y∥ . (6.6.7)
(2π)n Rn 4πα
Também pelo Corolário 6.3, item (i), segue que Kα ∈ L1 (Rn ), para cada α ∈ N.
Agora, estamos em posição de provar o principal teorema desta subseção.

TEOREMA 6.11. Se f ∈ C(Rn ) ∩ L1 (Rn ), então, para todo x ∈ Rn ,
$
1
dk f^(k)e−ikx = f (x) .
(2π)n Rn
Demonstração. A partir da definição da transformada de Fourier (6.6.1), podemos escrever

$ $ , $ -
1 ^ −ikx 1 iky
n
dk f (k)e = dk n
dy f (y)e e−ikx
(2π) Rn Rn (2π) Rn
$ , $ -
1 ik(y−x)
= dy f (y) dk e ,
Rn (2π)n Rn
433
trocando a ordem de integração na integral dupla. Como já enfatizado, este cálculo formal não
é válido, estritamente falando, porque a integral
$
1
dk eik(y−x) ,
(2π)n Rn
não converge para qualquer valor particular de x ou y. No entanto, procedendo com cautela,
2
introduzimos um fator gaussiano e−α∥k∥ na integral, obtendo
$ $ $
1 ^ −α∥k∥2 −ikx 1 2
n
dk f (k)e e = n
dk dy f (y)eiky e−α∥k∥ e−ikx
(2π) Rn (2π) Rn Rn
$ , $ -
1 −α∥k∥2 ik(y−x)
= dy f (y) dk e e
Rn (2π)n Rn
$ (i )n
1 1 2
= dy f (y) e− 4α ∥y−x∥
Rn 4πα
$
= dy f (y)Kα (y − x) .
Rn
6Q 7n 1
1 2
Mas, como a sequência de funções Kα (y − x) = 4πα
e− 4α ∥y−x∥ é uma identidade
aproximada (veja a Nota 6.10), segue que
$ $
1
dk f^(k)e−α∥k∥ 2 −ikx
lim e = lim+ dy f (y)Kα(y − x) = f (x) .
α→0+ (2π)n Rn α→0 Rn
d 8 9
O limite do lado esquerdo é (2π) 1
n Rn
dk f^(k)e−ikx que é exatamente F −1 F (f ) (k). Já o
d
limite do lado direito é f (x) porque a integral Rn dy f (y)Kα (y − x) é a convolução com uma
identidade aproximada. Isto finaliza a prova do teorema.
Nota 6.15 (O uso informal da delta de Dirac). Neste ponto, pode ser interessante chamar
a atenção para um desenvolvimento formal para a transformada inversa de Fourier que é
comumente encontrado na literatura de engenharia e física teórica. Deixando a cautela de lado,
é comum encontrarmos as seguintes definições:
$ $
1 ik(x−y) ′ 1 ix(k−k ′ )
δ(x − y) = dk e e δ(k − k ) = dx e . (6.6.8)
(2π)n Rn (2π)n Rn
De acordo com essas definições, é costume afirma-se que
$ $ ,$ -
1 ^ −iky 1 ikx
dk f (k)e = dk dx f (x)e e−iky
(2π)n Rn (2π)n Rn Rn
$ ,$ -
1 ik(x−y)
= dx f (x) dk e
(2π)n Rn Rn
$
1
= dx f (x)(2π)n δ(x − y) = f (y) .
(2π)n Rn
É desnecessário dizer que essas manipulações simbólicas de modo algum constituem um ar-
gumento rigoroso. No entanto, uma prova nesse sentido ainda pode ser construída se essas
expressões simbólicas forem tratadas como distribuições!
434
Nota 6.16 (Linearidade do operador F ). Uma vez que a integração é um operador linear,
assim o é a transformada de Fourier. Isto é, se f , g ∈ L1 (Rn ) e se α, β ∈ C, então,
F (αf + βg) = αF f + βF g .
O operador F −1 também é linear.

Nota 6.17 (Diferentes definições da transformada de Fourier). A escolha do sinal do argu-
mento da função exponencial na integral (6.6.1) não é uniforme na literatura, nem mesmo a
escolha do fator de normalização (2π)−n na transformada de Fourier inversa. Por exemplo,
existem textos que usam as seguintes definições:
$ $
^
f (k) = dx f (x)e 2πikx
e f (x) = dk f^(k)e−2πikx .
Outros textos usuam ainda uma outra definição, a saber

$ $
^ 1 1
f (k) = dx f (x)eikx
e f (x) = dk f^(k)e−ikx .
(2π)n/2 (2π)n/2
Cada escolha tem alguma vantagem e alguma desvantagem, mas, independentemente da escolha
feita, seja coerente ao usá-la!
6.6.3 Transformada de Fourier em L2 (Rn)
Até agora, assumimos que uma função f deve ser L1 em Rn para que sua transformada
de Fourier seja bem definida. Como vimos, isso garante que a integral em (6.6.1) converge
absolutamente para cada n-upla de números k ∈ Rn . No entanto, a transformada de Fourier
não pode ser definida em L2 (Rn ) através da integral (6.6.1) uma vez que essa integral não faz
sentido em geral se f ∈ L2 (Rn ). Especificamente, vimos no Exemplo 6.15 que se
f (x) = χ[−1/2,1/2] (x) então f^(k) = sin(k/2)/(k/2) .
A função f (x) = χ[−1/2,1/2] (x) é L1 em R, mas f^(k) = sin(k/2)/(k/2) não o é, e para que
a igualdade seja válida em ambas as partes das integrais (6.6.1) e (6.6.2), gostaríamos de poder
fazer a afirmação de que se
f (x) = sin(x/2)/(x/2) então f^(k) = χ[−1/2,1/2] (k) ,
isto é, que
$
sin(x/2) ikx
dx e = χ[−1/2,1/2] (k) . (6.6.9)
R (x/2)
Ou seja, precisamos expandir a definição da transformada de Fourier para uma classe maior de
funções. A questão é: como interpretamos a integral em (6.6.9), uma vez que ela não converge
absolutamente? Em outras palavras, o Teorema 6.11 não cobre todos os casos que serão de
interesse para nós neste livro, já que a função f (x) = χ[−1/2,1/2] (x) é L1 em R, mas não é
contínua. Além disso, f^(k) = sin(k/2)/(k/2) é L2 em R! Portanto, o Teorema 6.11 não se
aplica. Neste caso, temos o seguinte
435
TEOREMA 6.12. Se f ∈ L1 (Rn ) ∩ L2 (Rn ) para todo x ∈ Rn e f^ ∈ L2 (Rn ) para todo k ∈ Rn ,

então, $
1
dk f^(k)e−ikx = f (x) ,
(2π)n Rn
em L2 (Rn ).
Demonstração. A prova é análoga à prova do Teorema 6.11. Só precisamos garantir que os limites
a esquerda e a direita da expressão
$ $
1 ^ −α∥k∥2 −ikx
lim dk f (k)e e = lim+ dy f (y)Kα(y − x) = f (x) .
α→0+ (2π)n Rn α→0 Rn
estão bem definidos em L2 (Rn ). Mas isto é garantido pelo seguinte fato: por hipótese, f ∈
L2 (Rn ), f^ ∈ L2 (Rn ); além disso, e−α∥k∥ ∈ S (Rn ) e e− 4α ∥y−x∥ ∈ S (Rn ). Isto implica que,
2 1 2
as convoluções f^ ∗ e−α∥k∥ ∈ S (Rn ) e f ∗ e− 4α ∥y−x∥ ∈ S (Rn ). Por outro lado, de acordo

2 1 2
com o Teorema 6.6, S (Rn ) é denso em L2 (Rn ). Logo, f^∗e−α∥k∥ → f^ e f ∗e− 4α ∥y−x∥ → f ,
2 1 2
quando α → 0+ , segundo a topologia do espaço L2 (Rn ). Com efeito, para a expressão à direita,
temos que
$
(f ∗ Kα )(x) − f (x) = dy f (y)Kα(y − x) − f (x)
Rn
(i )n $
1 1 2
= dy f (y)e− 4α ∥y−x∥ − f (x)
4πα Rn
(i )n $
1 . / 1 2
= dy f (y) − f (x) e− 4α ∥y−x∥ .
4πα Rn
1
Então, fazendo a mudança de variável √
2 α
(y − x) = z, segue que
(i )n $
1 . √ / 2
(f ∗ Kα )(x) − f (x) = dz f (x + 2 αz) − f (x) e−∥z∥ .
π Rn
Ao tomar a norma L2 da expressão acima, obtemos

⎡(i ) ⎤1/2
2n $
1 . √ / 6 2
7 2
∥f ∗ Kα − f ∥2 = ⎣ dz | f (x + 2 αz) − f (x) |2 e−∥z∥ ⎦
π Rn
n(i )n $ o
√ 1 −∥z∥2
# ∥(f (x + 2 αz) − f (x)∥2 dz e .
π Rn
B CD E
=1
Portanto, f ∗ Kα → f quando α → 0+ , como afirmado. O mesmo raciocínio se aplica ao lado

esquerdo.
436
6.6.4 Transformada de Fourier em S e S ′
Na teoria quântica a transformada de Fourier tem importantes aplicações. Por exemplo, no

caso da teoria quântica relativística, como certas propriedades dos campos são formuladas no
espaço dos momenta (como a condição espectral), espera-se que a transformada de Fourier
das funções teste f^(k) exiba as mesmas propriedades de f (x). Por isso, embora seja possível
construir uma teoria para transformada de Fourier baseda no espaço L1 (Rn ), é mais simples
e elegante usar o espaço S (Rn ), porque em Rn a situação é completamente simétrica. É
exatamente isto o que acontece com as funções teste f ∈ S (Rn ) como mostraremos a seguir.
TEOREMA 6.13. A transformada de Fourier: f → f^ mapea S (Rn ) linearmente e continu-

amente em S (Rn ). A transformada de Fourier inversa: f^ → f também mapea S (Rn )
linearmente e continuamente em S (Rn ). Além disso, a transformada de Fourier de D α f (x) é
k α f^(k), e a transformada de Fourier de xα f (x) é D α f^(k).
Demonstração. O mapeamento F : f → f^ é claramente linear. Como f (x) tende a zero,

juntamente com todas suas derivadas, mais rápido que qualquer potência de 1/|x| quando
x → ∞, podemos diferenciar formalmente f^(k) a todas as ordens sob o sinal da integral. Para
qualquer α, temos:
$
α^ |α|
D f (k) = i dx xα f (x)eikx . (6.6.10)
Portanto, f^(k) ∈ C ∞ e D α f^(k) é a transformada de Fourier de xα f (x). Integrando por partes

β + 1 vezes (6.6.10), obtemos que
5 |α|+|β|+1 $
1 . / eikx 5∞ i . α / ikx
D f^(k) =
α
x f (x) β+1 55
α
− dx D β+1
x x f (x) e .
i|β|+1 k −∞ k β+1
Os termos de fronteira são evidentemente nulos. Como h(x) = xα f (x) ∈ S (Rn ), uma vez
que f (x) ∈ S (Rn ), o mesmo deve acontecer com sua derivada de ordem β + 1, e a integral
do lado direito convergirá. Disso, segue-se imediatamente que
5 β α 5
5k D f^(k)5 # C(α, β) .
k
Logo,
5 5
lim 5k β D α f^(k)5 = 0 ,
k→±∞
Para provar a continuidade, partimos de (6.6.10), integrando por partes, β vezes, para obter:
$
. /
k D f^(k) = i|α|+|β|
β α
dx eikx Dxβ xα f (x) . (6.6.11)
437
Assim,
$
5 5 5 . /5
∥f^∥α,β = sup 5k β D α f^(k)5 # dx 5Dxβ xα f (x) 5
k∈Rn
$
(1 + |x|)γ 55 β . α /5
= dx γ
Dx x f (x) 5
(1 + |x|)
$
(1 + |x|)γ 55 β . α /5
# dx γ
Dx x f (x) 5
(1 + ∥x∥)
# Cγ ∥h∥η,β , (6.6.12)
em que h(x) = xα f (x) ∈ S (Rn ) e, de acordo com o Lema 6.5,

$
1
Cγ = dx <∞,
(1 + ∥x∥)γ
para γ > n. Que o mapeamento F : f → f^ é contínuo é uma consequência do fato que

sendo S (Rn ) um espaço semi-normado, então o operador linear F : S (Rn ) → S (Rn ) é
contínuo se, e somente se, ele é limitado. Portanto, da Eq.(6.6.12) segue que a transformada de
Fourier é um mapeamento contínuo.
Por fim, tomando α = 0 e β ̸= 0 em (6.6.11), obtemos que k β f^(k) é a transformada de

Fourier de D β f (x); por outro lado, tomando α ̸= 0 e β = 0 na mesma equação, obtemos
que D α f^(k) é a transformada de Fourier de xα f (x) o que completa a prova. A prova para a
transformada inversa de Fourier segue a mesma linha da prova acima.
Exemplo 6.16. Para x ∈ Rn , a função gaussiana f (x) = exp(− 21 ∥x∥2 ) é um ponto fixo da
transformada de Fourier; isto é, a função gaussiana é uma auto-função do operador F com
auto-valor igual a (2π)n/2 . Com efeito, basta tomar α = 1/2 na segunda parte do Corolário 6.3
para obter
, -
1
f^(k) = (2π) exp − ∥k∥
n/2 2
,
2
para k ∈ Rn . Aqui cabe a seguinte observação: de acordo com a Nota 6.17, se, por exemplo,
estivéssemos adotando a convenção da transformada de Fourier
$ $
^ 1 1
f (k) = dx f (x)eikx
e f (x) = dk f^(k)e−ikx ,
(2π)n/2 (2π)n/2
então, a função gaussiana f (x) = exp(− 12 ∥x∥2 ) seria uma auto-função do operador F com
auto-valor igual a um. Existem ainda outros auto-valores dependendo da convenção adotada!
LEMA 6.10. Sejam f , g funções em S (Rn ). Então,

$ ∞ $ ∞
dx f^(x)g(x) = dx f (x)^
g (x) .
−∞ −∞
438
Demonstração. A demonstração é imediata, uma vez que ambos os lados da expressão acima
são iguais a uma integral dupla
$ ∞ $ ∞
dx dk eikx f (k)g(x) ,
−∞ −∞
então trocando-se a ordem de integração (uma vez que o integrando é bem comportado),
chega-se ao resultado afirmado acima.
TEOREMA 6.14 (Teorema de Parseval-Plancherel). A transformada de Fourier F : S (Rn ) →
S (Rn ) estende-se de forma única a um isomorfismo isométrico
F : L2 (Rn , dx) → L2 (Rn , (2π)−n dk) .
Para f , g ∈ L2 (Rn ), segue que

$ $
1
dx f (x)g(x) = dk f^(k)^
g (k) , (6.6.13)
Rn (2π)n Rn
e ∥f ∥2 = ∥f^∥2 .
Demonstração. Tome f , g ∈ S (Rn ); então,

$ $ $
1
dx f (x)g(x) = n
dx f (x) g (k)e−ikx
dk ^
R n (2π) R n R n
$ ,$ -
1 −ikx
= dk dx f (x)e ^
g (k)
(2π)n Rn Rn
$ ,$ -
1
= dk dx f (x)eikx g^(k)
(2π)n Rn Rn
$
1
= dk f^(k)^
g (k) .
(2π)n Rn
Agora, tomando f = g, vemos que a partir da relação acima o operador F : S (Rn ) →

L2 (Rn , (2π)−n dx) é uma isometria linear do espaço S (Rn ), considerado como um subes-
paço denso de L2 (Rn , dx). Uma vez que o espaço-alvo é completo, F se estende de forma
única a um operador linear contínuo 6F : L2 (Rn7 , dx) → L2 (Rn , (2π)−n dx), que é uma
isometria. Mas, o conjunto imagem F L2 (Rn , dx) também é completo; portanto é um su-
bespaço fechado de L2 (Rn , (2π)−n dx), mas uma vez que ele contém S (Rn ), que é denso em
L2 (Rn , (2π)−n dx), deve ser igual a L2 (Rn , (2π)−n dx). A Eq.(6.6.13) estende-se por continui-
dade e ∥f ∥2 = ∥f^∥2 .
O Lema 6.10 nos permite definir diretamente a transformada de Fourier dos elementos de
S (Rn ). Se consideramos ϕ(x) como um elemento de S ′ (Rn ),29 então, é natural definir a
′
transformada de Fourier sobre S ′ (Rn ) como:

29
Lembre-se que o espaço S (Rn ) é fracamente denso em S ′ (Rn )
439
DEFINIÇÃO 6.16. A transformada de Fourier T ∈ S ′ (Rn ) é a distribuição temperada dada por

^ = T^(ϕ), para todo ϕ ∈ S (Rn ).
T (ϕ)
TEOREMA 6.15. A transformada de Fourier é um isomorfismo de S ′ (Rn ) em S ′ (Rn ).
S S
Demonstração. Se ϕn −→ ϕ; então pelo Teorema 6.13, ϕ ^ Assim, T (ϕ
^n −→ ϕ. ^n ) −→ T (ϕ)
^
′ n ^ ^ ^
para cada T ∈ S (R ). Portanto, T (ϕn ) −→ T (ϕ), isso que mostra que T é um funcional
linear contínuo sobre S (Rn ). Além disso, se Tn −→ T fracamente; então T^n −→ T^
fracamente, pois T (ϕ ^ implica que T^n (ϕ) −→ T^(ϕ), que mostra que T 3→ T^ é
^n ) −→ T (ϕ)
fracamente contínuo.
6.6.5 O Princípio da Incerteza de Heisenberg
A transformada de Fourier vista como um homeomorfismo S (Rn ) → S (Rn ) tem múl-

tiplas interpretações físicas, entre elas o princípio da incerteza de Heisenberg, da mecânica
quântica formulado em 1927 por Werner Heisenberg. O princípio estabelece que certos pares
de grandezas físicas (como a velocidade e a posição de uma partícula) não podem ser medidas
simultaneamente com precisão ilimitada.
Como já enfatizado no Capítulo 3, Seção 3.9, uma função Ψ ∈ S (R3 ), com ∥Ψ∥2 = 1,
pode descrever a distribuição de probabilidade da posição
d de uma partícula, de modo que
a probabilidade de a partícula estar em Ω ⊆ R é Ω dx |Ψ(x)|2 . Neste caso, Ψ
3 ^ dá uma
distribuição de probabilidade do momentum da partícula. Aqui o princípio de incerteza de
Heisenberg afirma que se a distribuição da posição Ψ estiver fortemente localizada em uma
^ é forçado a se “espalhar” por um grande intervalo.
posição, então a distribuição de momentum Ψ
Note que se pensarmos em Ψ ∈ L2 (R3 ), com ∥Ψ∥2 = 1, como nos ddando uma probabili-
dade de distribuição para a posição de uma partícula, então, ∥XΨ∥2 = R3 dx |x|2 |Ψ(x)|2 dá
a expectativa da distância ao quadrado em relação à origem, em que X é o operador posição.
Se essa expectativa for pequena, então, Ψ certamente está bem localizada em torno da origem.
Similarmente, ∥P Ψ∥2 mede o quanto Ψ ^ está localizada em torno do momentum zero, em que
P é o operador momentum como definido pela Eq.(4.7.5).
TEOREMA 6.16 (Princípio da incerteza). Para Ψ ∈ S (R3 ) temos que
#
∥XΨ∥2 ∥P Ψ∥2 " ∥Ψ∥22 .
2
Demonstração. Partimos observando que

, -
d
Ψ(x)Ψ(x) = x Ψ(x)Ψ(x)
dx
d6 7 6 ′
′
7
= xΨ(x)Ψ(x) − x Ψ (x)Ψ(x) + Ψ(x)Ψ (x) .
dx
440
Logo, temos
$ $
∥Ψ∥22 = 2
dx |Ψ(x)| = dx Ψ(x)Ψ(x)
R3 R3
5∞ $
5 6 ′ 7
5
= xΨ(x)Ψ(x)5 − dx x Ψ (x)Ψ(x) + Ψ(x)Ψ′ (x)
5 R3
B CD −∞E
= 0 pois Ψ ∈ S (R3 )
$ 6 ′ 7
= −2 dx xRe Ψ (x)Ψ(x) .
R3
Portanto, pela desigualdade de Cauchy-Schwarz-Bunjakowski para integrais e pela Eq.(4.7.5),

segue que
5 $ 6 ′ 755
5
2 5
∥Ψ∥2 = 5−2 dx Re Ψ (x)xΨ(x) 55 = |−2Re ⟨Ψ′, xΨ⟩|
3 R
# 2∥XΨ∥2 ∥Ψ′ ∥2
2
= ∥XΨ∥2∥P Ψ∥2 ,
#
provando o teorema.
6.7 Espaços de Sobolev

No contexto da teoria quântica, naturalmente, somos levados a procurar por soluções da
celebrada equação diferencial de Schrödinger em um espaço de funções que são de quadrado
integrável e que possuem as primeiras derivadas parciais também de quadrado integrável. As
funções em um tal espaço, conhecido como espaço de Sobolev, tipicamente representam os
estados do sistema para os quais a energia total é finita.
Um espaço de Sobolev é um espaço vetorial de funções, equipado com uma norma que é uma
combinação de normas-Lp da própria função, bem como de suas derivadas até uma determinada
ordem. As derivadas são entendidas no sentido das distribuições, o que é adequado para tornar
o espaço completo, portanto, um espaço de Banach. A importância desses espaços vem do fato
de que as soluções de equações diferenciais parciais são, naturalmente, encontradas em espaços
de Sobolev, em vez de em espaços de funções contínuas e com as derivadas entendidas no
sentido clássico.
Apesar do espaço L2 (Rn ) não ser fechado em relação à diferenciação (convidamos o leitor
a dar um exemplo), nesta seção estaremos interessados nos espaços de Sobolev com p = 2,
isto é, consideraremos espaços lineares consistindo de funcionais-L2 com a propriedade de
que suas derivadas até uma determinada ordem também são funcionais-L2 . Estes espaços são
especialmente importantes para teoria quântica devido à sua relação com a transformada de
Fourier e porque eles formam um espaço de Hilbert.
441
DEFINIÇÃO 6.17. Seja s um número real arbitrário. Define-se o espaço de Sobolev Hs (Rn )
de ordem s como sendo o espaço de todas as distribuições u ∈ S ′ (Rn ) cuja transformada de
^ é uma função de quadrado integrável com respeito à medida (2π)−n (1 + |k|2 )s/2 dk,
Fourier u
isto é,
3 4
s n ′ n 2 s/2 n
H (R ) = u ∈ S (R ) | (1 + |k| ) u ^ ∈ L2 (R ) . (6.7.1)
Na Eq.(6.7.1) o produto (1 + |k|2 )s/2 u

^ deve ser entendido no sentido das distribuições; ou
seja, 8 9 . /
(1 + |k|2 )s/2 u ^ (1 + |k|2 )s/2 ϕ , ∀ ϕ(k) ∈ S (Rn ) .
^ (ϕ) = u
^ = (1 + |k|2)−s/2 ^
Isto significa que u v, com ^v ∈ L2 (Rn , (2π)−n dk). Assim, o espaço Hs (Rn )
pode ser equipado com o produto interno
$
1
⟨u, v⟩Hs (Rn ) = dk (1 + |k|2)s u
^(k ′ )^
v (k) ,
(2π)n Rn
que induz a norma
, $ -1/2
1 2 s 2
∥u∥Hs (Rn ) = dk (1 + |k| ) |^
u(k)| <∞.
(2π)n Rn
Em particular, H0 (Rn ) = L2 (Rn ). Isto, imediatamente, implica o seguinte

COROLÁRIO 6.4 (Versão do Teorema de Parseval-Plancherel). Se u ∈ H0 , então u
^ ∈ H0 .
Obviamente, da Eq.(6.7.1) fica claro que o espaço Hs (Rn ) decresce à medida que s cresce.
′
Com efeito, se s′ " s, então, (1 + |k|2 )s/2 # (1 + |k|2 )s /2 e se u ∈ Hs (Rn ), segue que
, $ -1/2
1 2 s 2
∥u∥Hs (Rn ) = dk (1 + |k| ) |^ u(k)|
(2π)n Rn
, $ -1/2
1 2 s′ 2
# dk (1 + |k| ) |^
u(k)| = ∥u∥ <∞ .
(2π)n Rn
′
Hs (Rn )
Assim, se a sequência un → 0 segundo a norma ∥ · ∥Hs (Rn ) e visto que ∥ · ∥Hs (Rn ) # ∥ · ∥Hs′ (Rn ) ,
′
quando s < s′ , isto implica que ∥un ∥Hs′ (Rn ) → 0. Isto prova que Hs (Rn ) ⊆ Hs (Rn ), se
s′ " s. Em particular, os elementos de Hs (Rn ), com s " 0, são funções de quadrado integrável
uma vez que Hs (Rn ) ⊆ H0 (Rn ) = L2 (Rn ). Mas cuidado! Se s < 0, não é sempre verdade
que os elementos de Hs (Rn ) são funções de quadrado integrável (veja o Exercício 6.21).
Nota 6.18. Poderíamos ter definido Hs (Rn ) da seguinte forma:
3 4
Hs (Rn ) = u ∈ S ′ (Rn ) | (1 + ∥k∥2 )s/2 u
^ ∈ L2 (Rn ) , (6.7.2)
e a norma ∥u∥Hs (Rn ) como

, $ -1/2
1 2 s 2
∥|u|∥Hs (Rn ) = dk (1 + ∥k∥ ) |^
u(k)| <∞.
(2π)n Rn
442
As normas ∥u∥Hs (Rn ) e ∥|u|∥Hs (Rn ) são equivalentes. Com efeito, como ∥k∥2 # |k|2 , então
(1 + ∥k∥2 ) # (1 + |k|2 ); logo
$ $
2 s 2
dk (1 + ∥k∥ ) |^ u(k)| # dk (1 + |k|2 )s |^
u(k)|2 ,
Rn Rn
Assim, existe uma constante C1 tal que ∥|u|∥Hs (Rn ) # C1 ∥u∥Hs (Rn ) . Por outro lado, pelo
Teorema Binomial,
s
< s
<
2 s 2α
(1 + |k| ) = Cα |k| # Cα (1 + ∥k∥2 )α .
α=0 α=0
Isto implica que

$ s
< $
2 s 2
u(k)| #
dk (1 + |k| ) |^ Cα dk (1 + ∥k∥2 )α |^
u(k)|2 .
Rn α=0 Rn
Consequentemente, existe uma constante C2 tal que ∥u∥Hs (Rn ) # C2 ∥|u|∥Hs (Rn ) . Portanto,
ambas definições de Hs (Rn ) são equivalentes. Assim, ao longo do texto usamos indistintamente
as definições acima.
Nós também podemos descrever o espaço Hs (Rn ) sem fazer qualquer referência à u^. De
2 s 2 2 s 2 s 2
fato, se ;
expandirmos (1 + ∥k∥ ) = (1 + k1 + · · · + kn ) , ou (1 + |k| ) = (1 + k1 + · · · +
kn + 2 i̸=j ki kj )s , então
2
, $ -1/2
1 2 s 2
∥|u|∥Hs (Rn ) = dk (1 + ∥k∥ ) |^
u(k)|
(2π)n Rn
, $ -1/2
1 2 2 s 2
= dk (1 + k1 + · · · + kn ) |^
u(k)| (6.7.3)
(2π)n Rn
< ? ?
= cα ?D α u?L2 (Rn ) < ∞ ,
|α|#s
ou
, $ -1/2
1 2 s 2
∥u∥Hs (Rn ) = dk (1 + |k| ) |^
u(k)|
(2π)n Rn
( $ )1/2
1 6 < 7s
= dk 1 + k12 + · · · + kn2 + 2 ki kj |û(k)|2 (6.7.4)
(2π)n Rn i̸=j
< ? ?
= dα ?D α u?L2 (Rn ) < ∞ ,
|α|#s
em que cα e dα são coeficientes polinomiais. Assim, Hs (Rn ) é o espaço de toda função

u ∈ L2 (Rn ) tal que D α u ∈ L2 (Rn ) quando |α| # s.
443
Para u, v ∈ Hs (Rn ) defina um produto interno por

<
⟨u, v⟩Hs (Rn ) = ⟨D α u, D α v⟩L2 (Rn ) , (6.7.5)
|α|#s
com a norma relacionada dada por

⎛ ⎞1/2
<? ?
|||u|||Hs (Rn ) = ⟨u, u⟩1/2 =⎝ ? D α u? ⎠ .
Hs (Rn ) L2 (Rn )
|α|#s
TEOREMA 6.17. Seja s ∈ N. Então, u ∈ Hs (Rn ) se, e somente se, D α u ∈ L2 (Rn ) para todo
multi-índice α tal que |α| # s, com as derivadas sendo calculadas no sentido das distribuições.
Demonstração. Basta mostrar que as normas ∥ · ∥Hs (Rn ) e ∥| · |∥Hs (Rn ) são equivalentes à norma
||| · |||Hs (Rn ) . Da relação (6.7.3), segue que para u ∈ Hs (Rn ) existe um c > 0 tal que
∥u∥Hs (Rn ) # c|||u|||Hs (Rn ) . Por outro lado, pela Definição 6.16 segue que, se u ∈ S ′ (Rn ),
então
D α u(ϕ)
^ = (−i)|α| k α u
^(ϕ) ∀ ϕ ∈ S (Rn ) .
Considerando que,
|k α | = |k1α1 · · · km
α1
| # (1 + |k|2 )α1 /2 · · · (1 + |k|2 )αm /2 # (1 + |k|2 )|α|/2 ,
então, se u ∈ Hs (Rn ) e |α| # s, segue que
$ $
α 2
dk |k u^(k)| # dk | # (1 + |k|2 )|α| |^
u(k)|2
Rn Rn
$
# dk | # (1 + |k|2 )s |^
u(k)|2 < ∞ ,
Rn
e existe uma constante C > 0 tal que |||u|||Hs (Rn ) # C∥u∥Hs (Rn ) . Logo, as normas ∥ · ∥Hs (Rn )
e ||| · |||Hs (Rn ) são equivalentes. A equivalência entres as normas ∥| ·
|Hs (Rn ) e ||| · |||Hs (Rn ) é provada de forma análoga.
Exemplo 6.17. Seja ∇2 o laplaciano em Rn . Pela Operação 6.3 segue que, se u ∈ S ′ (Rn ),
então
−∇2 u(ϕ) = −u(∇2 ϕ) ∀ ϕ ∈ S (Rn ) .
Além disso, pela Definição 6.16 segue que, se u ∈ S ′ (Rn ), então
−∇2 u(ϕ)
^ = ∥k∥2 u
^(ϕ) ∀ ϕ ∈ S (Rn ) .
Na teoria quântica, define-se o operador −#/2m∇2 como sendo o hamiltoniano da partícula
quântica livre, denotando-o por H0 . Assim, de acordo com o Teorema 6.17, podemos definir
3 4
Dom(H0 ) = H2 (Rn ) = Ψ ∈ L2 (Rn ) | ∇2 Ψ ∈ L2 (Rn ) ,
ou 3 4
^ ∈ L2 (Rn ) .
Dom(H0 ) = H2 (Rn ) = Ψ ∈ L2 (Rn ) | ∥k∥2 Ψ
Em outras palavras, se Ψ e ∇2 Ψ são elementos de L2 (Rn ), então as outras derivadas com
|α| # 2 têm esta mesma propriedade.
444
Vamos usar a norma ||| · |||Hs (Rn ) para provar o seguinte
TEOREMA 6.18. Hs (Rn ) forma um espaço de Hilbert com respeito ao produto interno (6.7.5).
Demonstração. Considere uma sequência (uj )j∈N em Hs (Rn ) de forma que |||uj −uk |||Hs (Rn ) →
0, quando j, k → ∞. Isto implica que as sequências (D α uj )j∈N , com |α| # s, convergem em
L2 (Rn ), quando j, k → ∞. Pela completeza de L2 (Rn ), existe um funcional u(α) ∈ L2 (Rn )
tal que ∥D α uj − u(α)∥L2 (Rn ) → 0, quando j → ∞. Tome u = u(0). Queremos mostrar que
u(α) = D α u. Pela Operação 6.3 segue que, se u ∈ S ′ (Rn ), então
D α u(ϕ) = (−i)α u(D α ϕ) ∀ ϕ ∈ S (Rn ) e |α| # s .
Assim,
|u(α)(ϕ) − D α u(ϕ)| = |u(α)(ϕ) − (−i)α u(D αϕ)|
# |u(α)(ϕ) − D α uj (ϕ)| + |D α uj (ϕ) − (−i)α u(D αϕ)|
= |(u(α) − D α uj )(ϕ)| + |(−i)α (uj − u)(D α ϕ)|
# ∥u(α) − D α uj ∥L2 (Rn ) ∥ϕ∥L2 (Rn ) + ∥uj − u∥L2 (Rn ) ∥D α ϕ∥L2 (Rn ) → 0 ,
quando j → ∞. Portanto, u(α)(ϕ) = D α u(ϕ) para todo ϕ ∈ S (Rn ). Isto implica que
u(α) = D α u ∈ L2 (Rn ) se |α| # s. Isto mostra que u ∈ Hs (Rn ). Além disso, temos que
∥u(α)−D α uj ∥L2 (Rn ) = ∥D α u−D α uj ∥L2 (Rn ) → 0 e, portanto, |||uj −u|||Hs (Rn ) → 0, quando
j → ∞. Isto mostra que Hs (Rn ) é completo com respeito à norma ||| · |||Hs (Rn ) .
6.8 O Tripleto de Gel’fand

Vimos, no Capítulo 4, que todo operador auto-adjunto A em um espaço de Hilbert H
tem um espectro σ(A) puramente real e que, além disso, seu espectro residual é vazio. Isto
significa que seu espectro é a união do espectro discreto σdisc (A) e o espectro contínuo σess (A).
Somente quando λ ∈ σdisc (A),
AΨ(x) = λΨ(x) , Ψ ∈ Dom(A) , (6.8.1)
terá solução não-trivial. Neste caso, o número real λ ∈ σdisc (A) foi chamado um auto-valor de
A e Ψ um auto-vetor de A associado ao auto-valor λ. Infelizmente, a relação simples (6.8.1) não
existe para todo operador auto-adjunto. De fato, as equações correspondentes a (6.8.1) para os
operadores auto-adjuntos X (posição) e P (momentum), definidos em L2 (R), nos mostraram
que os operadores X e P (veja os Exemplos 5.5 e 5.6) não têm auto-valores e, portanto, não têm
auto-vetores associados. Como já enfatizado, isto ilustra o fato que os auto-vetores associados
com o espectro contínuo de um operador auto-adjunto não pertencem ao espaço de Hilbert.
Este inconveniente pode ser remediado tratando os espaços de funções de quadrado integrável
do ponto de vista da teoria das distribuições. Como mostrado no Seção 6.5, a teoria das
distribuições lida, de fato, com a seguinte cadeia de espaços:
S (Rn ) ⊂ L2 (Rn ) ⊂ S ′ (Rn ) .
445
O papel do espaço L2 (Rn ) é reduzido ao fato de que o produto interno ⟨Ψ, Φ⟩ pode ser
estendido por continuidade à forma bilinear que determina a ação de uma distribuição Ψ ∈
S ′ (Rn ) sobre uma função teste ϕ ∈ S (Rn ), esta forma bilinear sendo denotada por ⟨Ψ, ϕ⟩ =
TΨ (ϕ) em L2 (Rn ). Note que, S ′ (Rn ) é o fecho de L2 (Rn ) em uma certa topologia. Dizemos
que o espaço L2 (Rn ) na cadeia acima é “manipulado” pelos espaços lineares topológicos
S (Rn ) e S ′ (Rn ). Na mecânica quântica, o método de investigação de distribuições baseado
na construção da cadeia acima é bastante eficiente. Isto nos leva ao conceito de tripleto
de Gel’fand (também chamado de espaço de Hilbert rigged),30 uma construção idealizada por
Gel’fand que conecta a teoria das distribuições ao espaço L2 (Rn ). Isto nos permite estudar a
teoria espectral em um sentido mais amplo. Em outras palavras, o tripleto de Gel’fand é uma
estrutura que equipa um espaço de Hilbert com um subespaço vetorial topológico denso de
“boas funções teste,” permitindo que o dual do subespaço de funções teste amplie o espaço
de Hilbert, incorporando-o em um espaço vetorial topológico maior cujos elementos podem
ser considerados auto-vetores generalizados para o caso do espectro contínuo de operadores
lineares (possivelmente não-limitados).
DEFINIÇÃO 6.18. O Tripleto de Gel’fand é um datum da forma
Ω ⊂ H ⊂ Ω′ .
Mais precisamente, o tripleto de Gel’fand é formado por um espaço de Hilbert H , por um

subconjunto próprio Ω denso em H , equipado com uma topologia fraca, e pelo dual Ω′ de Ω.
No caso específico do problema de auto-valores dos operadores X e P , que admitem um

espectro contínuo, podemos considerar o seguinte tripleto de Gel’fand:
S (Rn ) ⊂ L2 (Rn ) ⊂ S ′ (Rn ) .
Uma vez que S (Rn ) é um subespaço denso de L2 (Rn ), seu dual S ′ (Rn ) contém o dual
de L2 (Rn ), que é o próprio L2 (Rn ), devido ao Teorema de representação de Riesz-Fréchet
(Teorema 4.9). Como já vimos, toda função Ψ ∈ L2 (Rn ) define uma distribuição TΨ ∈ S ′ (Rn )
da seguinte forma:
TΨ : S (Rn ) −→ C ,
$
ϕ 3−→ TΨ (ϕ) = ⟨Ψ, ϕ⟩ = dx Ψ(x)ϕ(x) ∀ ϕ ∈ S (Rn ) . (6.8.2)
30
Lembre-se que, na mecânica quântica, quantidades observáveis são representadas por operadores lineares
auto-adjuntos atuando em H . Os auto-valores de um operador representam os valores possíveis da medida
do correspondente observável. Estes auto-valores, que matematicamente correspondem ao espectro do operador,
podem ser discretos (como as energias de uma partícula numa caixa), contínuo (como as energias de, uma partícula
livre), ou uma combinação de discreta e contínua (conforme as energias do átomo de hidrogênio). Quando o
espectro de um observável A é discreto e A é limitado, então A é definido em todo H e os auto-vetores de A
pertencem a H . Neste caso, A pode ser essencialmente considerado como uma matriz. Isto significa que não há
necessidade de se ampliar H . No entanto, observáveis quânticos são, em geral, ilimitados e o seus espectros têm,
em geral, uma parte contínua. A fim de lidar com um espectro contínuo, muitos livros-texto seguem o formalismo
bra-kets de Dirac, que é uma generalização heurística da álgebra linear de matrizes hermitianas utilizadas para
o espectro discreto. Acontece que os métodos matemáticos dos espaços de Hilbert não são suficientes para dar
sentido ao formalismo de Dirac, razão pela qual devemos estender o espaço de Hilbert para o espaço de Hilbert
rigged.
446
Note que sobre o lado esquerdo Ψ é um funcional linear sobre o espaço S (Rn ), enquanto
que sobre o lado direito Ψ aparece como uma função mensurável (nenhuma confusão deve
surgir disso). Ainda, é importante enfatizar que S ′ (Rn ) também contém distribuições, como
a distribuição delta de Dirac e a função eip·x , que não podem ser representadas por meio de
uma função Ψ ∈ L2 (Rn ) de acordo com (6.8.2).
Podemos agora introduzir a seguinte
DEFINIÇÃO 6.19. Seja A um operador linear auto-adjunto em um espaço de Hilbert H . Uma

distribuição T é um auto-vetor generalizado do operador A, associado ao auto-valor λ, se, e
somente se,
8 9
AT (Ψ) = T (AΨ) = λT (Ψ) ,
para qualquer Ψ ∈ S (Rn ) ⊂ Dom(A).
Exemplo 6.18 (Exemplo 5.5 revisitado). Sejam Tδx = δ(x − λ) a distribuição delta de Dirac,
com suporte em λ, e X o operador posição sobre L2 (R). Então, para qualquer Ψ ∈ S (R) ⊂
Dom(X), segue que
$ 6 7
8 9
XTδx (Ψ) = dx Xδ(x − λ) Ψ(x)
$
= dx x δ(x − λ)Ψ(x)
$
= dx δ(x − λ) x Ψ(x) = Tδx (XΨ) .
Por sua vez,

$ $
λΨ(λ) = dx δ(x − λ) x Ψ(x) = λ dx δ(x − λ)Ψ(x) = λTδx (Ψ) .
Logo, de acordo com a definição acima, a equação de auto-valor XΨ(x) = λΨ(x) admite uma
solução distribucional Ψ para todo λ ∈ R, com a “função” delta de Dirac desempenhando o
papel de um auto-vetor generalizado do operador posição X.
Exemplo 6.19 (Exemplo 5.6 revisitado). Seja P o operador momentum sobre L2 (R). Então,
d
−i# Ψ(x) = λΨ(x) .
dx
−1
Como já mencionado, a família de funções Ψλ (x) = eiλ# x , indexada pelo parâmetro λ ∈ R,
é solução da equação de auto-valor acima, mas não pertence ao espaço S (R), nem mesmo ao
espaço L2 (R). No entanto, ela define uma distribuição TΨλ de acordo com
TΨλ : S (R) −→ C ,
$
ϕ 3−→ TΨλ (ϕ) = dx Ψλ (x)ϕ(x) . (6.8.3)
447
Assim,
$ , -
8 9 d
P TΨλ (ϕ) = dx −i# Ψλ (x)ϕ(x)
dx
$
=λ dx Ψλ (x)ϕ(x)
= λTΨλ (ϕ) .
Note que, por uma integração por partes,
$ , - $ , -
d d
dx −i# Ψλ (x)ϕ(x) = dx Ψλ (x) −i# ϕ(x) = TΨλ (P ϕ) .
dx dx
Portanto, segue que
8 9
P TΨλ (ϕ) = TΨλ (P ϕ) = λTΨλ (ϕ) , ∀λ ∈ R .
−1
Logo, as funções Ψλ = eiλ# x , com λ ∈ R, são auto-vetores generalizados do operador
momentum P considerado no espaço S (R).
Como uma última observação, é importante enfatizar que, de acordo com a transformada de
Fourier de S (Rn ) e S ′ (Rn ), o tripleto de Gel’fand é preservado pela transformada de Fourier.
6.9 Convolução
Vamos considerar rapidamente o conceito de convolução e algumas de suas aplicações.
DEFINIÇÃO 6.20. Considere f (x), g(x) ∈ S (Rn ). A operação convolução é definida como um
produto de f (x) e g(x), representada pela função integral
$
(f ∗ g)(x) = dy f (x − y)g(y) , (6.9.1)
com o símbolo (f ∗ g)(x) denotando a convolução de f e g.
A classe de funções de Schwartz é fechada sob convolução, como mostra a

PROPOSIÇÃO 6.8. 1. Se f (x), g(x) ∈ S (Rn ), então (f ∗ g) ∈ S (Rn ).
2. Equipado com a operação de convolução ∗ como produto, o espaço S (Rn ) é uma álgebra
de Banach comutativa.
Demonstração. Segue de (6.2.2) que se f (x), g(x) ∈ S (Rn ), então

$ $
5. β / 5 C(α, β) C ′ (γ, 0)
5
dy D f (x − y) g(y) # dy5
|x − y|α |y|γ
$
′ 1 1
# C(α, β)C (γ, 0) dy .
∥x − y∥ ∥y∥γ
α
448
Se escolhermos α + γ > n, a integral à direita é finita (veja o Lema 6.5). Portanto, neste caso
a convolução (D β f ) ∗ g está bem definida. Por outro lado, é fácil mostrar que D β (f ∗ g) =
(D β f ) ∗ g (veja Exercício 6.16); logo, podemos deduzir que f ∗ g ∈ C ∞ (Rn ). Resta provar que
xα D β (f ∗ g)(x) é limitada. Para isto, vamos usar o seguinte:
α
<
α
. /α
x = (x − y) + y = Cγ (x − y)γ y α ,
γ=0
.α/
em que Cγ = γ
. Assim,
$
5 α β 5 5 . / 5
sup 5x D (f ∗ g)(x)5 = sup dy 5xα D β f (x − y) g(y)5
x∈Rn ;|β|#m x∈Rn ;|β|#m
α
< $
C(γ + µ, β) C ′ (α + τ , 0)
# Cγ dy
γ=0
|x − y|µ |y|τ
α
< $
′ 1
# Cγ C(γ + µ, β)C (α + τ , 0) dy .
γ=0
∥x − y∥µ∥y∥τ
Novamente, se escolhermos µ+τ > n, a integral à direita será finita. Logo (f ∗g)(x) ∈ S (Rn ).
A estimativa acima também mostra que a convolução é contínua sobre S (Rn ).
A segunda parte segue, imediatamente, fazendo-se a mudança de variável z = x − y na

integral (6.9.1), obtendo-se
$
(g ∗ f )(x) = dn z g(x − z)f (z) , ∀ f , g ∈ S (Rn ) .
Isto finaliza a prova.
A ágebra acima não tem uma identidade, pois não existe g ∈ S (Rn ) tal que f ∗ g = f
para toda f ∈ S (Rn ), mas tem identidades aproximadas. Mais precisamente, suponha que f
S
e Kα pertencem a S (Rn ) para todo α ∈ N; então, f ∗ Kα −→ f . De acordo com o Corolário
6.2, uma identidade aproximada Kα ∈ S (Rn ) é representada pela sequência de funções
,i -n
α 2
Kα (x) = e−α∥x∥ , com α ∈ N , x ∈ Rn .
π
TEOREMA 6.19. Considere f (x), g(x) ∈ S (Rn ), então,
(a) (f&
∗ g)(k) = f^(k)^
g (k),
(b) (fpg)(k) = (2π)−n (f^ ∗ ^

g )(k).
Demonstração. Na demonstração recorremos ao Teorema de Fubini, que permite a inversão da

ordem de integração.
449
Prova de (a).
$
(f&
∗ g)(k) = dx eikx (f ∗ g)(x)
$ $
ikx
= dx e dy f (x − y)g(y)
$ $
ik(x−y)
= dx e f (x − y) dy eiky g(y)
,$ -
ik(x−y)
= d(x − y) e f (x − y) ^
g (k)
= f^(k)^
g (k) .
Prova de (b).
$
(f^ ∗ ^
g )(k) = dp f^(k − p)^
g (p)
$
= dp dx dny ei(k−p)x f (x)eipy g(y)
$ ,$ -
n ikx ip(y−x)
= dx d y e f (x)g(y) dp e
B CD E
(2π)n δ(y − x) (veja a Nota 6.15)
$
n
= (2π) dx eikx f (x)g(x)
= (2π)n (fpg)(k) .
Logo, (fpg)(k) = (2π)−n (f^ ∗ ^

g )(k).
Sob algumas circunstâncias, é possível definir a convolução de uma função com uma dis-
tribuição, ou de duas distribuições. Neste caso, algumas condições de integrabilidade devem
ser satisfeitas. Muitas vezes estas condições de integrabilidade são realizadas pela propriedade
de suporte das funções. Se f é uma função (ou distribuição) de suporte compacto e g é uma
distribuição, então, f ∗ g é uma função suave definida distribucionalmente por uma fórmula
análoga à Eq.(6.9.1), isto é,
$
8 9
(f ∗ g) (ϕ) = dx (f ∗ g)ϕ(x)
$ $
= dx dy f (x − y)g(y)ϕ(x) (6.9.2)
$ $
= dx dy f (x)g(y)ϕ(x + y) .
450
Note que o resultado acima é equivalente a aplicar o funcional f (x)g(y), que pode ser consi-
derado como o produto direto de f (x) e g(y), à função ϕ(x + y).
Para definir a convolução de distribuições T , S ∈ D ′ (Rn ) de acordo com a fórmula (6.9.2),

os suportes das distribuições T e S têm de ter numa relação especial, visto que para ϕ(x) ∈
D(Rn ), a função ϕ(x + y) definida em Rn × Rn , é certamente uma função de classe C ∞ , mas
não tem suporte compacto em Rn × Rn se ϕ ̸= 0. Por exemplo, se supp ϕ(x) = [a, b], então,
supp ϕ(x + y) é uma faixa no plano (x, y) que passa pelos pontos extremos do intervalo [a, b],
como mostrado na Figura 6.5.
supp ϕ(x)
a b x
Figura 6.5: Se o supp ϕ(x) é o intervalo [a, b], o suporte de ϕ(x + y) é a faixa sombriada
a # x + y # b que é ilimitada.
Assim, em geral, o lado direito da Eq.(6.9.2) não está definido. No entanto, existe uma maneira
natural para assegurar a validade do lado direito. Suponha que supp (T ⊗ S) ∩ supp ϕ(x + y)
é compacto em Rn × Rn para todo ϕ(x) ∈ D(Rn ). Então, seria de se esperar que a definição
funcione.
DEFINIÇÃO 6.21 (Condição de Suporte). Duas distribuições T , S ∈ D ′ (Rn ) são ditas satisfazer
a condição de suporte se, e somente se, para cada conjunto compacto K ⊂ Rn o conjunto
3 4
KT ,S = (x, y) ∈ Rn × Rn | x ∈ supp T , y ∈ supp S, x + y ∈ K ,
é compacto em Rn × Rn .
6.10 Potencial de Riesz

Seja 0 < α < n. Então, a função ∥k∥−α é localmente integrável e pode ser vista como um
elemento em S ′ (Rn ).
TEOREMA 6.20. Para 0 < α < n
$ $
1
dy ∥x − y∥−n+αϕ(y) = dk c−1
α ∥k∥
−α
^
ϕ(k) , (6.10.1)
Rn (2π)n Rn
para todo ϕ ∈ S (Rn ), em que

1 Γ((n − α)/2)
cα = .
π n/2 2α Γ(α/2)
451
Nota 6.19. A restrição 0 < α < n é necessária para garantir que ∥x − y∥−n+α e ∥k∥−α sejam
localmente integráveis para que a identidade acima faça sentido.
Demonstração do Teorema 6.20. Nosso ponto de partida é a fórmula elementar (veja I.S. Gradsh-
teyn e I.M. Ryzhik, “Table of Integrals, Series, and Products,” Seventh Edition, Elsevier (Academic
Press), 2007, fórmula 3.381, 4., pg.346)
$ ∞
1
dx xα−1 e−µx = α Γ(α) , [Re µ > 0, Re α > 0] . (6.10.2)
0 µ
Usando a fórmula acima, escrevemos
$ ∞
−α 1 2
∥k∥ = dλ λα/2−1 e−λ∥k∥ .
Γ(α/2) 0
Pela transformada de Fourier inversa, segue que para todo ϕ^ ∈ S (Rn )

$
8 −1 −α
9 1
F (∥k∥ ϕ) ^ (x) = dk ∥k∥−α ϕ(k)e
^ −ikx
(2π)n Rn
$ , $ ∞ -
1 1 α/2−1 −λ∥k∥2 −ikx
= dk dλ λ e ^
ϕ(k)e
(2π)n Rn Γ(α/2) 0
$ ∞ , $ -
1 α/2−1 1 −λ∥k∥2 −ikx
= dλ λ dk e ^
ϕ(k)e .
Γ(α/2) 0 (2π)n Rn
Na segunda igualdade da expressão acima usamos o Teorema de Fubini, uma vez que ∥k∥−α ϕ(k)
^
é integrável.
Levando em conta o Teorema 6.19 e as Eqs.(6.6.6) e (6.6.7), obtemos

$ ∞ , $ -
1 α/2−1 1 −λ∥k∥2 −ikx
dλ λ dk e ^
ϕ(k)e
Γ(α/2) 0 (2π)n Rn
$ ∞ ,$ -
1 α/2−n/2−1 1
− 4λ ∥x−y∥2
= n n/2 dλ λ dy e ϕ(y)
2 π Γ(α/2) 0 Rn
$ ,$ ∞ -
1 1
α/2−n/2−1 − 4λ ∥x−y∥2
= n n/2 dy dλ λ e ϕ(y) .
2 π Γ(α/2) Rn 0
Fazendo a mudança de variável λ → λ−1 na integral entre parênteses na expressão acima e

usando novamente a fórmula (6.10.2), obtemos que
$
8 −1 −α
9 1 Γ((n − α)/2)
F (∥k∥ ϕ) ^ (x) = n/2 α dy ∥x − y∥α−n ϕ(y) .
π 2 Γ(α/2) R n
Assim, temos que F (∥ · ∥α−n ) = c−1

α ∥·∥
−α
, em que
1 Γ((n − α)/2)
cα = ,
π n/2 2α Γ(α/2)
452
no sentido que para todo ϕ ∈ S (Rn )

$
8 9
c−1
α F −1
(∥k∥ −α
^ (x) =
ϕ) dy ∥x − y∥α−n ϕ(y) .
Rn
Finalmente, a Eq.(6.10.1) segue do Teorema 6.14.
De acordo com o Teorema 6.20, definimos o operador potencial de Riesz Iα : S (Rn ) →

S ′ (Rn ) através da integral
$
Iα ϕ(x) = dy ∥x − y∥α−n ϕ(y) , 0 < α < n . (6.10.3)
Rn
A função Iα (x) = ∥x − y∥α−n é chamada potencial de Riesz, ou núcleo de Riesz. Em particular,

para n = 3 e α = 2, o potencial de Riesz é o bem conhecido potencial de Coulomb.
Por argumentos da transformada de Fourier, verifica-se que
Iα ϕ = (−∇2 )−α/2 ϕ ,
com ∇2 sendo o operador laplaciano. Aqui, (−∇2 )−α/2 é definido usando-se a análise de
Fourier. Isto é, para toda função ϕ ∈ S (Rn ) sabemos que (−∇ ' 2 )β/2 ϕ = ∥k∥β ϕ.
^ Então,
de especial significado são as potências negativas β no intervalo, −n < β < 0. Para estas
potências existe uma realização formal do operador (−∇2 )−α/2 como um operador integral
dado pela integral (6.10.3). Ou seja, com uma ligeira mudança de notação, a identidade Iα ϕ =
(−∇2 )−α/2 ϕ equivale ao fato de que a transformada de Fourier de ∥x − y∥α−n é precisamente
c−1
α ∥k∥
−α
no sentido provado no Teorema 6.20. Resulta imediatamente que qualquer função
n
ψ ∈ S (R ) pode ser escrita como um potencial de Riesz (no sentido distribucional), isto é,
ψ(x) = Iα ϕ(x) = (Iα ∗ ϕ)(x) , 0<α<n,
com ϕ = (−∇2 )α/2 ψ.
Como última observação, cabe destacar que uma extensão natural de Iα : S ′ (Rn ) →
S ′ (Rn ) é definida por dualidade da seguinte forma: para u ∈ S ′ (Rn ), segue que
u(Iα ϕ) = Iα u(ϕ) , ∀ ϕ ∈ S (Rn ) .
6.11 Potencial de Bessel

O potencial de Bessel é um potencial semelhante ao potencial de Riesz, mas com melhores
propriedades de decaimento no infinito. Esse potencial é obtido substituindo-se Iα por uma
função Gα que tem o mesmo comportamento local (∥x∥ → 0), mas um decaimento mais
rápido no infinito, como Iα (x)e−∥x∥ . A forma mais simples de modificar o potencial de Riesz,
mantendo-se o comportamento local essencial, mas eliminando os problemas irrelevantes do
infinito, é substituir o operador “não-negativo” −∇2 , pelo operador “estritamente positivo”
1I − ∇2 , em que (1I é o operador identidade, e definir o operador potencial de Bessel
Bα = (1I − ∇2 )−α/2 : S (Rn ) → S ′ (Rn ) ,
453
em analogica com o operador
Iα = (−∇2 )−α/2 : S (Rn ) → S ′ (Rn ) .
Por argumentos da transformada de Fourier, segue que

8 9
F ((1I − ∇2 )−α/2 ϕ) (k) = (1 + ∥k∥2 )−α/2 ϕ(k)
^
para todo ϕ ∈ S (Rn ). Aqui podemos assumir qualquer expoente α ∈ R (ou mesmo α ∈ C),
uma vez que a função G ^α (k) = (1 + ∥k∥2 )−α/2 pode ser identificada com uma distribuição
em S ′ (Rn ) para todo α. Além disso, se ϕ ∈ S (Rn ), então, claramente G ^α ϕ
^ ∈ S (Rn ).
Resulta imediatamente que qualquer função ψ ∈ S (Rn ) pode ser escrita como um potencial
de Bessel (no sentido distribucional), isto é,
ψ(x) = Bα ϕ(x) = (Gα ∗ ϕ)(x) , α∈R,
com ϕ = G−α ψ = (1I − ∇2 )α/2 ψ, em que ϕ ∈ S (Rn ). Portanto, Bα : S (Rn ) → S (Rn ) é

uma bijeção. Aqui, a função Gα é chamada Kernel do potencial de Bessel.
Note que para α, β ∈ R,

. /−1
Bα+β = Bα Bβ , Bα = B−α , B0 = 1I .
Assim como no caso do operador potencial de Riesz, uma extensão natural de Bα :

S ′ (Rn ) → S ′ (Rn ) é definida por dualidade da seguinte forma: para u ∈ S ′ (Rn ), segue que
u(Bα ϕ) = Bα u(ϕ) , ∀ ϕ ∈ S (Rn ) .
PROPOSIÇÃO 6.9. Quando α > 0, o Kernel do potencial de Bessel, Gα , em Rn pode ser repre-
sentado pela fórmula integral
$ ∞
1 1 2
Gα (x) = n n/2 dλ λα/2−n/2−1 e− 4λ ∥x∥ e−λ . (6.11.1)
2 π Γ(α/2) 0
Além disso, Gα ∈ L1 (Rn ).
Demonstração. Partimos observando que pela fórmula elementar (6.10.2) temos que
$ ∞
^α (k) = (1 + ∥k∥ ) 2 −α/2 1 2)
G = dλ λα/2−1 e−λ(1+∥k∥ .
Γ(α/2) 0
Procedendo como na prova do Teorema 6.20, pela transformada de Fourier inversa, segue que
454
^ ∈ S (Rn )
para todo ϕ
= > $
−1 ^ 1 ^α (k)ϕ(k)e−ikx
^ (x) =
F (Gα (k)ϕ) dk G ^
(2π)n Rn
$ , $ ∞ -
1 1 α/2−1 −λ(1+∥k∥2 ) −ikx
= dk dλ λ e ^
ϕ(k)e
(2π)n Rn Γ(α/2) 0
$ ∞ , $ -
1 α/2−1 −λ 1 −λ∥k∥2 −ikx
= dλ λ e dk e ^
ϕ(k)e
Γ(α/2) 0 (2π)n Rn
$ ∞ ,$ -
1 α/2−n/2−1 −λ 1
− 4λ ∥x−y∥2
= n n/2 dλ λ e dy e ϕ(y)
2 π Γ(α/2) 0 Rn
$ ,$ ∞ -
1 1
α/2−n/2−1 −λ − 4λ ∥x−y∥2
= n n/2 dy dλ λ e e ϕ(y)
2 π Γ(α/2) Rn 0
$
= dy Gα (x − y)ϕ(y) .
Rn
Assim, a primeira afirmação está demonstrada. Para demonstrar a segunda afirmação, usamos
o fato que
$
1 2
dx e− 4λ ∥x∥ = (4λπ)n/2 = 2n π n/2 λn/2 (pelo Corolário 6.3) .
Rn
Então, aplicando o Teorema de Fubini na Eq.(6.11.1), segue que

$ $ ∞
1
dx Gα (x) = dλ λα/2−1 e−λ = 1 (para α > 0, pela fórmula (6.10.2)) .
Rn Γ(α/2) 0
Portanto, Gα é uma função em L1 (Rn ).
Segue imediatamente da proposição acima o seguinte
COROLÁRIO 6.5. Se 0 < α < n, então,

$ ∞
1 1 2
0 < Gα (x) < Iα (x) = n n/2 dλ λα/2−n/2−1 e− 4λ ∥x∥ .
2 π Γ(α/2) 0
Nota 6.20. A ideia de substituir o potencial de Riesz pelo potencial de Bessel apareceu no artigo
de J. Deny, “Les Potentiels d’Energie Finie,” Acta Math. 82 (1950) 107, pg.129. Os potenciais de
Bessel foram introduzidos sistematicamente no artigo de N. Aronszajn e K. T. Smith, “Theory of
Bessel Potentials, I ” Ann. Inst. Fourier 11 (1961) 385. Aronszajn-Smith mostraram que a função
Gα , para α > 0, é essencialmente uma função de Bessel, isto é,
1 α−n
Gα (x) = K n−α (∥x∥) ∥x∥ 2 , (6.11.2)
2(n+α−2)/2 π n/2 Γ(α/2) 2
em que K n−α é a função de Bessel modificada do terceiro tipo (também conhecida como função
2
de Bessel-Macdonald) de ordem n−α2
. Com efeito, de acordo com a tabela de integrais de I.S.
455
Gradshteyn e I.M. Ryzhik, “Table of Integrals, Series, and Products,” Seventh Edition, Elsevier
(Academic Press), 2007, fórmula 8.432, 6.11 , pg.917, a função K n−α (∥x∥) tem a seguinte
2
representação integral:
, - n−α $ ∞
1 ∥x∥ 2 1 2
K n−α (∥x∥) = dλ λα/2−n/2−1 e−λ e− 4λ ∥x∥ .
2 2 2 0
Logo, ao substituírmos esta representação integral na Eq.(6.11.2) obtemos imediatamente a

Eq.(6.11.1).
Existe uma outra representação para a função Gα , com α > 0, em termos de outra função
de Bessel. Essa outra representação usa a relação
π n−α+2 (1)
K n−α (∥x∥) = i 2 H n−α (i∥x∥) ,
2 2 2
(1) n−α
em que H n−α (i∥x∥) denota a função de Hankel de primeiro tipo de ordem 2
. Com isso a
2
Eq.(6.11.2) assume a seguinte forma:
n−α+2
i 2 (1) α−n
Gα (x) = (n+α)/2 (n−2)/2 H n−α (i∥x∥) ∥x∥ 2 . (6.11.3)
2 π Γ(α/2) 2
Assim, a maioria das fórmulas e propriedades de Gα são quase consequências imediatas das
(1)
correspondentes fórmulas e propriedades de K n−α , ou H n−α . Citamos abaixo algumas dessas
2 2
propriedades (que podem ser encontradas no artigo de Aronszajn-Smith):
(i) Gα ∗ Gβ = Gα+β se β > 0.
(ii) Quando ∥x∥ → 0,

⎧
⎪
⎪ ∥x∥α−n se 0 < α < n ,
⎪
⎪
⎪
⎨
1
Gα (x) ≃ ln ∥x∥ se α = n ,
⎪
⎪
⎪
⎪
⎪
⎩
C(α, n) se α > n ,
em que C(α, n) é uma constante.
(iii) Quando ∥x∥ → ∞,

α−n−1
Gα (x) ≃ ∥x∥ 2 e−∥x∥ .
(iv) Existe c > 0 tal que para todo x ∈ Rn e todo 0 < α < n
Gα (x) ≃ ∥x∥α−n e−c∥x∥ .
Gostaríamos de enfatizar que as propriedades do kernel de Bessel Gα que são realmente

importantes para os nossos interesses são a natureza da singularidade na origem, a monotonici-
dade e o fato de que o decaimento no infinito é suficientemente rápido para torná-lo integrável.
A propriedade de grupo e a propriedade de que G2 é uma solução fundamental de 1I − ∇2
também são úteis.
456
6.12 Transformada de Fourier-Laplace de Distribuições

Nesta seção investigaremos a conexão que existe entre o comportamento da propriedade de
decaimento de uma função, ou distribuição, no infinito e a propriedade de analiticidade de sua
transformada de Fourier-Laplace. Veremos que a transformada de Fourier-Laplace de distribui-
ções temperadas com suporte compacto ou com suporte num cone são funções analíticas.
DEFINIÇÃO 6.22. A transformada de Fourier-Laplace de uma distribuição u é a função de
n-variáveis complexas ζ = k + iη ∈ Cn da forma
8 9 8 9
(L u)η (k) = F u(x)e−ηx (k) = u
^(k + iη) .
6.12.1 Transformada de Fourier-Laplace de Distribuições Temperadas com

Suporte Compacto
A forma mais extrema de decaimento no infinito é ter suporte compacto. Este é o conteúdo
de um teorema clássico, conhecido como Teorema de Paley-Wiener, que caracteriza funções
inteiras do tipo exponencial (de uma variável complexa), cuja restrição ao eixo dos reais é
exatamente a transformada de Fourier de uma função L2 com suporte compacto. A extensão da
transformada de Fourier para o domínio complexo é chamada transformada de Fourier-Laplace.
Abaixo, vamos apresentar dois teoremas análogos (em várias variáveis), um para funções de
classe C ∞ com suporte compacto, e outro para distribuições com suporte compacto.
TEOREMA 6.21 (Teorema Paley-Wiener para C0∞ ). Seja {x ∈ Rn | |x| # R} uma bola em
Rn . As seguintes propriedades são equivalentes:
(i) f (x) é uma função de classe C ∞ com suporte na bola {x ∈ Rn | |x| # R}.
(ii) a transformada de Fourier-Laplace da função f é uma função analítica inteira de n

variáveis complexas, tal que, para cada inteiro N ∈ N, existe uma constante CN > 0, para todo
ζi = ki + iηi , com i = 1, . . . , n, de forma que a seguinte estimativa acontece
|f^(ζ)| # CN (1 + |ζ|)−N eR|Im ζ| , ∀ ζ ∈ Cn . (6.12.1)
Demonstração. (i) implica (ii). Suponha que f (x) ∈ C0∞ (Rn ) tem suporte em uma bola
{x | |x| # R}. Então, para todo ζ = (ζ1 , . . . , ζn ) ∈ Cn , a integral
$
^
f (ζ) = dx f (x)eiζx ,
|x|!R
é bem definida. Além disso, f^(ζ) é uma função analítica inteira das n variáveis complexas
ζ1 , . . . , ζn , uma vez que ∂ f^(ζ)/∂ ζ̄i = 0, em que ζ̄i = ki − iηi – veja o Apêndice C para
detalhes.
Por integrações por partes, obtemos:

$ $
^ iζx (−i)|α|
f (ζ) = dx f (x)e = α
dx f (x)(Dxα eiζx ) ,
|x|!R
ζ |x|!R
457
ou $
ζ f^(ζ) = i|α|
α
dx eiζx (Dxα f (x)) . (6.12.2)
|x|!R
Tomando o valor absoluto de ambos os lados da Eq.(6.12.2) e usando o fato que f^(ζ) é limitada
sobre o conjunto {ζ | |η| < ε}, temos
5$ 5
5 5
5 5
|ζ α||f^(ζ)| = 5 dx eiζx (Dxα f (x))5
5 |x|!R 5
$
R|η|
#e dx |Dxα f (x)| = Cα eR|η| .
|x|!R
Isto prova a estimativa (6.12.1) – lembre-se que |ζ α| e (1 + |ζ|)α são comparáveis (veja Nota 6.4).
(ii) implica (i). Sejam Ω um subconjunto aberto em Cn e ζ o qualquer ponto de Ω. Considere

o polidisco ! "
D(r1 , . . . , rn ) = ζ ∈ Cn | |ζi − ζio| # ri , i = 1, . . . , n .
Suponha que D(r1 , . . . , rn ) esteja contido em Ω. Como f^(ζ) é uma função analítica de uma
única variável complexa ζj quando todos os outros ζi são mantidos fixos, a aplicação da fórmula
de Cauchy produzirá31
6 1 7n ` `
f^(ζ1 , . . . , ζn )
^
f (ζ) = ··· dζ1 · · · dζn .
2πi |ζ −ζ o |=r |ζn −ζ o |=rn
(ζ1 − ζ1o ) · · · (ζn − ζno )
1 1 1 n
Isto mostra que f^(ζ) ∈ C ∞ (D(r1 , . . . , rn )), visto que a diferenciação sob o sinal da integral
é legitima. Ela também mostra que as derivadas Dζα f^(ζ) satisfazem as condições de Cauchy-
Riemann, e são assim analíticas em D(r1 , . . . , rn ).32 Uma vez que Ω pode ser coberto por
tais polidiscos, conclui-se que, se f^(ζ) é analítica sobre Ω, então f^(ζ) ∈ C ∞ (Ω), e que suas
derivadas de todas as ordens são também analíticas sobre Ω. Isso nos mostra que toda derivada
de f^(ζ), Dζα f^(ζ), também satisfaz a estimativa (6.12.1), possivelmente com uma constante CN
diferente (na verdade, esta constante dependerá de α). Desse fato, se tomarmos ζ = k real,
isto é, η = 0, concluímos que toda função |Dkα f^(k)| decrescerá no infinito mais rápido do que
qualquer potência de 1/|k|. Em outras palavras, isto significa que f^(k) ∈ S (Rn ). Portanto,
f (x) ∈ S (Rn ) e pela fórmula de reciprocidade
$
1
f (x) = dk e−ikx f^(k) .
(2π)n Rn
Note que (por diferenciação)
$ n
]
1
β
D f (x) = dk e −ikx
(ikj )βj f^(k) ,
(2π)n Rn j=1
e fazendo-se uso da estimativa (6.12.1) quando restrita a Rn (e recorrendo ao Lema 6.5), vemos
que f ∈ C ∞ (Rn ).
31
Veja o Teorema 2.2.1, pg.26, em L. Hörmander, “An Introduction to Complex Analysis in Several Variables,” Van
Nostrand, 1966.
32
Veja no Apêndice B a definição de funções analíticas em um subconjunto aberto Ω de Cn .
458
Considere, para os números complexos ζ2 , . . . , ζn fixos, a integral

$ M
1
dk1 e−ik1 x1 f^(k1 , ζ2 , . . . , ζn ) . (6.12.3)
(2π)n −M
Usando o fato que f^(ζ) é uma função analítica inteira, podemos integrá-la, considerando f^(ζ)
como uma função de ζ1 somente, sobre o caminho fechado C do plano complexo, como mostra
a Figura 6.6.
Im ζ1
η1
Re ζ1
−M +M
Figura 6.6: Caminho fechado C .
Como C é um caminho fechado, a integral de f^(ζ) ao longo dele é zero, resultado do

seguinte
LEMA 6.11 (Lema de Cauchy). Se f (z) é analítica em um domínio X, e C é uma curva simples
fechada em X (suave por pedaços), então
`
dz f (z) = 0 .
C
Demonstração. Com a notação z = x + iy e f (x + iy) = u(x, y) + iv(x, y), obtemos

` ` `
dz f (z) = (dx u − dy v) + i (dx v + dy u)
C C C
$$ , - $$ , -
∂u ∂v ∂u ∂v
=− dydx + +i dydx − .
S ∂y ∂x S ∂x ∂y
A segunda igualdade é uma consequência do Teorema de Green. Contudo, as condições de

Cauchy-Riemann implicam que
$$ , - $$ , -
∂u ∂v ∂u ∂v
dydx + =0 e dydx − =0.
S ∂y ∂x S ∂x ∂y
Isto demonstra o Lema.33

33
O Lema 6.11 é equivalente ao teorema que mostra que a integral de f (z) ao longo de uma curva ligando os
pontos zo e z1 só depende desses pontos e não da curva sobre a qual a integração está sendo realizada.
459
Finalizando a demonstração do Teorema 6.21. Considerando a porção da integral que é

realizada sobre o segmento (−M, M) da linha real, podemos mostrar que ela é igual a integral
(6.12.3): $ M
1
dk1 e−i(k1 +iη1 )x1 f^(k1 + iη1 , ζ2 , . . . , ζn ) + Υ(M) ,
(2π)n −M
em que
$ η1
1 ! "
|Υ(M)| # dt e|x1 t|
| ^(M + it, ζ2 , . . . , ζn )| + |f^(−M + it, ζ2 , . . . , ζn )| .
f
(2π)n 0
Se levarmos em conta a estimativa (6.12.1), quando N = 1, vemos que |Υ(M)| → 0, quando
M → ∞. Em outras palavras, temos
$ ∞ $ ∞
1 1
−i(k1 +iη1 )x1
dk1 e f^(k1 + iη1 , ζ2 , . . . , ζn ) = dk1 e−ik1 x1 f^(k1 , ζ2 , . . . , ζn ) .
(2π)n −∞ (2π)n −∞
Aplicando este argumento a cada variável k1 , . . . , kn , obtemos

$
1
f (x) = n
dk e−i(k+iη)x f^(k + iη) ,
(2π) Rn
em que η é um vetor arbitrário de Rn . Assuma que η pertence ao semi-plano aberto {η ∈ Rn |
η · x < 0}; isto é, tome η = −tx/|x|, com t > 0. Então, η · x = −t|x| e |η| = t. Portanto,
novamente levando em conta a estimativa (6.12.1), obtemos
$
1 (R−|x|)t 1
|f (x)| # CN n
e dk
(2π) Rn
(1 + |k + iη|)N
$
1 (R−|x|)t 1
# CN n
e dk
(2π) Rn
(1 + |k|)N
$
1 (R−|x|)t 1
# CN n
e dk .
(2π) Rn
(1 + ∥k∥)N
De acordo com o Lema 6.5, tomando N > n, a integral
$
1
dk ,
Rn
(1 + ∥k∥)N
é finita, e assim temos que
|f (x)| # C ′ e(R−|x|)t .
Se |x| > R, podemos tomar o limite t → +∞ para obter f (x) = 0. Logo, supp f (x) ⊂
{|x| # R}.
A extensão do Teorema 6.21 para a linguagem de distribuições foi realizada por Laurent
Schwartz.
TEOREMA 6.22 (Teorema Paley-Wiener-Schwartz). Seja u ∈ S ′ (Rn ) com suporte na bola
{x ∈ Rn | |x| # R}. Então sua tranformada de Fourier é uma função que tem um prolonga-
mento para valores complexos ζ = (ζ1 , . . . , ζn ) de k = (k1 , . . . , kn ) de tal modo que u
^(ζ) é
uma função analítica inteira que satisfaz, para um N ∈ N e uma constante C, a estimativa
u(ζ)| # C(1 + |ζ|)N eR|Im ζ|
|^ ∀ ζ ∈ Cn , (6.12.4)
^ é polinomialmente limitada em Rn .
Em particular, u
460
Demonstração. De acordo com a Definição 6.5, uma distribuição temperada u tem suporte em
um conjunto fechado K se, e somente se, u(ϕ) = 0 para toda função teste ϕ com suporte em
Rn \ K. Se K é compacto, então u tem suporte compacto. Vamos tomar K como sendo a bola
fechada {x ∈ Rn | |x| # R}.
^(k) = u(eikx ). De fato, lembre-se que

Pela definição da transfomada de Fourier, segue que u
(pela dualidade)
$
^(ϕ) = u(ϕ)
u ^ = dx u(x)ϕ(x) ^
$
8 9
= dxdk u(x)ϕ(k)eikx = u(eikx ) (ϕ) .
Isto mostra que a transformada de Fourier definida pela dualidade é a função suave dada por
u(eikx ). Como u e eikx são funções suaves, então a expressão acima faz sentido para qualquer
ζ ∈ Cn . Aplicamos a ela os operadores de Cauchy-Riemann ∂/∂ ζ¯i , (i = 1, . . . , n). Logo, u ^
tem um prolongamento para valores complexos ζ = (ζ1 , . . . , ζn ) de k = (k1 , . . . , kn ) de tal
modo que u ^(ζ) é uma função analítica inteira de ζ, cuja restrição a Rn é u
^.
Resta provar a estimativa. Para isto, tome a função suave auxiliar h ∈ D(Rn ), tal que
h(t) = 1 se t # 1 e h(t) = 0 se t > 2. Associe com cada ζ ∈ Cn , com ζ =
̸ 0, a função
ϕζ (x) = eiζx h(|ζ||x| − |ζ|R) , (x ∈ Rn ) . (6.12.5)
Logo, ϕζ (x) ∈ D(Rn ) e, portanto, ϕζ (x) ∈ S (Rn ).34 Sobre o suporte de ϕζ , |x| # R + 2/|ζ|,
de forma que
|eiζx | = e|Im ζ||x| # e2+R|Im ζ| .
Agora, aplicando a regra de Leibniz (6.1.4) em (6.12.5), obtemos
6 7 < ,α -. /. /
α iζx
D e h(|ζ||x| − |ζ|R) = D β eiζx D α−β h(|ζ||x| − |ζ|R)
β
β#α
6 7
= |i|−1 αn|ζ|ζ −1 h′ (|ζ||x| − |ζ|R) + h(|ζ||x| − |ζ|R) |i|α ζ α eiζx .
(6.12.6)
Como supp h ⊂ [−2, 2], então supp h′ ⊂ [−2, 2] (veja o Exercício 6.1). Logo, temos que (6.12.6)
é majorado por
6 7
|i| αn|ζ|ζ + 1 4|i|α ζ α eiζx .
−1 −1
Usando o fato que

|ζ α| = |ζ1α1 · · · ζnαn | = |ζ1 |α1 · · · |ζn |αn
# (1 + |ζ1|)α1 · · · (1 + |ζn |)αn
# (1 + |ζ|)|α| ,
34
Em geral, se h ∈ D e se ψ é uma função infinitamente diferenciável cujo suporte não é necessariamente
limitado, então hψ ∈ D e o suporte de hψ está contido na interseção dos suportes de h e ψ.
461
obtemos que
56 7 5
5 −1 α α iζx 5
5 |i| αn|ζ|ζ + 1 4|i| ζ e 5 # 4(αn + 1)(1 + |ζ|)|α|e2+R|Im ζ| .
−1
Finalmente, como u ∈ S ′ (Rn ) e h(|ζ||x| − |ζ|R) = 1 se |x| # R + |ζ|−1, então na

vizinhança do suporte de u temos h = 1 e
( )
5 5
u(ζ)| = |u(ϕζ (x))| # C1
|^ sup (1 + |x|)α 5D β ϕζ (x)5 ,
x∈Rn ;|β|#m
para α, m ∈ N0 , β ∈ Nn0 e alguma constante C1 . Logo,
u(ζ)| # C(1 + |ζ|)meR|Im ζ| ,

|^
em que C = 4C1 e2 (1 + R)α (mn + 1). Note que, quando restrita a Rn ,
u(k)| # C(1 + |k|)m .

|^
^ é polinomialmente limitada em Rn .
Portanto, u
6.12.2 Transformada de Fourier-Laplace de Distribuições Temperadas com

Suporte em Cones
Vamos agora estudar certas funções analíticas em certos domínios complexos, chamados
tubos, que satisfazem uma condição de crescimento temperado35 e provar que o valor limite
u dessas funções sobre os reais admite u ^ como sua transformada de Fourier no sentido das
distribuições temperadas. Antes disso, a fim de definir um domínio tubo, precisamos de alguns
fatos simples a respeito de cones.
Um conjunto aberto C ⊂ Rn é chamado de cone, se C (salvo indicação em contrário, todos

os cones terão seus vértices em zero) é invariante sob homotetias positivas (ou dilatações),
ou seja, se para todo λ > 0, λC ⊂ C. Um cone C é um cone aberto conexo se C é um
conjunto aberto conexo. Além disso, C é chamado convexo se C + C ⊂ C (isto significa que
se x e y ∈ C e 0 # t # 1 então tx + (1 − t)y ∈ C) e próprio se ele não contém qualquer
reta linha (observe que se C é um cone próprio, então se x ∈ C, e se x ̸= 0, segue que
−x ∈ / C). Um cone C′ é chamado compacto em C – nós escrevemos C′ % C – se a projeção
′ def. ′ def.
prC = C ∩ S n−1 ⊂ prC = C ∩ S n−1 , em que S n−1 é a esfera unitária em Rn .
DEFINIÇÃO 6.23. Seja C ⊂ Rn um cone convexo, aberto e próprio. O tubo com base C, denotado
por T (C), é definido por:
3 4
def
T (C) = Rn + iC = z = x + iy ∈ Cn | x ∈ Rn , y ∈ C .
35
Várias outras condições de crescimento podem ser encontradas nos Capítulos 5 e 6 no tratado de R.D.
Carmichael and D. Mitrović, “Distributions and Analytic Functions,” Longman Scientific & Technical, 1989.
462
Nota 6.21. Na definição acima se C é somente aberto, T (C) é chamado um cone tubular; se
C é aberto e conexo, T (C) é chamado um domínio radial tubular. Vamos sempre considerar
o domínio tubo da seguinte forma:
3 4
T (C) = z = x + iy ∈ Cn | x ∈ Rn , y ∈ C, |y| < δ ,
em que δ > 0 é um número arbitrário.

Nota 6.22. Podemos tentar “visualizar” o cone C da seguinte forma: seja y uma direção em Rn ;
então C pode ser pensado como sendo o cone “sólido” obtido pela interseção da bola centrada
na origem com raio ε, com um cone convexo aberto com vértice também na origem e contendo
a direção y. A Figura 6.7 ilustra o caso particular de um cone “sólido” em R3 .
ε
B[0; ε]
0
Figura 6.7: O cone “sólido” em R3 .
Dado um cone convexo, aberto e próprio C com vértice na origem no espaço das coordenadas
x, associamos a C o cone dual convexo fechado C◦ no espaço dos momenta k, representado
pelo conjunto (veja a Figura 6.8)
3 4
C◦ = k ∈ Rn | ky " 0, ∀ y ∈ C .
C◦
ky = 0
Figura 6.8: O cone C e seu dual C◦ .
Da mesma forma, todo cone convexo fechado C◦ é o cone dual de precisamente um cone
convexo, aberto e próprio C, representado pelo conjunto
3 4
C = y ∈ Rn | ky > 0, ∀ k ∈ C◦ \ {0} .
463
◦
Nota 6.23. Um cone é chamado auto-dual se C◦ = C. Temos que C◦ = C = Ch(C)◦ e
C◦◦ = Ch(C), em que Ch(C) denota o envelope convexo de C.36 Os cones-de-luz do futuro,
V+ , e do passado, V− = −V+ , respectivamente, com seus interiores sendo representado por V+
3 4
V+ = x ∈ R4 | x2 > 0, x0 > |⃗x| ,
são importantes cones auto-duais.
DEFINIÇÃO 6.24. A função hC definida por
hC (k) = sup(−ky) , k ∈ Rn ,
y∈C
é chamada função suporte do cone C. Dado um cone C, o número

, -
hCh(C) (k)
ρC = sup
k∈(Rn \C◦ ) hC (k)
caracteriza a convexidade de C. Um cone C é convexo se, e somente se, ρC = 1. Além disto, se

um cone é aberto e consiste de um número finito de componentes, então ρC < ∞.
! "
Nota 6.24. Da definição acima segue que C◦ = k ∈ Rn | hC (k) # 0 . Além disto,
hC (k) # hCh(C) (k) para todo k ∈ Rn e hC (k) = hCh(C) (k) para k ∈ C◦ .
DEFINIÇÃO 6.25. Seja u ∈ S ′ (Rn ) e suponha que T (x + iy) seja uma função analítica no
tubo T (C) = Rn + iC, para algum cone convexo, aberto e próprio C. Diz-se que T (x + iy)
admite a distribuição temperada u como seu valor limite sobre os reais, se para toda função teste
ϕ ∈ S (Rn ) tem-se $
dx T (x + iy)ϕ(x) −→ u(ϕ) ,
Rn
quando y → 0 dentro do cone C. Então dizemos que u é o valor limite de T , no sentido

distribucional.
DEFINIÇÃO 6.26 (Função espectral). Seja f (z) analítica no domínio tubo T (C) = Rn + iC.
Diz-se que a distribuição g ∈ D ′ (Rn ) é a função espectral da função f (z) se as seguintes
propriedades são satisfeitas:
(i) e−ky g(k) ∈ S ′ (Rn ) para todo y ∈ C;

8 9 d
(ii) f (z) = F g(k)e−ky (x) = dk g(k)eikz para todo z ∈ T (C). Nos referimos ao
suporte da função espectral g(k) como o espectro da função f (z).
Note que na definição acima, f (z) é a transformada de Fourier-Laplace da função espectral

g(k).
Seja Ω um subconjunto aberto em Cn . Denotamos por O(Ω) o espaço de funções analíticas

em Ω.
36
Se X é um espaço vetorial e Y um subconjunto de X não necessariamente convexo, então Ch(Y ) é o
menor subconjunto convexo de X que contém Y .
464
DEFINIÇÃO 6.27. Seja Z uma vizinhança complexa de Rn ⊂ Cn . Diz-se que uma função
analítica f (z) ∈ O(Z ∩ T (C)) é de crescimento temperado se existem um inteiro α e uma
constante M, que depende de C, tais que
5 5
5f (x + i y)5 # M(C) |y|−α , (6.12.7)
para todo z = x + iy em Z ∩ T (C).
Distribuições que são valores limite de funções analíticas de crescimento temperado surgem
naturalmente para uma classe especial de distribuições temperadas como mostra o seguinte
TEOREMA 6.23. Sejam Z uma vizinhança complexa de Rn ⊂ Cn e T (C) = Rn + iC um tubo,

para algum cone convexo, aberto e próprio C. As duas seguintes propriedades são equivalentes
para uma distribuição u ∈ S ′ (Rn ) cuja transformada de Fourier u
^ é uma função de quadrado
−n 2 s/2
integrável com respeito à medida (2π) (1 + |k| ) dk:
^ ⊂ C◦ , em que C◦ é o cone dual de C.

(i) supp u
(ii) u ∈ S ′ (Rn ) pode ser expressa como uma soma finita

m
<
u= bC′j (Tj (x + iy)) ,
j=1
com cada Tj (x+iy) ∈ O(Z∩T (C′j )) sendo de crescimento temperado, e em que bC′j (Tj (x+iy))
denota o valor limite em S ′ (Rn ) e C′j um cone compacto arbitrário contido em Cj . Além disso,
u admite u
^ como sua transformada de Fourier no sentido das distribuições temperadas.
Demonstração. Prova que (i) implica (ii). Seja C′ um cone compacto arbitrário contido em C
(veja a Figura 6.9). Assuma que C é da forma C = ∪m j=1 Cj , m < ∞, com cada Cj sendo um
cone convexo, aberto e próprio. Se C % C, então C = ∪m
′ ′ ′ ′
j=1 Cj com Cj % Cj .
C′
C
C \ B[0; 1]
C◦
prC
prC′
Figura 6.9: Cone C, cone dual C◦ e cone compacto C′ .
Defina T (C′j ) = Rn + iC′j , com C′j % Cj , e considere a fórmula

$ $
ik(x+iy)
. /
Tj (x + iy) = ^(k)e
dk u = dk e−ky u^(k) eikx , (6.12.8)
C◦ C◦
465
com Tj (x + iy) ∈ O(Z ∩ T (C′j )). Como u ^(k) ∈ S ′ (Rn ) (e assim u ^ ⊂ D ′ (Rn )), segue da
−ky
Definição 6.26 que e u ^(k) é uma distribuição temperada de decrescimento rápido. Escolha
um Y ∈ Cj arbitrário, porém fixo. Então para esta escolha existe δ(Y ) > 0 tal que ky =
|k||y| cos β " δ|k||Y | para k ∈ C◦ . Logo,
5 5
5 ik(x+iy) 5
5e 5 = e−|k||y| cos β # e−δ|k||Y | .
Agora, como por hipótese u ∈ Hs (Rn ), então o quadrado de (1+|k|)s |^ u(k)| pode ser estimado
2(s+N ) 37
pela função (1 + |k|) , em que s ∈ R e N ∈ Z"0 , que é integrável se 2(s + N) < −n
(prove isto com a ajuda do Lema 6.5), isto é, s < − n2 −N. Isto implica que existe uma constante
M tal que
u(k)| # M(1 + |k|)N .

|^ (6.12.9)
^ é limitada polinomialmente, e a presença do fator e−δ|k||Y | indica que podemos

Portanto, u
diferenciar sob o sinal de integração. Então note que
∂ . −ky / ∂ . −ky /
e u ^(k)eikx = ike−ky u
^(k)eikx = −i e u ^(k)eikx ,
∂xk ∂yk
que são as equações de Cauchy-Riemann para as variáveis complexas xj + iyj , k = 1, . . . , n.
Consequentemente, Tj (x + iy) é uma função analítica no tubo T (Cj ) = Rn + iCj , com base
Cj , visto que ela é infinitamente diferenciável no sentido complexo, isto é, o integrando em
(6.12.8) é uma solução do sistema de n equações de Cauchy-Riemann (veja Apêndice B)
∂ . −ky /
e u ^(k)eikx = 0 ,
∂z k
no tubo, em que , -
∂ 1 ∂ ∂
= +i , para k = 1, . . . , n .
∂z k 2 ∂xk ∂yk
A prova que cada Tj (x + iy) ∈ O(Z ∩ T (C′j )) é de crescimento temperado é obtida da

seguinte forma: considere novamente a fórmula
$
Tj (x + iy) = ^(k)eik(x+iy) .
dk u
C◦
Usando o teorema binomial, a estimativa (6.12.9) acima pode ser reescrita da seguinte forma:
N
<
u(k)| # M
|^ dα |k|α .
α=0
Como C′j é um cone tal que C′j % Cj , então existe c > 0 de maneira que ky " c|k||y|, para
todo k ∈ C◦ e para todo y ∈ C′j . Portanto, para x + iy ∈ Rn + iC′j ,
$ N
< $
−ky
|Tj (x + iy)| # dk |^
u(k)|e #M dα dk |k|α e−c|k||y| .
C◦ α=0 C◦
37
Estamos levando em conta que 1 + |k|2 # (1 + |k|)2 .
466
Usando um resultado relativo à integral de Lebesgue,38 obtemos

<N $ ∞
|Tj (x + iy)| # M dα ωn−1 dt tn+α−1 e−c|y|t # M1 (C′ )|y|−(n+N ) ,
j=0 0
em que ωn−1 é a área da esfera unitária em Rn . Isto prova que Tj (x + iy) é de crescimento
temperado.
A existência de valores limite no espaço S ′ (Rn ) é garantida com a ajuda do seguinte

LEMA 6.12 (Decomposição de u ∈ S ′ (Rn )). Seja C um cone aberto tal que C = ∪;
m
j=1 Cj , com
cada Cj sendo um cone convexo, aberto e próprio. Seja u ∈ S (R ); então u(x) = m
′ n
j=1 uj (x),
′ n
em que uj ∈ S (R ), para cada j = 1, . . . , m.
! "
Demonstração. Defina C◦j = k ∈ Rn | ky " 0, ∀y ∈ Cj os cones duais de Cj , tal que o
seguinte acontece:
Rn \ (∪m ◦
j=1 Cj ) e C◦j ∩ C◦k , j ̸= k , j, k = 1, . . . , m , (6.12.10)
são conjuntos de medida zero. Pelo Teorema 6.15 existe um elemento v ∈ S ′ (Rn ) tal que
v = F (u), e, portanto, u = F −1 (v). Denote por λj (k) a função característica de C◦j ,39 j =
1, . . . , m e defina vj = λj (k)v. Então, cada vj ∈ S ′ (Rn ) e supp vj ⊂ C◦j , com j = 1, . . . , m.
Para cada j = 1, . . . , m, tome uj = F −1 (vj ) e pelo Teorema 6.15, uj ∈ S ′ (Rn ) para cada j.
Seja ϕ ∈ S (Rn ) e ψ = ϕ ^ ∈ S (Rn ), então, pela Definição 6.16 e a hipótese (6.12.10), temos
que
m m
n m o
< 8 9 < 8 9 <
u(ϕ) = v(ψ) = vj (ψ) = uj (ϕ) = uj (ϕ) ,
j=1 j=1 j=1
;m
Assim u(x) = j=1 uj (x).
Voltando à prova do teorema, tome ϕ ∈ S (Rn ), então com a ajuda do Lema 6.12 temos
$
8 9
bCj (Tj (x + iy)) (ϕ) = ′ lim
′ dx Tj (x + iy)ϕ(x)
Cj ∋y→0 Rn
$ ($ )
= ′ lim dx u(k)eik(x+iy) ϕ(x)
dk λj (k)^
Cj ∋y→0 Rn C◦j
$
−ky
= ′ lim dk λj (k)^ ^
u(k)ϕ(−k)e
Cj ∋y→0 C◦j
$
= dk λj (k)^ ^
u(k)ϕ(−k)
C◦j
= uj (ϕ) .
38
Para detalhes veja L. Schwartz, “Mathematics for the Physical Sciences,” Capítulo 1, Seção 2.
39
Lembre-se que a função característica de um conjunto é a função que é igual a 1 em todo o conjunto e zero
fora do conjunto.
467
Portanto, usando a linearidade de u ∈ S ′ (Rn ) e a hipótese (6.12.10), obtemos

m
< m
< 8 9
u(ϕ) = uj (ϕ) = bC′j (Tj (x + iy)) (ϕ) .
j=1 j=1
limite de cada Tj (x + iy) existe em S ′ (Rn ), isto é u admite o valor limite

Logo, o valor ;
distribucional m j=1 bCj (Tj (x + iy)) no sentido da convergência fraca; porém do Corolário 1,
′
página 358, do livro de F. Treves, “Topological Vector Spaces, Distributions and Kernels,” a última
implica uma convergência forte visto que S (Rn ) é um espaço Montel.40 Isto completa a prova
da primeira parte do teorema.
A prova que (ii) implica (i) é obtida a partir das definições de suporte e transformada de
Fourier de uma distribuição. Com efeito,
$
^(ϕ) = dk u
u ^(k)ϕ(k) .
^(k) ⊂ C◦ , quando
Temos, então, que mostrar que a integral acima se anula se o supp u
◦ !
supp ϕ(k) ⊂ (C ) . Assim,
$ $
1
^(ϕ) =
u ^(k)ϕ(k) =
dk u dkdx u(x)ϕ(k)e−ikx .
(2π)n
Trocando x por x + iy, com y fixo tomado dentro do cone C,41 e assumindo que ϕ tem suporte
compacto contido em (C◦ )! , segue que
$ $
1
^(ϕ) =
u ^(k)ϕ(k) =
dk u dkdx T (x + iy)ϕ(k)e−ik(x+iy)
(2π)n
$
1 ky y→∞
= ^
dx T (x + iy)ϕ(x)e −−−→ 0 ,
(2π)n
quando ky < 0, o que implica que k ∈ supp ϕ(k) ⊂ (C◦ )! (veja a Figura 6.10). Logo, u
^(k)
decresce exponencialmente fora do cone C◦ . Isto prova que supp u
^(k) ⊂ C◦ .
C◦
C◦
C (C◦ )" ky = 0
y
C◦
supp ϕ
k
Figura 6.10: O suporte de ϕ.

40
No dual E ′ de um espaço Montel E, toda sequência que converge no sentido fraco, converge no sentido forte.
41
Isto é permitido porque T é analítica no tubo T (C).
468
6.12.3 Transformada de Fourier-Laplace de Distribuições Temperadas e o

Teorema “Edge of the Wedge”
Nosso próximo objetivo é apresentar a versão distribucional do celebrado Teorema “Edge of

the Wedge,” e o importante papel desempenhado pela analiticidade da transformada de Fourier-
Laplace de uma distribuição na prova do teorema. Este teorema classical da Análise Complexa
mostra que funções analíticas sobre dois “wedges” com um “edge” em comum são continuações
holomorfas uma da outra, desde que ambas coincidam sobre o “edge.” Na teoria dos campos
quantizados, o fato importante que as distribuições de Wightman de n-pontos são valores limite
de funções de Wightman “complexas” de n-pontos é mostrado por uma aplicação simples do
Teorema Edge of the Wedge. As funções de Wightman “complexas” de n-pontos são definidas
e analíticas em wedges com a parte imaginária de cada função situando-se no cone-de-luz
do futuro. Então, permutando-se as variáveis obtemos n! funções de Wightman diferentes
definidas em n! wedges diferentes. Aplicando-se o Teorema Edge of the Wedge (com o edge dado
pelo conjunto de pontos totalmente tipo-espaço) pode-se deduzir que as funções de Wightman
“complexas” são todas continuações analíticas da mesma função holomorfa, definida sobre uma
região conexa contendo todos os n! wedges. (A igualdade dos valores limite sobre o edge que
precisamos para aplicar o Teorema Edge of the Wedge segue do axioma da localidade). De fato,
a formulação e a primeira prova do teorema foram apresentadas por Nikolay Bogoliubov na
Conferência Internacional de Física Teórica, Seattle, EUA, Setembro de 1956 (e também publicada
no livro “Problems in the Theory of Dispersion Relations”) em conexão com a verificação das
relações de dispersão na teoria dos campos quantizados. Provas adicionais e generalizações
do teorema foram dadas por R. Jost e H. Lehmann (1957), F. Dyson (1958), H. Epstein (1960),
entre outros.42 Todas as demonstrações (das várias versões) do Teorema Edge of the Wedge
estabelecem condições suficientes para garantir a continuação analítica de funções holomorfas
definidas em wedges no espaço complexo Cn com edge no espaço real Rn .
TEOREMA 6.24 (Versão original do Teorema de Bogoliubov). Seja C um cone aberto e próprio
com vértice na origem e denote por Cr = C∩B(0; r) a interseção de C com a bola aberta de raio
r > 0 centrada na origem. Para um conjunto aberto não-vazio E ⊂ Rn introduza os wedges
W ± = E ± iCr com edge comum E. Se F1 é uma função holomorfa sobre W + e F2 é uma
função holomorfa sobre W − e se F1 e F2 têm os mesmos valores limites sobre E
lim F1 (x + iy) = lim F2 (x − iy), x∈E , (6.12.11)
y→0 y→0
y∈Cr y∈Cr
então F1 e F2 têm uma extensão holomorfa comum para uma vizinhança complexa Ω de
W + ∪ E ∪ W −.
Nota 6.25. Naturalmente, em (6.12.11) é importante especificar em que sentido os valores limites
são considerados. Na versão de Bogoliubov estes valores limites foram tomadas segundo a
topologia das distribuições de Schwartz. Notamos também que, para n = 1 e quando os valores
limites são tomados no sentido de funções contínuas, este resultado é facilmente demonstrado
usando o Teorema de Morera para funções de uma variável complexa.
O seguinte teorema é uma versão para o caso das distribuições temperadas.

42
Para uma boa fonte de revisão sobre o Teorema “Edge of the Wedge,” veja o artigo de V.S. Vladimirov, V.V.
Zharinov and A.G. Sergeev, “Bogolyubov’s “edge of the wedge” theorem, its development and applications, Uspekhi
Mat. Nauk 49 (1994) 47-60; English transl. Russian Math. Surveys 49, No. 5 (1994), 51-65.
469
TEOREMA 6.25 (Versão do Teorema “Edge of the Wedge” de Epstein). Seja C um cone aberto
da forma C = C1 ∪ C2 , em que cada Cj , com j = 1, 2, é um cone convexo, aberto e próprio.
Denote por Ch(C) o envelope convexo do cone C. Assuma que os valores limites distribucionais
de duas funções analíticas fj (z) ∈ O(Z ∩ T (Cj )) de crescimento temperado, com j = 1, 2,
coincidam, isto é, u = bC1 (f1 (z)) = bC2 (f2 (z)), em que u ∈ S ′ (Rn ) de acordo com o Teorema
6.23. Então existe uma função F (z) ∈ O(Z ∩ T (Ch(C))) de crescimento temperado tal que
F (z) = fj (z) sobre o domínio de definição de cada fj (z), j = 1, 2.
Demonstração. Por hipótese bC1 (f1 (z)) = bC2 (f2 (z)) em S ′ (Rn ), e chamamos este valor
comum u. Denote por SC′◦ (Rn ) o subespaço de S ′ (Rn ) de distribuições temperadas com
suporte no cone C◦ :
3 4
SC′◦ (Rn ) = v ∈ S ′ (Rn ) | supp v ⊆ C◦ .
Pelo Teorema 6.15, existe um único vj ∈ SC′◦ (Rn ) tal que bCj (fj (z)) = F [vj8], com j =91, 2, e
isto
d implica que vj = F −1 [bCj (fj (z))]. Pela Definição 6.26 cada fj (z) = F vj (k)e−ky (x) =
dk vj (k)eikz para todo z ∈ Z ∩ T (C), e pelo Teorema 6.23 cada fj (z) é de crescimento
′ n
temperado. Usando estes fatos temos que v1 = v2 em ! SC◦ (R ). Chamamos este
" valor
! comum
v e assim " u = F [v]. Visto que supp vj ⊆ C = k !∈ R | ky " 0, y ∈ C"j = k ∈ Rn |
◦ n
hC (k) # 0 , j = 1, 2, então v desaparece sobre ∪2j=1 k ∈ Rn | hCj (k) > 0 . De fato, tome
hC (k) = max hCj (k) . (6.12.12)

j=1,2
Da Definição 6.24, temos hCh(C) (k) # ρC hC (k), com 1 # ρC < ∞. Assim, por (6.12.12)
hCh(C) (k) # ρC max hCj (k) . (6.12.13)

j=1,2
! " ! "
Considere agora o conjunto k ∈ Rn | hCh(C) (k) > 0 . Se k ∈ k ∈ Rn | hCh(C) (k) > 0 ,
! " !
então por (6.12.13), k ∈ k ∈ Rn | maxj=1,2 hCj (k) > 0 . Portanto, k ∈ ∪2j=1 k ∈ Rn |
" !
hCj (k) > 0 , e sobre esse conjunto v desaparece. Logo, v desaparece se k ∈ k ∈ Rn |
" ! " !
hCh(C) (k) > 0 , e isto implica que supp v ⊆ C◦ = k ∈ Rn | ky " 0, y ∈ Ch(C) = k ∈
"
Rn | hCh(C) (k) # 0 .
Escolha uma função F (z) tal que

$
8 9
F (z) = F v(k)e−ky (x) = dk v(k)eikz , z ∈ Z ∩ T (Ch(C)) , (6.12.14)
′
com v ∈ SCh(C) ◦
(Rn ). Já que Ch(C) é um cone convexo aberto, temos exatamente pela prova
do Teorema 6.23 que F (z) ∈ O(Z ∩ T (Ch(C))) e é de crescimento temperado. Além disto,
usando o fato que v1 = v2 = v, da Definição 6.26
8 9 8 9
fj (z) = F vj (k)e−ky (x) = F v(k)e−ky (x) , z ∈ Z ∩ T (C) . (6.12.15)
Finalmente, combinando (6.12.14) e (6.12.15) segue que F (z) coincide com fj (z), j = 1, 2, sobre
o domínio de definição de cada fj (z).
470
COROLÁRIO 6.6. Suponha que as hipóteses do Teorema 6.25 sejam válidas com C1 e C2 opostos
um ao outro. Então F (z) é um polinômio em z ∈ Cn , e portanto uma função analítica inteira
em Cn .
n
Demonstração. Como C2 = −C1 , então Ch(C1 ∪ −C ! 1 ) = R , T (Ch(C)) =
" Cn e isto implica
que k ∈ C◦1 ∩ −C◦1 , que por sua vez implica que k ∈ Rn | hCh(C) (k) # 0 = {0}, em que 0
indica a origem de Rn . Aplicando o Teorema
8 6.25 obtemos
9 um elemento v ∈ S ′ (Rn ) que tem
suporte na origem tal que F (z) = F −1 v(k)e−ky (x). Pelo Teorema 6.3 v é uma combinação
linear finita de derivadas distribucionais da função delta de Dirac. Assim, F (z) definida por
(6.12.14) é um polinômio em z ∈ Cn .
O seguinte teorema é uma consequência imediata do Teorema “Edge of the Wedge” e reflete
um dos princípios mais importantes que regem o comportamento de funções analíticas, ou seja,
a determinação de uma função a partir de seus valores em um conjunto não-vazio, aberto e
real. Antes vamos definir o que entendemos por um conjunto simétrico com respeito a Rn .
DEFINIÇÃO 6.28. Seja U um subconjunto de Cn . Dizemos que U é simétrico com respeito a
Re Cn , se para todo z ∈ U seu conjugado z̄ ∈ U. Neste caso, U+ e U− denotarão os conjuntos
{x + iy ∈ U | y " 0} e {x + iy ∈ U | y # 0}, respectivamente (veja a Figura 6.11 ).
U+
z
Re Cn
z̄
U−
Figura 6.11: Conjunto simétrico com respeito a Rn .
TEOREMA 6.26. Seja C um cone convexo aberto. Tome f (z) ∈ O(Z ∩ T (C)) de crescimento
temperado de acordo com o Teorema 6.23. Se o valor limite distribucional bC (f (z)) de f (z) no
sentido das distribuições temperadas desaparece, então a função f (z) ≡ 0.
Demonstração. Tome f (x + iy) = u(x, y) + iv(x, y) e defina
g(x + iy) = f (x − iy) = u(x, −y) − iv(x, −y)
= a(x, y) + ib(x, y) ,
em que a(x, y) = u(x, −y) e b(x, y) = −v(x, −y). Decorre da equação acima e das relações
de Cauchy-Riemann que
∂a(x, y) ∂u(x, −y) ∂v(x, −y) ∂b(x, y)
= = =
∂x ∂x ∂y ∂y
∂a(x, y) ∂u(x, −y) ∂v(x, −y) ∂b(x, y)

=− = =− .
∂y ∂y ∂x ∂x
471
Portanto, a função g(z) satisfaz as relações de Cauchy-Riemann, logo é analítica em Z ∩ (Rn −

iC). É imediato mostrar que g(z) satisfaz (6.12.7) e aproxima-se de 0 quando y → 0. Para tanto,
basta tomar um cone −C′ % −C e repetir o desenvolvimento feito na prova do Teorema 6.23
(observando que ky < 0). Assim aplicamos o Teorema “Edge of the Wedge” para f (z) e g(z).
Visto que Ch(C ∪ −C) = Rn , então pelo Corolário 6.6 F (z), a continuação analítica de f (z) e
g(z), é um polinômio em z ∈ Cn , e portanto uma função analítica inteira em Cn . Entretanto,
por hipótese bC (F (z)) desaparece como uma distribuição e, portanto, como uma função junto
com f (z) identicamente.
Existe uma extensão do Teorema “Edge of the Wedge” para o caso quando existem vários
wedges em vez de dois, como mostra o
TEOREMA 6.27 (Versão do Teorema “Edge of the Wedge,” de Martineau). Sejam C1 , . . . , Cm

cones convexos, abertos e próprios em Rn . Dado qualquer conjunto de m cones convexos abertos
C′j tal que C′j % Cj , j = 1, . . . , m, então as seguintes duas propriedades de um conjunto de m
funções fj (z) ∈ O(Z ∩ T (Cj )) de crescimento temperado, j = 1, . . . , m, são equivalentes:
;m
P1 . O valor limite distribucional u = j=1 bCj (fj (z)) ∈ S ′ (Rn ) desaparece identicamente.
P2 . Denote por Ch(Cj ∪ Cℓ ) o envelope convexo de Cj ∪ Cℓ . Para cada par de índices (j, ℓ),
1 # j, ℓ # m, existe uma função holomorfa gjℓ (z) ∈ O(Z ∩ T (Ch(Cj ∪ Cℓ ))) de crescimento
temperado tal;que gjℓ (z) + gℓj (z) = 0, ∀ j, ℓ = 1, . . . , m – logo gjj (z) = 0, ∀ j = ℓ – e tal
que fj (z) = m ′
ℓ=1 gjℓ (z) sobre Z ∩ T (Cj ), para cada j = 1, . . . , m.
Demonstração. Começamos provando que P2 → P1 . Assuma gjℓ (z) ∈ O(Z ∩ T (Ch(Cj ∪

Cℓ ))) de crescimento temperado. Por hipótese temos
m
<
fj (z) = gjℓ (z) , z ∈ Z ∩ T (C′j ) .
ℓ=1
Então,
6<
m 7
bCj (fj (z)) = bCj gjℓ (z) quando C′j ∋ y → 0 .
ℓ=1
Portanto, levando em conta a anti-simetria das funções gjk (z), segue que
m 6
m
< < m
.< /7 6<
m <
m 7
bCj (fj (z)) = bCj gjℓ (z) = bCj gjℓ (z) ≡ 0 .
j=1 j=1 ℓ=1 j=1 k=1
Prova que P1 → P2 . If m = 1, P1 → f1 ≡ 0 pelo Teorema 6.26. Portanto, assumimos

m " 2. Seja uj = bCj ((fj (z)) ∈ S ′ (Rn ) quando C′j ∋ y → 0. Então, existe ujℓ ∈ S ′ (Rn )
; ;m
tal que uj = m ℓ=1 ujℓ com a restrição que ujℓ + uℓj = 0. Assim j=1 uj ≡ 0. Denote por
SC◦ (R ) o subespaço de S (R ) de distribuições temperadas com suporte no cone C◦ :
′ n ′ n
3 4
SC′◦ (Rn ) = v ∈ S ′ (Rn ) | supp v ⊆ C◦ .
472
Pelo Teorema 6.15, existe um único vj ; ∈ SC′◦ (Rn ) tal;que uj = F [vj ], com
;m j = 1, . . . , m, e isto
−1 −1 m m −1
implica
;m que vj = F [u j ] = F [
;m ℓ=1 jℓ;mu ] = F [u;jℓ ] = vjℓ . Uma
ℓ=1 ; vez que
m ;m
ℓ=1
−1 −1 m
j=1 uj ≡ 0, segue que F [ j=1 uj ] = j=1 F [uj ] = j=1 vj = j=1 ℓ=1 vjℓ ≡
0. Logo, vjℓ + vℓj = 0.
Pela Definição 6.26, para cada vj ∈ SC′◦ (Rn ) temos que

$
8 −ky
9
fj (z) = F vj (k)e (x) = dk vj (k)eikz
$ m
<
= dk vjℓ (k)eikz (6.12.16)
ℓ=1
m 6$
< 7
ikz
= dk vjℓ (k)e
ℓ=1
para todo z ∈ Z ∩ T (C′j ), e pelo Teorema 6.23 cada fj (z) é de crescimento temperado.
Tome agora $
gjℓ (z) = dk vjℓ (k)eikz , (6.12.17)
tal que z ∈ Z ∩ T (Ch(Cj !∪ Cℓ )). Pode-se mostrar, pela mesma análise

" realizada no Teorema
◦ n
6.25, que supp vjℓ ⊆ C = k ∈ R | ky " 0, ∀ y ∈ Ch(Cj ∪ Cℓ ) . Visto que Ch(Cj ∪ Cℓ ) é
um cone convexo aberto, temos, novamente e exatamente como na prova do Teorema 6.25, que
gjℓ (z) ∈ O(Z ∩ T (Ch(Cj ∪ ;Cℓ )) e é crescimento temperado. Assim, combinando (6.12.16) e
(6.12.17) temos que fj (z) = m g
ℓ=1 jℓ (z) em Z ∩ T (C ′
j ) com a restrição que gjℓ + gℓj = 0.
6.13 Análise Microlocal de Singularidades

Em geral não é possível definir o produto de duas distribuições se elas contêm singularidades
em comum. Este é o caso típico do que acontece quando tomamos produtos de propagadores
de Feynman na teoria quântica dos campos. Nesta seção, nosso objetivo será mostrar sob quais
condições esta operação pode ser realizada.
Uma condição suficiente para um produto de distribuições ser bem definido segue de um
teorema de Hörmander (veja o Teorema 6.30). Um conceito importante na prova do teorema
é a noção do conjunto de frente de ondas (W F ) de uma distribuição.43 Este conceito, que
representa um refinamento no estudo da estrutura das singularidades de distribuições, fornece
uma descrição detalhada das singularidades de uma distribuição em termos do comportamento
assintótico de sua transformada de Fourier44 (isto dá uma formulação precisa do fato que as
singularidades de uma distribuição podem ser localizadas assintoticamente no espaço de fase,
isto é, simultaneamente no espaço das posições e assintoticamente no espaço dos momenta).
43
Usaremos a abreviação W F para o Conjunto de Frente de Ondas (do inglês Wavefront Set).
44
A definição do conjunto de frente de ondas é motivada pelo Teorema de Paley-Wiener (Teorema 6.21), que
caracteriza uma função suave (ou de C ∞ ) com suporte compacto por uma condição de crescimento sobre sua
transformada de Fourier.
473
Na análise de Fourier, o conceito do conjunto de frente de ondas está fundamentado na

análise que investiga a suavidade de uma distribuição u no espaço de fase Rnx × (Rnk \ {0}).
Neste caso, os pontos (x, k) ∈ Rnx × (Rnk \ {0}) não somente nos diz em que pontos u
é singular, mas também especificam as direções singulares k no espaço dual, responsáveis
pelo “mau” comportamento da transformada de Fourier u ^(k) quando k → ∞. Este “mau”
comportamento da transformada de Fourier por sua vez está diretamente relacionado à não-
suavidade de u no ponto x no espaço das posições. Assim, usualmente estaremos interessados
nos valores dos k ′ s ̸= 0. Em síntese, a ideia central da análise microlocal é tratar a questão das
singularidades de distribuições mais local do que o habitual, introduzindo a direção cotangencial
em cada ponto.
6.13.1 Conjunto de Frente de Ondas de Distribuições
Se u(x) é uma distribuição de suporte compacto, isto é, se u ∈ E ′ (Rn ), podemos examinar

se u(x) é uma função suave examinando o comportamento de sua transformada de Fourier
^(k) no infinito. Com efeito, no Teorema 6.21 (Teorema Paley-Wiener para C0∞ ) se restrigirmos
u
a função f^(ζ) a Rn , imediatamente obtemos que a transformada de Fourier de uma função
suave f , com suporte na bola {x ∈ Rn | |x| # R}, satisfaz a seguinte estimativa:
|f^(k)| # CN (1 + |k|)−N < ∞ , ∀ N ∈ N; k ∈ Rn .
Portanto, como consequência do Teorema Paley-Wiener, podemos examinar se u ∈ E ′ (Rn ) é

suave recorrendo-se ao seguinte
TEOREMA 6.28. u ∈ E ′ (Rn ) é suave se, e somente se, para todo N ∈ N existe uma constante
CN tal que
u(k)| # CN (1 + |k|)−N < ∞ ,
|^ ∀ N ∈ N; k ∈ Rn . (6.13.1)
E se u ∈ E ′ (Rn ) não é suave? Neste caso, pode ocorrer que em certas direções k sua
transformada de Fourier u ^(k) ainda seja assintoticamente limitada. Nesse caso, o conjunto
formado pelos k ′ s para os quais a transformada de Fourier u ^(k) ainda satisfaz a estimativa
(6.13.1) é chamado conjunto de direções regulares de u(x). As direções ao longo das quais u
^(k)
não decai suficientemente rápido servem para caracterizar as singularidades de u(x).
DEFINIÇÃO 6.29. Nós definimos o conjunto Σ(u) ∈ Rn \ {0}, dizendo que k ∈ Σ(u) se existe
uma vizinhança cônica C de k de tal forma que a estimativa (6.13.1) acontece em C para todo
N ∈ N.
Nota 6.26. Segue imediatamente da definição que Σ(u) é um conjunto cônico fechado. Além
disso, observe que uma distribuição u(x) é induzida por uma função suave se, e somente se,
Σ(u) = ∅!
PROPOSIÇÃO 6.10. Sejam u ∈ E ′ (Rn ) e φ ∈ C ∞ (Rn ). Então, Σ(φu) ⊂ Σ(u).
Demonstração. Primeiro, tome φ ∈ C0∞ (Rn ). Escolha um k, tal que k ∈ / Σ(u), e uma
vizinhança cônica C de k onde a estimativa (6.13.1) acontece. Agora, tome uma vizinhança
474
cônica menor C′ de k tal que C′ % C; então provaremos que a estimativa (6.13.1) é satisfeita
para o produto φu ∈ C′ . Para isto, escolha uma constante c tal que, para todo k̃ ∈ C′ , a
bola fechada de raio c|k̃|, centrada em k̃, situa-se completamente em C (veja a Figura 6.12).
Com efeito, tome c < d(C′ ∩ S n−1 , C! ). Então a desigualdade |k − k̃| < c|k̃| implica que
|(k/|k̃|) − (k̃/|k̃|)| < c; logo (k/|k̃|) ∈ C′ e k ∈ C′ visto que C′ é um cone.
C′
k̃ C
C"
S n−1
Figura 6.12: Os cones C e C′ .
A transformada de Fourier de φu é igual à convolução da da transformada de Fourier,

$
p
φu(k̃) = (2π) −n ^ k̃ − k)^
dk φ( u(k) (6.13.2)
Pelo Teorema 6.22, em particular, a transformada de Fourier de u é limitada polinomialmente

sobre R, isto é:
u(k)| # C(1 + |k|)M ,

|^ (6.13.3)
para algum M ∈ N. A integral (6.13.2) pode ser dividida como:

$ $
I1 + I2 = + .
|k−k̃|#c|k̃| |k−k̃|"c|k̃|
Na primeira integral k ∈ C; assim
u(k)| # CN (1 + |k|)−N # CN′ (1 + |k̃|)−N ,

|^
visto que, segunda desigualdade triangular, temos que |k| − |k̃| " −|k − k̃| " −c|k̃|, e isto
implica que |k| " (1 − c)|k̃|. Consequentemente,
$
′
|I1 | # CN (1 + |k̃|) −N ^ k̃ − k)| .
dk |φ( (6.13.4)
Para estimar a integral I2 , note que para |k − k̃| > c|k̃|, novamente pela segunda desigualdade
triangular, temos que |k − k̃| " |k| − |k̃| " |k| − c−1 |k − k̃|, e isto implica que
c
|k − k̃| " |k| , (6.13.5)
1+c
475
As estimativas (6.13.1) e (6.13.3) implicam que, para qualquer escolha de N,

$
|I2 | # C dk (1 + |k − k̃|)−N −M −n−1(1 + |k|)M .
|k−k̃|"c|k̃|
O integrando acima é limitado por
(1 + |k − k̃|)−N (1 + |k − k̃|)−M −n−1(1 + |k|)M # C1 (1 + |k̃|)−N (1 + |k|)−n−1 ,
por causa desigualdade (6.13.5). Consequentemente,
|I2 | # C2 (1 + |k̃|)−N .
A última estimativa junto com (6.13.4) implica que
p k̃) # C3 (1 + |k̃|)−N .
φu(
Isto prova a proposição no caso em que φ ∈ C0∞ . Por outro lado se a função φ não é de
suporte compacto, então podemos encontrar uma função φ′ ∈ C0∞ que coincide com φ na
vizinhança do suporte de u. Neste caso, claramente temos que φu = φ′ u, o que completa a
prova.
No caso em que a distribuição u não é de suporte compacto, ainda assim podemos verificar
se sua transformada de Fourier decai rapidamente em uma certa região V , recorrendo-se à
técnica da localização. A técnica consiste em multiplicar a distribuição u por uma função suave
φ com suporte contido na região V , isto é, φ(x) ̸= 0, para todo x ∈ V . A distribuição φu
pode, então, ser vista como uma distribuição sobre Rn de suporte compacto. Nesse caso, a
transformada de Fourier φup é bem definida como uma distribuição sobre Rn se a estimativa
(6.13.1) é satisfeita.
TEOREMA 6.29. Sejam u ∈ S ′ (Rn ) e φ ∈ C0∞ (V ). Então,
p
(i) φu(k) = u(φeikx );
p
(ii) Se u|V é suave, segue que |φu(k)| # C(φ, N)(1 + |k|)−N < ∞ para todo N ∈ N e
n
k∈R .
Demonstração. Para provar (i) usamos o fato que a transformada de Fourier de um produto é
a convolução das transformadas de Fourier. Logo,
$
p −n ^
φu(k) = (2π) (φ ∗ u ^)(k) = (2π) −n ^ − p)^
dp φ(k u(p)
$
= dx u(x)φ(x)eikx
= u(φeikx ) .
476
A prova de (ii) é análoga, em argumentos, àquela do Teorema 6.21. Por integrações por
partes, obtemos:
$ |α| $
p ikx (−i)
φu(k) = dx φu(x)e = α
dx φu(x)(Dxαeikx ) ,
x∈V
k x∈V
ou $
αp |α|
k φu(k) = i dx eikx (Dxα φu(x)) . (6.13.6)
x∈V
Tomando o valor absoluto de ambos os lados da eq.(6.13.6), temos que:

5$ 5 $
α p
5 5
|k ||φu(k)| = 5 5 dx e (Dx φu(x))55 #
ikx α
dx |Dxα φu(x)| < ∞ .
x∈V x∈V
Isto prova o teorema.
Quando uma distribuição u ∈ S ′ (Rn ) é singular em x e φ ∈ C0∞ (V ), tal que φ(x) ̸= 0,

então, φu é singular em x e tem suporte compacto. Em algumas direções a transformada de
p pode ainda ser assintoticamente limitada. Por isso, se u, v ∈ S ′ (Rn ) são singulares
Fourier φu
no mesmo ponto x, ainda assim o produto dessas distribuições pode ser definido se cada
direção no espaço dos momenta é “boa” para u ou v. Para verificarmos isto, localizamos as
distribuições u e v em uma vizinhança arbitrariamente pequena da singularidade, nesse caso
p e φv
φu p serão singulares em x e de suporte compacto. A seguir analisamos o resultado no
espaço de Fourier. Para ilustrar esta situação, vamos usar o fato que a transformada de Fourier
de um produto é a convolução das transformadas de Fourier, e considerar o seguinte
Exemplo 6.20. Considere as duas distribuições definidas por
$ ∞ $ ∞
ϕ(x) ϕ(x)
u(ϕ) = lim dx e v(ϕ) = lim dx .
ε→0 −∞ x + iε ε→0 −∞ x − iε
Se pudermos definir o produto do tipo u pv = u^ ∗ v^, então podemos esperar que o produto da
forma uv seja bem definido. De fato, assumindo-se que a operação de convolução de duas
distribuições u
^ e v^ está definida, podemos tomar a transformada de Fourier inversa como a
definição do produto das distribuições. Vamos, consequentemente, computar a transformada de
Fourier de u e v. É fácil mostrar que suas transformadas de Fourier são dadas por:
^(k) = −2πiθ(−k)
u e ^
v (k) = 2πiθ(k) , (6.13.7)
em que ⎧ ⎧
⎨1 se k > 0 ⎨0 se k " 0
θ(k) = e θ(−k) = .
⎩0 se k # 0 ⎩1 se k < 0
Agora, fica fácil ver que podemos computar o produto ^ v ∗ v^

$ ∞ $ ∞
−2
(2π) dp v^(k − p)^
v (p) = − dp θ(k − p)θ(p)
−∞ −∞
$ ∞
=− dp θ(k − p) .
0
477
Realizando a mudança de variável k − p = r na última integral, então

$ ∞ $ −∞ $ k $ k
−2
(2π) dp v^(k − p)^
v(p) = dr θ(r) = − dr θ(r) = − dr
−∞ k −∞ 0
= −k = −kθ(k) = (2π)−1 ik^

v (k) . (6.13.8)
Da mesma forma, podemos mostrar que o produto u ^∗u ^ existe, mas não o produto u^ ∗ v^. É
fácil ver que a razão para que isto aconteça está relacionada com o suporte de u
^ e v^. Portanto,
devemos esperar que os produtos uu and vv existem, mas não o produto uv.
O exemplo acima nos mostra que apesar de u e v serem singulares em x = 0, suas

transformadas de Fourier não têm “mau” comportamento em todas as direções. Isso sugere a
seguinte definição:
DEFINIÇÃO 6.30. Seja u ∈ S ′ (Rn ). O par ordenado (x, k) ∈ Rn × (Rn \ {0}) é chamado um
ponto descrevendo uma direção regular dos altos momenta para u(x) se, e somente se, existe uma
vizinhaça V de x, uma vizinhaça cônica M de k e uma função φ ∈ C0∞ (V ), com φ(x) ̸= 0,
tal que a transformada de Fourier de φu é assintoticamente limitada quando |k| → ∞, isto é,
existe uma constante Cφ,N tal que
p
|φu(k)| # Cφ,N (1 + |k|)−N < ∞ ∀N ∈ N; k ∈ Rn . (6.13.9)
Então, o conjunto de frente de ondas W F (u) da distribuição u consiste dos pares ordenados
p não decai suficientemente
(x, k) ∈ Rn × (Rn \ {0}) para os quais a transformada de Fourier φu
rápido ao longo da direção k, para |k| → ∞.
O conjunto de frente de ondas W F (u) é cônico no sentido que ele fica invariante quando
multiplicamos a segunda variável por um escalar positivo; isto é, se k ∈ W F (u) então λk ∈
W F (u) para todo λ > 0. Assim, (x, k) é um ponto descrevendo uma direção regular se a
“localização” φu de u próximo a x tem transformada de Fourier decaindo mais rápido do que
qualquer potência inversa de |k| em um cone em torno de k.
Exemplo 6.21. O conjunto de frente de ondas da distribuição δ ∈ S ′ (R) é
3 4
W F (δ) = (0, k) | k ∈ R \ {0} .
Isto pode ser visto diretamente de sua transformada de Fourier (localizada)

p
φδ(k) = δ(φeikx ) = φ(0) ,
que não decai rapidamente qualquer que seja a direção k. Isto significa que a transformada de
Fourier da distribuição δ não satisfaz a condição de decaimento de suavidade do Teorema 6.28.
Em outras palavras, no espaço-k todas as direções são direções de propagação de singularidades!
Exemplo 6.22. (Exemplo 6.20 revisitado) As distribuições u(x) = 1/(x + i0) e v(x) = 1/(x −
i0) têm conjunto de frente de ondas
3 4 3 4
W F (u) = (0, k) | k ∈ R− \ {0} e W F (v) = (0, k) | k ∈ R+ \ {0} ,
478
respectivamente. Isto é uma consequência diretamente das transformadas de Fourier, u ^(k) =

−2πiθ(−k) e ^ v(k) = 2πiθ(k). Portanto, a condição de decaimento de suavidade do Teorema
6.28 é satisfeita para todo k " 0, no caso da distribuição u, enquanto que a mesma condição
é satisfeita para todo k # 0, no caso da distribuição v. De fato, pela definição do conjunto de
frente de onda, temos de considerar a taxa de decrescimento no infinito de
. /
p
φu(k) = φ^ ∗ u^ (k) ,
em que φ ∈ C0∞ , com o suporte de φ estando em alguma vizinhança da origem, φ(0) ̸= 0.

Uma vez que, φ^ decresce no infinito mais rápido do que qualquer polinômio, a convolução φ^ ∗ u
^
tem a mesma propriedade quando k → +∞, mas não quando k → −∞ porque
$ ∞
. /
lim φ^ ∗ u^ (k) = (2π) −2
lim ^ − p)^
dp φ(k u(p)
k→−∞ k→−∞ −∞
$ ∞
= −i(2π) −1
lim ^ − p)θ(−p)
dp φ(k
k→−∞ −∞
$ 0
= −i(2π) −1
lim ^ − p)
dp φ(k
k→−∞ −∞
= −kθ(k) = (2π)−1ik^
v (k) .
Em resumo, este exemplo nos revela que, ao contrário da distribuição δ, o conjunto de frente
de ondas nem sempre contém o espaço de Fourier completo para todos os pontos do suporte
singular de uma distribuição.
A seguir colecionamos alguns resultados importantes sobre o conjunto de frente de ondas:
1. O conjunto W F é independente do sistema de coordenadas escolhido, e pode ser descrito

localmente.
2. Da definição do conjunto de frente de ondas W F (u), segue que a projeção sobre a pri-
meira coordenada π1 (W F (u)) → x, consiste daqueles pontos que não têm vizinhanças
onde u é uma função suave. A projeção sobre a segunda coordenada π2 (W F (u)) →
Σx (u) é o cone em torno de k (Figura 6.13) ligado a tal ponto, indicando o conjunto de
direções no espaço dos momenta responsáveis pelo aparecimento de uma singularidade
naquele ponto.
Figura 6.13: Cone em torno de k.
479
3. O conjunto W F de uma função suave é o conjunto vazio.
4. Para toda função suave φ com suporte compacto temos que (cf. Proposição 6.10)
W F (φu) ⊂ W F (u) .
5. Para um operador diferencial parcial P , com coeficientes constantes, temos que
W F (P u) ⊆ W F (u) .
6. Se u e v são duas distribuições com conjunto de frente de ondas W F (u) e W F (v),

respectivamente, então o conjutno de frente de ondas da soma (u + v) está contido no
conjunto W F (u) ∪ W F (v).
Nota 6.27. Entre os anos de 1969 e 1972 houve uma “competição” acirrada no desenvolvimento
da análise microlocal entre duas escolas distintas: a escola de Mikio Sato e a escola Lars Hör-
mander. O resultado dessa competição culminou com trabalhos monumentais de Hörmander e
Duistermaat-Hörmander, por um lado, e Sato-Kawai-Kashiwara, por outro (cada artigo contendo
mais de 150 páginas, ou mais). O ponto fundamental dos artigos foi a formulação matemati-
camente rigorosa do princípio de Christiaan Huygens sobre propagação de ondas. No entanto,
as suas definições de conceitos fundamentais e suas provas dos mesmos resultados são, essen-
cialmente, diferentes. Sato et al. empregaram o conceito de espectro de singularidade SS(u),
enquanto Hörmander et al. empregaram o conceito de conjunto de frente de onda W F (u).
O conjunto de frente de ondas analítico, W Fa (u), introduzido por Hörmander mais tarde, de
fato, coincide com o espectro de singularidade SS(u) para distribuições u, mas a prova dessa
equivalência foi extremamente difícil. Uma razão é que Sato et al. empregaram conceitos de
grupos de cohomologia.
6.13.2 Produto de Distribuições: O Critério de Hörmander
No esquema perturbativo da teoria quântica dos campos sempre encontramos produtos de

distribuições de Feynman associados aos campos. Em geral não é possível definir tais produtos
se as distribuições têm singularidades em comum. Por outro lado, o conceito do conjunto de
frente de ondas nos permite obter uma condição suficiente que garante quando tais produtos
podem ser sensivelmente realizados. Em outras palavras, o problema do ultravioleta que aparece
quando tomamos o produto de distribuições de Feynman pode ser convenientemente analisado
através do seguinte teorema, cuja prova pode ser encontrada no Volume II, página 95, da coleção
de Reed-Simon.
TEOREMA 6.30 (Critério de Hörmander). Sejam u e v distribuições. Suponha que

3 4
W F (u) ⊕ W F (v) = (x, k1 + k2 ) | (x, k1 ) ∈ W F (u), (x, k2) ∈ W F (v) , (6.13.10)
não contenha qualquer elemento da forma (x, 0). Então o produto uv existe. Além disso
W F (uv) ⊂ W F (u) ∪ W F (v) ∪ (W F (u) ⊕ W F (v)) . (6.13.11)
480
Note que, pelo Critério de Hörmander, o produto de duas distribuições u e v está bem
definido em x se u, ou v, ou ambas distribuições são regulares em x. Se u e v são singulares
em x, o produto existe se a soma da segunda componente dos conjuntos de frente de ondas
de u e v em x é diferente de zero. Ou seja, de acordo com o teorema acima, podemos
multiplicar distribuições, mesmo que tenham um overlapping de singularidades, desde que os
seus conjuntos de frentes de ondas estejam em direções favoráveis. Com base nisso, fica claro
que o produto δ 2 (x) = δ(x)δ(x) não está bem definido, pois a condição de suficiência do
Teorema 6.30 que garante a existência do produto de distribuições não é respeitada. Por outro
lado, a n-ésima potência das distribuições u(x) = 1/(x + i0) e v(x) = 1/(x − i0) está bem
definida, apesar da singularidade em x = 0, enquanto que o produto uv não existe, pois não
respeita o critério de Hörmander.
6.13.3 Pseudo-Topologia de Hörmander
O Teorema 6.30 é frequentemente usado para garantir que o produto pontual de determinadas
distribuições existe, ou, mais geralmente, para garantir que certos mapeamentos lineares com o
kernel distribuicional tem uma ação bem definida sobre determinadas distribuições. Operações
com distribuições não são contínuas (mesmo que sejam bem definidas) na topologia usual de
distribuições. No entanto, são contínuas na pseudo-topologia de Hörmander definida como
segue: seja C um conjunto cônico fechado em Rn × (Rn \ {0}) e DC′ (Rn ) o conjunto de todas
as distribuições u sobre Rn com W F (u) ⊂ C. Dizemos que uma sequência (uj )j∈N ⊂ DC′ (Rn )
converge para u na pseudo-topologia de Hörmander se uj → u no sentido distribucional e se,
para qualquer vizinhança aberta Ω ⊂ Rn e qualquer cone V ⊂ Rn tal que Cx ⊂ V ∀x ∈ Ω e
qualquer f ∈ D(Ω) o seguinte acontece:
sup |(fq
uj − fpu)(k)|(1 + |k|)N → 0 ∀N ∈ N.
k ∈V
/
Esta noção pode ser generalizada de uma forma invariante para variedades suaves X, em que
C é agora um subconjunto cônico fechado de T ∗ X.
6.13.4 Caracterização do Conjunto de Frente de Ondas em Termos do

Valor Limite de Funções Analíticas
Pelo que vimos no Teorema 6.23, uma distribuição u ∈ S ′ (Rn ) é obtida como uma soma
finita de valores limite de funções analíticas Tj (x + iy), com j = (1, . . . , m), com uma condi-
ção de crescimento temperado sendo imposta para caracterizar tais valores limite. Vamos agora
traduzir essa condição de crescimento em termos do conjunto de frente de ondas analítico. Hör-
mander introduziu a noção do conjunto de frente de ondas analítico baseada sobre estimativas
usando uma sequência de funções cut-off, o que a torna mais difícil em aplicações. Nesta seção,
apresentamos uma definição do conjunto de frente de ondas analítico em termos dos valores
limite de funções analíticas. Neste caso, as singularidades de uma distribuição temperada são
descritas pela falta de analiticidade no sentido das funções complexas.
DEFINIÇÃO 6.31. Seja u ∈ S ′ (Rn ), tal que u = bC (T (x + iy)), em que bC (T (x + iy)) denota o
valor limite no sentido forte em S ′ (Rn ) de uma função analítica T (x + iy). Seja q = (x0 , k0 ).
Então q ∈ / W Fa (u) se, e somente se, existem M(C′ ) e N para os quais a seguinte estimativa é
satisfeita: 5 5
5T (x + iy)5 # M(C′ )|y|−N , z = x + iy ∈ Z ∩ T (C′ ) .
481
W Fa (u) é chamado o conjunto de frente de ondas analítico de u.

PROPOSIÇÃO 6.11. Admita que u ∈ S ′ (Rn ) é o valor limite, no sentido distribucional, de uma
função T (x + iy) analítica
5 em Z ∩ T (C′ ) que satisfaz a estimativa (6.12.7). Então próximo a
5
x0 a fibra W Fa (u) x0 está contida em C◦ .
5 ! . / "
Demonstração. Seja W Fa (u)5x0 = k ∈ Rn \ {0} | (x0 , k) ∈ W Fa (u) a fibra sobre x0 .
Faça com que {C◦j }j∈L seja uma cobertura finita de C◦ composta de cones convexos, fechados
e próprios. Decomponha u ^(k) da seguinte forma:
m
<
^(k) =
u λj (k)^
u(k) , (6.13.12)
j=1
em que λj (k) denota a função característica de C◦j , j ∈ L. Então, pelo Teorema 6.23, a
decomposição (6.13.12) induzirá uma representação de u na forma de uma soma de valores
limite de funções analíticas Tj (x + iy), tal que Tj (x + iy) → uj na topologia forte de S ′ (Rn )
quando y → 0, y ∈ C′j % Cj . De acordo também com o Teorema 6.23, a família de funções
Tj (x + iy) satisfaz a estimativa
5 5
5Tj (x + iy)5 # M(C′ )|y|−N , z = x + iy ∈ Z ∩ T (C′j ) ,
a não ser que kY < 0 para k ∈ C◦j e Y ∈ −C′j . Logo, os cones responsáveis pelas direções
“ruins” associadas às singularidades destes valores limites estão contidos nos cones duais dos
cones base Cj . Portanto, temos a inclusão
. /
W Fa (u) ⊂ Rn × ∪j C◦j . (6.13.13)
Finalmente, fazendo um refinamento da cobertura e contraindo-a (shrinking) para o cone C◦ ,
obtemos o resultado desejado.
Lembramos que Hörmander definiu o conjunto de frente de ondas, W F (f ), para uma

distribuição como o conjunto de pontos no espaço cotangente que deve ser característico para
cada operador pseudo-differencial P , de tal forma que P f ∈ C ∞ . É claro que W F (f ) ⊂
W Fa (f ). Seguindo Nishiwada45 uma outra caracterização de W F (f ) pode ser obtida com
base no resultado acima.
PROPOSIÇÃO 6.12. Seja U um conjunto aberto em Rn , (x0 , k0 ) ∈ Rn ×(Rn \{0}) e u ∈ S ′ (U).
Então (x0 , k0 ) ∈
/ W F (u) se existe uma família finita {Cj } de cones convexos, abertos e próprios
n
em R , com j = 1, . . . , m, uma vizinhança complexa Z de x0 e uma decomposição de u
próximo a x0
m
<
u= bC′j (Tj (x + iy)) em U , (6.13.14)
j=1
com Tj (x+iy) ∈ O(Z ∩T (C′j )) sendo de crescimento temperado, tal que bC′j (Tj (x+iy) ∈ C ∞
! "
próximo a x0 para cada j, com C′j ⊂ y | k0 y " 0 .
45
K. Nishiwada, “On the local surjectivity of analytic partial differential operators in the space of distributions
with given wave front sets,”Surikaiseki-kenkyusho kokyuroku, RIMS, Kyoto Univ. 239 (1975) 19 e “On local
characterization of wave front sets in terms of boundary values of holomorphic functions,” Publ. RIMS, Kyoto Univ.
14 (1978) 309.
482
Demonstração. Assuma que a Eq.(6.13.14) é válida para a família {Cj } de tais!cones convexos,
"
abertos e próprios. Tome uma subfamília {κ} ⊂ {j} de índices tal.;que C′κ ∩ y | k0 y < 0 / =
m
∅. Então, pela Proposição 6.11, nós temos que (x0 , k0 ) ∈
/ W Fa κ=1 bC′κ (Tκ (x + iy)) e,
portanto, (x0 , k0 ) ∈
/ W F (u).
6.13.5 O Teorema “Edge of the Wedge” Revisitado
Vamos revisitar o Teorema “Edge of the Wedge” e apresentar uma prova alternativa desse
teorema baseada no desenvolvimento acima sobre o conjunto de frente de ondas analítico. Para
isto, começamos com o seguinte
LEMA 6.13. Seja Cm a família de todos os cones convexos, abertos e próprios em Rm . Se
C1 , C2 ∈ Cm , então C1 + C2 ∈ Cm . Além disto, se C pertence a Cm e y ∈ C, então −y ∈
/ C.
Demonstração. A prova é imediata da definição de um cone convexo, aberto e próprio dada no

início da subseção “Transformada de Fourier-Laplace de Distribuições Temperadas com Suporte
em Cones.”
DEFINIÇÃO 6.32. Seja Ω um subconjunto fechado de Rn . O conjunto normal exterior normal
Ne (Ω) ⊂ T ∗ (Rn ) \ {0} associado ao conjunto Ω é definido como sendo o conjunto de todos os
pares (x, k) tal que x ∈ Ω e existe uma função a valores reais f ∈ C 2 (Rn ) com df (x) = k ̸= 0
e f (y) # f (x) para todo y ∈ Ω. O conjunto normal N(Ω) é a união Ne (Ω) ∪ Ne′ (Ω), em que
Ne′ (Ω) denota a imagem de Ne (Ω) sob a simetria (x, k) → (x, −k).
LEMA 6.14. Para um subconjunto fechado Ω de Rn a projeção de Ne (Ω) sobre Rn é densa em
∂Ω.
Demonstração. Veja a Proposição 8.5.8 no Volume I do tratado de L. Hörmander, “The Analysis

of Linear Partial Differential Operators I,” Springer-Verlag, Second Edition, 1990.
LEMA 6.15. Para todo u ∈ S ′ (Rn ) temos N(supp u) ⊂ W Fa (u).
Demonstração. Similar à prova do Teorema 8.5.6’ em L. Hörmander, “The Analysis of Linear

Partial Differential Operators I,” Springer-Verlag, Second Edition, 1990.
LEMA 6.16 (Proposição 5.3 – J. Math. Phys. 43 (2002) 5514). Considere u ∈ S ′ (Rn ) com a
propriedade que
W Fa (u) ∩ W Fa′ (u) = ∅ , (6.13.15)
em que W Fa′ (u) denota a imagem de W Fa (u) sob a simetria (x, k) → (x, −k). Se Ω ⊂ Rn é
um subconjunto aberto não-vazio e u|Ω = 0, então u ≡ 0.
Demonstração. Assuma que (x, k) ∈ N(supp u); consequentemente, pela Definição 6.32,
(x, −k) ∈ N(supp u). Pelo Lema 6.15, (x, k) e (x, −k) estão em W Fa (u), o que contradiz a
hipótese. Isto implica que N(supp u) é vazio e portanto ∂(supp u) é vazio também pelo Lema
6.14. Como supp u não é todo o Rn , segue da conexidade de Rn que supp u = ∅ → u ≡ 0.
483
5
PROPOSIÇÃO 6.13. Seja u ∈ S ′ (Rn ). Se W Fa (u)5x0 ⊂ C◦ , para um cone convexo, aberto e
próprio C em Rn \ {0}, então existe uma função analítica f (z) ∈ O(Z ∩ T (C)) de crescimento
temperado, em que Z é uma vizinhaça complexa de x0 , tal que u = bC (f (z)).
Demonstração. Tome um cone C′ tal que C′ % C. Então, se k ∈ C◦ e y ∈ C′ , isto implica que

ky > 0 e pelo Teorema 6.23 f (z) ∈ O(Z ∩T (C)) é de crescimento temperado e u = bC (f (z)).
Logo, (x0 , k) ∈
/ W Fa (u).
6.14 Distribuições Homogêneas e a Teoria da

Renormalização
“The basic concepts and methods of quantum field theory are becoming more and more mathematical.”
N.N. Bogoliubov
Na primeira metade do Século XX, em um ramo da física, a teoria quântica dos campos (a
unificação da mecânica quântica com a relatividade especial), os físicos com base em métodos
puramente intuitivos obtiveram sucesso no cálculo de taxas de emissão e absorção de partículas,
mas somente pela supressão arbitrária de certas quantidades que assumiam valores infinitos. Na
década de 1950, vários físicos começaram a levar a sério a eliminação desses infinitos pela intro-
dução de novos axiomas precisos,46 e uma grande quantidade de novos resultados interessantes
apareceram – como o Lamb-shift, o momento magnético anômalo do elétron, etc. Do ponto
de vista matemático, esses infinitos têm origem nas singularidades não-integráveis associadas
a certos diagramas de Feynman no espaço-x. Nosso objetivo nesta seção é exatamente mos-
trar como tratar rigorosa e matematicamente este problema através da noção de distribuições
homogêneas.
6.14.1 Funções e Distribuições Homogêneas
Para entender o processo de renormalização na teoria quântica dos campos precisaremos,

antes de mais nada, de um dispositivo para avaliar o grau de divergência de uma distribuição na
vizinhança de um ponto singular – uma vez que um propagador de Feynman é uma distribuição.
Isso será feito recorrendo-se ao conceito de grau de homogeneidade de uma distribuição.
Seguiremos o tratamento de Gel’fand-Shilov-Hörmander para distribuições homogêneas.47
A noção de homogeneidade é determinada pela ação do operador de dilatações, isto é,
D(λ)f (x) = f (λx) , λ>0.

46
Neste ponto, é interessante destacar o que Dirac escreveu sobre esses “novos axiomas” no seu artigo “Quantised
singularities in the electromagnetic field,” Proc. Roy. Soc. London, Ser. A 133 (1931) 60: “It seems likely that this
process of increasing abstraction will continue in the future and that advance in physics is to be associated with a
continual modification and generalization of the axioms at the base of the mathematics rather than with a logical
development of anyone mathematical scheme on a fixed foundation.”
47
Para mais detalhes, veja os livros-texto de I.M. Gel’fand e G.E. Shilov, “Generalized Functions: Properties and
Operations,” Academic Press, Volume I, 1964 e L. Hörmander, “The Analysis of Linear Partial Differential Operators
I, ” Springer-Verlag, Second Edition, 1990.
484
Logo, uma função homogênea pode ser descrita como uma função com um comportamento
de escala multiplicativo: se o argumento é multiplicado por um fator, então o resultado é
multiplicado por uma potência desse fator. Mais precisamente, se f : X → Y é uma função
entre dois espaços vetoriais e s é um número inteiro, então diz-se que f é homogênea de grau
s se f (λx) = λs f (x) para todo escalar λ diferente de zero e x ∈ X . Isto implica que f tem
invariância de escala!
Exemplo 6.23. A função f (x, y) = x2 + y 2 é homogênea de grau 2, já que temos f (λx, λy) =
(λx)2 + (λy)2 = λ2 (x2 + y 2 ) = λ2 f (x, y).
Exemplo 6.24. Qualquer função linear f : R → R é homogenênea de grau 1, já que pela
definição de linearidade f (λx) = λf (x) para todo escalar λ diferente de zero e x ∈ R.
Similarmente, qualquer função multilinear f : Rn → R é homogênea de grau n, já que
pela definição de multilinearidade f (λx1 , . . . , λxn ) = λn f (x1 , . . . , xn ) para todo escalar λ
diferente de zero e (x1 , . . . , xn ) ∈ Rn .
Exemplo 6.25 (Um contra-exemplo). A função logarítmo natural f (x) = ln x escala aditiva-
mente e, portanto, não é homogênea. Isto pode ser provado notando que f (λx) = ln λx =
ln λ + ln x = ln λ + f (x). Consequentemente, não existe um s tal que f (λx) = λs f (x).
Exemplo 6.26. Considere a função f (x) = xs com s ∈ R. Se s > 0, podemos naturalmente
assumir que a função f (x) = xs define uma distribuição, dada pela integral
$
T (ϕ) = dx xs ϕ(x) , ∀ ϕ ∈ S (R) .
R
A função f (x) = xs é homogênea de grau s. Isto significa que para λ > 0, f (λx) = λs f (x).
Explicitamente, temos
$ $
s s −n
Tλ (ϕ) = dx λ x ϕ(x) = λ dx xs ϕ(λ−1 x) = λ−n T (ϕλ ) , (6.14.1)
em que definimos ϕλ (x) = ϕ(λ−1 x).
Em geral, se f ∈ Lloc n s
1 (R ) tal que f (λx) = λ f (x), para todo s ∈ R e λ > 0, então f
define uma distribuição homogênea de grau s, dada pela integral
$ $
s
Tλ (ϕ) = dx f (λx)ϕ(x) = λ dx f (x)ϕ(x) = λs T (ϕ) , (6.14.2)
ou, equivalentemente,
$ $
−n −n −1 s
T (λ ϕ ◦ µλ ) = λ dx f (x)ϕ(λ x) = λ dx f (x)ϕ(x) = λs T (ϕ) , (6.14.3)
em que µλ : x → x/λ é o operador divisão por um escalar em Rn . O fator adicional λ−n

é necessário para reproduzir a noção usual de homogeneidade para as funções localmente
integrável, e surge da mudança de variáveis x → λ−1 x.
Distribuições homogêneas também podem ser definidas para os espaços vetoriais com a
origem excluída. Neste caso, uma função contínua (não-trivial) homogênea de grau s que define
uma distribuição em Rn \ {0} pode ser estendida continuamente para Rn se, e somente se,
s > 0. Entretanto, se s < 0, a situação é mais delicada, e pode ser um problema não-trivial
estender uma dada distribuição homogênea a partir de Rn \ {0} a uma distribuição em Rn .
Tal extensão existe na maioria dos casos, embora possa não ser única.
485
DEFINIÇÃO 6.33 (Gel’fand-Shilov-Hörmander). Diz-se que uma distribuição T ∈ S ′ (Rn ) é

homogênea de grau s se para qualquer λ > 0 e para toda ϕ ∈ S (Rn ) temos
T (ϕλ ) = λs+n T (ϕ) . (6.14.4)
em que ϕλ = ϕ ◦ µλ . O número s pode ser real ou complexo.48
Exemplo 6.27. A distribuição δ tem grau de homegeneidade −n. Com efeito, temos
Tδ (ϕλ ) = λs+n Tδ (ϕ)

$ $
−1 s+n
dx δ(x)ϕ(λ x) = λ dx δ(x)ϕ(x) , ∀ ϕ ∈ S (Rn )
ϕ(0) = λs+n ϕ(0) .
Logo, s = −n.
TEOREMA 6.31. Se uma distribuição T ∈ S ′ (Rn ) é homogênea de grau s para qualquer λ > 0,
então D α T é homogênea de grau s − |α|.
Demonstração. Para todo ϕ ∈ S (Rn ), partimos da relação
(Dxα T )(ϕλ ) = (−1)|α| λ−|α| T (Dλα−1 x ϕλ ) .
De acordo com a Definição 6.33, temos
(−1)|α| λ−|α| T (Dλα−1 x ϕλ ) = (−1)|α| λs−|α|+n T (Dxαϕ) ,
já que ϕ é infinitamente diferenciável e, portanto, Dxα ϕ ∈ S (Rn ). Mas,
(−1)|α| λs−|α|+nT (Dxα ϕ) = λs−|α|+n (Dxα T )(ϕ) .
Logo,
(Dxα T )(ϕλ ) = λs−|α|+n (Dxα T )(ϕ) .
Consequentemente, D α T tem grau de homogeneidade s − |α|.
DEFINIÇÃO 6.34. Diz-se que uma distribuição t em Rn \ {0} é homogênea de grau s se a

Eq.(6.14.4) é válida para toda ϕ ∈ S (Rn \ {0}). Se T é uma distribuição em Rn e (6.14.4) é
válida para toda ϕ ∈ S (Rn ), então T é dita homogênea de grau s em Rn .
Vamos chamar uma distribuição homogênea t sobre Rn regular quando ela é suave fora da
origem; a função suave sobre Rn \{0} associada a t é homogênea de mesmo grau. Distribuições
homogêneas de todos os tipos são temperadas e, portanto, possuem transformadas de Fourier.
As considerações acima levantam as seguintes questões importantes:

48
Aqui vamos assumir que s é real.
486
Questão 1: Suponha que f seja uma função suave sobre Rn \ {0} (isto é, uma função de
classe C ∞ fora de uma vizinhança arbitrária da origem) e homogênea de grau s que define
uma distribuição homogênea regular t ∈ S ′ (Rn \ {0}). Como ela pode ser estendida para
uma distribuição homogênea regular T em S ′ (Rn ) e de grau s tal que f seja a sua função
associada?
Questão 2: Se tal distribuição existir, até que ponto ela é univocamente determinada por f ?
Estas questões serão respondidas construtivamente abaixo.
6.14.2 Extensão de Distribuições
O problema da renormalização na teoria quântica dos campos pode ser reformulado como
sendo um problema de estender distribuições definidas em Rn \{0} para distribuições definidas
em Rn . Por isso, recordaremos os ingredientes básicos da construção de extensões de distri-
buições. Essencialmente, seguiremos o formalismo de extensões de distribuições homogêneas
como descrito por Gel’fand-Shilov-Hörmander.
Para começar, lembremos que se f é uma função contínua sua identificação com uma
distribuição é imediata. No entanto, a continuidade de f não é realmente necessária para
identificá-la com uma distribuição. De fato, uma função f pode definir uma distribuição se
ela contém um número finito de descontinuidades localizadas nos pontos x1 , x2 , . . . , xn (veja
o Exemplo 6.9) ou se ela se torna infinita em certos pontos, mas desde que essas singularidades
sejam integráveis. Por outro lado, se uma função f tem singularidades não-integráveis a
identificação de f com uma distribuição não é imediata. Nesse caso, f pode estar associada a
várias distribuições diferentes, como explicaremos abaixo quando falarmos sobre a extensão de
distribuições. Antes de estudarmos este caso, vamos analisar um exemplo simples relacionado
com a situação onde uma função f tem uma singularidade integrável.
Exemplo 6.28 (Potencial coulombiano em dimensão
H n " 2). Considere a função f (x) =
1/∥x∥ em dimensões n " 2, em que ∥x∥ = x1 + · · · + x2n . Queremos mostrar que esta
2
função define uma distribuição temperada T através da equação

$
1
T (ϕ) = dx ϕ(x) , ∀ ϕ ∈ S (Rn ) .
Rn ∥x∥
Em outras palavras, queremos mostrar que a função f (x) = 1/∥x∥ tem uma singularidade
integrável na origem e, portanto, pode ser identificada univocamente com uma distribuição
T ∈ S ′ (Rn ), para n " 2. Para vermos isto, devemos mostrar que T é um funcional linear
n
contínuo sobre S 5 (R ).5 Lembre-se que isto é equivalente à existência de uma semi-norma
5 5 n
∥ · ∥α,β tal que T (ϕ) # C∥ϕ∥α,β para todo ϕ ∈ S (R ). Neste caso, usando coordenadas
esféricas, obtemos
5$ 5 5$ $ ∞ 5
5 5 5 1 5 5 5
n−1 ϕ(rω) 5
5T (ϕ)5 = 5 5 5
5 n dx ∥x∥ ϕ(x)5 = 5 dω dr r
r 5
R ∥ω∥=1 0
$ $ ∞
5 5
# dω dr 5r n−2 ϕ(rω)5 .
∥ω∥=1 0
487
Considerando que ϕ ∈ S (Rn ), então, por definição, existe uma constante C = C(n − 2, 0)
tal que 5 n−2 5
5r ϕ(rω)5 # C ,
com a constante sendo dada pela semi-norma ∥ϕ∥n−2,0 em S (Rn ). Assim,

$
5 5
5T (ϕ)5 # ∥ϕ∥n−2,0 dω = C1 ∥ϕ∥n−2,0 ,
∥ω∥=1
se n " 2 (já que os índices α e β que aparecem na semi-norma ∥ · ∥α,β devem pertencer ao
conjunto N0 ). Aqui, C1 = ωn−1 é a área da esfera unitária S n−1 (veja os detalhes no Apêndice
6A). Logo, T é um funcional contínuo. Portanto, a função f (x) = 1/∥x∥ em dimensão n " 2
define uma distribuição T ∈ S ′ (Rn ).
Vamos, agora, considerar a situação quando uma função f tem singularidades não-integráveis.
O problema básico na nossa análise será o da regularização das singularidades de f em pontos
isolados.49 Assim, se V é uma vizinhança de um ponto isolado x0 ∈ Rn e f é uma função
(localmente integrável) sobre V \ {x0 }, desejamos estender f a uma distribuição sobre V . Efe-
tivamente, a regularização de distribuições refere-se ao problema de estender distribuições que
são definidas a priori sobre um conjunto menor para um conjunto maior. No entanto, isto não
é sempre possível, se a singularidade de f em x0 for muito “violenta.” Por outro lado, f será
sempre regularizável se sua singularidade em x0 for do tipo algébrica.50
DEFINIÇÃO 6.35 (Gel’fand-Shilov). Diz-se que uma função f tem uma singularidade algé-
brica em x0 se ela não cresce mais rápido do que qualquer potência de 1/|x − x0 |, quando x se
aproxima do ponto singular x0 .
A seguir, por conveniência, consideraremos o caso particular de distribuições sobre o espaço

vetorial Rn \ {0},51 representadas por funções que têm uma singularidade algébrica em 0. Neste
caso, por uma regularização na origem entender-se-a uma extensão para Rn de uma distribuição
inicialmente definida fora da origem. A existência de tal extensão é garantida pelo
TEOREMA 6.32 (Teorema de Hahn-Banach). Seja S (Rn \ {0}) um subespaço do espaço

S (Rn ) e t um funcional linear sobre S (Rn \ {0}) tal que |t(ϕ)| # C ∥ϕ∥α,β , para toda
ϕ ∈ S (Rn \{0}), em que C é uma constante. Então, existe um funcional linear T definido sobre
S (Rn ) tal que |T (ϕ)| # C ∥ϕ∥α,β , para toda ϕ ∈ S (Rn ), com T = t se ϕ ∈ S (Rn \ {0}),
isto é, a restrição de T ao subespaço S (Rn \ {0}) é igual a t.
T
S (Rn ) −−−→ C |T (ϕ)| # C∥ϕ∥α,β
K
⏐
⏐
t
S (Rn \ {0}) −−−→ C |t (ϕ)| # C∥ϕ∥α,β .
49
Existe uma vasta literatura dedicada ao estudo da regularização de distribuições. Veja, por exemplo, os livros
de I.M. Gel’fand e G.E. Shilov, “Generalized Functions: Properties and Operations,” Academic Press, Volume I, 1964 e
de G. Eskin, “Lectures on Linear Partial Differential Equations,” Graduate Studies in Mathematics, Vol.123, AMS.
50
Veja os detalhes no livro de I.M. Gel’fand e G.E. Shilov, “Generalized Functions: Properties and Operations,”
Academic Press, Volume I, 1964.
51
Isto é, sobre o espaço vetorial Rn com a origem excluída
488
O funcional T , que representa a extensão do funcional t definido sobre o subespaço S (Rn \

{0}) para todo o espaço S (Rn ), define uma regularização de t.
É importante ressaltar, como já mencionado, que na teoria quântica dos campos o processo
de regularização de produtos de propagadores de Feynman é também conhecido como “re-
normalização.” Por causa disso, daqui para frente os aspectos técnicos da regularização de
distribuições serão denominados renormalização de distribuições.
Exemplo 6.29 (Renormalização de 1/x). Considere a função f (x) = 1/x, definida para x
real com x ̸= 0. Esta função não define, inicialmente, uma distribuição sobre R porque não é
localmente integrável na vizinhança da origem. No entanto, f (x) = 1/x define uma distribuição
regular t em Rn \{0}, homogênea de grau -1, para toda função teste ϕ ∈ S (R\{0}). Queremos
mostrar que existe uma extensão da distribuição t que pode ser naturalmente associada à função
f (x) = 1/x. Ela é definida da seguinte forma: como f (x) = 1/x é absolutamente integrável
fora de qualquer vizinhança da origem, isto é, para ε < |x| d< +∞, com ε > 0 escolhido
∞
arbitrariamente, definimos o valor principal da integral v.p. −∞ dx 1/x como o limite de
d −ε d∞
−∞
dx 1/x + ε dx 1/x quando ε → 0 (assumindo a existência desse limite).52
Considere o funcional P(1/x) definido pela fórmula

$ ∞ $
8 9 1 1
P(1/x) (ϕ) = v.p. dx ϕ(x) = lim dx ϕ(x) , ϕ ∈ S (R) . (6.14.5)
−∞ x ε→0 |x|"ε x
em que uma vizinhança simétrica da singularidade tendendo a zero foi removida. Observamos
primeiro que o limite acima existe para qualquer função ϕ ∈ S (R) e, portanto, P(1/x) é de
fato uma distribuição. Assuma que ε < 1. Então, podemos escrever
$ $ $
1 1 1
dx ϕ(x) = dx ϕ(x) + dx ϕ(x)
|x|"ε x 1"|x|"ε x |x|>1 x
$ −ε $ 1 $ −1 $ ∞
1 1 1 1
= dx ϕ(x) + dx ϕ(x) + dx ϕ(x) + dx ϕ(x) .
−1 x ε x −∞ x 1 x
52
Para ver o que isto significa, considere o exemplo simples da integral
$ 5
1
dx .
0 x−3
Essa integral não é bem definida uma vez que o integrando diverge em x = 3. Você pode ver que as duas integrais
d3 d5
0
dx/(x − 3) e 3 dx/(x − 3) são divergentes, dando −∞ e +∞, respectivamente. No entanto, existe uma
maneira de “renormalizar” a integral acima. Considere a seguinte expressão:
$ 3−ε $ 5 = >3−ε = >5
1 1
dx + dx = ln |x − 3| + ln |x − 3|
0 x−3 3+ε x−3 0 3+ε
= ln | − ε| − ln | − 3| + ln |2| − ln |ε| .
A soma dessas duas integrais é independente de ε. Os termos ln ε e − ln ε se cancelam. Assim, se tomamos o

d5
limite de ε → 0, obtemos o resultado ln(2/3) que é chamado o valor principal de 0 dx/(x − 3). Somente a
soma das duas integrais é finita. Termos individuais tornam-se divergentes quando ε → 0. Cabe registrar que, a
ideia de se extrair uma “parte finita” de uma integral divergente foi primeiro discutido por J. Hadamard no clássico
“Lectures on Cauchy’s Problem in Linear Partial Differential Equations,” Yale University Press, 1923.
489
As duas últimas integrais claramente convergem por causa do decaimento rápido de ϕ(x)
quando |x| → ∞. Quanto às duas primeiras integrais, podemos escrevê-las como
$ $ $
1. / 1. / 1
dx ϕ(x) − ϕ(0) + ϕ(0) = dx ϕ(x) − ϕ(0) + ϕ(0) dx .
1"|x|"ε x 1"|x|"ε x 1"|x|"ε x
A segunda integral ns expressão acima é zero devido ao fato de 1/x ser uma função ímpar
que está sendo integrada em uma vizinhança simétrica da singularidade. Por outro lado, na
avaliação da primeira integral se levarmos em conta que ϕ é C ∞ , então, pelo Teorema do Valor
Médio, existe um certo ξ entre 0 e x tal que ϕ(x) − ϕ(0) = xϕ′ (ξ). Logo,
$ $
1. / ′
dx ϕ(x) − ϕ(0) = ϕ (ξ) dx = 2ϕ′ (ξ)(1 − ε) .
1"|x|"ε x 1"|x|"ε
Assim, o limite quando ε → 0 no lado direito de (6.14.5) existe. Além disso, é evidente que
58 $ 1 5$ ∞ 5
5 9 55 5 1 5
5 P(1/x) (ϕ)5 # 2 dx |ϕ (ξ)| + 55
′
dx 2 xϕ(x)55 # 2∥ϕ∥0,1 + ∥ϕ∥1,0 .
0 1 x
Consequentemente, P(1/x) é uma distribuição temperada.
Repare que se ϕ(0) ̸= 0, então as integrais

$ 0 $ ∞
1 1
dx ϕ(x) e dx ϕ(x)
−∞ x 0 x
não serão localmente integráveis na vizinhança de x = 0, mas
$ ∞
1
ϕ 3→ v.p. dx ϕ(x) ,
−∞ x
existe. Essa integral, que converge para todo ϕ ∈ S (R), representa uma “renormalização” (ou
uma extensão) da função 1/x, que inicialmente definia um funcional somente para funções
teste ϕ ∈ S (R \ {0}).
Por fim, observe que para qualquer ϕ ∈ S (R \ {0}), isto é, se ϕ(0) = 0, então
$ ∞ $ ∞
1 1
v.p. dx ϕ(x) = dx ϕ(x) .
−∞ x −∞ x
Em outras palavras, a distribuição P(1/x) coincide com a função 1/x quando x ̸= 0.

Exemplo 6.30 (Mais renormalização de 1/x). Considere para ε > 0 as funções (x ± iε)−1 .
Veremos que as funções (x ± iε)−1 convergem para um limite, no sentido das distribuições,
quando ε → 0. Denotaremos esse limite por (x ± i0)−1 . Para provar isto, tome ϕ ∈ S (R).
Então,
$ ∞ $ ∞
ϕ(x) (x ∓ iε)ϕ(x)
lim dx = lim dx
ε→0 −∞ x ± iε ε→0 −∞ x2 + ε2
,$ ∞ $ ∞ -
x ϕ(x) ε ϕ(x)
= lim dx 2 ∓i dx 2 .
ε→0 −∞ x + ε2 −∞ x + ε2
490
Note que a segunda integral é exatamente a sequência de funções de Breit-Wigner que apareceu
no Exemplo 6.12 com n = 1/ε. Logo,
$ ∞
ε ϕ(x)
∓i lim dx 2 = ∓iπϕ(0) .
ε→0 −∞ x + ε2
Por outro lado, a primeira integral pode ser escrita da seguinte forma
$ ∞ ,$ $ -
x ϕ(x) x ϕ(x) x ϕ(x)
lim dx 2 = lim dx 2 + dx 2
ε→0 −∞ x + ε2 ε→0 |x|<1 x + ε2 |x|>1 x + ε2
($ . / $ )
x ϕ(x) − ϕ(0) x ϕ(x)
= lim dx 2 2
+ dx 2 .
ε→0 |x|<1 x +ε |x|>1 x + ε2
d
já que a integral |x|<1 dx xx2ϕ(0)
+ε2
x
= 0 devido ao fato de x2 +ε 2 ser uma função ímpar. Portanto,
no limite ε → 0, segue que

$ ∞
x ϕ(x) 8 9
lim dx 2 = P(1/x) (ϕ) .
ε→0 −∞ x + ε2
Consequentemente, do ponto de vista das distribuições, temos que

⎫
(x + i0)−1 = P(1/x) − iπδ(x) ⎬
. (6.14.6)
⎭
(x − i0)−1 = P(1/x) + iπδ(x)
As fórmulas (6.14.6) são chamadas Fórmulas de Sokhotski-Plemelj e são muito usadas na

teoria quântica. Por exemplo, as fórmulas (6.14.6) são úteis no estudo da renormalização no
espalhamento Coulomb.
Nota 6.28. As distribuições (x + i0)−1 , (x − i0)−1 e P(1/x) representam diferentes renor-
malizações (ou extensões) da função dnão-integrável 1/x, isto é, elas tornam possível dar um
∞
significado para a integral divergente −∞ dx x1 ϕ(x), para toda ϕ ∈ S (R). Enquanto diferen-
tes, as três distribuições concordam com a função 1/x quando x ̸= 0. Portanto, as distribuições
(x+i0)−1 , (x−i0)−1 e P(1/x) são distribuições regulares, com a função 1/x sendo a função
associada a cada uma delas. Além disso, as distribuições (x + i0)−1 , (x − i0)−1 e P(1/x) são
todas homogêneas de grau -1. Por exemplo,
8 9 8 9
P(1/x) (ϕλ ) = λs+1 P(1/x) (ϕ)
$ $
1 s+1 1
lim dx ϕ(x) = λ lim dx ϕ(x) .
ε→0 |λx|"ε x ε→0 |x|"ε x
Aqui, transformamos a variável independente no lado esquerdo de acordo com x/λ → x. Note
que os limites existem para as duas integrais e são iguais. Logo, P(1/x) é homogênea de grau
-1. De acordo com a Proposição 6.14 abaixo, segue que (x + i0)−1 e (x − i0)−1 também têm
grau de homogeneidade -1. Isto responde (parcialmente) a Questão 1 formulada anteriormente.
Por outro lado, fica claro que a renormalização de 1/x não é única: várias distribuições
correspondem à função não-integrável 1/x. Isto responde a Questão 2! A diferença entre
quaisquer duas renormalizações de 1/x é simplesmente cδ(x), em que c = ±iπ ou c = ±2iπ.
491
6.14.3 Renormalização de Distribuições Homogêneas
Vimos no Exemplo 6.26 que a função f (x) = xs é homogênea de grau s e define, natu-
ralmente, uma distribuição se s > 0. Em particular, de acordo com a Definição 6.33, a toda
função f homogênea de grau s > −n, contínua para x ̸= 0, corresponde uma distribuição
dada pela integral $
T (ϕ) = dx f (x)ϕ(x) ,
que também é homogênea de grau s. No entanto, se a função f (x) = xs tem grau de

homogeneidade s # −n, ela tem uma singularidade no 0 que é não integrável, e não é claro
que exista uma renormalização que também seja homogênea de grau s.53 Por outro lado,
é desejável que as renormalizações de f (x) = xs , quando s # −n, preservem o grau de
homogeneidade de f . De maneira geral, espera-se que as renormalizações T ∈ S ′ (Rn ) de
uma distribuição t ∈ S ′ (Rn \ {0}) preservem o grau de homogeneidade de t, já que devemos
ter t(ϕ) = T (ϕ) para qualquer função teste ϕ ∈ S (Rn \ {0}), isto é, já que a restrição de
T ao subespaço S (Rn \ {0}) é igual a t.54 Podemos fundamentar nosso argumento em favor
disto com base na seguinte
PROPOSIÇÃO 6.14 (Gel’fand-Shilov). Distribuições homogêneas com diferentes graus de homo-
geneidade são linearmente independentes.
Demonstração. Sejam tκ , κ = 1, . . . , m distribuições homogênas de grau sκ , com todos os sκ

diferentes. Assuma que
c1 t1 + c2 t2 + · · · + cm tm = 0 .
Então, por definição, para qualquer λ > 0 e qualquer ϕ ∈ S (Rn ), segue que
c1 λs1 t1 (ϕ) + c2 λs2 t2 (ϕ) + · · · + cm λsm tm (ϕ) = 0
Como, por hipótese, todos sκ são diferentes, temos que cκ tκ (ϕ) = 0 para todo κ e toda ϕ. Se
tκ ̸= 0, podemos escolher ϕ tal que tκ (ϕ) ̸= 0. Portanto, cκ = 0 para todo κ. Isto prova a
proposição.
Vamos explorar a Definição 6.33 de forma a obtermos um critério razoável para medir a
ordem de singularidade de uma distribuição. Primeiro, note que se tomarmos o limite λ → 0
no lado esquerdo da Eq.(6.14.4), o argumento de ϕ(λ−1 x) vai para infinito. Mas, por definição,
no infinito a função ϕ é zero e, assim, o lado esquerdo da Eq.(6.14.4) vai para zero nesse limite.
Por outro lado, o lado direito só será zero se s > −n.
Assuma que f é uma função homogênea de grau s # −n com uma singularidade não-
integrável no ponto x0 . Logo, o lado direito da Eq.(6.14.4) não vai para zero quando λ → 0.
Apesar disso, f é localmente integrável fora de qualquer vizinhança do ponto x0 ∈ Rn e define
uma distribuição regular t sobre Rn \ {x0 }. Então, multiplique f (x) por (x − x0 )m . Se a
função (x − x0 )m f (x) tem agora grau de homogeneidade m + s > −n, para um certo valor
53
A função f (x) = 1/∥x∥ do Exemplo 6.28 tem grau de homogeneidade -1 e para dimensões n " 2 sua
singularidade no zero é integrável, como já mostrado.
54
Na teoria quântica de campos também algumas simetrias devem ser preservadas no processo de renormaliza-
ção, como a simetria de Lorentz e/ou simetrias de calibre. Caso contrário, falamos de uma anomalia.
492
de R ∋ m " 0, ela será localmente integrável em qualquer vizinhança do ponto x0 e definirá

uma distribuição regular T sobre Rn . O menor valor de m que garante que (x − x0 )m f (x) é
integrável em qualquer vizinhança do ponto x0 definirá a ordem singular de f de acordo com
a seguinte
DEFINIÇÃO 6.36 (Ordem singular de8 uma distribuição). 9 Diz-se que ω = [m] é a ordem
m+s+n m
singular de f , no ponto x0 , se λ (x − x0 ) f (x) (ϕ) → 0 quando λ → 0, para toda
n
ϕ ∈ S (R ), em que [m] é a parte inteira de m.
Seguindo Gel’fand-Shilov, apresentamos agora uma proposição geral sobre a existência de

renormalizações de distribuições homogêneas. A ideia segue, em linhas gerais, o que foi feito
no Exemplo 6.29: adicionamos e subtraímos de ϕ termos de uma em série de Taylor (truncada)
até a ordem singular da distribuição. Por simplicidade, vamos tomar x0 = 0.
PROPOSIÇÃO 6.15. Seja f uma função suave sobre Rn \ {0} e homogênea de grau s; logo, f
define uma distribuição homogênea t ∈ S ′ (Rn \ {0}) também de grau s. Se s # −n, então t
tem uma extensão homogênea T ∈ S ′ (Rn ) de grau s se, e somente se,
$
dx f (x)xα = 0 .
|x|#1
Demonstração. Inicialmente, assumiremos que s = −n. Então, de acordo com a Definição 6.36,
f tem ordem singular 0. Logo,
$ $ $
. /
T (ϕ) = dx f (x) ϕ(x) − ϕ(0) + ϕ(0) dx f (x) + dx f (x)ϕ(x) ,
|x|#1 |x|#1 |x|>1
para toda ϕ(x) ∈ S (Rn ). Dado o rápido decrescimento de ϕ no infinito, a integral sobre
|x| > 1 é convergente. Por outro lado, visto que ϕ é infinitamente diferenciável, então, pelo
Teorema do Valor Médio, ϕ(x) − ϕ(0) = xϕ′ (ξ), para um um certo ξ entre 0 e x. Portanto,
para a primeira integral obtemos
$
′
ϕ (ξ) dx xf (x) .
|x|#1
Mas a integral acima é convergente já que xf (x) tem grau de homogeneidade s > −n e,
portanto, é localmente integrável em qualquer vizinhança de 0. Para analisar a segunda integral,
vamos levar em conta o fato que toda função homogênea de grau s pode ser escrita na forma
f (x1 , . . . , xn ) = f (rω1, . . . , rωn ) = r s f (ω1 , . . . , ωn ) ,
em que f (ω1 , . . . , ωn ) é uma função sobre a esfera unitária em n-dimensões. Então

$ $ 1 $ $
n−1+s ϕ(0)
ϕ(0) dx f (x) = ϕ(0) dr r dω f (ω) = dω f (ω) .
|x|#1 0 ∥ω∥=1 n + s ∥ω∥=1
Note que o funcional T (ϕ) tem um polo em s = −n. Assim,

d para a distribuição T não ter um
polo em s = −n é necessário e suficiente que a integral ∥ω∥=1 dω f (ω) = 0. Vamos mostrar
493
que esta condição também garante que a distribuição T será homogênea de grau −n. Neste
caso, por definição, devemos ter
T (ϕλ ) = T (ϕ) . (6.14.7)
Considere a integral
$ $ $
. −1
/ −1
T (ϕλ ) = dx f (x) ϕ(λ x) − ϕ(0) + dx f (x)ϕ(λ x) + ϕ(0) dx f (x) ,
|x|#1 |x|>1 |x|#1
que pode ser escrita da seguinte forma

$ $ $
. /
T (ϕλ) = dx f (x) ϕ(x) − ϕ(0) + dx f (x)ϕ(x) + ϕ(0) dx f (x) .
|λx|#1 |λx|>1 |λx|#1
Aqui, transformamos as variáveis independentes de acordo com xκ /λ → xκ , além de usar o

fato que f é homogênea de grau −n. Consequentemente, a condição (6.14.7) implica que
$ $ $
. / . /
dx f (x) ϕ(x) − ϕ(0) + dx f (x)ϕ(x) = dx f (x) ϕ(x) − ϕ(0)
|λx|#1 |λx|>1 |x|#1
$ ,$ $ -
+ dx f (x)ϕ(x) + ϕ(0) − dx f (x) .
|x|>1 |x|#1 |λx|#1
Usando coordenadas esféricas, a diferença entre as duas últimas integrais nos dá

,$ $ - ($ $ 1/λ ) $
1
−1
− dx f (x) = lim − dr r dω f (ω)
|x|#1 |λx|#1 ε→0 ε ε ∥ω∥=1
$
= ln λ dω f (ω) .
∥ω∥=1
Note que, a presença do termo ln λ na expressão acima revela a não-homogeneidade da extensão

de
d t. Assim, para a distribuição T ser homogênea de grau s = −n devemos ter necessariamente
∥ω∥=1
dω f (ω) = 0. Isto também é suficiente para garantir que a distribuição T não terá um
polo em s = −n, como afirmando anteriormente!
A seguir, assumiremos que s = −n − ℓ. Então, de acordo com a Definição 6.36, f tem

ordem singular ω = [ℓ]. Logo, adicionando e subtraindo de ϕ termos de uma em série de
Taylor (truncada) até a ordem singular ω = [ℓ], obtemos
⎛ ⎞
$ < xα < 1 $
T (ϕ) = dx f (x) ⎝ϕ(x) − D ϕ(0)⎠ +
α α
D ϕ(0) dx xα f (x)
|x|#1 α! α! |x|#1
|α|#[ℓ] |α|#[ℓ]
$
+ dx f (x)ϕ(x) ,
|x|>1
para toda ϕ(x) ∈ S (Rn ). Novamente, dado o rápido decrescimento de ϕ no infinito, a integral
sobre |x| > 1 é convergente. Por outro lado, o polinômio
< xα
ϕ(x) = D α ϕ(0) ,
α!
|α|#[ℓ]
494
tem como principal propriedade o fato que ele passa pelo ponto (0, ϕ(0)) ∈ R2n e possui as
mesmas derivadas até a ordem ω = [ℓ] que a função ϕ. O polinômio acima desenvolvido numa
vizinhança de 0 aproxima a função ϕ nesta vizinhança. É importante sabermos estimar o erro
que cometemos ao se realizar esta aproximação. Faremos isto com ajuda do seguinte
LEMA 6.17 (Teorema de Taylor). Seja ϕ : Rn → R uma função diferenciável ω vezes no ponto
a ∈ Rn . Então, existe um mapeamento χα : Rn → R tal que
< D α ϕ(a) <
ϕ(x) = (x − a)α + χα (x)(x − a)α and lim χα (x) = 0 .
α! x→a
|α|#ω |α|=ω
Se a função ϕ : Rn → R é ω + 1 vezes continuamente diferenciável em um conjunto compacto

K contendo o ponto a, então, pode-se derivar uma fórmula exata para o resto χα em termos da
derivada parcial de ϕ de ordem (ω + 1) nesta vizinhança. Especificamente,
< D α ϕ(a) <
ϕ(x) = (x − a)α + χα (x)(x − a)α ,
α!
|α|#ω |α|=ω+1
em que
$ 1
|α| . /
χα (x) = dt (1 − t)|α|−1 D α ϕ a + t(x − a) .
α! 0
Neste caso, devido à continuidade da derivada parcial de ordem (ω + 1) no conjunto compacto

K, obtém-se imediatamente a seguinte estimativa:
1
|χα (x)| # sup |D α ϕ(ξ)| , x∈K .
α! ξ∈K
O Teorema do Valor Médio é um caso particular do lema acima, quando ω = 1. Portanto,

para a primeira integral obtemos
⎛ ⎞
$ < xα < $
dx f (x) ⎝ϕ(x) − D ϕ(0)⎠ =
α
dx f (x)χα (x)xα .
|x|#1 α! |x|#1
|α|#[ℓ] |α|=[ℓ]+1
Logo,
< $ 5 5 < 1
$
5 5
dx 5f (x)χα (x)xα 5 # ∥ϕ∥0,α dx 5f (x)xα 5 < ∞ .
|x|#1 α! |x|#1
|α|=[ℓ]+1 |α|=[ℓ]+1
já que xα f (x) tem grau de homogeneidade positivo e, portanto, é localmente integrável em

qualquer vizinhança de 0. Para analisar a segunda integral, usamos a mesma estratégia anterior
para obter o seguinte resultado:
< 1 $ < 1 $ 1 $
α α α n−1+s+|α|
D ϕ(0) dx f (x)x = D ϕ(0) dr r dω f (ω)ω α
α! |x|#1 α! 0 ∥ω∥=1
|α|#[ℓ] |α|#[ℓ]
< 1 $
α 1
= D ϕ(0) dω f (ω)ω α .
α! n + s + |α| ∥ω∥=1
|α|#[ℓ]
495
O funcional T (ϕ) tem polos em s = −n−|α|. De novo,d para a distribuição T não ter polos em
s = −n − |α| é necessário e suficiente que a integral ∥ω∥=1 dω f (ω)ω α = 0, o que também
garante que a distribuição T será homogênea de grau −n − |α|. Neste caso, obteremos que
⎛ ⎞
$ < xα $
⎝
dx f (x) ϕ(x) − α
D ϕ(0) +⎠ dx f (x)ϕ(x)
|λx|#1 α! |λx|>1
|α|#[ℓ]
⎛ ⎞
$ < xα $
= ⎝
dx f (x) ϕ(x) − α ⎠
D ϕ(0) + dx f (x)ϕ(x)
|x|#1 α! |x|>1
|α|#[ℓ]
< 1 ,$ $ -
α
+ D ϕ(0) − dx f (x)xα .
α! |x|#1 |λx|#1
|α|#[ℓ]
Usando coordenadas esféricas, a diferença entre as duas últimas integrais nos dá

,$ $ - ($ $ 1/λ ) $
1
α −1
− dx f (x)x = lim − dr r dω f (ω)ω α
|x|#1 |λx|#1 ε→0 ε ε ∥ω∥=1
$
= ln λ dω f (ω)ω α .
∥ω∥=1
Novamente, a presença do termo ln λ na expressão acima revela a não-homogeneidade da

extensão de t. Portanto,
d para a distribuição T ser homogênea de grau s = −n − ℓ devemos
α
ter necessariamente ∥ω∥=1 dω f (ω)ω = 0. Isto também será suficiente para garantir que a
distribuição T não terá polos em s = −n − ℓ. Consequentemente, t ∈ S ′ (Rn \ {0}) terá uma
extensão homogênea T ∈ S ′ (Rn ) também de grau s se,
$
dx f (x)xα = 0 .
|x|#1
A recíproca é imediata e a prova da proposição está completa.

Exemplo 6.31 (Exemplo 6.29 revisitado). Se f (x) = 1/x, então, xm f (x) = xm−1 tem grau
de homogeneidade positivo se [m] = 0. Logo, ω = 0. Isto nos dá imediatamente
$ $
1. / 1
dx ϕ(x) − ϕ(0) + dx ϕ(x) ,
|x|#1 x |x|>1 x
já que 51
$ $ 1 5
1 1 5
ϕ(0) dx = ϕ(0) dx = ϕ(0) ln |x|5 = 0 .
|x|#1 x −1 x 5
−1
Nota 6.29 (Nem tudo são flores). Na Proposição 6.15 nós ignoramos um fato importante:
⎛ ⎞
< xα
⎝ϕ(x) − D α ϕ(0)⎠ , (6.14.8)
α!
|α|#ω
496
não é, necessariamente, uma função teste em S (Rn ). Como é óbvio,

⎛ ⎞
< xα
lim ⎝ϕ(x) − D α ϕ(0)⎠ = ∞ . (6.14.9)
x→∞ α!
|α|#ω
Podemos remediar este inconveniente recorrendo-se à seguinte versão C ∞ do Lema de Urysohn

(veja o Corolário 1.11):
TEOREMA 6.33. Sejam Ω um conjunto aberto em Rn e K um subconjunto compacto em Ω.
Então, para qualquer vizinhança-ε de K, em que ε > 0 é número real, existe uma função
positiva ϑε ∈ D(Ω), com as seguintes propriedades:
1. 0 # ϑε # 1,
2. ϑε (x) = 1 se x ∈ Kε ,
3. ϑε (x) = 0 se x ∈
/ K3ε ,
5 α 5
4. 5D ϑε 5 # Cα ε−|α| , em que Cα é uma constante que depende de α e de n.
Demonstração. Denote por Kε a vizinhança-ε do conjunto K, isto é, existe uma margem em

torno de K em Ω, cuja largura não é inferior a ε (veja a Figura 6.14).
Kε
Figura 6.14: A vizinhança-ε do conjunto K.
Então, escolha ε > 0 (pequeno) tal que
∥x − y∥ " 4ε quando x ∈ K, y ∈ !Ω .
Seja χK2ε a função característica do conjunto

! "
K2ε = y | ∥x − y∥ # 2ε para algum x ∈ K .
Tome a função (nossa velha conhecida)

⎧ 6 7
⎨ Mε exp − 2 ε2 2 se ∥x − y∥ < ε
ε −∥x−y∥
D(Ω) ∋ ωε (x − y) = ,
⎩ 0 se ∥x − y∥ " ε
497
H
em que ∥x∥ = x21 + · · · + x2n , Mε é uma constante e ε é um número real positivo. Note
que, a função ωε é positiva para todo y ∈ Kε e tem suporte na bola fechada
d B[y; ε] de raio ε
com centro em y. Nós escolhemos a constante Mε de tal forma a obter dx ωε (x − y) = 1,
isto é, $ 6 1 7
n
Mε ε dξ exp − =1.
B[0;1] 1 − ∥ξ∥2
Considere a função ϑε = ωε ∗ χK2ε que é positiva, por definição. Note que,
$ $
. /
ϑε (x) = ωε ∗ χK2ε (x) = dy ωε (x − y)χK2ε (y) = dy ωε (x − y) .
Ω K2ε
De fato, χK2ε (y) = 0 se y ∈

/ supp χK2ε . Por outro lado, se x ∈
/ supp ωε + supp χK2ε , então
x−y ∈ / supp ωε para todo y ∈ supp χK2ε e, portanto, ωε (x−y) = 0 para todo y ∈ supp χK2ε .
. /
Consequentemente, ωε ∗ χK2ε (x) = 0. Assim, segue que
. / 3 4
supp ωε ∗χK2ε ⊂ supp ωε +supp χK2ε = x+y | x ∈ supp ωε , y ∈ supp χK2ε . (6.14.10)
Isto prova que ϑε (x) = 0 se x ∈

/ K3ε . Além disso, note que 1 − ϑε = ωε ∗ (1 − χK2ε )
desaparece em Kε por causa da propriedade (6.14.10). Isto significa que ϑε (x) = 1 se x ∈ Kε .
Finalmente, note que

$ $
5 α 5 5 5 5 5
5Dx ϑε (x)5 # dy 5Dxα ωε (x − y)5 = ε−|α| dy 5Dξα ωε (ξ)5 ,
K2ε K2ε
e ωε (ξ) tem derivadas contínuas de todas as ordens expressas por

. /
P 1/(1 − ∥ξ∥2 )
Dξα ωε (ξ) = . / ωε (ξ) ,
PN 1/(1 − ∥ξ∥2 )
. / . /
em que P 1/(1 − ∥ξ∥2) e PN 1/(1 − ∥ξ∥2) são polinômios em ξ. Além disso, Dξα ωε (ξ) → 0
. /
quando ∥ξ∥ → 1, uma vez ωε (ξ) → 0 mais rápido do que PN 1/(1 − ∥ξ∥2) → ∞.55 Assim,
as derivadas Dξα ωε (ξ) estão bem definidas em ξ = 1, para qualquer α, e são iguais a zero. Isto
nos permite concluir que ωε ∈ C ∞ (Rn ) e que
$
5 5
dy 5Dξα ωε (ξ)5 = Cα .
K2ε
Com isto, finalizamos a prova do teorema.
55
Por exemplo, em R a primeira derivada de ωε é
⎧ 6 7
⎨ −Mε 2ξ2 2 exp − 1 2 se |ξ| < 1
(1−ξ ) 1−ξ
ωε′ (ξ) = , com ξ = x/ε ,
⎩
0 se |ξ| " 1
e também está bem definida em toda parte: limx→1+ ωε′ (ξ) = 0 = limx→1− ωε′ (ξ).
498
De acordo com o Teorema 6.33, podemos reescrever as Eqs.(6.14.8) e (6.14.9) da seguinte

forma:
⎛ ⎞
< xα
⎝ϕ(x) − ϑε (x) D α ϕ(0)⎠ ∈ S (Rn ) . (6.14.8a)
α!
|α|#ω
E como é óbvio, temos

⎛ ⎞
< xα
lim ⎝ϕ(x) − ϑε (x) D α ϕ(0)⎠ = 0 . (6.14.9a)
x→∞ α!
|α|#ω
Nosso problema agora está resolvido!

PROPOSIÇÃO 6.16. Seja t ∈ S ′ (Rn \ {0}) uma distribuição homogênea de grau s # −n.
Então t tem uma extensão homogênea T ∈ S ′ (Rn ) de grau s dada por
⎛ ⎞
$ < xα
T (ϕ) = dx t(x) ⎝ϕ(x) − ϑε (x) D α ϕ(0)⎠ , (6.14.11)
α!
|α|#ω
se, e somente se, $

dx t(x)ϑε (x)xα = 0 ,
|x|#1
n
em que ϑε ∈ D(R ) como no Teorema 6.33.
Demonstração. A condição que

$
dx t(x)ϑε (x)xα = 0 ,
|x|#1
segue imediatamente da Proposição 6.15, já que ϑε (x) = 1 se x ∈ Kε e ϑε (x) = 0 se x ∈

/ K3ε ,
em que Kε representa a vizinhança-ε de um compacto K que contém a origem. Para provar a
Eq.(6.14.11) partimos da equação
⎛ ⎞
$ < xα $
⎝
T (ϕ) + T (ϑε ϱ) = dx t(x) ϕ(x) − ϑε (x) α ⎠
D ϕ(0) + dx t(x)ϑε (x)ϱ(x) ,
α!
|α|#ω
com a função ϱ sendo o resto da aproximação por polinômios de Taylor de grau ω de ϕ centrada
em x = 0. Na equação acima subtraímos, na primeira integral, um número suficiente de termos
de uma série de Taylor (modificada pela introdução da função ϑε (x)), de grau determinado pela
ordem singular de t. Seguindo o mesmo raciocínio usado na prova do Teorema 6.3, é imediato
mostrar que T (ϑε ϱ) → 0. Com efeito, escreva para cada ε > 0, ψε (x) = ϑε (x)ϱ(x), em que
supp ψε (x) ⊂ {x | |x| # 1/ε}. Então,
5 5
|T (ψε )| # C sup 5xα D β ψε (x)5 → 0 quando ε → ∞ .
|x|# ε1
Por outro lado, para cada ε, T ϑε = T , pelo Lema 6.2, uma vez que ϑε (x) = 1 na vizinhança
de x = 0. Portanto,
T (ψε ) = T (ϑε ϱ) = T ϑε (ϱ) = T (ϱ) ,
que é independente de ε. Como, T (ψε ) = 0 =⇒ T (ϱ) = 0.
499
A integral (6.14.11) converge para todo ϕ ∈ S (Rn ) e define um funcional linear contínuo.
Isso pode ser justificado da seguinte forma: observe que os termos individuais da integral são
divergentes se x = 0; formalmente esses infinitos se cancelam ao extraírmos a “parte principal”
da diferença entre as integrais divergentes. Se o suporte de ϕ não inclue odponto x = 0, então
ϕ(0) = ϕ′ (0) = · · · = ϕ(n) (0) = 0, de forma que (6.14.11) concorda com dx t(x)ϕ(x) para
toda função ϕ ∈ S (Rn \ {0}). Note que essa é uma forma muito natural de “renormalizar”
uma integral divergente.
Exemplo 6.32 (Exemplo 6.29 mais uma vez). Se f (x) = 1/x; então, de acordo com a
proposição acima, segue que
$
1. /
dx ϕ(x) − ϑε (x)ϕ(0) ,
x
com a função ϑε representada na Figura 6.15, em que tomamos ε = 1.
ϑ(x)
−1 0 1 x
Figura 6.15: A função ϑε , em que tomamos ε = 1.
PROPOSIÇÃO 6.17 (Teorema de não-unicidade). Sejam t ∈ S ′ (Rn \ {0}) uma distribuição

homogênea de grau s # −n e T1 , T2 ∈ S ′ (Rn ) duas extensões homogênea de t de grau s.
Então,
<
T2 = T1 + cα D α δ , ω ∈ N . (6.14.12)
|α|#ω
Demonstração. Pelo Teorema de Hahn-Banach, T1 é um funcional linear contínuo sobre S (Rn )

que coincide com t sobre S (Rn \ {0}). Por outro lado, T2 também coincide com t sobre
S (Rn \ {0}). Portanto, T2 − T1 desaparece sobre S (Rn \ {0}) e define um funcional linear
concentrado em x;= 0. Pelo Teorema 6.3, esse funcional é uma combinação linear de derivadas
da função delta, cα D α δ(x). Logo, temos
|α|#ω
⎛ ⎞
< <
T2 (ϕ) = ⎝T1 + cα D α δ ⎠ (ϕ) = T1 (ϕ) + cα D α δ(ϕ)
|α|#ω |α|#ω
<
= T1 (ϕ) + (−1)|α| cα δ(D α ϕ)
|α|#ω
= T1 (ϕ) ,
para todo ϕ ∈ S (Rn \ {0}), dado que supp δ ∩ supp D α ϕ = ∅. Isto prova a proposição.
500
Nota 6.30. Observamos que as constantes cα satisfazendo (6.14.12) são únicas. Com efeito, se
<
T2 = T1 + c′α D α δ , ω∈N,
|α|#ω
em que c′ são constantes, então
<
(cα − c′α )D α δ = 0 .
|α|#ω
Em particular, aplicando a equação acima na função monomial ϕ(x) = xβ , para |β| # ω,

obtemos
⎛ ⎞
< < $
⎝ (cα − c′α )D α δ ⎠ (ϕ) = (cα − c′α ) dx D α δ(x)xβ
|α|#ω |α|#ω
< $
|α|
= (−1) (cα − c′α ) dx δ(x)D α xβ .
|α|#ω
Pela Proposição 6.1 temos que
⎧
β!
⎨ (β−α)! xβ−α se α # β ,
D α xβ =
⎩ 0 caso contrário .
Logo, temos
< $ < $
|α| β!
(−1) (cα − c′α ) α β
dx δ(x)D x = (−1) |α|
(cα − c′α ) dx δ(x)xβ−α ,
(β − α)!
|α|#ω |α|#ω
não será identicamente zero se, e somente se, β = α. Portanto, segue que
⎛ ⎞
<
⎝ (cα − c′α )D α δ ⎠ (ϕ) = (−1)|β| β!(cβ − c′β ) = 0 .
|α|#ω
Isto implica que cβ = c′β , provando a unicidade das constantes cβ .
Repare que, pela Proposição 6.17, a não-unicidade tem origem no fato de podermos escolher
duas funções ϑε1 , ϑε2 ∈ D(Rn ) como no Teorema 6.33, construidas, por exemplo, a partir das
duas funções ωε1 , ωε2 ∈ D(Rn ) mostradas na Figura 6.16.
501
ωε1 (x)
ωε2 (x)
−ε2 −ε1 0 ε1 ε2 x
Figura 6.16: Duas possíveis funções ωε1 , ωε2 ∈ D(Rn ) a partir das quais podemos construir
duas funções ϑε1 , ϑε2 ∈ D(Rn ) como no Teorema 6.33.
Ainda, como para todo ϕ ∈ S (Rn )

8 9 < 1 ,$ . / α
-
T2 − T1 (ϕ) = dx t(x) ϑε2 (x) − ϑε1 (x) x D α ϕ(0)
α!
|α|#ω
< (−1)|α| ,$ . / α
- ,$ -
α
= dx t(x) ϑε2 (x) − ϑε1 (x) x dy D δ(y)ϕ(y)
α!
|α|#ω
⎛ ⎞
<
=⎝ cα D α δ ⎠ (ϕ) ,
|α|#ω
em que $
(−1)|α| . /
cα = dx t(x) ϑε2 (x) − ϑε1 (x) xα .
α!
Exemplo 6.33 (Exemplos 6.29 e 6.30 revisitados). A Proposição 6.17 justifica o resultado já
encontrado anteriormente, isto é, a renormalização de 1/x não é única. A diferença entre
quaisquer duas renormalizações de 1/x é simplesmente cδ(x), em que c = ±iπ ou c = ±2iπ.
Podemos resumir toda a discussão acima no seguinte

TEOREMA 6.34. Seja t ∈ S ′ (Rn \ {0}) uma distribuição homogênea de grau s > −n. Então t
tem uma única extensão homogênea T ∈ S ′ (Rn ) de grau s. Por outro lado, se s # −n, então
t tem uma extensão T ∈ S ′ (Rn ) dada por
⎛ ⎞
$ < xα
T (ϕ) = dx t(x) ⎝ϕ(x) − ϑε (x) D α ϕ(0)⎠ ,
α!
|α|#[ℓ]
em que [ℓ] é a ordem singular de t, no ponto x = 0, como na Definição 6.36 e ϑε ∈ D(Rn )

como no Teorema 6.33. Além disso,
< 1 $
s+n α
T (ϕλ ) = λ T (ϕ) + ln λ D ϕ(0) dω t(ω)ϑε (ω)ω α .
α! ∥ω∥=1
|α|#[ℓ]
502
Portanto, a extensão T ∈ S ′ (Rn ) de t ∈ S ′ (Rn \ {0}) será homogênea de grau s se, e somente
se, $
dω t(ω)ϑε (ω)ω α = 0 .
∥ω∥=1
Nota 6.31. Em geral, na teoria quântica dos campos, um comportamento homogêneo não
pode ser mantido na renormalização. O fato da homogeneidade nem sempre ser mantida no
processo da extensão, devido aos termos contendo o ln λ, é a origem matemática da violação
da invariância de escala na teoria quântica dos campos. Isto é conhecido como “anomalia de
escala” (também chamada de “anomalia de dilatação”) na renormalização perturbativa.
O método de extensão de distribuições que discutimos nesta seção, com o objetivo de definir
integrais de funções com singularidades algébricas não-integráveis, desempenha um papel im-
portante no cálculo de distribuições. O método também é aplicado (com sucesso) no problema
da extensão de distribuições de Feynman na teoria quântica dos campos. É precisamente esta
ideia que está por trás da abordagem da renormalização de toda a combinatória e integra-
bilidade de gráficos de Feynman que encontramos nos livros-texto sobre teoria quântica dos
campos. De fato, o cálculo de múltiplos loops pode ser considerado como um problema de
estender as distribuições de Feynman (recursivamente) para a diagonal. Este procedimento está
associado aos nomes de Epstein e Glaser.56
Nota 6.32. Observe que o Teorema 6.34 considera a extensão de S ′ (Rn \ {0}) para S ′ (Rn ),
portanto, podemos usar a transformada de Fourier. Neste caso, obtemos
< pα
T^(p) = ^
t(p) − D α^
t(0) .
α!
|α|#[ℓ]
Isso corresponde ao método de renormalização BPHZ em p = 0. A renormalização BPHZ é um

método de renormalização famoso devido a Bogoliubov, Parassiuk, Hepp e Zimmermann.57
6.14.4 Renormalização da Energia Potencial Eletrostática
Vamos encerrar este capítulo discutindo uma importante aplicação do processo de renorma-
lização discutico acima no cálculo da energia potencial eletrostática.58 Para iniciar, lembramos
brevemente alguns resultados conhecidos.
O comportamento do campo eletrostático é descrito por duas equações diferenciais:
∇ · E = 4πρ , ∇×E = 0 . (6.14.13)
A primeira das equações acima, derivada diretamente do teorema da divergência, diz que o
fluxo do campo elétrico através de uma superfície fechada, S, é proporcional à densidade de
56
H. Epstein e V. Glaser, “The Role of Locality in Perturbation Theory,” Ann. Inst. Henri Poincaré 19A (1973) 211.
57
Veja uma breve discussão do método BPHZ no livro de O. Piguet e S.P. Sorella, “Algebraic Renormalization:
Perturbative Renormalization, Symmetries and Anomalies,” Springer, Lect. Notes Phys. M28, 1995.
58
Este exemplo foi discutido por D. Prange, “Epstein-Glaser Renormalization and Differential Renormalization,”
J.Phys. A32 (1999) 2225. Veja também, J.M. Gracia-Bondía and S. Lazzarini, “Connes-Kreimer-Epstein-Glaser Renor-
malization,” hep-th/0006106.
503
carga elétrica, ρ, dentro de S. A segunda equação equivale à afirmação de ser E o gradiente

de uma função escalar, o potencial escalar Φ:
E = −∇Φ . (6.14.14)
Combinando as eqs.(6.14.13) e (6.14.14), encontramos que
∇2 Φ = −4πρ , (6.14.15)
em que
∂2 ∂2 ∂2
∇2 = + + ,
∂x2 ∂y 2 ∂z 2
é o operador diferencial de Laplace. A equação (6.14.15) é exatamente a equação de Poisson da
eletrostática. Nas regiões do espaço em que não há densidade de cargas, o potencial escalar
satisfaz a equação de Laplace
∇2 Φ = 0 . (6.14.16)
Isto nos permite identificar o potencial escalar Φ
Q
Φ= . (6.14.17)
r
;
em que r = (x2 + y 2 + z 2 )1/2 e Q = i qi , é um conjunto discreto de cargas puntiformes.
Com efeito,59 , -
Q Q
E = −∇ = 3r. (6.14.18)
r r
Embora o valor do campo E em um ponto não seja um observável bem definido, o campo
suavizado com uma função teste é bem definido. Na verdade, pode-se mostrar (veja a prova
do Teorema 6.35) que E ∈ S ′ (R3 ), portanto o espaço de funções teste sobre o qual ele deve
atuar é composto por funções ϕ ∈ S (R3 ).
Agora, suponha que queiramos determinar a energia total armazenada no campo elétrico E.
Na eletrostática clássica, considerando o campo como uma distribuição, essa energia é dada
pela integral $
1
U(ϕ) = d3 r |E(r)|2 ϕ(r) , (6.14.19)
8π
em que
Q2
|E|2 = 4 ,
r
representa a densidade total de energia.
59
Lembre-se que o operador ∇ em coordenadas esféricas é dado por
∂ 1 ∂ 1 ∂
∇= er + eθ + e ,
∂r r ∂θ r sinθ ∂ϕ ϕ
em que er , eθ e eϕ são vetores unitários ortogonais.
504
Sendo E ∈ S ′ (R3 ), o produto |E|2 não é bem definido, a priori, devido à singularidade
não-integrável em r = 0. Fisicamente, isso é interpretado como sendo um efeito da “auto-
energia” do campo elétrico. |E|2 só faz sentido como um elemento de S ′ (R3 \ {0}), isto
é, omitindo a contribuição da “auto-energia.” Insistindo na computação da energia potencial
eletrostática em todo R3 , devemos, então, estender o domínio de definição de |E|2 de S ′ (R3 \
{0}) → S ′ (R3 ) via o processo de renormalização (extensão). Para isto, precisamos primeiro
determinar a ordem singular de |E|2 em r = 0 multiplicando |E|2 por r m . Nesse8 caso,2 9o grau
m 2 m−4+3 m
de homogeneidade de r |E| é igual a m − 4. Isso implica que para λ r |E| → 0,
2
quando λ → 0, devemos ter [m] = 1. Portanto, a ordem singular de |E| , em r = 0, é 1. Logo,
a expressão da energia potencial eletrostática renormalizada é dada por:
$ =
1 . />
URen (ϕ) = d3 r |E(r)|2 ϕ(r) − ϑ(r) ϕ(0) + xi ∂xi ϕ(0) , (6.14.20)
8π
= . />
em que ϕ(r) − ϑ(r) ϕ(0) + xi ∂xi ϕ(0) ∈ S (R3 ).
Contudo, segundo a Proposição 6.17, o processo de renormalização não é único, carregando

um certo grau de ambiguidade representado pela possibilidade que temos de adicionar a qual-
quer solução particular uma distribuição concentrada em r = 0 da forma c0 δ(r) + ci ∂xi δ(r).
As constantes c0 e ci parametrizam as ambiguidades presentes na solução do problema. Con-
sequentemente, a energia potencial total é dada por:
$
. /
UTotal (ϕ) = URen (ϕ) + d3 r c0 δ 3 (r) + ci ∂xi δ 3 (r) ϕ(r) . (6.14.21)
As constantes c0 e ci podem ser determinadas através de condições físicas extras impostas

sobre a solução (6.14.21). Neste caso particular, as constantes ci podem ser descartadas por
razões de simetria. Para determinarmos a constante c0 , uma possível condição que se pode
adotar é aquela que toma ϕ = ϑ = 1, devido ao bom comportamento do campo elétrico no
infravermelho (convergência em longas distâncias, isto é, |E(r)|2 decai suficientemente rápido
para |r| → ∞). Isso dá, exatamente, a auto-energia do campo elétrico, U = c0 . Podemos
fixar a constante c0 = 0, uma vez que a auto-energia do campo elétrico é uma quantidade
não-mensurável. Somente diferenças de energia são quantidades observáveis, ou medidas!
505
Apêndice 6A: Área da Esfera Unitária S n−1

Um outro resultado que podemos deduzir diretamente do Lema 6.6 e do Corolário 6.3 diz
respeito ao cálculo da área da esfera unitária S n−1 em Rn (isto é, esfera de raio 1 em Rn ),
resultado este que teremos oportunidade de usar em vários momentos ao longo do texto. Com
efeito, a área ωn−1 da esfera unitária S n−1 em Rn é
n
2π 2
ωn−1 = .n/ . (6A.1)
Γ 2
Demonstração. Primeiro, introduzimos coordenadas esféricas (n-dimensional) para fazer uma

mudança de variáveis, alterando o sistema de coordenadas cartesianas (x1 , x2 , . . . , xn ) para as
coordenadas (r, θ1 , θ2 , . . . , θn−1 ). Lembremos que as coordenadas esféricas estão relacionadas
com as coordenadas cartesianas da seguinte forma:
⎛ ⎞ ⎛ ⎞
x1 r cos θ1
⎜ x2 ⎟ ⎜ r sin θ1 cos θ2 ⎟
⎜ ⎟ ⎜ ⎟
⎜ .. ⎟ ⎜ .. ⎟
⎜ . ⎟ ⎜ . ⎟
⎜ ⎟=⎜ ⎟ ,
⎜ xn−2 ⎟ ⎜ r sin θ1 · · · sin θn−3 cos θn−2 ⎟
⎜ ⎟ ⎜ ⎟
⎝ xn−1 ⎠ ⎝ r sin θ1 · · · sin θn−2 cos θn−1 ⎠
xn r sin θ1 · · · sin θn−2 sin θn−1
em que 0 # r < ∞, 0 # θ1 < 2π e 0 # θj < π, com j = 2, . . . , n − 1. Esta expressão
pode ser verificada por meio de indução para n. Para n = 2 e n = 3 elas são bem conhecidas.
Definindo
⎛ ⎞ ⎛ ⎞ ⎛ ⎞ ⎛ ⎞
ω1 cos θ1 x1 ω1
⎜ ω2 ⎟ ⎜ sin θ1 cos θ2 ⎟ ⎜ x2 ⎟ ⎜ ω2 ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎜ .. ⎟ ⎜ .. ⎟ ⎜ .. ⎟ ⎜ .. ⎟
⎜ . ⎟ ⎜ . ⎟ ⎜ ⎟ ⎜ ⎟
⎜ ⎟=⎜ ⎟ =⇒ ⎜ . ⎟ = r ⎜ . ⎟ ,
⎜ ωn−2 ⎟ ⎜ sin θ1 · · · sin θn−3 cos θn−2 ⎟ ⎜ xn−2 ⎟ ⎜ ωn−2 ⎟
⎜ ⎟ ⎜ ⎟ ⎜ ⎟ ⎜ ⎟
⎝ ωn−1 ⎠ ⎝ sin θ1 · · · sin θn−2 cos θn−1 ⎠ ⎝ xn−1 ⎠ ⎝ ωn−1 ⎠
ωn sin θ1 · · · sin θn−2 sin θn−1 xn ωn
e não é difícil ver que da relação
Q
∥x∥ = x21 + · · · + x2n = r ,
segue que o vetor ω = (ω1 , . . . , ωn ) tem norma ∥ω∥ = 1. Esse vetor representa o sistema
de coordenadas dos pontos sobre a esfera unitária em n dimensões. Logo, compactamente,
podemos escrever
x = rω , r ∈ [0, ∞) , ω ∈ S n−1 ,
em que S n−1 denota a esfera de raio um centrada na origem de Rn , lembrando que dx =
r n−1 drdω. Portanto,
dω = J(θ1 , . . . , θn−1 )dθ1 , . . . , dθn−1 ,
com J(θ1 , . . . , θn−1 ) = sinn−2 θn−1 sinn−3 θn−2 · · · sin θ2 . Denote por ωn−1 a área da esfera
unitária S n−1 em Rn . Logo,
$ 2π $ π $ π
ωn−1 = ··· dθ1 , . . . , dθn−1 J(θ1 , . . . , θn−1 ) .
0 0 0
506
Para calcular ωn−1 , podemos usar a forma explícita de J. No entanto, um método mais fácil
e elegante segue, imediatamente, da primeira parte do Lema 6.6. Com efeito, para α = 1,
obtemos
$ $ $ ∞
n 2 +···+x2 ) 2
−(x
π2 = dx e 1 n
= dω dr r n−1 e−r
Rn S n−1 0
$ ∞
2
= ωn−1 dr r n−1e−r
0
$ ∞
1 n
= ωn−1 dt t 2 −1 e−t
2 0
1 6n7
= ωn−1 Γ .
2 2
Logo,
n
2π 2
ωn−1 = .n/ .
Γ 2
Deve-se enfatizar que, como n é a dimensão do espaço e, portanto, um número inteiro

positivo, a função Gama, Γ, pode ser calculada explicitamente através da integral
$ ∞
Γ(n) = dx xn−1 e−x ,
0
em que Γ(n + 1) = nΓ(n), lembrando que Γ(n) = (n − 1)!. Isto implica que
⎧
⎪ 1 n
⎪
⎪ . / 2π 2 se n é par
⎨ n −1 !
2
ωn−1 = . 1 / .
⎪
⎪ (n − 1) ! n 1 (n−1)
⎪
⎩ 2
2 π2 se n é ímpar
(n − 1)!
Nota 6.33. Para derivar o volume, Vn (R), de uma bola n de raio R a partir do cálculo da área
da esfera unitária, basta integrar a área da superfície de uma esfera de raio r, com 0 # r # R,
e aplicar a equação funcional Γ(a + 1) = aΓ(a):
$ R n n n
n−1 2π 2π 2 π2
2
n
Vn (R) = dr r .n/ = .n/R = .n / Rn , (6A.2)
0 Γ 2
nΓ 2
Γ 2
+ 1
em que
⎧ n
⎪
⎪ π2
π2
n ⎨ . n /!
⎪ se n é par
.n /= 2 ,
Γ 2 +1 ⎪
⎪ ⌊n ⌋ ⌈n ⌉
⎩π 2
⎪ 2 2
se n é ímpar
n!!
com n!! sendo o fatorial duplo. Na fómula acima os símbolos ⌊ · ⌋ e ⌈ · ⌉ denotam as funções
floor e ceiling, respectivamente. A função floor é a função que assume como entrada um
507
número real x e fornece como saída o maior número inteiro menor ou igual a x. Da mesma
forma, a função ceiling é a função que assume como entrada um número real x e fornece como
saída o menor número inteiro maior ou igual a x.
Por sua vez, se ωn−1 (R) é a área da superfície da n-esfera de raio R, então
n
d 2π 2
Vn (R) = ωn−1 (R) = . n / Rn−1 . (6A.3)
dR Γ 2
508
Apêndice 6B: A Equação de Poisson e as Identidades de

Green
Neste apêndice apresentamos alguns cálculos simples com distribuições. Considere P (D)
um operador diferencial parcial com coeficientes constantes, isto é,
<
P (D) = aα D α .
|α|#m
Uma solução fundamental do operador P (D) é uma distribuição u(x) ∈ S ′ se

P (D)u(x) = δ(x) . (6B.1)
Note que essa solução não é única: se P (D)v(x) = 0, então u N(x) = u(x) + v(x) também
é uma solução fundamental. Este resultado é importante, pois nos permite modificar soluções
fundamentais conhecidas de maneira conveniente para o tratamento de certos problemas. Isto
acontece, por exemplo, na construção de funções de Green do operador laplaciano na solução
de problemas eletrostáticos sujeitos a certas condições de contorno (do tipo Dirichlet e/ou do
tipo Neumann).60
Se f (x) é uma dada distribuição, e podemos achar uma solução fundamental u(x) =
(E ∗ f )(x), então
P (D)u(x) = P (D)(E ∗ f )(x) = (P (D)E ∗ f )(x) = (δ ∗ f )(x) = f (x) . (6B.2)
Isto acontece porque δ faz o papel da identidade do produto de convolução.
De acordo com um teorema devido a Malgrange-Ehrenpreis-Hörmander todo operador di-

ferencial com coeficientes constantes tem uma solução fundamental. Malgrange e Ehrenpreis
provaram independentemente o teorema para o espaço de distribuições em D ′ . Coube a Hör-
mander a prova para o caso de distribuições em S ′ . Só para ilustrar a ideia básica, tomando-se
a transformada de Fourier de P (D)u(x) = δ(x), obtemos
^(k) = (P (ik))−1 .
u (6B.3)
O problema é que (P (ik)) pode anular-se para certos valores de k e, assim, não podemos
interpretar imediatamente (P (ik))−1 como uma distribuição. A prova, então, depende do
teorema de Hahn-Banach. Como esperado, em geral, equações diferenciais parciais terão tantas
soluções fundamentais, quantas permitirem o teorema de Hahn-Banach.
def.
Para uma ilustração, suponha que P (D) = ∇2 em Rn , seja o operador laplaciano, isto é,
∂2 ∂2
∇2 = + · · · + . (6B.4)
∂x21 ∂x2n
A equação de Poisson
∇2 u(x) = f (x) , (6B.5)
está associada aos fenômenos estacionários (aqueles independentes do tempo) como, por exem-
plo, os potênciais eletrostáticos gerados por distribuições fixas de cargas.
60
Veja J.D. Jackson, “Eletrodinâmica Clássica,” Editora Guanabara Dois, 1983.
509
TEOREMA 6.35. Seja u(x) = 1/∥x∥ ∈ R3 , em que ∥x∥ = (x2 + y 2 + z 2 )1/2 . Então
(i) ∇2 u(x) = 0 se x ̸= 0,
(ii) u(x) ∈ Lloc 3

1 (R ), isto é, u(x) é localmente integrável,
(iii) u(x) ∈ S ′ (R3 ),
(iv) ∇2 u(x) = −4πδ(x) no sentido distribucional.
Antes de provar esse teorema, é necessário estabelecer alguns resultados úteis.
LEMA 6.18 (As identidades de Green). Seja Ω ⊂ R3 uma região limitada e φ, ψ funções de
classe C 2 . Então,
(a) a primeira identidade de Green implica que

$ $
2
dx (φ∇ ψ + ∇φ · ∇ψ) = dσ n · (φ∇ψ) ,
Ω ∂Ω
(b) a segunda identidade de Green implica que

$ $
2 2
dx (φ∇ ψ − ψ∇ φ) = dσ n · (φ∇ψ − ψ∇φ) .
Ω ∂Ω
Lembrete: o operador ∇ é por definição dado por

∂ ∂ ∂
∇= ei + ej + e .
∂x ∂y ∂z k
Demonstração. As identidades de Green acima são consequências do teorema da divergência

$ $
dx ∇ · f = dσ n · f . (6B.6)
Ω ∂Ω
Esse teorema converte uma integral no volume Ω, em uma integral sobre a superfície que encerra
Ω. n é a normal exterior a ∂Ω em um certo ponto. Para provar a parte (a) do lema, substitua
f = φ∇ψ no teorema da divergência. Note então que ∇ · (φ∇ψ) = φ∇2 ψ + ∇φ · ∇ψ. Para
provar (b), troque ψ por φ na primeira identidade de Green e subtraia a identidade resultante
de (a), os termos ∇φ · ∇ψ se cancelam e se tem a segunda identidade de Green.
Demosntração do Teorema 6.35. Para provar (i), é conveniente trabalhar com coordenadas es-
féricas. Neste caso, obtemos que ∇2 (1/r) = 0 para r ̸= 0. Então, uma aplicação direta do
correspondente laplaciano em coordenadas esféricas resulta
, -
21 1 ∂ 2 ∂ 1
∇ = 2 r =0.
r r ∂r ∂r r
510
Para provar (ii) note que em coordenadas esféricas

$ $ R $
1 r2 4πR2
dx = dr dω = <∞.
r#R ∥x∥ 0 r S2 2
Para provar (iii) considere ϕ ∈ S (R3 ), então:

$ $
|ϕ(x)|
dx |u(x)ϕ(x)| # dx (1 + |x|)α
R3 R3 ∥x∥(1 + |x|)α
$
1
# ∥ϕ∥α,0 dx
R3 ∥x∥(1 + |x|)α
$
1
# ∥ϕ∥α,0 dx (6B.7)
R3 ∥x∥(1 + ∥x∥)α
$ ∞ $
r
# ∥ϕ∥α,0 dr dω
0 (1 + r)α S 2
# 4π C∥ϕ∥α,0 ,
em que, de acordo com o Lema 6.5,

$ ∞
r
C= dr <∞,
0 (1 + r)α
para α > 1.61
Para provar (iv), observe que graças à operação (6.3.1) podemos escrever
$
2 2
∇ u(ϕ) = u(∇ ϕ) = dx u(x)∇2 ϕ(x) .
R3
Considerando que o supp ϕ ⊂ Ω = {x ∈ R3 | ε # |x| # R} segue que,

$ $
2
dx u(x)∇ ϕ(x) = lim lim dx u(x)∇2 ϕ(x) .
R3 R→∞ ε→0
ε!|x|!R
Aplicando a segunda identidade de Green ao suporte de ϕ, obtemos:

$ b$
1
lim lim dx u(x)∇2 ϕ(x) = lim lim dx ϕ(x)∇2 +
R→∞ ε→0 R→∞ ε→0 ∥x∥
ε!|x|!R ε!|x|!R
$ , -c
1 ∂ ∂ 1
+ dσ ϕ(x) − ϕ(x) ,
∂Ω ∥x∥ ∂n ∂n ∥x∥
61
Na prova acima, novamente usamos o fato que ∥x∥ # |x|, segundo nossas notações definidas no início deste
capítulo.
511
em que ∂Ω é o elemento de superfície das esferas |x| = ε e |x| = R. Na expressão acima,

∂ ∂
usamos o fato que ϕ∇u = ϕ ∂n u, em que ∂n é a derivada normal sobre as superfícies das
esferas dirigida para fora.
Uma vez que 1/∥x∥ satisfaz a equação de Laplace ∇2 (1/∥x∥) = 0 em todos os pontos
excluindo a origem, temos $
1
dx ϕ(x)∇2 =0.
ε#|x|#R ∥x∥
∂ ∂
Observando que em coordenadas esféricas podemos escrever ∂n = ∂r , então a integral que
resta ser avaliada, aquela sobre ∂Ω, torna-se
$ , -
1 ∂ ∂ 1
lim lim dσ ϕ(x) − ϕ(r) .
R→∞ ε→0 ∂Ω r ∂r ∂r r
Essa integral divide-se na soma de duas outras. A primeira dessas, sobre r = ε, tende a
∂ ∂
−4πϕ(0) nos limites acima. Note que, neste caso ∂n = − ∂r . Por (6.2.5), a derivada da função
teste ϕ é limitada 5 5
5∂ 5
5 ϕ(r)5 # M ,
5 ∂r 5
logo,
5$ 5
5 1 ∂ 5 M
5 dσ ϕ(r)55 # 4πε2 = 4πεM → 0 quando R → ∞, ε → 0 ,
5 r ∂r ε
r=ε
Agora, como ϕ(r) é contínua em r = 0, então

$ $
∂ 1 1
dσ ϕ(r) =− 2 dσ ϕ(r) → −4πϕ(0) quando R → ∞, ε → 0 ,
r=ε ∂r r ε r=ε
A segunda integral sobre r = R, tende a zero quando R → ∞, ε → 0. Lembre-se que

ϕ ∈ S (R3 ) e por definição essas funções teste caem a zero mais rápido que qualquer potência
de 1/R quando R → ∞. Isso completa a prova.
512
Apêndice 6C: Definição e Fatos sobre Funções Analíticas

Funções analíticas são o objeto central de estudo na análise complexa. Uma função analítica
é uma função de uma ou mais variáveis complexas valorada no conjunto de números complexos
que é diferenciável no sentido complexo na vizinhança de cada ponto do seu domínio.
Nota 6.34. O termo função holomorfa 62 é frequentemente usado como sinônimo de “função
analítica,” embora a palavra “analítica” também seja usada num sentido mais amplo para
descrever qualquer função (real, complexa, ou de um tipo mais geral) que é igual à sua série
de Taylor em uma vizinhança de cada ponto do seu domínio. Hoje em dia, o termo “função
holomorfa” é por vezes preferido ao termo “função analítica,” pois um resultado importante na
análise complexa é que cada função holomorfa é analítica complexa, fato este que não segue
diretamente das definições. O termo “analítica,” no entanto, também é largamente utilizado.
Se Ω é um subconjunto aberto de C e f : Ω → C é uma função de uma variável complexa,

dizemos que f é diferenciável complexa ou C-diferenciável no ponto z0 de Ω se o limite
f (z) − f (z0 )
f ′ (z0 ) = lim ,
z→z0 z − z0
existir. Este limite se toma aqui sobre todas as sequências de números complexos que se
aproximam de z0 , e para todas essa sequências o quociente de diferenciais tem que resultar no
mesmo número f ′ (z0 ). Intuitivamente, se f é diferenciável complexa em z0 e nas proximidades
ao ponto z0 da direção r, então as imagens se aproximarão ao ponto f (z0 ) a partir da
direção f ′ (z0 )r, com o último produto sendo a multiplicação de números complexos. Este
conceito de diferenciabilidade no caso complexo compartilha várias propriedades da noção de
diferenciabilidade no caso real: é linear e obedece a regra do produto, a regra do quociente e a
regra da cadeia.
DEFINIÇÃO 6.37. Sejam Cn o espaço vetorial complexo n-dimensional e f : Ω → C, com

Ω ⊂ Cn aberto. Diz-se que a função complexa f de n variáveis complexas é analítica em Ω se
∂f /∂zj existe para todo ponto z = (z1 , . . . , zn ) ∈ Ω.
Nota 6.35. Uma função que seja analítica sobre todo o espaço complexo Cn é chamada função
inteira de n variáveis complexas.
Considere uma função de uma variável complexa z = x + iy, mais especificamente, f (z) =
2
z . Podemos escrever
f (z) = z 2 = (x + iy)2 = x2 − y 2 + 2ixy = u(x, y) + iv(x, y) ,
em que u(x, y) = x2 − y 2 e v(x, y) = 2xy. Em geral, podemos escrever
f (x + iy) = u(x, y) + iv(x, y) .
Aqui, deve ser entendido que u e v são funções reais das variáveis reais x e y.
62
A palavra “holomorfa” foi introduzida por dois estudantes de Cauchy, Briot (1817-1882) e Bouquet (1819-1895), e
deriva do grego (holos) que significa “inteiro,” e (morphe) que significa “forma” ou “aparência.”
513
Seja Ω um subconjunto aberto em Cn , em que n > 1, e seja f ∈ C 1 (Ω). Então,

<n <n
∂f ∂f
df = dzj + dz̄j ,
j=1
∂zj j=1
∂ z̄j
em que zj = xj + iyj e z̄j = xj − iyj . Disso, obtemos que

zj + z̄j zj − z̄j
xj = e yj = .
2 2i
Logo, escrevendo
f (z1 , . . . , zn ) = u(x1 , . . . , xn , y1, . . . , yn ) + iv(x1 , . . . , xn , y1 , . . . , yn )

6 z + z̄ zn + z̄n z1 − z̄1 zn − z̄n 7
1 1
=u ,..., , ,..., +
2 2 2i 2i
6 z + z̄ zn + z̄n z1 − z̄1 zn − z̄n 7
1 1
+ iv ,..., , ,..., ,
2 2 2i 2i
temos, pela regra da cadeia,
∂f ∂u ∂xj ∂u ∂yj 6 ∂v ∂x ∂v ∂yj 7
j
= + +i +
∂zj ∂xj ∂zj ∂yj ∂zj ∂xj ∂zj ∂yj ∂zj
1 6 ∂u ∂u 7 i 6 ∂v ∂v 7
= −i + −i ,
2 ∂xj ∂yj 2 ∂xj ∂yj
ou seja,
∂ def. 1 6 ∂ ∂ 7
= −i .
∂zj 2 ∂xj ∂yj
Da mesma forma mostra-se que

∂f 1 6 ∂u ∂u 7 i 6 ∂v ∂v 7
= +i + +i ,
∂ z̄j 2 ∂xj ∂yj 2 ∂xj ∂yj
ou seja,
∂ def. 1 6 ∂ ∂ 7
= +i .
∂ z̄j 2 ∂xj ∂yj
A relação entre a diferenciabilidade no caso real e diferenciabilidade no caso complexo nos

leva à seguinte
DEFINIÇÃO 6.38 (Definição de Riemann). Seja f : Ω → C, com Ω ⊂ Cn aberto. Diz-se que a
função complexa f (x + iy) = u(x, y) + iv(x, y) é analítica em Ω se para cada ponto z0 ∈ Ω
todas as primeiras derivadas parciais ∂f /∂z j = 0, para j = 1, . . . , n, isto é, em todos os pontos
do aberto Ω as seguintes condições são satisfeitas:
∂u ∂v ∂u ∂v
= e =− . (6C.1)
∂xj ∂yj ∂yj ∂xj
As condições acima são chamadas Condições de Cauchy-Riemann.
514
Assim, de acordo com a definição de Riemann, uma função é analítica em um ponto z0 se

ela é analítica com respeito a cada variável zj separadamente (com as outras variáveis mantidas
fixas) em uma vizinhança deste ponto.
TEOREMA 6.36 (Teorema Looman-Menchoff). Uma função contínua a valores complexos de-
finida em um conjunto aberto do plano complexo é analítica se, e somente se, ela satisfaz as
equações de Cauchy-Riemann.
A existência de uma derivada no sentido complexo é uma condição muito forte, pois implica
que qualquer função analítica é realmente infinitamente diferenciável e igual á sua própria série
de Taylor. Isto nos leva à uma outra definição de uma função analítica.
DEFINIÇÃO 6.39 (Definição de Weierstrass). Seja f : Ω → C, com Ω ⊂ Cn aberto. Diz-se que

a função complexa f é analítica em Ω se para cada ponto z0 ∈ Ω se ela é a soma de uma série
de potências absolutamente convergente
∞
<
f (z) = aα1 ,...,αn (z1 − (z0 )1 )α1 · · · (zn − (z0 )n )αn , (6C.2)
α1 ,...,αn =0
em que
1 ∂ |α| f ((z0 )1 , . . . , (z0 )n )
aα1 ,...,αn = .
α1 ! · · · αn ! ∂z1α1 · · · ∂znαn
Portanto, toda função que é analítica no sentido de Weierstrass é contínua e infinitamente

diferenciável, e todas as suas derivadas também são funções analíticas. Em particular, toda
função analítica no sentido de Weierstrass é analítica no sentido de Riemann.
515
Apêndice 6D: Prova da Equação (6.13.7)

Para provarmos a Eq.(6.13.7)), vamos antes relembrar um pouco a teoria do Teorema dos
Resíduos. Maiores detalhes podem ser encontrados nos livros de G. Ávila, M.G. Soares, E. Butkov
e M. Boas.
Seja f (z) analítica em uma vizinhança de z = a exceto, talvez, em z = a. Em outras

palavras, f (z) é analítica em z = a ou tem neste ponto uma singularidade isolada. Seja C uma
curva simples fechada no interior desta vizinhança e em torno de z = a. Então a integral
`
1
Res f (a) = dz f (z) ,
2πi C
independe da escolha de C e é chamada de resíduo da junção no ponto z = a. Evidentemente,
se f (z) é analítica em z = a, então este ponto é chamado ponto regular. Nesse caso, o resíduo
é zero. Se z = a é uma singularidade isolada, então o resíduo pode ser ou não zero.
Os resíduos de uma função em suas singularidades isoladas se aplicam ao cálculo de inte-

grais, complexas ou reais. Isso é uma consequência do seguinte
TEOREMA 6.37 (Teorema dos Resíduos). Seja f (z) uma função analítica no domínio Ω \
{a1 , a2 , . . . , an }. Suponha que C ⊂ Ω \ {a1 , a2 , . . . , an } é uma curva C, orientada positiva-
mente,63 tal que a região fechada e limitada por C está contida em Ω e contém todos os pontos
singulares a1 , a2 , . . . , an . Então
` <n
dz f (z) = 2πi Res f (ai ) .
C i=1
No cálculo de certas integrais, através do Teorema dos Resíduos, muitas vezes vamos encon-
trar integrais do tipo $ ∞
dz eikz f (z) .
−∞
No desenvolvimento dessas integrais seremos levados a considerar a integral

$
IR = dz eikz f (z) ,
CR
em que CR é uma semi-círculo de centro na origem e raio R. O Lema de Jordan, que

consideramos a seguir, estabelece condições suficientes para que esta integral tenda a zero
quando R → ∞.
LEMA 6.19 (Lema de Jordan). Sejam k > 0 e CR = Reiθ , com 0 # θ # π, um contorno semi-
circular de raio positivo R situado no semi-plano superior, centrado na origem.64 Suponha que f
seja regular nesse semi-plano à exceção, eventualmente, de um número finito de singularidades
isoladas, e que o máximo M(R) de |f (z)| para z em CR tenda a zero quando R tender para o
infinito. Então IR → 0, quando R → ∞.
63
Estamos admitindo que a curva é orientada no sentido anti-horário.
64
Lembre-se que, se CR for um círculo de raio R com centro em z = a, então fica fácil o cálculo de certas
integrais fazendo z = a + Reiθ . Neste caso, dz = iReiθ dθ.
516
Antes de apresentarmos a prova do Lema de Jordan, vamos precisar do seguinte lema auxiliar:
LEMA 6.20. sin θ " 2θ/π no intervalo 0 # θ # π/2.
Demonstração. Considere a função

2θ
f (θ) = sin θ − ,
π
cuja derivada
df (θ) 2
= cos θ − ,
dθ π
se anula para um certa valor a, é positiva para 0 < θ < a e negativa para a < θ < π/2. A
função f é então crescente no intervalo 0 < θ < a e decrescente em a < θ < π/2. Como
f (0) = f (π/2) = 0, conclui-se que f (θ) " 0 em todo o intervalo a < θ < π/2, logo
sin θ " 2θ/π nesse intervalo.
Demonstração do Lema de Jordan. Temos

$ π
IR = dθ iReiθ eikR(cos θ+i sin θ) f (Reiθ )
0
$ π
= iR dθ ei(kR cos θ+θ) e−kR sin θ f (Reiθ ) ,
0
donde segue que

$ π $ π
−kR sin θ
|IR | # RM(R) dθ e = 2RM(R) dθ e−kR sin θ .
0 0
Como, pelo Lema 6.20, sin θ " 2θ/π no intervalo 0 # θ # π/2, então:
$ π
πM(R)
|IR | # 2RM(R) dθ e−2kRθ/π = (1 − e−kR ) −R→∞
−−→ 0 .
0 k
Estamos, agora, prontos para provar a Equação (6.13.7). Tomamos a integral

$ ∞ $ R
eikx eikx
dx = lim lim dx .
−∞ x ε→0 R→∞ −R x − iε
A integral do lado direito da equação acima pode ser tratada como parte da integral complexa
`
eikz
lim dz ,
ε→0
C
z − iε
que tem pólo simples no ponto z = iε. Aqui, usamos, como tradicionalmente é feito em Física,
o expediente de deslocar para cima o pólo original em z = 0, por meio de uma quantidade
infinitesimal ε. Isto corresponde ao contorno C1 , com o contorno sendo fechado por meio
517
de um semi-círculo de raio R, contido no semi-plano superior do plano complexo. Podemos,

então, escrever
` $ R $
eikz eikx eikz
lim dz = lim lim dx + lim dz .
ε→0
C
z − iε ε→0 R→∞ −R x − iε ε→0 C
R
z − iε
;
Pelo teorema dos resíduos, a integral do lado esquerdo é igual a 2πi ni=1 Res f (ai ). Como o
integrando f (z) = eikz /(z − iε) tem pólo simples em z = iε, então
Res f (iε) = lim (z − iε)f (z) .

z→iε
Logo, temos que o lado esquerdo dá como resultado 2πi limε→0 eikε = 2πi. Levando em conta
que a integral sobre CR tende a zero, pelo Lema de Jordan, obtemos:
$ ∞
^ eikx
f (k) = lim dx = 2πiθ(k) .
ε→0 −∞ x − iε
Note que θ(k) garante que k > 0, já que CR corresponde ao semi-círculo de raio R contido
no semi-plano superior do plano complexo.
518
Apêndice 6E: Integral Oscilatória

Neste apêndice apresentamos um outro método para computar o conjunto de frente de
ondas de uma distribuição, baseado em uma outra ferramenta importante desenvolvida por
Hörmander chamada Distribuição Integral de Fourier, ou Integral Oscilatória, empregada no
estudo de operadores pseudo-diferenciais. A ideia é generalizar operadores diferenciais lineares
com coeficientes variáveis.
Lembrando que a transformada de Fourier inversa é dada por

$
1
u(x) = dk e−ikx u
^(k) ,
(2π)n
então se diferenciarmos a expressão acima, obtemos
$
α (−i)|α|
D u(x) = n
dk e−ikx k α u
^(k) ,
(2π)
; α
Se p(x, D) = |α|#m aα (x)Dx é um operador diferencial com coeficientes dependendo de
x ∈ Rn , então
$
1
p(x, D)u(x) = n
p(x, D) dk eikx u ^(k)
(2π)
$
1
= n
dk p(x, k)eikx u
^(k) , (6E.1)
(2π)
;
em que u(x) ∈ S (Rn ), u
^(k) é transformada de Fourier, p(x, k) = |α|#m aα (x)k α .
Vamos usar a representação da integral de Fourier (6E.1) para definir operadores pseudo-di-
ferenciais, tomando a função p(x, k) como pertencendo à uma classe geral de símbolos, que
agora definimos.
DEFINIÇÃO 6.40. Dado um conjunto aberto X ⊂ Rn , define-se o espaço de símbolos Sρ,δ
m
(X ×
s s
R ), sobre X × R de ordem m e tipo (ρ, δ), em que m ∈ R, 0 < ρ # 1 e 0 # δ < 1,
como sendo o espaço composto por funções suaves a(x, k) (funções C ∞ sobre X × Rs ), tal que
para qualquer conjunto compacto Ω ⊂ X, sobre o qual as funções a(x, k) tomam valores, e
multi-índices α ∈ Nn , β ∈ Ns , existe uma constante Cα,β,Ω com
5 5
5 α β 5
5Dx Dk a(x, k)5 # Cα,β,Ω (1 + |k|)m−ρ|β|+δ|α| ∀ x ∈ Ω; k ∈ Rs . (6E.2)
As melhores constantes Cα,β,Ω , possíveis, em (6E.2) são semi-normas

5 5
5 5
∥a∥α,β,Ω = sup (1 + |k|)ρ|β|−δ|α|−m 5Dxα Dkβ a(x, k)5 . (6E.3)
x∈Ω; k∈Rs
Em aplicações de interesse nesta seção, precisaremos tratar somente com símbolos (e ope-
radores pseudo-diferenciais) do tipo (1,0). Um polinômio com respeito a k de grau m, com
m
coeficientes constantes, é com certeza um símbolo S1,0 .
519
m
DEFINIÇÃO 6.41. Dado um símbolo a em Sρ,δ (X × X × Rs ), com a variável k ∈ Rs sendo
considerada o dual das variáveis xi ∈ X, o operador pseudo-diferencial é um operador integral
de Fourier
$
1
Au(x) = dkdn y eik(x−y) a(x, y, k)u(y) ∀ u ∈ S (X) . (6E.4)
(2π)n
Representamos por Lm m
ρ,δ (X) o espaço desses operadores e dizemos que A ∈ Lρ,δ (X) é de ordem
# m e do tipo (ρ, δ).
∂ 2 ∂ 2
Exemplo 6.34. O inverso de (1 − ∇2 ) : S (Rn ) → S (Rn ), em que ∇2 = ∂x 2 + · · · + ∂x2 é
1 n
o operador laplaciano, é dado por
$
2 −1 1 1
Au(x) = (1 − ∇ ) u(x) = n
dk eikx ^(k) ,
u (6E.5)
(2π) (1 + k 2 )
;
com k 2 = ni=1 ki2 . Portanto, A ∈ L−2 n
1,0 (R ).
Exemplo 6.35. A é um operador diferencial de ; ordem # m sobre X ⊂ Rn com coeficientes

suaves, então A ∈ Lm1,0 (X). De fato, se A =
α ∞
|α|#m aα (x)Dx , com a ∈ C (X), então pela
transformada inversa de Fourier obtemos
$ $
1 ikx 1
Au(x) = dk e a(x, k)^ u(k) = dkdn y eik(x−y) a(x, k)u(y) , (6E.6)
(2π)n (2π)n
;
em que a(x, k) = |α|#m aα (x)k α ∈ S1,0 m
(X × Rs ).
DEFINIÇÃO 6.42. Seja X ⊂ Rn aberto e Γ um cone aberto em X × Rs \ {0}. Dizemos que a

função ϕ(x, k) ∈ C ∞ (Γ) é uma função fase em Γ se
1. ϕ é homogênea de grau 1 em k, isto é, ϕ(x, λk) = λϕ(x, k) se (x, k) ∈ Γ ∀ λ > 0,
2. Im ϕ(x, k) " 0,
; ;
3. dϕ = ni=1 ∂x∂ϕ
i
dxi + si=j ∂ϕ
∂kj
dkj ̸= 0, isto é, ϕ não tem pontos críticos em Γ. Isto
∂ϕ ∂ϕ
significa que em cada ponto em Γ, alguma das derivadas ∂xi
ou ∂kj
nunca se anulam.
DEFINIÇÃO 6.43. Uma integral oscilatória – ou distribuição integral de Fourier – sobre X × Rs

é escrita formalmente como
$
Iϕ (a) = dk eiϕ(x,k) a(x, k) , (6E.7)
em que ϕ(x, k) é uma função fase e a(x, k) é um símbolo.
No Exemplo 6.35 o kernel de A é dado por uma integral oscilatória

$
1
KA (x, y) = n
dk eik(x−y) a(x, k) . (6E.8)
(2π)
520
Para provar que a integral acima representa o kernel de A, inserimos χ(εk) na integral (6E.6),
tal que χ ∈ C0∞ é igual a 1 na vizinhança de zero. Assim a integral oscilatória é o limite da
integral
$ $
1 ε−n x−y
n
dkd y eik(x−y)
χ(εk)a(x, k)u(y) = dkdn y eik( ε ) χ(k)a(x, εk)u(y)
(2π)n (2π)n
$ , -
ε−n x−y
= ^
dy χ a(x, εk)u(y) (6E.9)
(2π)n ε
$
1
= ^(y)a(x, εk)u(yε + x) .
dy χ
(2π)n
Assim,
$ $
1 1
dy χ ε→0
^(y)a(x, εk)u(yε + x) −−−−→ a(x)u(x) ^(y) = a(x)u(x) .
dy χ (6E.10)
(2π)n (2π)n
B CD E
χ(0)
Isso prova (6E.8).
Outro exemplo importante de uma integral oscilatória é a integral

$
dk e−ikx = (2π)n δ(x) ,
que define a distribuição δ de Dirac. Pode-se provar que a distribuição δ é dada pela a integral
acima, considerando o limite da integral dubla
$ $
1 −ikx 1 kx
n
dkdx χ(εk)u(x)e = n n
dkdx χ(k)u(x)e−i ε
(2π) ε (2π)
$
1
= n dx χ ^(x/ε)u(x)
ε (2π)n
$
1
= dx χ^(x)u(εx)
(2π)n
$
1
ε→0
−−−→ u(0) (2π)n dx χ ^(x) = u(0) ,
com u ∈ C0∞ (Rn ) e χ ∈ C0∞ é igual a 1 na vizinhança de zero.

. /
DEFINIÇÃO 6.44. Se ϕ ∈ C ∞ X × (Rs \ {0}) é uma função fase chamamos
3 4
Cϕ = (x, k) ∈ X × (Rs \ {0}) | ϕ′k (x, k) = 0 ,
o conjunto crítico de ϕ. Chamamos de variedade de fase estacionária o conjunto de pontos

3 4
Λϕ = (x, ϕ′x (x, k)) | (x, k) ∈ Cϕ ; k ̸= 0 .
521
É o comportamento de a(x, k) e ϕ(x, k) próximo de Cϕ que determina as singularidades

de Iϕ (a).
LEMA 6.21. Λϕ é um subconjunto fechado em X × (Rs \ {0}). Além disso, se (x, k) ∈ Λϕ ,
então (x, λk) ∈ Λϕ para todo λ ∈ R+ .
Demonstração. Veja Reed-Simon, Volume II, página 101.

.
TEOREMA 6.38. Se ϕ(x, k) é uma função fase sobre X × (Rs \ {0}) e a(x, k) ∈ Sρ,δ
m
X×
s
/
(R \ {0}) , com δ < 1, ρ > 0; então W F (Iϕ (a)) ⊂ Λϕ .
Antes de provarmos o Teorema 6.38, precisaremos de um lema.

LEMA 6.22. Seja X ⊂ Rn um conjunto aberto e u ∈ C0∞ (X). Se ϕ ∈ C ∞ (X) é uma função
fase tal que Im ϕ " 0 e dϕ ̸= 0 em toda parte, isto é, ϕ não tem pontos críticos sobre o suporte
de u ∈ C0∞ (X), então a integral
$
I(λ) = dx eiλϕ(x) u(x) ,
decai rapidamente quando λ → ∞.
Demonstração. A prova pode ser alcançada fazendo-se integrações por partes repetidas, usando
o operador L = iλ|ϕ1 ′ |2 ϕ′xi Dxi . Com efeito,
$
I(λ) = dx eiλϕ(x) u(x)
$
(−i)|α| ′ α . iλϕ(x) /
= dx ϕ D e u(x)
λ|α| |ϕ′ |2|α| xi xi
$
i|α| . /
= dx |α| ′ 2|α|
eiλϕ(x) Dxαi ϕ′xi u(x) .
λ |ϕ |
Logo, para todo compacto Ω ⊂ X e N ∈ N, existe uma constante Cα = CΩ,ϕ,N tal que
⎛ ⎞
1 <
|I(λ)| # N ⎝ Cα ∥u∥α⎠ , λ > 0, supp u ⊂ Ω ,
λ
|α|#N
em que ∥u∥α = sup |D α u(x)|.

x∈R
O método da fase estacionária aplica-se quando dϕ(x) tem pontos críticos. Nesse caso
assume-se a hipótese que os pontos críticos 6
de ϕ são7 não-degenerados. Isto significa que, se
∂2ϕ
dϕ(x0 ) = 0, a matriz Hessiana de ϕ em x0 , ∂xj ∂xk , é necessariamente não-singular.
1#j,k#n
Portanto, se ϕ ∈ C ∞ (X) tal que Im ϕ " 0 e u ∈ C0∞ (X), o comportamento assintótico de
I(λ) → ∞ é determinado por ϕ e u na vizinhança do conjunto de pontos críticos de ϕ, isto
é, quando dϕ = 0. Assim, as contribuições essênciais devem sempre vir de pontos onde a fase
ϕ é real e estacionária.
522
Prova do Teorema 6.38. Primeiro assumimos que (x, k) ∈ X × (Rs \ {0}) \ Λϕ . Considere
u ∈ C0∞ (Ω), em que Ω ⊂ X representa um conjunto compacto, com u(x) ̸= 0 para todo
x ∈ Ω. Então, a integral
$
'
Iϕ (au)(p) = dkdx eiϕ(x,k,p)
!
N k, p) = ϕ(x, k) − xp ,
a(x, k)u(x) , ϕ(x,
deve decrescer rapidamente na vizinhança cônica V de k para todo p ∈ V . Para provarmos

isso, aplicamos o método da fase estacionária. Tomamos p = λp′ e consideramos a mudança
de variável k → λk ′ , tal que com p, k ∈ V também p′ e k ′ estarão contidos em V para todo
λ > 0. Assim, obtemos
$
'
Iϕ (au)(λp) = λ −n
dkdx eiϕ(x,λk,λp)
!
a(x, λk)u(x) ,
omitindo por conveniência o símbolo ′ .
Usando a homogeneidade da função fase, então ϕ(x, N λk, λp) = λϕ(x, N k, p) se (x, k, p)
s
pertence a um cone aberto Γ em X × (R \ {0}) para todo λ > 0. Pelo Lema 5 (pg.105) em
Reed-Simon, Volume II, existe um operador diferencial, L, tal que t L eiλϕ! = eiλϕ!, (em que t L é
seu adjunto) cujo os coeficientes são homogêneos de grau −1 em k, p. Este operador é dado
por
, - , -2
1 ∂ϕ(x, k) ∂ϕ(x, k)
L= − p i Dx i , Φ(x, k, p) = − pi .
iλΦ(x, k, p) ∂xi ∂xi
Consequentemente,
$
I'
ϕ (au)(λp) =λ
−n
dkdx (t L)α eiλϕ!a(x, λk)u(x)
$
−n
=λ dkdx eiλϕ! Lα (a(x, λk)u(x)) .
Portanto, obtemos a estimativa:

5 5 5 $ , -α 5
5 ' 5 55 −n−|α| i|α| eiλ(ϕ(x,k,p))
!
∂ϕ(x, k) 5
5Iϕ (au)5 = 5λ dkdx α
− pi Dxi (a(x, λk)u(x))55
α
Φ (x, k, p) ∂xi
< , -
# Cα,ϕ,Ω sup |D u(x)| (1 + |λ|)m−(1−δ)|α|−n ,
α
x∈Ω
|α|#N
decai rapidamente por (6E.2) se m − (1 − δ)|α| − n < 0. Pela hipótese, como δ < 1, e visto
que |α| pode assumir valores arbitrariamente grandes, então Iϕ (au) decai rapidamente quando
λ → ∞ em um cone aberto em X × (Rs \ {0}). Se m é arbitrariamente negativo, Iϕ (au)
decai rapidamente mesmo que |α| seja igual a zero. Deduzimos que (x, k) ∈ / W F (Iϕ (a)). Isto
completa a prova.
523
Apêndice 6F: Solução Fraca de uma Equação Diferencial

Neste apêndice apresentamos uma extensão da notação de uma solução de equações di-
ferenciais ordinárias ou parciais, a chamada solução fraca. Essa extensão é necessária pelas
seguintes razões: em geral, não se pode esperar que uma equação diferencial parcial tenha
uma solução clássica. Para a existência de uma solução clássica, todos os parâmetros devem
ser suficientemente suaves. Em dimensões mais altas, também o domínio tem que satisfazer
certas condições de regularidade. Tais condições de suavidade ou regularidade muitas vezes
não são satisfeitas nas aplicações. No entanto, os processos que são modelados com as equa-
ções diferenciais parciais ocorrem e obviamente existe uma solução. No entanto, esta solução
não possuirá as propriedades (regularidade) da solução clássica e, portanto, é necessária uma
extensão da notação da solução; em outras palavras é necessária uma extensão via uma solução
fraca.
Uma solução fraca (também chamada de solução generalizada) para uma equação diferencial
ordinária ou parcial é uma função para a qual nem todas as derivadas existem, mas que, no
entanto, é considerada como satisfazendo a equação em algum sentido precisamente definido.
Existem muitas definições diferentes de solução fraca, apropriadas para diferentes classes de
equações. Um dos mais importantes baseia-se na noção de distribuições. Lembre-se de que
as distribuições são infinitamente diferenciáveis. Essa propriedade é amplamente usada para
resolver equações diferenciais, que modelam vários tipos de fenômenos. Para entender a ideia
básica de resolver equações diferenciais usando distribuições, considere a equação diferencial
linear representada por
L f (t) = 0 , com −∞<t<∞ ,

def. 2
em que definimos L = dtd 2 . Usando o formalismo distribucional, assumimos que a seguinte
relação vale para ϕ ∈ S (R):
6 7 6 7
L Tf (ϕ) = Tf L ϕ = 0 .
Esta é a nossa equação chave. Suponha que não exista solução para a equação original
L f (t) = 0, mas existe um f apropriado que satisfaça a relação
6 7 $ d2 ϕ(t)
Tf L ϕ = dt f (t) =0.
dt2
Nesse caso, dizemos que f é uma solução fraca (em alguns textos, esta solução é também
chamada solução distribucional) da equação diferencial L f (t) = 0.65 Esse conceito de
solução fraca permite incluir funções descontínuas como soluções para equações diferenciais.
Um exemplo simples disso é dado pelo seguinte
Exemplo 6.36. Considere a equação diferencial parcial no espaço euclidiano R2
∂ 2 f (t, x) ∂ 2 f (t, x)
− =0, (6F.1)
∂t2 ∂x2
65
Mesmo em situações em que uma equação possui soluções diferenciáveis, muitas vezes é conveniente primeiro
provar a existência de soluções fracas e somente mais tarde mostrar que essas soluçẽs são, na verdade, suaves o
suficiente.
524
sujeita às seguintes condições iniciais:

5
∂f (t, x) 55
f (0, x) = g(x) e 5 = h(x) . (6F.2)
∂t 5
t=0
Aqui, g e h são funções suaves e contínuas. A Eq.(6F.1) sujeita às condições iniciais (6F.2) é
conhecida por ter uma solução suave e contínua descrita por
$
g(x + t) + g(x − t) 1 x+t
f (t, x) = + dy h(y) ,
2 2 x−t
conhecida como solução de D’Alembert. Em geral, as soluções clássicas da Eq.(6F.1) são todas
as funções da forma
f (x, y) = g(x + y) + h(x − y) ,
com g e h duas vezes continuamente diferenciáveis, e elas têm como limites uniformes todas
as funções da forma acima com g e h contínuas. Todas essas funções devem, portanto, ser
reconhecidas como soluções de (6F.1), de modo que a definição de uma solução clássica é muito
restritiva.
Por outro lado, assumindo que f é continuamente diferenciável no espaço euclidiano R2 ,

se multiplicarmos a Eq.(6F.1) por uma função suave ϕ de suporte compacto e integrarmos,
obteremos a seguinte equação:
$ ∞$ ∞ $ ∞$ ∞
∂ 2 f (t, x) ∂ 2 f (t, x)
dxdt ϕ(t, x) − dxdt ϕ(t, x) = 0 . (6F.3)
−∞ −∞ ∂t2 −∞ −∞ ∂x2
Usando o Teorema de Fubini, que permite trocar a ordem de integração, bem como a integração
por partes (em t para o primeiro termo e em x para o segundo termo), esta equação torna-se
$ ∞$ ∞ $ ∞$ ∞
∂ 2 ϕ(t, x) ∂ 2 ϕ(t, x)
dxdt f (t, x) − dxdt f (t, x) =0. (6F.4)
−∞ −∞ ∂t2 −∞ −∞ ∂x2
Note que enquanto as integrais vão de −∞ a +∞, as integrais são essencialmente sobre
uma caixa finita porque ϕ tem suporte compacto, e é essa observação que também permite a
integração por partes sem a introdução de termos de contorno.
Assim, a Eq.(6F.1) implica a Eq.(6F.4) contanto que f seja continuamente diferenciável. A

chave para o conceito de solução fraca é que existem funções f que satisfazem a Eq.(6F.4), para
qualquer ϕ, mesmo que f não seja continuamente diferenciável e, portanto, elas não satisfazem
a Eq.(6F.1). Um exemplo simples de tal função é a função
f (t, x) = c[1 − θ(x − t)] , (6F.5)
em que θ é a função degrau de Heaviside e c uma constante não-nula. Essa solução descontínua
corresponde a uma onda de choque, frequentemente usada na física. A distribuição dada por
(6F.5) é uma solução da equação diferencial (6F.4), isto é,
∂f (t, x) ∂f (t, x)
= −cδ(x − t) e = cδ(x − t) ,
∂x ∂t
e
∂ 2 f (t, x) ′ ∂ 2 f (t, x)
= −cδ (x − t) e = −cδ ′ (x − t) .
∂x2 ∂t2
Aqui, usamos o fato já verificado que distribucionalmente θ′ = δ.
525
A ideia geral que se segue do exemplo acima é que, ao resolver uma equação diferencial em
f , pode-se reescrevê-la usando a assim chamada função de teste ϕ, de modo que quaisquer
derivadas em f que apareçam na equação são “transferidas” via integração por partes para
ϕ. Desta forma, obtém-se soluções para a equação original que não são necessariamente
diferenciáveis. Esta abordagem funciona para equações mais gerais do que a equação de onda.
De fato, considere um operador diferencial linear em um conjunto aberto Ω ⊆ Rn
<
P (x, ∂)f (x) = aα1 ,α2 ,...,αn (x) ∂ α1 ∂ α2 · · · ∂ αn f (x) ,
com o multi-índice (α1 , α2 , . . . , αn ) variando em alguns conjuntos finitos em Nn e os coefici-

entes aα1 ,α2 ,...,αn são funções suficientemente suaves de x.
A equação diferencial P (x, ∂)f (x) = 0 pode, após ser multiplicada por uma função teste
suave ϕ com suporte compacto em Ω e integrada por partes, ser escrita como
$
dx f (x)Q(x, ∂)ϕ(x) = 0 , (6F.6)
Ω
com o operador diferencial Q(x, ∂) sendo dado pela fórmula

<
Q(x, ∂)ϕ(x) = (−1)|α| ∂ α1 ∂ α2 · · · ∂ αn [aα1 ,α2 ,...,αn (x)ϕ(x)] .
Lembre-se que o número (−1)|α| = (−1)α1 +α2 +···+αn aparece porque é necessário integrar
α1 + α2 + · · · + αn por partes para transferir todas as derivadas parciais de f para ϕ em cada
termo da equação diferencial, e cada integração por partes implica uma multiplicação por −1.
Em resumo, se o problema original (forte) fosse encontrar uma função |α|-vezes diferenciável
f definida no conjunto aberto Ω tal que
P (x, ∂)f (x) = 0 para todo x ∈ Ω ,
(a chamada solução forte), então uma função integrável f seria uma solução fraca se a Eq.(6F.6)
for satisfeita para toda função suave ϕ com suporte compacto em Ω.
Nota 6.36. A noção de solução fraca baseada na teoria de distribuições é às vezes inadequada.
Por exemplo, no caso de sistemas hiperbólicos, a noção de solução fraca baseada em distribui-
ções não garante a unicidade, e é necessário complementá-la com outras condições chamadas
condições de entropia. No caso de equações diferenciais parciais não-lineares, como a equação
de Hamilton-Jacobi, há uma definição muito diferente de solução fraca chamada solução de vis-
cosidade. Todos os detalhes podem ser encontrados no livro do L. C. Evans, “Partial Differential
Equations,” American Mathematical Society, Providence, 1998.
526
Quarta Parte:
Elementos de Teoria Quântica
não-Relativística
527
Capítulo 7
Aspectos Matemáticos da Mecânica
Quântica
“Não me preocupo se o gato de Schrödinger está meio vivo e

meio morto. Não exijo que uma teoria corresponda à realidade, porque não sei o que ela é. A realidade não é uma
qualidade que possa ser testada universalmente. Tudo o que me preocupa é que a teoria deve predizer os resultados
dos experimentos. A teoria quântica é muito bem-sucedida nesse aspecto.”
S. Hawking
em “A Natureza do Espaço e do Tempo ”
A mecânica quântica representa uma das mais profundas revoluções ocorridas na física do
século XX. Neste capítulo, apresentamos alguns resultados importantes da análise funcional,
enfatizando a profunda relação desses resultados com a mecânica quântica (não-relativística).
7.1 Fatos sobre a Mecânica Quântica Não-Relativística

Na construção de uma teoria física, precisamos de um formalismo matemático que é, geral-
mente, constituído por um conjunto de conceitos primitivos, relações entre estes conceitos e
leis dinâmicas, bem como uma série de regras de correspondência que relacionam os conceitos
teóricos do formalismo matemático com o mundo da experiência.
Qualquer sistema físico é descrito por três ingredientes básicos: estados, observáveis e
dinâmica. Na física newtoniana, o estado de um sistema é caracterizado pela posição e o
momento de todas as partículas; isto corresponde à um único ponto do espaço de fase. Por sua
vez, observáveis são quantidades mensuráveis, como a energia ou momento angular. Finalmente,
529
Aspectos Matemáticos da Mecânica Quântica
as leis de Newton governam a dinâmica do sistema.
Esses três ingredientes também estão incluídos na formulação matemática da mecânica

quântica. No entanto, não devemos nos esquecer que a mecânica quântica lida com o com-
portamento de objetos tão pequenos que nós, seres humanos, estamos mal “equipados” para
visualizá-los, seja da forma que for. Por exemplo, os elétrons, frequentemente usados como
objetos de estudo,1 são imperceptíveis pelos nossos orgãos sensoriais, simplesmente não são
somos capazes de perceber o movimento de um elétron. É por isso, que a matemática tornar-se
crucial quando nossa intuição falha, ou seja, o melhor que podemos fazer é tentar entender
o elétron e seu movimento como abstrações matemáticas. Portanto, a teoria quântica é um
modelo matemático do mundo físico na escala microscópica!
A mecânica quântica é considerada a primeira teoria da física que exigiu estruturas matemá-
ticas bem abstratas, como espaços de Hilbert de dimensão infinita e operadores auto-adjuntos
definidos sobre eles. Na mecânica quântica os possíveis resultados de qualquer experimento
realizado por um observador sobre um sistema físico são expressos em termos de relações ocor-
rendo entre os elementos do espaço de Hilbert. Assim, a teoria final deve ser um modelo cuja
sobrevivência depende absolutamente do seu sucesso na produção de “números” que concordam
com os experimentos. Isto significa que o “caminho” a ser seguido deve estar fundamentado
em postulados fisicamente razoáveis. De acordo com esse padrão, a descrição de um sistema
quântico comporta os seguintes elementos básicos:
I. Noção de Estado: Os estados físicos do sistema são descritos por vetores num espaço
de Hilbert separável H . Na teoria quântica H é um espaço vetorial complexo de dimensão
finita ou infinita (com os vetores sendo denotados Φ, Ψ, . . .), munido com um produto escalar
⟨Φ, Ψ⟩ linear em Ψ e anti-linear em Φ. Além disso, H é completo com respeito à norma
∥Φ∥ = ⟨Φ, Φ⟩1/2 , isto é, toda sequência (Φn )n∈N de vetores em H que é de Cauchy com
respeito à norma converge em H . Vetores Φ e Ψ definem o mesmo estado se, e somente se,
existe α ∈ C, com |α| = 1, tal que Φ = αΨ. Isto justifica a afirmação frequentemente feita
que “um estado de um sistema quântico (em qualquer dado instante) é um raio no espaço de
Hilbert.”
II. Noção de Observáveis: Para cada observável físico na teoria quântica corresponde no
espaço de Hilbert H um operador auto-adjunto, A, que tem um conjunto completo de auto-
vetores {Ψn } com os correspondentes auto-valores {λn } tal que
AΨn = λn Ψn , n = 1, 2, 3, . . .
Inversamente, a cada operador em H está associado algum observável físico. Os únicos valores
possíveis de um observável físico são os seus vários auto-valores.
Em geral, a medição de um observável físico não tem a priori um valor definido. Qualquer
um dos possíveis auto-valores do operador A pode ser obtido, porém com probabilidades
diferentes. Conhecendo-se o estado Ψ e considerando-se a interpretação dada por Born, segue
1
Átomos individuais estão o mais perto da extremidade superior da escala em termos de tamanho.
530
que o valor esperado, ⟨A⟩Ψ (resultado da medição de A), é dado pela expressão
$
dV Ψ(t, x)AΨ(t, x)
⟨Ψ, AΨ⟩ R 3
⟨A⟩Ψ = = $ , para todo t ∈ R ,
⟨Ψ, Ψ⟩
dV Ψ(t, x)Ψ(t, x)
R3
ou simplesmente
$
⟨A⟩Ψ = ⟨Ψ, AΨ⟩ = dV Ψ(t, x)AΨ(t, x) , para todo t ∈ R ,
R3
se considerarmos que, por hipótese, os vetores de estado são normalizados, isto é, se ∥Ψ∥ = 1.
Note que, ⟨A⟩Ψ reflete o caráter inerentemente estatístico da teoria quântica. A função Ψ denota
o vetor de estado do sistema no momento da medição. Naturalmente, esta expressão é válida
se Ψ pertence ao domínio de definição Dom(A) ⊆ H do operador A. Como queremos que
A seja definido para pelo menos a maioria dos estados, exigimos que Dom(A) seja denso.
III. Evolução Temporal: Dado um estado inicial Ψ(0) de um sistema quântico, deve existir
um único vetor Ψ(t) representando o estado do sistema no instante t ∈ R. Vamos escrever
Ψ(t) = U (t)Ψ(0) .
Resultados de experimentos físicos mostram que o princípio da superposição de estados conti-
nua válido no nível quântico; isto é,
U (t)(α1 Ψ(0) + α2 Ψ2 (0)) = α1 Ψ(t) + α2 Ψ2 (t) .
Em outras palavras, U (t) deve ser um operador linear. Ainda, como Ψ(t) é um estado
normalizado (ou seja, ∥Ψ(t)∥ = 1), temos
∥Ψ∥ = ∥U (t)Ψ∥ .
Assim, U deve ser um operadore unitário, e como devemos assumir soluções únicas para o
problema de valor inicial, precisamos ter
U (0) = 1I e U (t + s) = U (t)U (s) .
Uma família de operadores unitários U com essas propriedades é chamada de grupo unitário de
um parâmetro (ou uni-paramétrico). Além disso, é natural supor que esse grupo seja fortemente
contínuo. Cada um desses grupos possui um gerador infinitesimal, chamado hamiltoniano, que
corresponde à energia do sistema. Estes conceitos serão discutidos em detalhes na Seção 8.
Em resumo, a dinâmica de um sistema quântico é descrita por um grupo unitário uni-

paramétrico fortemente contínuo {U (t)}t∈R ; os estados, como função do tempo, são represen-
tados por uma família {Ψ(t)}t∈R tal que se Ψ(t) é o estado do sistema no instante de tempo
t, então, o estado do sistema no instante de tempo t + s é dado por
Ψ(t + s) = U (s)Ψ(t) , ∀ t, s ∈ R .
Além disso, o grupo {U (t)}t∈R é determinado pelo operador auto-adjunto H, o hamiltoniano
do sistema
i
U (t) = e− ! tH .
531
Para esta formulação ser verdadeira, temos que assumir que H não depende explicitamente
do tempo. Mais geralmente, para vetores Ψ(0) ∈ Dom(H), a forma diferencial da evolução
temporal é dada pela Equação de Schrödinger:
d
i# (U (t)Ψ(0)) = H(U (t)Ψ(0)) .
dt
7.2 Estados Puros e Misturados na Mecânica Quântica

Nesta seção, vamos apresentar um dos mais importantes e elegantes resultados da análise
funcional sobre os conjuntos convexos compactos, conhecido como Teorema de Krein-Milman.2
Este teorema, de caráter geométrico, tem uma importante aplicação na mecânica quântica: ele
garante a existência de suficientes estados puros a partir dos quais estados misturados podem
ser obtidos.
7.2.1 Pontos Extremos e o Teorema de Krein-Milman
Os vértices de um quadrado o “caracterizam” no seguinte sentido: se conectamos os vértices

por linhas retas e “preenchemos” o interior da figura resultante, o quadrado é recuperado. Em
outras palavras, o envelope convexo dos vértices de um quadrado, isto é, o menor conjunto
convexo contendo os vértices de um quadrado, é o quadrado. A mesma coisa acontece para
qualquer polígono convexo em R2 , ou qualquer poliedro convexo em R3 : o envelope convexo
dos vértices produz a figura original. Isto leva-nos às seguintes questões:
1. Quais propriedades dos vértices que permitem isto? O que torna um vértice um vértice?
2. Assumindo que alguma generalização da noção de vértice foi escolhida, para quais
conjuntos E, é E o envelope convexo de seus “vértices”?
A primeira questão pode ser respondida observando-se que um vértice ν do quadrado (ou
de qualquer polígono convexo em R2 , ou ainda de qualquer poliedro convexo em R3 ) não está
entre quaisquer dois pontos do quadrado (ou de qualquer polígono convexo em R2 , ou ainda de
qualquer poliedro convexo em R3 ) no sentido que ν ∈/ (x, y) para quaisquer dois pontos x e y
no quadrado (ou de qualquer polígono convexo em R2 , ou ainda de qualquer poliedro convexo
em R3 ). A resposta para a segunda parte da primeira questão é agora imediata: um vértice é
um ponto extremo do quadrado!
A generalização mencionada na segunda questão é alcançada observando-se que, se E é um

subconjunto de um espaço vetorial X e se F ⊂ E é um conjunto não vazio, então F é um
conjunto extremo de E se nenhum ponto de F é um ponto interno de um segmento de reta
cujos pontos finais estão em E, mas não em F . Analiticamente, esta condição
! pode ser expressa
da seguinte
" forma: se x, y ∈ E e o segmento de reta aberta (x, y) = αx + (1 − α)y | α ∈
(0, 1) ∈ F , então x, y ∈ F . Pontos extremos de E são os conjuntos extremos que consistem
de exatamente um ponto.
2
Para espaços de dimensão finita o Teorema de Krein-Milman é muitas vezes chamado de Teorema de Min-
kowski.
532
Exemplo 7.1. Nas figuras abaixo, os pontos extremos do triângulo fechado são seus vértices,
enquanto que os pontos extremos do disco fechado são todos os pontos sobre a fronteira.
E
E
A resposta para segunda questão fica completa através do Teorema de Krein-Milman que
afirma que, se X é um espaço vetorial topológico e se E é um conjunto convexo compacto em
X , então E é envelope convexo fechado do conjunto de seus pontos extremos. Isto é mostrado
em detalhes a partir de agora, de forma construtiva. Partimos com a seguinte
DEFINIÇÃO 7.1. Sejam X um espaço vetorial sobre K e E um subconjunto convexo e não-vazio
de X . Então, a ∈ E é um ponto extremo se E \ {a} é convexo. O conjunto de pontos extremos
de E será denotado por Ext (E).
Existem várias formas equivalentes de se definir pontos extremos, como mostra a

PROPOSIÇÃO 7.1. Sejam X um espaço vetorial sobre K e E um subconjunto convexo e não-
vazio de X . Então, as seguintes afirmações são equivalentes:
(a) Se a = (x + y)/2, com x, y ∈ E, então a = x = y.
(b) Se a = αx + (1 − α)y, com x, y ∈ E, x ̸= y e α ∈ [0, 1], então α = 0 ou α = 1.
(c) Se a = αx + (1 − α)y, com x, y ∈ E e α ∈ (0, 1), então a = x = y.

; ;
(d) Se a = ni=1 αi xi , com xi ∈ E, αi > 0, para i = 1, . . . , n e ni=1 αi = 1, então
a = x1 = · · · = xn .
(e) E \ {a} é convexo.
Demonstração. Considere z = (2α − 1)x + 2(1 − α)y, com x, y ∈ E e α " 1/2. z é uma
combinação convexa de x e y; logo z ∈ E. Observe que
x+z
a= = αx + (1 − α)y .
2
;
Disso pode-se concluir que (a) ⇒ (b) ⇒ (c). Agora, escreva y = ni=2 βi xi ,;com xi ∈ E,
> 0, para i = 2, . . . , n. É fácil provar (veja Teorema 2.3) que ni=2 βi = 1 e
βi = αi /(1 − α) ;
que α + (1 − α) ni=2 βi = 1 (estamos assumindo que α1 = α). Logo,
n
< n
< n
<
a = αx + (1 − α)y = a = αx + (1 − α) βi xi = αx + αi xi = αi xi .
i=2 i=2 i=1
Note
;n que, para a igualdade acima ser verdadeira para xi ∈ E, αi > 0, com i = 1, . . . , n e
i=1 αi = 1, devemos ter a = x1 = · · · = xn . Portanto, temos que (c) ⇒ (d). Que (d) ⇒ (e)
é imediato.
533
Exemplo 7.2. Em geral, o conjunto de pontos extremos de um conjunto convexo não precisa
ser fechado e nem mesmo convexo. Por exemplo, em R3 o conjunto E, representado pela figura
abaixo a esquerda, pode ser visto como dois objetos do tipo-cone unidos pelas suas bases, de
modo que uma única linha reta conecte os dois pontos do cone no conjunto convexo resultante.
Os pontos extremos, mostrados a direita da figura, são as duas extremidades junto com todos
menos um ponto do círculo central. Portanto, o conjunto de pontos extremos do conjunto E
não é fechado e nem convexo.
Ext (E)
DEFINIÇÃO 7.2. Seja X um espaço vetorial ;nsobre R. Sejam E ⊂;Fn ⊂ X . E é a face de F

se para cada {x1 , . . . , xn } ⊂ F tal que i=1 αi xi ∈ E, com i=1 αi = 1, αi > 0, para
i = 1, . . . , n, tem-se que xi ∈ E, para i = 1, . . . , n.
Exemplo 7.3. Em R2 o conjunto E representado pela figura abaixo tem por conjunto de pontos
extremos o conjunto ao centro da figura, enquanto o conjunto mais à direita da figura representa
a face do conjunto E.
E Ext (E)
Frt (E)
x y x y x y
Exemplo 7.4. Seja H um espaço de Hilbert e suponha x ∈ H com ∥x∥ = 1. Então, x é

chamado de ponto extremo da bola unitária em H se não for o ponto médio de um segmento
de linha localizado na bola unitária de H . Em linguagem menos geométrica, a Proposição 7.1
estabelece que x é um ponto extremo se sempre x = x1 /2 + x2 /2 com ∥x1 ∥ = ∥x2 ∥ = 1,
então x1 = x2 . Como já enfatizado, o estudo de pontos extremos na esfera unitária de um
espaço de Hilbert atraiu considerável atenção por muitos anos devido ao fato de que este
conceito foi mostrado ser uma ferramenta importante na caracterização de estados puros na
mecânica quântica.
Como o cerne deste capítulo repousa sobre os aspectos matemáticos da mecânica quântica,
no restante desta seção vamos assumir que X é um espaço de Hilbert H .
DEFINIÇÃO 7.3. Sejam y um elemento de H e c um elemento de K. Por um hiperplano Hc em

H definimos o conjunto 3 4
Hc = x ∈ H | ⟨y, x⟩ = c .
534
O conjunto de todos os vetores x ∈ H tal que ⟨y, x⟩ " c será chamado um semi-espaço fechado
determinado pelo hiperplano, e assim será o conjunto de todos vetores x tal que ⟨y, x⟩ # c. Da
mesma forma, definimos os semi-espaços abertos, determinados pelas desigualdades ⟨y, x⟩ > c e
⟨y, x⟩ < c, respectivamente.
Se E é um subconjunto fechado de H e x0 é um vetor em H , dizemos que um hiperplano

H separa E e x0 se E está contido em um dos semi-espaços fechados determinados por H e
se x0 não está contido neste semi-espaço.
LEMA 7.1. Sejam E um conjunto convexo fechado em H e x0 um vetor em H tal que x0 ∈ / E.

Então, existe um hiperplano que separa para E e x0 , tal que E está contido em um semi-espaço
fechado determinado por H.
Demonstração. Assuma que x0 ∈ / E; então, de acordo com Lema 3.3, existe em E um único
elemento y0 que está mais próximo de x0 , tal que a função distância d = d(x0 , E) =
inf y∈E ∥x0 − y∥ = ∥x0 − y0 ∥. Tome z0 = x0 − y0 . Uma vez que x0 ∈ / E, temos que
z0 ̸= 0. Mostraremos que o hiperplano H que passa por y0 , perpendicular a z0 , satisfaz nossos
requisitos. A equação desse hiperplano é ⟨z0 , y0 ⟩ = c. Seja y ̸= y0 qualquer outro vetor de E;
isto significa que ∥x0 − y∥ " d. Para todo t, com 0 # t # 1, segue que
∥z0 ∥ # ∥z0 + t(y − y0 )∥ .
Isto implica que

∥z0 ∥2 # ∥z0 ∥2 + 2t⟨z0 , (y − y0 )⟩ + t2 ∥y − y0 ∥2 .
Cancelando e dividindo por t, obtemos
0 # 2⟨z0 , (y − y0 )⟩ + t∥y − y0 ∥2 .
Tomando o limite t → 0 produz
⟨z0 , y⟩ " ⟨z0 , y0 ⟩ = c .
Note que, o hiperplano H tangencia o conjunto E em y0 , como mostra a figura abaixo.
E H
y0
x0
Isso prova que E está contido no semi-espaço fechado definido por ⟨z0 , y⟩ " c, para todo
y ∈ E, provando assim o fato de que o hiperplano H separa E e x0 .
LEMA 7.2. Seja E um subconjunto não-vazio, convexo e compacto de H . Então, existe pelo
menos um ponto extremo em E.
535
Demonstração. Seja F a família de subconjuntos não-vazios, convexos e compactos de H

contida em E e com a seguinte propriedade adicional: (i) se K ∈ F , x ∈ K e se x1 , x2 ∈ E
são tais que
x = αx1 + (1 − α)x2 ,
com 0 < α < 1, então x1 , x2 ∈ K.
Portanto, o próprio conjunto E pertence à família F . Podemos ordenar os elementos de

F com a inclusão
* decrescente, e se {Ki }i∈I for uma subfamília totalmente ordenada, então
a interseção i∈I Ki , não é vazia, e claramente pertence à família F . Assim, pelo Lema de
Zorn, existe um elemento mínimo E0 em F . Mostraremos que E0 consiste de um ponto. Isso
irá provar o lema. Para isto, sabendo que existe um hiperplano que separa vetores y em H de
E0 , assuma que
c = inf ⟨y0 , x⟩ , para todo x ∈ E0 ,
y0 ∈H
e que 3 4
F = x ∈ E0 | ⟨y0 , x⟩ = c .
Sendo assim, tome x ∈ F e assuma que x = αx1 + (1 − α)x2 para todo x1 , x2 ∈ E0 , com
0 < α < 1. Então, para o vetor y0 em H temos que
⟨y0, x⟩ = α⟨y0, x1 ⟩ + (1 − α)⟨y0, x2 ⟩ .
Mas, por definição, ⟨y0 , x⟩ = c. Isto implica que ⟨y0 , x1 ⟩ = ⟨y0 , x2 ⟩ = c e que x1 , x2 ∈ F (de
acordo com a propriedade adicional (i)). Mas isso contradiz o fato de que E0 é um elemento
mínimo em F . Logo, existe x0 ∈ E tal que E0 = {x0 }. Portanto, pela Proposição 7.1, x0 é um
ponto extremo em E.
TEOREMA 7.1 (Teorema de Krein-Milman). Sejam H um espaço de Hibert e K um subconjunto
compacto e convexo de H . Seja S o conjunto de pontos extremos de K. Então, K é o menor
conjunto convexo fechado contendo todos os elementos de S, isto é, K é a interseção de todos os
conjuntos convexos fechados contendo S.
Demonstração. Sejam S o conjunto de pontos extremos de K e Ch(S) o envelope convexo

fechado de S (veja a Figura 2.5). Temos que mostrar que Ch(S) = K. Primeiro, como S ⊆ K
e K é convexo e fechado, então Ch(S) ⊆ K. Assim, para completar a prova, basta mostrar
que K ⊆ Ch(S). Por contradição, suponha que não, e que x0 ∈ K \ Ch(S). Pelo Lema
7.1, existe um hiperplano H que separa para Ch(S) e x0 , tal que Ch(S) está contido em um
semi-espaço fechado determinado por H. Em outras palavras, existe um vetor z0 = y0 − x0 ,
com y0 ∈ Ch(S), uma constante c e ε > 0 tal que ⟨z0 , y0 ⟩ = c e ⟨z0 , y⟩ # c − ε, para todo
y ∈ Ch(S).
! "
Defina K1 = x ∈ K | ⟨z0 , x⟩ = c . Como K é compacto, então K1 ̸= ∅ é compacto (já
que o subconjunto fechado de um conjunto compacto é compacto). Por outro lado, x0 ∈ K e
⟨z0 , x0 ⟩ = c, com z0 = y0 − x0 e y0 ∈ Ch(S). Portanto, K1 ∩ Ch(S) = ∅. Pelo Lema 7.2,
seja x0 um ponto extremo de K1 . Será mostrado que x0 é um ponto extremo de K. Mas, se
isto for verdade, então, x0 ∈ Ch(S) o que contradiz o fato de que K1 ∩ Ch(S) = ∅. Assuma
que z1 , z2 ∈ K e que 0 < β < 1 tal que
x0 = βz1 + (1 − β)z2 .
536
Portanto,
⟨z0 , x0 ⟩ = β⟨y0, z1 ⟩ + (1 − β)⟨y0, z2 ⟩ .
Mas, ⟨z0 , z1 ⟩ # c, ⟨z0 , z2 ⟩ # c. Como ⟨z0 , x0 ⟩ = c e o produto interno ⟨ · , · ⟩ é linear, segue
que ⟨z0 , z1 ⟩ = ⟨z0 , z2 ⟩ = c. Então, z1 , z2 ∈ K1 . Mas, x0 é um ponto extremo de K1 . Logo,
z1 = z2 = x0 . Portanto, x0 é um ponto extremo de K.
7.2.2 Caracterização de Estados Puros na Mecânica Quântica
Seguindo essencialmente a apresentação de Araki,3 vamos primeiro explicar o conceito de

estados misturados. Seja Ψ um vetor de estado particular de um sistema quântico em um
espaço de Hilbert. Assuma que
Ψ = λΨ1 + (1 − λ)Ψ2 , 0#λ#1,
em que Ψ1 e Ψ2 são dois estados diferentes. O estado Ψ assim representado com a ajuda
de dois outros estados é dito ser um estado misturado. Os estados Ψ1 e Ψ2 podem ser
concretamente dados especificando-se o procedimento de preparação de cada estado. Vamos
primeiro escolher 1 ou 2 com probabilidade λ e (1−λ), respectivamente, usando-se para isto um
método aleatório de seleção (como jogar dados). Então, de acordo com o resultado, preparamos
Ψ1 ou Ψ2 . Ao se preparar um estado desta forma seremos capazes de produzir exatamente a
mistura dada acima. Neste sentido, assumimos que o conjunto Σ de todos os estados é fechado
sob a operação de tomar uma mistura. Assim, assumimos que para qualquer dois elementos
Ψ1 , Ψ2 ∈ Σ e qualquer número real λ, com 0 # λ # 1, um estado Ψ representando a mistura
de Ψ1 e Ψ2 também está no conjunto Σ. Portanto, o conjunto Σ forma um conjunto convexo.
Mais geralmente, para estados Ψ1 , . . . , Ψn ∈ Σ, se Ψ é uma mistura dos estados Ψ1 , . . . , Ψn ,

então n
<
Ψ = λ1 Ψ1 + · · · + λn Ψn , 0 # λi # 1 , com λi = 1 .
i=1
Note que a forma geral acima de uma mistura pode ser reproduzida pelo uso repetido da
mistura de dois estados. Com efeito, pelo Teorema 2.3,
n−1
<
Ψ = λ1 Ψ1 + · · · + λn Ψn = (1 − λn ) γ i Ψ i + λn Ψ n ,
i=1
;n−1
em que γi = λi /(1 − λn ), i < n. Então, i=1 γi = 1. Logo,
Ψ = (1 − λn )Φ + λn Ψn ,
;n−1
em que Φ = i=1 γi Ψi . Naturalmente, segue que o estado Ψ ∈ Σ.
Queremos agora definir um estado puro. Primeiro note que, para qualquer estado Ψ, a
combinação linear convexa Ψ = λΨ1 + (1 − λ)Ψ2 , com 0 # λ # 1, acontece trivialmente em
três casos:
1. λ = 1. Neste caso, teremos necessariamente Ψ = Ψ1 .

3
H. Araki, “Mathematical Theory of Quantum Fields,” Oxford University Press, 1999.
537
2. λ = 0. Neste caso, teremos necessariamente Ψ = Ψ2 .
3. Ψ1 = Ψ2 . Neste caso, para λ arbitrário, teremos necessariamente Ψ = Ψ1 = Ψ2 , pelo

item (c) da Proposição 7.1.
Para estes três casos, dizemos que a mistura é uma mistura trivial. Se um estado Ψ não
pode ser escrito como uma mistura Ψ = λΨ1 + (1 − λ)Ψ2 , em que 0 # λ # 1, exceto por
uma mistura trivial, então dizemos que o estado Ψ é um estado puro. Em outras palavras, se
Ψ não é uma mistura dos estados Ψ1 e Ψ2 , ambos diferentes de Ψ, então Ψ é um estado puro.
Desta forma somos levados à seguinte
DEFINIÇÃO 7.4. Um estado Ψ é puro se ele não pode ser escrito como uma combinação linear
convexa de dois outros estados.
De acordo com isso, segue, da Proposição 7.1 e do Teorema de Krein-Milman, que estados
puros pertencem ao conjunto de pontos extremos do conjunto de estados Σ.
Nota 7.1. Como os estados físicos de um sistema quântico são descritos por vetores de norma 1
num espaço de Hilbert separável
! H , o conjunto de" todos esses vetores pode ser representado
por uma bola unitária B = Ψ ∈ H | ∥Ψ∥ # 1 e os pontos sobre a superfície de B são
exatamente os pontos extremos de B. Assim, estados puros da Mecânica Quântica têm uma
representação geométrica: são aqueles que estão sobre a superfície de B. Por exemplo, para
um espaço de Hilbert em duas dimensões isto é muito bem ilustrado pela esfera de Bloch. Na
mecânica quântica, a esfera Bloch é uma representação geométrica do espaço de estados puros
de um sistema de dois níveis. A esfera de Bloch é um 2-esfera de raio unitário, com cada par
de pontos antípodas representando vetores de estado mutuamente ortogonais. Os pólos norte
e sul da esfera Bloch normalmente são escolhidos corresponder aos vetores da base canônica
|0⟩ e |1⟩, respectivamente, que por sua vez podem corresponder, por exemplo, aos estados de
spin-up e spin-down de um elétron. No entanto, esta escolha é arbitrária. Os pontos sobre
a superfície da esfera correspondem aos estados puros do sistema, enquanto que os pontos
interiores correspondem aos estados mistos. A esfera de Bloch pode ser generalizada para um
sistema quântico de n níveis, mas sua visualização é mais difícil.
O teorema seguinte, algumas vezes tomado na literatura matemática como definição de

um estado puro, estabelece uma condição necessária e suficiente para que um estado seja
considerado puro.
TEOREMA 7.2. Um estado Ψ é puro se, e somente se, ele não domina outro estado.
Demonstração. Diz-se que um estado Φ domina um estado Ψ se existe um número real α > 1
tal que ∥αΦ − Ψ∥ " 0. Seja Φ = λΨ1 + (1 − λ)Ψ2 um estado misturado. Então, note que Φ
domina cada um5 de seus componentes.
5 De fato, da segunda desigualdade triangular, segue que
∥αΦ − Ψi ∥ " 5∥αΦ∥ − ∥Ψi ∥5, para i = 1, 2. Logo, ∥αΦ∥ " ∥Ψ∥.
7.3 Relações de Comutação e Incerteza de Heisenberg

“The interaction between observer and object causes uncontrollable and large changes in the system being
observed. If this perturbation be followed in its quantitative details, it appears that in many cases it is impossible to
538
obtain an exact determination of the simultaneous values of two variables, but rather that there is a lower limit to
the accuracy with which they can be known.”
Werner Heisenberg
em “The Physical Principles of Quantum Theory”
No Capítulo 6, na Subseção 6.6.5, abordamos o princípio de incerteza de Heisenberg do

ponto de vista da análise de Fourier. Nesta seção, retornamos ao assunto para investigar este
princípio com mais detalhes. Iniciamos com a
DEFINIÇÃO 7.5. A incerteza na medição de um observável A no estado Φ é a raiz quadrada do
valor esperado no estado Φ de (A − a1I)2 , em que a = ⟨A⟩Φ é o valor esperado de A. Denotamos
esta incerteza por ∆Φ (A):
∆2Φ (A) = ⟨Φ, (A − a1I)2 Φ⟩ = ⟨(A − a1I)Φ, (A − a1I)Φ⟩
= ∥AΦ − aΦ∥2 = ∥AΦ∥2 − 2a⟨Φ, AΦ⟩ + a2 (7.3.1)

. /2
= ∥AΦ∥2 − a2 = ⟨AΦ, AΦ⟩ − ⟨Φ, AΦ⟩ .
PROPOSIÇÃO 7.2. Se A é um operador auto-adjunto sobre H , então, para todo vetor unitário
Ψ ∈ Dom(A), temos ∆Φ (A) = 0 se, e somente se, Φ é um auto-estado de A.
Demonstração. Se Φ é um auto-estado de A, então AΦ = aΦ, para algum a, e ⟨Φ, AΦ⟩ =

a⟨Φ, Φ⟩. Assim, ⟨Φ, (A − a1I)Φ⟩ = 0. Logo, pela Eq.(7.3.1), segue que ∆Φ (A) = 0. Recipro-
camente, se ∆Φ (A) = 0, então, novamente pela Eq.(7.3.1), vemos que (A − a1I)Φ = 0; isto
implica que Φ é um auto-vetor de A, com auto-valor ⟨A⟩Φ .
Seja Ψ um vetor de estado tal que Ψ ∈ Dom(AB) ∩ Dom(BA). Considere três medições
sucessivas dos observáveis A e B na seguinte ordem: ABA.4 Diz-se que A e B são compatíveis
se, após as três medições sucessivas ABA, a segunda medição do observável A for igual à
primeira medição, isto é, se a primeira medição produziu o valor an a segunda medição deve
produzir o mesmo valor. Em outras palavras, o vetor de estado após a primeira medição de A
é o mesmo vetor de estado após a segunda medição de A. Este resultado pode ser expresso no
seguinte
TEOREMA 7.3. Sejam A e B dois observáveis tendo um domínio denso comum. As seguintes
propriedades são equivalentes:
(i) A e B são compatíveis.
(ii) A e B possuem uma base comum de auto-vetores.
(iii) A e B comutam, isto é, [A, B] = 0.

4
Assuma que essas medições são feitas tão rapidamente que não há tempo para o vetor evoluir para um outro
estado: qualquer mudança do vetor de estado será devido ao efeito das medições.
539
Em outras palavras, o teorema acima afirma que observáveis compatíveis podem ser medidos
simultaneamente com uma precisão arbitrária!
Exemplo 7.5. Dois observáveis que são sempre compatíveis são A e f (A), em que f (A) é
qualquer função do operador A.
DEFINIÇÃO 7.6. Um conjunto de operadores auto-adjuntos, A, B, C, . . . é chamado de conjunto
completo de operadores comutantes se os operadores comutam mutuamente, e se o conjunto
de seus auto-estados comuns é completo e não degenerado – ou seja, é único.
Agora, suponha que A e B não são compatíveis. Isto significa que existe pelo menos um
vetor de estado Φ ∈ Dom(AB) ∩ Dom(BA) tal que
(AB − BA)Φ = ic1IΦ .
em que c ∈ R.5 Isto implica que Φ não é um auto-vetor comum de A e B, e, portanto, eles
não podem ser medidos com uma precisão arbitrária. Em outras palavras, A e B não podem
ser medidos simultaneamente, a ordem em que eles são medidos passa a ser determinante!
TEOREMA 7.4 (Princípio da Incerteza). Sejam A e B dois operadores lineares auto-adjuntos,
não compatíveis. Então, para todo vetor unitário Ψ ∈ Dom(AB) ∩ Dom(BA), temos que
1
∆Ψ (A)∆Ψ (B) " c .
2
Nota 7.2. Uma vez que Ψ ∈ Dom(AB), então, em particular, Ψ ∈ Dom(B), e se Ψ ∈

Dom(BA), então Ψ ∈ Dom(A). Logo, as hipóteses sobre Ψ são suficientes para garantir
que ∆Ψ (A) e ∆Ψ (B) façam sentido, de acordo com a Definição 7.5.
Demonstração do Teorema 7.4. Seja C = AB − BA. Defina S = A − c1 1I e T = B − c2 1I.

Note que, com esta definição, temos que Ψ ∈ Dom(ST ) ∩ Dom(T S) e
C = AB − BA = ST − T S .
Pela definição de valor médio esperado, segue que
⟨C⟩Ψ = ⟨Ψ, (ST − T S)Ψ⟩ = ⟨Ψ, ST Ψ⟩ − ⟨Ψ, T SΨ⟩
= ⟨SΨ, T Ψ⟩ − ⟨T Ψ, SΨ⟩ .
Os dois últimos produtos são iguais em valor absoluto. Logo, pelas desigualdades triangular e
de Cauchy-Schwarz-Bunjakowski, temos que
|⟨C⟩Ψ | # |⟨SΨ, T Ψ⟩| + |⟨T Ψ, SΨ⟩| # 2∥SΨ∥∥T Ψ∥ .
Por outro lado,

H
∥SΨ∥ = ⟨Ψ, (A − c1 1I)2 Ψ⟩ = ∆Ψ (A) ,
5
O número c poderia ser um número complexo se tivéssemos assumido que os operadores A e B fossem
apenas simétricos. Como estamos assumindo que A e B são auto-adjuntos, então c deve ser real!
540
e
H
∥T Ψ∥ = ⟨Ψ, (B − c2 1I)2 Ψ⟩ = ∆Ψ (B) .
Assim,
1
|⟨C⟩Ψ | # ∆Ψ (A)∆Ψ (B) .
2
Mas,
|⟨C⟩Ψ | = |⟨Ψ, [A, B]Ψ⟩| = |⟨Ψ, ic1IΨ⟩| = c .
A prova está completa.
Nota 7.3 (Um contra-exemplo). Na prova do Teorema 7.4 assumiu-se a hipótese que Ψ ∈
Dom(AB) ∩ Dom(BA). Naturalmente, isto nos leva a questionar se o resultado ainda seria
válido se assumíssemos que Ψ ∈ Dom(A) ∩ Dom(B). Primeiro, deve-se enfatizar que,
mesmo que Dom(A) e Dom(B) sejam densos em H , pode acontecer que Dom(AB) não
seja denso em H . Com efeito, pode muito bem ocorrer de termos Ran(A) ∩ Dom(B) =
{0}; neste caso o produto AB não tem significado algum. Por exemplo, considere H =
L2 (0, 2π) e os operadores
AΨ(x) = xΨ , com Ψ ∈ L2 (0, 2π) e 0 # x # 2π ,
e
dΨ(x)
BΨ = i ,
dx
Note que, A é limitado, porque restringimos x ao intervalo aberto (0, 2π), ou seja, (∥A∥ = 2π).
Assim, A está definido sobre todo H , isto é, Dom(A) = H e, portanto, é auto-adjunto. Por
outro lado, vamos assumir que
# %
dΨ(x)
Dom(B) = Ψ ∈ L2 (0, 2π) | Ψ(0) = Ψ(2π), ∈ L2 (0, 2π) .
dx
Para verificarmos que B é auto-adjunto, notemos que para quaisquer funções Ψ e Φ de classe
C 1 , segue que
$ 2π , - $ 2π , -
dΨ(x) dΨ(x)
dx Φ(x) i =i dx Φ(x)
0 dx 0 dx
$ , -
52π 2π
dΦ(x)
= i Φ(x)Ψ(x)5 − i
0
dx Ψ(x)
0 dx
$ , -
52π 2π
dΦ(x)
= i Φ(x)Ψ(x)5 + 0
dx i Ψ(x) .
0 dx
Note que, a expressão
. /
Φ(2π)Ψ(2π) − Φ(0)Ψ(0) = Ψ(0) Φ(2π) − Φ(0) ,
541
vai se anular se Φ também satisfizer uma condição de contorno periódica Φ(0) = Φ(2π), isto
é, se as funções Φ obedecerem as mesmas condições obedecidas pelas funções Ψ. Então, com
argumentos similares àqueles usados para provar que o operador momentum associado à uma
partícula restrita a mover-se dentro do intervalo (0, a) é auto-adjunto, podemos mostrar que
Dom(B) = Dom(B ∗ ). Assim, B é auto-adjunto!
A seguir, vamos assumir que o sistema está no estado representado pelo vetor
def. 1
Ψ(x) = Ψm (x) = √ eimx , m∈Z.
2π
Q . /2
Logo, ∆Ψ (B) = ⟨Ψm , B 2 Ψm ⟩ − ⟨Ψm , BΨm ⟩ = m2 −m2 = 0. Em outras palavras, como
Ψm é um auto-estado de B, a incerteza de B no estado Ψm é zero! Por outro lado, como A é
limitado, a incerteza de A é bem definida e finita. Portanto, ∆Ψ (A) e ∆Ψ (B) estão definidas
sem qualquer ambiguidade e ∆Ψ (A)∆Ψ (B) = 0. Isto contradiz o Teorema 7.4. Este aparente
paradoxo é solucionado notando-se que Ψ ∈ Dom(BA) somente se AΨ(0) = AΨ(2π),
isto é, somente se, 0 · Ψ(0) = 2π · Ψ(2π). Isto implica que Ψ(0) = Ψ(2π) = 0; mas as
funções Ψm não satisfazem esta condição e, consequentemente, a expressão ⟨Ψm , BAΨm ⟩
não tem significado: AΨm ∈ / Dom(B). Podemos concluir dizendo que a forma forte do
princípio da incerteza não acontece, em geral, para dois operadores quaisquer A e B sobre
Dom(AB) ∩ Dom(BA), mesmo que o domínio Dom(AB) ∩ Dom(BA) seja denso em
H.
O contra-exemplo acima nos sugere quais as condições que devemos impor sobre dois
operadores auto-adjuntos A e B para que o número ⟨Ψ, [A, B]Ψ⟩ faça sentido: devemos tomar
3 4
Dom([A, B]) = Ψ ∈ Dom(A) ∩ Dom(B) | BΨ ∈ Dom(A) e AΨ ∈ Dom(B) .
Vale destacar, contudo, que ainda é possível dar sentido ao número ⟨Ψ, [A, B]Ψ⟩, para todo
Ψ ∈ Dom(A) ∩ Dom(B), se usarmos a auto-adjunção dos operadores A e B para obter a
versão fraca do princípio da incerteza:
⟨Ψ, [A, B]Ψ⟩ = ⟨AΨ, BΨ⟩ − ⟨BΨ, AΨ⟩ , (7.3.2)
A versão fraca do princípio da incerteza nos permite dar uma
Segunda demonstração do Teorema 7.4. Primeiro, note que para dois operadores auto-adjuntos
A e B, não compatíveis, e com Ψ ∈ Dom(A) ∩ Dom(B), segue o seguinte resultado:
⟨Ψ, [A, B]Ψ⟩ = ⟨Ψ, ABΨ⟩ − ⟨Ψ, BAΨ⟩
= ⟨AΨ, BΨ⟩ − ⟨BΨ, AΨ⟩
= ⟨AΨ, BΨ⟩ − ⟨AΨ, BΨ⟩
= 2i Im ⟨AΨ, BΨ⟩ . (7.3.3)
542
A seguir, para qualquer vetor unitário Ψ ∈ Dom(A) ∩ Dom(B), considere o vetor (A +

iαB)Ψ, em que α é um número real. Então, pela desigualdade de Cauchy-Schwarz-Bunjakowski,
obtemos que
5 5
5⟨Ψ, (A + iαB)Ψ⟩52 # ∥(A + iαB)Ψ∥2 . (7.3.4)
Denote por a e b os valores esperados dos operadores A e B, respectivamente. Logo, a

desigualdade (7.3.4) pode ser escrita como
8 9
a2 + α2 b2 # ∥AΨ∥2 + iα ⟨AΨ, BΨ⟩ − ⟨BΨ, AΨ⟩ + α2 ∥BΨ∥2
= ∥AΨ∥2 − 2αIm ⟨AΨ, BΨ⟩ + α2 ∥BΨ∥2 .
Defina c = 2Im ⟨AΨ, BΨ⟩; portanto

. / . / . /2 . /2
0 # ∥AΨ∥2 − a2 − cα + α2 ∥BΨ∥2 − b2 = ∆Ψ (A) − cα + α2 ∆Ψ (B) .
Em outras palavras, o polinômio quadrático à direita da desigualdade acima é positivo-definido

para todo α real. Isto é verdade se, e somente se,6
. /2 . /2
c2 − 4 ∆Ψ (A) ∆Ψ (B) # 0 .
COROLÁRIO 7.1 (Princípio de Incerteza de Heisenberg). Sejam X o operador posição e P o

operador momentum. Então, para qualquer vetor unitário Ψ ∈ Dom(X) ∩ Dom(P ), com
XΨ ∈ Dom(P ) e P Ψ ∈ Dom(X), segue que
#
# ∆Ψ (X)∆Ψ (P ) , (7.3.5)
2
com # = h/2π, com h = 6, 6260695729 × 10−34 kg m2 /s sendo a constante de Planck.
Demonstração. Usando a regra do produto obtemos que
d. /
P XΨ = −i# xΨ(x)
dx
d
= −i#Ψ(x) − i#x Ψ(x)
dx
= −i#Ψ(x) + XP Ψ .
Logo, [X, P ]Ψ = i#Ψ. Portanto,
#
|⟨Ψ, [X, P ]Ψ⟩| = |⟨Ψ, i#Ψ⟩| = # =⇒ ∆Ψ (X)∆Ψ (P ) " .
2
6
Lembre-se da nota de rodapé na prova da Proposição 3.3.
543
Nota 7.4 (Significado físico da Eq.(7.3.5)). O princípio de incerteza de Heisenberg é um dos

temas mais profundos da teoria quântica relacionado com as propriedades das partículas, como
a posição. No espírito original de sua teoria, Heisenberg propôs que a posição de uma partícula
seria uma coisa significativa a ser considerada somente se fosse especificado o modo como
medi-la. Isto significa que não podemos indagar onde realmente está uma partícula, como o
elétron, sem descrever exatamente como encontraremos essa informação. Em seu clássico “The
Principles of Quantum Mechanics ” P.M.A. Dirac afirma que “a ciência se preocupa apenas com
coisas observáveis e só podemos observar um objeto deixando-o interagir com alguma influência
externa. O ato de observar é, assim, necessariamente acompanhado de alguma perturbação do
objeto observado. Há um limite para nossa capacidade de observação – um limite que é inerente
à natureza das coisas e que nunca pode ser superado por uma técnica aprimorada por parte
do observador. Existe uma incerteza inevitável no cálculo dos resultados observados.” O que
Dirac quis dizer é que na Eq.(7.3.5) ∆Ψ (X) é a incerteza sobre a posição de uma partícula e
∆Ψ (P ) é a incerteza correspondente no momento linear. Em outras palavras, a Eq.(7.3.5) indica
que quanto mais precisamente identificarmos a posição de uma partícula, menos precisamente
saberemos sobre seu momento linear, e vice-versa. Por exemplo, a dispersão de fótons pelo
elétron é o modo como “vemos” o elétron, assim como um radar determina a velocidade de
um carro pela dispersão de fótons que são capturados pelo radar. A onda eletromagnética do
radar perturba o objeto a ser observado, o carro, mas de forma imperceptível, devido ao valor
bastante insignificante da constante de Planck. No entanto, isso não acontece com o elétron, já
que o fóton “enviado” para observar o elétron tem a mesma ordem de grandeza do elétron e
a capacidade de transferir energia suficiente ao elétron, de forma que há uma tendência deste
último de ser “arremessado” para muito longe da sua posição original que estamos tentando
determinar.
Nota 7.5. Embora tenha um significado diferente, uma relação semelhante à relação de incerteza
de Heisenberg (7.3.5), especificamente,
#
# ∆Ψ (E)∆Ψ (t) . (7.3.6)
2
também é válida. Essa desigualdade é chamada de relação de incerteza tempo-energia. A
diferença essencial entre as duas relações vem do fato de que enquanto X e P não podem
ambos ser especificados ao mesmo tempo, com uma precisão absoluta, a energia do sistema
pode ter um valor bem definido, a cada momento de tempo t. Na relação (7.3.6), ∆Ψ (E) é
a diferença entre dois valores E1 e E2 da energia E medidos em dois momentos diferentes
de tempo t1 e t2 , com ∆Ψ (t) = t2 − t1 , e não é a incerteza na energia em um determinado
momento de tempo. Em outras palavras, a relação (7.3.6) estabelece que se realizarmos duas
medições da energia de um sistema, e se essas medições estão separadas por um intervalo
∆Ψ (t), os valores medidos da energia irão diferir por uma quantidade ∆Ψ (E) que não pode
ser menor do que #/∆Ψ (t). Se o intervalo de tempo entre as duas medições é grande,
a diferença de energia será pequena. Isto está relacionado ao fato que, quando a primeira
medição é realizada, o sistema torna-se perturbado e ele leva um tempo muito longo para
retornar ao seu estado inicial, o estado não-perturbado. Por fim, é importante enfatizar que t
aparece na teoria quântica apenas como um parâmetro, não existe um “operador tempo.”
PROPOSIÇÃO 7.3 (Princípio mínimo de incerteza). Seja Ψ um vetor unitário em Dom(XP )∩
Dom(P X), com XΨ ∈ Dom(P ) e P Ψ ∈ Dom(X). Então, o princípio de incerteza de
Heisenberg é mínimo se, e somente se, (X +iαP )Ψ = λΨ, em que α é um número real não-nulo
e λ um número complexo.
544
Demonstração. Assuma que (X + iαP )Ψ = λΨ, em que α é um número real não-nulo e λ

um número complexo. Então, para qualquer vetor unitário Ψ no domínio de X e P , segue que
|λ|2 = ⟨Ψ, (X + iαP )Ψ⟩ . (7.3.7)
Sejam a e b os valores esperados de X e P , respectivamente; ou seja, a = Re λ e b = Im λ.
Então, a igualdade (7.3.7) pode ser escrita como
. /
a2 + α2 b2 = ∥XΨ∥2 + iα ⟨XΨ, P Ψ⟩ − ⟨P Ψ, XΨ⟩ + α2 ∥P Ψ∥2
. /
= ∥XΨ∥2 + iα ⟨Ψ, [X, P ]Ψ⟩ + α2 ∥P Ψ∥2 (7.3.8)
= ∥XΨ∥2 − #α + α2 ∥P Ψ∥2 .
Portanto, de acordo com a Definição 7.5, temos que
. / . /
0 = ∥XΨ∥2 − a2 − #α + α2 ∥P Ψ∥2 − b2
= ∆2Ψ (X) − #α + α2 ∆2Ψ (P ) . (7.3.9)

Naturalmente, a solução da equação acima depende do valor do discriminante:
def.
∆ = #2 − 4∆2Ψ (X)∆2Ψ (P ) .
Pelo Corolário 7.1, temos que ∆ # 0. É bem sabido que se ∆ = 0 a equação terá uma raiz
apenas (mais precisamente, a equação tem duas raízes reais iguais). Por outro lado, se ∆ < 0 a
equação não tem raízes reais, tendo duas raízes complexas conjugadas. No entanto, por hipótese,
α é assumido ser real; logo devemos tomar, necessariamente, #2 − 4∆2Ψ (X)∆2Ψ (P ) = 0. Isso
prova a condição de suficiência. Reciprocamente, assuma que o princípio de incerteza de
Heisenberg é mínimo,
#
= ∆Ψ (X)∆Ψ (P ) .
2
Para um vetor unitário Ψ, a equação acima pode ser reescrita da seguinte forma:
#
⟨Ψ, Ψ⟩ = ∆Ψ (X)∆Ψ (P ) .
2
Agora, defina X ′ = X − a1I e P ′ = P − b1I. Com esta definição, temos que Ψ ∈ Dom(X ′ ) ∩
Dom(P ′ ) e [X, P ] = [X ′ , P ′ ] = i#. Além disso, segue de (7.3.3) que ⟨Ψ, [X ′ , P ′]Ψ⟩ =
2iIm ⟨X ′ Ψ, P ′Ψ⟩, ou seja,
Im ⟨X ′ Ψ, P ′Ψ⟩ = ∆Ψ (X)∆Ψ (P ) .
Por outro lado, pela desigualdade de Cauchy-Schwarz-Bunjakowski, segue que
|Im ⟨X ′Ψ, P ′ Ψ⟩| # ∥X ′ Ψ∥∥P ′Ψ∥ .
A igualdade na equação acima só acontece se
X ′ Ψ = iγP ′ Ψ =⇒ (X − a1I)Ψ = iγ(P − b1I)Ψ ,
em que γ é um número real não nulo. Logo, (X + iαP )Ψ = λΨ, se tomármos γ = −α e
λ = a + iαb. Finalmente, a condição de necessidade fica provada se observarmos que, pelo
Teorema 7.4,
∥X ′ Ψ∥∥P ′Ψ∥ = ∆Ψ (X)∆Ψ (P ) .
545
7.3.1 Lema de Wintner-Wielandt
Se olharmos para as estruturas matemáticas que podem acomodar a não-comutatividade, as

famílias de matrizes vêm rapidamente à mente. É claro que podemos esperar que as matrizes
finitas sejam suficientes para o nosso trabalho computacional na física quântica. Infelizmente,
isto não se sustenta, como o traço (funcional) na álgebra de matrizes complexas n × n deixa
claro. Com efeito, o traço de um produto de matrizes quadradas não depende da ordem
do produto: tr(AB) = tr(BA). Assim, o traço do lado esquerdo da relação de comutação
AB − BA = c1I é zero, enquanto que o traço do lado direito não é zero. Isto significa que, a
relação de Heisenberg não pode ser satisfeita por matrizes finitas. Uma extensão natural seria
considerar operadores limitados em espaços de Hilbert de dimensão infinita. Nem mesmo isto
é possível como mostra o seguinte
TEOREMA 7.5 (Lema de Wintner-Wielandt). Na teoria quântica, as relações de comutação não
são representáveis por operadores limitados.
Demonstração.
AB − BA = ic1I , (7.3.10)
segue que A e B não podem ser operadores nulos e nem constantes. Portanto, devemos ter
∥A∥ ≠ 0 e ∥B∥ =
̸ 0. Da relação acima, pode-se mostrar que
AB m − B m A = icmB m−1 , com m > 1 .
Um método simples e direto de provar isto é por indução. Com efeito, assuma que AB m −
B m A = cmB m−1 acontece para m = k (note que isto acontece para m = 1, isto é, AB −
BA = ic1I),
AB k − B k A = ickB k−1 .
Vamos mostrar que a relação acontece para m = k + 1. Primeiro, note que7
8 9 8 9 8 9 8 9
A, B k+1 = A, BB k = A, B B k + B A, B k
8 9
Logo, como A, B = ic1I, então
8 9
A, B k+1 = icB k + ickBB k−1 = ic(k + 1)B k
Finalmente, tomando k = m − 1, obtemos
AB m − B m A = icmB m−1 , com m > 1 ,
como queríamos provar.
Continuando, assuma que A e B são operadores limitados, com normas ∥A∥ e ∥B∥.
Tomando as normas de ambos os lados da relação acima, para m = 1, 2, 3, . . ., obtemos
|c|m∥B m−1 ∥ = ∥AB m − B m A∥
# ∥AB m ∥ + ∥B m A∥
# 2∥A∥∥B m ∥
# 2∥A∥∥B m−1 ∥∥B∥ . (7.3.11)

7
8 9 8 9 8 9
Aqui, usamos a relação A, BC = A, B C + B A, C .
546
Seja N um inteiro tal que

2
N> ∥A∥∥B∥ . (7.3.12)
|c|
De acordo com a relação de comutação (7.3.10), ∥B∥ > 0. Por sua vez, a relação [A, B 2 ] =
2icB implica que ∥B 2 ∥ > 0, e por indução, segue que ∥B m ∥ > 0 para todo m ∈ N. Portanto,
podemos dividir a estimativa (7.3.11) por ∥B m−1 ∥ para obter
2
m# ∥A∥∥B∥ .
|c|
para todo m ∈ N, o que contradiz a estimativa (7.3.12). Logo, ou A ou B, ou ambos, devem ser
ilimitados.
Nota 7.6. O Teorema 7.5 foi provado pela primeira vez por Aurel Wintner, no artigo “The
Unboundedness of Quantum-Mechanical Matrices,” Phys. Rev. 71 (1947) 738. A prova de
Wintner em 1947, baseou-se diretamente na relação de comutação canônica de Heisenberg:
XP − P X = i#. Analisando os espectros de XP e P X, ele concluiu que pelo menos um
entre os operadores X e P não pode ser limitado. O teorema foi novamente provado por
Helmut Wielandt, no artigo “Über die Unbeschränktheit der Operatoren der Quantenmechanik,”
Math. Ann. 121 (1949) 21,8 com o argumento algébrico usado na prova acima. O famoso
matemático John von Neumann mostrou que os únicos pares de operadores que satisfazem a
d
relação de comutação de Heisenberg são operadores do tipo A = −i# dµ e B = µ, atuando
sobre o espaço de Hilbert L2 .
É fato que o princípio de incerteza Heisenberg desempenha um papel central na teoria

quântica, e como o Lema de Wintner-Wielandt nos mostrou, não pode ser uma relação entre
operadores auto-adjuntos limitados. Assim, não podemos simplesmente recorrer à uma analogia
conceitual da álgebra linear elementar para capturar as propriedades matemáticas dos observá-
veis físicos (ou seja, os operadores auto-adjuntos ilimitados) dentro da teoria quântica. Devido
ao Lema de Wintner-Wielandt, até mesmo o princípio mais essencial da física quântica requer
uma classe avançada de operadores bastante complicada, além dos operadores mais simples e
bem-comportados (matrizes, operadores limitados ou compactos). Portanto, ao explorar concei-
tos na teoria quântica, devemos tentar abandonar uma visão intuitiva e construir um processo
de pensamento puramente lógico, a fim de descrever as propriedades matemáticas dos operado-
res auto-adjuntos ilimitados. Este é o principal motivo pelo qual o estudo da análise funcional
beneficia os envolvidos na física quântica.
8
Tradução do título: “Sobre a natureza ilimitada dos operadores da mecânica quântica.”
547
Capítulo 8
O Teorema de Stone e o Fluxo do Tempo
na Mecânica Quântica
“É impossível explicar honestamente as belezas das leis da Natureza sem uma compreensão profunda da
matemática.”
R.P. Feynman
Neste capítulo, discutimos a existência da dinâmica quântica e como ela está relacionada ao
Teorema de Stone sobre grupos unitários contínuos uni-paramétrico. O assunto deste capítulo é
fundamental para a mecânica quântica. Com efeito, grupos unitários contínuos uni-paramétrico
e o Teorema de Stone formam a base matemática para a descrição da evolução temporal
de sistemas quânticos conservativos e reversíveis. Mais precisamente, o Teorema de Stone é
essencial no estudo da dinâmica de sistemas quânticos fechados com um número finito de
partículas
8.1 Introdução
A evolução de um sistema físico no tempo é geralmente descrita por um problema de valor
inicial para uma equação diferencial ordinária ou parcial. A versão quântica da dinâmica clássica
sobre a evolução temporal de um vetor de estado, Ψ, descrevendo uma partícula não-relativística
no espaço euclidiano n-dimensional, é determinada pela equação de Schrödinger
∂Ψ
i# = HΨ , ∀ Ψ ∈ Dom(H) e t ∈ R , (8.1.1)
∂t
549
O Teorema de Stone e o Fluxo do Tempo na Mecânica Quântica
em que
#2 2
H = H0 + V (x) = − ∇ + V (x) , (8.1.2)
2m
é o operador hamiltoniano de Schrödinger. Aqui, H0 é o hamiltoniano livre e V é uma função
potencial valorada no conjunto dos reais, representando um campo de força conservativa ao
qual a partícula está submetida. Suplementamos a Eq.(8.1.1) com a condição inicial
5
5
Ψ5 = Ψ0 , (8.1.3)
t=0
em que Ψ0 ∈ Dom(H). Um dos principais objetivos da mecânica quântica é descrever a

evolução espaço-temporal das funções de onda Ψ. A resolução da Eq.(8.1.1), sujeita à condição
(8.1.3), é chamada problema de valor inicial ou problema de Cauchy. Para qualquer estado inicial
da Eq.(8.1.1), sujeita à condição (8.1.3), a solução é dada pela fórmula
Ψ(t) = UH (t)Ψ0 , (8.1.4)
O mapeamento UH (t) : Ψ0 ∈ Dom(H) → Ψ(t) é chamado de operador de evolução
temporal para a equação de Schrödinger. Para que exista uma solução, esse operador deve
permanecer limitado no tempo. Além disso, se levarmos em conta que na teoria quântica a
probabilidade de encontrarmos d uma partícula em um certa região do espaço Ω, em um certo
instante t, é dada por ∥Ψ∥ = Ω dx |Ψ(t, x)|2 , essa probabilidade também deve ser conservada
sob a evolução temporal, e isso requer que
$ $ $
2 2
∥Ψ∥ = dx |Ψ(t, x)| = dx |UH (t)Ψ0 (x)| = dx |Ψ0 (x)|2 = ∥Ψ0 ∥ . (8.1.5)
Ω Ω Ω
E mais, para termos uma solução única para (8.1.1), o operador de evolução deve satisfazer a
condição que para todo s, t ∈ R,
UH (s)UH (t) = UH (s + t) . (8.1.6)
Observe que, se definirmos t = −t em (8.1.6), obtemos a relação
UH (−t) = UH−1 (t) , (8.1.7)
que reflete o princípio da invariância sob reversão temporal.
Estas condições que operador de evolução UH (t) deve satisfazer são equivalentes à proprie-
dade fundamental de auto-adjunção do operador de Schrödinger H em (8.1.1). A auto-adjunção
de H é uma condição necessária e suficiente para garantir a existência e unicidade de uma
solução para o problema de Cauchy associado à equação de Schrödinger (8.1.1) satisfazendo
(8.1.3), (8.1.4), (8.1.5), (8.1.6) e (8.1.7). A auto-adjunção do operador de Schrödinger H garante
que o operador de evolução UH (t) forma um grupo uni-paramétrico fortemente contínuo de
operadores unitários, chamado simplesmente de grupo-C0 unitário.
8.2 Preliminares: Semi-grupos-C0 e o Teorema de

Hille-Yosida
A noção de um semi-grupo é a noção mais importante para descrever processos dependentes
do tempo na Natureza em termos de análise funcional. Nesta seção, apresentamos alguns fatos
550
básicos da teoria dos semi-grupos-C0 que são essenciais para o entendimento das técnicas de
resolução do problema da existência da dinâmica quântica. A maior parte da exposição será
centrada na caracterização dos geradores dos semi-grupos-C0 em espaços de Hilbert.1 Nosso
objetivo é mostrar que todo semi-grupo-C0 possui um gerador infinitesimal.
Antes, porém, de definirmos o que é um semi-grupo-C0 , vamos lembrar alguns conceitos

auxiliares: a continuidade forte e a diferenciabilidade forte.
DEFINIÇÃO 8.1 (Continuidade Forte). Uma função vetor-valorada Ψ em um intervalo Ω ⊆ R

é um mapeamento de Ω em um espaço de Hilbert H . Tal função associa a cada ponto x ∈ Ω
um vetor Ψ(x) em H . Diz-se que Ψ é fortemente contínua se, para cada x ∈ Ω,
lim ∥Ψ(y) − Ψ(x)∥ = 0 .

y→x
y∈Ω
Igualmente, uma função operador-valorada T é um mapeamento de Ω em Lb (H ). Tal função

associa a cada ponto x ∈ Ω um operador em T (x) em Lb (H ). Diz-se que T é fortemente
contínuo se, para cada x ∈ Ω,
s− y→x
lim T (y) = T (x) .
y∈Ω
Podemos também dizer que o operador T é fortemente contínuo se, para cada x ∈ Ω e para cada
Ψ ∈ H , tem-se
lim ∥T (y)Ψ − T (x)Ψ∥ = 0 .
y→x
y∈Ω
DEFINIÇÃO 8.2 (Diferenciabilidade Forte). Uma função vetor-valorada Ψ : Ω ⊆ R → H é

fortemente diferenciável em cada ponto x ∈ Ω, se existe um vetor Φ ∈ H tal que
? ?
?1. / ?
lim ? Ψ(y + x) − Ψ(x) − Φ?
?
?=0.
x→0 x
Podemos escrever Φ = Ψ′ (y). Em geral, Ψ é fortemente diferenciável em Ω se Ψ é diferenciável

em cada ponto x ∈ Ω, isto é, se existe uma função Ψ′ : Ω → H tal que
? ?
?1. / ?
?
lim ? Ψ(y + x) − Ψ(x) − Ψ (y)? ′
? = 0 , ∀y ∈ Ω .
x→0 x
Igualmente, uma função operador-valorada T : Ω ⊆ R → Lb (H ) é fortemente diferenciável

em Ω se existe uma função T ′ : Ω → Lb (H ) – chamada a derivada forte de T – tal que para
cada Ψ ∈ H e cada y ∈ Ω
? ?
?1. / ?
lim ? T (y + x)Ψ − T (x)Ψ − T ′
(y)Ψ ?=0.
x→0 ? x ?
1
Alguns resultados, como o Teorema de Hille-Yosida, foram obtidos em um ambiente mais geral, isto é, em
espaços de Banach. Aqui, estamos considerando o ambiente como sendo espaços de Hilbert por causa da teoria
quântica.
551
Retornando à definição de um semi-grupo-C0 e seus geradores, considere o estado físico de

um sistema (do tipo representado pela Equação de Schrödinger e suplementado com a condição
inicial (8.1.3)) que está evoluindo com o tempo (de acordo com alguma lei da física), conforme
fornecido por um problema de Cauchy (assuma que este problema é bem-posto):2
dΨ
= AΨ , com t > 0 , (8.2.1)
dt
em que A : Dom(A) ⊂ H → H é um operador linear (em geral ilimitado). Com Ψ0 =
Ψ(0), assuma que a Eq.(8.2.1) está submetida à condição inicial
Ψ(0) = Ψ0 , (8.2.2)
para uma função Ψ(t) com t " 0.
Nota 8.1. Assuma que a função Ψ(s) descreve o estado no tempo s que muda no tempo a
uma taxa dada pela função A. Suponha que T (t) mapea a solução Ψ(s) no instante de tempo
s na solução Ψ(t + s) no instante tempo t + s. A solução Ψ(t + s) no tempo t + s pode ser
computada como T (t + s)Ψ0 ou, alternativamente, como Ψ(t + s) = T (t) ◦ T (s)Ψ0 . Note
também que o estado Ψ(t + s) no instante t + s poderia ter sido obtido assumindo-se que o
sistema evolui primeiro para um estado intermediário Ψ(t) = T (t)Ψ0 , no instante de tempo
t que, posteriormente, é mapeado no o estado Ψ(t + s) no instante tempo t + s através do
operador T (s). Isto significa que Ψ(s + t) = T (s) ◦ T (t)Ψ0 = T (t) ◦ T (s)Ψ0 = Ψ(t + s). A
unicidade da solução implica na propriedade de semi-grupo. Além disso, T (0) = 1I o operador
de identidade (isso significa que a condição inicial é assumida), t 3→ T (t)Ψ0 é diferenciável
em [0, ∞), e cada T (t) é um operador contínuo em H (isso reflete a dependência contínua
de Ψ(t) sobre Ψ0 ). Tudo isso, nos leva à noção de um semi-grupo uni-paramétrico fortemente
contínuo de operadores lineares limitados em um espaço de Hilbert H , definido da seguinte
forma:
DEFINIÇÃO 8.3 (Semi-grupo-C0 ). Um semi-grupo uni-paramétrico sobre um espaço de Hilbert
H é uma família T = {T (t) | t ∈ [0, ∞)} de operadores lineares limitados de H em H que
satisfaz as seguintes propriedades:
1. T (0)Ψ = 1IΨ, para todo Ψ ∈ H , em que 1I é o operador identidade sobre H ;

2. T (t + s)Ψ = T (t) ◦ T (s)Ψ, para todo Ψ ∈ H e para todo t, s " 0;
3. se ∥T (t)Ψ − Ψ∥ → 0, quando t → 0+ , para todo Ψ ∈ H e para todo t " 0, diz-se
que o semi-grupo é fortemente contínuo; isto é, T é denominado fortemente contínuo se a
função T (t)Ψ : R → R é contínua para todo Ψ ∈ H .
4. se ∥T (t) − 1I∥ → 0, quando t → 0+ , para todo t " 0, diz-se que o semi-grupo é
uniformemente contínuo.
A família {T (t)}t∈[0,∞) é chamada um semi-grupo-C0 .3

2
O termo matemático “problema bem-posto” deriva de uma definição dada pelo matemático Jacques Hadamard.
Ele acreditava que os modelos mateméticos relacionados com fenômenos físicos deveriam respeitar as propriedades:
(i) existência de uma solução, (ii) a solução é única e (iii) o comportamento da solução deve depender
continuamente das condições iniciais.
3
Essa terminologia, introduzida por Hille, tornou-se padrão.
552
As duas primeiras propriedades são algébricas, com T sendo uma representação do semi-
grupo (R+ , +), enquanto que as duas últimas propriedades são topológicas.
Nota 8.2. Na definição de semi-grupo-C0 assumimos que t ∈ [0, ∞). Por outro lado, se assu-
mirmos que t ∈ (−∞, ∞), então, temos um grupo uni-paramétrico fortemente contínuo, ou
simplesmente grupo-C0 . Do ponto de vista da mecânica quântica, a dinâmica quântica é des-
crita por um caso particular dos grupos-C0 , mais especificamente por um grupo uni-paramétrico
fortemente contínuo de operadores unitários em um espaço de Hilbert H . Utilizaremos o termo
“grupo de evolução temporal” apenas para um grupo que dá a evolução no tempo de um sistema
quântico, com o gerador infinitesimal do grupo devendo ser o hamiltoniano do sistema. Como
veremos, a existência a dinâmica quântica não dependerá da forma particular do operador H,
mas somente de uma propriedade básica que ele deve respeitar: a auto-adjunção do operador
H.
A seguinte proposição estabelece equivalências para a propriedade de continuidade forte de

semi-grupos-C0 .
PROPOSIÇÃO 8.1. As seguintes afirmações são equivalentes para um semi-grupo T (t) em um

espaço de Hilbert H .
(a) T (t) é fortemente contínuo.
(b) limt→0+ T (t)Ψ = Ψ para todo Ψ ∈ H .
(c) Existem t0 > 0, K " 1, e um subconjunto denso D ∈ H de modo que as seguintes

propriedades são válidas: (i) ∥T (t)∥ # K para todo t ∈ [0, s] e (ii) limt→0+ T (t)Ψ = Ψ para
todo Ψ ∈ D.
Demonstração. A implicação (a) =⇒ (c.ii) segue imediatamente das propriedades do semi-

grupo. A seguir, provamos que (a) =⇒ (c.i) por contradição. Assuma que existe uma sequência
(tn )n∈N ⊂ R+ convergindo para zero tal que ∥T (tn )∥ → ∞ quando n → ∞. Então, pelo
princípio da
. limitação/ uniforme (Teorema de Banach-Steinhaus), existe Ψ ∈ H tal que a
sequência ∥T (tn )∥ n∈N é ilimitada, contradizendo o fato de que T (t) é contínuo em t = 0.
Para verificar que (c) =⇒ (b), definimos K = {tn | n ∈ N} ∪ {0} para uma sequência 5
arbitrária (tn )n∈N ⊂ R + convergindo para t = 0 . Então, K ∈ [0, ∞) é compacto, T (·) 5 é
5 K
limitado e T (·)5K Ψ é contínuo para todo Ψ ∈ D. Portanto, segue do princípio da limitação
uniforme que T (·) é uniformemente limitado em K, uma vez que os mapeamentos t 3→ T (t)Ψ
são contínuos, logo limitados no conjunto compacto K. Assim,
lim T (tn )Ψ = Ψ ,
n→∞
para todo x ∈ H . Como (tn )n∈N ⊂ R+ foi escolhido arbitrariamente, isso prova (b).
Para mostrar que (b) =⇒ (a), tome t0 > 0 e Ψ ∈ H . Então, pelas propriedades de
semi-grupo e as propriedades da norma do operador, segue que
lim ∥T (t0 + h)Ψ − T (t0 )Ψ∥ # ∥T (t0 )∥ · lim+ ∥T (h)Ψ − Ψ∥ = 0 ,

h→0+ h→0
553
provando a continuidade a direita. Por outro lado, se assumirmos que h é estritamente positivo,
isto é, se h > 0, então,
lim ∥T (t0 − h)Ψ − T (t0 )Ψ∥ # lim+ ∥T (t0 − h)∥ · lim+ ∥Ψ − T (h)Ψ∥
h→0+ h→0 h→0
= lim+ ∥T (t0 − h)∥ · lim+ ∥T (h)Ψ − Ψ∥ = 0 ,

h→0 h→0
implica a continuidade a esquerda desde que ∥T (t)∥ seja uniformemente limitado para todo
t ∈ [0, t0 ]. Isso, no entanto, segue como acima primeiro para algum intervalo pequeno [0, s]
pelo princípio da limitação uniforme e, em seguida, em cada intervalo compacto graças às
propriedades de semi-grupo.
DEFINIÇÃO 8.4. Seja T um semi-grupo uni-paramétrico fortemente contínuo de classe C0 sobre

um espaço de Hilbert H . O gerador infinitesimal A de T é definido por
5
(T (t) − 1I)Ψ d 5
5
AΨ = lim+ = T (t)Ψ5 , (8.2.3)
t→0 t dt 5
t=0
isto é, A é o operador linear cujo domínio é o conjunto

3 4
−1
Dom(A) = Ψ ∈ H | lim+ t (T (t) − 1I)Ψ existe em H ,
t→0
e para Ψ ∈ Dom(A), segue que AΨ = limt→0+ t−1 (T (t) − 1I)Ψ.
O conjunto Dom(A) é não-vazio, já que ele contém pelo menos o vetor nulo. Mais do que
isso, pode-se mostrar que de fato Dom(A) é denso em H . Dom(A) é um subespaço e A
é linear sobre Dom(A). O operador A é fechado, embora não necessariamente limitado.
O semi-grupo uni-paramétrico fortemente contínuo gerado pela família T = {T (t) | t ∈

[0, ∞)}, com gerador infinitesimal A, é muitas vez representado pelo símbolo etA . De fato, o
operador T (t) tem muitas das propriedades de uma exponencial etA . De acordo com o livro de
J. Aczél, “Lectures on Functional Equations and Their Applications,” Capítulo 2, Teorema 1, pg.38,
Dover Publications, 2006, uma vez que T (t) é fortemente contínuo, se a equação funcional
T (t+s) = T (t)·T (s), para todo t, s ∈ R+ , satisfaz a equação diferencial dtd T (t)Ψ = AT (t)Ψ,
então, T (t) é necessariamente da forma T (t) = etA . Aqui a fórmula T (t) = etA deve
admitir alguma interpretação que faça sentido, já que A é um operador. Veremos que esta
notação é compatível com a notação exponencial quando A é uma matriz em um espaço
de dimensão finita, um operador limitado, ou uma função de um operador limitado. Para
operadores ilimitados a questão é um pouco mais delicada; entretanto, a fórmula T (t) = etA
ainda fará sentido de acordo com o celebrado Teorema de Hille-Yosida.4 Embora a prova deste
teorema seja bastante difícil e longa, o teorema em si é muito poderoso, pois nos dá as condições
4
O famoso artigo de K. Yosida, “On the Differentiability and the Representation of One-parameter Semigroups
of Linear Operators,” J. Math. Soc. Japan 1 (1948) 15 e o célebre livro de E. Hille, “Functional Analysis and
Semigroups,” Vol. 31, Amer. Math. Soc., 1948, foram publicados no mesmo ano. O interessante é que Hille
descobriu a parte que faltava do teorema enquanto corrigia as provas preliminares de seu livro. O Teorema de
Hille-Yosida resultado marcou o avanço da teoria dos semigrupos fortemente contínuos.
554
necessárias e suficientes que precisamos para caracterizar completamente os geradores de semi-

grupos-C0 sobre espaços de Hilbert.5 Em particular, estaremos interessados na classe chamada
semi-grupos-C0 de contração (muitas vezes também denominados semi-grupos-C0 contrativos,
ou semi-grupos-C0 não-expansivos).
DEFINIÇÃO 8.5 (Semi-grupo-C0 de contração). A família {T (t) | 0 # t < ∞} de operadores

lineares limitados sobre um espaço de Hilbert H é chamado um semi-grupo-C0 de contração
se, além de satisfazer as propriedades listadas na Definição 8.3, temos ∥T (t)∥ # 1 para todo
t ∈ [0, ∞), isto é, se ∥T (t)Ψ∥ # ∥Ψ∥ para todo t " 0 e para todo Ψ ∈ H .
TEOREMA 8.1 (Teorema de Hille-Yosida). Um operador linear A, não necessariamente limitado,

é o gerador de um semi-grupo-C0 de contração se A for fechado, densamente definido e para
cada Re λ > 0, λ ∈ ρ(A) e ∥Rλ (A)∥ = ∥(A − λ1I)−1 ∥ # (Re λ)−1 .
Lembre-se de que se A é um operador linear, não necessariamente limitado, em um espaço

de Hilbert H , o conjunto resolvente ρ(A) de A é o conjunto de todos os números complexos
λ para os quais o operador A − λ1I é invertível, ou seja, (A − λ1I)−1 é um operador linear
limitado em H . A família Rλ (A) = (A − λ1I)−1 , λ ∈ ρ(A), de operadores lineares limitados
é chamada de resolvente de A (veja o Capítulo 5).
Demonstração da Necessidade do Teorema de Hille-Yosida. Suponha que Ψ ∈ Dom(A) e que

Ψ(t) = T (t)Ψ. Considere a derivada
d+ Ψ(t + h) − Ψ(t)
Ψ(t) = lim+
dx h→0 h
Ψ(h + t) − Ψ(t)
= lim+ (pela Nota 8.1) .
h→0 h
Visto que T (t) é contínuo, isto significa que
d+ T (t + h)Ψ − T (t)Ψ
T (t)Ψ = lim+
dx h→0 h
T (h + t)Ψ − T (t)Ψ
= lim+ ,
h→0 h
ou que
d+ T (t)T (h)Ψ − T (t)Ψ

T (t)Ψ = lim+
dx h→0 h
T (h)T (t)Ψ − T (t)Ψ
= lim+ ,
h→0 h
5
O leitor interessado pode encontrar uma discussão sobre semi-grupos-C0 nos livros de A. Pazy, “Semigroups of
Linear Operators and Applications to Partial Differential Equations, Applied Mathematical Sciences, Vol.44, Springer-
Verlag, 1983, K. Yosida, “Functional Analysis,” reprint of the Sixth Edition, Springer Verlag, 1980 e J.A. Goldstein,
“Semigroups of Linear Operators & Applications,” Second Edition, Dover Publications, 2017.
555
ou ainda que
d+ T (h)Ψ − 1IΨ
T (t)Ψ = lim+ T (t) · lim+
dx h→0 h→0 h
T (h) − 1I
= lim+ · lim+ T (t)Ψ .
h→0 h h→0
Portanto, segue que

d+
T (t)Ψ = T (t)AΨ = AT (t)Ψ .
dx
+
Isto mostra que T (t)Ψ ∈ Dom(A) e que a derivada ddt T (t)Ψ existe, sendo contínua para
t " 0. Por outro lado, se assumirmos que h é estritamente positivo, isto é, se h > 0, então,
d− T (t − h)Ψ − T (t)Ψ T (t)Ψ − T (t − h)Ψ
T (t)Ψ = lim+ = lim+
dt h→0 −h h→0 h
Logo, segue que
d− T (t)Ψ − T (t − h)Ψ T (t − h + h)Ψ − T (t − h)Ψ
T (t)Ψ = lim+ = lim+
dt h→0 h h→0 h
T (t − h)T (h)Ψ − T (t − h)Ψ
= lim+
h→0 h
T (h)Ψ − 1IΨ
= lim+ T (t − h) ·
h→0 h
T (h)Ψ − 1IΨ
= lim+ T (t − h) · lim+
h→0 h→0 h
= T (t)AΨ .
+ −
Como resultado nós temos que as derivadas ddt T (t)Ψ e ddt T (t)Ψ são iguais. Isto nos permite
concluir que para todo Ψ ∈ Dom(A) o mapeamento [0, ∞) ∋ t 3→ T (t)Ψ ∈ C 1 (R+ , H )6
(isto é, T (t) é continuamente diferenciável) e
d
T (t)Ψ = AT (t)Ψ = T (t)AΨ . (8.2.4)
dt
Portanto, para Ψ ∈ Dom(A), segue que
$ t
d
T (t)Ψ − Ψ = ds T (s)Ψ
0 ds
$ t
=A ds T (s)Ψ se Ψ ∈ H (8.2.5)
0
$ t
= ds T (s)AΨ se Ψ ∈ Dom(A) .
0
6
C 1 (R+ , H ) denota as funções continuamente diferenciáveis de R+ em H .
556
A seguir, assuma que AΨ = λΨ, com Ψ ∈ Dom(A), tal que ∥Ψ∥ = 1. Defina
def.
g(t) = ⟨Ψ, T (t)Ψ⟩ .
Pelos resultados acima, sabemos que g é uma função diferenciável de t e satisfaz a equação
diferencial
g ′(t) = ⟨Ψ, T (t)AΨ⟩ = ⟨Ψ, T (t)λΨ⟩ = λ⟨Ψ, T (t)Ψ⟩ = λg(t)
e que g(0) = 1. Logo, segue que g(t) = eλt . Mas, isto é impossível já que g, por definição,
como função de t é limitada, enquanto que eλt não é limitada para t " 0 uma vez que
Re λ > 0. Portanto, (A − λ1I)Ψ = 0 =⇒ Ψ = 0.
Para mostrar que Dom(A) = H , tome Ψ ∈ H e defina

$ s
Φs = dt T (t)Ψ .
0
Pelo Teorema Fundamental do Cálculo, como T (·) é fortemente contínuo, segue que Φ é
diferenciável e Φ′s = T (s)Ψ, isto é,
$
d s
dt T (t)Ψ = T (s)Ψ .
ds 0
Portanto, lims→0+ s−1 Φs = Ψ. Com efeito, temos que

$
1 1 s
lim Φs = lim+ dt T (t)Ψ
s→0+ s s→0 s 0
$
d s
= lim+ dt T (t)Ψ (por L’Hospital)
s→0 ds 0
= lim+ T (s)Ψ (pelo Teorema Fundamental do Cálculo)

s→0
=Ψ (já que T (0) = 1I) .
Consequentemente, para qualquer r > 0,

$ s $ s
T (r)Φs = dt T (r)T (t)Ψ = dt T (r + t)Ψ .
0 0
Assim,
, $ s $ -
18 9 1 1 s
lim+ T (r) − 1I Φs = lim+ dt T (r + t)Ψ − dt T (t)Ψ
r→0 r r→0 r 0 r 0
, $ r+s $ -
1 1 r
= lim+ dt T (t)Ψ − dt T (t)Ψ
r→0 r s r 0
= T (s)Ψ − Ψ .
Dessa forma, para todo Ψ ∈ H e s > 0, Φs ∈ Dom(A). Uma vez que lims→0+ s−1 Φs = Ψ,
A é densamente definido.
557
Para mostrar que A é fechado, assuma que a sequência (Φn )n∈N ⊂ Dom(A) converge
para Φ e que a sequência (AΦn )n∈N converge para Ψ. Então, temos que
18 9 18 9
AΦ = lim+ T (r) − 1I Φ = lim+ lim T (r) − 1I Φn
r→0 r r→0 n→∞ r
$ r
= lim+ lim dt T (t)AΦn (por (8.2.5))
r→0 n→∞ 0
$ r
1
= dt T (t)Ψ
r 0
=Ψ.
Logo, Φ ∈ Dom(A) e AΦ = Ψ; portanto, A é fechado.
Para finalizar a prova da necessidade do Teorema de Hille-Yosida, para cada λ ∈ C, com

Re λ > 0, λ ∈ ρ(A), assuma (por um momento) que
$ ∞
Rλ (A) = − dt e−λt T (t) . (8.2.6)
0
Esta fórmula para Rλ (A) é chamada de representação integral do resolvente. É claro, que essa
integral deve ser entendida como uma integral de Riemann imprópria, ou seja,
$ s
Rλ (A) = − lim dt e−λt T (t) .
s→∞ 0
Tendo isso mente, escreveremos Rλ (A) frequentemente com na Eq.(8.2.6). Logo, para todo
Ψ ∈ H , temos
$ $
1 1 ∞ −λt 1 ∞
(T (h) − 1I)Rλ (A)Ψ = − dt e T (h)T (t)Ψ + dt e−λt T (t)Ψ
h h 0 h 0
$ $
1 ∞ −λt 1 ∞
=− dt e T (h + t)Ψ + dt e−λt T (t)Ψ
h 0 h 0
$ $
1 ∞ −λ(t−h) 1 ∞
=− dt e T (t)Ψ + dt e−λt T (t)Ψ
h h h 0
$ ∞ $
1 λh −λt 1 h
= − (e − 1) dt e T (f )Ψ + dt e−λt T (t)Ψ .
h h h 0

$ ∞ $ h $ ∞
−λt −λt
dt e T (t) = dt e T (t) + dt e−λt T (t) ,
0 0 h
Note que, com isto podemos escrever

$ ∞ $ h
−λt
dt e T (t) = dt e−λt T (t) − Rλ (A) .
h 0
558
Portanto, temos que

F$ h G
1 1
(T (h) − 1I)Rλ (A)Ψ = − (eλh − 1) −λt
dt e T (t)Ψ − Rλ (A)Ψ
h h 0
$ h
1
+ dt e−λt T (t)Ψ . (8.2.7)
h 0
Como o mapeamento [0, h] ∋ t 3→ T (t)Ψ ∈ H é fortemente contínuo pela Propriedade 3 da

Definição 8.3, a integral
$ h
dt e−λt T (t)Ψ .
0
existe como um limite de somas de Riemann. Consequentemente, pelo Teorema do Valor Médio
para Integrais, existe r ∈ [0, h] tal que
$ h
dt e−λt T (t)Ψ = he−λr T (r)Ψ .
0
Assim, se agora tomamos o limite h → 0+ na Eq.(8.2.7), a integral dentro do colchete tende

para zero, enquanto que a integral fora do parêntese tende para Ψ, uma vez que T (0) = 1I.
Tudo isto implica que Rλ (A)Ψ ∈ Dom(A) e que
ARλ (A) = λRλ (A) + 1I ,
ou, reescrevendo isto na forma mais familiar,
(A − λ1I)Rλ (A) = 1I . (8.2.8)
A equação acima estabelece que Rλ (A) é o inverso a direita do operador (A − λ1I). Da

Eq.(8.2.8), nós temos que
(A − λ1I)Rλ (A)(A − λ1I)Ψ = (A − λ1I)Ψ ,
e isto implica que Rλ (A)(A − λ1I)Ψ ∈ Dom(A). Da injetividade de A − λ1I, podemos

concluir que Rλ (A)(A − λ1I)Ψ = Ψ. Isto estabelece que Rλ (A) é o inverso de (A − λ1I)
também a esquerda, que λ ∈ ρ(A) e que o resolvente Rλ (A) = (A − λ1I)−1 é, de fato,
representado pela integral
$ ∞
Rλ (A) = − dt e−λt T (t) .
0
Além disso, como ∥T (t)∥ # 1, então, para Ψ ∈ H e Re λ > 0, segue que

? $ ? $
? ∞ ? ∞
1
∥Rλ (A)Ψ∥ = ?
?− dt e −λt
T (t)Ψ?
?# dt e−(Re λ)t ∥T (t)∥∥Ψ∥ # ∥Ψ∥ .
0 0 Re λ
Isso completa a prova da necessidade.
559
8.2.1 Fórmulas Exponenciais
Agora, queremos responder a seguinte questão: quando um operador A densamente definido

e fechado é um gerador infinitesimal de um semi-grupo-C0 ? Com o propósito de clarificar essa
questão, vamos colocar o problema num quadro mais geral. Seja H um espaço de Hilbert.
Queremos definir funções de uma variável real t " 0 com valores em H . Isto significa que
para cada valor de t no “domínio” da função Ψ, atribuímos um elemento Ψ(t) ∈ H . Dizemos
que Ψ(t) é contínua em t0 se para cada ε > 0 existe um δ > 0, tal que |t − t0 | < δ implica
que ∥Ψ(t) − Ψ(t0 )∥ < ε. Dizemos que Ψ(t) é diferenciável em t0 se existe um elemento
Φ ∈ H tal que, para cada ε > 0, existe um δ > 0 tal que |t − t0 | < δ implica
? ?
? Ψ(t) − Ψ(t0 ) ?
? − Φ ?<ε.
? t − t0 ?
5 5
Em tal caso, denotamos Φ por Ψ′ (t)5t=t0 , ou dΨ(t) 5 . É claro que uma função que é
dt t=t0
diferenciável em t0 é contínua nesse ponto. Para completar o quadro, assuma que A é um
operador e tome Ψ0 como sendo um vetor qualquer em H . Então, as equações
dΨ
= AΨ , com t > 0 , (8.2.9)
dt
e
Ψ(0) = Ψ0 , (8.2.10)
para um vetor Ψ ∈ H com t " 0, fazem sentido se o limite

? ?
? Ψ(t + s) − Ψ(t) ?
lim+ ?
? − AΨ(t)?
? = 0 , com Ψ ∈ Dom(A) , (8.2.11)
s→0 s
é bem definido no sentido da convergência em H . Portanto, temos um problema de equação

diferencial em um espaço de Hilbert para resolver. Será que ele tem uma solução? A Eq.(8.2.4)
parece indicar que a solução é dada pela expressão
Ψ(t) = T (t)Ψ0 = etA Ψ0 . (8.2.12)
No entanto, a princípio, isso não parece fazer muito sentido dentro do atual quadro. Primeiro,
A é um operador e, portanto, deve operar sobre alguma coisa. Segundo, que interpretação
podemos dar para a exponencial etA ? Vamos analisar o segundo ponto em primeiro lugar,
assumindo o caso mais simples quando A é um operador limitado, e então generalizamos.
Como se sabe, quando A ∈ C, a série
<∞
tA 1 n n
e = t A , (8.2.13)
n=0
n!
converge para cada A finito, para qualquer t. Por outro lado, se a convergência se dá de
acordo com a topologia da norma de H , então, a série (8.2.13) faz sentido se A é um operador
limitado. Neste caso, a solução do problema de Cauchy é Ψ(t) = Ψ0 etA , já que para qualquer
560
operador limitado A a função exponencial etA é definida por sua séria de potência. Isto segue,
imediatamente, a partir do fato de que a série
<∞ <∞
1 n n 1 n n
|t| ∥A∥ # |t| C ,
n=0
n! n=0
n!
é limitada por uma série convergente. Com efeito, lembre-se que, A : Dom(A) ⊂ H → H
é um operador limitado se existe uma contante (finita) C > 0 tal que ∥AΨ∥ # C∥Ψ∥, e a
menor constante que satisfaz esta desigualdade define a norma de A, isto é, ∥A∥. Assim sendo,
defina T (t) = etA , para t " 0, com A sendo um operador limitado. Neste caso, podemos
justificar esta definição da seguinte forma: escreva
T (t) = etA = lim Sn ,

n→∞
em que Sn ∈ Lb (H ) é a soma parcial
1 n n
Sn = 1I + tA + · · · + t A .
n!
A convergência da sequência de somas parciais Sn → etA é segundo a norma do operador. Isto

segue do fato que
? ?
?<n ℓ ℓ ? n
? t A Ψ ? <1 ℓ
∥Sn Ψ∥ = ? ? # |t| ∥A∥ℓ ∥Ψ∥ , para t ∈ R .
? ℓ! ? ℓ!
ℓ=0 ℓ=0
Logo, lembrando que sendo H completo, também o é Lb (H ), então para Ψ ∈ Dom(A)

tomado arbitrariamente, porém fixo, segue que
? ? ? ?
?<ℓ n n
t A Ψ
k
< n n ? ?
t A Ψ? ?<ℓ n n ? ℓ
t A Ψ? < 1 n
?
∥(Sℓ − Sk )Ψ∥ = ? − ?=? ?# |t| ∥A∥n ∥Ψ∥ → 0 ,
? n! n! ? ? n! ? n!
n=0 n=0 n=k n=k
quando k, ℓ → ∞. Assim, podemos ? definir

? T (t) = etA através da série (8.2.13). Com esta
definição T (t) = etA ∈ Lb (H ) e ?etA ? # e|t|∥A∥ , uma vez que
? ?
? tA ? ?
?<∞ ℓ ℓ?
t A
∞
? <1 ℓ
?e ? = ? ?# |t| ∥A∥ℓ = e|t|∥A∥ . (8.2.14)
? ℓ! ? ℓ!
ℓ=0 ℓ=0
Observe que, quando t = 0, temos que T (0) = e0A = 1I e para t > 0, temos
? ?
? tA ? ? ?<∞ ℓ ℓ?
tA ? <1 ℓ
∞
? ?
∥T (t) − 1I∥ = e − 1I = ? ?# |t| ∥A∥ℓ = e|t|∥A∥ − 1 → 0 ,
? ℓ! ? ℓ!
ℓ=1 ℓ=1
quando t → 0+ . Portanto, o operador T (t) = etA é uniformemente contínuo! Isto implica que
a Propriedade 3, na Definição 8.3, também é satisfeita, já que se tomarmos um vetor Ψ ∈ H ,
então,
∥T (t)Ψ − 1IΨ∥ # ∥T (t) − 1I∥ ∥Ψ∥ → 0 , quando t → 0+ .
561
Nota 8.3 (Identidades de etA quando A é limitado). Aplicando-se a fórmula binomial
k
< <k
k! k!
(t + s)k = tk−m sm = sk−m tm = (s + t)k
m=0
m!(k − m)! m=0
m!(k − m)!
na série
<∞
1
e(t+s)A = (t + s)n An ,
n=0
n!
pode-se mostrar, facilmente, que e(t+s)A = etA · esA . Com efeito, uma vez que as séries
envolvidas são convergentes na norma, tem-se
<∞ , - , - < ∞ < , 1 - , -

tA sA 1 m m 1 n n m m 1 n n
e ·e = t A · s A = t A · s A
m,n=0
m! n! k=0 m+n=k
m! n!
<∞
1 < k! m m n n
= t A s A
k=0
k! m+n=k
m!n!
<∞ k
1 < k!
= tm Am sk−m Ak−m
k=0
k! m=0 m!(k − m)!
∞
< 1
= (s + t)k Ak = e(s+t)A
k!
k=0
<∞
1
= (t + s)k Ak = e(t+s)A .
k=0
k!
Além disso, pode-se mostrar também que a função operatorial t 3→ etA é diferenciável (na
topologia uniforme) e que
d tA e(t+h)A − etA
(e ) = lim+ = A · etA = etA · A .
dt h→0 h
Uma vez que agora entendemos o significado da exponencial etA no caso de um opera-
dor limitado, podemos resolver a outra dificuldade olhando para a Eq.(8.2.12). Mas, (8.2.12) é
realmente solução das Eqs.(8.2.9) e (8.2.10)? Para responder esta questão, vamos examinar a
expressão
F sA G F sA G
Ψ(t + s) − Ψ(t) e − 1I tA e − 1I
− AΨ(t) = − A e Ψ0 = − A Ψ(t) .
s s s
Note que
∞
esA − 1I < 1 n−1 n
= s A ,
s n=1
n!
562
e, portanto, para s > 0
? sA ? ∞
? e − 1I ? < 1 n−1 es∥A∥ − 1
? − A? # s ∥A∥ n
= − ∥A∥ → 0 , quando s → 0+ .
? s ? n! s
n=2
Isto mostra que, para todo Ψ ∈ Dom(A), o limite (8.2.11) existe e que a derivada de Ψ, para
todo s > 0, é igual a AΨ. Consequentemente, (8.2.9) é satisfeita. Portanto, (8.2.12) é realmente
uma solução do problema de Cauchy descrito pelas Eqs.(8.2.9) e (8.2.10) e A é o gerador de T .
Em resumo, a análise que acabamos de realizar sobre operadores limitados prova a seguinte
PROPOSIÇÃO 8.2. Seja A um operador linear limitado. Então,
b ∞ ℓ ℓ
c
< tA
T = T (t) = etA = | t ∈ R+
ℓ!
ℓ=0
é um semi-grupo-C0 satisfazendo a propriedade ∥T − 1I∥ → 0 quando t → 0+ . Além disso, A

é o gerador infinitesimal de T .
Conforme mostrado pela Proposição 8.2, todo operador linear limitado em H é o gerador de
um semi-grupo-C0 que satisfaz a propriedade de continuidade uniforme, isto é, (∥T − 1I∥ → 0
quando t → 0). Por outro lado, a recíproca também é verdadeira, ou seja, se um semi-
grupo-C0 satisfaz a propriedade de continuidade uniforme, então, seu gerador infinitesimal A
é necessariamente um operador linear limitado (consulte o Exercício 8.5).
Nota 8.4. Deve-se sempre ter em mente que, nas considerações acima, assumimos que A
é um operador limitado. Neste caso, como vimos, podemos usar a série de potências para
exponenciar A. Além disso, é importante enfatizar que na Proposição 8.2 a limitação do
operador A também determinou o tipo de continuidade do semi-grupo gerado: a condição
de continuidade uniforme. Por sua vez, isto igualmente implica a convergência forte do semi-
grupo gerado. Portanto, este resultado sugere que os semi-grupos-C0 que satisfazem a condição
de continuidade forte da Definição 8.3, mas não a condição de continuidade uniforme da
Proposição 8.2, são precisamente os que têm geradores ilimitados; esses são os semi-grupos-C0
que estamos interessados.
Como vimos, pela Proposição 8.2, um semi-grupo-C0 , T (t), é “igual” em algum sentido a
exponencial etA , em que A é o gerador infinitesimal de T (t). A igualdade acontece se A
for um operador linear limitado. No caso em que A é ilimitado a fórmula T (t) = etA deve
admitir alguma interpretação que tenha fundamento. Neste caso, como podemos garantir que
T (t) é “igual” a etA ? A Proposição 8.2 nos aponta que é razoável tentar basear a prova da
parte de suficiência do Teorema de Hille-Yosida em uma das fórmulas clássicas para a função
563
exponencial. Por exemplo, se A ∈ C, temos quatro possibilidades:

<n
tA 1
(I) e = lim (tA)ℓ ;
n→∞
ℓ=0
ℓ!
, -n
tA t
(II) e = lim 1 + A ;
n→∞ n
, -−n
t
(III) etA = lim 1 − A ;
n→∞ n
(IV ) etA = lim etAλ em que lim Aλ = A .

λ→∞ λ→∞
Cada uma dessas fórmulas pode ser generalizada para operadores atuando em espaços de
Hilbert (e, em geral, para espaços de Banach); em particular, para operadores ilimitados. As
fórmulas (I) e (II) envolvem limites de operadores A que são limitados. Quando se tenta
substituir A por operadores ilimitados nas duas primeiras fórmulas nos deparamos com um
problema relacionado com os domínios das potências dos operadores envolvidos. Por exemplo,
quando A é ilimitado é difícil definir etA por (I), pois o domínio de An torna-se mais estreito
com o aumento de n e, portanto, a série raramente convergirá. Na realidade, um resultado
muito mais forte é necessário; mais especificamente, se A é o gerador infinitesimal do semi-
grupo-C0 , T (t), em um espaço de Hilbert H e se Dom(An ) é o domínio de An , então,
∩∞ n ∞
n=1 Dom(A ) deve ser denso em H . Mas, pode acontecer de ∩n=1 Dom(A ) = {0} e,
n
desse modo, não teremos a densidade exigida. A fórmula (II) também não é útil pela mesma
razão. Por outro lado, as fórmulas (III) ou (IV ) são mais promissoras e podem ser usadas
como base para os semi-grupos-C0 com geradores infinitesimais que . sãot operadores
/−n ilimitados.
Com efeito, na fórmula (III), pode-se mostrar que a expressão 1 − n A está relacionada
com o resolvente de A, a menos de um fator constante. Por consequência, isso resulta em uma
fórmula envolvendo apenas potências de operadores limitados, e pode ser iterada mesmo quando
A é ilimitado. Foi ideia de Hille usar esta fórmula e provar que, em condições apropriadas,
o limite existe e define um semi-grupo fortemente contínuo. Por sua vez, como resultado
da Proposição 8.2, podemos tentar aproximar A por uma sequência (Aλ )λ∈N de operadores
limitados. Neste caso, na fórmula (IV ), o limite etA = limλ→∞ etAλ , em que limλ→∞ Aλ = A,
existe e também pode ser usada para definir um semi-grupo fortemente contínuo. Esta foi
a ideia de Yosida, que está relacionada com a aproximação discutida no Capítulo 5 que leva
seu nome. Seguindo Hille, vamos usar (III) na prova da suficiência do Teorema de Hille-
Yosida. Quando estudarmos o Teorema de Stone e sua relação com a existência da dinâmica na
mecânica quântica usaremos a fórmula (IV ), com uma aproximação tipo-Yosida.
Nota 8.5 (Fato hitórico). Foi Leonhard Euler (1707-1783) que mostrou que7
<∞ ℓ , -n , -n
t t t 1
e = = lim 1 + , com e = lim 1 + .
ℓ=0
ℓ! n→∞ n n→∞ n
Demonstração da Suficiência do Teorema de Hille-Yosida. Nosso objetivo é provar que o semi-

grupo T pode ser recuperado a partir do gerador A (não necessariamente limitado). Em outras
7
Veja L. Euler, “Introductio in Analysin Infinitorum,” Lausannae, 1748.
564
palavras, queremos provar que para todo elemento fixo Ψ ∈ Dom(A) o limite (uniforme)
, -−n
t
T (t)Ψ = lim 1I − A Ψ. (8.2.15)
n→∞ n
existe em todo intervalo finito 0 # t # s. Seguiremos a prova desenvolvida por T. Kato no seu
livro “Perturbation Theory for Linear Operators, Second Edition, Springer, 1980, pg.480. Primeiro,
observe que a Eq.(8.2.15) pode ser reescrita da seguinte forma:
, -−n F Gn
t n6 n 7−1
T (t)Ψ = lim 1I − A Ψ = lim − A − 1I Ψ.
n→∞ n n→∞ t t
Assim, embutido na fórmula (8.2.15) temos o negativo do operador resolvente (A − λ1I)−1
. /−1
tomando λ = n/t. Além disso, o comportamento de nt nt 1I − A para n → ∞ é o mesmo
−1
de λ(λ1I − A) para λ → ∞.
Defina
, -−n
t
Tn (t) = 1I − A , ∀t " 0 e n ∈ N .
n
Para Ψ ∈ Dom(A), n ∈ N e t > 0, segue que
?, -−1 ? ? ?
? t ? ?n 6n 7−1 ?
? ? ?
? 1I − A Ψ − Ψ? = ? 1I − A Ψ − Ψ?
?
? n ? t t
?6 7−1 = n 6n 7 >?
? n ?
?
= ? 1I − A Ψ− 1I − A Ψ ?
t t t ?
?6 7−1 ?
? n ?
?
= ? 1I − A AΨ?
t ?
?6 7−1 ?
? n ?
#?? t 1
I − A ? ∥AΨ∥
?
t
# ∥AΨ∥ ,
n
. /−1
que tende a zero quando t → 0+ . Mas, como Dom(A) é denso em H e ∥ nt nt 1I − A ∥#
s
1, segue que ∥Tn (t)∥ # 1, de maneira que Tn (t) é uniformemente limitado e Tn (t) −→ T (0)
quando t → 0+ , isto é,
, -−n ] , -−1
t t
lim Tn (t)Ψ = lim+ 1I − A Ψ= lim 1I − A Ψ=Ψ. (8.2.16)
t→0+ t→0 n n
t→0+ n
para todo Ψ ∈ H .
Para provar a existência do limite limn→∞ Tn (t), estimamos Tn (t)Ψ − Tm (t)Ψ. Para isso,
notamos que, para t > 0, a diferenciação em relação a t produz
, -−n−1
′ d t
Tn (t) = Tn (t) = 1I − A A ∈ Lb (H ) , (8.2.17)
dt n
565
no sentido da topologia da norma do operador. Tn (t) não é, em geral, diferenciável em t = 0,

mas, como vimos, é fortemente contínuo. Assim, em virtude de (8.2.16),
$ t−ε
d= >
Tn (t)Ψ − Tm (t)Ψ = lim+ ds Tn (t − s)Tm (s)Ψ
ε→0 ε ds
$ t−ε = >
= lim+ ds Tn′ (t − s)Tm (s)Ψ + Tn (t − s)Tm′ (s)Ψ . (8.2.18)
ε→0 ε
O integrando de (8.2.18) pode ser calculado facilmente usando (8.2.17); o resultado é

$ t−ε n , -−n−1 6
t−s s 7−m
Tn (t)Ψ − Tm (t)Ψ = lim+ ds − 1I − A A 1I − A Ψ
ε→0 ε n m
, -−n 6 o
t−s s 7−m−1
+ 1I − A 1I − A AΨ . (8.2.19)
n m
Agora, um pouco de truque. Levando em conta que (veja a prova na pg.561)

6 s 7−1 6 s 7 6 s 76 s 7−1
1I − A 1I − A = 1I − A 1I − A = 1I ,
m m m m
o integrando de (8.2.19) pode ser reescrito da seguinte forma:
$ t n , -−n−1 6 , - o
t−s s 7−m−1 t − s s 2
Tn (t)Ψ − Tm (t)Ψ = ds − 1I − A 1I − A − A Ψ .
0 n m n m
Note que, por causa de (8.2.16), este integrando é contínuo para 0 # s # t. E mais, pelo fato
de ∥Tn (t)∥ # 1, segue que
$ t , - , -
2 t−s s t2 1 1
∥Tn (t)Ψ − Tm (t)Ψ∥ # ∥A Ψ∥ ds − = − ∥A2 Ψ∥ .
0 n m 2 n m
Assim, Tn (t)Ψ forma uma sequência de Cauchy e limn→∞ Tn (t)Ψ existe, uniformemente em
t em qualquer intervalo finito, desde que Ψ ∈ Dom(A2 ) ⊆ Dom(A), com Dom(A2 )
representando o conjunto
6 n 7−1
2
Dom(A ) = A − 1I Dom(A) , ∀t > 0 e n ∈ N .
t
Mas, lembre-se que ,6 -
n 7−1
Ran A − 1I = Dom(A) ,
t
que é denso em H . Logo, Dom(A2 ) é denso em H . Consequentemente, Tn (t)Ψ forma
uma sequência de Cauchy e limn→∞ Tn (t)Ψ existe!
Finalmente, por causa da limitação uniforme dos Tn (t), segue pelo Corolário 4.2 que o limite
forte
, -−1
t
T (t)Ψ = s− lim Tn Ψ = s− lim 1I − A Ψ, (8.2.20)
n→∞ n→∞ n
566
existe e (8.2.15) segue para todo Ψ ∈ H . Resta mostrar que T (t) é de fato um semi-grupo-C0
de contração e que A é seu gerador infinitesimal. Em outras palavras, resta mostrar que T (t)
obtido como o limite forte na Eq.(8.2.20) tem as propriedades esperadas da função exponencial.
Isto é provado no Exercício 8.7. Portanto, T (t) é igual a etA .
A prova da suficiência do Teorema de Hille-Yosida não apenas indica a existência de um

semi-grupo-C0 , como também produz uma maneira prática de aproximar o semi-grupo através
da expressão
, -−n
t
T (t) = lim 1 − A .
n→∞ n
Isto dá ao leitor uma ideia clara de como vemos T (t) como uma exponencial. Por consequência,
isto também confirma uma afirmação já feita no Capítulo 5, que Rλ (A) como definido em
(5.2.12) é de fato o resolvente de um operador linear A.
Como último resultado nós temos a seguinte
PROPOSIÇÃO 8.3. Um semi-grupo é univocamente determinado pelo seu gerador.
Demonstração. Assuma que existe um outro semi-grupo fortemente contínuo S(t) com o
mesmo gerador (A, Dom(A)). Defina a função Ψ : [0, s] → H por Ψ(t) = T (t)S(s − t)Ψ.
Esta função é diferenciável e podemos obter sua derivada pela regra Leibniz:
d d d
Ψ(t) = T (t) · S(s − t)Ψ + T (t) · S(s − t)Ψ
dt dt dt
= AT (t)S(s − t)Ψ + T (t)(−A)S(s − t)Ψ = 0
= AT (t)S(s − t)Ψ − AT (t)S(s − t)Ψ = 0 . (pela Eq.(8.2.4))
Portanto, Ψ(t) é constante em [0, s], de modo que
T (s)Ψ = T (s)S(0)Ψ = Ψ(s) = Ψ(0) = T (0)S(s)Ψ = S(s)Ψ ,
para Ψ ∈ Dom(A). Como Dom(A) é denso em H , segue-se que T (s) = S(s) em H .
8.2.2 Teoria Espectral para Semi-grupos
Até agora, nossa principal preocupação foi mostrar que semi-grupos fortemente contínuos
possuem geradores e, inversamente, que certos operadores geram semi-grupos fortemente con-
tínuos. Estabelecido a existência de um semi-grupo fortemente contínuo, voltamos agora nossa
atenção para a seguinte questão: seja A o gerador de um semigrupo-C0 de contração, T (t).
Visto que pensamos em T (t) como a exponencial etA , podemos concluir que o espectro de
T (t) satisfaz σ[T (t)] = etσ(A) ? Vamos responder esta questão através de alguns resultados
conhecidos como Teoremas do Mapeamento Espectral.8
8
O leitor vai encontrar uma discussão mais detalhada sobre este tema no livro de K.-J. Engel & R. Nagel,
“One-Parameter Semigroups for Linear Evolution Equations,” Springer-Verlag, 2000, Cap. IV.
567
De acordo com a discussão realizada no Capítulo 5, o espectro de um operador A em um

espaço de Hilbert complexo H consiste de três partes mutuamente disjuntas cuja união é
σ(A): o espectro discreto σdisc (A), o espectro essencial σess (A) e o espectro residual σres (A).
Também no Capítulo 5 comentamos que, para uma ampla classe de operadores, incluindo
aqueles de interesse na mecânica quântica, ou seja, os operadores auto-adjuntos, o conjunto
σres (A) é vazio (veja a Proposição 5.10). Sendo assim, como o objetivo principal deste capítulo é
a prova da existência da dinâmica quântica, na discussão a seguir vamos assumir, sem perda de
generalidade, que A é um operador auto-adjunto (não necessariamente limitado) em um espaço
de Hilbert complexo H .
LEMA 8.1. Seja A auto-adjunto e o gerador de um semi-grupo-C0 de contração, T (t), em um
espaço de Hilbert H . Defina, para λ ∈ C, o operador
$ t
Bλ (t)Ψ = ds eλ(t−s) T (s)Ψ . (8.2.21)
0
Então,
(A − λ1I)Bλ (t)Ψ = (T (t) − eλt )Ψ , ∀Ψ ∈ H , (8.2.22)
e
Bλ (t)(A − λ1I)Ψ = (T (t) − eλt )Ψ , ∀ Ψ ∈ Dom(A) . (8.2.23)
Demonstração. Primeiro, não é difícil mostrar que para todo λ e t fixos, Bλ (t) definido por
(8.2.21) é um operador limitado; mais precisamente, temos que
e(Re λ)t − 1
∥Bλ (t)Ψ∥ # ∥Ψ∥ .
Re λ
Além disso, para todo Ψ ∈ H , temos
$ $
1 1 t λ(t−s) 1 t
(T (h) − 1I)Bλ (t)Ψ = ds e T (h)T (s)Ψ − ds eλ(t−s) T (s)Ψ
h h 0 h 0
$ $
1 t λ(t−s) 1 t
= ds e T (h + s)Ψ − ds eλ(t−s) T (s)Ψ
h 0 h 0
$ $
eλh h+t λ(t−s) 1 t
= ds e T (s)Ψ − ds eλ(t−s) T (s)Ψ
h h h 0
$ $
eλh t λ(t−s) eλh h+t
= ds e T (s)Ψ + ds eλ(t−s) T (s)Ψ
h h h t
$ $
1 h λ(t−s) 1 t
− ds e T (s)Ψ − ds eλ(t−s) T (s)Ψ
h 0 h h
$ t $
1 λh λ(t−s) eλh h+t
= (e − 1) ds e T (s)Ψ + ds eλ(t−s) T (s)Ψ
h h h t
$
1 h
− ds eλ(t−s) T (s)Ψ . (8.2.24)
h 0
568
Como os mapeamentos [0, h] ∋ s 3→ T (s)Ψ ∈ H e [t, t + h] ∋ s 3→ T (s)Ψ ∈ H são

fortemente contínuos pela Propriedade 3 da Definição 8.3, as integrais
$ h+t $ h
λ(t−s)
ds e T (s)Ψ e ds eλ(t−s) T (s)Ψ ,
t 0
existem como um limite de somas de Riemann. Consequentemente, pelo Teorema do Valor

Médio para Integrais, existem r ∈ [t, t + h] e u ∈ [0, h] tais que
$ h+t $ h
λ(t−s) λ(t−r)
ds e T (s)Ψ = he T (r)Ψ e ds eλ(t−s) T (s)Ψ = heλ(t−u) T (u) .
t 0
Assim, se agora tomarmos o limite h → 0+ na expressão (8.2.24), obtemos

ABλ (t)Ψ = λBλ (t)Ψ + T (t)Ψ − eλt Ψ .
Consequentemente, Bλ (t)Ψ ∈ Dom(A) e
(A − λ1I)Bλ (t)Ψ = (T (t) − eλt )Ψ ,
para todo Ψ ∈ H , provando (8.2.22).
A seguir, lembremos, de acordo com T. Kato, “Perturbation Theory for Linear Operators,”
Second Edition, Springer, 1980, pg.171, que como A não é necessariamente limitado, então,
A comuta com Bλ (t) se Bλ (t)A ⊂ ABλ (t), o que significa que quando Ψ ∈ Dom(A),
Bλ (t)Ψ também pertence ao domínio Dom(A) e ABλ (t)Ψ = Bλ (t)AΨ. Portanto, para
Ψ ∈ Dom(A), segue-se que A e Bλ (t) comutam. Além disso, todo operador em H comuta
com o operador escalar λ1I. Logo, estes fatos reunidos provam (8.2.23).
TEOREMA 8.2 (Teorema de Inclusão Espectral). Seja A auto-adjunto e o gerador de um
semi-grupo-C0 de contração, T (t), em um espaço de Hilbert H . Então,
. / ! "
σ T (t) ⊃ etσ(A) = etλ | λ ∈ σ(A) , (8.2.25)
para todo t ∈ R+ .
Demonstração. De acordo com o Teorema 5.15, basta mostrar que

! . /"
ρ(A) ⊃ λ | etλ ∈ ρ T (t) ,
já que para cada λ ∈ ρ(A) existe uma relação canônica entre o espectro do operador A
(não necessariamente limitado) e o espectro do operador limitado Rλ (A). Isso nos permite
transferir resultados da teoria espectral de operadores limitados para o caso de operadores
não necessariamente limitados. Definindo Q = (T (t) − eλt )−1 , para cada λ ∈ C, t > 0 e
Ψ ∈ Dom(A), observe que como o operador invertível (T (t) − eλt ) em H comuta com o
operador limitado Bλ (t), então, Q comuta com Bλ (t). Logo, segue de (8.2.23) que
QBλ (t)(A − λ1I)Ψ = Bλ (t)Q(A − λ1I)Ψ = Ψ ,
Naturalmente, para Ψ ∈ Dom(A), segue também que AQBλ (t)Ψ = Bλ (t)QAΨ, já que Q e
Bλ (t) são limitados. Dessa forma, de (8.2.23) temos que
(A − λ1I)Bλ (t)QΨ = Ψ ,
569
λt
Essas relações mostram, junto com a Eq.(8.2.23), .que (T
/ (t) − e ) não é bijetivo se (A − λ1I)
λt
falha de ser bijetivo. Consequentemente, e ∈ ρ T (t) implica que λ ∈ ρ(A),
(A − λ1I)−1 = Bλ (t)(T (t) − eλt )−1 .

. /
e que ρ T (t) \ {0} ⊂ ρ(A). Isto prova (8.2.25).
A seguir, estudamos as relações entre cada parte do espectro de A e sua parte correspondente
do espectro de T (t) = etA . Começamos com o espectro discreto, Lembremos, como enfatizado
no Capítulo 5, que se A é um operador auto-adjunto, então, λ ∈ R está no espectro discreto de
A se, e somente se, λ for um ponto isolado em σ(A) e se λ for um auto-valor de multiplicidade
finita. O espectro discreto não é um conjunto fechado! Se considerarmos em R3 , o operador de
Schrödinger com potencial coulombiano (veja mais detalhes no Capítulo 10), o espectro discreto
é uma sequência de auto-valores tendendo a 0, mas 0 não pertence ao espectro discreto.
TEOREMA 8.3 (Teorema do Mapeamento Espectral para o Espectro Discreto). Seja A auto-
adjunto e o gerador de um semi-grupo-C0 de contração, T (t), em um espaço de Hilbert H .
Então,
. /
etσdisc (A) ⊂ σdisc T (t) ⊂ etσdisc (A) ∪ {0} ,
. /
para.todo /t ∈ R+ . Mais precisamente, se λ ∈ σdisc (A), então, eλt ∈ σdisc T (t) e se eλt ∈
σdisc T (t) existe um inteiro k tal que λk = λ + i2πk/t ∈ σdisc (A).
Demonstração. A primeira inclusão segue trivialmente do Lema 8.1. Com efeito, se λ ∈ σdisc (A),
então, existe Ψ ∈ Dom(A), com Ψ ̸= 0, tal . que/ (A − λ1I)Ψ = 0. Logo, de (8.2.23) segue que
(T (t) − eλt )Ψ = 0 e, portanto, eλt ∈ σdisc T (t) , o que comprova a primeira inclusão.
. /
Para provar a segunda inclusão, para t > 0, assuma que eλt ∈ σdisc T (t) , isto é, assuma
que (T (t) − eλt )Ψ = 0, com Ψ ̸= 0. Observe que, podemos escrever (T (t) − eλt )Ψ =
eλt (e−λt T (t) − 1I)Ψ = 0. Isso implica que a função contínua t 3→ S(t) = e−λt T (t) define um
semi-grupo-C0 reescalonado, cujo gerador é B = A−λ1I com domínio Dom(B) = Dom(A)
e S(t)Ψ = 1IΨ. De fato, basta aplicar à função S(t) a mesma argumentação que nos levou à
Eq.(8.2.5) para obter
$ t
−λt d . −λs /
e T (t)Ψ − Ψ = ds
e T (s) Ψ
0 ds
$ t
= (A − λ1I) ds e−λs T (s)Ψ se Ψ ∈ H
0
$ t
= ds e−λs T (s)(A − λ1I)Ψ se Ψ ∈ Dom(A) .
0
A condição S(t)Ψ = 1IΨ implica que S(t)Ψ = S(0)Ψ, indicado que S(t)Ψ é periódica com
o período t, isto é, os expoentes em e−λt T (t)Ψ não são únicos uma vez que e−λt T (t)Ψ =
e−(λ+i2πk/t)t T (t)Ψ. Portanto, S(t)Ψ = e−i2πk S(t)Ψ. Como S(·)Ψ ∈ C(R+ , H ) é diferente
570
de zero e periódica, podemos usar a função exponencial complexa como base para escrever
S(·)Ψ na seguinte forma
<∞
S(s)Ψ = Φk ei2πks/t ,
k=−∞
Naturalmente, pelo menos um de seus coeficientes de Fourier, Φk , deve ser diferente de zero.
Ou seja, existe um k tal que
$
−i2πks/t 1 t
⟨e , S(s)Ψ⟩ = Φk = ds e−i2πks/t e−λs T (s)Ψ ̸= 0 , para k = 0, ±1, ±2, . . .
t 0
Mostraremos que Φk ∈ Dom(A) e que λk = λ + i2πk/t é um auto-valor de A. Defina
γ = i2πk/t, então, seguindo o mesmo desenvolvimento da Eq.(8.2.24), temos que
$ $
1 1 t −(γ+λ)s 1 t
(S(h) − 1I)Φk = ds e S(h)T (s)Ψ − ds e−(γ+λ)s T (s)Ψ
h ht 0 ht 0
$ $
eγh t −(γ+λ)(h+s) 1 t
= ds e T (h + s)Ψ − ds e−(γ+λ)s T (s)Ψ
ht 0 ht 0
$ $
eγh h+t −(γ+λ)s 1 t
= ds e T (s)Ψ − ds e−(γ+λ)s T (s)Ψ
ht h ht 0
$ $
eγh t −(γ+λ)s eγh h+t
= ds e T (s)Ψ + ds e−(γ+λ)s T (s)Ψ
ht h ht t
$ $
1 h −(γ+λ)s 1 t
− ds e T (s)Ψ − ds e−(γ+λ)s T (s)Ψ
ht 0 ht h
$ t $
1 γh −(γ+λ)s eγh h+t
= (e − 1) ds e T (s)Ψ + ds e−(γ+λ)s T (s)Ψ
ht h ht t
$
1 h
− ds e−(γ+λ)s T (s)Ψ . (8.2.26)
ht 0
Novamente, levando em conta que os mapeamentos [0, h] ∋ s 3→ T (s)Ψ ∈ H e [t, t + h] ∋
s 3→ T (s)Ψ ∈ H são fortemente contínuos pela Propriedade 3 da Definição 8.3, as integrais
$ h+t $ h
−(γ+λ)s
ds e T (s)Ψ e ds e−(γ+λ)s T (s)Ψ ,
t 0
existem como um limite de somas de Riemann. Consequentemente, pelo Teorema do Valor
Médio para Integrais, existem r ∈ [t, t + h] e u ∈ [0, h] tais que
$ h+t $ h
−(γ+λ)s −(γ+λ)r
ds e T (s)Ψ = he T (r)Ψ e ds e−(γ+λ)s T (s)Ψ = he−(γ+λ)u T (u) .
t 0
Assim, se agora tomarmos o limite h → 0+ na expressão (8.2.26), obtemos
1
BΦk = γΦk + (e−(γ+λ)t T (t)Ψ − 1IΨ) = γΦk + (e−γt S(t)Ψ − S(0)Ψ)
t
= γΦk + (e−γt S(t)Ψ − S(t)Ψ)
= γΦk .
571
Aqui, usamos a periodicidade da função t 3→ S(t) = e−λt T (t). Consequentemente, Φk ∈

Dom(B) = Dom(A) e
. /
(B − γ1I)Ψk = A − (λ + i2πk/t) Ψk = 0 .
Isto prova que λ + i2πk/t ∈ σdisc (A).
Agora analisamos o espectro essential de A, isto é, o complementar em σ(A) do espectro

discreto. Recordemos que, intuitivamente, um ponto do espectro essencial corresponde (i) a
um ponto no espectro contínuo, ou (ii) a um ponto limite de uma sequência de auto-valores
com multiplicidade finita, ou (iii) a um auto-valor de multiplicidade infinita. Sendo o espectro
discreto composto de pontos isolados, obtemos que o espectro essencial de um operador auto-
adjunto A é fechado em R. Vamos lembrar o critério de Weyl para a caracterização de pontos
em σess (A), em que A é um operador auto-adjunto em um espaço de Hilbert H : λ ∈ σess (A)
se, e somente se, a sequência (Ψn )n∈N ⊂ Dom(A), com ∥Ψn ∥ = 1, converge fracamente
para zero e limn→∞ ∥(A − λ1I)Ψn ∥ = 0. Recorde-se que, a sequência (Ψn )n∈N ⊂ Dom(A)
satisfazendo este critério é chamada sequência de Weyl.
TEOREMA 8.4 (Teorema do Mapeamento Espectral para o Espectro Essencial). Seja A auto-
adjunto e o gerador de um semi-grupo-C
. / 0 de contração, T (t), em um espaço de Hilbert H . Se
λ ∈ σess (A), então, λ ∈ σess T (t) , para todo t ∈ R+ .
Demonstração. Assuma que (Ψn )n∈N ⊂ Dom(A) é uma sequência de Weyl para A e λ.
Temos que mostrar que (Ψn )n∈N também desempenha o papel de uma sequência de Weyl para
T (t) e eλt , para todo t ∈ R+ . Através da Eq.(8.2.23), defina uma nova sequência
$ t
λt
Φn = (T (t) − e )Ψn = ds eλ(t−s) T (s)(A − λ1I)Ψn .
0
Obviamente, pelo Lema 8.1, esses vetores satisfazem, para alguma constante c > 0, a estimativa
?$ t ?
? ?
? λ(t−s)
T (s)(A − λ1I)Ψn ?
∥Φn ∥ = ? ds e ? # c∥(A − λ1I)Ψn ∥ → 0 , quando n → ∞ .
0
Portanto, eλt é um auto-valor aproximado de T (t) e (Ψn )n∈N ⊂ Dom(A) serve como a
mesma sequência de Weyl para todo t " 0.
8.3 Operador de Evolução Temporal e a Equação de

Schrödinger
Suponha que temos um sistema físico cujo vetor de estado em t0 é representado por Ψ(x, t0 ).
Em geral, não é de se esperar que em tempos posteriores o sistema permaneça no mesmo estado.
Representemos o correspondente vetor de estado em um tempo posterior por Ψ(x, t). Dado
que o tempo na mecânica quântica é meramente um parâmetro contínuo e não um operador,9
esperamos que
lim Ψ(x, t) = Ψ(x, t0 ) .
t→t0
9
Em particular, o tempo não é um observável no sentido por nós atribuído aos observáveis físicos posição,
momentum e energia, isto é, como sendo operadores auto-adjuntos.
572
Nossa tarefa será estudar a evolução temporal do vetor de estado Ψ(x, t0 ):
evolução temporal
Ψ(x, t0 ) −−−−−−−−−−−−→ Ψ(x, t) .
Assuma que os dois vetores de estado Ψ(x, t0 ) e Ψ(x, t) estão relacionados da seguinte
forma:
Ψ(x, t) = U (t, t0 )Ψ(x, t0 ) ,
em que U (t, t0 ) é um operador chamado operador de evolução temporal.
Quais propriedades se espera que o operador de evolução temporal satisfaça? A primeira

propriedade importante que se espera que o operador U (t, t0 ) satisfaça é a unitariedade. Com
efeito, se U (t, t0 ) é unitário, então pela interpretação probabilística de Born, teremos que
$ $
2
dx |Ψ(x, t)| = dx Ψ(x, t)Ψ(x, t)
R3 R3
$ 6 76 7
= dx U (t, t0 )Ψ(x, t0 ) U (t, t0 )Ψ(x, t0 )
R3
$
= dx Ψ(x, t0 )U ∗ (t, t0 )U (t, t0 )Ψ(x, t0 )
R3
$
= dx |Ψ(x, t0 )|2 = 1 para todo t ∈ R .
R3
Portanto, dizemos que a probabilidade é conservada!
Outra propriedade que exigimos que o operador de evolução temporal satisfaça é a proprie-
dade de composição:
U (t2 , t0 ) = U (t2 , t1 )U (t1 , t0 ) , t2 > t1 > t0 . (8.3.1)
Isto significa que, se quisermos obter a evolução temporal de t0 para t2 , obteríamos o mesmo
resultado se considerássemos primeiro a evolução temporal de t0 para t1 e depois de t1 para
t2 . Isto implica que, o operador de evolução temporal satisfaz a propriedade de composição
de grupo. Note também que, em particular, U (t0 , t0 ) = 1I. De fato, se tomamos t2 = t0 na
Eq.(8.3.1), obtemos
U (t0 , t0 ) = U (t0 , t1 )U (t1 , t0 ) , t0 > t1 > t0 .
Mas, como U (t0 , t1 ) = U −1 (t1 , t0 ) = U ∗ (t1 , t0 ), então,
U (t0 , t0 ) = U ∗ (t1 , t0 )U (t1 , t0 ) = 1I .
Finalmente, como U (t, t0 ) depende somente do parâmetro contínuo t ∈ R, diz-se que

U (t, t0 ) define um grupo uni-paramétrico.
573
DEFINIÇÃO 8.6. Um grupo unitário uni-paramétrico em um espaço de Hilbert H é uma

família U (t), para todo t ∈ R, de operadores unitários tal que U (0) = 1I e U (s + t) =
U (s)U (t) para todo s, t ∈ R. Além disso, diz-se que um grupo unitário uni-paramétrico é
fortemente contínuo se ? ?
lim?U (t)Ψ − U (s)Ψ? = 0 ,
t→s
para todo Ψ ∈ H e todo t ∈ R. Tal grupo é chamado simplesmente grupo-C0 unitário.
Nota 8.6. Note que a condição de unitariedade U ∗ (t)U (t) = U (t)U ∗ (t) = 1I implica
que U ∗ (t) = U −1 (t) = U (−t), para todo t ∈ R. Além disso, deve ficar claro que, na
condição de continuidade forte é suficiente assumir s = 0 e Ψ em um subconjunto denso
de H . Além disso, uma vez que os operadores U (t) são unitários, é suficiente assumir
que limt→0 ⟨Ψ, U (t)Ψ⟩ = ⟨Ψ, Ψ⟩, para Ψ em um subconjunto denso de H . Se o espaço
de Hilbert H é separável, a condição de continuidade forte pode ser substituída por uma
condição mais fraca, isto é, exigindo-se que para Ψ, Φ ∈ H a função t 3→ ⟨Φ, U (t)Ψ⟩ sobre
R seja mensurável a Lebesgue (veja Reed-Simon, Volume I, Teorema VIII.9). Finalmente, como
∥U (t)∥ = 1 para todo t ∈ R, o grupo-C0 é naturalmente um grupo unitário.
Muitas vezes, é mais conveniente considerar o operador evolução temporal infinitesimal, isto
é,
Ψ(x, t0 + ∆t) = U (t0 + ∆t, t0 )Ψ(x, t0 ) .
Por causa da continuidade, expressa pelo limite
lim Ψ(x, t) = Ψ(x, t0 ) ,

∆t→0
o operador evolução temporal infinitesimal deve ser igual ao operador identidade quando ∆t →
0:
lim U (t0 + ∆t, t0 ) = 1I .
∆t→0
Note que, o limite acima nos permite propor o seguinte ansatz em primeira ordem em ∆t:
U (t0 + ∆t, t0 ) = 1I − iA∆t ,
em que A é um operador (não necessariamente limitado). Assuma que A é auto-adjunto, então,
U ∗ (t0 + ∆t, t0 )U (t0 + ∆t, t0 ) = (1I + iA∗ ∆t)(1I − iA∆t) ≈ 1I .
Aqui, o termo de ordem (∆t)2 foi desprezado. Isto nos leva à seguinte
DEFINIÇÃO 8.7. Seja U (t) um grupo-C0 unitário; então, o gerador infinitesimal de U (t) é o
operador A dado por
5
U (t)Ψ − Ψ dU (t) 55
AΨ = i lim =i Ψ5 , (8.3.2)
t→0 t dt 5
t=0
com Dom(A) sendo o conjunto formado por todos os Ψ ∈ H para os quais o limite (8.3.2) é
bem definido.
574
Como o operador A tem dimensão de inverso do tempo, ou de frequência, segue, da relação

Planck-Einstein, que
E = #ω ,
em que ω é a frequência angular. Portanto, o fato do hamiltoniano de um sistema físico ser o
gerador de evolução temporal nos permite relacionar A com o hamiltoniano H, isto é, definimos
def. H
A = ,
#
em que H não depende explicitamente do tempo. Logo, o operador de evolução temporal
infinitesimal pode ser escrito como:
i
U (t0 + ∆t, t0 ) = 1I − H∆t ,
#
em que se assume que H é auto-adjunto.
Estamos agora em condições de deduzir uma equação diferencial fundamental para o opera-
dor U (t, t0 ). Para tanto, exploramos a propriedade de composição, considerando as evoluções
temporais t0 → t e t → t + ∆t:
, -
i
U (t + ∆t, t0 ) = U (t + ∆t, t)U (t, t0 ) = 1I − H∆t U (t, t0 ) ,
#
em que a diferença entre os tempos (t + ∆t) − t0 não precisa ser infintesimal. Logo,
i
U (t + ∆t, t0 ) − U (t, t0 ) = − H∆t U (t, t0 ) ,
#
e se U (t, t0 ) como uma função de t é diferenciável sobre R, então, por um processo de passar
ao limite, segue que
∂ U (t + ∆t, t0 ) − U (t, t0 )
i# U (t, t0 ) = i# lim = H U (t, t0 ) , (8.3.3)
∂t ∆t→0 ∆t
que é uma equação tipo-Schrödinger para o operador U (t, t0 ). Para sistemas conservativos,
isto é, para os quais H não depende explicitamente do tempo, a Eq.(8.3.3) pode ser formalmente
integrada sem dificuldades. Impondo a condição inicial U (t0 , t0 ) = 1I, obtém-se a expressão
U (t, t0 ) = e−i(t−t0 )H/# .
Note que a Eq.(8.3.3) nos diz que a curva Ψ(t, x) = U (t)Ψ0 (t0 , x) ∈ H satisfaz a equação
diferencial
∂
i# Ψ(t, x) = HΨ(t, x) . (8.3.4)
∂t
dado que Ψ0 ∈ Dom(H). A maioria dos livros-texto sobre mecânica quântica resolve formal-
mente a Eq.(8.3.4) estabelecendo que Ψ(t, x) = e−itH/# Ψ0 (t0 , x). Além disso, os livros-texto
costumam sustentar que um hamiltoniano hermitiano H é capaz de gerar uma evolução tem-
poral unitária e−itH/# para todo t real. É bem verdade que para um hamiltoniano hermitiano
limitado e−itH/# é de fato unitário para todo t. No entanto, o hamiltoniano de Schrödinger,
Eq.(8.1.2), é ilimitado. Neste caso, o resultado chave para a questão sobre quando a evolução
temporal é bem definida, é respondida pelo seguinte
TEOREMA 8.5. e−itH/# é unitário se, e somente se, o operador H for auto-adjunto.
Mostraremos que esse resultado é consequência do famoso Teorema de Stone.
575
8.4 Teorema de Stone e a Existência da Dinâmica Quântica

Dado que, em geral, H é um operador auto-adjunto ilimitado, devemos encontrar condições
que garantam que a solução da Eq.(8.3.3) possa ser escrita na forma exponencial
U (t, t0 ) = e−i(t−t0 )H/# .
O seguinte resultado mostra que podemos construir um grupo unitário uni-paramétrico

fortemente contínuo para o operador auto-adjunto H, definindo U (t) = e−itH/# . Além disso,
o operador H é precisamente o gerador infinitesimal de U (t). Em outras palavras, se H é
um operador auto-adjunto em um espaço de Hilbert H , então, ele dá origem a um grupo de
evolução pela exponenciação de H, o que garante a existência da dinâmica para um sistema
quântico.
TEOREMA 8.6. Assuma que A : Dom(A) → H é um operador auto-adjunto. Então, existe
uma única família de operadores limitados, U (t) = e−itA , satisfazendo as seguintes proprieda-
des para t1 , t2 ∈ R:
dU (t)
i = AU (t) = U (t)A ; (8.4.1)
dt
U (0) = 1I e U (t)Ψ → Ψ quando t → 0 ; (8.4.2)
U (t1 )U (t2 ) = U (t1 + t2 ) ; (8.4.3)
∥U (t)Ψ∥ = ∥Ψ∥ . (8.4.4)
Demonstração. Defina uma aproximação tipo-Yosida de A por

= >
def. 1 2 −1 −1
Aλ = λ (A + iλ1I) + (A − iλ1I) .
2
Como A é auto-adjunto, os operadores (A ± iλ1I)−1 existem para cada R ∋ λ > 0 e satisfazem
a estimativa
? ?
?(A ± iλ1I)−1 ? # 1 . (8.4.5)
λ
De fato, considere a equação
(A ± iλ1I)Ψ = Φ .
Então,
⟨Ψ, (A ± iλ1I)Ψ⟩ = ⟨Ψ, AΨ⟩ ± ⟨Ψ, iλ1IΨ⟩ = ⟨Ψ, Φ⟩ .
Note que, como A é auto-adjunto, ⟨Ψ, AΨ⟩ é sempre real; logo a parte imaginária da equação
acima é . /
±λ∥Ψ∥2 = Im ⟨Ψ, Φ⟩ .
576
Isso mostra que para um R ∋ λ > 0, Φ não pode desaparecer,

. a menos
/ que Ψ desapareça.
Portanto, ∓iλ não é um auto-valor de A, e os operadores A ± iλ1I têm um inverso, isto é,
. /−1
podemos tomar Ψ = A ± iλ1I Φ.
Finalmente, pela desigualdade de Cauchy-Schwarz-Bunjakowski, segue que

5 . /5
λ∥Ψ∥2 = 5Im ⟨Ψ, Φ⟩ 5 # |⟨Ψ, Φ⟩| # ∥Ψ∥∥Φ∥ .
. /−1
Logo, como Ψ = A ± iλ1I Φ, obtemos
? ? ? ? 1
λ?(A ± iλ1I)−1 Φ? # ∥Φ∥ =⇒ ?(A ± iλ1I)−1 Φ? # ∥Φ∥ .
λ
Isto prova a estimativa (8.4.5). Consequentemente, explorando a estimativa (8.4.5), segue que
? > ?
? ? ? 1 2= ?
?Aλ Ψ? = ? λ (A + iλ1I) + (A − iλ1I) Ψ?
−1 −1
?2 ?
1 2 =?
?
? ?
−1 ? ?
?>
−1 ?
# λ (A + iλ1I) Ψ + (A − iλ1I) Ψ
2
F G
1 2 ∥Ψ∥ ∥Ψ∥
# λ + = λ∥Ψ∥ .
2 λ λ
Ou seja, Aλ é limitado! O operador A pode ser aproximado pelos operadores Aλ no sentido

que Aλ Ψ → AΨ, quando λ → ∞, para todo Ψ ∈ Dom(A). Para verificarmos isto, defina
def. i = >
Bλ = λ (A + iλ1I)−1 − (A − iλ1I)−1 .
2
Então, note que Bλ A = Aλ . De fato,
i = >
Bλ A = λ (A + iλ1I)−1 − (A − iλ1I)−1 A
2
i = −1 −1
>
= λ (A + iλ1I) A − (A − iλ1I) A
2
i = −1 −1
>
= λ (A + iλ1I) (A + iλ1I − iλ1I) − (A − iλ1I) (A − iλ1I + iλ1I)
2
i = >
= λ 1I − (A + iλ1I)−1 (iλ1I) − 1I − (A − iλ1I)−1 (iλ1I)
2
1 = >
= λ2 (A + iλ1I)−1 + (A − iλ1I)−1 = Aλ .
2
A seguir, vamos analisar o limite

? ? ? ?
lim ?(Aλ − A)Ψ? = lim ?(Bλ − 1I)AΨ? .
λ→∞ λ→∞
577
Primeiro, observe que

i = >
Bλ − 1I = λ (A + iλ1I)−1 − (A − iλ1I)−1 − 1I
2
i = > 1 1
= λ (A + iλ1I)−1 − (A − iλ1I)−1 − 1I − 1I
2 2 2
i = > 1
= λ (A + iλ1I)−1 − (A − iλ1I)−1 − (A + iλ1I)−1 (A + iλ1I)
2 2
1
− (A − iλ1I)−1 (A − iλ1I)
2
1= >
= − (A + iλ1I)−1 (A + iλ1I − iλ1I) + (A + iλ1I)−1 (A − iλ1I + iλ1I)
2
1= >
= − (A + iλ1I)−1 + (A + iλ1I)−1 A .
2
Assim, para qualquer Φ ∈ Dom(A), porém fixo, recorrendo-se novamente à estimativa (8.4.5),
obtemos:
? > ?
? ? ? = ?
?(Bλ − 1I)Φ? = ?− 1 (A + iλ1I)−1 + (A + iλ1I)−1 AΦ?
? 2 ?
? = >?
? 1 ?? ?
#? −
? 2 (A + iλ1I) −1
+ (A + iλ1
I) −1 ? ?AΦ?
?
1
# ∥AΦ∥ → 0 quando λ→∞.
λ
Observe que a convergência acima não é uniforme; ela é uma convergência ponto-a-ponto, pois
depende do vetor Φ ∈ Dom(A)! Uma vez que Dom(A) é denso e ∥Bλ ∥ # 1, temos que
Bλ Φ → Φ, quando λ → ∞, para qualquer Φ ∈ H . Finalmente, tomando Φ = AΨ, para
qualquer Ψ ∈ Dom(A), obtemos que
Bλ Φ → Φ =⇒ Bλ AΨ → AΨ =⇒ Aλ Ψ → AΨ , (8.4.6)
quando λ → ∞. Isto confirma que o operador A pode ser aproximado pelos operadores
limitados Aλ !
Continuando, uma vez que os operadores Aλ são limitados, podemos definir a exponencial
iAλ
e por séries de potência. Vamos mostrar que a família eiAλ , para λ > 0, é uma família de
Cauchy, no sentido que
? iA ′ ?
lim ?(e λ − eiAλ )Ψ? = 0 , (8.4.7)
′
λ,λ →∞
para todo Ψ ∈ Dom(A). Para provar este fato, representamos o operador dentro da norma da
seguinte forma:
$ 1
iAλ′ iAλ ∂ . isAλ′ i(1−s)Aλ /
e −e = ds e e .
0 ∂s
578
Uma vez que Aλ é simétrico e limitado, ele é auto-adjunto pelo Teorema 4.14 (Teorema Hellinger-
Toeplitz). Logo,
∥eiAλ Ψ∥2 = ⟨eiAλ Ψ, eiAλ Ψ⟩

∗
= ⟨Ψ, e−iAλ eiAλ Ψ⟩
= ⟨Ψ, e−iAλ eiAλ Ψ⟩ (8.4.8)
= ⟨Ψ, Ψ⟩
= ∥Ψ∥2 .
Isto implica que ∥eiAλ Ψ∥ = ∥Ψ∥, ou seja, eiAλ é unitário. Assim, usando a unitariedade de
eiAλ e o fato que Aλ e Aλ′ comutam, obtemos
?$ ?
? iA ′ ? ? 1 ∂ . isAλ′ i(1−s)Aλ / ?
?(e λ − eiAλ )Ψ? = ? ds e e Ψ?
? ∂s ?
0
?$ 1 ?
? . / ?
=? ?
isA
ds e λ e′ i(1−s)A λ
i Aλ′ − Aλ Ψ?
?
0
$ 1 ? . / ?
# ds ?eisAλ′ ei(1−s)Aλ i Aλ′ − Aλ Ψ?
0
$ 1 ?. / ? ?. / ?
# ds ? Aλ′ − Aλ Ψ? = ? Aλ′ − Aλ Ψ? .
0
A passagem da segunda para terceira linha na expressão acima, onde aparece a desigualdade,
pode ser provada escrevendo a integral como um limite de somas de Riemann e usando a
desigualdade triangular (veja, por exemplo, W. O. Amrein, “Non-Relativistic Quantum Dynamics,”
D. Reidel Publishing Company, 1981, Proposição 1.21, pg.23). Dessa forma, a Eq.(8.4.6) implica
que (8.4.7) é satisfeita.
A propriedade de Cauchy (8.4.7) indica que, para qualquer Ψ ∈ Dom(A), os vetores eiAλ Ψ
convergem para um elemento do espaço de Hilbert quando λ → ∞. Assim, mesmo que A seja
ilimitado, em um conjunto denso de vetores Dom(A) ⊂ H , o operador eiA pode ser obtido
através do limite
def.
eiA Ψ = lim eiAλ Ψ , ∀ Ψ ∈ Dom(A) . (8.4.9)
λ→∞
Além disso, como já mostramos que o teorema vale para operadores limitados, temos que
∥eiA Ψ∥ # ∥Ψ∥, para todo Ψ ∈ Dom(A), que é denso em H , ou seja, o operador eiA é
limitado também. Com efeito, segue que
? iA ? ? iA ?
?e Ψ? = ?(e − eiAλ )Ψ + eiAλ Ψ?
? ? ? ?
# ?(eiA − eiAλ Ψ? + ?eiAλ Ψ?
? ?
= ?(eiA − eiAλ )Ψ? + ∥Ψ∥ (eiAλ é unitário, pois Aλ é limitado) .
579
Logo, conclui-se que

? iA ? ? iA ?
?e Ψ? # ∥Ψ∥ =⇒ ?e ? # 1 ,
dado que, por construção, a família {Aλ } de operadores limitados cumpre

? iA ?
?(e − eiAλ )Ψ? → 0 , quando λ → ∞ .
qualquer que seja Ψ ∈ Dom(A). Portanto, de acordo com o teorema de extensão, Teorema
4.5, a definição acima pode ser estendida para todo Ψ ∈ H . Isso define a função exponencial
eiA para qualquer operador auto-adjunto A ilimitado. Além disso, temos também que
∥eiA Ψ∥2 = ⟨eiA Ψ, eiA Ψ⟩ = lim ⟨eiAλ Ψ, eiAλ Ψ⟩

λ→∞
∗
= lim ⟨Ψ, e−iAλ eiAλ Ψ⟩
λ→∞
= lim ⟨Ψ, e−iAλ eiAλ Ψ⟩

λ→∞
= ⟨Ψ, Ψ⟩
= ∥Ψ∥2 .
? ?
Isto prova que de fato ?eiA ? = 1. Em particular, isso nos permite definir a função exponencial
e−itA , para todo Ψ ∈ Dom(A) e todo t ∈ R. Com isto provamos a Eq.(8.4.4)!
Vamos provar a propriedade de grupo (8.4.3). Para isso, usamos mais uma vez a Eq.(8.4.9) e
a Nota 8.3, já que Aλ é um operador limitado:
[ \
⟨Φ, U (t1 )U (t2 )Ψ⟩ = lim Φ, e−it1 Aλ e−it2 Aλ Ψ
λ→∞
[ \
= lim Φ, e−i(t1 +t2 )Aλ Ψ
λ→∞
[ \
= Φ, e−i(t1 +t2 )A Ψ = ⟨Φ, U (t1 + t2 )Ψ⟩ .
Consequentemente, U (t1 + t2 ) = U (t1 )U (t2 ).
Para provar (8.4.1), tome Ψ ∈ Dom(A) e use a propriedade de grupo (8.4.3) para computar
, -
U (s + t)Ψ − U (t)Ψ U (s)Ψ − Ψ
= U (t) .
s s
Então, como Ψ ∈ Dom(A), o limite
dU (t) U (t + s)Ψ − U (t)Ψ U (s)Ψ − Ψ

i Ψ = i lim = i U (t) lim ,
dt s→0 s s→0 s
existe e é igual −iAΨ no lado direito, pela Eq.(8.3.2). Assim, obtemos que
dU (t)
i Ψ = U (t)AΨ .
dt
580
Por outro lado, usando a propriedade de grupo (8.4.3) e comutatividade de U (s) e U (t),
podemos escrever
. / . /
U (s + t)Ψ − U (t)Ψ U (s) U (t)Ψ − U (t)Ψ
= .
s s
Portanto, novamente, o limite
. / . /
dU (t) U (s + t)Ψ − U (t)Ψ U (s) U (t)Ψ − U (t)Ψ
i Ψ = i lim = i lim ,
dt s→0 s s→0 s
. /
existe e é igual A U (t)Ψ no lado direito, pela Eq.(8.3.2). Logo, se Ψ ∈ Dom(A), então
e−itA Ψ ∈ Dom(A). Consequentemente,
d −itA
i e Ψ = Ae−itA Ψ , ∀ Ψ ∈ Dom(A) .
dt
Para finalizar, temos que provar (8.4.2). Primeiro, note que,

( ∞
)
< (−i)n
U (t)Ψ = e−itA Ψ = lim e−itAλ Ψ = lim tn Anλ Ψ
λ→∞ λ→∞
n=0
n!
( ∞
)
< (−i)n
= lim 1IΨ + tn Anλ Ψ .
λ→∞
n=1
n!
Logo, para t = 0, segue que U (0)Ψ = Ψ =⇒ U (0) = 1I. Além disso, se usarmos (8.4.1),
então,
dU (t)
i = AU (t) = U (t)A ,
dt
e para qualquer Ψ0 ∈ Dom(A), obtemos
dU (t)
i Ψ0 = U (t)AΨ0 ,
dt
em que Ψ0 = Ψ0 (t0 ), com t0 arbitrário, porém fixo. Então, de acordo com a Eq.(8.2.5), segue
que
$ s $ s $ s
d
U (s)Ψ0 − Ψ0 = dt U (t)Ψ0 = dU (t)Ψ0 = −i dt U (t)AΨ0 .
0 dt 0 0
Ou seja, obtemos, imediatamente, para qualquer Ψ0 ∈ Dom(A),

$ s
U (s)Ψ0 − Ψ0 = −i dt U (t)AΨ0 → 0 quando s→0.
0
Isso prova (8.4.2) e o teorema.
581
O teorema acima tem como consequência imediata o fato que, sendo o hamiltoniano, H,
auto-adjunto, o problema de Cauchy (8.1.1) - (8.1.3) tem uma solução única que conserva a
probabilidade. De fato, Ψ(t) = U (t)Ψ0 é a única solução de (8.1.1) - (8.1.3), uma vez que
se5 existirem duas soluções Ψ1 e Ψ2 , então, a diferença, ΨN = Ψ1 − Ψ2 , resolve (8.1.1) com
N5
Ψ = 0, e, portanto, pela conservação da probabilidade (uma consequência da simetria de
t=0
N
H), ∥Ψ(t)∥ N
= ∥Ψ(0)∥ N ≡ 0. Logo, conclui-se que, neste
= 0 para todo t. Isso implica que Ψ
caso, o problema de Cauchy (8.1.1) - (8.1.3) é bem-posto.
Voltamos, agora, nossa atenção para o principal resultado deste capítulo: o Teorema de
Stone, que é o inverso do Teorema 8.6. Note que se {U (t) = e−itA }t∈R para um operador
auto-adjunto A, então, pela Definição 8.7 podemos recapturar A. Esta é a rota seguida na prova
do Teorema de Stone.
TEOREMA 8.7 (Teorema de Stone). 10 Seja {U (t) = e−itA }t∈R um grupo-C0 de operadores
unitários sobre um espaço de Hilbert H , em que A é o gerador infinitesimal do grupo. Então, A
é um operador auto-adjunto.
Demonstração. Vamos provar o teorema dividindo a prova nas seguintes etapas:
(i) partimos do seguinte cálculo elementar: seja z ∈ C e x ∈ R, então
$ 5∞
∞
i(z−x)t ei(z−x)t 55 1
i dt e = = se Im z > 0 .
0 z − x 50 x−z
Se nós substituirmos x por A, em que A é o gerador infinitesimal de um grupo-C0 de

operadores unitários, U (t) = e−itA em H , isto sugere que tomemos
$ ∞
−1
(A − z1I) =i dt eizt U (t) para Im z > 0 .
0
Uma vez que o integrando acima é fortemente contínuo e

$ ∞ $ ∞
izt 1
dt ∥e U (t)∥ # dt e−(Im z)t = <∞, para Im z > 0 ,
0 0 Im z
então, ∥(A − z1I)−1 ∥ # (Im z)−1 , ou seja, (A − z1I)−1 é limitado.
(ii) Vamos mostrar que Ran(A − z1I)−1 é denso em H . Para isto, devemos mostrar que
se ⟨Φ, (A − z1I)−1 Ψ⟩ = 0, para todo Ψ ∈ H , então Φ = 0. Com efeito,
O $ ∞ P $ ∞
−1 izt
0 = ⟨Φ, (A − z1I) Ψ⟩ = Φ, i dt e U (t)Ψ =i dt eizt ⟨Φ, U (t)Ψ⟩ .
0 0
10
Marshall Stone formulou e provou o teorema que leva seu nome em 1932.
582
Pela desigualdade de Cauchy-Schwarz-Bunjakowski, segue que

5O $ ∞ P5 $
5 5 ∞ 5 5
−1 5
0 = |⟨Φ, (A − z1I) Ψ⟩| = 5 Φ, i dt e U (t)Ψ 55 #
izt
dt 5eizt ⟨Φ, U (t)Ψ⟩5
0 0
$ ∞
# dt e−(Im z)t ∥Φ∥∥U (t)Ψ∥
0
1
# ∥Φ∥∥U (t)Ψ∥
Im z
1
= ∥Φ∥∥Ψ∥ .
Im z
Aqui, a passagem do módulo do produto interno sob o sinal integral é justificada pelo fato de
Im z > 0 e U (t) ser fortmente contínuo. Isto implica que, para qualquer Ψ ∈ H , devemos
ter ∥Φ∥ = 0; mas pela definição de norma (Definição 2.10), isto implica que Φ = 0.
(iii) Vamos mostrar que A é um operador fechado. Com efeito, suponha que Ψn ∈
Dom(A), Ψn → Ψ e Φn → Φ em que Φn = AΨn . Devemos mostrar que Ψ ∈ Dom(A) e
AΨ = Φ. Tome
Λn = (A − z1I)Ψn =⇒ Λn → Φ − zΨ .
Como (A − z1I)−1 é um operador limitado, concluímos que
Ψ = lim Ψn = lim (A − z1I)−1 Λn = (A − z1I)−1 (Φ − zΨ) .

n→∞ n→∞
Logo, (A − z1I)Ψ = Φ − zΨ; isto implica que Ψ ∈ Dom(A) = Dom(A − z1I) e que
AΨ = Φ. Logo, A é fechado.
(iv) Agora, da relação
(A − z1I)(A − z1I)−1 Ψ = Ψ , ∀Ψ ∈ H , (8.4.10)
segue que (A − z1I)−1 Ψ ∈ Dom(A − z1I) = Dom(A) e isto implica que Dom(A) é denso
em H uma vez que Ran(A − z1I)−1 é denso. Em particular, tomando z = i em (8.4.10),
obtemos que Ran(A − i1I) é denso em H . Por sua vez, pela Proposição 3.14 e pelo Teorema
4.18, isto implica que {0} = Ran(A − i1I)⊥ = Ker(A∗ + i1I).
(v) Definindo
$ 0
−1
(A − z1I) = −i dt eizt U (t) para Im z < 0 ,
−∞
podemos repetir os argumentos das etapas (i), (ii) e (iii) e concluir que a relação (8.4.10)
continua válida para Im z < 0. Em particular, tomando z = −i, obtemos que Ran(A + i1I)
é denso em H . Novamente, pela Proposição 3.14 e pelo Teorema 4.18, isto implica que
{0} = Ran(A + i1I)⊥ = Ker(A∗ − i1I).
(vi) Finalmente, sendo U (t) um grupo-C0 de operadores unitários em H , com A sendo
583
seu gerador infinitesimal, então,

O P O P
1 (U (t) − 1I)Ψ −1 (U ∗ (t) − 1I)Φ
⟨Φ, AΨ⟩ = lim Φ, = lim ,Ψ
t→0 i t t→0 i t
O P
−1 (U −1 (t) − 1I)Φ
= lim ,Ψ
t→0 i t
O P
−1 (U (−t) − 1I)Φ
= lim ,Ψ
t→0 i t
O P
1 (U (−t) − 1I)Φ
= lim ,Ψ
t→0 i −t
O P
1 (U (τ ) − 1I)Φ
= lim ,Ψ
τ →0 i τ
= ⟨AΦ, Ψ⟩ ,
para todo Φ, Ψ ∈ Dom(A) para os quais o limite existe.11 Isto mostra que A é simétrico.12
Por outro lado, como A é fechado, Ker(A∗ ± i1I) = {0} e Ran(A ± i1I) = H , então,
pelo Teorema 4.25, A é auto-adjunto.
Conclusão: se o hamiltoniano H é auto-adjunto, então, o operador U (t) = e−itH/# existe e

é unitário para todo t ∈ R. Portanto, para a formulação da equação de Schrödinger da mecânica
quântica fazer sentido, o operador hamiltoniano H deve ser auto-adjunto! Assim, o Teorema 8.5
pode ser enunciado da seguinte forma:
TEOREMA 8.1a. A dinâmica quântica existe se, e somente se, o operador hamiltoniano H é
auto-adjunto.
Por conta do Teorema de Stone e do Teorema 8.6, existe uma correspondência de um-para-
um entre operadores auto-adjuntos e grupos unitários uni-paramétricos fortemente contínuos.
Assim, deve ser possível caracterizar certas propriedades de um grupo em termos de seu
gerador infinitesimal e vice-versa. Por exemplo, entre outras aplicações importantes do Teorema
de Stone está a teoria da representação de grupos de Lie de simetrias contínuas. De fato, um
grupo unitário uni-paramétrico fortemente contínuo não é senão uma representação unitária do
grupo de Lie R.
11
Na penúltima linha definimos τ = −t!
12
Poderíamos ter chegado à mesma conclusão a partir da Definição 8.7 considerando a seguinte relação:
⟨Φ, U (t)Ψ⟩ = ⟨U ∗ (t)Φ, Ψ⟩ = ⟨U −1 (t)Φ, Ψ⟩ = ⟨U (−t)Φ, Ψ⟩ .
Dessa forma, atuando na expressão acima com o operador id/dt e tomando t = 0, obtemos:
i⟨Φ, −iAΨ⟩ = i⟨iAΦ, Ψ⟩ =⇒ ⟨Φ, AΨ⟩ = ⟨AΦ, Ψ⟩ ∀ Φ, Ψ ∈ Dom(A) .
584
Nota 8.7. Neste ponto, chamamos a atenção para o seguinte fato importante: se o hamiltoniano
H associado a um sistema quântico é um operador auto-adjunto e se assumirmos que A = iH,
então, (A − λ1I)−1 = i(H − iλ1I)−1 e as hipóteses do Teorema de Hille-Yosida seguem das
propriedades bem conhecidas dos operadores auto-adjuntos. Neste caso, o semi-grupo-C0 é
unitário, sendo denotado por U (t) = e−iHt . Desse modo, em um espaço de Hilbert H ,
em certo sentido, o Teorema de Stone é um caso especial no quadro mais amplo criado pelo
Teorema de Hille-Yosida.
Nota 8.8 (Estados estacionários e constantes do movimento). Em geral, se o hamiltoniano
H de um determinado sistema possui um espectro discreto σdisc (H), todo auto-vetor Ψ de
H associado ao auto-valor E ∈ σdisc (H), tem uma evolução trivial. Em outras palavras, para
um sistema conservativo, ou seja, aquele para o qual o operador hamiltoniano não depende
explicitamente do tempo, se Ψ(t0 ) é um auto-estado de H com auto-valor E, então,
HΨ(t0 ) = EΨ(t0 ) . (8.4.11)
Neste caso, diz-se que o estado Ψ(t0 ) é um estado estacionário e, de acordo com o Teorema
de Stone e o Teorema 8.3, sua evolução temporal é dada por
Ψ(t) = e−iE(t−t0 )/# Ψ(t0 ) .
Dessa forma, o estado varia apenas em sua fase ao longo do tempo, e em um instante arbitrário
de tempo, Ψ(t) é um auto-estado de H com auto-valor E. Neste caso, E pertence ao espectro
discreto de H e a função Ψ(t0 ) solução da Eq.(8.4.11) é chamada de estado ligado. Para os
estados ligados, as energias possíveis são valores E ∈ σdisc (H). Por outro lado, se E pertence
ao espectro essencial de H, Ψ(t0 ) é chamado de estado espalhado. De acordo com a discussão
sobre o Tripleto de Gelf’and no Capítulo 6, Seção 6.8, tal estado pertence ao auto-subespaço
generalizado associado ao operador para o auto-valor E. Em muitos casos de interesse, H será
um operador diferencial e, ao encontrar soluções de (8.4.11), condições terão que ser impostas
a essas soluções para garantir que Ψ(t0 ) pertença a σdisc (H) (estados ligados) ou σess (H)
(estados espalhados).
8.5 Uma Aplicação Simples do Operador de Evolução

Temporal
Os livros de física típicos sobre mecânica quântica fornecem apenas um esboço da teoria dos
operadores. Em muitas ocasiões, algumas questões, como a definição do domínio do hamiltoni-
ano, não são abordadas, deixando a porta aberta para polêmicas e ambiguidades. Por exemplo,
vamos mostrar que o tratamento naïve do hamiltoniano de uma partícula quântica confinada
em um poço de potencial infinito pode facilmente nos levar a contradições surpreendentes e
a resultados sem qualquer conteúdo físico. Portanto, o leitor deve estar ciente das dificuldades
básicas intrínsecas a este modelo (em princípio) muito simples.
Considere uma partícula quântica de massa m confinada no poço de potencial infinito

⎧
⎨0 se 0 # x # ℓ
V (x) = .
⎩∞ caso contrário
585
O hamiltoniano para a partícula confinada no interior do poço é simplesmente
#2 d 2
H = H0 = − .
2m dx2
Em geral, exige-se que o domínio de H seja representado pelo conjunto

3 4
Dom(H) = Ψ ∈ L2 (0, ℓ) | HΨ ∈ L2 (0, ℓ), Ψ(0) = Ψ(ℓ) = 0 ,
isto é, Ψ deve ser duas vezes diferenciável. Entretanto, muitas vezes, olhar só para esta condição
pode nos levar à um resultado inesperado, com as funções Ψ’s podendo não estar entre as Ψ’s
para as quais H foi definido. Por exemplo, no livro de Griffiths,13 assume-se que
i
30
Ψ(x) = x(ℓ − x) para 0 # x # ℓ (e Ψ(x) = 0 caso contrário) ,
ℓ5
é uma função de onda normalizada representando o estado da partícula quântica em um
determinadoHinstante. Vamos computar a incerteza na medida da energia da partícula, isto é,
∆Ψ (E) = ⟨H 2 ⟩Ψ − (⟨H⟩Ψ )2 . O cálculo do valor esperado da energia é imediato e nos dá o
seguinte resultado:
$ ℓ
⟨H⟩Ψ = ⟨Ψ, HΨ⟩ = dx Ψ(x) (HΨ)(x)
0
$ ℓ
30 #2 d2
=− 5 dx x(ℓ − x) x(ℓ − x)
ℓ 2m 0 dx2
5#2
= .
mℓ 2
#4 d4 Ψ
Como H 2 Ψ = 4m2 dx4
= 0, o valor médio do operador H 2 no estado Ψ desaparece
$ ℓ
2 2
⟨H ⟩Ψ = ⟨Ψ, H Ψ⟩ = dx Ψ(x) (H 2 Ψ)(x) = 0 . (8.5.1)
0
Consequentemente, obtemos que a incerteza na medida da energia da partícula no estado

representado pela função de onda Ψ é um número imaginário, o que impossível!
Por outro lado, lembremos que qualquer partícula quântica confinada no poço de potencial
infinito, seja qual for seu estado, é convenientemente descrita por um pacote de ondas, que
pode ser sintetizado por meio da soma de ondas senoidais.14 Especificar a lista completa
de ondas senoidais fornece uma descrição completa da partícula. Em outras palavras, se
especificarmos exatamente que ondas senoidais são necessárias para construir um pacote de
13
D.J. Griffiths, “Introduction to Quantum Mechanics,” Prentice-Hall, 1995, pg.30.
14
De acordo com a Análise de Fourier, qualquer onda, de extensão e formato arbitrariamente complexos, pode
ser representada por meio de uma série formada de ondas senoidais. Todos os dias você deve usar tecnologia
baseada na Análise de Fourier, uma vez que a decomposição de uma onda em suas ondas senoidais constituintes
é a base da tecnologia de compressão de áudio e vídeo. Para detalhes matemáticos sobre o assunto, veja os
excelentes livros de D.G. Figueiredo, “Análise de Fourier e Equações Diferenciais Parciais,” Projeto Euclides, IMPA,
2007 e R. Iório Jr. e V.M. Iório, “Equações Diferenciais Parciais: Uma Introdução,” Projeto Euclides, IMPA, 1988.
586
ondas e exatamente quanto de cada onda senoidal precisamos combinar para ter o formato
exato, chegaremos a uma representação do pacote de ondas, porém totalmente equivalente.
Por exemplo, assumindo ℓ = 20, na Figura 8.1 a curva pontilhada representa o resultado
da soma das duas ondas representadas pelos dois primeiros gráficos na Figura 8.2, a curva
tracejada é formada pela soma das quatro ondas mostradas na mesma figura, enquanto que a
linha sólida mostra o que ocorre quando se soma as dez primeiras ondas. Quanto mais ondas
senoidais somamos, mais pronunciado fica o pico central.
Figura 8.1: Representação de pacotes de ondas. O pacote de ondas representado pela linha
pontilhada contém menos ondas do que a curva tracejada, que, por sua vez, contém menos
ondas do que a curva em linha sólida (figura retirada, e adptada, do livro de Brian Cox e Jeff
Forshaw, “The Quantum Universe,” DaCapo Press, 2011. Todos os Direitos Reservados).
Figura 8.2: As primeiras quatro ondas estacionárias, com n ímpar, usadas para montar os
pacotes de ondas na Figura 8.1 (figura retirada, e adptada, do livro de Brian Cox e Jeff Forshaw,
“The Quantum Universe,” DaCapo Press, 2011. Todos os Direitos Reservados).
Em termos gerais, o fato da partícula quântica estar confinada no poço implica que o pacote
de ondas que representa a partícula, bem como todas as ondas senoidais, estão também presas
dentro do poço. Isso faz com que surja um fenômeno conhecido como “ondas estacionárias,”
isto é, ondas que não mudam suas formas. Uma onda estacionária é um estado quântico puro,
com todos os observáveis a ele associado sendo independentes do tempo. As ondas estacionárias
587
descrevem uma partícula que só pode ter certos valores de energia bem definida (em vez de
uma superposição quântica de diferentes energias). Esse estado é também chamado auto-vetor
de energia ou auto-função de energia. Assim, qualquer pacote de ondas pode ser constituído
por uma combinação linear de ondas estacionárias, as auto-funções de H. Vamos aplicar esta
ideia de modo a calcular o valor médio acima a partir dos auto-valores e das auto-funções de
H,
i 6 πnx 7
2 π 2 #2 2
HΦn (x) = En Φn (x) com Φn = sin e En = n (n ∈ N) .
ℓ ℓ 2mℓ 2
Nota 8.9. As auto-funções de H têm algumas propriedades importantes: (i) elas são, alternada-
mente, pares e ímpares com respeito ao centro do poço; (ii) elas são mutuamente ortogonais
e (iii) de acordo com a Nota 8.8, uma auto-função, Φn , evolui no tempo na forma simples
U (t)Φn (x) = Φ(t, x) = e−iEn t/# Φn (x). Com isso, podemos construir uma solução mais geral
da forma
∞
<
Ψ(t, x) = an e−iEn t/# Φn (x) . (8.5.2)
n=1
Expandindo Ψ na base ortonormal completa das auto-funções de H, isto é, expressando Ψ

como uma combinação linear do tipo
∞
<
Ψ(x) = an Φn (x) , (8.5.3)
n=1
com
$ ℓ
an = ⟨Φn , Ψ⟩ = dx Φn (x)Ψ(x)
0
i i $ ℓ 6 πnx 7
2 30
= dx sin x(ℓ − x)
ℓ 0 ℓ5 ℓ
i i # F G %
30 2 ℓ2 n ℓ3 n 2ℓ 3 . n
/
= ℓ − (−1) + (−1) − (−1) − 1
ℓ5 ℓ nπ nπ (nπ)3
i i
30 2 2ℓ 3 . n
/
= 1 − (−1) .
ℓ 5 ℓ (nπ)3
Então, aplicando-se a fórmula
∞
< ∞
2 2 240#4 < 1 30#4
⟨H ⟩Ψ = |an | En2 = 2 2 4 = ,
n=1
m π ℓ n=1 (2n − 1)2 m2 ℓ 4
encontramos um resultado conflitante

;∞com o resultado encontrado anteriormente
√ em (8.5.1), isto
2 2 2 2
porque En > 0 e 0 # |an | # 1, n=1 |an | = 1. Agora, temos ∆Ψ (E) = 5#/mℓ . Neste
ponto, deve-se ressaltar que se tivéssemos computado o valor esperado da energia usando o
mesmo raciocínio acima obteríamos o mesmo resultado anterior. De fato,
∞
< ∞
480#2 < 2 1 5#2
⟨H⟩Ψ = |an | En = = .
n=1
mπ 4 ℓ 2 n=1 (2n − 1)4 mℓ 2
588
Assim, qual dos dois resultados acima está correto? De onde vem esta inconsistência?
Estas perguntas são importantes e merecem uma resposta, mas a resposta não pode ser dada
sem o rigor matemático necessário. O ponto é: se alguém quer realmente entender essas
questões, devemos desistir das discussões intuitivas-formais e usar as ferramentas matemáticas
apropriadas. Caso contrário, tudo permanecerá vago e indefinido.
Um operador auto-adjunto tem como parte de sua definição um conjunto univocamente

determinado de funções que constituem seu domínio; portanto sob as hipóteses do Teorema
de Stone, é a lei da evolução temporal que determina univocamente o domínio de definição do
hamiltoniano H. Assim, para um H independente do tempo uma aplicação simples da lei de
evolução temporal explica o paradoxo acima, como mostrado pela seguinte
PROPOSIÇÃO 8.4. Seja H o hamiltoniano, independente do tempo, de um sistema quântico.
Assuma que Ψ ∈ Dom(H). Se Ψ ∈ Dom(H 2 ), então
∥HΨ∥2 # 4 ∥H 2Ψ∥∥Ψ∥ .
Demonstração. Para qualquer Ψ ∈ Dom(H), partimos da relação

$
i s
U (s)Ψ − Ψ = − dt U (t)HΨ .
# 0
Aplicando H aos dois lados da equação acima, obtemos que
$
i s
HU (s)Ψ = HΨ − dt HU (t)HΨ .
# 0
Então, usando (8.4.1), obtemos que
$ s
dU (s) i 1
Ψ = − HΨ − 2 dt U (t)H 2 Ψ .
ds # # 0
Disso, segue que

$ r $ r $ r $ s
i 1
dU (s)Ψ = − ds HΨ − 2 ds dt U (t)H 2 Ψ . (8.5.4)
0 # 0 # 0 0
Note que, na integral dupla a variável de integração t varia entre 0 # t # s. Como resultado
desta integral obtemos uma função do parâmetro s que, por sua vez, de acordo com a segunda
integral, varia entre 0 # s # r. Portanto, temos que 0 # t # s # r.
t t
r r
Ω ≃ Ω
r s r s
⎧ ⎧
⎪
⎪0#s#r ⎪
⎪0#t#r
⎪
⎨ ⎪
⎨
Ω: & Ω: &
⎪
⎪ ⎪
⎪
⎪
⎩ ⎪
⎩
0#t#s t#s#r
589
Como t 3→ U (t)H 2 Ψ é fortemente contínua, podemos inverter a ordem de integração na

integral dupla (como está representado esquematicamente nos gráficos acima). Logo,
$ r $ s $ r $ r $ r
2 2
ds dt U (t)H Ψ = dt ds U (t)H Ψ = dt (r − t)U (t)H 2 Ψ .
0 0 0 t 0
Com isto, a Eq.(8.5.4) fica da seguinte forma:

$ r
i 1
U (r)Ψ − Ψ = − rHΨ − 2 dt (r − t)U (t)H 2 Ψ .
# # 0
Consequentemente,
$ r
#. / 1 2# r
∥HΨ∥ # ∥U (r)Ψ∥ + ∥Ψ∥ + dt (r − t)∥U (t)H 2 Ψ∥ = ∥Ψ∥ + ∥H 2 Ψ∥ .
r r# 0 r 2#
Elevando ao quadrado os dois lados, obtemos que
4#2 r2
∥HΨ∥2 # ∥Ψ∥ 2
+ 2∥Ψ∥∥H 2
Ψ∥ + ∥H 2 Ψ∥2 . (8.5.5)
r2 4#2
O valor mínimo para o lado direito da desigualdade acima ocorre para o instante de tempo
r = 2#∥Ψ∥1/2 ∥H 2 Ψ∥−1/2 .15 Assim, inserindo este valor de r na Eq.(8.5.5), obtemos que
∥HΨ∥2 # 4 ∥H 2Ψ∥∥Ψ∥, como queríamos provar.
Nota 8.10. A Proposição 8.4 apareceu no artigo de Daniel H.T. Franco e Lázaro S. Lima, “A
Simple Application of the Time Evolution Operator in the Solution of a Paradox in Quantum
Mechanics,” Quantum Stud.: Math. Found. 5 (2018) 273. Ela é uma adaptação, para o presente
caso, de uma desigualdade conhecida na literatura como Desigualdade de Landau-Kolmogorov-
Kallman-Rota (veja, por exemplo, K.-J. Engel & R. Nagel, “One-Parameter Semigroups for Linear
Evolution Equations,” Springer-Verlag, 2000, Cap. II, pg.59 e E. Hille, “Methods in Classical and
Functional Analysis,” Addison-Wesley, 1972, Cap. 5, pg.167).
Retornando ao paradoxo, de acordo com a Proposição 8.4, se Ψ ∈ Dom(H 2 ) e H 2 Ψ = 0,

então,
H necessariamente, devemos ter HΨ = 0. Mas isto não é respeitado pela função Ψ(x) =
H 0 # x # ℓ. Conclusão: Ψ ∈ Dom(H), mas Ψ
30/ℓ 5 x(ℓ − x), com / Dom(H 2 )! Embora
∈
a função Ψ(x) = 30/ℓ 5 x(ℓ − x) seja quase igual à função, Φ1 ,16 o estado fundamental,
ela não pode, em qualquer instante de tempo, representar um estado da partícula quântica
confinada no poço de potencial infinito.
Nota 8.11 (Algumas observações sobre o paradoxo). De acordo com a discussão feita neste
capítulo, na teoria quântica, temos duas maneiras de determinar a evolução temporal de um
sistema com um hamiltoniano auto-adjunto H. A primeira consiste em resolver o problema de
Cauchy para a equação de Schrödinger
∂Ψ
i# = HΨ , ∀ Ψ ∈ Dom(H) e t ∈ R ,
∂t
15
Observe que, claramente, o parâmetro r tem unidade de tempo!
16
Na verdade, a função Ψ é quase igual ao estado fundamental, Φ1 , visto que |a1 |2 = 0, 998555 . . .! Assim,
como seria de esperar, a energia associada com o estado representado por Ψ é muito próximo de E1 . De fato, o
valor é ligeiramente superior devido à mistura dos estados excitados.
590
com os dados iniciais fornecidos

5
5
Ψ5 = Ψ0 ,
t=0
em que Ψ0 ∈ Dom(H). Esse caminho não é universal; ele requer que o estado inicial e a
evolução do estado no tempo pertençam ao domínio Dom(H) do hamiltoniano. Nos casos
em que a equação de Schrödinger tem a forma de equações diferenciais parciais, esse requisito
significa que uma solução do problema de Cauchy é buscada sob certas condições de contorno
especificando o hamiltoniano auto-adjunto, caso contrário, a solução do problema de Cauchy
não será única (lembre-se que quando a solução é única o problema de Cauchy é chamado
bem-posto). A segunda forma consiste em avaliar o operador de evolução unitária
U (t, t0 ) = e−i(t−t0 )H/# ,
e, em seguida, aplicá-lo ao estado inicial. Esta forma é universal, é aplicável a qualquer estado
inicial porque o operador U (t, t0 ) é limitado e definido em todo o espaço de Hilbert H , o
estado Ψ(t)
Ψ(t) = e−i(t−t0 )H/# Ψ0 (t0 ) ,
sempre existe, e a evolução do estado no tempo é unitária.
O operador de evolução unitária U (t, t0 ) determina uma lei de evolução integral, que é
global, enquanto que a equação de Schrödinger determina uma lei de evolução diferencial, que
é local. A equação de Schrödinger pode convencionalmente ser derivada de uma lei de evolução
integral, diferenciando a última com respeito ao tempo t. Mas, de acordo com o Teorema
8.6, a derivada i dUdt(t)Ψ = HU (t)Ψ = U (t)HΨ existe se, e somente se, o estado inicial
(e então também o estado Ψ(t) = e−i(t−t0 )H/# Ψ0 (t0 )) pertencer ao domínio Dom(H). Em
outras palavras, a derivada i dUdt(t) do operador de evolução existe e é igual a HU (t) apenas
no domínio Dom(H) do hamiltoniano H. E mais, a diferenciação sucessiva do operador
de evolução temporal implica também que Ψ0 (t0 ) deve pertencer aos domínios de todas as
potências de H. No entanto, os conjuntos Dom(H n ) decrescem à medida que n;cresce. Por
sua vez, as Eqs.(8.5.2) e (8.5.3) aplicadas ao exemplo acima, indicam que se Ψ = ∞ n=1 an Φn ,
em que Φn é um sistema; ortonormalizado completo de auto-vetores de H, então, a condição
∥HΨ∥2 = ∥HΨ(t)∥2 = ∞ 2
n=1 |an |E < ∞ deve ser respeitada pela função Ψ(t) dada pela
Eq.(8.5.2) para que a equação de Schrödinger seja satisfeita. Portanto, para um hamiltoniano H
independente do tempo a simples aplicação da Proposição 8.4 esclarece o paradoxo: somente
certas combinações lineares das auto-funções de H produzem funções Ψ’s que pertencem ao
domínio de H 2 .
Gostaríamos de finalizar a discussão acima citando uma frase do renomado físico-matemático

Arthur S. Wightman:17 “. . . você pode argumentar que toda esta conversa extravagante da mate-
mática tem pouco interesse para a física. Mas, existe uma resposta precisa e elegante para esta
argumentação: para quais funções de onda o hamiltoniano de Schrödinger está definido? ” Pense
nisso!
17
A. S. Wightman,“The Usefulness of a General Theory of Quantized Fields,” em Conceptual Foundations of
Quantum Field Theory, Ed. Tian Yu Cao, pg.41, 1999.
591
8.6 Irreversibilidade e Reversibilidade de Processos Físicos

Iniciamos este capítulo afirmando que o Teorema de Stone é essencial para a descrição da
evolução temporal de sistemas quânticos conservativos e reversíveis; mais especificamente, o
teorema é fundamental para o estudo da dinâmica de sistemas quânticos fechados com um
número finito de partículas. Entretanto, deve-se ressaltar, o Teorema de Stone não é insuficiente
para o estudo da dinâmica de sistemas quânticos abertos (tal como um gás quântico no grand
canonical ensemble). Para o estudo de tais sistemas abertos, um resultado fundamental é o
Teorema de Hille-Yosida. Vamos finalizar este capítulo tentado colocar em bases sólidas estas
afirmações. Seguiremos o texto de E. Zeidler, “Applied Functional Analysis. Applications to
Mathematical Physics,” Vol. 108, Springer, 1995.
Seja H um espaço de Hilbert. Consideramos os elementos Ψ ∈ H como “estados” de um

sistema físico.
(i) Processos reversíveis na Natureza. Seja T = {T (t)}t∈R um grupo uni-paramétrico, em

que t é o tempo. Toda função Ψ = Ψ(t) dada através de Ψ(t) = T (t)Ψ0 para todo t ∈ R
e Ψ0 fixo é chamado de processo possível do sistema. Dizemos que o sistema está no estado
Ψ(t) no instante t. Em particular, como T (0) = 1I, o estado Ψ0 corresponde ao “estado inicial”
do sistema no instante t = 0. Segue-se da propriedade de grupo T (t + t0 ) = T (t)T (t0 ) para
todo t, t0 ∈ R que Ψ(t + t0 ) = T (t)Ψ(t0 ). Isso permite a seguinte interpretação:
Causalidade Forte. O estado do sistema Ψ(t0 ) em um instante fixo t0 determina exclusiva-

mente todos os estados do sistema no futuro t > t0 e no passado t < t0 .
Homogeneidade no tempo. Se t 3→ Ψ(t) é um possível processo do sistema físico, então,

o processo t 3→ Ψ(t + t0 ) é também possível para t0 ∈ R fixo.
A transformação t 3→ t + t0 a corresponde a uma translação de tempo. Isto significa que

dado dois observadores O1 e O2 , que realizam dois experimentos que correspondem a processos
físicos possíveis, então, se O1 obtém como resultado de uma mediação o estado Ψ0 no tempo
t = 0, enquanto que medição de O2 dá como resultado o estado Ψ0 no tempo t = t0 , segue
que eles observam o mesmo processo, desde que O2 mude seu relógio substituindo o tempo
inicial t0 pelo tempo t = 0.
Além disso, a propriedade de grupo nos diz que T (t)T (−t) = T (−t)T (t) = T (0) = 1I para
todo t ∈ R. Assim, obtemos que o operador T (t) : H → H é bijetivo e T −1 (t) = T (−t)
para todo t ∈ R. Portanto, Ψ(−t) = T −1 (t)Ψ0 . Isto nos leva à seguinte interpretação:
Reversibilidade. Se t 3→ Ψ(t) é um processo possível de um sistema fí sico, então, o

processo reverso t 3→ Ψ(−t) também é possível.
Consequentemente, grupos uni-paramétricos T descrevem processos reversíveis na Natureza,

por exemplo, processos em que não ocorram dissipação de energia. Se o grupo uni-paramétrico
T é fortemente contínuo, então, cada processo possível Ψ = Ψ(t) depende continuamente do
tempo t para todo t ∈ R. Por sua vez, um grupo uni-paramétrico fortemente contínuo de ope-
radores unitários reflete a conservação de energia de processos ondulatórios ou a conservação
592
de probabilidade de processos quânticos.
(ii) Processos irreversíveis na Natureza. Seja T = {T (t)}t"0 um semi-grupo uni-paramétrico,

em que t é o tempo. Toda função Ψ = Ψ(t) dada através de Ψ(t) = T (t)Ψ0 para todo t ∈ R
e Ψ0 fixo é chamado de processo possível do sistema. Em contraste com um grupo uni-
paramétrico, tal processo é definido apenas para instantes de tempo t " 0, e a condição de
reversibilidade não se aplica. Semi-grupos descrevem processos irreversíveis; por exemplo, o
crescimento de um ser humano é irreversível. Segue-se da propriedade de semi-grupo T (t +
t0 ) = T (t)T (t0 ) para todo t " 0 e t0 " 0 fixo que Ψ(t + t0 ) = T (t)Ψ(t0 ). Isso permite a
seguinte interpretação:
Causalidade Forte. O estado do sistema Ψ(t0 ) em um instante fixo t0 determina exclusiva-

mente todos os estados do sistema no futuro t > t0 .
Homogeneidade no tempo. Se t 3→ Ψ(t) é um possível processo do sistema físico, então,

o processo t 3→ Ψ(t + t0 ) é possível para todo t " 0 e t0 " 0 fixo.
593
Capítulo 9
O Teorema de Stone e as Simetrias na
Mecânica Quântica
“Symmetry is what we see at a glance; based on the fact that there is no reason for any difference. . .”
B. Pascal
No capítulo anterior, exploramos o papel desempenhado pelo Teorema de Stone na existência

da dinâmica quântica. Em particular, vimos que o Teorema de Stone fornece uma correspon-
dência um-para-um entre grupos unitários e operadores auto-adjuntos. A unitariedade preserva
normas (= probabilidades) e produtos escalares (= amplitudes de transição) e pode, portanto,
ser interpretada em termos de procedimentos experimentais: do ponto de vista da física, é o
conceito mais fundamental. O papel proeminente da auto-adjunção para os observáveis deve-
se à sua correspondência com grupos unitários. Neste capítulo continuaremos explorando o
Teorema de Stone e sua importância no estudo das simetrias contínuas na teoria quântica.
Mostraremos que entre outras aplicações matemáticas importantes desse teorema está a teoria
da representação de grupos de Lie. Em outras palavras, mostraremos que um grupo unitário
fortemente contínuo nada mais é do que uma representação unitária de um grupo de Lie G.
Neste caso, uma representação unitária U de G em um espaço de Hilbert H é um homomor-
fismo g 3→ U (g) de G no grupo unitário de operadores atuando em H tal que U (e) = 1I
e tal que o mapa g 3→ U (g) de G em H é contínuo para cada vetor Ψ ∈ H . Portanto, se
G é um grupo de Lie relacionado a uma simetria contínua de um sistema quântico, então, um
grupo unitário contínuo estará sempre associado a cada elemento da álgebra de Lie de G, com
os geradores desses grupos sendo operadores auto-adjuntos, interpretados como observáveis que
representam os elementos da álgebra de Lie.
595
O Teorema de Stone e as Simetrias na Mecânica Quântica
9.1 Simetrias
A palavra simetria1 na Grécia antiga era sinônimo de algo bem proporcionado, bem equili-
brado e, portanto, estava relacionado com o antigo conceito de beleza. Mais tarde, o conceito de
simetria adquiriu um outro significado, mais restrito, que é exatamente o mais importante para
a ciência: diz-se que um sistema possui uma simetria sob uma operação se ele é invariante sob
essa operação.
O fato de alguns processos na Natureza apresentarem certas simetrias, nos leva a supor que
as simetrias estejam relacionadas com certas leis da Natureza. No caso da mecânica quântica as
simetrias são descritas por grupos de transformações que preservam as suas estruturas essenci-
ais. Esses grupos desempenham um papel fundamental no estudo das propriedades do sistema
quântico e revelam aspectos fundamentais da teoria que não estão presentes nem na dinâ-
mica envolvida, nem nas interações. Simetrias relacionadas com a estrutura do espaço-tempo,
denominadas “simetrias externas” (responsáveis, por exemplo, pela conservação da energia e
do momentum linear), “simetrias internas” (responsáveis, por exemplo, por governar como as
partículas podem mudar de “identidade”), o estudo dos estados invariantes ou simetrias quebra-
das espontaneamente são ingredientes padrão na descrição das teorias quânticas. Em muitos
casos, os números quânticos, ou regras de superseleção, são caracterizados por representações
de grupos de simetria.
Qualquer sistema quântico pode, em princípio, ser investigado por diferentes indivíduos, e
cada um deve, eventualmente, converter seus resultados observacionais para uma descrição
do sistema ao longo das linhas já discutidas: um espaço de Hilbert deve ser escolhido para
descrever os estados puros, e certos operadores devem ser associados com os observáveis, etc.
Naturalmente, exige-se que tudo isso permita uma tradução para a linguagem de um outro
indivíduo, ou equipe, que tenha observado o mesmo objeto, de tal forma que os resultados
estejam de pleno acordo. Por exemplo, se movemos ou giramos o nosso referencial de laboratório
isso não deve alterar as leis da Natureza observadas no laboratório. Isto não significa que uma
transformação de simetria não muda os estados físicos, mas apenas que os novos estados após
uma transformação de simetria deverão satisfazer as mesmas leis da Natureza como os outros
estados. Em particular, a probabilidade de transição entre qualquer par de estados deve ser a
mesma para dois observadores.
Portanto, simetria e invariância são sinônimo na física; o primeiro conceito está relacionado
com as estruturas intrínsecas da Natureza, enquanto o último está relacionado com a forma
matemática das equações de movimento. Como consequência disso, somos capazes de encontrar
quantidades que são conservadas. Assim, uma cadeia lógica pode ser estabelecida:
princípio de simetria ⇒ invariância da teoria ⇒ lei de conservação .
9.2 Grupos de Lie: Transformações Contínuas

Em um famoso artigo,2 Wigner mostrou que qualquer transformação de simetria de um
sistema quântico preservando as probabilidades de transição entre dois estados deve ser im-
1
Em grego, σνµµϵτ ρια!
2
E.P. Wigner, “On Unitary Representations of the Inhomogeneous Lorentz Group,” Ann. Math. 40 (1939), 149-204.
596
plementada por um operador semi-unitário (isto é, por um operador unitário ou anti-unitário).

Neste caso, a ação de um grupo de simetria G sobre um sistema é implementada por uma
representação semi-unitária de G no espaço de Hilbert físico. Uma vez que os principais
exemplos de simetrias considerados nesta seção serão implementados em termos de operadores
unitários, vamos restringir aqui a este caso.3 Lembre-se que, de acordo com o Teorema de
Stone, os geradores infinitesimais associados com operadores unitários de simetria devem ser
auto-adjuntos.
Na mecânica quântica, em muitos casos, os grupos de simetrias de um sistema são grupos

contínuos, isto é, grupos parametrizados por um ou mais parâmetros reais que variam con-
tinuamente. Mais precisamente, uma simetria contínua é representada por um Grupo de Lie
G, isto é, por uma variedade diferenciável munida com uma estrutura de grupo, de tal forma
que as operações de multiplicação de grupo e inversão são suaves, ou seja, diferenciáveis. A
diferenciabilidade nos permite desenvolver o conceito de gerador e reduzir o estudo do grupo
inteiro a um estudo dos elementos do grupo na vizinhança do elemento identidade. A ideia
essencial de Lie era estudar elementos R em um grupo G que estivessem infinitesimalmente
próximos ao elemento identidade de G.
Seja G um grupo de Lie, cujos elementos g(t) têm uma dependência contínua do parâmetro
t ∈ R. Então, os elementos g(t) têm uma lei de composição simples:
g1 (t)g2 (t) = g3 (t) e g(0) = e ,
em que e é o elemento identidade de G. Os elementos R infinitesimalmente próximos ao

elemento identidade de G são definidos da seguinte forma:
5
dg(t) 55
R = −i 5 .
dt 5
t=0
Uma representação unitária U de G sobre um espaço de Hilbert H é um homomorfismo

g 3→ U (g(t)) = e−iGt de G no grupo de operadores unitários que atuam em H , em que G
são os geradores infinitesimais. Isto implica que
. / . / . /
U g1 (t) U g2 (t) = e−iG1 t e−iG2 t = e−i(G1 +G2 )t = U g1 (t)g2 (t)
. /
= e−iG3 t = U g3 (t)
e
. /
U g(0) = 1I .
O mapeamento g 3→ U (g(t))Ψ de G em H é contínuo para cada vetor Ψ ∈ H . Enquanto
G é o gerador de um grupo contínuo uni-paramétrico pelo Teorema de Stone, e e−iGt é o
equivalente a esse grupo uni-paramétrico no grupo de Lie. O mapeamento g 3→ U (g(t))Ψ de
G em H diz que esses dois grupos são mapeados um no outro pela representação g.
3
A representação anti-unitária de uma simetria aparece em aplicações relacionadas com os grupos discretos de
simetria, como a simetria de reversão do tempo e, ou simetria de paridade.
597
Nota 9.1. Na álgebra abstrata, um homomorfismo é um mapeamento de preservação da estrutura

entre duas estruturas algébricas (como grupos, anéis, ou espaços vetoriais). Em particular, na
teoria de grupos um homomorfismo é um mapeamento que preserva a estrutura do grupo, isto
é, dados dois grupos (G, ∗) e (H, ·), um homomorfismo de grupo de (G, ∗) para (H, ·) é uma
função h : G → H tal que para todo u e v em G temos que
h(u ∗ v) = h(u) · h(v) ,
em que o grupo de operação no lado esquerdo da equação é aquele de G e no lado direito

aquele de H. A partir desta propriedade, pode-se deduzir que h mapeia o elemento identidade
eG de G no elemento identidade eH de H, e mapeia também inversos em inversos, no sentido
de que
. /−1
h(u−1 ) = h(u) .
Portanto, pode-se dizer que h “é compatível com a estrutura do grupo.”
9.2.1 Translações Espaciais
Uma translação espacial é um exemplo muito simples de um mapeamento unitário. Inicial-

mente, vamos considerar o caso de uma partícula, sem spin, no espaço de Hilbert de estados
da partícula H = L2 (R3 ).
Assuma que os observadores parametrizam o espaço por coordenadas transladadas x e

x = x + ta, em que a é um vetor em R3 , fixado arbitrariamente, e t ∈ R. Uma vez que os
′
observadores estão investigando a mesma partícula, é natural assumir que eles descrevam seu
estado por funções de quadrado integrável Ψ e Ψ′ que estão relacionadas por Ψ′ (x′ ) = Ψ(x),
ou equivalentemente por
. /
Ua (t)Ψ (x) = Ψ(x + ta) , ∀ x ∈ R3 . (9.2.1)
Ou seja, o operador de translação Ua (t) desloca a função Ψ(x) ∈ L2 (R3 ) para a esquerda por
uma quantidade ta.
PROPOSIÇÃO 9.1. Sejam H = L2 (R3 ) e Ua (t) o operador de translação definido pela Eq.(9.2.1).
Então, Ua (t) é um grupo unitário uni-paramétrico fortemente contínuo.
Demonstração. Primeiro vamos provar que Ua (t) é unitário. Com efeito, para Ψ, Φ ∈ L2 (R3 ),
temos
$ ∞
[ . /\
Φ, Ua (t)Ψ = dx Φ(x)Ψ(x + ta)
−∞
$ ∞
= dx Φ(x − ta)Ψ(x)
−∞
[. / \
= U−a (t)Φ , Ψ .
Aqui, fizemos a troca de variáveis x + ta → x. Logo, Ua∗ (t) = U−a (t); por outro lado, Ua (t)
tem inverso dado por Ua−1 (t) = U−a (t). Portanto, Ua (t) é unitário, já que Ua−1 (t) = Ua∗ (t).
598
Para provar que Ua (t) é fortemente contínuo, tome uma função Φ em C0∞ (R3 ). A prova
vai usar um argumento-ε/3. Com efeito, como C0∞ (R3 ) é denso em L2 (R3 ), então, é sempre
possível encontrar um ε > 0 tal que para Ψ ∈ L2 (R3 ) temos ∥Φ − Ψ∥L (R3 ) # ε/3. Escolha
?. / ? 2
um δ tal que ? Ua (t)Φ − Φ? 3 < ε/3 quando |t| < δ. Então, dados t, s ∈ R tais que
L2 (R )
|t − s| < δ, obtemos
?. / . /? ?. / . /? ?. / . /?
? Ua (t)Ψ − Ua (s)Ψ ? # ? Ua (t)Ψ − Ua (t)Φ ? + ? Ua (t)Φ − Ua (s)Φ ?
?. / . /?
+ ? Ua (s)Φ − Ua (s)Ψ ?
?. /? ? 8. / 9?
= ? Ua (t)(Ψ − Φ) ? + ?Ua (s) Ua (t − s)Φ − Φ ?
?. /?
+ ? Ua (s)(Φ − Ψ) ?
Agora, lembre-se que Ua (t) e Ua (s) são operadores unitários e, portanto, preservam a norma.
Assim, podemos concluir que cada termo da última linha da equação acima é menor do que
ε/3. Isto prova a proposição.
Uma vez que mostramos que uma translação constitui um grupo unitário uni-paramétrico
fortemente contínuo, pelo Teorema de Stone existe um gerador infinitesimal auto-adjunto A, tal
que Ua (t) = eita·A .
PROPOSIÇÃO 9.2. O operadores momenta lineares Pj , j = 1, 2, 3, são os geradores infinitesimais

do grupo das translações.
Demonstração. Queremos mostrar que os geradores infinitesimais de Ua (t) são os operadores

Pj , j = 1, 2, 3, obtidos tomando-se o seguinte limite:
i Ψ(xj + taj ) − Ψ(xj )

Pj Ψ(x) = lim , (9.2.2)
# t→0 taj
com Dom(Pj ) sendo o conjunto de todos os Ψ ∈ H = L2 (R3 ) para os quais o limite (9.2.2)
existe. A ideia é explorar o conceito de tripleto de Gel’fand. Para isso, considere Ψ(x + tax )
uma translação na direção do eixo e1 por uma quantidade ax e assuma que o limite à direita
da Eq.(9.2.2) existe. Vamos denotar este limite por Φ ∈ L2 (R3 ). Seja Θ ∈ C0∞ (R3 ). Então,
uma vez que C0∞ (R3 ) é um subespaço denso de L2 (R3 ), seu dual D ′ (R3 ) contém o dual de
L2 (R3 ), que é o próprio L2 (R3 ). Além disso, a função Φ ∈ L2 (R3 ) define uma distribuição
TΦ ∈ D ′ (R3 ) da seguinte forma:
TΦ : C0∞ (R3 ) −→ C ,
$
Θ 3−→ TΦ (Θ) = dx Φ(x)Θ(x) = ⟨Φ, Θ⟩ , ∀ Θ ∈ C0∞ (R3 ) .
Logo, no sentido das distribuições

O P O P
Ψ(x + tax ) − Ψ(x) Θ(x − tax ) − Θ(x)
⟨Φ, Θ⟩ = lim , Θ = lim Ψ, .
t→0 tax t→0 tax
599
Os geradores infinitesimais do grupo das translações são obtidos considerando-se elementos

próximos do operador identidade 1I, isto é, considerando-se valores pequenos de t. Assim,
expandindo Θ(x − tax ) em uma série de Taylor, segue que
5
∂Θ 55
Θ(x − tax ) = Θ(x) − tax 5 + O(t2 ) .
∂x 5
t=0
Portanto, uma vez que Θ ∈ C0∞ (R3 ), obtemos que ponto a ponto
Θ(x − tax ) − Θ(x) ∂Θ

lim =− ,
t→0 tax ∂x
lembrando que estamos tomando as derivadas em t = 0. No sentido das distribuições, o limite

ponto a ponto acima implica que
O P O P
∂Θ ∂Ψ
⟨Φ, Θ⟩ = − Ψ, = ,Θ ,
∂x ∂x
para todo Θ ∈ C0∞ (R3 ). Logo, no sentido de derivadas fracas
Ψ(x + tax ) − Ψ(x) ∂Ψ

lim =Φ= , (9.2.3)
t→0 tax ∂x
ou seja, Φ e ∂Ψ/∂x são a mesma distribuição, isto é, o mesmo elemento de L2 (R3 ). Con-
sequentemente, identificamos o gerador infinitesimal de uma translação na direção do eixo e1
como sendo , -
i ∂Ψ i
−i# = Px Ψ(x) ,
# ∂x #
com seu domínio sendo todas as funções para as quais, no sentido das distribuições, existe o
limite em (9.2.3) e que estão novamente em L2 (R2 ). A análise é a mesma para as translações na
direção dos eixos e2 e e3 . Assim, os geradores infinitesimais do grupo unitário uni-paramétrico
das translações são os operadores Pj .
De acordo com o teorema acima, podemos afirmar que o domínio de P pode ser definido
com sendo
b . / c
U a (t)Ψ (x) − Ψ(x)
Dom(P ) = Ψ ∈ L2 (R3 ) | lim existe e está em L2 (R3 ) ,
t→0 t
isto é, é um subconjunto das funções fracamente diferenciáveis em L2 (R3 ).

Nota 9.2 (Exemplos 4.11, 4.12 e 4.13 revisitados). Com a ajuda do Teorema de Stone podemos
reexaminar, de um ponto de vista físico, os Exemplos 4.11, 4.12 e 4.13 analisados no Capítulo
4. Comecemos tentando entender o porque que o operador momentum não é auto-adjunto
quando consideramos a situação que descreve uma partícula confinada à semi-reta (0, ∞)
por uma barreira de potencial infinitamente alta em x = 0. Para isto, considere o operador
momentum
d
P = −i# ,
dx
600
que é (apenas) simétrico sobre o domínio

3 4
Dom(P ) = Ψ ∈ L2 (0, ∞) | P Ψ ∈ L2 (0, ∞), Ψ(0) = 0 .
Já vimos no Capítulo 4 que o operador momentum sobre o sem-eixo R+ não tem qualquer
extensão auto-adjunta. Assim, a exponenciação de P , U (a) = e−iaP não pode definir um
operador unitário, uma vez que
,$ ∞ -1/2 ,$ ∞ -1/2 ,$ ∞ -1/2
2 2 2
∥U (a)Ψ∥2 = dx |Ψ(x − a)| = dx |Ψ(x)| ̸= dx |Ψ(x)| .
0 −a 0
Portanto, ao operarmos com o operador U (a) = e−iaP sobre a função de onda Ψ perdemos a
normalização e, assim, a unitariedade. Em outras palavras, a translação da coordenada x para
a direita nunca levará a função de onda Ψ além de um ponto final à direita. Por outro lado,
ao considerarmos translações para a esquerda nos deparamos com uma barreira de potencial
infinitamente alta na origem e a função Ψ deve se anular neste ponto. No entanto, a função de
onda Ψ não pode simplesmente desaparecer, porque se não U (a) não seria unitário. Portanto,
ela deveria reaparecer no ∞, em um intervalo de tempo finito, para conservar a probabilidade.
Mas isto, mesmo para a teoria quântica, é impossível! Logo, P não pode ser auto-adjunto e
nem possuir extensões auto-adjuntas em L2 (0, ∞). Dessa forma, U (a) = e−iaP não pode
definir um operador unitário em L2 (0, ∞). Por outro lado, isso também explica porque P já
é essencialmente auto-adjunto em L2 (−∞, ∞). Com efeito, como, agora, é possível transladar
livremente a função de onda Ψ para ambos os lados em R, o gerador de infinitesimal de
translações está bem posto, isto é,
,$ ∞ -1/2 ,$ ∞ -1/2
2 2
∥U (a)Ψ∥2 = dx |Ψ(x − a)| = dx |Ψ(x)| = ∥Ψ∥2 .
−∞ −∞
Logo, U (a) = e−iaP define um operador unitário e a probabilidade é conservada em L2 (−∞, ∞).
Finalmente, no caso do intervalo limitado [0, 1], o operador momentum em L2 ([0, 1]) não pode
ser auto-adjunta pelo seguinte motivo: se fosse, geraria um grupo uni-paramétrico representado
pelo operador U (a). Suponha que Ψ seja uma função (digamos contínua) com suporte no su-
bintervalo [α, β] ⊂ [0, 1]. Então, Ψ não pode fornecer informação suficiente para nos dizer se
ela é um elemento de L2 ([0, 1]) ou de L2 (R). Portanto, para valores suficientemente pequenos
de |a| (dependendo do suporte de Ψ), devemos ter U (a)Ψ(x) = Ψ(x − a). Agora, o que
acontece quando o suporte de Ψ(x − a) cruza o ponto 1? Usando o mesmo raciocínio do caso
o operador P em L2 (0, ∞), a função Ψ não pode simplesmente desaparecer, pois então U (a)
não seria unitário. Portanto, ela deve reaparecer em 0. Mas, deve reaparecer como ela mesmo,
com um sinal de menos ou sendo multiplicada por eiθ , por algum θ? Qualquer escolha desse
tipo estaria OK, mas isso não é determinado pelo operador P sozinho. Algumas “condições
de fronteira” devem ser especificadas. Em outras palavras, suponha que Ψ ∈ C0∞ (0, 1). Um
exemplo de tal função é
⎧ 6 7
⎨ exp − 1 − 1 se α#x#β
α−x β−x
Ψ(x) = .
⎩ 0 se x # α < 0 , x " β > 1
Se a > 1 − β parte do pacote de onda, Ψ(x), “desaparece” além do barreira infinita à direita.
Para conservar a probabilidade é necessário que o que desaparece à direita reapareça à esquerda.
601
É evidente que a fase da função Ψ pode ser alterada fazendo com que Ψ reapareça à esquerda.
Além disso, qualquer função deve experimentar a mesma mudança de fase. Assim, se Ψ1 e Ψ2
são duas dessas funções e se suas mudanças de fase são diferentes, digamos θ1 e θ2 , então a
translação da função Ψ = Ψ1 + Ψ2 eventualmente produziria a função Ψ′ = eiθ1 Ψ1 + eiθ2 Ψ2 .
Isto implicaria que
,$ 1 -1/2 ,$ 1 -1/2
2 2
∥U (a)Ψ∥2 = dx |Ψ(x − a)| ̸= dx |Ψ(x)| = ∥Ψ∥2 ,
0 0
a menos que θ1 = θ2 . Assim, o princípio da superposição limita o número de parâmetros de

mudança de fase a um único parâmetro. No entanto, cada fase eiθ corresponde a um tipo
distinto de translação e, portanto, a uma extensão auto-adjunta diferente de P e, como vimos,
existem uma infinidade delas!
9.2.2 Rotações Espaciais
Queremos descrever rotações em R3 . Elas são descritas pelo grupo ortogonal especial SO(3),
composto por todas as matrizes 3 × 3 com determinate 1.4 Como se sabe, para toda rotação em
R3 pode-se encontrar um eixo que passa através da origem e que deixa invariante a rotação.
Então, escolhendo-se os eixos corretos, o problema se reduz ao estudo de uma rotação em
R2 . De fato, para todo eixo que passa através da origem, existe associado um grupo unitário
uni-paramétrico fortemente contínuo que descreve todas as rotações entorno desse eixo, com
o parâmetro sendo o ângulo. Além disso, podemos descrever uma rotação geral qualquer pela
composição de todas as rotações através de cada um dos eixos e1 , e2 e e3 . Essa rotação geral
é chamada Rotação de Euler, e os três parâmetros associados ângulos de Euler. É importante
enfatizar que, enquanto as rotações através de um eixo comutam, a composição de todas as
rotações entorno de cada um dos eixos e1 , e2 e e3 , em geral não comutam.
Rotações entorno dos eixos e1 , e2 e e3 são representadas pelas seguintes matrizes 3 × 3,

respectivamente:
⎛ ⎞ ⎛ ⎞
1 0 0 cos β 0 − sin β
⎜ ⎟ ⎜ ⎟
M1 (ϕ) = ⎜
⎝0 cos ϕ sin ϕ ⎟
⎠ , M2 (β) = ⎜ 0
⎝ 1 0 ⎟ ,
⎠
0 − sin ϕ cos ϕ sin β 0 cos β
⎛ ⎞
cos θ sin θ 0
⎜ ⎟
M3 (θ) = ⎜
⎝− sin θ cos θ 0 ⎟ .
⎠
0 0 1
Os geradores infinitesimais do grupo SO(3) são obtidos considerando-se elementos próximos

da identidade, neste caso a matriz identidade 1I3×3 . Logo, para valores pequenos de ϕ, β e θ,
4
Isto descreve o que, fisicamente, chamamos de rotações próprias. Se permitimos que o determinante seja −1,
então incluímos as rotações impróprias, ou reflexões. Na Física das Partículas Elementares uma rotação imprópria
está relacionada com uma transformação denominada “Transformação de Paridade.”
602
temos as seguintes expansões de M1 (ϕ), M2 (β) e M3 (θ), próximas à matriz identidade 1I3×3 ,
respectivamente:
M1 (ϕ) = 1I3×3 + iϕJ1 + O(ϕ2 ) ,
M2 (β) = 1I3×3 + iβJ2 + O(β 2 ) ,
M3 (θ) = 1I3×3 + iθJ2 + O(θ2 ) ,
em que
⎛ ⎞ ⎛ ⎞
5 00 0 5 0 0 −1
dM1 (ϕ) 55 ⎜ ⎟ 5 ⎜ ⎟
⎟ , iJ2 = dM2 (β) 55 = ⎜0 0 0 ⎟ ,
iJ1 = 5 =⎜
⎝ 0 0 1⎠ ⎝ ⎠
dϕ 5 dβ 5
ϕ=0 β=0
0 −1 0 1 0 0
⎛ ⎞
5 0 1 0
dM3 (θ) 55 ⎜ ⎟
iJ3 = 5 =⎜
⎝−1 0 0 ⎟ .
⎠
dθ 5
θ=0
0 0 0
Consequentemente, os geradores infinitesimais Ji são representados pelas matrizes

⎛ ⎞ ⎛ ⎞ ⎛ ⎞
0 0 0 0 0 i 0 −i 0
⎜ ⎟ ⎜ ⎟ ⎜ ⎟
J1 = ⎜ ⎟ ⎜ ⎟
⎝0 0 −i⎠ , J2 = ⎝ 0 0 0⎠ , J3 = ⎝ i 0 0⎠ .
⎜ ⎟
0 i 0 −i 0 0 0 0 0
Note que as matrizes Ji são hermitianas. Elas satisfazem as seguintes regras de comutação:
8 9
Ji , Jj = iεijk Jk ,
em que
⎧
⎪
⎪ +1 se (i, j, k) é uma permutação par de (1, 2, 3)
⎨
εijk = −1 se (i, j, k) é uma permutação ímpar de (1, 2, 3) . (9.2.4)
⎪
⎪
⎩
0 se pelo menos dois dos índices (i, j, k) forem iguais
PROPOSIÇÃO 9.3. Cada rotação entorno dos eixos e1 , e2 e e3 é representada por um operador
unitário uni-paramétrico fortemente contínuo.
Demonstração. Primeiro, note que podemos exponenciar facilmente os geradores Ji para obter
operadores Ui (ϕ) = eiϕJi , com i = 1, 2, 3. A ação desses operadores é definida da seguinte
forma: . /
Ui (ϕ)Ψ (x) = Ψ(Mi (ϕ)x) , ∀ Ψ ∈ L2 (R3 ) .
603
Ele gira a função Ψ em entorno do eixo ei por um ângulo de ϕ. Note que o operador de
rotação é unitário para todo ϕ uma vez que é uma isometria. Com efeito,
$ $
? ?2 5 52 5 52
?Ui (ϕ)Ψ? = d x 5Ui (ϕ)Ψ5 =
2
d2 x 5Ψ(Mi (ϕ)x)5
R2 R2
$
5 55 52
= d2 y 5det(Mi−1 (ϕ))55Ψ(y)5
R2 B CD E
=1
$
5 52 ? ?2
= d2 y 5Ψ(y)5 = ?Ψ? .
R2
Aqui, fizemos a troca de variáveis x → y = Mi (ϕ)x. Além disso, o operador de rotação é uma
bijeção, isto é,
. / . /. /
Ui (−ϕ)Ui (ϕ)Ψ (x) = Ui (−ϕ)Ψ Mi (ϕ)x
. /
= Ψ Mi (−ϕ)Mi (ϕ)x
= Ψ(x)
. /
= Ui (ϕ)Ui (−ϕ)Ψ (x) .
Consequentemente,
. / . /. /
Ui (θ)Ui (ϕ)Ψ (x) = Ui (θ)Ψ Mi (ϕ)x
. /
= Ψ Mi (θ)Mi (ϕ)x
. /
= Ψ Mi (θ + ϕ)x
. /
= Ui (θ + ϕ)Ψ (x) .
Aqui, usamos a propriedade bem conhecida que Mi (θ)Mi (ϕ) = Mi (θ + ϕ), que pode ser
facilmente demonstrada usando-se teoremas de adição trigonométricas. Então, se pudermos
mostrar que ϕ 3→ Ui (ϕ) é fortemente contínuo, nós mostramos que o operador Ui (ϕ) forma
um grupo unitário uni-paramétrico fortemente contínuo. Para isso, precisamos mostrar que
Ui (ϕ)Ψ → Ψ em L2 (R3 ) quando ϕ → 0 para todo Ψ ∈ L2 (R3 ). Como as rotações são
limitadas (com norma 1) será suficiente mostra que Ui (ϕ)Ψ → Ψ quando ϕ → 0 para todo
Ψ ∈ C0∞ (R3 ). Vamos usar o fato que toda função em C0∞ (R3 ) é lipschitziana.5 Desse fato,
segue que
?. / ?
? Ui (ϕ)Ψ − Ψ? = ∥Ψ(Mi (ϕ)x) − Ψ(x)∥ # C ∥Mi (ϕ)x − x∥ .
Como Ψ tem suporte compacto, existe um r > 0 tal que supp Ψ ⊆ B(0; r). Assim,
∥Mi (ϕ)x − x∥ # rϕ. Para ϕ muito pequeno, podemos escolher ϕ < ε/Cr. Logo, obte-
mos que
?. / ?
? Ui (ϕ)Ψ − Ψ? = ∥Ψ(Mi (ϕ)x) − Ψ(x)∥ < ε .
Portanto, o grupo das rotações é fortemente contínuo.

5
Veja o nota de página na página 147.
604
A seguir provaremos que os geradores infinitesimais das rotaçãoes são os operadores de

momentum angular.
9.2.2.1 Quantização do Momentum Angular Classicamente, o momento angular pode ser

pensado como o gerador infinitesimal das rotações. O momento angular é um conceito particu-
larmente útil quando um sistema tem simetria de rotação, uma vez que, nesse caso, o momento
angular é uma quantidade conservada. Na mecânica quântica, o momento angular é ainda o
“gerador” das rotações, o que significa que é o gerador infinitesimal de um grupo unitário de
operadores de rotação, no sentido do Teorema de Stone. O momento angular quantizado é no-
vamente conservado em sistemas com simetria rotacional. Isto significa que se o hamiltoniano
H é invariante sob rotações, então H comuta com os operadores de momento angular, isto
é, os operadores de momento angular são constantes do movimento no sentido da mecânica
quântica.
Vamos considerar o momento angular de um sistema de partículas. Para simplificar a

discussão, vamos somente tratar o caso de uma única partícula no espaço R3 . Lembre-se que
o momento angular clássico é definido pela expressão ℓ = r × p, em que r = (x1 , x2 , x3 ) é o
vetor posição da partícula e p = (p1 , p2 , p3 ) é seu momento linear.
As componentes ℓ1 , ℓ2 , ℓ3 do momento angular são dadas por

3 <
< 3
ℓi = εijk xj pk , i = 1, 2, 3 , (9.2.5)
j=1 k=1
em que εijk é dado pela Eq.(9.2.4).
Calculando o colchete de Poisson {ℓ1 , ℓ2 }, obtemos
<3 , - < 3 < 3 < 3

∂ℓ1 ∂ℓ2 ∂ℓ1 ∂ℓ2
{ℓ1 , ℓ2 } = − = (ε1qk ε2jq xj pk − ε1jq ε2qk xj pk )
q=1
∂xq ∂pq ∂pq ∂xq q=1 k=1 j=1
= (ε132 ε213 x1 p2 − ε123 ε231 x2 p1 )
= (x1 p2 − x2 p1 )
= ℓ3
Da mesma forma obtemos que {ℓ2 , ℓ3 } = ℓ1 e {ℓ3 , ℓ1 } = ℓ2 . Logo, as componentes ℓ1 , ℓ2 , ℓ3

do momento angular respeitam a álgebra de Lie de SO(3). Como veremos na próxima seção,
entender o momento angular do ponto de vista de representações de uma álgebra de Lie
também nos prepara para compreender o conceito de spin de uma partícula.
Nosso próximo passo é quantizar o sistema acima. Para isso, devemos obter operadores
L1 , L2 , L3 associados às componentes ℓ1 , ℓ2 , ℓ3 do momento angular. O colchete de Poisson
deve ser substituído por comutadores. Devido à Eq.(9.2.5), consideramos que
3 <
< 3 3 <
< 3
∂
Li = εijk Xj Pk = −i# εijk xj . (9.2.6)
j=1 k=1 j=1 k=1
∂xk
605
;3
LEMA 9.1. [Li , Lj ] = i# k=1 εijk Lk , em que i, j, k = 1, 2, 3.
Demonstração. Vamos usar as relações de comutação de Heisenberg

[Xi , Xj ] = [Pi , Pj ] = 0 , [Xi , Pj ] = i#δij 1I
e as seguintes identidades:
[AB, C] = A[B, C] + [A, C]B , [C, AB] = [C, A]B + A[C, B] ,
e
3
<
εijk εiℓm = δjℓ δkm − δjm δkℓ .
i=1
Logo,
3 <
< 3 <
3 <
3
[Li , Lj ] = εikℓ εjmn [Xk Pℓ , Xm Pn ]
k=1 ℓ=1 m=1 n=1
3 <
< 3 <
3 <
3 3 4
= εikℓ εjmn Xk [Pℓ , Xm Pn ] + [Xk , Xm Pn ]Pℓ
k=1 ℓ=1 m=1 n=1
3 <
< 3 <
3 <
3 3
= εikℓ εjmn Xk [Pℓ , Xm ]Pn + Xk Xm [Pℓ , Pn ]
k=1 ℓ=1 m=1 n=1
4
+ [Xk , Xm ]Pn Pℓ + Xm [Xk , Pn ]Pℓ
3 <
< 3 <
3 <
3 3 4
= εikℓ εjmn −i#δℓm Xk Pn + i#δkn Xm Pℓ
k=1 ℓ=1 m=1 n=1
3 <
< 3 < 3 3
3 < 4
= i# −εikℓ εjmn δℓm Xk Pn + εikℓ εjmn δkn Xm Pℓ .
k=1 ℓ=1 m=1 n=1
Trocando ℓ ↔ n e k ↔ m no primeiro termo da última linha, então

3 <
< 3 <
3 < 3 3 4
[Li , Lj ] = i# −εimn εjkℓ δnk + εikℓ εjmn δkn Xm Pℓ
k=1 ℓ=1 m=1 n=1
3 <
< 3 3
3 < 4
= i# −εimk εjkℓ + εikℓ εjmk Xm Pℓ
k=1 ℓ=1 m=1
3 <
< 3 3
3 < 4
= i# εkim εkjℓ − εkiℓ εkjm Xm Pℓ
k=1 ℓ=1 m=1
3 3
3 <
< 4
= i# δij δmℓ − δiℓ δmj − δij δℓm + δim δℓj Xm Pℓ
ℓ=1 m=1
. /
= i# Xi Pj − Xj Pi .
606
Tomando i = 1 e j = 2, segue que

. /
[L1 , L2 ] = i# X1 P2 − X2 P1 = i#L3 .
Da mesma forma, pode-se mostrar que [L2 , L3 ] = i#L1 e [L3 , L1 ] = i#L2 . Assim, podemos
concluir que
3
<
[Li , Lj ] = i# εijk Lk , em que i, j, k = 1, 2, 3 . (9.2.7)
k=1
Note que podemos pensar o processo de quantização do momento angular como dando
origem à uma representação da álgebra de Lie de SO(3) para operadores auto-adjuntos atuando
em algum espaço de Hilbert, com os geradores sendo mapeados em operadores Li satisfazendo
a relação (9.2.7).
A seguir, estaremos interessados na propriedade espectral dos operadores Li . Para isso, será
conveniente considerar o operador
3
<
2
L = Li Li .
i=1
Como Li é auto-adjunto (provaremos isso mais adiante), Li Li é um operador positivo.6 Conse-

quentemente, L2 sendo a soma de operadores positivos, também é positivo.
LEMA 9.2. O operador L2 comuta com cada operador Li .
Demonstração. Vamos usar novamente a identidade [AB, C] = A[B, C] + [A, C]B. Logo,
3
< 3 6
< 7 < 3 6
3 < 7
[Li Li , Lj ] = Li [Li , Lj ] + [Li , Lj ]Li = εijk Li Lk + εijk Lk Li
i=1 i=1 i=1 k=1
3 6
3 <
< 7
= εijk Li Lk + εkji Li Lk
i=1 k=1
3 6
3 <
< 7
= εijk Li Lk − εijk Li Lk
i=1 k=1
=0.
Observe que, da segunda igualdade da primeira para a segunda linha, trocamos k ↔ i no

segundo termo da soma, enquanto que da segunda para a terceira linha usamos a propriedade
de permutação dos índices i, j, k do tensor εijk .
6
Lembre-se que, um operador positivo em um espaço de Hilbert é um operador linear A para o qual vale
⟨Ψ, AΨ⟩ " 0. Se A é auto-adjunto, sabemos que ⟨Ψ, AΨ⟩ ⊂ R e, portanto, ⟨Ψ, AAΨ⟩ = ⟨AΨ, AΨ⟩ ⊂ [0, ∞).
607
O Lema 9.2 mostra que L2 comuta com todos os elementos da álgebra de Lie gerada pelos
operadores Li ; por isso L2 é chamado operador de Casimir da álgebra gerada pelos operadores
momentum angular. Portanto, L2 deve ser um múltiplo da identidade: L2 = β1I, para algum
β " 0 (lembre-se que L2 é um operador positivo). A possibilidade de que β = 0 pode ser
descartada, já que isso indicaria que a representação seria trivial. Assim, podemos assumir que
β > 0.
LEMA 9.3. Os operadores Li , com i = 1, 2, 3, são limitados.
Demonstração. Isto segue facilmente a partir do fato que os operadores L2i , com i = 1, 2, 3, são
2 2
operadores positivos e do fato que
√ L √ " Li . Isto por sua vez mostra que o espectro de cada
Li está contido no intervalo [− β, β], e, por conseguinte, os operadores Li , com i = 1, 2, 3,
são limitados.
PROPOSIÇÃO 9.4. Os operadores Li são auto-adjuntos.
Demonstração. Isto é uma consequência direta do Teorema 5.5 e do Lema 9.3.
Agora considere o grupo unitário uni-paramétrico das rotações

(Ui (ϕ)Ψ)(x) = Ψ(Mi (ϕ)x) , i = 1, 2, 3, ,
com Mi (ϕ) representando a matriz de rotação entorno do eixo ei por um ângulo de ϕ.
TEOREMA 9.1. Os operadores momenta angulares Li são os geradores infinitesimais do grupo
das rotações.
Demonstração. Com efeito, a prova é análoga à prova do Proposição 9.2. Isto é, queremos
mostrar que os geradores infinitesimais de Ui (ϕ) são os operadores Li dados por
i Ψ(Mi (ϕ)x) − Ψ(x)
Li Ψ(x) = lim , (9.2.8)
# ϕ→0 ϕ
com Dom(Li ) sendo o conjunto de todos os Ψ ∈ H = L2 (R3 ) para os quais o limite (9.2.8)
existe, recorrendo-se mais uma vez ao conceito do tripleto de Gel’fand. Para isso, tome M3 (ϕ)
a matriz de rotação entorno do eixo e3 por um ângulo de ϕ e assuma que o limite à direita
da Eq.(9.2.2) existe. Vamos denotar este limite por Φ ∈ L2 (R3 ). Seja Θ ∈ C0∞ (R3 ). Então,
uma vez que C0∞ (R3 ) é um subespaço denso de L2 (R3 ), seu dual D ′ (R3 ) contém o dual de
L2 (R3 ), que é o próprio L2 (R3 ). Além disso, a função Φ ∈ L2 (R3 ) define uma distribuição
TΦ ∈ D ′ (R3 ) da seguinte forma:
TΦ : C0∞ (R3 ) −→ C ,
$
Θ 3−→ TΦ (Θ) = dx Φ(x)Θ(x) = ⟨Φ, Θ⟩ , ∀ Θ ∈ C0∞ (R3 ) .

O P O P
Ψ(M3 (ϕ)x) − Ψ(x) Θ(M3 (−ϕ)x) − Θ(x)
⟨Φ, Θ⟩ = lim , Θ = lim Ψ, .
ϕ→0 ϕ ϕ→0 ϕ
608
Por outro lado,
Θ(M3 (−ϕ)x) = Θ(x1 cos ϕ + x2 sin ϕ, −x1 sin ϕ + x2 cos ϕ, x3 ) .
Os geradores infinitesimais do grupo SO(3) são obtidos considerando-se elementos próximos

da identidade, neste caso a matriz identidade 1I3×3 ; isto é, considerando-se valores pequenos
de ϕ. Assim,
Θ(M3 (−ϕ)x) = Θ(x1 + x2 ϕ, −x1 ϕ + x2 , x3 ) .
Expandindo a expressão acima em uma série de Taylor, segue que
5 5
∂Θ 55 ∂Θ 55
Θ(x1 + x2 ϕ, −x1 ϕ + x2 , x3 ) = Θ(x1 , x2 , x3 ) + ϕx2 5 − ϕx1 5 + O(ϕ2 ) .
∂x1 5 ∂x2 5
ϕ=0 ϕ=0
Portanto, uma vez que Θ ∈ C0∞ (R3 ), obtemos que ponto a ponto
Θ(x1 + x2 ϕ, −x1 ϕ + x2 , x3 ) − Θ(x1 , x2 , x3 ) ∂Θ ∂Θ
lim = x2 − x1 ,
ϕ→0 ϕ ∂x1 ∂x2
lembrando que estamos tomando as derivadas em ϕ = 0. No sentido das distribuições, o limite
O , -P O, - P
∂Θ ∂Θ ∂Ψ ∂Ψ
⟨Φ, Θ⟩ = − Ψ, x2 − x1 = x2 − x1 ,Θ ,
∂x1 ∂x2 ∂x1 ∂x2
para todo Θ ∈ C0∞ (R3 ). Logo, no sentido de derivadas fracas
Ψ(M3 (ϕ)x) − Ψ(x) ∂Ψ ∂Ψ
lim = Φ = x2 − x1 , (9.2.9)
ϕ→0 ϕ ∂x1 ∂x2
. /
ou seja, Φ e x2 ∂Ψ/∂x1 − x1 ∂Ψ/∂x2 são a mesma distribuição, isto é, o mesmo elemento
de L2 (R3 ). Consequentemente, identificamos o gerador infinitesimal de uma rotação entorno
do eixo e3 como sendo
, -
i ∂Ψ ∂Ψ i
−i#x2 + i#x1 = L3 Ψ(x) ,
# ∂x1 ∂x2 #
com seu domínio sendo todas as funções para as quais existe o limite em (9.2.9) e que estão
novamente em L2 (R2 ). A análise é a mesma para as rotações entorno dos eixos e1 e e2 . Assim,
os geradores infinitesimais do grupo unitário uni-paramétrico das rotações são os operadores
Li .
A exponenciação de Li produz a representação de SO(3) sobre H = L2 (R3 ) dada por

uma rotação em R3 ; isto é,
Ui (ϕ) = eiϕLi /# ,
é o elemento do grupo representando uma rotação por um ângulo ϕ entorno do eixo ei . Ainda,
visto que ∥ei2πLi /# Ψ∥ = ∥Ψ∥ (lembre-se que um operador unitário preserva a norma), podemos
inferir que ei2πLi /# é um múltiplo da identidade (uma fase); em outras palavras,
ei2πLi /# = eiθ 1I .
Esta igualdade nos permite provar o seguinte
609
LEMA 9.4. Os operadores Li têm espectro discreto.
Demonstração. Vamos considerar o grupo uni-paramétrico de operadores unitários dados por
U (t) = eitLi /#−itθ/2π = eitΦ , ∀ t ∈ [0, 2π] ,
em que
def. 1 θ
Φ = Li − 1I .
# 2π
Novamente, lembre-se que U (t) satisfaz uma equação diferencial do tipo Schrödinger
∂
i# U (t) = ΦU (t) = U (t)Φ .
∂t
Logo, para qualquer auto-função Ψ0 do operador Li ,7 temos que
dU (t)
i# Ψ0 = U (t)ΦΨ0 ,
dt
em que Ψ0 = Ψ0 (t0 ), com t0 arbitrário, porém fixo. Disso, segue que
,$ s - ,$ s -
i
dU (t) Ψ0 = − dt U (t)Φ Ψ0 .
0 # 0
Desenvolvendo a equação acima, obtemos que

,$ s -
i itΦ
U (s)Ψ0 − Ψ0 = − dt e Φ Ψ0
# 0
,$ s -
i itλ
=− dt e λ Ψ0
# 0
i
= − (eisλ − 1I)Ψ0 .
#
Note que, U (s)Ψ0 − Ψ0 → 0 quando s → 2π. Consequentemente, σ(Φ) ⊆ Z; isso, por sua
vez, implica que #, - %
θ
σ(Li ) ⊆ n+ #|n∈Z .
2π
Podemos descrever o espectro de cada Li mais explicitamente. Vamos fazer isso para i = 3.8
Tome α ∈ σ(L3 ) e Ψ um auto-vetor, com auto-valor α. Como os operadores L3 e L2 comutam,
Ψ também é auto-vetor de L2 . Então, tome β ∈ σ(L2 ) e redefina Ψ como Ψβ,α , em que os
subscritos α e β fazem menção os auto-valores de L2 e L3 , respectivamente. Logo, iremos
7
Naturalmente Ψ0 ∈ Dom(Li ).
8
Não existe nenhuma razão especial para isso; poderíamos ter escolhido i = 1, ou i = 2.
610
denotar a ação dos operadores L3 e L2 sobre o espaço H = L2 (R3 ) através das seguintes
regras:
L3 Ψβ,α (x) = α#Ψβ,α(x) ,
L2 Ψβ,α (x) = β#2 Ψβ,α (x) .

Além disso, vamos introduzir os seguintes operadores limitados: L± = L1 ± iL2 .9 Então,
usando os Lemas 9.1 e 9.2, obtemos as seguintes relações de comutação:
(i)
[L3 , L± ] = [L3 , (L1 ± iL2 )]
= [L3 , L1 ] ± i[L3 , L2 ]
= i#L2 ± i(−i)#L1
= ±#(L1 ± iL2 )
= ±#L± ,
(ii)
[L+ , L− ] = [(L1 + iL2 ), (L1 − iL2 )]
= i[L2 , L1 ] − i[L1 , L2 ]
= i(−i)#L3 − i(i)#L3
= 2#L3 ,
(iii)
[L2 , L± ] = [L2 , (L1 ± iL2 )]
= i[L2 , L1 ] ± i[L2 , L2 ] = 0 .
Note que, para Ψβ,α ∈ Dom(L3 ), temos que

L2 (L± Ψβ,α (x)) = L± (L2 Ψβ,α (x)) = #2 βL± Ψβ,α (x) ,
L3 (L± Ψβ,α (x)) = L± (L3 Ψβ,α (x)) ± #L± Ψβ,α (x) (9.2.10)
= #(α ± 1)L± Ψβ,α (x) .

Portanto, os estados L± Ψβ,α são auto-estados dos operadores L2 e L3 , respectivamente. Em
particular, o operador L3 tem seus auto-valores, associados aos estados L± Ψβ,α , aumentado ou
diminuído de uma unidade. Além disso, como L2 pode ser re-escrito na forma
1. /
L2 = L+ L− + L− L+ + L23 ,
2
9
Note que, os operadores L± não auto-adjuntos.
611
as regras de comutação (i), (ii) e (iii) nos permite escrever

L− L+ = L2 − L3 (L3 + #) , L+ L− = L2 − L3 (L3 − #) .
Usando essas igualdades, obtemos que
. /
L− L+ Ψβ,α (x) = β − α(α + 1) #2 Ψβ,α (x) ,
. /
L+ L− Ψβ,α (x) = β − α(α − 1) #2 Ψβ,α (x) ,
em que Ψβ,α ∈ Dom(L3 ). Ainda, como (L± )∗ = L∓ , segue que o quadrado da norma dos
vetores L± Ψβ,α (x) é
? ? . /
?L± Ψβ,α (x)?2 = β − α(α ± 1) #2 , (9.2.11)
que deve ser maior ou igual a zero, por definição. Como, de acordo com o Lema 9.3, α tem
um valor máximo, αmax , e um valor mínimo, αmin , devem existir estados Ψβ,αmax e Ψβ,αmin tais
que
L+ Ψβ,αmax (x) = 0 , se, e somente se, β = αmax (αmax + 1) ,
L− Ψβ,αmin (x) = 0 , se, e somente se, β = αmin (αmin − 1) .

Consequentemente, devemos ter
αmin (αmin − 1) = αmax (αmax + 1) ,
ou seja αmin = −αmax e −αmax # α # αmax .
Note que, podemos obter o estado Ψβ,αmin depois de n aplicações sucessivas do operador
L− ao estado Ψβ,αmax . Logo,
αmax = αmin + n ,
e como αmin = −αmax , inferimos que
n
αmax = .
2
Portanto, αmax pode ser um inteiro, ou um semi-inteiro, dependendo se n é par ou ímpar.
Convenciona-se usar a notação ℓ e m para αmax e α, respectivamente. Portanto, os auto-

valores do operador L2 são dados por
β = ℓ(ℓ + 1) .
Assim, temos
−ℓ # m # ℓ .
o que significa que para cada ℓ existem 2ℓ + 1 valores de m.
Resumindo, a ação dos operadores L3 e L2 sobre o espaço H = L2 (R3 ) pode ser re-escrita
da seguinte forma:
L3 Ψℓ,m (x) = m#Ψℓ,m (x) ,
L2 Ψℓ,m (x) = ℓ(ℓ + 1)#2 Ψℓ,m (x) , (9.2.12)
612
existindo um inteiro positivo n tal que

! "
σ(L3 ) = m# | m = −n, . . . , −1, 0, 1, . . . , n , (9.2.13)
ou
#, - %
1
σ(L3 ) = m+ # | m = −n, . . . , −1, 0, 1, . . . , n . (9.2.14)
2
Ainda,
! "
σ(L2 ) = ℓ(ℓ + 1)#2 | ℓ = 0, 1/2, 1, 3/2 . . . . (9.2.15)
Como ficará claro logo abaixo, a segunda possibilidade para o espectro do operador L3 será
descartada quando introduzirmos os harmônicos esféricos associados às funções de Legendre.
Entretanto, a expressão (9.2.14) ainda é importante: ela está associada com o espectro dos
operadores de momento angular de spin S1 , S2 , S3 . Eles surgem a partir de representações
unitárias do grupo de Lie SU(2).
Finalmente, com a ajuda da Eq.(9.2.11), podemos escrever

H
L± Ψℓm (x) = ℓ(ℓ + 1) − m(m ± 1)#Ψℓm±1 (x)
H
= (ℓ ∓ m)(ℓ ± m + 1)#Ψℓm±1 (x) .
ℓ(ℓ + 1) − m(m + 1) = ℓ2 + ℓ − m2 − m
= (ℓ2 − m2 ) + (ℓ − m)
= (ℓ + m)(ℓ − m) + (ℓ − m)
= (ℓ − m)(ℓ + m + 1) .
O mesmo raciocínio se aplica para mostrar que
ℓ(ℓ + 1) − m(m − 1) = (ℓ + m)(ℓ − m + 1) .
Como as rotações só agem sobre as variáveis angulares, sendo independentes do raio, pode-
mos definir a ação dos geradores das rotações sobre H = L2 (S 2 ), em que
! "
S 2 = (x, y, z) ∈ R3 | x2 + y 2 + z 2 = 1 ,
é a equação da esfera de raio unitário. Portanto, estaremos interessados em resolver os seguintes

problemas de auto-valores, no espaço de Hilbert H = L2 (S 2 ):
L3 Yℓm = m#Yℓm , L2 Yℓm = ℓ(ℓ + 1)#2 Yℓm ,
em que m e ℓ(ℓ + 1) são números reais. Lembre-se que, como L2 é um operador positivo,
devemos ter ℓ(ℓ + 1) " 0. Será conveniente escrever L3 e L± em coordenadas esféricas.
613
Para isto, vamos relembrar brevemente algumas propriedades relacionadas à esse sistema de
coordenadas.
Em um sistema de coordenadas esféricas, a localização de um ponto P é especificado por

três quantidades r, θ, ϕ como mostra a Figura 9.1.
er
eϕ
P
eθ
r cos θ
r
θ
y
ϕ r sin θ
Figura 9.1: Definição das coordenadas esféricas.
Note que, r representa a distância da origem até o ponto P e, portanto, o módulo do vetor
posição r. Por sua vez, θ é o ângulo formado por r e o eixo-z (positivo) e ϕ é o ângulo formado
pela projeção de r sobre o plano-xy e o eixo-x (positivo). As relações entre as coordenadas
retangulares e as coordenadas esféricas são, como se pode observar
x(r, θ, ϕ) = r cos ϕ sin θ , y(r, θ, ϕ) = r sin ϕ sin θ , z(r, θ, ϕ) = r cos θ ,
de forma que
(x2 + y 2 )1/2 y
r = (x2 + y 2 + z 2 )1/2 , tan θ = , tan ϕ = .
z x
Define-se um conjunto de vetores unitários mutuamente perpendiculares er , eθ e eϕ no

sentido que esses crescem, respectivamente, tal como se mostra na Figura 9.1. Eles satisfazem
as seguintes relações:
er · er = eθ · eθ = eϕ · eϕ = 1
er · eθ = eθ · eϕ = eϕ · er = 0 (9.2.16)
er × eθ = eϕ , eθ × eϕ = er , eϕ × er = eθ .
614
Assim, qualquer vetor A ∈ R3 pode ser escrito em componentes da seguinte forma:
A = Ar er + Aθ eθ + Aϕ eϕ .
Os vetores unitários er , eθ e eϕ estão relacionados com os vetores unitários do sistema de

coordenadas retangulares, ei , ej e ek , da seguinte forma:
er = sin θ cos ϕ ei + sin θ sin ϕ ej + cos θ ek ,
eθ = cos θ cos ϕ ei + cos θ sin ϕ ej − sin θ ek , (9.2.17)
eϕ = − sin ϕ ei + cos ϕ ej .
Portanto, temos
ei = sin θ cos ϕ er + cos θ cos ϕ eθ − sin θ eϕ ,
ej = sin θ sin ϕ er + cos θ sin ϕ eθ + cos θ eϕ ,
ek = cos θ er − sin θ eθ .
Deve-se observar que à medida que a localização de P muda, os três vetores, er , eθ e eϕ

variam. Com efeito, derivando-se (9.2.17), obtemos
∂er ∂er
= eθ , = sin θ eϕ ,
∂θ ∂ϕ
∂eθ ∂eθ
= −er , = cos θ eϕ , (9.2.18)
∂θ ∂ϕ
∂eϕ ∂eϕ
=0, = − sin θ er − cos θ eθ .
∂θ ∂ϕ
O vetor posição no sistema de coordenadas esféricas assume a forma
r = r er ,
com sua diferencial podendo ser obtida diretamente, usando-se (9.2.17) e (9.2.18), isto é,
dr = dr er + r dθ eθ + r sin θ dϕ eϕ . (9.2.19)
Seja u uma quantidade escalar que é função da posição, de maneira que podemos escrever
u = u(r, θ, ϕ). Neste caso, u é chamado campo escalar. Então, em algum outro ponto P ′ que
está deslocado de P por dr, o valor de u mudará para u + du. De fato,
∂u ∂u ∂u
du = dr + dθ + dϕ , (9.2.20)
∂r ∂θ ∂ϕ
615
com as derivadas sendo avaliadas no ponto P , isto é, ∂u/∂r = (∂u/∂r)|P , e assim por diante.
Logo, comparando (9.2.19) e (9.2.20), podemos expressar du como o produto escalar de dr e o
vetor
∂u 1 ∂u 1 ∂u
∇u = er + eθ + e , (9.2.21)
∂r r ∂θ r sin θ ∂ϕ ϕ
em que
∂ 1 ∂ 1 ∂
∇= er + eθ + e ,
∂r r ∂θ r sin θ ∂ϕ ϕ
é o operador gradiente em coordenadas esféricas. Ou seja,
du = ∇u · dr .
Finalmente, levando-se em conta as Eqs.(9.2.16), (9.2.18) e (9.2.21), obtemos

, - , -
2 1 ∂ 2 ∂u 1 ∂ ∂u 1 ∂2u
∇ u= 2 r + 2 sin θ + 2 2 , (9.2.22)
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂ϕ2
em que , - , -
1 ∂
2 2 ∂ 1 ∂ ∂ 1 ∂2
∇ = 2 r + 2 sin θ + 2 2 ,
r ∂r ∂r r sin θ ∂θ ∂θ r sin θ ∂ϕ2
é o operador laplaciano em coordenadas esféricas.
LEMA 9.5. Em coordenadas esféricas os operadores L2 , L3 e L± são dados pelas seguintes ex-
pressões: , , - -
2 2 1 ∂ ∂ 1 ∂2
L = −# sin θ + ,
sin θ ∂θ ∂θ sin2 θ ∂ϕ2
∂
L3 = −i# ,
∂ϕ
e , -
±ϕ ∂ ∂
L± = #e ± + i cot θ .
∂θ ∂ϕ
Demonstração. Vamos começar, pela sequência, provando a expressão para L2 . Partimos com-
putando diretamente a expressão
( 3 < 3
)( 3 < 3
)
< ∂ < ∂
L2 = i# εijk xj i# εimn xm
j=1 k=1
∂xk ℓ=m n=1
∂xn
3 <
< 3 <
3 <
3 , -
2 ∂ ∂
= −# (δjm δkn − δjn δkm ) xj xm
j=1 k=1 ℓ=m n=1
∂x k ∂xn
( 3 3 3 3 3 < 3
)
< ∂ < < ∂ ∂ < ∂ < ∂ ∂
2
= −# xj + xj xj −3 xj − xj xk .
j=1
∂xj j=1 k=1
∂xk ∂xk j=1
∂xj j=1 k=1
∂xj ∂xk
616
Note que o último termo da equação acima pode ser escrito da seguinte forma:
3 <
< 3 <3 3 3
∂ ∂ ∂ < ∂ < ∂
xj xk = xj xk − xj .
j=1 k=1
∂xj ∂xk j=1
∂xj k=1 ∂xk j=1
∂xj
Assim,
( 3 3 < 3 3 3
)
< ∂ < ∂ ∂ < ∂ < ∂
L2 = −#2 − xj + xj xj − xj xk
j=1
∂xj j=1 k=1
∂xk ∂xk j=1
∂xj k=1 ∂xk
6 7
= −#2 −(1 + r · ∇)r · ∇ + r 2 ∇2 .
Levando em conta a ortogonalidade entre os vetores unitários er , eθ e eϕ , então

, -
∂ ∂ ∂ ∂2
(1 + r · ∇)r · ∇ = 1 + r r = 2r + r 2 2
∂r ∂r ∂r ∂r
, -
2 1 ∂ ∂2
=r 2 +
r ∂r ∂r 2
F , -G
2 1 ∂ 2 ∂
=r r .
r 2 ∂r ∂r
Portanto,
# F , -G %
2 2 1 ∂
2 2 ∂ 2 2
L = −# −r r +r ∇
r 2 ∂r ∂r
, , - -
2 1 ∂ ∂ 1 ∂2
= −# sin θ + .
Vamos provar a expressão para L3 . Para isso, primeiro, note que

, -
∂ 1 ∂ 1 ∂
L = −i# r × ∇ = −i# rer × e + e + e
∂r r r ∂θ θ r sin θ ∂ϕ ϕ
, -
∂ 1 ∂
= −i# e − e .
∂θ ϕ sin θ ∂ϕ θ
Por sua vez,
6 7 ,∂ 1 ∂
-
∂
L3 = ek · L = −i# cos θ er − sin θ eθ · eϕ − eθ = −i# .
∂θ sin θ ∂ϕ ∂ϕ
Finalmente, vamos provar as expressões para L± . Primeiro, estabelecemos as expressões

para L1 e L2 , respectivamente.
6 7 ,∂ 1 ∂
-
L1 = ei · L = −i# sin θ cos ϕ er + cos θ cos ϕ eθ − sin θ eϕ · e − e
, -
∂ ∂
= i# sin θ + cot θ cos ϕ ,
∂θ ∂ϕ
617
e
6 7 ,∂ 1 ∂
-
L2 = ej · L = −i# sin θ sin ϕ er + cos θ sin ϕ eθ + cos θ eϕ · e − e
, -
∂ ∂
= i# − cos θ + cot θ sin ϕ ,
∂θ ∂ϕ
Portanto,
F6 7∂ 6 7 G
∂
L± = i# sin ϕ ∓ i cos ϕ + cos ϕ ± i sin ϕ cot θ
∂θ ∂ϕ
, - , -
±iϕ ∂ ±iϕ ∂ ±iϕ ∂ ∂
= i# ∓ie + e cot θ = #e ± + i cot θ .
∂θ ∂ϕ ∂θ ∂ϕ
A prova está completa.
A equação de auto-valores
L3 Yℓm = m#Yℓm ,
em coordenadas esféricas assume a seguinte forma:
∂
Yℓm (θ, ϕ) = imYℓm (θ, ϕ) .
∂ϕ
O método de separação de variáveis

Yℓm (θ, ϕ) = Θℓm (θ)Φm (ϕ) ,
nos leva à seguinte equação
d
Φm (ϕ) = imΦm (ϕ) , (9.2.23)
dϕ
em que Φm (ϕ) é diferenciável e Φm (ϕ) ∈ L2 (S 1 ), com
! "
S 1 = (x, y) ∈ R2 | x2 + y 2 = 1 ,
é a equação do círculo de raio unitário. A solução (já normalizada) da Eq.(9.2.23) é
1
Φm (ϕ) = √ eimϕ ,
2π
em que m ∈ Z. A condição de normalização é determinada exigindo-se que
$ 2π
dϕ |Φm (ϕ)|2 = 1 .
0
Neste ponto, deve-se enfatizar que a unicidade de Φm (ϕ) ao longo do intervalo [0, 2π] exige
que m seja um número inteiro.10 Como já antecipado, isso descarta a possibilidade (9.2.14) do
espectro do operador L3 .
10
Φm (ϕ) deve ser periódica em ϕ, com período 2π, isto é, Φm (ϕ + 2π) = Φm (ϕ).
618
As auto-funções dos operadores auto-adjuntos L3 e L2 são ortonormais, com normalização

adequada, ou seja,
⟨Yℓm (θ, ϕ), Yℓ′m′ (θ, ϕ)⟩ = δℓℓ′ δmm′ .
A forma explícita de Yℓm (θ, ϕ) pode ser encontrada da seguinte forma: a partir da equação
de auto-valores
L2 Yℓm (θ, ϕ) = ℓ(ℓ + 1)#2 Yℓm (θ, ϕ) ,
segue que
, -
#2 ∂2 ∂ 1 ∂2 ℓ(ℓ + 1)#2
−√ + cot θ + Θℓm (θ)eimϕ = √ Θℓm (θ)eimϕ .
2π ∂θ2 ∂θ sin2 θ ∂ϕ2 2π
Por outro lado, da equação de auto-valores
L3 Yℓm (θ, ϕ) = m#Yℓm (θ, ϕ) ,
segue que
∂ ∂2
Yℓm (θ, ϕ) = imYℓm (θ, ϕ) =⇒ 2
Yℓm (θ, ϕ) = −m2 Yℓm (θ, ϕ) .
∂ϕ ∂ϕ
Então, eliminando-se a dependência em ϕ, obtemos que

, 2 -
d d m2
+ cot θ + ℓ(ℓ + 1) − Θℓm (θ) = 0 .
dθ2 dθ sin2 θ
Esta equação é conhecida como a equação diferencial de Legendre. Suas soluções podem ser
expressas em termos das funções de Legendre Pℓm (cos θ):
Θℓm (θ) = Cℓm Pℓm (cos θ) ,
em que
d|m|
Pℓm (cos θ) = (1 − cos2 θ)|m|/2 Pℓ (cos θ) .
d(cos θ)|m|
Isto mostra que

Pℓ−m (cos θ) = Pℓm (cos θ) ,
em que Pℓ (cos θ) é ℓ-nésimo polinômio de Legendre, definido pela fórmula de Rodrigues
1 dℓ
Pℓ (cos θ) = (cos2 θ − 1)ℓ .
2ℓ ℓ! d(cos θ)ℓ
Falta determinarmos Cℓm ; para isso, exigimos que

$ $ $ $
2π π 5 52 |Cℓm |2 2π π 5 52
dϕ dθ sin θ5Yℓm (θ, ϕ)5 = dϕ dθ sin θ5Pℓ (cos θ)5 = 1 .
0 0 2π 0 0
619
Esta relação é conhecida como a condição de normalização dos harmônicos esféricos. Conse-
quentemente, obtemos
M, - b
2ℓ + 1 (ℓ − m)! ℓ"0
Cℓm = (−1)m , .
2 (ℓ + m)! |m| # ℓ
Concluindo, temos que os harmônicos esféricos normalizados são dados pela seguinte ex-
pressão:
M, - b
2ℓ + 1 (ℓ − m)! ℓ"0
Yℓm (θ, ϕ) = (−1)m Pℓ (cos θ)eimϕ , .
2 (ℓ + m)! |m| # ℓ
Isto finaliza a prova da quantização do momentum angular!
9.2.3 Transformações de Escala
Uma outra operação simples que podemos considerar é a transformação de escala. Claro
que ela tem de ser definida de uma maneira que seja unitária.
Uma transformação de escala sobre R é o mapeamento x 3→ eλ x, λ ∈ R que induz o

operador Us (λ) : H → H ,
/
(Us (λ)Ψ (x) = eλ/2 Ψ(eλ x) , Ψ∈H . (9.2.24)
Naturalmente,
/ . /
(Us (µ)Us (λ)Ψ (x) = eµ/2 eλ/2 Ψ eµ (eλ x)
= e(µ+λ)/2 Ψ(e(µ+λ) x)
/
= (Us (µ + λ)Ψ (x) , Ψ∈H .
Além disso, Us (λ) é unitário. Com efeito, para Ψ, Φ ∈ L2 (R3 ), temos

$ ∞
[ . /\
Φ, Us (λ)Ψ = dx Φ(x)eλ/2 Ψ(eλ x)
−∞
$ ∞
= dx e−λ/2 Φ(e−λ x)Ψ(x)
−∞
[. / \
= Us (−λ)Φ , Ψ .
Aqui, fizemos a troca de variáveis eλ x → x. Logo, Us∗ (λ) = Us (−λ); por outro lado, Us (λ)
tem inverso dado por Us−1 (λ) = Us (−λ). Portanto, Us (λ) é unitário, já que Us−1 (λ) =
620
Us∗ (λ). Note que, o operador Us (λ) de fato preserva a norma. Com efeito,
$ ∞
?. /?2 8 9
? Us (λ)Ψ ? = dx Ψ(x)Us−1 (λ) eλ/2 Ψ(eλ x)
−∞
$ ∞
= dx Ψ(x)e−λ/2 eλ/2 Ψ(e−λ (eλ x))
−∞
? ?2
= ?Ψ? .
Logo, resta-nos mostrar que o mapeamento λ 3→ Us (λ) é fortemente contínuo. Primeiro,

note que
?. / ? ? ?
? Us (λ)Ψ − Ψ? = ?eλ/2 Ψ(eλ x) − Ψ(x)?
? ? ? ?
# ?(eλ/2 − 1)Ψ(eλ x)? + ?Ψ(eλ x) − Ψ(x)?
eλ/2 − 1 ? ?
= λ
∥Ψ(x)∥ + ?Ψ(eλ x) − Ψ(x)? .
e
O primeiro termo, obviamente, vai para zero como λ → 0. Por isso, vamos estudar o segundo
termo. Como no caso das rotações, é suficiente mostrar que o segundo termo vai a zero,
quando λ → 0, para todo Ψ ∈ C0∞ (R). Vamos usar novamente o fato que toda função
em C0∞ (R) é lipschitziana. Assim, como Ψ tem suporte compacto, existe um r > 0 tal que
supp Ψ ⊆ B(0; r), e para λ muito pequeno, então
? ? ? ?
?Ψ(eλ x) − Ψ(x)? # C ?eλ x − x? # Cλr < ε .
em que tomamos λ < ε/Cr. Isto conclui a prova da seguinte

PROPOSIÇÃO 9.5. Sejam H = L2 (R3 ) e Us (λ) o operador de transformação de escala definido
pela Eq.(9.2.24). Então, Us (λ) é um grupo unitário uni-paramétrico fortemente contínuo.
Nota 9.3. A versão do grupo das transformações de escala em Rn é dada por
/
(Us (λ)Ψ (x) = enλ/2 Ψ(eλ x) ,
com λ ∈ R e Ψ ∈ L2 (Rn ).
PROPOSIÇÃO 9.6. O gerador infinitesimal do grupo das transformações de escala é o operador
i 1 1! "
Λs = − 1I + XP = X, P ,
2 # 2#
! "
em que X, P = XP + P X é o anti-comutador dos operadores X e P .
Demonstração. Queremos mostrar que o gerador infinitesimal de Us (λ) é o operador Λs , obtido

tomando-se o seguinte limite:
, -
i 1 eλ/2 Ψ(eλ x) − Ψ(x)
i − 1I + XP Ψ(x) = lim , (9.2.25)
2 # λ→0 λ
621
com Dom(Λs ) sendo o conjunto de todos os Ψ ∈ H = L2 (R3 ) para os quais o limite

(9.2.25) existe. Novamente, exploramos o conceito de tripleto de Gel’fand. Para isso, assuma
que o limite à direita da Eq.(9.2.25) existe. Vamos denotar este limite por Φ ∈ L2 (R). Seja
Θ ∈ C0∞ (R). Então, uma vez que C0∞ (R) é um subespaço denso de L2 (R), seu dual D ′ (R)
contém o dual de L2 (R), que é o próprio L2 (R). Além disso, a função Φ ∈ L2 (R) define uma
distribuição TΦ ∈ D ′ (R3 ) da seguinte forma:
TΦ : C0∞ (R) −→ C ,
$
Θ 3−→ TΦ (Θ) = dx Φ(x)Θ(x) = ⟨Φ, Θ⟩ , ∀ Θ ∈ C0∞ (R) .

O λ/2 P O P
e Ψ(eλ x) − Ψ(x) e−λ/2 Θ(e−λ x) − Θ(x)
⟨Φ, Θ⟩ = lim , Θ = lim Ψ, .
λ→0 λ λ→0 λ
O gerador infinitesimal do grupo das transformações de escala é obtido considerando-se ele-
mentos próximos do operador identidade 1I, isto é, considerando-se valores pequenos de λ.
Assim, segue que
5
λ dΘ(x) 5
5
e−λ/2 Θ(e−λ x) = Θ(x) − Θ(x) − λx 5 + O(λ2 ) .
2 dx 5
λ=0
Uma vez que Θ ∈ C0∞ (R) e Us (λ)C0∞ (R) C0∞ (R),

∀ λ ∈ R, obtemos que ponto a ponto
⊂
-,
e−λ/2 Θ(e−λ x) − Θ(x) 1 d
lim =− +x Θ(x) ,
λ→0 λ 2 dx
lembrando que estamos tomando a derivada em λ = 0. No sentido das distribuições, o limite
O , - P O, - P
1 d 1 d
⟨Φ, Θ⟩ = − Ψ, +x Θ = +x Ψ, Θ ,
2 dx 2 dx
para todo Θ ∈ C0∞ (R). Logo, no sentido de derivadas fracas
, -
eλ/2 Ψ(eλ x) − Ψ(x) 1 d
lim =Φ= +x Ψ, (9.2.26)
λ→0 λ 2 dx
ou seja, Φ e (1/2 + xd/dx) Ψ são a mesma distribuição, isto é, o mesmo elemento de L2 (R).
Consequentemente, identificamos o gerador infinitesimal de uma transforma¸ao de escala como
sendo , - , -
1 d i 1
+x Ψ(x) = i − 1I + XP Ψ(x) ,
2 dx 2 #
com seu domínio sendo todas as funções para as quais, no sentido das distribuições, existe
o limite em (9.2.26) e que estão novamente em L2 (R2 ). Finalmente, levando em conta que
−i1I = −#−1 (XP − P X), então
, -
i 1 1 1 1
− 1I + XP Ψ(x) = (P X − XP )Ψ(x) + XP Ψ(x) = (XP + P X)Ψ(x) .
2 # 2# # 2#
Note que, a validade do resultado acima exige que P Ψ ∈ Dom(X) e XΨ ∈ Dom(P ).
622
9.2.4 Transformações de Calibre
O próximo exemplo descreve um tipo diferente de operador unitário. Sabemos que para uma
função Ψ, solução da equação de Schrödinger, |Ψ(x)|2 é interpretado como a densidade de
probabilidade de encontrarmos uma partícula (como o elétron) no ponto x. A função de onda
Ψ não representa uma quantidade mensurável. Isto significa que, de acordo com o primeiro
postulado da mecânica quântica, podemos multiplicar Ψ por uma fase sem mudar a realidade
física. Tal operação é chamada transformação de calibre. Aqui tentaremos descrever os aspectos
particulares que envolvem este tipo de transformação.
Vamos iniciar considerando o caso simples da equação de Schrödinger para uma partícula
livre
#2 2 ∂Ψ
− ∇ Ψ = i# . (9.2.27)
2m ∂t
Esta equação é invariante sob uma mudança de fase constante

Ψ → Ψ′ = eiϑ Ψ . (9.2.28)
A Eq.(9.2.28), com ϑ constante, somente afirma que a fase de Ψ pode ser escolhida arbitra-
riamente e, uma vez escolhida, é a mesma em qualquer ponto do espaço-tempo. Então, nos
fazemos a seguinte pergunta: seria possível termos uma teoria invariante sob transformações de
fase locais, isto é, transformações de fase que dependessem das coordenadas do espaço-tempo?
Para responder esta questão consideramos a seguinte transformação de fase local:
Ψ(t, x) → Ψ′ (t, x) = eiϑ(t,x) Ψ(t, x) . (9.2.29)
Claramente, a Eq.(9.2.27) não é invariante sob a transformação (9.2.29). Se Ψ satisfaz a

Eq.(9.2.27), o mesmo não acontece para Ψ′ . Com efeito,
∇Ψ′ (t, x) = eiϑ(t,x) ∇Ψ(t, x) + ieiϑ(t,x) Ψ(t, x)∇ϑ(t, x) ,
∂ ′ ∂ ∂
Ψ (t, x) = eiϑ(t,x) Ψ(t, x) + ieiϑ(t,x) Ψ(t, x) ϑ(t, x)
∂t ∂t ∂t
os termos extras nas equações acima quebram o caráter covariante da equação de Schrödinger.
Vemos, assim, que a invariância sob uma transformação de fase local não é uma propriedade
compartilhada pela equação de onda da partícula livre. Para recuperarmos a invariância perdida,
a equação de onda da partícula livre deve ser modificada. No entanto, a nova equação não
descreverá mais uma equação de onda de uma partícula livre, mas uma partícula movendo-se
sob a ação de algum campo de força. No caso da Eq.(9.2.27) a invariância sob a transformação
de fase local (9.2.29) é obtida definindo-se novos operadores diferenciais chamados derivadas
covariantes. Eles são definidos da seguinte forma:
∂
D = ∇ − iqA , Dt = + iqϕ . (9.2.30)
∂t
Com os novos operadores diferenciais covariantes a equação de Schrödinger é reescrita da

seguinte forma: , -
# 6 72 ∂
− ∇ − iqA Ψ = i# + iϕ Ψ . (9.2.31)
2m ∂t
623
É uma tarefa fácil checar que a Eq.(9.2.31) é invariante sob a transformação (9.2.29), se os
novos campos introduzidos, A e ϕ, também se transformarem da seguinte forma:
1 1 ∂ϑ
A → A′ = A + ∇ϑ , ϕ → ϕ′ = ϕ − . (9.2.32)
q q ∂t
A Eq.(9.2.31) é exatamente a equação de Schrödinger que descreve a interação de uma

partícula de carga elétrica q com o campo eletromagnético, descrito pelos potenciais vetorial,
A, e escalar, ϕ, respectivamente. A Eq.(9.2.32) representa as transformações de calibre usuais
permitidas para os potenciais eletromagnéticos. Os novos campos de calibre são responsáveis
por carregar a informação da liberdade que temos de escolher arbitrariamente uma fase em
cada ponto do espaço-tempo. Tal princípio é chamado princípio de calibre. Ele nos permite
escrever a equação de onda para uma partícula em interação partindo-se da equação de onda
para a partícula livre.
DEFINIÇÃO 9.1. Seja ϑ uma função mensurável a valores reais sobre R. Define-se U (τ )
. /
U (τ )Ψ (x) = eiτ ϑ(x) Ψ(x) , (9.2.33)
em que x = (t, x). O operador U (τ ) é chamado transformação de calibre local.
PROPOSIÇÃO 9.7. Sejam H = L2 (R3 ) e U (τ ) o operador de transformação de calibre lo-
cal definido pela Eq.(9.2.33). Então, U (τ ) é um grupo unitário uni-paramétrico fortemente
contínuo.
Demonstração. A prova é análoga à prova da Proposição 9.5.

PROPOSIÇÃO 9.8. O operador A definido por
# $ %
5 52
Dom(A) = Ψ ∈ L2 (R) | dx 5ϑ(x)Ψ(x)5 < ∞ ,
R
e
AΨ( · ) = Tϑ Ψ( · ) = ϑ( · )Ψ( · ) ,
é o gerador infinitesimal das transformações de calibre locais
. /
U (τ )Ψ ( · ) = eiτ ϑ( · ) Ψ( · ) .
Demonstração. Novamente, voltamos a olhar para o conjunto das funções Ψ ∈ L2 (R) para o
qual o limite
. /
U (τ )Ψ ( · ) − Ψ( · ) eiτ ϑ( · ) Ψ( · ) − Ψ( · )
−i lim = −i lim = AΨ( · ) ,
τ →0 τ τ →0 τ
existe no sentido L2 . Este será o domínio Dom(A) de A. Naturalmente, se o limite existe, ele
é dado por
. /
U (τ )Ψ ( · ) − Ψ( · )
−i lim = ϑ( · )Ψ( · ) .
τ →0 τ
Por outro lado, um cálculo simples mostra que, para cada função Ψ tal que ϑΨ ∈ L2 (R),
o limite realmente existe. Logo, interpretamos A como sendo o operador de multiplicação
A = Tϑ , maximalmente definido, que atua em uma função Ψ multiplicada ponto a ponto pela
função ϑ.
624
9.3 Teorema de Noether

O teorema de Noether estabelece que toda simetria contínua (isto é, diferenciável) de um
sistema físico está associada à uma lei de conservação correspondente. O teorema foi provado
pela matemática alemã Emmy Noether em 1915 e publicado em 1918. Deve ficar claro que, a
palavra “simetria” aqui se refere mais precisamente à covariância da forma que uma lei física
assume em relação à um grupo de Lie de transformações, que cumpram determinados critérios
técnicos; mais especificamente, a evolução no tempo de um sistema físico permanece constante
ao longo do seu movimento.
A fim de motivar como uma simetria pode ser implementada no nível de operadores ili-
mitados, considere um hamiltoniano auto-adjunto H no espaço de Hilbert H e assuma que
i
U (t) = e− ! tH define um grupo fortemente contínuo a um parâmetro implementando a evo-
lução unitária do sistema quântico. Então, se G é uma simetria de um sistema quântico,
representada pela representação unitária U de G sobre um espaço de Hilbert H , isto é,
g 3→ U (g(λ)) = e−iλG , em que G são os geradores infinitesimais, é natural exigir que
U (g(λ)) e U (t) comutem, ou seja,
U (t)U (g(λ)) = U (g(λ))U (t) , t, λ ∈ R , g ∈ G . (9.3.1)
Recordando que o domínio de H é dado por
b . / c
U (t) − 1I Ψ
Dom(H) = Ψ ∈ H | −i lim existe ,
t→0 t
então, no nível dos geradores de operadores auto-adjuntos a Eq.(9.3.1) implica que

U (g(λ))Dom(H) ⊂ Dom(H) e U (g(λ))HΨ = HU (g(λ))Ψ , Ψ ∈ Dom(H) .
A exigência de que a representação unitária fortemente contínua U (g(λ)) de um grupo de

Lie G comute com a dinâmica do sistema, implica a existência de uma simetria do hamiltoniano
H, ou uma simetria da equação Schrödinger correspondente ao operador H; isto, por sua vez,
implica a existência de quantidades conservadas que não dependem explicitamente do tempo.
Isto faz parte do conteúdo do seguinte
TEOREMA 9.2 (Teorema de Noether). Seja e−iλG uma simetria do operador auto-adjunto H.
Se Ψ ∈ Dom(H), então o valor esperado
i
⟨G⟩Ψ(t) = ⟨Ψ(t), GΨ(t)⟩ = ⟨G⟩Ψ(0) , Ψ(t) = e− ! tH Ψ(0) ,
ou seja, o valor esperado do gerador infinitesimal da simetria é constante com respeito ao tempo.
Demonstração. Como e−iλG é uma simetria do operador auto-adjunto H, então,

i i
e−iλG e− ! tH Ψ(0) = e− ! tH e−iλG Ψ(0) ,
para todo λ e t, com Ψ ∈ Dom(H). Disto, segue que
d 6 −iλG − i tH 7 d 6 − i tH −iλG 7
e e ! Ψ(0) = e ! e Ψ(0) ,
dλ dλ
625
ou,
i i
−iGe−iλG e− ! tH Ψ(0) = −ie− ! tH e−iλG GΨ(0) .
Logo,
6 i
7
e−iλG GΨ(t) − e− ! tH GΨ(0) = 0 .
i
Portanto, GΨ(t) = e− ! tH GΨ(0), para todo t. Isto implica que
i i
⟨G⟩Ψ(t) = ⟨Ψ(t), GΨ(t)⟩ = ⟨e− ! tH Ψ(0), e− ! tH GΨ(0)⟩ = ⟨Ψ(0), GΨ(0)⟩ = ⟨G⟩Ψ(0) .
O teorema está provado.
Nota 9.4. É importante que seja enfatizado que o Teorema de Noether não tem um análogo
para simetrias discretas!
9.4 Corrente de Probabilidade

Na mecânica quântica, a corrente de probabilidade (às vezes chamada de probabilidade de
fluxo) é uma quantidade que descreve o fluxo de probabilidade (ou seja, a probabilidade por
unidade de tempo por unidade de área). Intuitivamente, se representamos a densidade de
probabilidade como um fluido não homogâneo, então, a corrente de probabilidade é a taxa de
fluxo deste fluido. Isso é análogo à corrente de massa na hidrodinâmica e à corrente elétrica
no eletromagnetismo.
. #2 2 /É um vetor real j, definido da seguinte forma: se Ψ ∈ Dom(H), com
HΨ = − 2m ∇ + V Ψ, então
i# . /
j(t, x) = Ψ∇Ψ − ∇Ψ Ψ (t, x) .
2m
A noção de uma corrente de probabilidade é útil na mecânica quântica, pois, associada com
a equação de Schrödinger, ela pode ser usada para derivar uma lei de conservação de uma
quantidade física expressa como uma equação de continuidade, como mostra a seguinte
PROPOSIÇÃO 9.9. Se Ψ ∈ Dom(H), então j satisfaz a equação da continuidade
∂
|Ψ(t, x)|2 = ∇ · j(t, x) = 0 .
∂t
Demonstração. Considere a equação de Schrödinger e sua conjugada complexa

∂Ψ(t, x) #2 2
i# =− ∇ Ψ(t, x) + V (x)Ψ(t, x) , (9.4.1)
∂t 2m
∂Ψ(t, x) #2 2
−i# =− ∇ Ψ(t, x) + V (x)Ψ(t, x) . (9.4.2)
∂t 2m
Então, tomando Ψ(t, x) × (9.4.1) − Ψ(t, x) × (9.4.2), obtemos:
∂ . / i# . /
Ψ(t, x)Ψ(t, x) = − ∇ · Ψ(t, x)∇Ψ(t, x) − ∇Ψ(t, x)Ψ(t, x) .
∂t 2m
Isso prova a proposição.
626
Se considerarmos um volume Ω limitado em R3 , cuja fronteira é uma superfície fechada

“suave” ∂Ω; então, a probabilidade de que a partícula atravesse a fronteira ∂Ω por unidade de
tempo é d |Ψ(t, x)|2 /dt, que, pelo Teorema da Divergência de Gauss, é
$ $
d 2 ∂
dx |Ψ(t, x)| = dx |Ψ(t, x)|2
dt Ω Ω ∂t
$
= dx ∇ · j(t, x)
Ω
$
= ds · j(t, x) .
∂Ω
Portanto, a integral de superfície de j representa a probabilidade de que a partícula atravesse

esta superfície por unidade de tempo. Assim, se j é o vetor unitário normal à superfície de
Ω apontando para o lado de fora, então j · n é a densidade de probabilidade, por unidade de
área, da partícula atravessar essa superfície (de dentro para fora) por unidade de tempo. Isto
corrobora com a interpretação, já anunciada, da densidade de probabilidade de corrente.
627
Capítulo 10
Operadores de Schrödinger
“The two aspects of the study of Schrödinger operators we discuss

are “self-adjointness” and “spectral analysis.” These rather forbidding mathematical terms are really code words for
two important elements of the physics of quantum systems. “Self-adjointness” is equivalent to the unique solvability
of the time-dependent Schrödinger equation iΨ̇ = HΨ for all times. “Spectral analysis” is the abstract study of the
eigenfunctions of H - both discrete and continuous.”
B. Simon
em “An Introduction to the Self-Adjointness and

Spectral Analysis of Schrödinger Operators, ”
Vienna, 10th – 12th June 1976.
Neste capítulo, examinaremos uma parte da teoria dos operadores de Schrödinger H =

H0 + V . Adquirir conhecimento das propriedades fundamentais de H é um problema extrema-
mente importante, mas muito delicado e difícil. Entre as propriedades que analisaremos, cuja
determinação são importantes, estão: a auto-adjunção, o espectro essencial, a caracterização
do espectro discreto, com ênfase no número de estados ligados e nas propriedades de suas
auto-funções. Nesta ordem, iniciamos discutindo o problema da auto-adjunção dos operadores
de Schrödinger. Então, analisamos a questão do espectro desses operadores para uma classe de
potenciais que, virtualmente, acomoda a maioria dos casos de interesse da mecânica quântica.
Analisamos brevemente o problema dos estados ligados e do decaimento das auto-funções.
Exemplos específicos de operadores de Schrödinger em D = 1, 2, 3 são examinados, com des-
taque para o operador de Schrödinger atômico. Também discutimos a estabilidade da matéria,
explorando primeiro o caso simples do átomo do hidrogênio e, então, respondemos a questão
fundamental de quantos elétrons um núcleo atômico pode ligar.
629
10.1 Auto-adjunção dos Operadores de Schrödinger

A aplicação prática do Teorema de Stone dá origem a uma questão matemática importante.
Por exemplo, se Ψ é uma função das coordenadas x1 , x2 , . . . , xn de N-partículas e H é o
habitual hamiltoniano atômico não-relativístico
<N
#2 2
H = H0 + V = − ∇ + V (x1 , x2 , . . . , xn ) ,
i=1
2mi xi
então, sob quais hipóteses impostas sobre V , H0 + V é auto-adjunto? Aqui, estaremos inte-
ressados em analisar essa questão. Existe uma vasta literatura que discute este assunto. Um
aspecto importante aqui diz respeito à invariância da auto-adjunção de H0 sob perturbações.
Com efeito, uma vez que H0 é um operador auto-adjunto, se V for um operador limitado, então
é fácil ver que H0 + V é auto-adjunto no domínio Dom(H0 + V ) = Dom(H0 ). Entretanto,
em muitas situações de interesse o potencial V é um operador ilimitado, e é importante co-
nhecer um critério que garanta a auto-adjunção de H0 + V . Se H0 + V é limitado por baixo,
a extensão de Friedrichs produz uma extensão auto-adjunta H de H0 + V . Por outro lado, em
muitas aplicações, V é limitado em relação a H0 com limite < 1. Neste caso, podemos aplicar
o critério de perturbação de Kato e o Teorema de Kato-Rellich para deduzir que o operador
H0 + V é bem definido e auto-adjunto. Este cenário contempla praticamente todos os casos de
interesse da mecânica quântica.
Para começarmos, primeiro, vamos mostrar que os operadores H0 e V são, separadamente,

operadores auto-adjuntos sobre certos domínios naturais em L2 (Rn ) (veja as Proposições 10.1
e 10.2 abaixo). Neste caso, devemos ter muito cuidado porque os operadores H0 e V podem
ter diferentes domínios. Por isso, devemos primeiro definir o que queremos dizer com soma de
H0 e V . Inicialmente, isto pode ser feito de uma maneira bastante natural da seguinte forma:
assuma que H0 : Dom(H0 ) → H e V : Dom(V ) → H , então a soma H0 + V é o
operador linear com domínio
Dom(H0 + V ) = Dom(H0 ) ∩ Dom(V ) ,
e para cada Ψ ∈ Dom(H0 + V ) temos que
(H0 + V )Ψ = H0 Ψ + V Ψ .
Note que Dom(H0 + V ) é o maior conjunto sobre o qual a soma H0 + V faz sentido e
Dom(H0 + V ) é um espaço vetorial. Assim, para se obter o operador de Schrödinger, H0 + V ,
nós temos que “meramente” dar sentido à soma de dois operadores auto-adjuntos ilimitados.
Esta tarefa, no entanto, torna-se mais difícil do que poderia ser esperado.1 Em particular, se V é
uma função muito singular, então H0 + V pode deixar de ser auto-adjunto, ou essencialmente
auto-adjunto, em qualquer domínio natural. Em particular, vamos examinar quais os critérios
que o operador V deve satisfazer para que o operador de Schrödinger H0 +V seja auto-adjunto,
ou essencialmente auto-adjunto, em algum domínio natural dentro L2 (Rn ).
Vamos estabelecer o domínio natural sobre o qual o operador hamiltoniano livre, H0 , é

auto-adjunto. Existem dois domínios razoáveis para escolher para o operador −∇2 :
1
O que torna esta tarefa tão árdua é o fato de H0 e V serem operadores ilimitados.
630
• como a transformada de Fourier converte ∂/∂xj em multiplicação por ikj , podemos

usar este resultado para obter um domínio natural sobre o qual o operador −∇2 é auto-
adjunto, denominado domínio máximo, no sentido de que ele tenha o maior domínio
possível. Mais precisamente, o domínio máximo do operador −∇2 é definido como
sendo o conjunto
! "
Dommax (−∇2 ) = Ψ ∈ L2 (Rn ) | −∇2 Ψ ∈ L2 (Rn ) no sentido distribucional ,
(10.1.1)
• o outro domínio razoável é denominado domínio mínimo, no sentido de que ele tenha o
menor domínio possível. Ele definido como sendo o conjunto
Dommin (−∇2 ) = C0∞ (Rn ) . (10.1.2)
Nota 10.1. É mais natural considerar o negativo do laplaciano −∇2 , já que, como um operador,
ele não é negativo (veja o Teorema 10.29). Com relação ao domínio máximo do operador
−∇2 , deve ficar claro para o leitor porque se afirmou que −∇2 Ψ ∈ L2 (Rn ) no sentido
das distribuições. Com efeito, as funções que aparecem na mecânica quântica nem sempre
são diferenciáveis no sentido clássico. Por isso, é importante entender o que é uma derivada
distribucional.
5 5
PROPOSIÇÃO 10.1. Denote por Tmax = −∇2 5 e Tmin = −∇2 5 . Então,
Dommax Dom
min
^
(i) Ψ ∈ Dommax (−∇2 ) se, e somente se, ∥k∥2 Ψ(k) ∈ L2 (Rn ) e neste caso
6 7
Tmax Ψ(x) = F −1 ∥k∥2 Ψ(k)^ ;
(ii) Tmax é auto-adjunto;
(iii) Tmin é essencialmente auto-adjunto e TNmin = Tmax .
Demonstração. O item (i) segue imediatamente da fórmula
^
−∇ 2
T = ∥k∥2 T^ ,
que é válida para qualquer distribuição temperada. Pela Proposição 10.2 abaixo, a multiplicação
por ∥k∥2 é auto-adjunta no conjunto
3 4
^
Ψ ∈ L2 (Rn ) | ∥k∥2 Ψ(k) ∈ L2 (Rn ) .
Como F é unitário e Tmax = F −1 ∥k∥2 F , Tmax é auto-adjunto em Dommax .
∗
Para provar que Tmin é essencialmente auto-adjunto basta mostrar que Tmin = Tmax , uma
N ∗∗ ∗
vez que Tmin = Tmin = Tmax . Para isto, assuma que Ψ ∈ Dom(Tmin ). Então,
⟨Ψ, −∇2 Φ⟩ = ⟨Ψ, Tmin Φ⟩ = ⟨Tmin

∗
Ψ, Φ⟩ , ∀ Φ ∈ C0∞ (Rn ) .
631
Portanto, −∇2 Ψ(x) ∈ L2 (Rn ) no sentido das distribuições; assim Ψ ∈ Dommax e

∗
Tmin Ψ(x) = −∇2 Ψ(x) = Tmax Ψ(x) .
Inversamente, suponha que Ψ ∈ Dommax . Então, −∇2 Ψ(x) ∈ L2 (Rn ), de maneira que para
todo Φ ∈ C0∞ (Rn ), segue que
⟨Ψ, −∇2 Φ⟩ = ⟨−∇2 Ψ, Φ⟩ .
∗ ∗
Logo, Ψ ∈ Dom(Tmin ) e Tmin Ψ = −∇2 Ψ.
Nota 10.2. De acordo com o item (i) da Proposição 10.1, o domínio máximo (10.1.1) é equivalente
à condição
! "
Dommax (−∇2 ) = Ψ ∈ L2 (Rn ) | ∥k∥2 Ψ ^ ∈ L2 (Rn ) no sentido das distribuições .
E mais, de acordo com Exemplo 6.17, Dommax (−∇2 ) = H2 (Rn ), que é exatamente o espaço
de Sobolev de ordem 2. Além disso, como o hamiltoniano livre, H0 é auto-adjunto, então são
também auto-adjuntos as potências do hamiltoniano livre, H0m , visto que H0m = F −1 ∥k∥m F .
Assim, o domínio de H0m é o espaço de Sobolev de * ordem 2m. Isto, imediatamente, implica
que um vetor Ψ ∈ L2 (Rn ) está em C ∞ (H0 ) = ∞ m
m=1 Dommax (H0 ) se, e somente se,
Ψ ∈ C ∞ (Rn ) e D α Ψ ∈ L2 (Rn ) para todo α. Neste capítulo, os espaços mais relevantes
são L2 (Rn ) (por motivo já explicado no Capítulo 3) e H1 (Rn ), que consiste de funções de
quadrado integrável, cujas derivadas distribucionais também são funções de quadrado integrável.
Isto se deve aos seguintes fatos óbvios: (i) como já explicado no Capítulo 6, os espaços de
Sobolev H1 (Rn ) e H2 (Rn ) respeitam a inclusão H2 (Rn ) ⊂ H1 (Rn ) e (ii) temos que
$ $ $
2
− dx Ψ(x)∇ Ψ(x) = dx ∇Ψ(x)∇Ψ(x) = dx |∇Ψ(x)|2 . (10.1.3)
Rn Rn Rn
Q;
n
Aqui, ∇Ψ = (∂1 Ψ, . . . , ∂n Ψ) é o gradiente de Ψ e |∇Ψ| = j=1 |∂j Ψ|
2 é o comprimento
euclidiano do gradiente.
Agora, suponha que Ω é um subconjunto não vazio e aberto de Rn com fecho Ω e fronteira
∂Ω; em particular Ω pode ser o próprio Rn . Sabemos que C0∞ (Ω) é um subespaço denso
no espaço L2 (Ω). Em C0∞ (Ω), uma forma quadrática q E é bem definida pela Eq.(10.1.3). Essa
forma quadrática é chamada de forma de Dirichlet em Ω. É densamente definida e positiva,
mas não fechada. No entanto, o forma de Dirichlet tem uma extensão fechada. De fato, se Ω for
limitado,2 com fronteira ∂Ω suave, o completamento de C0∞ (Ω) com respeito à norma-forma
∥ · ∥H1 (Ω)
$ 6 7
2 2 2
∥Ψ∥H1 (Ω) = dx |Ψ(x)| + |∇Ψ(x)| ,
Ω
denotado por H10 (Ω), com o produto interno

⟨Φ, Ψ⟩H1 (Ω) = ⟨Φ, Ψ⟩L2 (Ω) + ⟨∇Φ, ∇Ψ⟩H1 (Ω) ,
é um espaço Hilbert por construção, sendo em geral um subespaço próprio de H1 (Ω). Com
efeito, se Ω é um conjunto aberto limitado, funções constantes não-nulas pertencem a H1 (Ω),
mas não a H10 (Ω); assim, H1 (Ω) ̸= H10 (Ω). Intuitivamente, H10 (Ω) é o subespaço das
funções Ψ ∈ H1 (Ω) cuja restrição à fronteira Ω desaparece, Ψ|∂Ω = 0.
2
Mais geralmente, que uma das projeções de coordenadas de Ω é limitada; isto é, dizemos que Ω é limitado
na direção xj se a projeção de Ω sobre o eixo xj for um conjunto limitado da reta.
632
O próximo resultado estabelece o domínio natural sobre o qual o operador V é auto-adjunto.

PROPOSIÇÃO 10.2. Seja V um operador multiplicação ilimitado definido por
. /
V Ψ (x) = v(x)Ψ(x) .
Suponha que v : Rn → R é uma função contínua, porém não necessariamente limitada, tal que
3 4
Dom(V ) = Ψ ∈ L2 (Rn ) | v(x)Ψ(x) ∈ L2 (Rn ) .
Então, Dom(V ) é denso em L2 (Rn ) e V é auto-adjunto neste domínio.
Demonstração. Para cada m ∈ N, seja Em um subconjunto de Rn dado por

3 4
Em = x ∈ Rn | |v(x)| < m .
+
Então, Em ⊂ Em+1 e ∞ n
m=1 Em = R . Seja χEm a função característica de Em ; então para
qualquer Ψ ∈ L2 (Rn ), a função Ψm = χEm Ψ, pertence ao domínio Dom(V ). Logo, a
estimativa
$
? ?
?V Ψm ?2 = dx |v(x)χEm (x)|2 |Ψ(x)|2 < m2 ∥Ψ∥22 , ∀ Ψ ∈ L2 (Rn ) , ∀ m ∈ N .
2
Em
implica que V Ψm → V Ψ, quando m → ∞, o que estabelece que Dom(V ) é denso.
Como a função v é real-valorada, é fácil ver que o operador V é simétrico em Dom(V ).

Assim, V ∗ é uma extensão de V . Ao mesmo tempo, suponha que Φ ∈ Dom(V ∗ ), o que
significa que $
dx Φ(x)v(x)Ψ(x) , Ψ ∈ Dom(V ) ,
Rn
é um funcional linear limitado. Este funcional linear tem uma única extensão limitada para
L2 (Rn ) e, assim, existe um único Λ ∈ L2 (Rn ) tal que
$ $
dx Ψ(x)v(x)Φ(x) = dx Λ(x)Φ(x) ,
Rn Rn
ou $
8 9
dx Ψ(x)v(x) − Λ(x) Φ(x) = 0 ,
Rn
para todo Φ ∈ Dom(V ). Tomando Φ = (Ψv − Λ)χEm , vemos que Ψv − Λ é zero em quase
toda parte em Em , para todo m; logo, é zero em quase toda parte em Rn . Assim, Ψv é igual
à Λ como um elemento de L2 (Rn ). Isto mostra que Ψ ∈ Dom(V ). Consequentemente,
Dom(V ) = Dom(V ∗ ). Uma vez que V ∗ é uma extensão de V , concluímos que V é
auto-adjunto em Dom(V ).
PROPOSIÇÃO 10.3. Seja V um operador multiplicação em L2 (Rn ), com domínio
3 4
n n
Dom(V ) = Ψ ∈ L2 (R ) | v(x)Ψ(x) ∈ L2 (R ) .
Então, V é limitado se, e somente se, a função v ∈ L∞ (Rn ).
633
Demonstração. Assuma que v ∈ L∞ (Rn ); então, por definição,

! "
∥v∥∞ = inf M ∈ R | |v(x)| # M .
Assim,
$ $
2 2 2
∥V Ψ∥ = dx |v(x)| |Ψ(x)| # ∥v∥∞ dx |Ψ(x)|2 = ∥v∥2∞ ∥Ψ∥2 .
Rn Rn
Portanto, se v ∈ L∞ (Rn ), então ∥V ∥ # ∥v∥∞ . Por outro lado, tome ε > 0, arbitrariamente
pequeno, e 3 4
Fε = x ∈ Rn | |v(x)| > ∥v∥∞ − ε .
Se Ψ ∈ L2 (Rn ) é tal que ∥Ψ∥ ≠ 0 para todo x ∈/ Fε , então, ∥V Ψ∥/∥Ψ∥ " ∥v∥∞ − ε. Como
ε é arbitrariamente pequeno, isto implica que ∥V ∥ " ∥v∥∞ . Assim, ∥V ∥ = ∥v∥∞ .
/ L∞ (Rn ). Procedendo como antes, para cada m ∈ N, seja Fm um

Agora, assuma que v ∈
n
subconjunto de R dado por
3 4
Fm = x ∈ Rn | |v(x)| > m .
Seja χFm a função característica de Fm ; então para qualquer Ψ ∈ L2 (Rn ), a função Ψm =

χFm Ψ, pertence ao domínio Dom(V ). Consequentemente,
$ $
2 2 2
∥V Ψm ∥ = dx |v(x)| |Ψm (x)| = dx |v(x)|2|Ψm (x)|2 " m2 ∥Ψm ∥2 .
Rn Fm
Isto mostra que ∥V Ψm ∥/∥Ψm ∥ " m. Como m é arbitrário, o operador V não pode ser
limitado.
Logo, se v ∈ L∞ (Rn ), pelo Teorema 4.14 (Teorema de Hellinger-Toeplitz), tem-se que

Dom(V ) = L2 (Rn ) e V é necessariamente limitado e auto-adjunto.
A seguir, vamos ver como o critério de Kato, discutido na Seção 4.9, nos permite estabelecer
a auto-adjunção dos operadores de Schrödinger
#2 2
H=− ∇ +V .
2m
Começamos com a seguinte3

DEFINIÇÃO 10.1 (Classe de potenciais de Kato-Rellich). Sejam H0 o operador hamiltoniano
livre e V : Rn → R um operador multiplicação, ambos definidos em um espaço de Hilbert H .
Então, V é chamado um potencial de Kato-Rellich se Dom(H0 ) ⊂ Dom(V ) e se existem
números reais 0 # a < 1 e b ∈ (0, ∞) tal que
∥V Ψ∥ # a∥H0 Ψ∥ + b∥Ψ∥ , ∀ Ψ ∈ Dom(H0 ) . (10.1.4)
3
Compare esta definição com a Definição 4.31.
634
O próximo resultado apresenta alguns exemplos de potenciais de Kato-Rellich que são im-
portantes na teoria quântica.
TEOREMA 10.1 (Perturbação de H0 : exemplos de potenciais de Kato-Rellich). Se n #
3, então o operador de Schrödinger H = H0 + V em L2 (Rn ) é auto-adjunto no domínio
Dom(H0 ), em qualquer das seguintes circunstâncias:
(i) V ∈ L∞ (Rn );
(ii) V ∈ L2 (Rn );
(iii) V = V1 + V2 , em que V1 ∈ L2 (Rn ) e V2 ∈ L∞ (Rn ).
(iv) V ∈ Lloc n 2
2 (R ), Dom(−∇ ) ⊂ Dom(V ) e
$
M = sup dx |V (x)|2 < ∞ ,
c∈Rn B[c;1]
! "
em que B[c; 1] = x ∈ Rn | ∥x − c∥ # 1 é a bola unitária fechada centrada em c.
A prova do teorema acima necessita do seguinte

LEMA 10.1. Se n # 3, toda função Ψ ∈ Dom(H0 ) ⊂ L2 (R3 ) é majorada pela seguinte
expressão:
ωn−1 π 6 3/2 −1/2
7
∥Ψ∥∞ # α ∥Ψ∥ 2 + α ∥H 0 Ψ∥ 2 , ∀α > 0 ,
4(2π)n
em que ωn−1 é a área da esfera unitária S n−1 em Rn .
Demonstração. Por simplicidade, vamos ignorar as constantes físicas, isto é, vamos usar uni-
dades atômicas com #2 = 2m = 1. Tecnicamente, a ideia básica do argumento é pegar uma
constante arbitrária α > 0 e considerar que para n # 3, para toda Ψ ∈ Dom(H0 ) ⊂ L2 (Rn ),
a função k 3→ (α2 + ∥k∥2 )−1 ∈ L2 (Rn ), pelo Lema 6.5.4 Além disso, L2 (Rn ) ∋ (α2 +
^
∥k∥2 )Ψ(k) = F (α2 Ψ + H0 Ψ). Logo, pela desigualdade de Hölder,
^
(α2 + ∥k∥2 )−1 (α2 + ∥k∥2 )Ψ(k) ∈ L1 (Rn ) ,
e, portanto
$
^ 1=
∥Ψ∥ ^
dk (α2 + ∥k∥2 )−1 (α2 + ∥k∥2 )|Ψ(k)|
Rn
,$ -1/2 ,$ -1/2
# 2
dk (α + ∥k∥ ) 2 −2 2 ^
dk (α + ∥k∥ ) |Ψ(k)|2 2
2
.
Rn Rn
Note que, como já enfatizado, pelo Lema 6.5, temos

$ $ ∞
2 2 −2 −1
dk (α + ∥k∥ ) = ωn−1α dk k 2 (1 + k 2 )−2 ,
Rn 0
4
Não é difícil ver que (α2 + ∥k∥2 )−1 ∈
/ L2 (Rn ) se n > 3. O que podemos concluir disso?
635
em que ωn−1 é a área da esfera unitária S n−1 em Rn . Na integral acima fizemos a troca de
variável k → αk. Por sua vez, a integral
$ ∞
dk k 2 (1 + k 2 )−2 ,
0
pode ser “facilmente” calculada realizando-se mais uma troca de variável: k → tan ϕ. Neste
caso,
$ ∞ $ π/2 $
2 2 −2 2 1 π/2
dk k (1 + k ) = dϕ sin ϕ = dϕ (1 − cos 2ϕ)
0 0 2 0
5π/2 5π/2
1 55 1 5
5 π
= ϕ 5 − sin 2ϕ 5 = .
2 5 4 5 4
0 0
Assim, usando agora a desigualdade de Minkowski, temos
^ 1# ωn−1 π −1/2 ^ 2
∥Ψ∥ α ∥(α2 + ∥k∥2 )Ψ∥
4
ωn−1 π 6 3/2 ^ 7
^ 2 .
# α ∥Ψ∥2 + α−1/2 ∥∥k∥2 Ψ∥
4
Pela transformada de Fourier inversa segue que
$
1 ^
Ψ(x) = dk e−ikx Ψ(k) .
(2π)n Rn
^ ∈ S (Rn ). Além disso, da
Claramente, pela Proposição 6.7, Ψ é uma função contínua se Ψ
mesma proposição, a estimativa
$
1 5 5
sup |Ψ(x)| # n
dk 5e−ikx Ψ(k)
^ 5
x∈Rn (2π) Rn
$
1 5 5
= n
dk 5^
Ψ(k)5
(2π) Rn
1 ^ 1,
= ∥Ψ∥
(2π)n
^ ∈ L1 (Rn ) uma vez que
mostra que Ψ é uma função contínua para uma função arbitrária Ψ
n n
S (R ) é denso em L1 (R ). Logo,
1 ^ 1
∥Ψ∥∞ # ∥Ψ∥
(2π)n
ωn−1 π 6 3/2 ^ −1/2 2^
7
# α ∥Ψ∥2 + α ∥∥k∥ Ψ∥2
4(2π)n
ωn−1π 6 3/2 −1/2
7
= α ∥Ψ∥ 2 + α ∥H 0 Ψ∥ 2 , ∀n # 3 .
4(2π)n
Na última passagem foi usado o Corolário 6.14. Isto completa a prova.
636
Prova do Teorema 10.1. (i) Se V ∈ L∞ (Rn ), então, pela desigualdade de Hölder (veja Lema 6.9),
segue que ∥V Ψ∥2 # ∥V ∥∞ ∥Ψ∥2 . Consequentemente, o critério de perturbação de Kato será
satisfeito tomando-se a = 0 e b = ∥V ∥∞ . Assim, V ∈ L∞ (Rn ) é infinitesimalmente pequeno
em relação ao operador H0 . Logo, H = H0 + V é auto-adjunto no domínio Dom(H0 ).
(ii) Assuma V ∈ L2 (Rn ). Novamente, pela desigualdade de Hölder, segue que ∥V Ψ∥2 #
∥V ∥2 ∥Ψ∥∞ . Assim, pelo Lema 10.1, temos
ωn−1 π . 3/2 −1/2
/
∥V Ψ∥2 # ∥V ∥2 α ∥Ψ∥ 2 + α ∥H 0 Ψ∥ 2 .
4(2π)n
Consequentemente, o critério de perturbação de Kato será satisfeito assumindo-se
∥V ∥2 ωn−1 π ∥V ∥2 ωn−1 πα3/2

a= e b= ,
4(2π)n α1/2 4(2π)n
e notando que se tomarmos

∥V ∥2 ωn−1 π
< α1/2 ,
4(2π)n
as hipóteses do Teorema de Kato-Rellich são satisfeitas (pois isto implica que a < 1). Portanto,
H = H0 + V é auto-adjunto no domínio Dom(H0 ).
(iii) Partimos observando que
∥V Ψ∥2 = ∥(V1 + V2 )Ψ∥2 # ∥V1 Ψ∥2 + ∥V2 Ψ∥2 # ∥V1 ∥2 ∥Ψ∥∞ + ∥V2 ∥∞ ∥Ψ∥2 ,
ou seja,
ωn−1 π . 3/2 /
∥V Ψ∥2 # ∥V1 ∥2 n
α ∥Ψ∥2 + α−1/2 ∥H0 Ψ∥2 + ∥V2 ∥∞ ∥Ψ∥2
4(2π)
, -
∥V1 ∥2 ωn−1 π ∥V1 ∥2 ωn−1 π
= n 3/2
+ ∥V2 ∥∞ ∥Ψ∥2 + ∥H0 Ψ∥2 .
4(2π) α 4(2π)n α1/2
Consequentemente, o critério de perturbação de Kato será satisfeito assumindo-se
∥V1 ∥2 ωn−1 π ∥V1 ∥2 ωn−1π

a= e b= + ∥V2 ∥∞ ,
4(2π)n α1/2 4(2π)n α3/2
e, novamente, notando que se tomarmos
∥V1 ∥2 ωn−1 π
n
< α1/2 ,
4(2π)
as hipóteses do Teorema de Kato-Rellich são satisfeitas (pois isto implica que a < 1). Portanto,
H = H0 + V é auto-adjunto no domínio Dom(H0 ).
Nota 10.3. Neste ponto, uma observação importante com relação ao item (iii) deve ser feita.
Para Rn , n " 4, o Teorema 10.1 vale para V ∈ Lp (Rn ) + L∞ (Rn ), com p > 2 se n = 4 e
p " n/2 se n " 5 (veja, por exemplo, o Teorema X.29, em M. Reed e B. Simon, “Methods of
Modern Mathematical Physics. Fourier Analysis, Self-Adjointness,” Vol.II, Academic Press, 1975).
637
(iv) Como −∇2 e V são dois operadores lineares densamente definidos em um espaço de
Hilbert H , com −∇2 sendo um operador auto-adjunto e V um operador simétrico, tal que
Dom(−∇2 ) ⊂ Dom(V ), então, de acordo com Lema 4.7, segue que V é −∇2 -limitado. Isto
implica que existem constantes positivas a e b tais que
∥V Ψ∥2 # a∥ − ∇2 Ψ∥2 + b∥Ψ∥2 , ∀ Ψ ∈ Dom(−∇2 ) .
Escolha Ψ ∈ C0∞ (Rn ) tal que Ψ(x) = 1 para todo x na bola unitária fechada B[0; 1]. Para
c ∈ Rn , considere a função transladada Ψc (x) = Ψ(x − c). Então, Ψc = 1 sobre B[c; 1], e
$ $ $
2 2
dx |V (x)| = dx |V (x)Ψc (x)| # dx |V (x)Ψc (x)|2
B[c;1] B[c;1] Rn
= ∥V Ψc ∥22
. /2
# a∥ − ∇2 Ψc ∥2 + b∥Ψc ∥2
. /2
= a∥ − ∇2 Ψ∥2 + b∥Ψ∥2 ,
com a e b dados por (4.9.1). Como o lado direito não depende de c, o supremo do lado esquerdo
com c ∈ Rn é finito, isto é, M < ∞. Assim,
∥V Ψ∥2 # a∥H0 Ψ∥2 + b∥Ψ∥2 ,
e H = H0 + V é auto-adjunto no domínio Dom(H0 ).

Nota 10.4 (Classe de potenciais de Stummel). De acordo com o Teorema 10.1, item (iv), o
potencial V ∈ Lloc n 2
2 (R ), com Dom(−∇ ) ⊂ Dom(V ) e
$
M = sup dx |V (x)|2 < ∞ , (10.1.5)
c∈Rn ∥x−c∥#1
pertence à uma classe de potenciais chamada classe Stummel. Um potencial V sobre Rn é dito
ser da classe de Stummel se a seguinte condição local é satisfeita: fixe n " 4 e 0 < α < 4 e
(n)
assuma que Sα é o conjunto de funções, V , sobre Rn obedecendo
$
sup dx ∥x − c∥−(n−4+α) |V (x)|2 < ∞ . (10.1.6)
c∈Rn ∥x−c∥#α
Observamos que para n # 3 a Eq.(10.1.5) é equivalente a

, $ -
4−α 2
lim sup dx ∥x − c∥ |V (x)| = 0 .
α→0 c∈Rn ∥x−c∥#α
A classe de potenciais de Stummel é particularmente importante quando desejamos explorar

as propriedades locais de um potencial. Com essa definição, não é difícil provar o seguinte
resultado:5
(n)
TEOREMA 10.2. Se V ∈ Sα , então a condição (10.1.4) é respeitada no domínio Dom(H0 ) e
a constante a pode ser tomada arbitrariamente próxima de zero.
5
Ver F. Stummel, “Singuläre Elliptische Differentialoperatoren in Hilbertschen Räumen,” Math. Ann. 132 (1956)
176.
638
(n)
O resultado acima estabelece que se V ∈ Sα , então, V é infinitesimalmente pequeno em
relação ao operador H0 , já que a constante a pode ser tomada arbitrariamente próxima de zero.
Nota 10.5 (Um pouco mais sobre o Teorema 10.1, item (iv)). No Teorema 10.1, item (iv), a
condição (10.1.5) é necessária para que uma função V em Rn seja relativamente H0 -limitada.
Com uma prova um pouco mais complexa, usando estimativas de Sobolev, pode-se se provar
que esta condição também é suficiente em dimensões n # 3. As estimativas de Sobolev
estabelecem que se definirmos q = ∞ para n # 3 e assumirmos que 2 # q < ∞ para n = 4
e 2 # q < 2n/(n − 4) para d " 5, então, para cada a > 0, existe uma constante b > 0,
dependendo de a, n e q, tal que Ψ ∈ Lq (Rn ) e
∥Ψ∥q # a∥ − ∇2 Ψ∥2 + b∥Ψ∥2 , ∀ Ψ ∈ Dom(−∇2 ) .
A prova deste resultado pode ser encontrada no livro de K. Schmüdgen, “Unbounded Self-Adjoint
Operators on Hilbert space,” Springer, 2012, Lema 8.9 e no livro de M. Reed e B. Simon, “Methods
of Modern Mathematical Physics II. Fourier Analysis and Self-Adjointness,” Academic Press, New
York 1975, Theorema IX.28. A seguir, defina p tal que p−1 + q −1 = 2−1 , com p = 2 se n # 3,
p > 2 se n = 4 e p > n/2 se n " 5. Então, qualquer função de valor real V em Rn que
satisfaça a condição
,$ -1/p
p
∥V ∥p = sup |V (x)| dx < ∞ (diz-se que V é localmente uniformemente Lp ) ,
y∈Rn ∥x−y∥#1
é H0 -limitada. Com efeito, pela desigualdade de Hölder, se V ∈ Lp (Rn )

. /
∥V Ψ∥2 # ∥V ∥p ∥Ψ∥q # M a∥ − ∇2 Ψ∥2 + b∥Ψ∥2 ,
para todo Ψ ∈ Dom(H0 ). Portanto, V é relativamente H0 -limitado.
Exemplo 10.1 (Átomo do hidrogênio). Tome n = 3 e considere o hamiltoniano do átomo do
hidrogênio dado por −∇2 − 1/∥x∥.6 Isso significa que o potencial é dado por −1/∥x∥. Agora
usamos a decomposição
, -
1 1
V (x) = V1 (x) + V2 (x) = − 1I∥x∥#1 · + 1I∥x∥>1 · ,
∥x∥ ∥x∥
em que
⎧ ⎧
⎨1 se ∥x∥ # 1 ⎨1 se ∥x∥ > 1
1I∥x∥#1 = e 1I∥x∥>1 = .
⎩0 se ∥x∥ > 1 ⎩0 se ∥x∥ # 1
Claramente V2 ∈ L∞ (R3 ) e V1 ∈ L2 (R3 ), mesmo com o potencial V1 contendo uma

singularidade na origem. Mais precisamente, usando coordenadas esféricas, segue que
$ $ $ $ 1
2 1 1
dx |V1 (x)| = dx 2
= dω dr r 2 2 = 4π < ∞.
R3 ∥x∥#1 ∥x∥ S2 0 r
Portanto, segue do Teorema 10.1, item (iii), que hamiltoniano do átomo do hidrogênio dado por
−∇2 − 1/∥x∥ é auto-adjunto no domínio Dom(H0 ).
6
Aqui, novamente estamos ignorando as constantes físicas, isto é, estamos usando unidades atômicas com
# = e2 = 2µ = 1, em que µ é a massa reduzida do sistema elétron-próton.
2
639
Nota 10.6 (Classe de potenciais de Rollnik). Do ponto de vista das formas quadráticas, uma
grande classe de potenciais em R3 para a qual a forma-soma −∇2 +̇V existe pelo Teorema
KLMN (Teorema 4.37) é a classe R de Rollnik, ou seja, o conjunto de funções reais V em R3
satisfazendo a condição
$ $
2 |V (y)||V (x)|
∥V ∥R = dxdy <∞. (10.1.7)
R3 R3 ∥x − y∥2
A classe de potenciais de Rollnik com a norma ∥·∥R é um espaço vetorial normado completo.
Pode-se mostrar que se V ∈ R+L∞ (R3 ), então, V é relativamente uma forma (−∇2 )-limitada
com a (−∇2 )-forma limitada por zero. Portanto, a forma-soma −∇2 +̇V existe pelo Teorema
KLMN. Além disso, temos L3/2 (R3 ) ⊂ R (veja o Apêndice 10.A). Por exemplo, se γ ∈ R e α < 2,
então, V (x) = γ∥x∥−α ∈ L3/2 (R3 ) ⊂ R e, portanto, a forma-soma −∇2 +̇V existe. Por outro
lado, pelo Teorema 10.1, o operador −∇2 + V é auto-adjunto em L2 (R3 ) quando α < 3/2 (veja
o Exercício 10.5). Ou seja, o Teorema KLMN permite tratar potenciais com “singularidades mais
fortes” do que aqueles potenciais considerados no Teorema 10.1. Um tratamento detalhado da
classe de potenciais de Rollnik pode ser encontrado no texto de B. Simon, “Quantum Mechanics
for Hamiltonians Defined as Quadratic Forms,” Princeton Series in Physics 68, 1971.
10.2 Espectro dos Operadores de Schrödinger

Vamos analisar o espectro dos operadores de Schrödinger H = H0 + V . Queremos saber
qual o efeito de um potencial V , visto como uma perturbação, sobre o espectro do operador H0 .
Vamos determinar os espectros discretos e essenciais de H. Em nossa discussão sobre o espectro
dos operadores de Schrödinger, consideraremos, principalmente, os efeitos das perturbações no
espectro essencial de H0 .
10.2.1 O Hamiltoniano Livre
Nosso primeiro resultado fundamental estabelece que o operador H0 não possui auto-valores.
Em outras palavras, o espectro de H0 é puramente contínuo (já mostramos isto no caso
unidimensional no Exemplo 5.7, na pg.291).
TEOREMA 10.3. O espectro do operador H0 é σ(H0 ) = σess (H0 ) = [0, ∞).
Duas provas do Teorema 10.3 são apresentadas. Na primeira, no caso particular em R3 ,

usamos o método da transformada de Fourier para obter a função de Green G(x − y; λ),
chamada função de Green livre.7 Essa função de Green é o kernel do operador resolvente do
hamiltoniano livre Rλ (H0 ) em L2 (R3 ). A segunda prova, no caso geral em Rn , é inspirada no
Critério de Weyl. Por simplicidade, em ambas as provas tomamos #2 = 2m = 1.
Demonstração do Teorema 10.3: O Caso Particular em R3 . Seja Rλ (−∇2 ) = (−∇2 − λ1I)−1 ,

com λ ∈ C, o resolvente do operador −∇2 . Isto significa que, para todo Ψ ∈ Dom(H0 ),
7
No contexto da mecânica quântica, normalmente o termo “função de Green” se refere a uma representação
no espaço das coordenadas, ou dos momenta, do resolvente de um operador auto-adjunto.
640
existe pelo menos um Φ ∈ L2 (R3 ) tal que
(−∇2 − λ1I)Ψ = Φ . (10.2.1)
A solução fundamental de (10.2.1) é uma distribuição G ∈ S ′ (R3 ), de forma que
(−∇2 − λ1I)G = δ .
De fato, se definimos Ψ como uma equação de convolução Ψ = G ∗ Φ, com Φ ∈ S (R3 ),

então
(−∇2 − λ1I)Ψ = (−∇2 − λ1I)(G ∗ Φ)

8 9
= (−∇2 − λ1I)G ∗ Φ
=δ∗Φ
=Φ
Note que, pela transformada de Fourier, F [−∇2 − λ1I] = ∥k∥2 − λ, e este operador não tem
zeros, uma vez que λ ∈ ρ(−∇2 ). Portanto, F [G] = (2π)−3 (∥k∥2 − λ)−1 é uma distribuição
temperada bem-definida. Portanto, se pudermos encontrar uma expressão para G, então teremos
uma representação explícita para o resolvente do operador −∇2 . Vamos ver como obter esta
representação.
Através da transformada de Fourier inversa, obtemos que

$ $
2 1 ^ −ik·x 1 ^ −ik·x
(−∇ − λ1I) dk Ψ(k)e = dk Φ(k)e ,
(2π)3 (2π)3
ou
$ $
1 2 ^ 1 ^
dk (∥k∥ − λ)Ψ(k) e−ik·x = dk Φ(k) e−ik·x .
(2π)3 (2π)3
Disso, segue que

$
. / 1
2
Rλ (−∇ )Φ (x) = ^
dk (∥k∥2 − λ)−1 Φ(k) e−ik·x
(2π)3
$ $
1 2 −1 −ik·x
= 3
dk (∥k∥ − λ) e dy Φ(y) eik·y
(2π)
$ , $ -
1 2 −1 −ik·(x−y)
= dy dk (∥k∥ − λ) e Φ(y) .
(2π)3
Definimos,
$
1
def.
G(x − y; λ) = dk (∥k∥2 − λ)−1 e−ik·(x−y) ,
(2π)3
641
como sendo a função de Green em L2 (R3 ). Vamos computar a integral acima usando coorde-
nadas esféricas. Com efeito,
$
1
G(x − y; λ) = dk (∥k∥2 − λ)−1 e−ik·(x−y)
(2π)3
$ ∞ $ π $ 2π
1
= 3
dκ dθ dφ κ2 sin θ (κ2 − λ)−1 e−iκ∥x−y∥ cos θ
(2π) 0 0 0
$ ∞ $ 1 $ 2π
1
= dκ dγ dφ κ2 sin θ (κ2 − λ)−1 e−iκ∥x−y∥γ
(2π)3 0 −1 0
$ ∞
i . /
= 2
dκ κ(κ2 − λ)−1 e−iκ∥x−y∥ − eiκ∥x−y∥ ,
(2π) ∥x − y∥ 0
realizando a troca de variável γ = cos θ da segunda para a terceira linha. Trocando κ → −κ

na primeira integral, obtemos que
$ ∞
i
G(x − y; λ) = − dκ κ(κ2 − λ)−1 eiκ∥x−y∥
(2π)2 ∥x − y∥ −∞
$ R
i
=− 2
lim dκ κ(κ2 − λ)−1 eiκ∥x−y∥ .
(2π) ∥x − y∥ R→∞ −R
A integral acima pode ser tratada como parte da integral complexa

`
dω ω(ω 2 − λ)−1 eiω∥x−y∥ .
C
Podemos, então, escrever

` $ R
2 −1 iω∥x−y∥
dω ω(ω − λ) e = lim dκ κ(κ2 − λ)−1 eiκ∥x−y∥
R→∞ −R
C
$
+ dω ω(ω 2 − λ)−1 eiω∥x−y∥
CR
A função √ √
f (ω) = ω(ω 2 − λ)−1 eiω∥x−y∥ , com ω ∈ C \ {− λ, λ} ,
satisfaz a condição√do Lema de Jordan (Lema
√ 6.19, aqui com ∥x − y∥ no lugar de k) para todo
R > 0 com R ̸= λ. Note que, para R > λ,
|Reiθ | R R→∞ 0 .
M(R) = max = 2
2
θ∈[0,2π] |R e2iθ − λ| R − λ −−−→
√ √
Como, para Im λ > 0, a única singularidade de f no semi-plano superior é ω = λ, a
aplicação do Teorema dos Resíduos produz
$ ∞ √
dκ κ(κ2 − λ)−1 eiκ∥x−y∥ = 2πi Res f ( λ) .
−∞
642
√ √ √
Uma vez que ω = λ é um pólo simples de f e ω 2 − λ = (ω − λ)(ω + λ), então
√ √ √ −1 iω∥x−y∥ 1 i√λ∥x−y∥
Res f ( λ) = lim
√ (ω − λ)f (ω) = lim
√ ω(ω + λ) e = e .
ω→ λ ω→ λ 2
Assim, a representação do resolvente do operador −∇2 no espaço-x é a função de Green

1 √ √
G(x − y; λ) = ei λ∥x−y∥ , Im λ > 0 . (10.2.2)
4π∥x − y∥
Por conta
√ disso, para um número complexo λ ∈
/ [0, ∞), com o ramo da raiz quadrada dado
por Im λ > 0, segue que
$
. 2
/ 1 1 √
Rλ (−∇ )Φ (x) = dy ei λ∥x−y∥ Φ(y) , ∀ Φ ∈ L2 (R3 ) .
4π ∥x − y∥
Note que, para Φ ∈ L2 (R3 ), novamente usando coordenadas esféricas, segue que
, $ -1/2
? ? 1 1 √
?Rλ (−∇2 )Φ? = dy e−2Im λ∥x−y∥
|Φ(y)|2
2 16π 2 ∥x − y∥2
, $ ∞ $ π $ 2π √
-1/2
1 1
# ∥Φ∥2 dr dθ dφ r sin θ 2 e−2Im λr
2
16π 2 0 0 0 r
, $ ∞ √
-1/2
1 −2Im λr
= ∥Φ∥2 dr e
4π 0
( 5∞ )1/2
1 √ 5
5
= ∥Φ∥2 − √ e−2Im λr 5
8πIm λ 5
0
1
= H √ ∥Φ∥2 .
2 2πIm λ
Portanto, o resolvente do operador −∇2 é limitado para todo λ ∈ C \ [0, ∞) (cf. a

Proposição 10.4). De acordo com a observação feita na pg.260, σ(−∇2 ) ∪ ρ(−∇2 ) = C e
σ(−∇2 ) ∩ ρ(−∇2 ) = ∅. Como pelo Corolário 5.2 o espectro é um conjunto fechado, então,
σ(−∇2 ) = [0, ∞). Além disso, como o operador −∇2 é auto-adjunto, sabemos que σ(−∇2 ) =
σdisc (−∇2 ) ∪ σess (−∇2 ). Assuma que −∇2 Ψ = λΨ para algum Ψ ∈ Dom(−∇2 ). Como,
8 9
F (−∇2 − λ1I)Ψ = (∥k∥2 − λ)Ψ ^ ,
então, do Teorema de Parseval-Plancherel (Teorema 6.14), segue que

,$ -1/2
2 2
∥(−∇ − λ1I)Ψ∥2 = ∥(∥k∥ − λ)Ψ∥2 = ^ 2 2 ^
dk (∥k∥ − λ) |Ψ(k)| 2
=0.
Como (∥k∥2 − λ)2 > 0, para todo ∥k∥2 = ^

̸ λ, então Ψ(k) = 0 para quase todo k, isto é,
^ ^
Ψ = 0. Assim, nem Ψ é um auto-vetor e nem λ é um auto-valor de H0 . Logo, σ(−∇2 )
643
é puramente essencial. Isto prova que σdisc (−∇2 ) = ∅ e σess (−∇2 ) = [0, ∞). Portanto,
σ(−∇2 ) = σess (−∇2 ) = [0, ∞).
Finalmente, como pela transformada de Fourier o operador diferencial −∇2 torna-se uma
multiplicação por ∥k∥2 se Ψ ∈ S (R3 ), então, pela Proposição 10.3, H0 é ilimitado, uma vez
que a função ∥k∥2 é estritamente crescente e ilimitada!
A seguir vamos apresentar a segunda prova do Teorema 10.3 usando o Critério de Weyl. A
prova é baseada na estratégia seguida por Kohlmann.8
Segunda Demonstração do Teorema 10.3: O Caso Geral em Rn . De acordo com o Teorema de

Gauss-Green, temos para qualquer Ψ no core de H0 , isto é, para qualquer Ψ ∈ C0∞ (Rn ),
$ $
2
⟨Ψ, H0Ψ⟩ = − dx Ψ(x)∇ Ψ(x) = ⟨∇Ψ, ∇Ψ⟩ = dx |∇Ψ(x)|2 . (10.2.3)
Rn Rn
Observe que Ψ não tem contribuições na fronteira, pois supp Ψ é compacto.

5
Como H0 5C ∞ (Rn ) é essencialmente auto-adjunto, dado qualquer Ψ ∈ Dom(H0 ) existe
0
uma sequência (Ψℓ )ℓ∈N ⊂ C0∞ (Rn ) tal que Ψℓ → Ψ e −∇2 Ψℓ → H0 Ψ (lembre-se que todo
operador auto-adjunto é fechado). Então, ⟨Ψ, H0 Ψ⟩ " 0 para toda função Ψ ∈ Dom(H0 ).
Em particular, H0 " 0, de modo que E(λ) = 0, quando λ < 0, para a família espectral
associada. Neste caso, o teorema espectral mostra que σ(H0 ) ⊂ [0, ∞).
Para concluir a prova, mostraremos que σess (H0 ) ⊃ [0, ∞). Para esse propósito, construímos,
para qualquer λ ∈ [0, ∞), uma sequência de Weyl adequada. Escolha um k ∈ Rn tal que
k · k = λ e considere a onda plana ω(x) = eik·x , com x ∈ Rn . Naturalmente, ω ∈ / L2 (Rn ),
mas temos no sentido pontual, considerando cada valor ω(x) da função ω,
−∇2 ω(x) = λω(x) , (10.2.4)
Como próximo passo, assuma que B(0; ε) = {x ∈ Rn | ∥x∥ < ε} é a bola aberta com
raio N ∋ ε > 0 em torno de zero em Rn . De acordo com o Teorema 6.33, existe uma função
positiva ϑε ∈ C0∞ (B(0; 2ε)), com as seguintes propriedades:
1. 0 # ϑε # 1,
2. ϑε (x) = 1 se x ∈ B(0; ε),
3. ϑε (x) = 0 se x ∈
/ B(0; 2ε),
5 5 5 5
4. 5∇ϑε 5 # C1 ε−1 e 5∇2 ϑε 5 # C2 ε−2 , em que C1 e C2 são constantes que dependem de
n.
8
M. Kohlmann, “Schrödinger Operators and their Spectra,” Lecture Notes, curso ministrado na Universidade de
Göttingen, no inverno de 2017/2018.
644
Agora, defina
ηε (x) = ϑε (x)ω(x) e Φε = ∥ηε ∥−1

2 ηε (x) .
Vamos mostrar que sequência (Φε )ε∈N é uma sequência de Weyl. Claramente, ∥Φε ∥2 = 1.
Para mostrar que Φε → 0 fracamente, escolhemos ϕ ∈ C0∞ (Rn ), escrevemos Qε = B(0; 2ε) \
B(0; ε) e observamos que
5$ 5
5 ηε (x) 55
⟨ϕ, Φε ⟩ # |⟨ϕ, Φε ⟩| = 55 dx ϕ(x)
B(0;2ε) ∥ηε ∥2 5
5$ 5 5$ 5
5 1 5 5 η (x) 5
# 55 5+5 5
ε
dx ϕ(x) 5 5 dx ϕ(x) (10.2.5)
B(0;ε) ∥ηε ∥2 Qε ∥ηε ∥2 5
5$ 5
∥ϕ∥2 55 ηε (x) 55
# + dx ϕ(x) → 0 quando ε → ∞ .
∥ηε ∥2 5 Qε ∥ηε ∥2 5
Aqui, usamos a desigualdade de Hölder da segunda para a terceira linha para a primeira integral
e o fato que
$ $
∥ηε ∥22 = dx |ϑε (x)ω(x)| "2
dx |ω(x)|2 = |B(0; ε)| → ∞ quando ε→∞.
Rn B(0;ε)
Além disso, o segundo termo no lado direito de (10.2.5) desaparece para ε0 " ε e supp ϕ ⊂
B(0; ε). Como C0∞ (Rn ) ⊂ L2 (Rn ) é denso, concluímos que ⟨ϕ, Φε ⟩ → 0 para qualquer
ϕ ∈ L2 (Rn ).
Resta mostrar que ∥(H0 − λ)Φε ∥2 → 0, quando ε → ∞. Para ϕ ∈ C0∞ (Rn ), consideramos
a identidade
<n <n , 2 -
2 ∂2 ∂ Φε ∂Φε ∂ϕ ∂2ϕ
−∇ (Φε ϕ) = − (Φε ϕ) = − ϕ+2 + Φε 2
j=1
dx2j j=1
dx2j dxj dxj dxj
= −(∇2 Φε )ϕ − 2⟨∇Φε , ∇ϕ⟩ − Φε (∇2 ϕ) . (10.2.6)
Mais uma vez decompomos
$ 5 52 $
5 η (x) 5 1 5 5
∥(H0 − λ)Φε ∥22 = 5 2
dx 5(−∇ − λ)
ε 5 = dx 5(−∇2 − λ)eik·x 52
Rn ∥ηε ∥2 5 ∥ηε ∥22 B(0;ε)
$
1 5 . /5
+ dx 5(−∇2 − λ) ϑε (x)ω(x) 52 . (10.2.7)
2
∥ηε ∥2 Qε
O primeiro termo no lado direito de (10.2.7) desaparece de acordo com (10.2.4). Usando mais
645
uma vez a identidade (10.2.4) e a Eq.(10.2.6), obtemos que

$
1 5 . / 5
2
∥(H0 − λ)Φε ∥2 = dx 5−∇2 ϑε (x)ω(x) + ϑε (x)∇2 ω(x)52
∥ηε ∥22 Qε
$
1 5 . / 52
= 2
dx 5− ∇2 ϑε (x) ω(x) − 2⟨∇ϑε , ∇ω⟩5
∥ηε ∥2 Qε
$ $
1 5 2 52 1
# dx 5∇ ϑε (x)5 + dx |2⟨∇ϑε , k⟩|2
∥ηε ∥22 Qε ∥ηε ∥2 Qε
$ $
1 5 2 52 4∥k∥
# 5
dx ∇ ϑε (x) + 5 dx |∇ϑε |2
2 2
∥ηε ∥2 Qε ∥ηε ∥ Qε
$ $
1 5 2 52 4λ
= 5
dx ∇ ϑε (x) + 5 dx |∇ϑε |2 .
∥ηε ∥22 Qε ∥ηε ∥2 Qε
Como ∥ηε ∥2 " |B(0; ε)|, então, pela nossa construção, existem constantes positivas C1 , C2 tais
que
, -
2 |Qε | C1 C2
∥(H0 − λ)Φε ∥2 # + 2
|B(0; ε)| ε ε
, -
(2ε)n − εn C1 C2
= + 2
εn ε ε
, -
n C1 C2
= (2 − 1) + 2 → 0 quando ε → ∞ .
ε ε
Portanto, (Φε )ε∈N é uma sequência de Weyl para −∇2 e λ, e pelo Critério de Weyl, λ ∈
σess (−∇2 ). Assim, (0, ∞) ⊂ σess (−∇2 ), e como o espectro é um conjunto fechado, [0, ∞) ⊂
σ(−∇2 ). Isso implica que σ(−∇2 ) = σess (−∇2 ) = [0, ∞), porque zero não é um ponto
isolado do espectro. Isso completa a segunda prova do Teorema 10.3.
/ σ(H0 ) o resolvente Rλ (H0 ) = (H0 − λ1I)−1 satisfaz a
PROPOSIÇÃO 10.4. Para todo λ ∈
estimativa
1
∥(H0 − λ1I)−1 ∥ # , ∀ λ ∈ C \ [0, ∞) .
|λ|
Demonstração. Para Ψ ∈ Dom(H0 ), assuma que Ran(H0 − λ1I) ∋ Φ = (H0 − λ1I)Ψ, e que
λ = µ + iν, com µ, ν ∈ R. Sendo H0 auto-adjunto em seu domínio, de acordo com o Corolário
4.5, temos que Ran(H0 − λ1I) = H e que Ran(H0 − λ1I)⊥ = {0}. Assim, pelo Lema 4.1,
(H0 − λ1I) tem um inverso e, portanto, para todo Ψ ∈ Dom(H0 ) existe um Φ ∈ L2 (Rn ) tal
que Ψ = (H0 − λ1I)−1 Φ. Por sua vez, pela Proposição 5.7, segue que
. /
∥(H0 − λ1I)Ψ∥ " d λ, σ(H0) ∥Ψ∥ , para λ ∈ ρ(H0 ) ,
. /
em que. d λ, σ(H/0 ) = inf µ∈σ(H0 ) |λ − µ|. Pelo Teorema 10.3, sabemos que σ(H0 ) = [0, ∞);
logo, d λ, [0, ∞) = |λ|. Assim, temos que
∥(H0 − λ1I)Ψ∥ " |λ|∥Ψ∥ .
646
Dessa forma, a desigualdade acima implica que |λ|∥(H0 − λ1I)−1 Φ∥ # ∥Φ∥, ou seja,
1
∥(H0 − λ1I)−1 ∥ # , ∀ λ ∈ C \ [0, ∞) .
|λ|
TEOREMA 10.4. Seja V um potencial de Kato-Rellich. Então, H = H0 + V é limitado in-

feriormente por −b/(1 − a), em que 0 # a < 1 e b ∈ (0, ∞). Além disso, temos que
∥H0 Ψ∥ # α∥HΨ∥ + β∥Ψ∥, em que α = 1/(1 − a) e β = b/(1 − a).
Demonstração. De acordo com o Teorema 10.3, o operador H0 é limitado inferiormente por

zero, isto é, inf Ψ∈Dom(H0 ) ⟨Ψ, H0Ψ⟩ = 0. Portanto, pelo Teorema de Kato-Rellich (Teorema
4.35), o operador H0 + V é limitado inferiormente por b/(1 − a), em que, de acordo com a
Definição 4.31, 0 # a < 1 e b ∈ (0, ∞). Assim, pelo Teorema 5.12, podemos concluir que o
espectro de H0 + V está contido em [−b/(1 − a), +∞). Além disso, para Ψ ∈ Dom(H0 )
temos
∥H0 Ψ∥ # ∥HΨ∥ + ∥V Ψ∥ # ∥HΨ∥ + a∥H0 Ψ∥ + b∥Ψ∥ ,
ou seja, temos
1 b
(1 − a)∥H0 Ψ∥ # ∥HΨ∥ + b∥Ψ∥ =⇒ ∥H0 Ψ∥ # ∥HΨ∥ + ∥Ψ∥ .
1−a 1−a
o que finaliza a prova.
O resultado estabelecido no Teorema 10.4 garante que não existem auto-valores do operador
H indo para −∞ se V é um potential do tipo Kato-Rellich. Na literatura, isso é conhecido
como “estabilidade da matéria.” Para o caso do átomo do hidrogênio isto significa que o
elétron não pode “cair” sobre o núcleo. Na Seção 10.9 provaremos, usando uma desigualdade
devido ao matemático inglês Hardy, que todos os auto-valores do átomo do hidrogênio são
" −2µe4 #−2 . Do ponto de vista matemático, investigações rigorosas sobre a estabilidade da
matéria em sistemas quânticos iniciaram-se com os clássicos trabalhos de Dyson e Lenard,9
culminando com o trabalho monumental de Lieb e Thirring,10 entre vários outros. Aqui, deve-se
enfatizar que, no estudo da estabilidade da matéria, o princípio de exclusão de Pauli revela-se
não apenas suficiente para a estabilidade, mas também necessário.
10.2.2 Potenciais do Tipo V (x) → 0 Quando |x| → ∞
As propriedades espectrais dos operadores de Schrödinger são altamente dependentes do

comportamento do potencial V no infinito. Basicamente, nesta e na próxima seção, estudamos
duas classes distintas de potenciais. A classe cujas propriedades espectrais são mais fáceis
de estabelecer são aquelas com V (x) → ∞ quando |x| → ∞; esta classe tem um espectro
essencial vazio. A outra classe é composta pelos potenciais para os quais V (x) → 0 quando
9
F.J. Dyson e A. Lenard, “Stability of Matter. I,” J. Math. Phys. 8 (1967) 423; “Stability of Matter. II, J. Math.
Phys. 9 (1968) 698.
10
E.H. Lieb e W.E. Thirring, “Bound for the Kinetic Energy of Fermions which Proves the Stability of Matter,” Phys.
Rev. Lett. 35 (1975) 687; ibid 35 (1975) 1116 (E).
647
|x| → ∞. Vamos discutir primeiro esta segunda classe, nos concentrando nos potenciais
relativamente limitados (em relação a H0 ) com limite relativo < 1. O exemplo mais proeminente
nesta classe é o operador de Schrödinger atômico que será analisado em detalhes mais a frente.
Os potenciais contínuos e limitados por partes com suporte compacto em Rn também pertencem
à classe discutida aqui, como o potencial do poço quadrado.
TEOREMA 10.5. Seja V : Rn → R contínuo, com V (x) → 0 quando |x| → ∞. Então,

σess (H0 + V ) = σess (H0 ) = [0, ∞).
Para provar o teorema acima vamos introduzir outro conceito muito útil.
! "
DEFINIÇÃO 10.2. Seja B[0; κ] = x ∈ Rn | ∥x∥ # κ, com κ ∈ N a bola fechada de centro
em zero e raio κ. Diz-se que uma sequência (Ψκ )κ∈N é uma sequência Zhislin !para um
.operador /" A e λ ∈ C se (Ψκ )κ∈N ⊂ Dom(A), ∥Ψκ ∥ = 1, supp Ψκ (x) ⊂ x | x ∈
fechado
Rn \ B[0; κ] e ∥(A − λ)Ψκ ∥ → 0 quando κ → ∞.
Se (Ψκ )κ∈N for uma sequência de Zhislin, então Ψκ tem suporte no complemento da bola
fechada B[0; κ]. Observe que, por causa disso, a sequência (Ψκ )κ∈N converge fracamente para
zero. Além disso, pelo Critério de Weyl (Teorema 5.11) é claro que, se A é auto-adjunto e se
existe uma sequência de Zhislin para A e λ, então, λ ∈ σess (A).
Demonstração do Teorema 10.5. Pela desigualdade triangular, temos
∥(H0 + V − λ)Ψκ ∥ − ∥V Ψκ ∥ # ∥(H0 − λ)Ψκ ∥ # ∥(H0 + V − λ)Ψκ ∥ + ∥V Ψκ ∥ .
Suponha que (Ψκ )κ∈N seja uma sequência de Zhislin. Então, o termo
,$ -1/2
2
∥V Ψκ ∥ = dx |V (x)Ψκ (x)| .
Rn \B[0;κ]
vai a zero quando κ → ∞ porque V vai a zero no infinito e ∥Ψκ ∥ = 1 para todo κ. Deste
modo, λ está no espectro essencial de H0 + V se, e somente se, λ ∈ σess (H0 ). Mas, de acordo
com o Teorema 10.3, o espectro do operador H0 é σess (H0 ) = [0, ∞). Consequentemente,
σess (H0 + V ) = [0, ∞).
Potenciais contínuos por partes e limitados, com suporte compacto em Rn , também perten-
cem à classe discutida acima, por exemplo os chamados potenciais de poço quadrado.
TEOREMA 10.6. Assuma que V pertence à classe de potenciais de Kato-Rellich. Então, σess (H0 +
V ) = σess (H0 ) = [0, ∞).
Demonstração Fraca. Pela segunda identidade do resolvente, para λ ∈ ρ(H) ∩ ρ(H0 ) (portanto,
em particular, para qualquer λ < −b/(1 − a) pelo Teorema de Kato-Rellich), em que ρ(H) e
ρ(H0 ) são, respectivamente, os conjuntos resolventes de H e H0 , segue que
(H − λ1I)−1 − (H0 − λ1I)−1 = −(H − λ1I)−1 V (H0 − λ1I)−1 . (10.2.8)
648
O lado esquerdo de (10.2.8) é compacto como vamos mostrar. Primeiro, tome uma sequência
s
(Φℓ )ℓ∈N ⊂ L2 (Rn ) tal que Φℓ −→ 0 na norma L2 (é por assumir a convergência forte que
tornamos a demonstração mais fraca). Sem perda de generalidade, considere a sequência de
funções (Φℓ )ℓ∈N ⊂ L2 (Rn ) definida
⎧ 1
⎨∥x∥− 2 (n+1) se ℓ # ∥x∥ # ℓ + 1 , ℓ = 1, 2, 3, . . .
Φℓ (x) = . (10.2.9)
⎩ 0 caso contrário
Introduzindo coordenadas esféricas x = rω, com r ∈ [0, ∞) e ω ∈ S n−1 , em que S n−1 denota
a esfera de raio um centrada na origem de Rn , segue que
,$ -1/2
−(n+1)
∥Φℓ ∥ = dx ∥x∥
ℓ#∥x∥#ℓ+1
,$ $ ℓ+1 -1/2
n−1 −(n+1)
= dω dr r r
S n−1 ℓ
, $ -1/2 M , -
ℓ+1
n−1 −2 1 1
= ωn−1 dr r r = ωn−1 − ,
ℓ ℓ ℓ+1
s
em que ωn−1 é a área da esfera unitária S n−1 em Rn . Portanto, Φℓ −→ 0 quando ℓ → ∞ na
norma L2 . Isto implica que Φℓ converge fracamente para zero.
Agora, tendo em vista a auto-adjunção de H segue que (H − λ1I)−1 é limitado por

∥(H − λ1I)−1 ∥ # |Im λ|−1 ,
(cf. a Proposição 5.6). Assim, nós temos que
?8 9 ? ? ?
? (H − λ1I)−1 − (H0 − λ1I)−1 Φℓ ? = ?(H − λ1I)−1 V (H0 − λ1I)−1 Φℓ ?
1 ? ?
?V (H0 − λ1I)−1 Φℓ ? .
#
|Im λ|
Por outro lado, nossa hipótese sobre V implica que existem números reais 0 # a < 1 e b > 0
tais que
? ? ? ?
?V (H0 − λ1I)−1 Φℓ ? # a ?H0 (H0 − λ1I)−1 Φℓ ? + b∥(H0 − λ1I)−1 Φℓ ∥
? ?
= a ?(H0 − λ + λ)(H0 − λ1I)−1 Φℓ ? + b∥(H0 − λ1I)−1 Φℓ ∥
# (a|λ| + b)∥(H0 − λ1I)−1 Φℓ ∥ + a∥Φℓ ∥

F G
(a|λ| + b)
# + a ∥Φℓ ∥ .
|Im λ|
Na última desigualdade levamos novamente em consideração a Proposição 5.6. Assim,
F G
?8 9 ?
? (H − λ1I)−1 − (H0 − λ1I)−1 Φℓ ? # a(|λ| + |Im λ|) + b ∥Φℓ ∥ → 0 ,
|Im λ|2
quando ℓ → ∞. Isto implica que (H − λ1I)−1 − (H0 − λ1I)−1 é compacto. Logo, pelo Lema
5.6, segue que σess (H0 + V ) = σess (H0 ) = [0, ∞).
649
Do Teorema 10.5, vimos que a condição do desaparecimento do potencial V no infinito

é suficiente para garantir a invariância do espectro essencial. Podemos refinar a classe de
potenciais de Kato-Rellich de forma a capturar essa característica. Assumiremos que, para
n # 3, V (x) → 0 quando |x| → ∞ pelo menos em algum sentido fraco representado pela
condição que V ∈ L2 (Rn ) + L∞ (Rn )ε ⊂ L2 (Rn ) + L∞ (Rn ), em que ε indica que, para
qualquer ε > 0, podemos decompor V = V1 + V2 , com V1 ∈ L2 (Rn ) e V2 ∈ L∞ (Rn ),
tal que ∥V2 ∥∞ < ε. Em outras palavras, o potencial V é Lloc n
2 (R ) e desaparece (de forma
arbitrariamente lenta) no infinito, isto é, existem constantes R e ε tais que
$
dx |V1 (x)|2 < ∞ e ∥V2 ∥∞ = sup |V (x)| < ε (com |x| > R) .
|x|#R x∈Rn
Equivalentemente, quando assumimos que V ∈ L2 (Rn ) + L∞ (Rn )ε , estamos supondo que a

componente L∞ (Rn ) de V pode ser escolhida arbitrariamente pequena no sentido da norma-
L∞ , ou seja, quando lim sup|x|→∞ |V2 (x)| = 0. Lembramos que o supremum da função V (x)
no intervalo [0, ∞) é exatamente seu maximum, se o maximum existe, e é ∞ se ele não
existe. O supremum não nos diz nada sobre como V (x) se comporta quando x → ∞. Este
é o trabalho do lim sup. Com efeito, o lim sup ignora o que acontece em qualquer intervalo
[0, R] e nos informa o supremum quando olhamos cada vez mais longe no intervalo (R, ∞)
para algum R ∈ R; ou seja,
lim sup |V (x)| = lim

′
sup |V (x)| .
|x|→∞ |x |→∞ |x|"|x′|
Em particular, isso abrange o caso das interações coulombianas, ou potenciais da forma ∥x∥−α
se α < 3/2.
TEOREMA 10.7. Tome V ∈ L2 (Rn ) + L∞ (Rn )ε . Então, σess (H0 + V ) = σess (H0 ) = [0, ∞).
Demonstração. Para localizar o espectro essencial de H = H0 + V , com V ∈ L2 (Rn ) +

L∞ (Rn )ε , analisamos o operador resolvente (H −λ1I)−1 para algum λ ∈
/ σ(H). Como na prova
do Teorema 10.6, nosso objetivo é mostrar que a diferencça (H − λ1I) − (H0 − λ1I)−1 dada
−1
pela Eq.(10.2.8) é compacta como um operador atuando sobre L2 (Rn ), para λ ∈ ρ(H) ∩ ρ(H0 )
(portanto, em particular, para qualquer λ < −b/(1 − a) pelo Teorema de Kato-Rellich), em que
ρ(H) e ρ(H0 ) são, respectivamente, os conjuntos resolventes de H e H0 . Tendo em vista a
auto-adjunção de H segue que (H − λ1I)−1 é limitado por
∥(H − λ1I)−1 ∥ # |Im λ|−1 ,
(cf. a Proposição 5.6). Portanto, resta-nos mostrar que V (H0 − λ1I)−1 é compacto. Para isso,
precisaremos do Teorema de Rellich que diz que a injeção canônica H10 (Ω) :→ L2 (Ω) é um
operador compacto (Ω é um domínio limitado).
TEOREMA 10.8 (Teorema de Rellich). Seja Ω ⊂ Rn um conjunto aberto e limitado. Assuma
que H10 (Ω) é o fecho de C0∞ (Ω) no espaço de Sobolev H1 (Ω). Então, para qualquer sequência
limitada (Ψℓ )ℓ∈N em H10 (Ω) existe uma subsequência (Ψℓk )k∈N ⊂ (Ψℓ )ℓ∈N tal que (Ψℓk )k∈N
converge fortemente em L2 (Ω).
Nota 10.7. (1) Aqui lembramos que se Ω é um conjunto aberto em Rn , diz-se que a função
Ψ : Ω → C está em H1 (Ω) se Ψ ∈ L2 (Ω) e se seu gradiente distribucional, ∇Ψ =
650
(∂1 Ψ, . . . , ∂j Ψ), é uma função que também está em L2 (Ω). De acordo com o desenvolvimento
realizado no Capítulo 6, ∇Ψ ∈ L2 (Ω) significa que existem funções Φ1 , . . . , Φn em L2 (Ω),
coletivamente denotadas por ∇Ψ, tal que para todo Θ ∈ C0∞ (Ω)
$ $
∂
dx Ψ(x) Θ(x) = − dx Φj (x)Θ(x) , j = 1, . . . , n .
Ω ∂xj Ω
O espaço H10 (Ω) ⊂ L2 (Ω), com produto escalar ⟨ · , · ⟩H1 (Ω) definido por
⟨Ψ, Φ⟩H1 (Ω) = ⟨Ψ, Φ⟩L2 (Ω) + ⟨∇Ψ, ∇Φ⟩L2 (Ω) , (10.2.10)
e munido com a norma-forma (veja a Nota 10.2)

,$ $ -1/2
2 2
∥Ψ∥H1 (Ω) = dx |Ψ(x)| + dx |∇Ψ(x)| , (10.2.11)
Ω Ω
é um espaço de Hilbert por construção, sendo um subespaço fechado do espaço de Hilbert

H1 (Ω) (cf. o Capítulo 10, do livro de F. Hirsch e G. Lacombe, “Elements of Functional Analysis,”
Springer Verlag, 1999). Obviamente, é verdade que Ψ está em H1 (Ω) se, e somente se,
∥Ψ∥H1 (Ω) < ∞. Note que, ∥Ψ∥H1 (Ω) " ∥Ψ∥2 , para todo Ψ ∈ C0∞ (Ω).
(2) O subespaço H10 (Ω) gera o ambiente natural para se discutir equações diferenciais
com condições de fronteira nula, já que as funções em H10 (Ω) são aquelas de H1 (Ω) que
desaparecem em ∂Ω.
(3) Quando Ω = Rn , então, C0∞ (Rn ) é denso em H1 (Rn ). Portanto, neste caso, H10 (Rn ) =
H (Rn ). Caso contrário, se Ω é limitado, então, H10 (Ω) ̸= H1 (Ω) (veja a Nota 10.2).
1
Vamos dar uma prova do teorema da compacidade de Rellich que pode ser vista como sendo
a versão para espaços de Hilbert do Teorema de Arzelà. Para isto, o seguinte lema será crucial.
def.
LEMA 10.2. Sejam Q = (0, 2π)n ⊂ Rn e (Φn )n∈N ⊂ C0∞ (Q) uma sequência limitada, no
sentido que ∥Φn ∥ < C para todo n ∈ N. Então, existe uma subsequência (Φnk )k∈N ⊂ (Φn )n∈N
e Φ ∈ H10 (Q) tal que (Φnk )k∈N converge fortemente para Φ ∈ L2 (Q) e (Φnk )k∈N converge
fracamente para Φ ∈ H10 (Q).
Demonstração. Vamos dividir a prova em quatro passos.
Passo 1: Como L2 (Q) e H10 (Q) são espaços de Hilbert separáveis, de acordo com o
Teorema 3.16, existem subsequências (Φn1k )k∈N ⊂ (Φn )n∈N e (Φn2k )k∈N ⊂ (Φn1k )k∈N e vetores
Φ ∈ L2 (Q) e Ψ ∈ H10 (Q) tais que
w w
Φn1k −→ Φ ∈ L2 (Q) e Φn2k −→ Ψ ∈ H10 (Q) ,
quando k → ∞. Vamos mostrar que Φ = Ψ. Para este propósito, podemos assumir sem
N n = Φn − Ψ. Para
perda de generalidade que Ψ = 0, pois caso contrário, consideraríamos Φ
1
Θ ∈ L2 (Q), definimos um funcional linear ℓΘ : H0 (Q) → C definindo
ℓΘ (Φ) = ⟨Θ, Φ⟩ , ∀ Φ ∈ H10 (Q) .
651
Como ℓΘ (Φ) # ∥Θ∥2 ∥Φ∥2 # ∥Θ∥2 ∥Φ∥H1 (Q) , segue, pelo Teorema de Representação de Riesz-
N ∈ H1 (Q) tal que
Fréchet (Teorema 4.9), que existe um único vetor Θ 0
N Φ⟩H1 (Q) ,
⟨Θ, Φ⟩ = ⟨Θ, ∀ Φ ∈ H10 (Q) .
Logo, para um vetor Θ ∈ L2 (Q) arbitrário, segue que

N Φn ⟩H1 (Q) → 0
⟨Θ, Φn2k ⟩ = ⟨Θ, quando k → ∞ ,
2k
w
de maneira que Φn2k −→ 0 em L2 (Q) e, portanto, Φ = Ψ. Para simplificar a notação,
escrevemos daqui em diante
w w
Φn −→ Φ ∈ L2 (Q) e Φn −→ Φ ∈ H10 (Q) ,
quando n → ∞.
Passo 2: Para k ∈ Zn , defina

n
]
−n/2 ikx −n/2
Ψk (x) = (2π) e = (2π) eikj xj .
j=1
A família {Ψk }k∈Zn é uma base ortonormal de L2 (Q) (série de Fourier). Pelo Teorema de
Parseval,
<
|⟨Φn , eikx ⟩|2 = (2π)n ∥Φn ∥22 # C1 .
k∈Zn
Mas, como ∥∂j Φn ∥ # C, para j = 1, . . . , n, podemos concluir que

<
|⟨∂j Φn , eikx ⟩|2 = (2π)n ∥∂j Φn ∥22 # C2 , j = 1, . . . , n .
k∈Zn
Considerando que
⟨∂j Φn , eikx ⟩ = −⟨Φn , ∂j eikx ⟩ = −ik⟨Φn , eikx ⟩ ,
obtemos que existe uma constante C3 " 0 tal que

<
(1 + ∥k∥2 )|⟨Φn , eikx ⟩|2 # C3 , n∈N.
k∈Zn
;n
Aqui, ∥k∥2 = 2
j=1 kj .
w
Passo 3: Como Φn −→ Φ, quando n → ∞, temos que
⟨Φn , eikx ⟩ → ⟨Φ, eikx ⟩ , ∀ k ∈ Zn ,
de forma que a sequência numérica (⟨Φn , eikx ⟩)n∈N ⊂ C é uma sequência de Cauchy para
todo k ∈ Zn .
Passo 4: Afirmamos que (Φn )n∈N é uma sequência de Cauchy em L2 (Q). Para isto, tome
um ε > 0 arbitrário e R = (C3 /ε)−1/2 . Observamos que existe somente uma quantidade
652
finitamente grande de k ∈ Zn tal que ∥k∥2 # R2 . Logo, de acordo com o Passo 2, existe
Nε ∈ N tal que
< <
(2π)−n (1 + ∥k∥2 )|⟨Φn − Φm , eikx ⟩|2 # (2π)−n (1 + R2 )|⟨Φn − Φm , eikx ⟩|2 # C3 .
∥k∥#R ∥k∥#R
Isto implica que

< C3 C3
(2π)−n |⟨Φn − Φm , eikx ⟩|2 # 2
# 2 #ε, n, m " Nε .
1+R R
∥k∥#R
Portanto, pelo Teorema de Parseval, para n, m " Nε , segue que

<
∥Φn − Φm ∥22 = (2π)−n |⟨Φn − Φm , eikx ⟩|2
k∈Zn
⎛ ⎞
< <
= (2π)−n ⎝ + ⎠ |⟨Φn − Φm , eikx ⟩|2
∥k∥#R ∥k∥>R
< ∥k∥2
# ε + (2π)−n |⟨Φn − Φm , eikx ⟩|2
R2
∥k∥>R
< ∥k∥2
# ε + (2π)−n 2
|⟨Φn − Φm , eikx ⟩|2
k∈Zn
R
< ∥k∥2 6 7
# ε + 2(2π)−n |⟨Φn , eikx 2
⟩| + |⟨Φm , eikx 2
⟩|
k∈Zn
R2
# ε + 4(2π)−n C3 R−2
# 2ε .
w
Como Φn −→ Φ, a propriedade de Cauchy mostra que ∥Φn − Φ∥2 → 0. Isto finaliza a prova
do lema.
Demonstração do Teorema 10.8. Assuma que (Φn )n∈N ⊂ H10 (Ω) é uma sequência limitada,
no sentido que ∥Φn ∥H1 (Ω) < C1 para todo n ∈ N. Seja Q ⊂ Rn um cubo (aberto) tal
que Ω ⊂ Q. Como C0∞ (Ω) é denso em H10 (Ω), então, para todo Φn ∈ H10 (Ω), existe
Ψn ∈ C0∞ (Ω) ⊂ C0∞ (Q) tal que ∥Φn − Ψn ∥H1 (Ω) # n−1 . Como ∥Ψn ∥H1 (Ω) < C2 , pelo Lema
10.2, existe uma subsequência (Ψnk )k∈N ⊂ (Ψn )n∈N e Φ ∈ H10 (Q) tais que
s w
Ψnk −→ Ψ ∈ L2 (Q) e Ψnk −→ Ψ ∈ H10 (Q) , (10.2.12)
5
quando k → ∞. Seja Ψ′ = Ψ5Ω ; então, Ψ′ ∈ L2 (Q) e Ψnk −→ Ψ′ ∈ L2 (Q). Mas, por
w
(10.2.12) e o fato que H10 (Ω) ⊂ H10 (Q), segue que
⟨Ψnk , Φ⟩H10 (Ω) −→ ⟨Ψ, Φ⟩H10 (Ω) , ∀ Φ ∈ H10 (Ω) . (10.2.13)
653
Portanto, (Ψnk )k∈N converge fracamente em H10 (Ω). Como os espaços de Hilbert são fraca-
w
mente sequencialmente fechados, existe Θ ∈ H10 (Ω) com Ψnk −→ Θ ∈ H10 (Ω). Agora, a
w
Eq.(10.2.13) implica que Θ = Ψ′ , em particular Ψ′ ∈ H10 (Ω) e Ψnk −→ Ψ′ ∈ H10 (Ω). Mas,
s w
então, Φnk −→ Ψ′ ∈ L2 (Ω) e Φnk −→ Ψ′ ∈ H10 (Ω).
Retornando à demonstração do Teorema 10.7. Selecione uma sequência (Φℓ )ℓ∈N ⊂ L2 (Rn )
w
tal que Φℓ −→ 0. Assuma que
Ψℓ = (H0 − λ1I)−1 Φℓ ,
em que Ψℓ ∈ Dom(H0 ). Considerando que a sequência (Φℓ )ℓ∈N converge fracamente, então
(Φℓ )ℓ∈N é limitada em L2 (Rn ). Como (H0 − λ1I)−1 é limitado, a sequência (Ψℓ )ℓ∈N também
é limitada no domínio Dom(H0 ) e converge fracamente para zero em Dom(H0 ) ⊂ L2 (Rn ).
Agora, para qualquer ε > 0, decompomos V as V = V1 + V2 , em que V1 ∈ L2 (Rn ) e

V2 ∈ L∞ (Rn )ε . Então, aplicando a desigualdade de Hölder, segue que
∥V2 Ψℓ ∥2 = ∥V2 (H0 − λ1I)−1 Φℓ ∥2
# ∥V2 ∥∞ ∥(H0 − λ1I)−1 Φℓ ∥2
# ε|Im λ|−1∥Φℓ ∥2
# ε∥Φℓ ∥2 . (10.2.14)
Isto implica que ∥V2 (H0 − λ1I)−1 ∥ # ε. A seguir, observe que como V1 é limitado, existe
K " 0 tal que |V1 (x)| # K, para todo x ∈ Rn . Tome BR = {x ∈ Rn | |x| < R} como sendo
n ∞
5 raio R > 0 em torno do zero em R . Assuma que θR ∈1C0 (B2R ) é tal que
a bola aberta com
0 # θR # 1, θR 5B = 1. Então, a sequência (θR Ψℓ )ℓ∈N é limitada em H (B2R ). Lembramos
R
que o Teorema de Rellich para a compacidade nos dá que a inclusão
H1 (B2R ) :→ L2 (B2R ) ,
é compacta. Isso significa que existe uma subsequência (θR Ψℓk )k∈N ⊂ (θR Ψℓ )ℓ∈N tal que
(θR Ψℓk )k∈N converge fortemente em L2 (B2R ). Vamos mostrar que ∥V1 Ψℓ ∥ converge para zero.
Com a ajuda da função θR definida acima, segue-se que
∥V1 Ψℓ ∥2 # ∥V1 θR Ψℓ ∥2 + ∥V1 (1 − θR )Ψℓ ∥2
# ∥V1 θR Ψℓ ∥2 + ∥V1 (1 − θR )∥∥Ψℓ ∥2 . (10.2.15)
O primeiro termo pode ser tomado como sendo menor que ε escolhendo ℓ grande, uma vez
que V1 é limitado, isto é, existe ℓ0 ∈ N tal que ∥θR Ψℓ ∥ # ε/K para todo ℓ " ℓ0 . Como Ψℓ
converge fracamente para zero, existe uma constante positiva M tal que ∥Ψℓ ∥2 # M. Portanto,
por hipótese, o segundo termo pode ser tomado como sendo menor que ε vezes uma constante
positiva escolhendo-se R grande. Consequentemente, para ℓ grande o bastante, o lado direito
de (10.2.15) é menor do que ε vezes uma constante positiva. Isto implica que V1 Ψℓ → 0 em
L2 (Rn ) quando ℓ → ∞, visto que ε é arbitrário. Logo, V1 (H0 − λ1I)−1 é compacto.
654
Finalmente, por (10.2.14), temos que
∥V (H0 − λ1I)−1 − V1 (H0 − λ1I)−1 ∥ < ε .
Dessa forma, pelo Teorema 5.24, sendo V (H0 − λ1I)−1 aproximado por operadores compactos
é ele próprio compacto. Logo, temos que (H − λ1I)−1 − (H0 − λ1I)−1 é igual ao produto de
um operador compacto e de um operador limitado. Como, pelo Teorema 5.22(b), o produto de
um operador compacto com um operador limitado é compacto, isso comprova a compacidade
em L2 (Rn ). Isto significa que H e H0 têm o mesmo espectro essencial pelo Lema 5.6, isto é,
σess (H) = σess (H0 ) = [0, ∞).
PROPOSIÇÃO 10.5. Se Re λ < 0 e se V ∈ L2 (R3 ) + L∞ (R3 )ε , então,
lim ∥V (H0 − λ1I)−1 ∥ = 0 .

Re λ→−∞
Demonstração. Como V ∈ L2 (R3 ) + L∞ (R3 )ε , então para todo Ψ ∈ Dom(H0 ) nós temos
que Ψ ∈ Dom(V ). Pela Proposição 10.4, podemos assumir que Ψ = (H0 − λ1I)−1 Φ. Assim,
de forma similar à prova do Teorema 10.6, nossa hipótese sobre V implica que, para Re λ < 0,
existem números reais 0 # a < 1 e b > 0 tais que
, -
? ?
?V (H0 − λ1I)−1 Φ? # 2a + b ∥Φ∥2 .
2 |λ|
Portanto, temos que
? ?
?V (H0 − λ1I)−1 ? # 2a + b .
|λ|
Como a pode ser escolhido arbitrariamente pequeno, concluímos que
lim ∥V (H0 − λ1I)−1 ∥ = 0 .

Re λ→−∞
Apresentaremos, a seguir, uma segunda prova do Teorema 10.7 usando a teoria de equações
integrais com kernels de Hilbert-Schmidt. Para isto, precisamos de alguns resultados auxiliares.
Começamos com a seguinte
DEFINIÇÃO 10.3. Seja Ω ⊆ Rn um aberto e K ∈ L2 (Ω × Ω). Então, o operador integral K
definido por $
KΨ(x) = dy K (x, y)Ψ(y) ,
Ω
é chamado operador integral de Hilbert-Schmidt se
,$ $ -1/2
2
dxdy |K (x, y)| <∞. (10.2.16)
Ω Ω
Neste caso, a função K ∈ L2 (Ω × Ω) é chamada kernel de Hilbert-Schmidt.
655
De acordo com a definição acima, K é um operador que mapeia todo elemento de L2 (Ω)
em um elemento de L2 (Ω). Com efeito, pela desigualdade de Hölder,
5$ 5 ,$ -1/2 ,$ -1/2
5 5
5 dy K (x, y)Ψ(y)5 # dy |K (x, y)| 2
dy |Ψ(y)| 2
,
5 5
Ω Ω Ω
ou
,$ - ,$ -
2 2 2
|KΨ(x)| # dy |K (x, y)| dy |Ψ(y)| .
Ω Ω
Consequentemente,
$ ,$ $ -
∥KΨ∥22 = dx |KΨ(x)| # 2
dxdy |K (x, y)| 2
∥Ψ∥22 ,
Ω Ω Ω
pelo Teorema de Fubini, uma vez que a integral acima é finita pela Eq.(10.2.16). Logo, ∥KΨ∥2 é
finito, como afirmamos acima. A Eq.(10.2.16) também fornece uma estimativa útil para a norma
de K. A partir dela, concluímos que
,$ $ -1/2
2
∥KΨ∥2 # dxdy |K (x, y)| ∥Ψ∥2 ,
Ω Ω
para todo elemento Ψ ∈ L2 (Ω) e, portanto,

,$ $ -1/2
2
∥K∥2 # dxdy |K (x, y)| .
Ω Ω
Dessa forma, isto mostra que o domínio Dom(H) = L2 (Ω) e que K é um operador limitado
em L2 (Ω).
TEOREMA 10.9. Seja Ω ⊆ Rn um aberto. Se K é um operador de Hilbert-Schmidt, com kernel
integral K ∈ L2 (Ω × Ω), então, K é compacto e
∞
< $ $
∥KΨn ∥22 # dxdy |K (x, y)|2 , (10.2.17)
n=1 Ω Ω
para qualquer sitema ortonormal completo {Ψn } em L2 (Ω).
Demonstração. Nós já provamos acima que K é limitado. Para provar que K é compacto, basta
mostrar que K é o limite na norma de uma sequência de operadores de rank finito. Seja
{Ψn } um sistema ortonormal completo em L2 (Ω). Então, pelo Teorema 3.9, para qualquer
Ψ ∈ L2 (Ω),
< < ,$ -
Ψ(x) = ⟨Ψn , Ψ⟩Ψn (x) = dy Ψn (y)Ψ(y) Ψn (x) ,
n n Ω
e
< < ,$ -
KΨ(x) = ⟨Ψn , Ψ⟩KΨn (x) = dy Ψn (y)Ψ(y) KΨn (x) .
n n Ω
656
Então,
< < <$
∥KΨn ∥22 = ⟨KΨn , KΨn ⟩ = dx KΨn (x)KΨn (x)
n n n Ω
<$ $
= dxdy K (x, y)Ψn (y)K (x, y)Ψn (y)
n Ω Ω
<$ $
= dxdy |K (x, y)Ψn (y)|2
n Ω Ω
$ ( )
<$
= dx dy |K (x, y)Ψn (y)|2
Ω n Ω
$ ( )
<
= dx |KΨn (x)|2
Ω n
,$ $ -
2
# dxdy |K (x, y)| .
Ω Ω
Aqui, usamos a desigualdade de Bessel na última etapa, uma vez que K ( · , y) ∈ L2 (Ω) como
função de y. Isto prova a Eq.(10.2.17). Agora, introduzimos uma família de operadores de rank
finito Km por
m
<
Km Ψ(x) = ⟨Ψn , Ψ⟩KΨn (x) .
n=1
Queremos provar que limm→∞ Km = K no sentido uniforme para

<
∥KΨ − Km Ψ∥2 = |⟨Ψn , Ψ⟩|∥KΨn∥2
n"m+1
( )1/2 ( )1/2
< <
2
# |⟨Ψn , Ψ⟩| ∥KΨn ∥22 ,
n"m+1 n"m+1
pela desigualdade de Cauchy-Schwarz-Bunjakowski. Pela identidade de Parseval (veja o Teorema

3.9(iv))
<∞
∥Ψ∥2 = |⟨Ψn , Ψ⟩|2 ,
n=1
obtemos que
( )1/2
<
∥KΨ − Km Ψ∥2 # ∥Ψ∥2 ∥KΨn ∥22 .
n"m+1
;m 2
Pela
; a Eq.(10.2.17), a série n=1 ∥KΨn ∥2 converge quando m → ∞ e, portanto, a soma
2
n"m+1 ∥KΨn ∥2 → 0 quando m → ∞. Consequentemente, dado um ε > 0 arbitário, existe
657
um mε tal que para todo m > mε segue que

∥(K − Km )Ψ∥2
∥K − Km ∥2 = sup <ε.
Ψ̸=0 ∥Ψ∥2
Logo, limm→∞ ∥K − Km ∥2 = 0. Dessa forma, pelo Teorema 5.24, K é compacto.
Demonstração Alternativa do Teorema 10.7. Daremos a prova para o caso tridimensional. Da

primeira prova vimos que, de acordo com a Eq.(10.2.14), para qualquer Φ ∈ L2 (R3 ),
∥V2 (H0 − λ1I)−1 Φℓ ∥2 # ∥V2 ∥∞ ∥(H0 − λ1I)−1 Φℓ ∥2 # ε∥Φℓ ∥2 .
Portanto, segue que ∥V2 (H0 −√λ1I)−1 ∥ # ε. A seguir, com a ajuda da Eq.(10.2.2), observamos
que V1 (H0 − λ1I)−1 , com Im λ ̸= 0, é um operador integral com o kernel dado por
1 √
K (x, y) = V1 (x) ei λ∥x−y∥
4π∥x − y∥
De fato, para qualquer Φ ∈ L2 (R3 ),

$ √
−1 1 1
V1 (H0 − λ1I) Φ(x) = V1 (x) dy ei λ∥x−y∥ Φ(y)
4π R3 ∥x − y∥
$ √
= dy K (x, y)Φ(y) com Im λ > 0 .
R3
Pela primeira prova do Teorema

√ 10.3, para um número complexo λ ∈ / [0, ∞), com o ramo da
raiz quadrada dado por Im λ > 0, esse kernel é um kernel de Hilbert-Schmidt uma vez que
V1 ∈ L2 (R3 ). Com efeito,
$ $ ,$ -, $ √
-
2 2 1 1 2i λ∥x−y∥
dxdy |K (x, y)| = dx |V1 (x)| dy e
R3 R3 R3 16π 2 R3 ∥x − y∥2
,$ -
1 2
# √ dx |V1 (x)| < ∞ .
8πIm λ R3
Portanto, pelo Teorema 10.9, o operador V1 (H0 − λ1I)−1 é compacto. Agora, como na parte
final da primeira prova, temos que
∥V (H0 − λ1I)−1 − V1 (H0 − λ1I)−1 ∥ < ε .
Dessa forma, pelo Teorema 5.24, sendo V (H0 − λ1I)−1 aproximado por operadores compactos
é ele próprio compacto. Logo, temos que (H − λ1I)−1 − (H0 − λ1I)−1 é igual ao produto de
um operador compacto e de um operador limitado. Como, pelo Teorema 5.22(b), o produto de
um operador compacto com um operador limitado é compacto, isso comprova a compacidade
em L2 (R3 ). Isto significa que H e H0 têm o mesmo espectro essencial pelo Lema 5.6, isto é,
σess (H) = σess (H0 ) = [0, ∞).
PROPOSIÇÃO 10.6. Seja H = H0 + V , em que V pertence à classe de potenciais de Kato-Rellich.
Se existe uma função Ψ ∈ Dom(H), com ⟨Ψ, HΨ⟩ < 0, então H possui pelo menos um
auto-valor negativo.
658
Demonstração. Se a afirmação da proposição estivesse errada, então σ(H) ∩ (−∞, 0) = ∅

indicando que σ(H) ⊂ [0, ∞). Pelo teorema espectral, isso implicaria que H " 0, ou
seja, ⟨Ψ, HΨ⟩ " 0 para toda função Ψ ∈ Dom(H) em contradição com a suposição que
⟨Ψ, HΨ⟩ < 0.
De acordo com o Teoremas 10.6 e a Proposição 10.6 podemos concluir que os auto-valores
negativos do espectro de H0 + V são auto-valores com multiplicidade finita, com H0 + V
podendo ter apenas auto-valores negativos isolados (e eles são de importância na física quântica
quando se pensa em espectroscopia), possivelmente acumulando-se em 0 (veja a representação
gráfica baixo).
0
σ(H0 + V ) =
B CD E B CD E R
σdisc (A) σess (A)
Exemplo 10.2 (Potencial esfericamente simétrico). Um potencial V : Rn → R é esfericamente

simétrico (também chamado radial ou central) se seus valores dependem apenas de r = ∥x∥,
isto é, se existir V : [0, ∞) → R, de modo que V (x) = V (r). Por exemplo, se n = 3, o
potencial coulombiano V (x) = −1/∥x∥ discutido no Exemplo 10.1 é esfericamente simétrico,
V (x) = V (r), com r = ∥x∥. Vamos considerar em particular o potencial V : R3 → R. A
ideia principal é separar H = H0 + V (r) em coordenadas esféricas e obter os auto-valores
negativos e as auto-funções associadas da seguinte maneira: primeiro, usando separação de
variáveis, assuma que11
Ψnℓm (x) = ψnℓ (r)Yℓm (θ, ϕ) , (10.2.18)
para as auto-funções Ψnℓm e auto-valores λn de H0 + V (r) no espaço Hilbert
L2 (R3 ) = L2 ((0, ∞); r 2dr) ⊗ L2 (S 2 , dω) ,
segue que12
F , 2 - G
∂ 2 ∂ 1 ψnℓ (r)
HΨnℓm(x) = − + ψnℓ (r) − ψnℓ (r) Yℓm (θ, ϕ) + BS 2 Yℓm (θ, ϕ) ,
∂r r ∂r r r2
sendo BS 2 o operador Laplace-Beltrami
, , - -
1 ∂ ∂ 1 ∂2
BS 2 = − sin θ + .
Esse operador é exatamente o operador L2 que aparece na álgebra gerada pelos operadores
momentum angular, agora escrito na forma de um operador diferencial em coordenadas esféricas
– veja o Lema 9.5.
11
Aqui, n, ℓ e m são números quânticos, denominados número quântico principal, número quântico orbital
e número azimutal, respectivamente. Para mais detalhes sobre estes números, veja o livro-texto de N. Zettili,
“Quantum Mechanics Concepts and Applications,” Second Edition, John Wiley and Sons, Ltd., Publication, 2009.
12
Mais uma vez, estamos ignorando as constantes físicas, isto é, estamos usando unidades atômicas com
# = e2 = 2m = 1.
659
Nota 10.8. O operador , -

∂2 2 ∂
+ ,
∂r r ∂r
pode ser visto como o operador energia cinética radial, enquanto que o operador r12 BS 2 pode
ser identificado com o operador energia cinética rotacional, pois esse operador está associado
com uma rotação “pura” da partícula em torno da origem.
A seguir, determina-se os auto-valores e as auto-funções do operador Laplace-Beltrami atu-

ando em L2 (S 2 , dω). BS 2 com o domínio C0∞ (S 2 ), em que S 2 é a esfera unitária em duas
dimensões, é essencialmente auto-adjunto, possui espectro puramente discreto (veja os detalhes
na Capítulo 9, Subseção 9.2.2), e suas auto-funções Yℓm (θ, ϕ), restritas à esfera, são os harmô-
nicos esféricos, que constituem uma base ortonormal de L2 (S 2 , dω) (assim, se a partícula se
mover ao longo de um raio a partir da origem em R3 , apenas o valor de ψnℓ (r) irá variar).
Lembre-se que
BS 2 Yℓm (θ, ϕ) = ℓ(ℓ + 1)Yℓm (θ, ϕ) , ℓ∈N, −ℓ # m # ℓ ,
em que ℓ é o momento angular de Ψ. Observe que, neste caso, as informações sobre o operador
BS 2 são independentes do potencial V .
Agora, assuma que Ωℓ é o subespaço gerado pelas funções Yℓm (θ, ϕ) e que Lℓ = L2 ((0, ∞); r 2dr)⊗
Ωℓ . Então, h
L2 (R2 ) = Lℓ .
ℓ∈Z
Se 1Iℓ é o operador
5 identidade em Ωℓ , a restrição do operador hamiltoniano H a Dℓ = D ∩ Lℓ
é dada por H 5D = Hℓ ⊗ 1Iℓ , nos dá uma equação diferencial ordinária (chamada Equação
ℓ
Diferencial de Bessel) para ψ ∈ C0∞ (0, ∞) ⊂ L2 ((0, ∞); r 2dr),
F , 2 - G
d 2 d ℓ(ℓ + 1) 1
Hℓ ψnℓ (r) = − + + − ψnℓ (r) = λn ψ(r) .
dr 2 r dr r2 r
É conveniente introduzir a transformação unitária U : L2 ((0, ∞); r 2dr) → L2 (0, ∞) represen-

tada pelo operador unitário (U ψnℓ )(r) = rψnℓ (r). Este operador deixa C0∞ (0, ∞) invariante.
Isto nos leva à seguinte equação diferencial:
F G
d2 ℓ(ℓ + 1) 1
Hℓ ψnℓ (r) = − 2 + − ψnℓ (r) = λn ψnℓ (r) . (10.2.19)
dr r2 r
Note que, podemos extrair o seguinte potencial efetivo da equação acima:

ℓ(ℓ + 1)
Veff (r) = V (r) + .
r2
O potencial Veff é conhecido como potencial efetivo ou centrífugo, pois o termo extra ℓ(ℓ+1)/r 2
é um potencial repulsivo, associado ao momento angular orbital, que tende a repelir a partícula
para longe do centro. Portanto, para que a equação de auto-valor (10.2.19) descreva estados
ligados, o potencial V (r) deve ser atrativo (isto é, negativo) já que o termo ℓ(ℓ + 1)/r 2 é
repulsivo. Por isso mesmo, o termo extra no potencial Veff (r) é também chamado barreira
660
centrífuga. Especialmente para a física nuclear, esse termo desempenha um papel importante
para lidar com o problema de espalhamento. Quando o momento angular orbital, ℓ, torna-se
grande, a barreira centrífuga causa um grande efeito no espalhamento, já que à medida que
o momento angular da partícula aumenta, a partícula se torna cada vez menos ligada. Se a
energia de espalhamento for inferior a 10 mega-elétron-volts, E < 10 MeV , o espalhamento
nucleon-nucleon é essencialmente dado pela onda-s; ou seja, ℓ = 1. Em outras palavras, a
barreira centrífuga não faz diferença devido ao pequeno valor da energia. Por isto, devido ao fato
do potencial Veff ser contínuo e Veff (r) → 0 quando r → ∞ e como V (r) = −1/r pertence à
classe de potenciais de Kato-Rellich, pelo Teorema 10.7, segue que σess (−∇2 + V ) = [0, +∞).
Nota 10.9. Observe que embora (10.2.19) possua a estrutura de uma equação de auto-valor uni-
dimensional, ela difere da equação de Schrödinger unidimensional em um aspecto importante:
a variável r não pode ter valores negativos, pois varia de r = 0 a r → ∞. Portanto, devemos
exigir que a função de onda Ψnℓm (x) seja finita para todos os valores de r entre 0 e ∞,
notadamente para r = 0. Mas, se ψnℓ (0) for finito, rψnℓ (r) deve desaparecer em r = 0, ou
seja,13
lim rψnℓ (r) = 0 .
r→0
Para o potencial de Coulomb em R3 , obtém-se uma sequência infinita de auto-valores

negativos. No caso do átomo do hidrogênio, considerando que
inf ⟨Ψ, −∇2 Ψ⟩ = inf σ(−∇2 ) = 0 ,

Ψ∈Dom(−∇2 )
∥Ψ∥=1
então, de acordo com o Teorema Kato-Rellich, −∇2 +V é (experimentalmente) limitado inferior-

mente por −13, 6 eV , tendo uma infinidade de auto-valores negativos entre −13, 6 eV e 0 eV .
Isto significa que, no caso do átomo do hidrogênio, temos que σdisc (−∇2 +V ) = [−13, 6 eV , 0)
(veja a representação gráfica baixo).
σ(−∇2 − 1/∥x∥) =
−13, 6 eV R
0 eV
10.2.3 Potenciais do Tipo V (x) → ∞ Quando |x| → ∞
A seguir, consideramos operadores de Schrödinger H = H0 + V com potenciais contínuos

V , com V (x) → ∞ quando |x| → ∞. O exemplo mais importante nesta classe é o oscilador
harmônico para o qual V (x) = ∥x∥2 , x ∈ Rn . No estudo do operador de Schrödinger com um
potencial do tipo acima, mostraremos que sob determinada hipótese de compacidade o espectro
de H é um conjunto discreto, enumerável e não limitado, ou sucintamente, H tem espectro
puramente discreto.
13
Veja a Proposição 9.35 no livro de B.C. Hall, “Quantum Theory for Mathematicians,” Springer, 2013.
661
Para simplificar, vamos assumimos (sem perda de generalidade) que V (x) " 0, com x ∈ Rn .
Seja H10,V (Rn ) o completamento do espaço pré-Hilbert (C0∞ (Rn ), ⟨ · , · ⟩H1V (Rn )) , em que
$
⟨Φ, Ψ⟩H1V (Rn ) = ⟨Φ, Ψ⟩H1 (Rn ) + dx Φ(x)V (x)Ψ(x) .
Rn
É fácil ver que

# $ %
H10,V n 1 n
(R ) = Ψ ∈ H0 (R ) | dx V (x)|Ψ(x)| < ∞ 2
Rn
# $ %
= H10 (Rn ) ∩ Ψ ∈ L2 (R ) | n 2
dx V (x)|Ψ(x)| < ∞ .
Rn
5
A extensão de Friedrichs de H0 + V 5C ∞ (Rn ) é caracterizada pela seguintes propriedades:
0
C0∞ (Rn ) ⊂ Dom(H) ⊂ H10,V (Rn ) ,

e
⟨Φ, Ψ⟩H1V (Rn ) = ⟨Φ, HΨ⟩ , ∀ Ψ ∈ Dom(H) e Φ ∈ H1V (Rn ) .
Além disso, Dom(H) é denso em H1V (Rn ) em relação àa norma ∥ · ∥H1V (Rn )} .
TEOREMA 10.10. Seja V : Rn → R uma função contínua em L2 (Rn ) satisfazendo as seguintes
condições: V (x) " 0 e V (x) → ∞ quando |x| 5 → ∞. Assuma que H = H0 + V é uma
extensão auto-adjunta de Friedrichs de H0 + V 5C ∞ (Rn ) . Então,
0
(i) Rλ0 (H) = (H − λ0 1I)−1 é um operador compacto para algum λ0 ∈ ρ(H) e, portanto,
λ ∈ ρ(H);
(ii) σ(H) = σdisc (H) e σess (H) = ∅;
(iii) existe uma base ortonormal {Φn }n de L2 (Rn ) construída de auto-vetores de H, HΦn =
λn Φn , para todo n, com auto-valores reais µn , contando suas multiplicidades, satisfazendo
limn→∞ |λn | = ∞ e, portanto, cada um deles de multiplicidade finita.
Demonstração. A compacidade do resolvente Rλ (H) = (H − λ1I)−1 terá um papel decisivo na

w
nossa prova. Com efeito, tome λ0 ∈ ρ(H) tal que H − λ0 1I " 1. Assuma que Φn −→ 0 em
H = L2 (Rn ). Defina Ψn (x) = (H − λ0 1I)−1 Φn (x). Mostramos que existe uma subsequência
(Ψnk )k∈N ⊂ (Ψn )n∈N tal que ∥Ψnk ∥2 → 0 quando k → ∞. Primeiro, o fato de (Φn )n∈N
convergir fracamente implica que (Φn )n∈N é limitado em H . Como, pela Proposição 10.4,
(H −λ0 1I)−1 é limitado, a sequência (Ψn )n∈N também é limitada em H e converge fracamente
a zero em H . Além disso, Ψn ∈ Dom(H) e
∥HΨn ∥2 = ∥(H − λ0 1I)Ψn + λ0 Ψn ∥2
# ∥(H − λ0 1I)Ψn ∥2 + |λ0 |∥Ψn ∥2
= ∥(H − λ0 1I)(H − λ0 1I)−1 Φn ∥1 + |λ0 |∥Ψn ∥2
# ∥Φn ∥2 + |λ0 |∥Ψn ∥2 # C1 .
662
Pela definição de H, segue que

$
∥Ψn ∥2H1 (Rn ) = ∥Ψn ∥2H1 (Rn ) + dx V (x)|Ψn (x)|2
V
Rn
= ⟨Ψn , HΨn ⟩ + ∥Ψn ∥22
# ∥HΨn ∥2 ∥Ψn ∥2 + ∥Ψn ∥22

6 7
# C1 + ∥Ψn ∥2 ∥Ψn ∥2 # C2 . (10.2.20)
Dado um ε > 0 arbitrário, escolhemos um R " 0 tal que
V (x) " ε−1 quando |x| " R .
Pela Eq.(10.2.20) temos que $

dx V (x)|Ψn (x)|2 # C2 .
Rn
Logo, segue que $

dx |Ψn (x)|2 # C2 ε .
|x|"R
A seguir, vamos tomar θ5R ∈ C0∞ (B2R ), em que B2R é a bola aberta de centro zero em Rn
e raio 2R. Assuma que θR 5B = 1 e 0 # θR # 1. Observamos que por causa da desigualdade
R
(10.2.20), temos
$
2 2
∥θR Ψn ∥H1 (Rn ) = ∥θR Ψn ∥2 + dx |∇(θR Ψn )(x))|2
Rn
$
# ∥Ψn ∥22 dx |∇(θR Ψn )(x))|2 # C3 .
Rn
Consequentemente, (θR Ψn )n∈N é uma sequência limitada em H10 (B2R ). Assim, pelo Teorema
de Rellich para a compacidade, existe uma subsequência (θR Ψnk )k∈N ⊂ θR (Ψn )n∈N tal que
(θR Ψnk )k∈N converge fortemente em L2 (B2R ). Isto significa que podemos escolher um k0 ∈ N
para o qual ∥θR Ψn ∥22 # ε para todo k " k0 . Dessa forma, obtemos que
∥Ψnk ∥22 = ∥(H − λ0 1I)−1 Φnk ∥22 # C2 ε + ε
para todo k " k0 . Portanto, pela Definição 5.7, (H − λ0 1I)−1 é compacto.
Observe que, para todo Ψ ∈ Dom(H), temos que (H − λ0 1I) é injetivo. Mais do que
isso, como H é auto-adjunto, pelo Corolário 4.5, temos que Ran(H − λ0 1I) = H . Dessa
forma, (H − λ0 1I) : Dom(H) → L2 (Rn ) é bijetivo com inverso compacto (H − λ0 1I)−1 .
Isso implica que (H − λ0 1I)−1 é .limitado (veja /o Teorema 5.21) e tem todo espaço de Hilbert
L2 (Rn ) como domínio; logo, Ker (H − λ0 1I)−1 = {0} e, portanto, de acordo com o Teorema
3.9, as auto-funções Φn de (H − λ0 1I)−1 formam uma base ortonormal de L2 (Rn ), cujo os
correspondentes auto-valores µn são de multiplicidade finita.
663
A seguir, devemos considerar que como consequência imediata da primeira equação do

resolvente
(H − λ1 1I)−1 − (H − λ2 1I)−1 = (H − λ1 1I)−1 (λ1 − λ2 )(H − λ2 1I)−1 ,
para qualquer λ1 , λ2 ∈ ρ(H), temos que
(H − λ1 1I)−1 é compacto ⇐⇒ (H − λ2 1I)−1 é compacto .
Consequentemente, como
Φn (x) = (H − λ1I)(H − λ1I)−1 Φn (x) = (H − λ1I)µn Φn (x) , ∀ Φn ∈ L2 (Rn ) ,
e todo µn ̸= 0, já que Rλ (H) = (H − λ1I)−1 é o inverso de um operador linear, segue que

, -
1
HΦn (x) = λ + Φn (x) ,
µn
para todo n e todo λ ∈ ρ(H) fixo. Isto implica que σess (H) = ∅, pois {Φn }n é uma base
ortonormal de L2 (Rn ). Além disso, como σ(H) = σdisc (H), existe uma sequência crescente
(λn )n∈N ⊂ R de auto-valores de H de multiplicidade finita HΦn = λn Φn , para todo n,
com auto-valores reais λn . Assim, contando as multiplicidades, existe um número finito de
auto-valores em [−n, n] para todo n ∈ N, o que implica limn→∞ |λn | = ∞.
Nota 10.10 (Operadores com resolvente compacto). O resultado do Teorema 10.10 é um caso
particular de um resultado mais geral que estabelece que, dado um espaço de Hilbert H de
dimensão infinita, o espectro essencial de todo operador auto-adjunto atuando em H que tem
o correspondente operador resolvente compacto é sempre vazio. Veja a prova nos livros de
César R. de Oliveira, “Intermediate Spectral Theory and Quantum Dynamics,” Birkhäuser, 2009,
Teorema 11.3.13, pg.291 e K. Schmüdgen, “Unbounded Self-Adjoint Operators on Hilbert Space,”
Springer, 2012, Proposition 5.12, pg.94.
Exemplo 10.3 (O oscilador harmônico). Vamos considerar um modelo importante de aplicação
do Teorema 10.10, o oscilador harmônico, cujo potencial é descrito pela função V (x) = ∥x∥2 ,
com x ∈ Rn . O oscilador harmônico é um modelo importante por várias razões. Na física do
estado sólido, por exemplo, um cristal é modelado através de um grande número de osciladores
harmônicos acoplados. Usando a noção de “modos normais,” este modelo é então transformado
em osciladores harmônicos unidimensionais independentes com frequências diferentes. No
cenário da teoria quântica, as excitações dos diferentes modos normais são chamadas de fônons.
O oscilador harmônico no espaço tridimensional é descrito pelo seguinte hamiltoniano:
H = H0 + ω 2∥x∥2 , com ω>0. (10.2.21)
Vamos escolher como domínio Dom(H) = S (Rn ) ⊂ L2 (R3 ), em que S (Rn ) é o espaço
de Schwartz. Obviamente, C0∞ (Rn ) ⊂ S (Rn ). Além disso, H é essencialmente auto-adjunto
em S (Rn ). As auto-funções de H são da forma
2 /2
Ψn (x) = Cn Pn (x)e−∥x∥ , x ∈ R3 .
Aqui, Pn = (1 + |x|)n = (1 + |x1 |)n1 (1 + |x2 |)n2 (1 + |x3 |)n3 é um polinômio de grau n ∈ N30 e
Cn é uma constante. A família {Ψn }n é uma base ortonormal de do espaço de Hilbert L2 (Rn ).
664
Na sequência, vamos considerar o caso unidimensional. Introduzindo os operadores

, -
1 1/2 −1/2 d
A± = ω x∓ω , Dom(A± ) = S (R) ,
2 dx
não é difícil mostrar que
[A− , A+ ] = 1I ,
e
H = ω(2N + 1) , N = A+ A− , Dom(N) = S (R) ,
para toda função em S (R). Em particular, S (R) é invariante sob a ação dos operadores A± .
Além disso, como
[N, A± ] = ±A± ,
vemos que NΨ = nΨ implica que NA± Ψ = (n ± 1)A± Ψ. E mais, temos
∥A+ Ψ∥2 = ⟨Ψ, A− A+ Ψ⟩ = (n + 1)∥Ψ∥2 e ∥A− Ψ∥2 = n∥Ψ∥2 .
Neste caso, segue que σdisc (N) ⊂ N0 .
Se NΨ0 = 0, então, devemos ter A− Ψ = 0, e a solução normalizada desta última equação

é dada por
6 ω 71/4 2
Ψ0 (x) = e−ωx /2 ∈ S (R) .
π
Por sua vez, as auto-funções podem ser construídas aplicando-se os chamados operadores de
escada
1
Ψn (x) = √ An+ Ψ0 (x) .
n!
é uma auto-função normalizada de N correspondente ao auto-valor n. Já que
1 6 ω 71/4 √ 2
Ψn (x) = √ Hn ( ωx) e−ωx /2 . (10.2.22)
2 n! π
n
em que Hn (x) é um polinômio de grau n dado por

, -n
√ −ωx2 /2 1/2 −1/2 d 2
Hn ( ωx) = e ω x−ω e−ωx /2 ,
dx
√
segue que span{Ψn } = S (R). Os polinômios Hn ( ωx) são os polinômios de Hermite já
discutidos na Subseção 6.5.1.
Nossos resultados podem ser generalizados para H em L2 (R3 ), nos dando o seguinte
TEOREMA 10.11. O oscilador harmônico H é essencialmente auto-adjunto em S (Rn ) e tem
uma base ortonormal de auto-funções
Ψn1 ,n2 ,n3 (x) = Ψn1 (x1 )Ψn2 (x2 )Ψn3 (x3 ) ,
com cada Ψnk sendo do tipo (10.2.22). O espectro é dado por
! "
σdisc (H) = (2n + 3)ω | n ∈ N0 .
665
10.2.4 Resumo
Para concluir nossa análise sobre o espectro dos operadores de Schrödinger, gostaríamos
de destacar os seguintes pontos importantes: no Teorema 10.10 vimos que o efeito de uma
perturbação por um potencial positivo crescente, embora preserve a auto-adjunção, pode alterar
drasticamente o espectro essencial do operador não-perturbado H0 , já que neste caso σess (H0 +
V ) = ∅. Tal perturbação não é relativamente limitada. Por outro lado, os Teoremas 10.6 e
10.7 nos mostraram que o efeito de uma perturbação por um potencial real V da classe de
Kato-Rellich preserva o espectro essencial do operador não-perturbado H0 . Este é um exemplo
do que chamamos de estabilidade espectral.
10.3 Auto-Valores Negativos dos Operadores de Schrödinger

Como visto acima, se V é um potencial da classe Kato-Rellich em Rn , com n # 3, o
operador de Schrödinger associado, H = H0 + V , atuando em H = L2 (Rn ) tem o mesmo
espectro essencial que o hamiltoniano livre. De fato, decorre dos Teoremas 10.4, 10.6 e 10.7
que H = H0 + V é limitado por baixo e que σess (H) = σess (H0 ) = [0, +∞). Nesta
seção, vamos discutir a questão sobre a existência de auto-valores negativos de H. Esses auto-
valores correspondem aos chamados estados ligados. Lembramos que, estados ligados é o nome
dado às auto-funções dos auto-valores no espectro discreto (pontos isolados do espectro de
multiplicidade finita). Existem vários questionamentos de interesse do ponto de vista da física
no estudo dos estados ligados que foram considerados ao longo dos anos, entre eles estão:
(1) O espectro de energia negativa é infinito ou finito?
(2) Qual o número de estados ligados de H = H0 + V (contando a multiplicidade)? Qual

condição sobre V implicará em um limite no número de auto-valores negativos de H?
(3) O que se pode dizer sobre a impossibilidade de se ter estados ligados com energia
positiva?
(4) As auto-funções têm um decaimento exponencial no infinito?
Uma discussão relacionada com a primeira questão pode ser encontrada Subseção 10.3.1
abaixo. A segunda questão é o tema Subseção 10.3.2. As estimativas do número de estados
ligados, especialmente os limites superiores, são de suma importância para a mecânica quântica.
Entre os vários limites superiores do número de estados ligados encontrados na literatura, nós
vamos discutir a prova da celebrada Desigualdade de Cwikel-Lieb-Rozenbljum,14 que impõe uma
estimativa superior em Rn , com n " 3. A terceira questão será respondida pelo Subseção 10.7.3,
na pg.727, enquanto que a quarta questão será respondida na Seção 10.4.
14
Este teorema é assim chamado em homenagem a M. Cwikel, E.H. Lieb e G. Rozenbljum, que provaram uma
desigualdade de forma independente e por métodos muito diferentes nos artigos M. Cwikel, “Weak Type Estimates
for Singular Values and the Number of Bound States of Schrödinger Operators,” Ann. Math. 106 (1977) 93, E.H. Lieb,
“Bounds on the Number of Eigenvalues of Laplace and Schrödinger Operators,” Bull. Am. Math. Soc. 82 (1976)
751 e G. Rozenbljum, “The Distribution of the Discrete Spectrum for Singular Differential Operators,” Soviet Math.
Dokl. 13 (1972) 245. Observe que os nomes são listados em ordem alfabética, mas em ordem cronológica inversa
de descoberta.
666
10.3.1 Existência de Auto-Valores Negativos
Conforme discutido anteriormente, [0, +∞) é o espectro essencial do operador H0 + V e

seu espectro discreto deve estar contido em (−∞, 0). A existência de pelo menos um auto-
valor negativo dos operadores de Schrödinger H = H0 + V é garantida pela Proposição 10.6 se
⟨Ψ, HΨ⟩ < 0 para alguma função Ψ ∈ Dom(H). Nossa próxima proposição reune alguns
critérios simples relativos à existência de auto-valores negativos de H.
PROPOSIÇÃO 10.7. Seja V uma função real valorada de L2 (R3 ) + L∞ (R3 )ε . Suponha que
existam constantes positivas C, R0 e α tais que α < 2 e
V (x) # −C∥x∥−α para ∥x∥ " R0 . (10.3.1)
Então, o operador auto-adjunto H0 + V limitado inferiormente tem um número infinito de

auto-valores negativos.
Demonstração. Pelos Teoremas 10.1 e 10.7, H = H0 + V é um operador auto-adjunto e

σess (H) = [0, +∞). Consequentemente, a premissa da Proposição 10.6 é satisfeita e, por-
tanto, H possui pelo menos um auto-valor negativo. Vamos fixar uma função Ψ ∈ C0∞ (R3 )
tal que supp Ψ ⊂ {x | 1 < ∥x∥ < 2} e ∥Ψ∥ = 1. Considere a transformação de escala
Ψ(x) → Ψλ (x) = λ−3/2 Ψ(λ−1 x) para λ > 0, de forma que ∥Ψλ ∥ = 1. Então, temos
$ $
2 −3
⟨Ψλ , H0 Ψλ ⟩ = − dx Ψλ (x)∇ Ψλ (x) = −λ dx Ψ(λ−1 x)∇2 Ψ(λ−1 x)
R3 R3
$
= −λ−2 dx Ψ(x)∇2 Ψ(x)
R3
= λ−2 ⟨Ψ, H0 Ψ⟩ , (10.3.2)
e
$ $
−α −α −3
⟨Ψλ , ∥x∥ Ψλ ⟩ = dx Ψλ (x)∥x∥ Ψλ (x) = λ dx Ψ(λ−1 x)∥x∥−α 2Ψ(λ−1 x)
R3 R3
$
−α
=λ dx Ψ(x)∥x∥−α Ψ(x)
R3
= λ−α ⟨Ψ, ∥x∥−α Ψ⟩ . (10.3.3)
Uma vez que supp Ψλ ⊂ {x | α < ∥x∥ < 2α}, para α > R0 , segue de (10.3.1), (10.3.2) e (10.3.3)
que
⟨Ψλ , HΨλ ⟩ = ⟨Ψλ , H0 Ψλ ⟩ + ⟨Ψλ , V Ψλ ⟩ # λ−2 ⟨Ψ, H0Ψ⟩ − Cλ−α ⟨Ψ, ∥x∥−α Ψ⟩
= >
= λ−2 ⟨Ψ, H0 Ψ⟩ − Cλ−α+2 ⟨Ψ, ∥x∥−αΨ⟩ .
Portanto, como ⟨Ψ, H0Ψ⟩ > 0 e α < 2, definindo

, -α−2
|⟨Ψ, H0Ψ⟩|
γ= >0,
C|⟨Ψ, ∥x∥−αΨ⟩|
667
segue que ⟨Ψλ , HΨλ ⟩ < 0 para todo λ > γ.
Defina Φn = Ψ2n γ . Claramente, (Φn )n∈N é uma sequência ortonormal de funções com
suportes disjuntos, de modo que ⟨Φm , HΦn ⟩ = 0 para m ̸= n. Portanto, dado um N e
tomando EN = span{Φ1 , . . . , ΦN } segue pelo Teorema 5.39 que
µN = inf ⟨Φn , HΦn ⟩ < 0 .

1#n#N
Como N é arbitrário e σess (H) = [0, +∞), H = H0 + V tem um número infinito de

auto-valores.
Note que, pelo Exemplo 10.1, a Eq.(10.3.1) é satisfeita com α = 1 e R0 = 1. Portanto, pela
Proposição 10.7, o operador H0 + V tem infinitos auto-valores negativos. Pode-se mostrar que
estes são precisamente os auto-valores −C/n2 , em que n ∈ N, com multiplicidades n2 e as
auto-funções correspondentes sendo construídas a partir dos harmônicos esféricos e funções
de Laguerre. Isso é realizado em detalhes em livros padrão de mecânica quântica (veja, por
exemplo, Williams, F., “Topics in Quantum Mechanics,” PMP 27, Birkhäuser, 2003). Mais detalhes
sobre o espectro do átomo do hidrogênio podem ser encontrados na Subseção 10.7.4.
Nota 10.11. A condição α < 2 é crucial na Proposição 10.7. Acontece que o potencial V (x) =
∥x∥−2 é o caso limite para que tenhamos infinitos auto-valores negativos. Com efeito, H escala
como uma função homogênea de grau −2 sob a escala Ψ(x) → Ψλ (x) = λ−3/2 Ψ(λ−1 x).
Assim, se V escala em grandes distâncias com grau −2 + ε, ele vence; e se escalar com o grau
−2 − ε, a energia cinética vence e os estados não podem ter energia negativa, ou seja, não
podem formar estados ligados. Além disso, pode-se mostrar que se V ∈ L2 (R3 ) + L∞ (R3 )ε e
se existirem constantes positivas R0 e C1 tais que C1 < 1/4 e
V (x) " −C1 ∥x∥−2 para ∥x∥ " R0 ,
então, H tem apenas um número finito de auto-valores negativos (veja Apêndice 10A e o texto
de M. Reed e B. Simon, “Methods of Modern Mathematical Physics. Analysis of Operators,” Vol.
IV, Academic Press, 1978, Teorema XIII.6).
10.3.2 Estimativa do Número de Auto-Valores Negativos
Agora nos voltamos para a estimativa do número de auto-valores negativos dos operadores
de Schrödinger (contando sua mutiplicidade). Nesta subseção, nos limitaremos ao caso geral do
número de estados ligados entre duas partículas.15 Começamos observando que entre outras
aplicações importantes do Princípio Min-Max estão as estimativas dos números de auto-valores
negativos dos operadores de Schrödinger. Este assunto é tratado em grande detalhe em M. Reed
e B. Simon, “Methods of Modern Mathematical Physics. Analysis of Operators,” Vol. IV, Academic
Press, 1978. Primeiro, afirmamos o teorema sobre o limite de Birman-Schwinger, cuja prova será
apresentada no Apêndice 10A:
15
Uma discussão geral de quando um sistema quântico de N -partículas terá finitos ou infinitos estados ligados
apareceu no artigo de B. Simon, “On the Infinitude or Finiteness of the Number of Bound States of an N -Body
Quantum System, I.,” Helv. Phys. Acta 43 (1970) 607.
668
TEOREMA 10.12 (Limite de Birman-Schwinger). Em R3 , seja V uma função da classe R

de Rollnik – ver Nota 10.6. Seja V = V+ − V− sua divisão em partes positiva e negativa:
V± = max{±V , 0}. Seja N(λ; −∇2 + V ) o número total de auto-valores negativos menor ou
igual a −λ – contando as multiplicidades – da soma forma −∇2 +̇V associada com o operador
auto-adjunto −∇2 + V . Então, N(λ; −∇2 + V ) é finito e o seguinte acontece:
, -2 $ $
2 1 V− (x)V− (y)
N(λ; −∇ + V ) # dxdy . (10.3.4)
4π R3 R3 ∥x − y∥2
Nota 10.12. Observe que o Teorema 10.12 limita o número de estados ligados pela integral de
V− , a parte negativa de V , que é puramente atrativa. Lembremos que qualquer função V pode
ser escrita como
V (x) = V+ (x) − V− (x) ,
em que a parte positiva de V é definida pela fórmula
⎧
⎨V (x) , se V (x) > 0
V+ (x) = max{V (x), 0} = ,
enquanto que a parte negativa de V é definida pela fórmula

⎧
⎨−V (x) , se V (x) < 0
V− (x) = max{−V (x), 0} = − min{V (x), 0} = .
Com esta convenção V+ e V− são funções não-negativas, isto é, V+ " 0 e V− " 0; além disso,
temos que |V | = V+ +V− . Assim, o que a desigualdade (10.3.4) está nos mostrando é que para se
obter o número de estados ligados do operador H0 +V em L2 (R3 ) basta levar em conta a parte
do potencial V que é puramente atrativa, isto é, assumindo apenas os valores não-positivos de
V . Com efeito, qualquer discussão sobre o número de estados ligados do operador H0 + V tem
como fundamento o fato elementar que uma diminuição do potencial em alguma região deve
diminuir as energias dos estados ligados no sentido que ⟨Ψ, (H0 + V )Ψ⟩ " ⟨Ψ, (H0 − V− )Ψ⟩,
para todo Ψ ∈ Dom(H0 ). Portanto, N(H0 + V ) # N(H0 − V− ) e podemos omitir o termo
V+ em V .
A seguir, vamos discutir em detalhes o importante resultado conhecido na literatura como

Desigualdade de Cwikel-Lieb-Rozenbljum. Denote por N(H) = dim 1IH0 +V <0 a projeção es-
pectral em (−∞, 0) para H0 + V , em que V é qualquer função em Ln/2 (Rn ). Aqui, N(H)
é o número de auto-valores negativos de H0 + V (contados com a multiplicidade). Assumimos
que em (−∞, 0) o espectro é discreto. Por exemplo, este último é o caso em que V (x) → 0
quando x → ∞. Estamos interessados em obter estimativas de N(H) em termos do potencial
V.
Suponha que V seja um campo potencial atrativo. Então, H = H0 + V é o hamiltoniano de

uma partícula que se move nesse campo, e os auto-valores negativos de H correspondem aos
chamados estados ligados da partícula, ou seja, os níveis de energias negativas En que estão
dentro de um poço de potencial, como na figura abaixo:
669
V (x)
0
x
λj
Figura 10.1: Representação dos níveis de energia negativas En dentro de um poço de potencial.
Portanto, N(H) determina o número de estados ligados do sistema. Em particular, se V é

o campo potencial de um elétron em um átomo, então, N(H) é o número máximo de órbitas
possíveis do elétron no átomo.
Queremos provar o seguinte

TEOREMA 10.13 (Desigualdade de Cwikel-Lieb-Rozenbljum). Suponha que n " 3, que V ∈
Lloc n n
1 (R ) e que V− ∈ Ln/2 (R ), em que V− é a parte do potencial V que é puramente atrativa.
Denote por N(H) o número de estados ligados de H = H0 + V em L2 (Rn ). Então, a seguinte
estimativa é verdadeira
$
n/2
N(H) # C dx V− (x) , (10.3.5)
Rn
em que C é uma constante finita e independente de V .

Nota 10.13. A estimativa (10.3.5) implica que, para um parâmetro α grande,
$
n/2 n/2
N(Hα ) ∼ Cα dx V− (x) , quando α → ∞ .
Rn
Este limite é chamado limite semi-clássico assintótico (que corresponde a tomar # → 0). Além
disso, a hipótese que n " 3 é crucial, como ficará evidente no desenvolvimento da prova do
teorema.
Nota 10.14 (Desigualdades de Lieb-Thirring). A Desigualdade de Cwikel-Lieb-Rozenbljum é um
caso particular de um conjunto de desigualdades mais gerais, que dependem de um parâmetro
γ, chamadas Desigualdades de Lieb-Thirring (veja o Apêndice 10B). Estas desigualdades foram
obtidas por E.H. Lieb e W.E. Thirring em 1975 em conexão com a prova da estabilidade da
matéria.16 Lieb-Thirring mostraram que para o operador hamiltoniano de Schrödinger H0 + V
16
E.H. Lieb e W.E. Thirring, “Bound for the Kinetic Energy of Fermions which Proves the Stability of Matter,” Phys.
Rev. Lett. 35 (1975) 687. Errata ibid. (1975) 1116. Veja também E.H. Lieb e W.E. Thirring, “Inequalities for the
Moments of the Eigenvalues of the Schrödinger Hamiltonian and Their Relation to Sobolev Inequalities,” in Studies
in Mathematical Physics, E.H. Lieb, B. Simon, A.S. Wightman, eds., Princeton University Press, 1976, pg.269. Ensaios
em honra de Valentine Bargmann.
670
em Rn , com potencial V : Rn → R e com os números −λ0 # −λ1 # · · · < 0 denotando

a sequência de auto-valores negativos (não necessariamente finita; caso o número de auto-
valores negativos seja infinito, o ponto zero é o único ponto de acumulação possível), existe
uma constante Cγ,n ,17 que depende apenas de um parâmetro γ e da dimensão do espaço n,
satisfazendo uma das condições
1
γ" para n = 1 ,
2
γ > 0 para n = 2 ,
γ " 0 para n " 3 ,
de modo que
< $
γ γ+n/2
|λj | # Cγ,n dx V− (x) . (10.3.6)
j≥0 Rn
Note que, no caso em que γ = 0 e n " 3 o lado esquerdo das desigualdades (10.3.6) é
simplesmente o número de auto-valores negativos e concorda com a desigualdade (10.3.5).
O leitor interessado vai encontrar uma discussão completa e detalhada sobre as desigualdades
(10.3.6) no livro-texto de E.H. Lieb e R. Seiringer, “The Stability of Matter in Quantum Mechanics,”
Cambridge University Press, 2010.
Antes de demonstrar o Teorema 10.13, uma série de resultados auxiliares (não menos impor-
tantes na análise funcional) são necessários. Comecemos com o
$
n
LEMA 10.3. Seja Ω um domínio limitado em R com o volume |Ω| = dx.18 Então, para
Ω
n " 2, 0 < α < n e todo x ∈ Rn ,
$ , -(n−α)/n
1 ωn−1 n|Ω|
dy # ,
Ω ∥x − y∥α n−α ωn−1
em que ωn−1 = 2π n/2 /Γ(n/2) é a área da superfície da esfera unitária S n−1 em Rn .19
Demonstração. Sejam x ∈ Rn um ponto arbitrário e B(x; R) uma bola aberta, de centro x e

raio R, que tem o mesmo volume que Ω, de maneira que, de acordo com a Eq.(6A.2), seu raio
é , -1/n
n|Ω|
R= .
ωn−1
Considerando que para todo y ∈ B(x; R) temos que ∥x − y∥ # R (veja a Figura 10.2), então,
R−α # ∥x − y∥−α.
17
Uma fonte contendo uma discussão sobre os valores atualmente mais conhecidos para Cγ,n pode ser encon-
trada no artigo de A. Laptev, “Spectral Inequalities for Partial Differential Equations and Their Applications,” AMS/IP
Studies in Advanced Mathematics, Vol.51, 2012, pg.629.
18
Lembramos ao leitor que um domínio limitado em Rn significa um subconjunto aberto, conexo e limitado do
n
R .
19
Veja a Eq.(6A.1).
671
Ω x
Figura 10.2: Representação no plano dos conjuntos Ω e (B(x; R).
Isto implica que

$ $ $
1 1 1
dy = dy + dy
B(x;R) ∥x − y∥α B(x;R)∩Ω ∥x − y∥ α
B(x;R)\(B(x;R)∩Ω) ∥x − y∥α
$
1 1 . /
" dy α
+ α |Ω| \ |B(x; R) ∩ Ω| . (10.3.7)
B(x;R)∩Ω ∥x − y∥ R
Aqui, levamos em conta que B(x; R) tem o mesmo volume que Ω e que |B(x; R) ∩ Ω| é o
volume de B(x; R) ∩ Ω. Por outro lado, considerando que para todo y ∈ Ω \ (B(x; R) ∩ Ω)
temos que ∥x − y∥ " R (veja novamente a Figura 10.2), então, R−α " ∥x − y∥−α. Logo,
$ $ $
1 1 1
dy = dy + dy
Ω ∥x − y∥α B(x;R)∩Ω ∥x − y∥α Ω\(B(x;R)∩Ω) ∥x − y∥α
$
1 1 . /
# dy + |Ω| \ |B(x; R) ∩ Ω| , (10.3.8)
B(x;R)∩Ω ∥x − y∥α Rα
Comparando (10.3.7) e (10.3.8), obtemos que

$ $ $ $ R
1 1 Rn−α
dy # dy = dω dr r n−1−α = ωn−1 ,
Ω ∥x − y∥α B(x;R) ∥x − y∥α S n−1 0 n−α
que é o resultado desejado.
O próximo resultado é uma desigualdade geralmente referida como sendo do tipo-Poincaré.

É um resultado da teoria dos espaços de Sobolev. A desigualdade permite obter limites de uma
função usando limites de suas derivadas e a geometria de seu domínio de definição.
672
TEOREMA 10.14 (Desigualdade de Poincaré). Seja Ω um domínio limitado em Rn com o

volume |Ω|. Então, para 1 # p < ∞, existe uma constante C, dependendo de Ω e n tal que
para toda função Ψ ∈ H10 (Ω) se tem
∥Ψ∥p,Ω # C(Ω, n)∥∇Ψ∥p,Ω . (10.3.9)
Demonstração. É suficiente provar o resultado quando Ψ ∈ C0∞ (Ω), já que toda função em
H10 (Ω) pode ser aproximada por uma sequência de funções em C0∞ (Ω), uma vez que C0∞ (Ω)
é denso em H10 (Ω). Podemos assumir que Ψ é estendida por 0 em Rn \ Ω; isto é, definindo
Ψ(x) ≡ 0 fora de Ω, podemos supor que Ψ ∈ C0∞ (Rn ). Para provar a estimativa (10.3.9),
partimos usando a fórmula
$ ∞
∂
Ψ(x) = − dr Ψ(x + rω) ,
0 ∂r
válida para todo x ∈ Ω e ω ∈ S n−1 . Vamos trabalhar a expressão acima, definindo y = x + rω.
Então, levando em conta que x+rω = (x1 +rω1 , . . . , xn +rωn ) e o desenvolvimento realizado
no Apêndice 6A, segue que ω = (y − x)/∥y − x∥ é um vetor unitário em Rn . A seguir, observe
que, usando a diferencial da função Ψ(y1 , . . . , yn ),
∂ ∂
dΨ(y1, . . . , yn ) = Ψ(y1 , . . . , yn ) dy1 + · · · + Ψ(y1 , . . . , yn ) dyn ,
∂y1 ∂yn
e considerando que dyj = ωj dr, com j = 1, . . . , n, a seguinte identidade acontece:
∂ ∂
Ψ(x + rω) = Ψ(x1 + rω1 , . . . , xn + rωn )
∂r ∂r
n
< ∂
= ωj Ψ(y1 , . . . , yn )
j=1
∂yj
= ω · ∇Ψ(y)
, -
x−y
=− · ∇Ψ(y) .
∥x − y∥
Prosseguindo, podemos escrever

$
ωn−1 ∞ r n−1 ∂
Ψ(x) = − dr n−1 Ψ(x + rω)
ωn−1 0 r ∂r
$ $ ∞
1 r n−1 ∂
=− dω dr n−1 Ψ(x + rω)
ωn−1 S n−1 0 r ∂r
$ $ ∞ , -
1 ∥x − y∥n−1 x−y
= dω d∥x − y∥ · ∇Ψ(y)
ωn−1 S n−1 0 ∥x − y∥n−1 ∥x − y∥
$ , -
1 x−y
= dy · ∇Ψ(y) .
ωn−1 Ω ∥x − y∥
673
O próximo passo é observar que,

5$ , - 5
5 1 x−y 5
|Ψ(x)| = 5 dy · ∇Ψ(y) 5
ωn−1 5 Ω ∥x − y∥ 5
$ 5, - 5
1 5 x−y 5
# dy 55 · ∇Ψ(y)55
ωn−1 Ω ∥x − y∥
$
1
# dy ∥x − y∥1−n |∇Ψ(y)| .
ωn−1 Ω
Agora, um pouco de truque. Escrevemos

p−1
∥x − y∥1−n = ∥x − y∥(1−n)·1 = ∥x − y∥(1−n)·[ p
+ p1 ] = ∥x − y∥(1−n) p−1
p ∥x − y∥
(1−n) p1
.
Com isso, e o emprego da desigualdade de Hölder (veja o Lema 6.9(i)), segue que
,$ -(p−1)/p ,$ -1/p
1 1−n 1−n p
|Ψ(x)| # dy ∥x − y∥ dy ∥x − y∥ |∇Ψ(y)| .
ωn−1 Ω Ω
Se B(x; R) é uma bola aberta de centro x e raio R e volume igual a |Ω|, então, pelo Lema
10.3, segue que
$ $ , -1/n
1 1 n|Ω|
dy # dy = ωn−1 .
Ω ∥x − y∥n−1 B(x;R) ∥x − y∥n−1 ωn−1
Isto implica que
$ n , -1/n op−1 $ ,$ -
p 1 n|Ω| 1−n p
dx |Ψ(x)| # p ωn−1 dx dy ∥x − y∥ |∇Ψ(y)|
Ω ωn−1 ωn−1 Ω Ω
n , -1/n op−1 n , -1/n o $

1 n|Ω| n|Ω|
# p ωn−1 ωn−1 dy |∇Ψ(y)|p
ωn−1 ωn−1 ωn−1 Ω
n, -1/n op $
n|Ω|
= dy |∇Ψ(y)|p .
ωn−1 Ω
Consequentemente,
, -1/n
n|Ω|
∥Ψ∥p,Ω # ∥∇Ψ∥p,Ω ,
ω
B n−1
CD E
C(Ω,n)
como afirmado.
TEOREMA 10.15 (Desigualdade de Poincaré-Sobolev). O Teorema 10.14, juntamente com a
desigualdade de Hölder, produz a desigualdade
∥Ψ∥q,Ω # C(Ω, n, p)∥∇Ψ∥p,Ω , (10.3.10)
para toda função Ψ ∈ H10 (Ω) dado que 1 # p < n e q ∈ [1, np/(n − p)].
674
Demonstração. Um primeiro e importante passo para entender (10.3.10) é notar que os expoentes
q ∈ [1, np/(n − p)] são os únicos expoentes para os quais essa desigualdade pode ser mantida.
Com efeito, sob dilatações de Ω
x 3→ βx e Ψ(x) 3→ Ψ(x/β) ,
o operador derivada se multiplica por β −1 , enquanto as integrais n-dimensionais se multiplicam

por β n . Assim, o lado direito de (10.3.9) é proporcional a β (n−p)/p . Por sua vez, o lado esquerdo
multiplica por β n/q . Claramente, os dois lados só podem ser comparados quando escalam da
mesma forma, o que leva a condição que 1 # p < n e q ∈ [1, np/(n − p)].
Agora, lembremos que a desigualdade de Hölder estabelece que

,$ -1/p ,$ -1/q
p q
∥ΨΦ∥r # ∥Ψ∥p ∥Φ∥q = dx |Ψ(x)| dx |Φ(x)| ,
Ω Ω
em que p−1 + q −1 = r −1 , com 1 # p, q, r # ∞. Com base nisso, escrevemos ∥Ψ∥q,Ω da

seguinte forma:
,$ - p−q
pq
,$ -1/p
pq p−q
p
∥1 · Ψ∥q,Ω # dx |1| p−q dx |Ψ(x)| = |Ω| pq ∥Ψ∥p,Ω .
Ω Ω
Logo, pelo Teorema 10.14, obtemos imediatamente que

, -1/n
n|Ω| p−q
∥Ψ∥q,Ω # |Ω| pq ∥∇Ψ∥p,Ω ,
ωn−1
B CD E
C(Ω,n,p)
como desejado.
Nota 10.15. A desigualdade (10.3.10), com Ω = Rn , foi estabelecida, para 1 < p < n, por
Sobolev no artigo “On a Theorem of Functional Analysis,” Mat. Sb. (N.S.) 4 (1938) 471; English
transl. in Am. Math. Soc. Transl. II Ser. 34 (1963) 39, sendo o caso p = 1 posteriormente
provado por E. Gagliardo em “Proprietà di Alcune Classi di Funzionidi piu Variabili,” Ricerche
Mat. 7 (1958) 102 e por L. Nirenberg em “On Elliptic Partial Differential Equations,” Ann. Sc.
Norm. Pisa 13 (1959). Foi provado por G. Talenti no artigo “Best Constant in Sobolev Inequality,”
Ann. Mat. Pura Appl. 110 (1976) 353, que o melhor valor possível da constante C em (10.3.10),
quando Ω = Rn , é
, -(p−1)/p F G1/n
1 p−1 Γ(1 + n/2)Γ(n)
C(n, p) = 1/2 1/p . (10.3.11)
π n n−p Γ(n/p)Γ(1 + n − n/p)
A constante ótima para p = 1 foi determinada independentemente por H. Federer e W. Fleming

em “Normal and Integral Currents, Ann. Math. 72 (1960) 458 e por V.G. Maz’ya em “Classes of
Domains and Embedding Theorems for Function Spaces,” Sov. Math. Dokl. 1 (1960) 882, sendo
, -1/n
1 Γ(1 + n/2)
C(n, 1) = . (10.3.12)
n π n/2
675
TEOREMA 10.16 (Desigualdade de Poincaré-Sobolev com Ω = Rn ). Fixe um inteiro n " 2

e um p real, tal que 1 # p < n, e defina q = np/(n − p). Então, existe uma constante
C = C(n, p) tal que
∥∇Ψ∥p " C −1 ∥Ψ∥q , for all Ψ ∈ C0∞ (Rn ) . (10.3.13)
Note que não existe perda de generalidade se assumirmos no enunciado do teorema acima
o espaço C0∞ (Rn ), já que um simples argumento de densidade mostra que podemos nos
restringir ao caso de Ψ ∈ C0∞ (Rn ), uma vez que C0∞ (Rn ) é denso em H1 (Rn ).
Demonstração. Existem várias maneiras de provar este teorema. Aqui, escolhemos apresentar
uma prova diferente e mais independente (sem a constante ótima) tirada do livro de L. Saloff-
Coste, “Aspects of Sobolev-Type Inequalities,” Cambridge University Press, 2002. Começamos
considerando o caso p = 1. A prova devida a Gagliardo-Nirenberg estabelece que para p = 1
∥∇Ψ∥1 " 2n1/2 ∥Ψ∥n/(n−1) .
O próximo passo é mostrar que p = 1 implica p " 1. Suponha que (10.3.13) seja válida para
p = 1, ou seja,
∥∇Ψ∥1 " 2n1/2 ∥Ψ∥n/(n−1) , for all Ψ ∈ C0∞ (Rn ) . (10.3.14)
Fixe p > 1. Para qualquer α > 1 e Ψ ∈ C0∞ (Rn ), observe que |Ψ|α é de classe C 1 , tem suporte
compacto e satisfaz |∇|Ψ|α | = α|Ψ|α−1 |∇Ψ|. Como podemos aproximar |Ψ|α por uma
sequência (Ψκ )κ∈N de funções suaves com suporte compacto de forma que ∇Ψκ → ∇|Ψ|α , a
desigualdade (10.3.14) permanece válida com a função Ψ substituída por |Ψ|α . Isso produz (via
desigualdade de Hölder)
$
1/2 α
2n ∥Ψ∥αn/(n−1) # α dx |Ψ(x)|α−1 |∇Ψ(x)|
Rn
,$ -1/q ,$ -1/p
(α−1)q p
#α dx |Ψ(x)| dx |∇Ψ(x)| ,
Rn Rn
em que 1/p + 1/q = 1. Se escolhermos α = (n − 1)p/(n − 1), segue-se que
(n−1)p/(n−1) (n − 1)p n(p−1)/(n−p)

2n1/2 ∥Ψ∥np/(n−p) # ∥Ψ∥np/(n−p) ∥∇Ψ∥p .
n−p
Finalmente, note que (n − 1)p/(n − p) − n(p − 1)/(n − p) = 1, de modo que a última

desigualdade resulta
F 1/2 G
2n (n − p)
∥Ψ∥np/(n−p) # ∥∇Ψ∥p .
(n − 1)p
Isso completa a prova.
676
O próximo teorema é devido a Li-Yau. O teorema fornece um limite superior para o número
de auto-valores do operador laplaciano em um domínio limitado em Rn , submetido a uma
condição de fronteira de Dirichlet. Em outras palavras, vamos considerar um domínio limitado
Ω em Rn e tomar
⎧
⎨∞ , se x ∈ /Ω
V (x) = ,
⎩0 , se x ∈ Ω
como nosso potencial. Isto significa que tomamos Ψ ≡ 0 fora de Ω. Estamos interessados no
problema de auto-valor
−∇2 Ψ(x) = λΨ(x) ,
em Ω, com a condição de fronteira de Dirichlet
5
5
Ψ5 ≡ 0 ,
∂Ω
imposta sobre a função-de-onda dentro de Ω. A discretização do espectro de −∇2 permite

ordenar os auto-valores λ1 < λ2 # λ3 # · · · # λj # · · · , monotonicamente. O análogo mais
conhecido deste problema na mecânica quântica é o caso do poço de potencial infinito em R.
TEOREMA 10.17 (Li-Yau, 1983). 20 Seja Ω um domínio limitado no Rn . Suponha que λj denota
o j-enésimo auto-valor de −∇2 para o problema de fronteira de Dirichlet. Se |Ω| é o volume de
Ω, então,
N
< , -, -2/n
1 1
λj " N 1+2/n .
j=1
n+2 |Ω|ωn−1
Demonstração. Seja {Φj }N N

j=1 uma base ortonormal de auto-funções, com auto-valores {λj }j=1 .
n
Assuma que cada Φj (x) ≡ 0 fora de um domínio limitado Ω ⊂ R . Então, podemos supor
que cada Φj ∈ C0∞ (Rn ). Em outras palavras, podemos assumir que cada Φj está definida em
todo Rn e é zero fora de Ω.
Pela transformada de Fourier, segue que
N
< N $
< N $
<
λj = dx |∇Φj (x)| = 2 ^ j (k)|2 ,
dk ∥k∥2 |Φ
j=1 j=1 Rn j=1 Rn
e pelo Teorema Parseval-Plancherel (Teorema 6.14), temos
N $
< N $
<
2
dx |Φj (x)| = ^ j (k)|2 = N ,
dk |Φ
j=1 Rn j=1 Rn
20
P. Li e S.-T. Yau, “On the Schrödinger Equation and the Eigenvalue Problem,” Commun. Math. Phys. 88 (1983)
309.
677
já que as funções Φj formam uma base ortonormal de auto-funções em L2 (Rn ). Vamos

completar essa base de modo a obter uma base ortonormal {Φj }∞ n
j=1 de L2 (R ). Para isto, para
todo k ∈ Rn fixado arbitrariamente, defina
ek (x) = e−ikx χΩ (x) (x ∈ Rn ) ,
em que χΩ é a função característica de Ω. Note que
$ $
⟨ek , Φj ⟩ = dx ek (x)Φj (x) = ^ j (k) .
dx Φj (x)eikx = Φ
x∈Rn x∈Ω
^ 2
;N ^ 2
Logo, de definirmos |Ψ(k)| = j=1 |Φj (k)| , então,
N
< ∞
< ∞
< $
^
|Ψ(k)|2
= ^ j (k)| #
|Φ 2 ^ j (k)| =
|Φ 2 2
|⟨ek , Φj ⟩| = ⟨ek , ek ⟩ = dx = |Ω| .
j=1 j=1 j=1 Ω
Assuma que
N
< $
λj = ^
dk ∥k∥2 |Ψ(k)| 2
#C .
j=1 Rn
Então, defina |Θ(k)|2 = |Ω| quando ∥k∥ < R e |Θ(k)|2 = 0 quando ∥k∥ " R, em que R é
escolhido de forma que $
dk ∥k∥2 |Θ(k)|2 = C .
Rn
^
Assim, (∥k∥2 − R2 )(|Ψ(k)| 2
− |Θ(k)|2) " 0. Portanto,
$ $
. / . /
R 2 ^ 2
dk |Ψ(k)| − |Θ(k)| # 2 ^
dk ∥k∥2 |Ψ(k)| 2
− |Θ(k)|2 # C − C = 0 .
Rn Rn
Agora, temos
$ $ R , -
2 2 2 n+1 1
C= dk ∥k∥ |Θ(k)| = |Ω| ωn−1 dr r = |Ω|ωn−1 Rn+2 , (10.3.15)
Rn 0 n+2
e
$ $
N= ^
dk |Ψ(k)| 2
# dk |Θ(k)|2 = |Ω|ωn−1 Rn . (10.3.16)
Rn Rn
Dessa forma, de (10.3.15) obtemos

, -1/n+2
(n + 2)C
R= ,
|Ω|ωn−1
e como queremos um;limite superior para o número de auto-valores do operador laplaciano,
podemos tomar C = N j=1 λj e substituir o resultado acima em (10.3.16) para obter
N
< , -, -2/n
1 1
λj " N 1+2/n .
j=1
n+2 |Ω|ωn−1
como afirmado.
678
COROLÁRIO 10.1. Seja Ω um domínio limitado em Rn . Suponha que λj denota o j-enésimo

auto-valor de −∇2 para o problema de fronteira de Dirichlet. Se |Ω| é o volume de Ω, então,
, -, -2/n
1 1
λN " N 2/n .
n+2 |Ω|ωn−1
Demonstração. Naturalmente, uma vez que estamos assumindo que os auto-valores são ordena-
dos monotonicamente, λ1 < λ2 # λ3 # · · · # λj # · · · , temos
N
< , -, -2/n
1 1
NλN " λj =⇒ NλN " N 1+2/n ,
j=1
n+2 |Ω|ωn−1
que é o resultado desejado.
A prova da desigualdade de Cwikel-Lieb-Rozenbljum agora pode ser dada. No centro do

argumento está uma combinação elegante da desigualdade de Hölder e da desigualdade de
Poincaré-Sobolev.
Demonstração do Teorema 10.13. Assuma que V é tal que H0 + V é auto-adjunto e limitado

por baixo. Então, podemos tomar Dom(H0 + V ) = C0∞ (Rn ). Os auto-valores negativos de
H0 + V , se houverem, são rotulados como λ1 # λ2 # · · · < 0, repetidos de acordo com a
multiplicidade. Seja {Φj }N N
j=1 uma base ortonormal de auto-funções, com auto-valores {λj }j=1 .
Assuma que cada Φj (x) ≡ 0 fora de um domínio limitado Ω ⊂ Rn . Então, podemos supor que
cada Φj ∈ C0∞ (Rn ). Em outras palavras, podemos assumir que cada Φj está definida em todo
Rn e é zero fora de Ω. Com base nisso, só precisamos provar a desigualdade (como já adotado
em outras ocasiões, vamos ignorar as constantes físicas, isto é, vamos usar unidades em que
# = 2m = 1) $
n/2
N(−∇2 + V ) # C dx V− (x) ,
Ω
para a equação de Schrödinger de auto-valor em Ω dada por

5
2 5
(−∇ + V )Ψ(x) = −λΨ(x) e Ψ(x)5 ≡0, (10.3.17)
∂Ω
em que Ω é qualquer domínio limitado do Rn (lembremos que Rn pode ser expresso como a
união de domínios limitados).
De acordo com o desenvolvimento realizado no Capítulo 5, para qualquer domínio limitado

Ω ⊂ Rn , toda função normalizada Ψ ∈ C0∞ (Rn ) pode ser escrita como uma combinação linear
de auto-funções, Φj , da seguinte forma:
N
<
Ψ(x) = ⟨Φj , Ψ⟩Φj (x) .
j=1
679
Se definirmos por Pλj os projetores espectrais de H0 + V no intervalo (−∞, 0) através da

;
relação Pλj Ψ(x) = ⟨Φj , Ψ⟩Φj (x), então, segue que Ψ(x) = N j=1 Pλj Ψ(x). Assim, temos
que
<N
Pλj = 1IH0 +V <0 ,
j=1
Além disso, todo elemento (H0 + V )Ψ pode ser escrito como

N
< N
<
(H0 + V )Ψ(x) = ⟨Φj , (H0 + V )Ψ⟩Φj (x) = ⟨(H0 + V )Φj , Ψ⟩Φj (x)
j=1 j=1
N
<
= λj ⟨Φj , Ψ⟩Φj (x)
j=1
N
<
= λj Pλj Ψ(x) .
j=1
;N
Note que, (H0 + V ) = j=1 λj Pλj . Logo, para todo j = 1, . . . , N, segue que para a
correspondente forma quadrática
$ $
def.
E(Ψ) = ⟨Ψ, (H0 + V )Ψ⟩ = dx ∇Ψ(x)∇Ψ(x) + dx V (x)|Ψ(x)|2 ,
Ω Ω
temos
N <
< N
E(Ψ) = λj ⟨Pλj Ψ, Pλk Ψ⟩
j=1 j=k
N <
< N
= λj ⟨Φj , Ψ⟩⟨Φk , Ψ⟩⟨Φj , Φk ⟩
j=1 j=k
N <
< N $
= λj ⟨Φj , Ψ⟩⟨Φk , Ψ⟩ dx Φj (x)Φk (x)
j=1 j=k Ω
N
<
= λj |⟨Φj , Ψ⟩|2 ,
j=1
por causa da ortonormalidade das auto-funções Φj . Portanto, |⟨Φj , Ψ⟩|2 é a probabilidade que
no estado Ψ a quantidade E(Ψ) seja igual a λj .
A função contagem N(−∇2 + V ) de −∇2 + V é definida por
N(−∇2 + V ) = dim 1IH0 +V <0 .
Isto significa que, se o espectro de (H0 + V ) é discreto e {Φj }N j=1 uma base ortonormal
N
de auto-funções, com auto-valores {λj }j=1 , então, Pλj é a projeção no subespaço de L2 (Ω)
680
gerado por todas as auto-funções Φj com λj < 0. Segue-se que N(−∇2 + V ) é o número de
auto-valores λj < 0, contados com a multiplicidade. Isto implica que, a seguinte identidade é
verdadeira:
3 4
N(H0 + V ) = sup dim F | F ⊂ C0∞ (Ω), E(Ψ) < 0, ∀ Ψ ∈ F \ {0} . (10.3.18)
De fato, basta restringir o sup a sub-espaços F dimensionalmente finitos. Por exemplo, a
condição E(Ψ) < 0 será satisfeita trivialmente para Ψ = Φk dado que λk < 0, porque
N
<
E(Φk ) = λj |⟨Φj , Φk ⟩|2 = λk < 0 . (10.3.19)
j=1
Vamos interpretar a desigualdade (10.3.19) em termos de um outro operador. Considere uma

nova medida µ definida por dµ(x) = V (x)dx e assuma que 1/V ∈ Lloc n
1 (R ). Isto implica
que (10.3.19) pode ser escrita da seguinte forma:
$ $
2
− dµ(x) Φj (x)∇ (µ)Φj (x) < dµ(x) |Φj (x)|2 = ⟨Φj , Φj ⟩µ . (10.3.20)
Ω Ω
2 1
Aqui, definimos ∇ (µ) = V (x)
∇2 . Note que, com está definição temos, agora, um problema de
auto-valor
−∇2 (µ)Φj (x) = λΦj (x) , em Ω .
com a condição de fronteira de Dirichlet
5
5
Φj 5 ≡0,
∂Ω
imposta sobre a função-de-onda
! " Ω, com as correpondentes auto-funções Φj (j ∈ N)
dentro de
em L2 (Ω; V ) = Φj | Φj V 1/2 ∈ L2 (Ω) . Este problema é análogo ao problema analisado no
Teorema 10.17, e tem a mesma solução por causa da medida adotada, isto é, dµ(x) = V (x)dx.
Informalmente, a desigualdade (10.3.20) reflete a equivalência das desigualdades −∇2 + V < 0
e −∇2 (µ) < 1, que devem ser entendidas no sentido de formas quadráticas. Além disso, a
Eq.(10.3.18) para este operador pode ser escrita da seguinte forma:
3 4
2 ∞ 2
N(∇ (µ)) = sup dim F | F ⊂ C0 (Ω), Eµ (Φj ) < ∥Φj ∥µ , ∀ Ψ ∈ F \ {0} . (10.3.21)
Isto indica que N(−∇2 + V ) = N(−∇2 (µ)). Esta última identidade é chamada de Princípio
de Birman-Schwinger (veja a Nota 10.16).
Através das desigualdades de Hölder e de Poincaré-Sobolev, obtemos

$ ,$ -2/n ,$ - n−2
n
n
2 n/2 2 n−2
dx V (x)|Φj (x)| # dx V (x) dx |Φj (x)|
Ω Ω Ω
,$ -2/n $
n/2
# C(Ω, n, 2) dx V (x) dx |∇Φj (x)|2
Ω Ω
,$ -2/n $
n/2
= −C(Ω, n, 2) dx V (x) dµ(x) Φj (x)∇2 (µ)Φj (x)
Ω Ω
,$ -2/n
n/2
= C(Ω, n, 2) dx V (x) ⟨Φj , −∇2 (µ)Φj ⟩µ .
Ω
681
Como, por definição,

$ $
2
dx V (x)|Φj (x)| = dµ(x) |Φj (x)|2 = ⟨Φj , Φj ⟩µ ,
Ω Ω
e
⟨Φj , −∇2 (µ)Φj ⟩µ
<1,
⟨Φj , Φj ⟩µ
segue que
, - ,$ -2/n
⟨Φj , −∇2 (µ)Φj ⟩µ n/2
1 # C(Ω, n, 2) dx V (x)
⟨Φj , Φj ⟩µ Ω
,$ -2/n
n/2
< C(Ω, n, 2) dx V (x) .
Ω
Lembremos que, podemos definir os auto-valores de −∇2 (µ) da maneira óbvia. De acordo
com o Teorema 5.39, o auto-valor mais alto de −∇2 (µ) é obtido por
⟨Ψ, −∇2 (µ)Ψ⟩µ

λN = inf .
Ψ∈C0∞ (Ω)∩KN−1
⊥ ⟨Ψ, Ψ⟩µ
em que Ki = ∪0#j#i Ker(−∇2 (µ) − λj 1I), com Ker(−∇2 (µ) − λj 1I) sendo os auto-espaços
de −∇2 (µ) para os auto-valores λj . Pelo Corolário 5.10, temos que para qualquer auto-valor de
−∇2 (µ)
⟨Ψ, −∇2 (µ)Ψ⟩µ
" λj ,
⟨Ψ, Ψ⟩µ
para qualquer Ψ em C0∞ (Ω) ∩ Kj−1
⊥
. A seguir, definimos λj como o maior auto-valor menor
que 1. Dessa forma, obtemos
, -, -2/n ,$ -2/n
1 1 2 2/n n/2
N(−∇ (µ)) # λN < 1 < C(Ω, n, 2) dx V (x) ,
n+2 |Ω|ωn−1 Ω
ou seja,
$
2 2
N(−∇ + V ) = N(−∇ (µ)) # C dx V n/2 (x) ,
Ω
em que
C = C(Ω, n, 2)(n + 2)n/2 (|Ω|ωn−1)2/n .
Para finalizar, uma vez que V " −V− , em que V (x) = V+ (x) − V− (x), pela Nota 10.12,
segue que N(H0 + V ) # N(H0 − V− ). Consequentemente, temos que
$ $
2 n/2 n/2
N(−∇ + V ) # C dx V− (x) # C dx V− (x) .
Ω Rn
Isto completa a prova da desigualdade CLR.
682
Nota 10.16 (O princípio de Birman-Schwinger). Esta nota complementa a prova da desi-

gualdade CLR. Afirmamos que a desigualdade (10.3.20) reflete a equivalência das desigualdades
−∇2 + V < 0 e −∇2 (µ) < 1, que devem ser entendidas no sentido de formas quadráticas.
Para ver isso, consideramos a forma quadrática associada a (10.3.17) em L2 (Ω)
$ 6 7 $ ⎛ $ ⎞
2 2 2 2
dx |∇Ψ(x)| + V (x)|Ψ(x)| dx |V (x)||Ψ(x)| ⎜ dx |∇Ψ(x)| ⎟
Ω $ = Ω$ ⎜$ Ω − 1 ⎟.
2 2
⎝ 2
⎠
dx |Ψ(x)| dx |Ψ(x)| dx |V (x)||Ψ(x)|
Ω Ω Ω
Portanto, o subespaço no qual o lado esquerdo da equação acima é negativo tem dimensão
igual à dimensão do subespaço no qual a forma quadrática
$
dx |∇Ψ(x)|2
$ Ω ,
dx |V (x)||Ψ(x)|2
Ω
é menor que 1. No entanto, esta forma quadrática está associada ao operador −∇2 (µ). Isto
prova o Princípio de Birman-Schwinger (veja os detalhes no Apêndice 10A) que estabelece a
identidade N(−∇2 + V ) = N(−∇2 (µ)).
Nota 10.17. O melhor valor para a constante C na estimativa (10.3.5) ainda não é conhecido.
Tentativas foram feitas para se obter a melhor constante C, mas os resultados são bastante
inconclusivos. Lieb conjecturou que o melhor valor possível de C deveria ser
n, -n/2 o−1
n(n − 2) Γ(1/2)Γ(1/2n)
C= ωn−1 .
4 Γ((n + 1)/2)
Essa conjectura permanece aberta! A estimativa (10.3.5) falha no caso R2 . Assim, a questão
de se obter limites superiores ideais para N(H) em R2 também permanece aberta e é muito
discutida na literatura atual. Na Seção 10.6, aplicamos uma estimativa no tratamento do operador
de Schrödinger em R2 , conhecida como estimativa de Setô.
Nota 10.18 (Bônus: Comparação das desigualdades CLR e Poincaré-Sobolev). A desigualdade
CLR pode ser vista como sendo uma consequência da desigualdade de Poincaré-Sobolev. A
seguir, vamos mostrar que a desigualdade de CLR implica a desigualdade de Poincaré-Sobolev.
Portanto, as desigualdades CLR e de Poincaré-Sobolev podem ser vistas como sendo equivalentes!
TEOREMA 10.18. Suponha que a desigualdade CLR seja satisfeita. Então,

N2/n ∥∇Ψ∥22
∥Ψ∥22n/(n−2) # C
para todo Ψ ∈ H1 (Rn ).
Demonstração. A prova foi tomada do livro de A.A. Balsinky, W.D. Evans e R.T. Lewis, “The
Analysis and Geometry of Hardy’s Inequality,” Springer, 2015. Assuma que a desigualdade CLR é
satisfeita. Então, $
C dx V n/2 (x) < 1 ,
Rn
683
implica que N(−∇2 + V ) = 0. Portanto, a energia cinética é não-negativa e para todo

Ψ ∈ H1 (Rn ), temos que
$ $
2
dx |∇Ψ(x)| " dx V (x)|Ψ(x)|2 ,
Rn Rn
para todo Ψ ∈ H1 (Rn ). Seja W um elemento arbitrário de Ln/2 (Rn ), com ∥W ∥n/2 = 1 e
assuma que
N−2/n |W (x)| ,
V (x) = C
para qualquer
N > C = C(Ω, n, 2)(n + 2)n/2 (|Ω|ωn−1 )2/n .
C
Portanto, $ $
n/2 C
C dx V (x) = dx W n/2 (x) < 1 ,
Rn N
C Rn
e 5$ 5 $ $
5 5
5 dx W (x)|Ψ(x)| 5 # 25 N2/n
dx |W (x)||Ψ(x)| # C 2
dx |∇Ψ(x)|2 ,
5
R n Rn Rn
para todo Ψ ∈ H1 (Rn ). Por outro lado, pela desigualdade de Hölder, temos que
5$ 5 ,$ - n−2
5 5 n n
5 25
dx W (x)|Ψ(x)| 5 # ∥W ∥n/2 dx |Ψ(x)| 2 n−2
.
5
R n Rn
Assim, visto como um funcional limitado, a integral

$
dx W (x)|Ψ(x)|2 ,
Rn
implica, de acordo com o desenvolvimento do Capítulo 4, que

,$ - n−2 5$ 5
n n 5 5
∥Ψ∥22n/(n−2) = dx |Ψ(x)| 2 n−2
= sup 5 dx W (x)|Ψ(x)| 5 . 25
5
Rn ∥W ∥n/2 =1 R n
Consequentemente, obtemos que

,$ - n−2
n
$
n
dx |Ψ(x)| 2 n−2
#C N2/n dx |∇Ψ(x)|2 .
Rn Rn
N > C é arbitrário, o teorema segue como desejado.

Como C
10.4 Decaimento Exponencial das Auto-Funções

O assunto dessa seção é o fenômeno de decaimento exponencial de soluções da equação
de Schrödinger em domínios ilimitados. A muito se sabe que, para uma classe geral de
potenciais V , qualquer auto-função de H com auto-valor situado no espectro discreto decai
exponencialmente quando |x| → ∞. Nosso objetivo abaixo será apresentar os detalhes desse
padrão de decaimento das auto-funções com auto-valores situados abaixo do ínfimo do espectro
essencial.
684
Considere o operador diferencial de Schrödinger H = −∇2 + V em Rn , onde V é uma

função real em V ∈ Lloc n n
1 (R ) e V (x) " C. Suponha também que V− ∈ Ln/2 (R )) para n "
e que
3 4
inf ⟨Ψ, HΨ⟩ | Ψ ∈ C0∞ (Rn ), ∥Ψ∥2 = 1 > −∞ ,
em que
$ 6 7
⟨Ψ, HΨ⟩ = dx |∇Ψ(x)|2 + V (x)|Ψ(x)|2 .
Rn
Sob essas condições, H admite, pelo Teorema de Friedrichs, uma única realização auto-adjunta
em L2 (Rn ) (seja a Seção 10.7). O espectro essencial, σess (H), de H é limitado inferiormente
(veja o Teorema 10.25). Definimos
Existe um fenômeno de decaimento geral de auto-funções de H. Especificamente, para uma

classe geral de potenciais V , qualquer auto-função de H com auto-valor no espectro discreto
decai exponencialmente. Mas, o que faz com que as auto-funções com auto-valores abaixo
da parte inferior do espectro essencial decaiam exponencialmente? A resposta a esta pergunta
pode ser encontrada na observação de que as propriedades de decaimento exponencial das auto-
funções da equação HΨ = λΨ está intimamente relacionada às propriedades de positividade
da forma quadrática ⟨Ψ, (H − λ1I)Ψ⟩ em certos subconjuntos de funções teste. Para ver essa
conexão, invocamos uma fórmula para a parte inferior do espectro essencial de H dada por
Persson (ver Teorema 10.26), pelo qual
# = >%
−2 ∞ n
inf σess (H) = sup inf ⟨Ψ, HΨ⟩∥Ψ∥ | Ψ ∈ C0 (R \ K) , (10.4.1)
K⊂Rn Ψ̸=0
com o supremum sendo tomado sobre todos os subconjuntos compactos K ⊂ Rn . Segue-se de

(10.4.1) que se λ < inf σess (H) e ε é qualquer número positivo tal que ε < inf σess (H) − λ,
então, existe um número R = Rε > 0 tal que
$
⟨Ψ, (H − λ1I)Ψ⟩ " (inf σess (H) − λ − ε) dx |Ψ(x)|2 , (10.4.2)
|x|>R
! "
para todo Ψ ∈ C0∞ (ΩR ) em que ΩR = x ∈ Rn | |x| > R . Assim, vemos em particular
que para λ < inf σess (H) a forma quadrática ⟨Ψ, (H − λ1I)Ψ⟩ é fortemente positiva para
todo Ψ ∈ C0∞ (ΩR ) quando R é suficientemente grande. O limite inferior da forma quadrática
(10.4.2) implica o limite superior do decaimento exponencial
|Ψ(x)| # Cα e−α|x| ,
para as auto-funções da equação HΨ = λΨ. Isso decorre do seguinte
TEOREMA 10.19. Assuma que
lim inf V (x) " λ0 .
x→∞
Seja Ψ uma auto-função de H com o auto-valor λ < λ0 . Então, para todo ε > 0 existe uma
constante C > 0 tal que
( i )
λ0 − λ − ε
|Ψ(x)| # Cε exp − |x| . (10.4.3)
2
685
Note que, a estimativa (10.4.3) pode ser melhorada. De fato,

6 H 7
|Ψ(x)| # C2 exp − λ0 − λ − ε |x| .
Demonstração do Teorema 10.19. Primeiro, lembremos alguns fatos sobre a solução fundamental
de −∇2 + k 2 , isto é, uma solução de
−∇2 Ψk + k 2 Φk = δ(x) .
Existe uma solução (fraca) com a propriedade que Φk ∈ C0∞ (Rn \ {0}) e o comportamento
assintótico
1
Φk (x) = C|x| 2 (n−1) e−k|x| (1 + O(1)) , quando x→∞,
em que C > 0. Além disso, Φk é radialmente simétrica. No caso n = 3

1
Φk (x) = e−k∥x∥ .
4π∥x∥
Seja Ψ uma auto-função real-valorada, tal que
HΨ = λΨ , com λ < λ0 .
Por uma questão de simplicidade, vamos supor que V seja suave o suficiente para |x| muito
grande. Então, devido à regularidade elíptica,21 Ψ é suave para o mesmo x, isto é, Ψ é uma
solução clássica. Segue que
∇2 (Ψ2 ) = 2∇2 Ψ · Ψ + 2(∇Ψ)2 .
Portanto, . /
−∇2 (Ψ2 ) = 2 λ − V (x) Ψ2 − 2(∇Ψ)2 .
Logo, adicionando 2(b − λ)Ψ2 aos dois lados, obtemos
. / . /
−∇2 + 2(b − λ) Ψ2 = −2 V (x) − b Ψ2 − 2(∇Ψ)2 .
Assumimos aqui que b < λ0 e, portanto, o lado direita é não-negativo para |x| grande o
suficiente. Defina
Θ(x) = Ψ2 (x) − MΦk (x) ,
H
com k = 2(b − λ) (aqui λ < b < λ0 ). Escolha um R tal que Φk (x) " 0, V (x) > b e Ψ(x)
é suave para |x| " R. Em seguida, escolha M > 0, de modo que
Θ(x) < 0 , quando |x| = R ,

21
Na teoria das equações diferenciais parciais, os operadores elípticos são operadores diferenciais que generalizam
o operador laplaciano. Eles são definidos pela condição de que os coeficientes das derivadas de ordem superior
sejam positivos, o que implica a propriedade-chave de que o símbolo principal é invertível ou, equivalentemente,
de que não existem direções características reais. Os operadores elípticos são típicos da teoria do potencial e
aparecem frequentemente na eletrostática e mecânica do continuum. A regularidade elíptica implica que suas
soluções tendem a ser funções suaves (se os coeficientes no operador forem suaves).
686
(isso é possível devido à continuidade de Φk e Ψ na esfera |x| = R). Obviamente,
−∇2 Θ + k 2 Θ = Γ # 0 , quando |x| " R .
Aqui, . /
Γ = −2 V (x) − b Ψ2 − 2(∇Ψ)2 .
Defina $
Θε (x) = dy Θ(x − y)ϕε(y) ,
Rn
em que ϕε (y) = ε−n ϕ(y/ε), ϕ ∈ C0∞ (Rn ), ϕ " 0 e

$
dx ϕ(x) = 1 .
Rn
Ampliando R, se necessário, temos
(−∇2 + k 2 )Θε = Γ # 0 .
Como Θ ∈ L1 (Rn ), então Θ(x) → 0 quando |x| → ∞ (check isto). Defina

! "
VR,ρ = x ∈ Rn | R # |x| # ρ ,
e
Mρ (ε) = max |Θε (x)| .
|x|=ρ
Claramente, Θε (x) < 0 se |x| = R e ε é pequeno o suficiente. Pelo princípio do máximo,

temos
Θε (x) # Mρ (ε) , para x ∈ VR,ρ .
Deixando ρ → ∞, obtemos Θε (x) # 0, se |x| " R. Passando ao limite como ε → 0, vemos
que Θ(x) # 0 se |x| " R e isso implica o necessário.
COROLÁRIO 10.2. Se V (x) → ∞ quando |x| → ∞, então
|Ψ(x)| # Cα e−α|x| ,
para todo α > 0.
Em resumo, mostramos que as auto-funções associadas à um operador de Schrödinger,

com auto-valores no espectro discreto, decaem exponencialmente para uma ampla classe de
potenciais V . Este fenômeno é conhecido há muito tempo e já era aparente na solução de
Schrödinger do átomo do hidrogênio. Mais precisamente, se Ψ ∈ Dom(H) é uma solução de
HΨ(x) = (H0 + V )Ψ(x) = λΨ(x), e se λ está abaixo do espectro essencial de H, então
Ψ decai exponencialmente no sentido de existirem constantes positivas C e α para as quais
|Ψ(x)| # Cα e−α|x| . Este tipo de estimativa para Ψ, que pode ser referido como estimativa
isotrópica, é precisa se V (x) → 0 quando |x| → ∞. No entanto, se V (x) não tende para
o mesmo limite em todas as direções quando |x| → ∞ deve se esperar que a estimativa
isotrópica possa ser substituída por uma estimativa não-isotrópica mais precisa da forma
|Ψ(x)| # Cα e−(1−α)ρ(x) , (10.4.4)
687
para qualquer α > 0 em que ρ(x) é alguma função que tende ao infinito quando |x| > ∞
e que reflete o comportamento diferente do potencial V em diferentes direções. O estudo
de estimativas como (10.4.4) para soluções da equação de Schrödinger em domínios ilimitados
pode ser encontrado no livro de Shmuel Agmon, “Lectures on Exponencial Decay of Solutions of
Second Order Elliptic Equations, Princeton Universty Press, 1982.
Nota 10.19. Suponha que o potencial V tenha um crescimento do tipo-potência no infinito, isto
é,
V (x) " C|x|α − C1 ,
em que C > 0, C1 ∈ R e α > 0. Então, para toda auto-função Ψ tem-se
α +1
|Ψ(x)| # C2 e−γ|x| 2 ,
em que C2 > 0 e γ > 0.
10.5 Operador de Schrödinger Unidimensional: O Caso do

Potencial Quadrado Finito
Como uma aplicação do critério de Kato discutido acima, vamos considerar um exemplo
simples, mas instrutivo: o operador de Schrödinger H = H0 + V , independente do tempo em
R1 , com um potencial V da forma
⎧
⎨−V0 se |x| # a
V (x) = ,
⎩ 0 se |x| > a
em que a e V0 são constantes positivas. A região −a # x # a é o “poço quadrado” para o

potencial (veja a Figura 10.3).
V (x)
−a a
x
−V0
Figura 10.3: Representação gráfica do poço de potencial finito.
Vamos determinar, em detalhes, os conjuntos ρ(H) e σ(H) do hamiltoniano H = H0 + V ,

em que V é o potencial acima. Grande parte do material desta seção foi retirado do livro de
688
Shlomo Stenberg.22 Mostraremos que no caso de a partícula ter uma energia −V0 < E < 0,
existem soluções para a equação de Schrödinger para apenas alguns valores da energia (es-
tados ligados). Assim sendo, o espectro de H consiste de um número finito de pontos
σdisc (H) = [−V0 , 0) (pelo menos um), juntamente com σess (H) = [0, ∞); além disso,
(−∞, −V0 ) ∈ ρ(H). Os auto-vetores (ou as auto-funções) para os auto-valores negativos
decaem exponencialmente para |x| > a (veja a Figura 10.4).
∥Ψ∥2
−a 0 a
Figura 10.4: Decaimento exponencial das auto-funções para os auto-valores negativos.
O modelo do poço de potencial finito é bastante simplificado e pode ser resolvido por
métodos elementares. No entanto, apesar de ser simples, o modelo incorpora muitos aspectos
matemáticos que são analisados em qualquer curso de mecânica quântica elementar, de acordo
com Shlomo Sternberg, “por meio de definições e métodos que não são convincentes para os
matemáticos.”23 Por exemplo, como já enfatizado várias vezes ao longo deste texto, é muito
comum nos livros sobre mecânica quântica iniciar-se a análise das soluções da equação de
Schrödinger independente do tempo, HΨ(x) = (H0 + V )Ψ(x) = EΨ(x), sem nem mesmo
se fazer menção ao domínio do operador H. Ao se determinar um domínio para o operador
de Schrödinger H devemos decidir, antes de tudo, qual é o domínio do operador potencial V .
Como já vimos, a escolha mais simples, e natural, para um domínio para V é o conjunto de
todas as funções Ψ ∈ L2 (R) tal que V Ψ ∈ L2 (R). Uma vez feita esta escolha, precisamos
determinar se H é auto-adjunto. Se V é uma perturbação de Kato de H0 , então, o Teorema
4.35 (Teorema de Kato-Rellich) nos dá uma forma muito útil de determinar se H = H0 + V
é auto-adjunto. Contudo, para cada caso, devemos saber quando um potencial V satisfaz o
Teorema 4.35 (algumas classes de potenciais já apareceram no Teorema 10.1). Felizmente, no
caso do poço de potencial finito existe um critério simples, como mostra o seguinte
LEMA 10.4. Seja V uma função contínua em um intervalo I ∈ R. Então, as seguintes proprie-
dades são equivalentes:
$ a+1/2
1. C = sup dx |V (x)|2 < ∞.
a∈R a−1/2
2. Para cada ε > 0 arbitrário existem constantes a(ε) e b(ε) tais que
∥V Ψ∥ # a(ε)∥H0Ψ∥ + b(ε)∥Ψ∥ , Ψ ∈ Dom(H0 ) .

22
Shlomo Sternberg, “A Mathematical Companion to Quantum Mechanics,” Dover Publications, 2019.
23
Shlomo Sternberg, “A Mathematical Companion to Quantum Mechanics,” Dover Publications, 2019.
689
3. Dom(H0 ) ⊂ Dom(V ).
Demonstração. Assuma que 1 seja verdade. Tome uma função Ψ ∈ Dom(H0 ) tal que Ψ seja
real valorada, que Ψ ∈ C 1 (I), que Ψ′ ∈ AC(I) e que Ψ′′ ∈ L2 (I). A seguir, note que para
x, y ∈ [a − 1/2, a + 1/2], temos
$ x $ a+1/2 , -2 $ a+1/2
2 2 dΨ(z) dΨ(z) −1
Ψ (x) − Ψ (y) = dx 2Ψ(z) #ε dz +ε dx Ψ2 (z) .
y dz a−1/2 dz a−1/2
Aqui, usamos a desigualdade 2ab # εa2 + ε−1 b2 . Como Ψ foi assumida ser real valorada,
então, pelo Teorema do Valor Médio para integrais definidas,24 podemos concluir que f alcança
seu valor médio em algum ξ em (a, b). podemos escolher um x2 ∈ [a − 1/2, a + 1/2] tal que
$ a+1/2
2
Ψ (y) = dz Ψ2 (z). Logo, temos
a−1/2
$ 5 5 $ a+1/2
a+1/2 5 dΨ(z) 52
2
|Ψ(x)| # ε 5
dz 5 5 −1
+ (1 + ε ) dz |Ψ(z)|2 ,
a−1/2 dz 5 a−1/2
Ao decompor Ψ em partes real e imaginária a desigualdade acima permanece válida para

funções Ψ ∈ Dom(H0 ) que sejam complexa valoradas. Então, multiplicando por |V (x)|2 e
integrando sobre [a − 1/2, a + 1/2], segue que
$ a+1/2 $ a+1/2 5 52 $ a+1/2
5 dΨ(z) 5
2
dx |V (x)Ψ(x)| # εC 5
dz 5 5 −1
+ (1 + ε )C dz |Ψ(z)|2 .
a−1/2 a−1/2 dz 5 a−1/2
Como o intervalo [a − 1/2, a + 1/2] tem comprimento 1 e como a reta real é a união de
intervalos de comprimento 1, obtemos que
$ ∞ $ ∞ 5 5 $ ∞
5 dΨ(z) 52
2
dx |V (x)Ψ(x)| # εC dz 55 5 −1
dz |Ψ(z)|2 . (10.5.1)
dz 5 + (1 + ε )C
−∞ −∞ −∞
Agora, pelo Teorema 6.14, temos

$ ∞ 5 5 $ ∞
5 dΨ(z) 52
dz 55 5 ^ 2
dz 5 = dk |k Ψ(k)|
−∞ −∞
$ $ ∞
1 ∞ ^ 2 1 ^ 2
# dk |k Ψ(k)| + dk |Ψ(k)|
2 −∞ 2 −∞
2m2 1
= ∥H0 Ψ∥2 + ∥Ψ∥2 .
# 4 2
24
Lembre-se que, de acordo com o Teorema do Valor Médio para integrais, se f é uma função contínua no
intervalo [a, b], então, existe ξ ∈ [a, b], tal que
$ b
dx f (x) = (b − a)f (ξ) .
a
Como o valor médio de f em [a, b] é definido como

$ b
1
dx f (x) .
b−a a
690
Substituindo isto em (10.5.1), segue que

$ ∞ , -
2 2m2 εC 2 1 ε
dx |V (x)Ψ(x)| # ∥H0 Ψ∥ + 1 + + C∥Ψ∥2 . (10.5.2)
−∞ # 4 ε 2
2 4 −1 −1
HFinalmente, definindo a(ε) = 2m εC/# , b(ε) = (1 + ε + 2 ε) C, adicionando o termo
2 a(ε)b(ε)∥H0 Ψ∥∥Ψ∥ do lado direito de (10.5.2) e tomando a raíz quadrada dos dois lados,
obtemos que
∥V Ψ∥ # a(ε)∥H0 Ψ∥ + b(ε)∥Ψ∥ , Ψ ∈ Dom(H0 ) .
Note que, se tomarmos εC < #4 /(2m2 ) para garantir que a(ε) seja menor que 1, o critério
de perturbação de Kato estará satisfeito e, portanto, H = H0 + V é auto-adjunto. Além disso,
a desigualdade acima diz que V Ψ ∈ L2 (R) quando Ψ ∈ Dom(H0 ). Isto significa que
Dom(H0 ) ⊂ Dom(V ). Portanto, isto prova que 2 =⇒ 3. Que 3 =⇒ 1 segue do Teorema
10.1 item (iv).
COROLÁRIO 10.3. O operador H = H0 + V em L2 (R), em que V é o poço de potencial finito,
é auto adjunto no domínio Dom(H0 ).
Demonstração. Note que, no caso do poço de potencial finito

$ ∞ $ a
2
dx |V (x)Ψ(x)| = dx |V0 Ψ(x)|2 # 2aV02 ∥Ψ∥2 .
−∞ −a
Isto implica que o limite relativo de V em relação a H0 é zero. Portanto, V é infinitesimalmente

pequeno em relação a H0 . Consequentemente, isto prova que H = H0 + V em L2 (R) é auto
adjunto no domínio Dom(H0 ), em que V é o poço de potencial finito.
Agora que provamos que o operador de Schrödinger H = H0 + V é auto-adjunto no caso

em que V é o poço de potencial finito, precisamos obter mais informações sobre o domínio
Dom(H0 ).25 Essas informações estão contidas no
LEMA 10.5. Suponha que Ψ é suave em cada um dos intervalos (−∞, −a), (−a, a) e (a, ∞).
Então, Ψ pertence ao domínio do operador H = H0 + V , com V representando o poço de
potencial finito, se, e somente se, (1) Ψ e dΨ/dx são contínuas em x = ±a, e (2) d2 Ψ/dx2
pertence a L2 (R).
Demonstração. Suponha primeiro que Ψ satisfaça as condições (1) e (2). Então, não é difícil
ver que a derivada segunda de Ψ, no sentido distribucional, é simplesmente a função d2 Ψ/dx2
computada no sentido ordinário em todos os pontos x ̸= ±a. (A segunda derivada pode não
existir em x = ±a, mas simplesmente deixamos d2 Ψ/dx2 indefinido nesses dois pontos, que
formam um conjunto de medida zero.) Assim, d2 Ψ/dx2 , calculado no sentido distribucional, é
um elemento de L2 (R).
Por outro lado, se Ψ, ou dΨ/dx, tem uma descontinuidade em x = a ou em x = −a,

então, a derivada distribucional conterá um múltiplo da função-δ de Dirac, ou um múltiplo da
25
Lembramos que, em qualquer dimensão, definimos o domínio de H0 como o conjunto de todas a funções
^ ∈ L2 (R).
Ψ ∈ L2 (R) tal que a transformada de Fourier ∥k∥2 Ψ
691
derivada da função-δ, em um desses pontos (veja o Exemplo 6.9). Mas, nem a função-δ nem a
derivada da função-δ são funções de quadrado integrável.
No Exemplo 5.7 mostramos que quando V = 0, o espectro de H0 consiste do eixo real

não-negativo, isto é, σ(H0 ) = [0, ∞). Agora, queremos estudar o espectro de H quando V
é o poço de potencial finito. Assumimos que Dom(H) = Dom(H0 ). Começamos com a
seguinte
PROPOSIÇÃO 10.8. Se V é o poço de potencial finito, então, todo λ " −V0 está em σ(H).
Assim, σ(H) = [−V0 , ∞).
Demonstração. Pelo Corolário 10.3, o limite relativo de V em relação a H0 é zero.

√ Além disso,
segue também do Corolário 10.3 que, pelo Critério
√ de Kato (Definição 4.31), b = 2aV0 . Como
′ ′
2a é a largura do poço, se redefinimos b = b/ 2a, então, b = V0 e pelo Teorema 4.35, segue
que σ(H) = [−V0 , ∞).
PROPOSIÇÃO 10.9. Se V (x) " −V0 para todo x, então, todo −λ < −V0 está no conjunto
resolvente de H, ou seja, (−∞, −V0 ) ⊂ ρ(H).
Demonstração. Partimos da expressão

[ \ [ . / \ #2 [ \
Ψ, (H − λ1I)Ψ = Ψ, H0 + (V − λ1I) Ψ = ^ 2 + Ψ, (V − λ1I)Ψ .
∥k Ψ∥
2m
Logo, se −λ < −V0 , segue que
[ \ [ \
Ψ, (H + λ1I)Ψ " Ψ, (V + λ1I)Ψ " (−V0 + λ)⟨Ψ, Ψ⟩ ,
e aplicando a desigualdade de Cauchy-Schwarz-Bunjakowski, obtemos
∥Ψ∥∥(H + λ1I)Ψ∥ " | − V0 + λ|∥Ψ∥2 ,
ou
∥Ψ∥ # C∥(H + λ1I)Ψ∥ ,
com C = |−V01+λ| . Isto mostra que não existe uma sequência satisfazendo a Definição 5.6. De
fato, provamos (veja o Teorema 5.11) que se −λ não pertence ao espectro essencial de H não
pode existir uma tal sequência. Se −λ ∈ ρ(H), então, (H + λ1I)−1 é limitado e nenhuma
sequência com ∥Ψn ∥ = 1 e (H + λ1I)Ψn → 0 pode existir, enquanto que se −λ é um ponto
isolado do espectro nenhuma tal sequência satisfazendo as condições do Teorema 5.11 também
não pode existir. Assim, de acordo com o Teorema 5.11, −λ está no conjunto resolvente de
H.
Nota 10.20. Deve ficar claro que a Proposição 10.9 é válida para qualquer dimensão!
As duas proposições acima estabelecem que (i) o espectro essencial de H é igual ao espectro
essencial de H0 , isto é, σess (H) = σess (H0 ) = [0, ∞) e que não existem auto-valores na região
[0, ∞), (ii) não existe espectro abaixo de −V0 e (iii) o espectro discreto de H consiste de
auto-valores de multiplicidade finita, com σdisc (H) = [−V0 , 0), isto é, H tem auto-valores
692
discretos na região −V0 < E < inf σess (H), de maneira que HΨ = EΨ. Esses auto-valores
podem ser determinados resolvendo-se a equação de Schrödinger independente do tempo
, -
#2 d
− + V (x) Ψ(x) = EΨ(x) .
2m dx
Para a região |x| > a, temos

d
Ψ(x) = β 2 Ψ(x) ,
dx
Q
em que definimos β = − 2mE #2
, lembrando que −V0 < E < 0. Para x > a, a única solução
da equação acima que pertence a L2 (R) é da forma
Ψ(x) = Ce−βx ,
enquanto que para x < −a, a única solução da equação acima que pertence a L2 (R) é da
forma
Ψ(x) = Ceβx .
Por sua vez, para a região |x| # a, temos

d
Ψ(x) = −α2 Ψ(x) ,
dx
Q
2m(E+V0 )
em que definimos α = #2
. Para esta região as soluções são da forma
Ψ(x) = A cos αx (solução par) ,
e
Ψ(x) = B sin αx (solução ímpar) .
Para completar a solução, por causa da continuidade, de acordo com o Lema 10.5, temos que
combinar as funções de onda Ψ e suas derivadas nos pontos x = −a e x = a. Em vez de
combinar Ψ e dΨ/dx separadamente, uma simplificação que pode ser usada é a combinação da
chamada derivada logarítmica (1/Ψ)(dΨ/dx). Em virtude do Lema 10.5, essas derivadas devem
ser iguais nos pontos x = −a e x = a. Assim, ao combinarmos as derivadas logarítmicas para
as soluções pares nos limites x = ±a, obtemos
α tan αa = β ,
enquanto que, oo combinarmos as derivadas logarítmicas para as soluções ímpares nos mesmos
limites, obtemos
α cot αa = −β .
Para entender as soluções dessas equações, introduzimos as grandezas adimensionais ξ = αa

e η = βa. Logo, as equações acima tomam as formas mais simples
ξ tan ξ = η (solução par) , (10.5.3)
693
ξ cot ξ = −η (solução ímpar) . (10.5.4)
Note que,
ξ 2 + η2 = γ 2 , (10.5.5)
Q
2
em que γ = 2mV 0a
#2
. O parâmetro γ é muitas vezes denominado parâmetro de intensidade.
A Eq.(10.5.5) é a equação de um círculo no plano-(ξ, η).
Estamos interessados nas soluções com ξ e η positivos. Consequentemente, as soluções das

Eqs.(10.5.3) e (10.5.4) são obtidas pelas interseções das curvas (ξ, ξ tan ξ) e (ξ, ξ cot ξ) com o
círculo (10.5.5), respectivamente. Como ξ e η devem ser positivos, então, quando ξ variar de 0 a
π/2, ξ tan ξ cresce de 0 até ∞, de maneira que a curva η = ξ tan ξ sempre intercepta o círculo.
O ponto de interseção determina o valor de E do estado ligado. De π/2 a π, η = ξ tan ξ é
negativo e, portanto, não aparece no primeiro quadrante (veja a Figura 10.5 abaixo). Isto significa
que para π/2 a π não existem estados ligados para soluções pares, mas ainda temos o estado
ligado ímpar.
η
ξ tan ξ −ξ cot ξ ξ tan ξ
η 2 + ξ2 = γ 2
π π 3π ξ
2 2
Figura 10.5: Valores reais de E obtidos pelas interseções devem ser obtidos numericamente.
De π a 3π/2, obtemos a curva original transladada. Em outras palavras, isto implica que
obteremos as curva original transladada por multiplicações de π na direção ξ. Assim que nπ
excede o raio do círculo (10.5.5), não podemos mais ter uma interseção. Isso mostra que existem
apenas um número finito auto-valores correspondentes a auto-função par. Com efeito, o número
de auto-valores pares é o inteiro n tal que
2mV0 a2
nπ # < (n + 1)π .
#2
Por fim, observe que a continuidade de Ψ em x = ±a exige que Ce−βa = A cos αa, o que
mostra que cada auto-valor par tem multiplicidade finita.
694
De forma análoga, podemos computar os auto-valores ímpares (esta situação também está
representada na Figura 10.5). Neste caso, o número de auto-valores pares é o inteiro n tal que
π 2mV0 a2 π
n # < (n + 1) ,
2 # 2 2
com a continuidade de Ψ em x = ±a exigindo que Ce−βa = B sin αa, o que mostra que
cada auto-valor ímpar também tem multiplicidade finita.
Na Figura 10.5, vemos duas interseções, o que significa dois estados ligados. A primeira
interseção ocorre perto de ξ = π/2. Esta interseção representa o estado fundamental, ou o
estado ligado com a maior energia de ligação. A segunda interseção ocorre entre π/2 e 3π/2.
À medida que o raio do círculo se torna maior, temos mais e mais interseções; o parâmetro
de intensidade γ controla o número de estados ligados. Finalmente, note que há sempre uma
solução par, não importa quão pequena seja γ, porque o arco do círculo sempre irá cruzar a
primeira curva do gráfico η = ξ tan ξ. Assim, existe sempre pelo menos um estado ligado,
associado a auto-função par, por menos profundo que possa ser o poço finito!
Ψ3
x
Ψ2
x
Ψ1
−a a x
Figura 10.6: As três primeiras auto-funções, com Ψ1 e Ψ3 sendo pares e Ψ2 ímpar.
Na Figura 10.6 nós esboçamos as auto-funções que são soluções da equação de Schrödinger,
independente do tempo, para o poço de potencial quadrado associadas com os três primeiros
estados ligados, com energias E1 < E2 < E3 . Algumas características dessa auto-funções
merecem ser destacadas: elas se alternam como par e ímpar. Elas têm zero, um e dois nodos,
respectivamente (quanto maior o número de nodos das auto-funções, menor será o valor da
energia de ligação). A derivada segunda de cada auto-função Ψ é negativa para |x| < a e
positiva para |x| > a (na verdade é descontínua em x = ±a). O decaimento exponencial na
região |x| > a é mais rápido para o estado fundamental e vai ficando mais lento à medida que
a energia do estado ligado vai diminuindo.
Nota 10.21 (Tunelamento). Observe que, embora as auto-funções estejam decaindo exponen-
cialmente, elas não são zero fora do poço. Isto está em contraste com uma partícula clássica
aprisionada em um poço do qual ela não pode escapar; ou seja, existe uma probabilidade da
partícula ser encontrada fora do poço de potencial finito. Em outras palavras, a função de onda
Ψ penetra a região classicamente proibida. Este efeito é chamado de tunelamento quântico.
695
10.6 Operador de Schrödinger Bidimensional: O Caso do

Potencial do Tipo Bessel-Macdonald
Nesta seção, analisamos o operador Schrödinger em duas dimensões, com um potencial
atrativo dado por uma função de Bessel-Macdonald. Esse operador é derivado da aproxima-
ção não-relativística dos modelos de eletrodinâmica quântica planar (QED3 ) ao se estudar o
potencial de espalhamento de duas quase-partículas. A análise é motivada tendo em mente o
fato de que os modelos de QED3 com preservação da paridade podem fornecer uma possível
explicação para o comportamento dos supercondutores.26
O operador hamiltoniano que modela a aproximação não-relativística da QED3 com simetria

de paridade preservada é dado pela seguinte expressão:
#2 2
H = H0 + V = − ∇ (x) − αK0 (β∥x∥) . (10.6.1)
2µ
Aqui, µ representa a massa reduzida e α é o parâmetro de acoplamento considerado, sem
perda de generalidade, não-negativo. As constantes α e β dependem dos parâmetros de cada
modelo, como o valor esperado do vácuo de algum campo, a carga do elétron, as constantes
de acoplamento, os comprimentos característicos, a massa dos campos (exemplo do bóson
mediador), etc.
Levando em conta que o potencial K0 (β∥x∥) é esfericamente simétrico, como no Exemplo

10.2, introduziremos coordenadas polares (r = ∥x∥, θ), de modo que
L2 (R2 ) = L2 ((0, ∞); rdr) ⊗ L2 (S 1 , dθ) ,
em que S 1 é o círculo unitário em R2 . Seja D o conjunto de todas as funções que são

combinações lineares de produtos Ψ(r)Θ(θ), com Ψ ∈ L2 ((0, ∞); rdr) e Θ ∈ L2 (S 1 , dΘ).
Então, pela separação de variáveis para a equação de Schrödinger em D = 2, segue que
F 2 G
# 2
− ∇ − αK0 (β∥x∥) Ψ(x) = EΨ(x) x ∈ R2 (E: energia) ,
2µ
nas partes radial e angular, segue que a parte radial assume a forma
F 2, 2 - G
# d 1 d #2 m2
− + + − αK0 (βr) Ψ(r) = EΨ(r) , (10.6.2)
2µ dr 2 r dr 2µr 2
enquanto a parte angular assume a forma
d2 Θ(θ)
= −m2 Θ(θ) . (10.6.3)
dθ2
O operador d2 /dθ2 , com domínio C0∞ (S 1 ), é essencialmente auto-adjunto. Seus auto-vetores
Θm (θ) = (2π)−1/2 eimθ , com m ∈ Z, constituem uma base ortonormal de L2 (S 1 , dθ).
26
A discussão abaixo foi retirada do artigo Wellisson B. De Lima, Oswaldo M. Del Cima, Daniel H.T. Franco e
Bruno C. Neves, “On the Two-Dimensional Schrödinger Operator with an Attractive Potential of the Bessel-Macdonald
Type,” Annals of Physics 427 (2021) 168385 e da Monografia de Conclusão do Curso de Física de Wellisson B. De
Lima, “Estados Ligados Elétron-Elétron na Eletrodinâmica Quântica Planar.” Depto. de Física, UFV, 2016.
696
Seja Ωm o subespaço gerado pelas funções Θm e Lm = L2 ((0, ∞); rdr) ⊗ Ωm . Então,

h
L2 (R2 ) = Lm .
m∈Z
Se 1Im é o operador identidade

5 em Ωm , a restrição do operador hamiltoniano H a Dm =
D ∩ Lm é dada por H 5Dm = Hm ⊗ 1Im ; isso nos dá uma equação diferencial de Bessel para
Ψ ∈ C0∞ (0, ∞) ⊂ L2 ((0, ∞); rdr),
F , - G
#2 d2 1 d #2 m2
Hm Ψ(r) = − 2
+ + − αK0 (βr) Ψ(r) .
2µ dr r dr 2µr 2
Em completa analogia com o caso R3 discutido no Exemplo 10.2, é conveniente introduzir a

transformação unitária U : L2 ((0, ∞); rdr) → L2 (0, ∞) representada pelo operador unitário
(U ψ)(r) = rΨ(r) = Φ(r) = r 1/2 Ψ(r) . (10.6.4)
Em termos de uma função Φ, definida por (10.6.4), segue que

F , 2 2 -G
#2 d 2 # (m − 1/4)
Hm Φ(r) = − + − αK0 (βr) Φ(r) . (10.6.5)
2µ dr 2 2µr 2
Isto reduz o problema do operador hamiltoniano, H, em duas dimensões em um problema do

operador hamiltoniano, Hm , em uma dimensão, com um potencial efetivo dado por:
def. #2 (m2 − 1/4)

Veff. (r) = − αK0 (βr) .
2µr 2
Nota 10.22. Pode-se mostrar que a função-de-onda (10.6.4) associada à um estado ligado, com
energia negativa se comporta com27
⎧ 1
⎨O(r m+ 2 ) for r → 0
Φ(r) = .
⎩O(e−kr ) for r → ∞; k = (−2µE) #
1
2
−1
Portanto, segue que tal função Φ pertence a H = L2 ((0, ∞); |V (r)|dr), assim como a
L2 ((0, ∞); dr).
Nota 10.23. Da expressão V (r) = −αK0 (βr) podemos ver que α tem dimensão de energia e
nos dá uma escala de energia para a interação entre duas partículas. Por sua vez, o parâmetro
β tem dimensão de inverso de comprimento, fixando assim uma escala de comprimento, um
intervalo de interação, que está relacionado à massa do bóson mediador (Mb ) trocado durante
o espalhamento de duas partículas. Isso pode ser verificado se considerarmos o comprimento
de onda Compton do campo mediado pelo bóson, 2π#(Mb c)−1 , portanto β ∼ Mb . Além
disso, se tomarmos a constante, #2 β 2 (2µ)−1, que tem dimensão de energia, juntamente com
a relação entre β e Mb , uma escala de energia também é corrigida. Assim, introduzimos uma
constante adimensional C = 2µα(#β)−2 que dá uma noção de quão forte é a interação entre
os dois quanta (α) quando comparado com a energia do bóson mediador (Mb c2 ). Ao levar em
27
Veja N. Setô, “Bargmann’s inequalities in spaces of arbitrary dimension,” Publ. RIMS, Kyoto Univ. 9 (1974) 429.
697
consideração essa análise, reescrevemos o potencial efetivo de uma maneira mais conveniente,
isto é,
(m2 − 1/4)
veff. (s) = − CK0 (s) . (10.6.6)
s2
em que definimos
2µα
s = βr , C= .
#2 β 2
Portanto,
2µ
veff. (s) = Veff. (s) .
#2 β 2
Vejamos, agora, como o Critério de Kato e o Teorema de Kato-Rellich nos permitem estabe-
lecer a auto-adjunção do operador de Schrödinger (10.6.1).
PROPOSIÇÃO 10.10. O operador hamiltoniano (10.6.1) em L2 (R2 ) é auto-adjunto no domínio
Dom(H0 ).
Naturalmente, está implícito no enunciado da Proposição 10.10 que Dom(V ) contém

Dom(H 0 ). Além disso, o significado do operador V = −CK0 (∥x∥) é claro: ele é de
fato um operador multiplicativo e seu domínio Dom(V ) consiste de todas as funções Ψ ∈
H = L2 (R2 ). Assim definido, V é obviamente auto-adjunto.
Nota 10.24. No restante desta seção não adotaremos as unidades atômicas # = α = 2µ = 1,
como fizemos anteriormente!
A prova do Proposição 10.10 requer o seguinte28

LEMA 10.6. Toda Ψ ∈ Dom(H0 ) ⊂ L2 (R2 ) é limitada por
µ1/2 . 2 /
∥Ψ∥∞ # λ ∥Ψ∥2 + ∥H0 Ψ∥2 .
(2π) #λ
3/2
Demonstração. Seguindo o mesmo raciocínio do Lema 10.1, usando uma constante arbitrária
λ > 0, considere que para n # 3 e para cada Ψ ∈ Dom(H0 ) ⊂ L2 (Rn ), a função
^
k 3→ (λ2 + (2µ)−1 ∥k∥2 )−1 ∈ L2 (Rn ). Além disso, L2 (Rn ) ∋ (λ2 + (2µ)−1 ∥k∥2 )Ψ(k) =
2 29
F (λ Ψ + H0 Ψ). Portanto, pela desigualdade de Hölder,
^
(λ2 + (2µ)−1 ∥k∥2 )−1 (λ2 + (2µ)−1 ∥k∥2 )Ψ(k) ∈ L1 (R2 ) ,
28
Aqui, estamos repetindo propositalmente a prova do Lema 10.1, pois estamos levando em conta explicitamente
todos os parâmetros.
29
Aqui, estamos adotando a seguinte convenção para a transformada de Fourier:
$
8 9
^
F Ψ (k) = Ψ(k) = dn x ei! k·x Ψ(x) ,
−1
Rn
$
8 −1 9 1
F Ψ^ (x) = Ψ(x) = dn k e−i!
−1
k·x ^
Ψ(k) .
(2π#)n Rn
O # é introduzido para manter as unidades consistentes com a interpretação física.
698
e
$
^ 1= d2 k 2 ^
∥Ψ∥ (λ + (2µ)−1 ∥k∥2 )−1 (λ2 + (2µ)−1 ∥k∥2 )|Ψ(k)|
R2 #2
,$ -1/2 ,$ -1/2
d2 k 2 d2 k 2 ^
# (λ + (2µ)−1 ∥k∥2 )−2 (λ + (2µ)−1 ∥k∥2 )2 |Ψ(k)| 2
.
R2 #2 R2 #2
A primeira
√ integral pode ser facilmente calculada. De fato, aplicando a troca de variável
k → ( 2µλ) k e usando a Tabela de Integrais de Gradshtein-Ryzhik (fórmula 3.241, 4.11 , pg.
−1
322) nós obtemos

$ $
d2 k 2 −1 2 −2 4πµ ∞ 2πµ
(λ + (2µ) ∥k∥ ) = 2 2 dk k(1 + k 2 )−2 = 2 2 .
R2 # #λ 0 #λ
2
B CD E
1/2
Agora, usando a desigualdade de Minkowski, temos
^ 1# (2πµ)1/2 ?
? 2 ^?
?
∥Ψ∥ ?(λ + (2µ)−1 ∥k∥2 )Ψ ?
#λ 2
(2πµ)1/2 6 2 ^ ? ?7
−1 ? 2^?
# λ ∥Ψ∥2 + (2µ) ?∥k∥ Ψ? .
#λ 2
Por outro lado, pela transformada inversa de Fourier,

$
1 −1
^
Ψ(x) = 2
d2 k e−i# k·x Ψ(k) ,
(2π#) R2
^ 1 . Isto implica que,

obtemos a estimativa bem conhecida ∥Ψ∥∞ # (2π)−2 ∥Ψ∥
µ1/2 6 2 ^ ? ?7
−1 ? 2^?
∥Ψ∥∞ # λ ∥Ψ∥2 + (2µ) ?∥k∥ Ψ?
(2π)3/2 #λ 2
µ1/2 . 2 /
= λ ∥Ψ∥2 + ∥H0 Ψ∥2 ,
(2π) #λ
3/2
uma vez que a transformada de Fourier é um operador unitário. Isso completa a prova.
Demonstração da Proposição 10.10. Primeiro, mostramos que V (x) = −αK0 (β∥x∥) ∈ L2 (R2 ).
Com efeito, usando a Tabela de Integrais em Gradshteyn-Ryzhik (fórmula 6.521, 6.∗ , pg.665),
obtemos que
⎛ ⎞1/2
, $ -1/2 ⎜ $ ∞ ⎟
⎜ ⎟ π 1/2 α
∥V ∥2 = α2 2
dx K02 (β∥x∥) = ⎜2πα 2
dr rK02 (βr)⎟ = .
R2 ⎝ ⎠ β
B0 CD E
1/2β 2
699
//// ^ |Ψ|
Ψ ^2 #−2 d2 k λ2 α β µ ^ 1
∥Ψ∥ ∥Ψ∥∞ ∥V ∥2 a(λ) b(λ)
Dim. L L2 L−2 E E L−1 M L−1 L−1 EL ∅ E
^ e tutto il resto.
Tabela 10.1: Dimensões of Ψ
Portanto, V (x) = −αK0 (β∥x∥) ∈ L2 (R2 ). Obviamente, como um operador de multiplicação,

V é fechado em seu domínio de definição; isso implica que se Ψ ∈ L2 (R2 ), então V Ψ ∈
L2 (R2 ).
Novamente, usando a desigualdade de Hölder, segue que ∥V Ψ∥2 # ∥V ∥2 ∥Ψ∥∞ . Assim,

pelo Lema 10.6, obtemos
µ1/2 . 2 /
∥V Ψ∥2 # ∥V ∥2 λ ∥Ψ∥ 2 + ∥H 0 Ψ∥ 2
(2π)3/2 #λ
µ1/2 α . 2 /
= λ ∥Ψ∥ 2 + ∥H 0 Ψ∥ 2 .
23/2 π#λβ
Definimos
µ1/2 α µ1/2 αλ
a(λ) = e b(λ) = . (10.6.7)
23/2 π#λβ 23/2 π#β
Uma vez que λ é uma constante positiva arbitrária, basta assumir que
µ1/2 α
<λ,
23/2 π#β
para o fator a(λ) ser menor do que 1. Isto prova que o potencial V (x) = −αK0 (β∥x∥) é
H0 -limitado, de maneira que o Teorema 4.35 se aplica e comprova a auto-adjunção do operador
de Schrödinger (10.6.1).
Nota 10.25. Neste ponto, lembre-se de que a interpretação física da função de onda é aquela
que afirma que d2 x |Ψ(x)|2 dá a probabilidade de encontrar a partícula quântica em uma
região d2 x em torno da posição x. Probabilidade é uma quantidade adimensional. Portanto,
|Ψ(x)|2 deve ter dimensão inversa de área L−2 enquanto Ψ tem dimensão L−1 . Da mesma
^
forma, a interpretação física da função de onda no espaço dos momenta é que #−2 d2 k |Ψ(k)| 2
−2 2
dá a probabilidade de encontrar a partícula quântica em uma região # d k em torno do
^
momento k. Portanto, |Ψ(k)| 2
deve ter dimensão de comprimento ao quadrado L2 e Ψ ^ tem
dimensão L. As dimensões de todas as quantidades envolvidas nas provas do Lema 10.1 e da
Proposição 10.10 são coletadas na Tabela 10.1.
Como já mencionado, muitas vezes é importante determinar o ponto mais baixo do espectro
de um operador auto-adjunto. Esse problema só faz sentido se o operador for limitado por
baixo, pois, caso contrário, o espectro se estende para −∞. A limitação por baixo do operador
de Schrödinger com potencial K0 é analisada a seguir.
TEOREMA 10.20. O operador de Schrödinger (10.6.1) é limitado inferiormente por −Cα/4π, em
que C = 2µα(#β)−2 é uma constante adimensional, enquanto α tem dimensão de energia e
nos fornece uma escala de energia para a interação entre as duas partículas.
700
Demonstração. Primeiro, suponha que Ψ pertence a um core de H0 . Assim, sem perda de

generalidade, podemos assumir que Ψ ∈ C0∞ (Rn ). De acordo com o Teorema 10.3, o espectro
do operador H0 em Dom(H0 ) é σ(H0 ) = [0, ∞). Isso significa que
inf ⟨Ψ, H0 Ψ⟩ = inf σ(H0 ) = 0 .
Ψ∈Dom(H0 )
∥Ψ∥=1
Assim, H0 é limitado por baixo por zero e pelo Teorema 4.35 e pela Proposição
. 10.10/ obtemos
que o operador de Schrödinger (10.6.1) é limitado por baixo por −b(λ)/ 1 − a(λ) , em que
a(λ) e b(λ) são dados por (10.6.7).
Agora, considere a função

b(λ) Aλ2
f (λ) = = ,
1 − a(λ) λ−A
em que
µ1/2 α
A= .
23/2 π#β
Para procurar os pontos extremos da função acima (máximo ou mínimo), primeiro é neces-
sário identificar os pontos críticos da função e depois verificar o sinal da derivada segunda de
f . A primeira e a segunda derivada de f são, respectivamente,
2Aλ Aλ2
f ′ (λ) = − ; (10.6.8)
λ − A (λ − A)2
2A 2Aλ 2Aλ 2Aλ2

f ′′ (λ) = − − + . (10.6.9)
λ − A (λ − A)2 (λ − A)2 (λ − A)3
Agora, como temos a primeira derivada, segue-se de (10.6.8) que o ponto crítico é λ0 = 2A.
Com o ponto crítico λ0 pode-se definir λ = 2A em (10.6.9) e é fácil ver que f ′′ (λ0 ) > 0. Assim,
pelo teste da segunda derivada λ0 = 2A é de fato um mínimo. Consequentemente, temos
5 Cα
5
f (λ)5 = 4A2 = .
λ=λ0 4π
Deste modo, o operador de Schrödinger (10.6.1) é limitado inferiormente por −Cα/4π, como
queríamos provar. Esse resultado garante a estabilidade de possíveis estados ligados de duas
quase-partículas.
# 2
COROLÁRIO 10.4. Para H = − 2µ ∇2 (x) − αK0 (β∥x∥) segue que σ(H) = [−Cα/4π, +∞).
Demonstração. Naturalmente, de acordo com o Teorema 10.20, não existe pontos do espectro
abaixo de −Cα/4π. Em outras palavras, o fato do operador H ser limitado inferiormente
implica que existe um valor de energia E0 = −Cα/4π (negativo no caso considerado aqui), de
modo que ⟨Ψ, HΨ⟩ " E0 ⟨Ψ, Ψ⟩ para toda função Ψ ∈ Dom(H), ou equivalentemente, que
todo o espectro esteja em E " −Cα/4π. Isto corresponde à existência de estados ligados, com
#2
o estado de menor energia sendo −Cα/4π no espectro de H = − 2µ ∇2 (x) − αK0 (β∥x∥).
Dessa forma, σ(H) = [−Cα/4π, +∞).
701
Voltando às propriedades espectrais do operador de Schrödinger (10.6.1), queremos obter

informações não apenas sobre o espectro de H, σ(H), mas também sobre os subconjuntos
σdisc (H) e σess (H). Já vimos que, se V é real e H0 -limitado, com limite relativo < 1, e
se V (x) → 0 quando ∥x∥ → ∞, então σess (H0 + V ) = σess (H0 ) = [0, ∞) em C0∞ (Rn )
(logo H só pode ter auto-valores isolados e negativos, possivelmente acumulando-se em 0).
Consequentemente, tendo em conta que o potencial K0 é um potencial de Kato-Rellich real,
que tende a zero no infinito (levando em conta sua forma assintótica), somos levados ao seguinte
resultado:
# 2
PROPOSIÇÃO 10.11. Para H = − 2µ ∇2 (x) − αK0 (β∥x∥) segue que σess (H) = [0, +∞).
No limite inferior do espectro essencial ou acima deste valor, qualquer energia afetará o
estado ligado de dois quanta porque E > 0. O par de dois quanta não será mais localizado,
ou seja, as quasi-partículas se moverão livremente. Portanto, o operador de Schrödinger (10.6.1)
pode ter apenas auto-valores discretos em [−Cα/4π, 0). Em particular, sob certas condições
existe exatamente somente um estado ligado de dois quanta, isto é, um auto-estado abaixo do
parte inferior do espectro essencial, conforme mostrado a seguir.
# 2
PROPOSIÇÃO 10.12. Em relação à parte discreta do espectro do operador H = − 2µ ∇2 (x) −
αK0 (β∥x∥), se 0 < C < 2, para m ! C = 2m, para m " 1, em que m é o valor do
= 0, ou se "
momento angular, então, σdisc (H) = −Cα/4π , com a multiplicidade do estado fundamental
sendo um.
A prova desta proposição será apresentada no final desta seção. Primeiro, obtemos uma
estimativa para o número de estados ligados de dois quanta. Para o caso m = 0 (momento
angular zero) não é difícil ver que o potencial será unicamente atrativo, como podemos ver
através de uma inspeção direta da Eq.(10.6.6) (veja a Figura 10.7).
s
veff (s)
C<1
C=1
C>1
caso m = 0
Figura 10.7: Potencial efetivo para o caso m = 0 e alguns valores de C.
O potencial (10.6.6) se comporta, qualitativamente, como o potencial de Coulomb no espaço

tridimensional e, se houver estados ligados no modelo, eles provavelmente aparecerão para
702
o estado do momento angular zero (m = 0) (ou onda-s como é mais conhecido), uma vez
que o potencial é exclusivamente atrativo. Observe que, se mantivermos o parâmetro C fixo
e aumentarmos o momento angular em uma unidade, o termo centrífugo positivo dá uma
contribuição repulsiva ao potencial efetivo e pode até exceder o termo atrativo (veja a Figura
10.8).
caso m = 1
veff (s)
Figura 10.8: Potencial efetivo para o caso m = 1 e os mesmos valores de C da Figura 10.7.
Por outro lado, uma análise um pouco mais minuciosa da função potencial efetivo (10.6.6)
sugere que, aumentando o valor de C, para um determinado valor de m, a contribuição atrativa
pode ser maior que a repulsiva (isso é mostrado na Figura 10.9 para C > 1).
veff (s) caso m = 1
C<1
C=1
C>1
Figura 10.9: Potencial efetivo para o caso m = 1 e valor de C maior que os anteriores para a
situação C > 1.
703
Em seguida, obtemos o número limite superior de estados ligados de duas quase-partículas

para qualquer valor do momento angular m. Começamos considerando o caso do momento
angular m > 0 e usamos o seguinte
TEOREMA 10.21 (Primeira desigualdade de Setô). 30 Para 2m + d − 2 " 1, o número de
estados ligados, denotado por Ndm , produzido pelo potencial V , satisfazendo a condição
$ ∞
dr r |V (r)| < ∞ ,
0
para o estado de onda-m no espaço d-dimensional satisfaz a desigualdade

$ ∞
m 1
Nd < dr r |V (r)| . (10.6.10)
2m + d − 2 0
Antes de tudo, precisamos ter cuidado no cálculo da estimativa acima devido ao cumprimento
da condição imposta de consistência dimensional; portanto, realizaremos a seguinte substituição:
$ ∞ $
2µ ∞
dr r|V (r)| −→ 2 dr r |V (r)| .
0 # 0
Assim, podemos avaliar a expressão (10.6.10) adequadamente para d = 2 e m > 0 (momento
angular nulo), obtendo:
$ $
m 1 2µ ∞ 1 2µα ∞ C
N2 < dr r |V (r)| = ds s K0 (s) = .
2m # 0
2 2m # β 0
2 2 2m
B CD E
1
A solução da última integral é obtida da Tabela de Integrais em Gradshteyn-Ryzhik (fórmula

6.561, 16., pg.676). Além disso, analisando o resultado acima, concluímos que se C/2m < 1
(o que implica que C/2 < m) não existirá estados ligados, como já conjecturado por meio de
análise gráfica (cf. a Figura 10.9). Para um valor fixo de C, uma vez que m # C/2, quanto
maior o valor do momento angular, menor será o número de estados ligados de dois quanta.
Vamos agora considerar o caso do momento angular zero, m = 0. Neste caso, o Teorema
10.21 não se aplica. Portanto, temos que recorrer ao seguinte
TEOREMA 10.22 (Segunda desigualdade de Setô). 31 O número de estados ligados, N20 , produ-
zido pelo potencial V , satisfazendo a condição
$ ∞ 6 5 r 57
5 5
dr r 1 + 5ln 5 |V (r)| < ∞ , (10.6.11)
0 R
no estado de onda-0 no espaço bidimensional satisfaz a desigualdade
$ ,$ ∞ 5 r5 -
1 ∞ 5 5
dr r |V (r)| ds s 5ln 5 |V (s)|
0 2 0 0 s
N2 < 1 + $ ∞ . (10.6.12)
dr r |V (r)|
0
30
Veja N. Setô, “Bargmann’s Inequalities in Spaces of Arbitrary Dimension,” Publ. RIMS, Kyoto Univ. 9 (1974)
429, Teorema 3.2
31
Veja N. Setô, “Bargmann’s Inequalities in Spaces of Arbitrary Dimension,” Publ. RIMS, Kyoto Univ. 9 (1974)
429, Teorema 5.1
704
Verificaremos se o potencial K0 satisfaz a condição (10.6.11). Para isso, novamente, com base
na consistência dimensional, fazemos a seguinte substituição:
$ ∞ 6 5 r 57 $ ∞
5 5
dr r 1 + 5ln 5 |V (r)| −→ C ds s (1 + | ln s|)K0 (s) .
0 R 0
Vamos reescrever a última integral da seguinte forma:

$ ∞ $ ∞ $ 1 $ ∞
ds s (1 + | ln s|)K0 (s) = ds s K0 (s) − ds s ln s K0 (s) + ds s ln s K0 (s) .
0 0 0 1
A seguir, analisaremos cada uma das três integrais acima separadamente:
1. A primeira integral é obtida da Tabela de Integrais em Gradshteyn-Ryzhik (fórmula 6.561,

16. pg.676), e é igual a 1.
2. No caso da terceira integral, consideramos que
$ ∞ $ ∞
π
ds s ln s K0 (s) < ds s2 K0 (s) = ,
1 0 2
já que para s > 1, temos que ln s < s. A integral acima no lado direito foi obtida
também da Tabela de Integrais em Gradshteyn-Ryzhik (fórmula 6.561, 16., pg.676).
3. Finalmente, vamos avaliar a segunda integral. Observe que a função f (s) = s ln s K0 (s),
definida no intervalo aberto (0, 1), é bem comportada nesse intervalo, no sentido de que
não existem singularidades de qualquer tipo. Para s = 1, K0 (1) ≃ 0, 4210244382 e,
portanto, f (1) = 0 devido ao termo logarítmico. Para verificar o comportamento de f
quando s → 0, precisaremos do seguinte fato:
s
K0 (s) ≃ − ln as s → 0 .
2
Portanto,
s
lim+ f (s) ≃ lim+ s ln s ln = 0 .
s→0 s→0 2
Como todas as integrais são finitas, isto prova que o potencial V (r) = −CK0 (r) respeita
a condição (10.6.11).
Agora, temos o endosso para determinar o limite do número de estados ligados para o
caso em que m = 0. Novamente, mudando para uma forma dimensionalmente consistente,
reescrevemos a segunda parte de (10.6.12) da seguinte forma:
⎡ $ ∞ ,$ ∞ 5 r5 -⎤
1 5 5
⎢ 2 0 dr r K0 (r) 0 ds s 5ln s 5 K0 (s) ⎥
C⎢⎣ $ ∞ ⎥ .
⎦
dr r K0 (r)
0
A partir da integração na variável s, obtemos

$ ∞ 5 r5 $ ∞
5 5 2
ds s 5ln 5 K0 (s) = r dt t | ln t| K0 (rt) ,
0 s 0
705
em que t = s/r. Esta última é separada em

,$ ∞ $ 1 -
2
. /
r dt t ln t K0 (rt) − dt t ln t K0 (rt) = r 2 I1 + I2 .
1 0
Usando o pacote Mathematica, obtemos

$ ∞
K0 (r)
I1 = dt t ln t K0 (rt) = , (10.6.13)
1 r2
e
$ 1
γ + K0 (r) + ln 2r
I2 = dt t ln t K0 (rt) = − . (10.6.14)
0 r2
em que γ é a constante of Euler-Mascheroni. Portanto, segue que
$ ∞ 5 r5
5 5 r
ds s 5ln 5 K0 (s) = γ + 2K0 (r) + ln .
0 s 2
Ao integrar a variável r, obtemos

$ ∞ 6 $ ∞ $ ∞
r7
dr r K0 (r) γ + 2K0 (r) + ln =γ dr r K0 (r) + 2 dr r K02 (r)
0 2 0 0
$ ∞
r
+ dr r K0 (r) ln .
0 2
Da Tabela de Integrais em Gradshteyn-Ryzhik, pgs.665 e 676, obtemos que a soma dos dois
primeiros termos é igual a γ + 1 e a substituição r = 2t na última integral, junto com as
expressões (10.6.13) e (10.6.14), nos mostram que a última integral é igual −γ.32 Logo, segue que
$ ∞ 6 r7
dr r K0 (r) γ + 2K0 (r) + ln =1.
0 2
Consequentemente, reunindo toda a análise acima, obtemos que
⎡ $ ∞ ,$ ∞ 5 r5 -⎤
1 5 5
⎢ 2 0 dr r K0 (r) 0 ds s 5ln s 5 K0 (s) ⎥ C C
C⎢⎣ $ ∞ ⎥=
⎦ =⇒ N20 < 1 + .
2 2
dr r K0 (r)
0
Em resumo, temos que

⎧
⎪ C
⎪
⎨1 + 2 se m=0
N2m < . (10.6.15)
⎪
⎩C
⎪
se m"1
2m
32
Neste ponto, é importante notar que a expressão
$ ∞
r
γ=− dr r K0 (r) ln ,
0 2
é uma nova representação integral da constante de Euler-Mascheroni, até agora não encontrada na literatura.
706
Com a estimativa (10.6.15) podemos agora provar a Proposição 10.12. Precisaremos do seguinte
teorema (cf. o Teorema 11.8 no livro de E.H. Lieb e M. Loss, “Analysis,” Second Edition, American
Mathematical Society, Providence, 2001).
TEOREMA 10.23 (Unicidade dos minimizadores). Suponha que Ψ0 ∈ C0∞ (Rn ) seja um mini-
mizador para E, ou seja, E(Ψ0 ) = E0 > −∞ e ∥Ψ0 ∥ = 1. Assuma que V ∈ Lloc. n
1 (R ) e que V
é localmente limitado por cima (não necessariamente limitado por baixo). Além disso, assuma
que V |Ψ0 |2 é somável. Então, Ψ0 satisfaz a equação de Schrödinger
−∇2 Ψ(x) + V Ψ(x) = EΨ(x) ,
com Ψ = Ψ0 e E = E0 . Ainda, Ψ0 pode ser escolhido como sendo uma função estritamente
positiva e, o mais importante, Ψ0 é o único minimizador a menos de uma fase constante.
Demonstração da Proposição 10.12. Só precisamos provar que não existe outro auto-valor abaixo
de inf σess (H). A unicidade do estado fundamental é garantida pelo Teorema 10.23. De fato,
o potencial V (r) = −αK0 (βr) satisfaz todas as hipóteses do teorema acima, que assegura a
existência de um único minimizador, Ψ0 , a menos de uma fase constante. Por outro lado, de
acordo com a Eq.(10.6.15), a constante C afeta diretamente o número de estados ligados e, para
0 < C < 2, se m = 0, ou para C = 2m, se m " 1, existirá exatamente um único estado
ligado, com um auto-valor simples. Isso será encontrado apenas no estado de onda-s, isto é,
para momento angular zero, m = 0. Como o espectro do operador Schrödinger (10.6.1) começa
em −Cα/4π, concluímos que H tem no máximo um auto-valor isolado (exatamente um), o
que prova a proposição.
10.7 Operador de Schrödinger Tridimensional: O Caso do

Potencial Atômico
Nesta seção, examinaremos os operadores de Schrödinger de multi-partículas. Iniciamos
discutindo o problema da auto-adjunção do operador de Schrödinger atômico. Então, analisamos
a questão do espectro desse operador. Finalizamos esta seção com uma análise do espectro dos
átomos de hidrogênio e do hélio.
10.7.1 Auto-adjunção do Operador de Schrödinger Atômico
Em 1951, em um celebrado artigo, Tosio Kato, físico-matemático japonês, provou que o

operador de Schrödinger de um átomo com qualquer número atômico é auto-adjunto.33 O
primeiro obstáculo enfrentado por Kato foi levar em conta o fato que quanto mais graus de
liberdade um sistema quântico tem, mais difícil é, geralmente, tratá-lo. Entretanto, como Kato
observou, a tarefa pode ser consideravelmente simplificada se o sistema puder ser decomposto
em subsistemas. Sendo assim, Kato propôs a separação do centro-de-massa do sistema atômico.
Dessa forma, nossa primeira tarefa será separar o movimento do centro-de-massa de um sistema
de N-partículas. Por simplicidade, vamos considerar um sistema de N-partículas composto por
um único átomo constituído por um núcleo de carga positiva +Ze (com 1 # Z # 118 na
33
Existe uma bela história por trás da prova de Kato, contada por Barry Simon em “Tosio Kato’s Work on
non-Relativistic Quantum Mechanics: Part 1,” Bull. Math. Sci. 8 (2018) 121.
707
tabela periódica atual) rodeado por Ne elétrons. O correspondente sistema, desprezando-se

contribuições da correção spin-órbita, correção relativística e termos similares, é descrito pelo
seguinte operador de Schrödinger, agindo em Lsim
2 (R
3N
), em que N = Ne + 1:34
Ne Ne <Ne Ne
#2 2 #2 < 1 2 < <
HNatom =− ∇x + ∇x α + Vαβ (xα − xβ ) + VαZ (xα − x) . (10.7.1)
e
2M 2 α=1 me α=1 α<β α=1
Aqui, me e M são, respectivamente, as massas do elétron e do núcleo, e x, x1 , x2 , . . . , xNe são

as coordenadas do núcleo e dos elétrons. Por sua vez,
e2 e2 Z
Vαβ (xα − xβ ) = e VαZ (xα − x) = − ,
∥xα − xβ ∥ ∥xα − x∥
descrevem, respectivamente, a interação de dois elétrons e a interação de um elétron com o

núcleo atômico.
Em vez das 3(Ne + 1) coordenadas introduzidas acima, podemos usar o centro-de-massa

(N )
1 < e
ycm = me xα + Mx , com Mtotal = (me Ne + M) ,

Mtotal α=1
e as posições dos elétrons com relação ao núcleo definidas por
yα = xα − x , com α = 1, . . . , Ne .
Essas coordenadas são denominadas coordenadas atômicas. Como o nome sugere, essas coor-
denadas são particularmente úteis na física atômica, onde geralmente algumas partículas são
“privilegiadas,” por exemplo, por serem muito mais pesadas que as demais. No caso que iremos
tratar a partícula “privilegiada” será núcleo.
Nota 10.26. De maneira análoga, podemos separar o movimento do centro-de-massa de um
sistemas de N-partículas usando as coordenadas de Jacobi
( α
)
1 <
yα = α xα+1 − mβ xβ com α = 1, . . . , N − 1 .
<
β=1
mβ
β=1
As coordenadas yα acima descrevem a posição relativa da (α + 1)-ésima partícula em relação

ao centro-de-massa das α-partículas anteriores e, portanto, uma ordenação é essencial neste
caso.
Adotando-se o sistema de coordenadas ycm , y1 , y2 , . . . , yNe , computamos o laplaciano em

termos dessas coordenadas. Assim, o hamiltoniano nas novas coordenadas torna-se
HNatom
e
atom
= Hcm + HNrele ,
34
Aqui, Lsim
2 (R
3N
) é um subespaço de simetria de L2 (R3N ) refletindo o fato de que os elétrons e alguns dos
núcleos são partículas idênticas.
708
em que
atom #2
Hcm =− ∇2 , (10.7.2)
2Mtotal ycm
é o hamiltoniano associado ao centro-de-massa e
Ne Ne <
Ne Ne <Ne Ne
#2 < #2 < < <
HNrele =− 2
∇ − ∇ yα · ∇ yβ + Vαβ (yαβ ) + VαZ (yα ) ,
2µ α=1 yα M α=1 α<β α=1 α<β α=1
(10.7.3)
o hamiltoniano “relativo.” Aqui, µ = me M/(M + me ) é a massa reduzida do elétron em

relação ao núcleo. No segundo somatório acima, os termos cruzados da forma ∇yα · ∇yβ ,
com α ̸= β, são chamado termos de Hughes-Eckart. Como M >> µ, esses termos podem ser
tratados na teoria das perturbações, e é possível mostrar que as contribuições desses termos em
situações fisicamente interessantes são muito pequenas; assim, geralmente, em uma primeira
análise podemos desprezar esses termos (um argumento em favor disto será apresentado na
Seção 10.8). É isto que assumiremos no desenvolvimento abaixo.
A Eq.(10.7.2) indica que o centro-de-massa do sistema move-se como uma partícula livre,
enquanto que o movimento relativo dos elétrons é governado pelo hamiltoniano (10.7.3). Isto
implica que as auto-funções de H podem ser assumidas da forma
Ψ(ycm , y1 , y2 , . . . , yNe ) = Ψcm (ycm )Ψrel (y1 , . . . , yNe ) .
Em outras palavras, o espaço de Hilbert do sistema acima pode ser escrito como o produto
atom
tensorial H = Hcm ⊗ Hrel , em que os operadores Hcm e HNrele agem não-trivialmente
somente sobre os fatores Hcm e Hr , respectivamente, da seguinte forma:
5 5
atom 5 atom atom 5
H Ne 5 = Hcm ⊗ 1Irel e HNe 5 rel
= 1Icm ⊗ HNrele ,
atom )
Dom(Hcm Dom(HNe )
em que 1Icm e 1Irel são operadores identidades.
Para simplificar as coisas um pouco mais, vamos adotar uma aproximação comum usada na
física atômica que atribui à massa nuclear um valor infinitamente grande e fixa na origem. Com
efeito, já que prótons e neutrons constituem o núcleo dos átomos, com a massa do neutron
ligeiramente maior que a de um próton, que por sua vez tem uma massa aproximadamente 1800
vezes maior que a massa do elétron, a localização do centro-de-massa do sistema acima quase
que coincide com a localização do núcleo. Além disso, a massa reduzida do sistema é muito
próxima da massa do elétron. Assim, numa primeira aproximação, o centro-de-massa pode
ser “removido,” supondo que o núcleo está “congelado” em sua localização, com os elétrons
“orbitando” em torno dessa localização. Em outras palavras, podemos fixar um referencial ao
centro-de-massa de um átomo isolado e, em relação a esse referencial, o centro-de-massa estará
em repouso. Isso é chamado de referencial do centro-de-massa. Com isto, só o movimento dos
elétrons relativo ao referencial do centro-de-massa pode ser considerado para efeito de análise.
Portanto, o operador resultante, após a remoção do centro-de-massa, usando coordenadas atô-
micas e tomando-se a massa nuclear infinitamente grande e fixa na origem, é simplemente o
hamiltoniano HNrele .
709
PROPOSIÇÃO 10.13. Denote por H0 o operador hamiltoniano livre associado com o operador
HNrele , isto é,
Ne
#2 < 2
H0 = − ∇ . (10.7.4)
2µ α=1 yα
Então,
(i) se Ψ ∈ S (R3Ne ), isto implica que Ψ ∈ Dom(H0 ),
(ii) H0 é um operador ilimitado positivo; seu espectro é σ(H0 ) = σess (H0 ) = [0, ∞),
. /
(iii) H0 + 1I é um mapeamento sobrejetivo de S (R3Ne ) em S (R3Ne ).
Demonstração. (i) Primeiro note que, Dom(H0 ) = Dom(−∇2yα ). Agora, de acordo com o
Teorema 6.13, S (R3Ne ) é invariante sob a transformada de Fourier. Logo, se Ψ ∈ S (R3Ne ),
então Ψ^ ∈ S (R3Ne ). Também de acordo com o Teorema 6.13, ∇2 Ψ ∈ S (R3Ne ) =⇒
yα
^ ∈ S (R3Ne ) ⊂ L2 (R3Ne ), α = 1, . . . , Ne . Portanto, pela Proposição 10.1, item (i),
∥kα ∥2 Ψ
Ψ ∈ Dommax (−∇2yα ) =⇒ Ψ ∈ Dom(H0 ).
(ii) Isto segue imediatamente do Teorema 10.3, devido à energia cinética do movimento
relativo livre dos Ne -elétrons.
; e 2 n^
(iii) É claro da definição de S (R3Ne ) que se Ψ ∈ S (R3Ne ), então N
α=1 (1+∥k
. α ∥/ ) Ψ ∈
3Ne
S (R ) para todo n ∈ N0 . Portanto, tomando n = 1, obtém-se que H0 + 1I é um
mapeamento sobrejetivo de S (R3Ne ) em S (R3Ne ).
Nosso próximo passo é provar a auto-adjunção do operador HNrele = H0 + V dado pela

expressão (10.7.3). A primeira observação importante a ser feita com relação à prova da auto-
adjunção do hamiltoniano (10.7.3) diz respeito ao potencial
Ne <
< Ne Ne
< Ne <
< Ne <N
e
e2 e2 Z
V = Vαβ (yαβ ) + VαZ (yα ) = − . (10.7.5)
α=1 α<β α=1 α=1 α<β
∥yαβ ∥ α=1 ∥yα ∥
Sendo do tipo-coulombiano, cada potencial Vαβ , VαZ ∈ L2 (R3 ) + L∞ (R3 )ε , isto é, a compo-
nente L∞ (R3 ) de cada potencial nas somas acima pode ser escolhida arbitrariamente pequena,
no sentido da norma-L∞ . Com efeito, de acordo com o Exemplo 10.1, nos podemos decompor
cada potencial acima da seguinte forma:
1 1
Vαβ = Vαβ,1 + Vαβ,2 = 1I∥yαβ ∥#R · + 1I∥yαβ ∥>R · ,
∥yαβ ∥ ∥yαβ ∥
em que
⎧ ⎧
⎨1 se ∥yαβ ∥ # R ⎨1 se ∥yαβ ∥ > R
1I∥yαβ ∥#R = e 1I∥yαβ ∥>R = .
⎩0 se ∥yαβ ∥ > R ⎩0 se ∥yαβ ∥ # R
710
Então,Vαβ,1 ∈ L2 (R3 ),
1
∥V2 ∥∞ = sup |V2 (yαβ )| # ,
yαβ ∈R3 R
e (trivialmente)
lim sup |V2 (yαβ )| = lim sup |V2 (yαβ )| = 0 ,
yαβ →∞ y→∞ yαβ "y
quando olhamos cada vez mais longe para R < y # yαβ . Portanto, cada potencial Vαβ
desaparece quando ∥yαβ ∥ → ∞ no sentido fraco representado pela condição que Vαβ , VαZ ∈
L2 (R3 ) + L∞ (R3 )ε , com ε > 0 e arbitrariamente pequeno.
TEOREMA 10.24 (Kato, 1951). O operador hamiltoniano HNrele é essencialmente auto-adjunto em
C0∞ (R3Ne ).
Demonstração. Como,
Ne <
< Ne Ne
<
V = Vαβ (yαβ ) + VαZ (yα ) ,
α=1 α<β α=1
a estratégia é considerar cada função potencial nas somas acima separadamente. Como
observado previamente, podemos decompor Vαβ = Vαβ,1 + Vαβ,2 , com Vαβ,1 ∈ L2 (R3 ) e
Vαβ,2 ∈ L∞ (R3 )ε . Então,
∥Vαβ Ψ∥2 = ∥(Vαβ,1 + Vαβ,2 )Ψ∥2 # ∥Vαβ,1 Ψ∥2 + ∥Vαβ,2 Ψ∥2
# ∥Vαβ,1 ∥2 ∥Ψ∥∞ + ∥Vαβ,2 ∥∞ ∥Ψ∥2
# ∥Vαβ,1 ∥2 ∥Ψ∥∞ + ε∥Ψ∥2
1 6 3/2 7
# λ ∥Ψ∥2 + λ−1/2 ∥H0 Ψ∥2 ∥Vαβ,1 ∥2 + ε∥Ψ∥2 .
8π
Aqui, usamos o Lema 10.1 para n = 3. Lembramos que λ > 0. Definindo,
λ−1/2 λ3/2
a= ∥Vαβ,1 ∥2 e b= ∥Vαβ,1 ∥2 + ε ,
8π 8π
obtemos que
∥Vαβ Ψ∥2 # b∥Ψ∥2 + a∥H0 Ψ∥2 .
A mesma análise se aplica a cada potencial VαZ . Consequentemente, pela desigualdade de

Minkowski, segue que
? ? ? ? ? ?
?<Ne <Ne Ne
< ? ?<Ne < Ne ? ?<Ne ?
? ? ? ? ? ?
? Vαβ Ψ + VαZ Ψ? = ? Vαβ Ψ? + ? VαZ Ψ?
? ? ? ? ? ?
α=1 α<β α=1 2 α=1 α<β 2 α=1 2
Ne <
< Ne Ne
<
# ∥Vαβ Ψ∥2 + ∥VαZ Ψ∥2
α=1 α<β α=1
6 7
# 2Ne b∥Ψ∥2 + a∥H0 Ψ∥2 , ∀ Ψ ∈ C0∞ (R3Ne ) .
711
Como a pode ser escolhido tão pequeno quanto desejarmos, o potencial total V será infi-
nitesimalmente pequeno com relação ao hamiltoniano livre, H0 . Portanto, pelo Teorema de
Kato-Rellich, H0 + V é essencialmente auto-adjunto em C0∞ (R3Ne ). Isto significa que não
existe ambiguidade sobre o operador auto-adjunto a ser considerado, uma vez que o operador
HNrele , definido em C0∞ (R3Ne ), tem pela Proposição 10.1 o seu fecho como a única extensão
auto-adjunta que satisfaz
! !
Dom(HNrele ) = Dommin (H0 ) = C0∞ (R3Ne ) = Dommax (H0 ) ,
em L2 (R3Ne ).
Nota 10.27. Observamos que a mesma prova acima funciona se adicionarmos núcleos adicionais
em locais fixos. Ou seja, também podemos tratar moléculas se assumirmos que os núcleos estão
fixos no espaço. No entanto, deve-se enfatizar que a análise da auto-adjunção do operador
hamiltoniano atômico representa uma aproximação por várias razões; por exemplo, ignoramos o
spin dos elétrons. Um tratamento mais realista dos hamiltonianos atômicos e moleculares exige
que o spin dos elétrons seja levado em consideração, a razão é que os elétrons obedecem ao
princípio de exclusão de Pauli. Também ignoramos o movimento dos núcleos, tratando-os como
fixos. E, por fim, o modelo não é relativístico, ou seja, não estamos levando em conta possíveis
efeitos relativíticos.
10.7.2 Espectro do Operador de Schrödinger Atômico
Uma vez provado que o operador de Schrödinger associado a um sistema de N-partículas,

composto por um único átomo constituído por um núcleo de carga pontual Ze rodeado por
Ne elétrons, é auto-adjunto e limitado por baixo, nosso próximo passo será analisar o espectro
desse operador. A grande questão aqui é localizar a parte inferior do espectro essencial.
No caso de 2-partículas um papel chave foi desempenhado pela condição que V (x) → 0
pelo menos no sentido fraco implicado pela condição que V ∈ L2 (R3 ) + L∞ (R3 )ε , como nos
revelou o Teorema 10.7. Acontece que no caso de operadores de Schrödinger de N-partículas,
isso não é mais absolutamente verdade. O ponto central é que
N <
< N
V (x) = Vαβ (xα − xβ ) ,
α=1 α<β
não necessariamente desaparece quando x → ∞ em certas direções, especificamente nas

direções em que a diferença xα − xβ permanece finita para pelo menos um par α ̸= β
(assumimos aqui que Vαβ (0) ̸= 0). Para entendermos o real significado desta afirmação, pense
num sistema formado por N-partículas. Naturalmente, como a energia potencial V de um
sistema de N-partículas depende apenas das posições relativas de seus componentes, assumir
que V (x) → 0, quando x → ∞, significa admitir que a distância relativa entre cada par
de partículas é infinitamente grande. Desta forma, podemos assumir que a interação mútua
entre cada par é desprezível. Acontece que ao tentarmos separar cada par de partículas, pode
ocorrer que isto nos leve, inevitavelmente, a uma situação tal que a partícula-α e a partícula-β
permaneçam próximas, apesar delas estarem infinitamente afastadas das outras partículas do
sistema. Matematicamente, isto pode ser entendido da seguinte forma: para separar as partículas
realizamos uma translação de cada partícula descrita pelo vetor a = (a1 , . . . , aN ) ∈ R3N como
712
um todo. Isto induz um mapeamento (x1 , x2 , . . . , xN ) 3→ (x1 + a1 , x2 + a2 , . . . , xN + aN ).

Como a representa uma translação arbitrária em R3N , para certas direções de a pode acontecer
que diferença xα − xβ permanece constante, isto é, pode acontecer de xα − xβ = (xα +
aα ) − (xβ + aβ ). Assim, o fato de V não decair em certas direções torna a teoria de N-
partículas mais complicada. Consequentemente, a análise espectral realizada anteriormente não
funcionará e deveremos modificá-la, levando em consideração a geometria dos sistemas de N-
partículas. Nosso interesse é mostrar como esta modificação foi alcançada apresentando um dos
teoremas fundamentais da teoria quântica: o celebrado Teorema HVZ.35 Esse teorema identifica a
localização do espectro essencial do hamiltoniano, H, de muitos corpos. Com efeito, o Teorema
HVZ estabelece que o espectro essencial de um operador de Schrödinger de N-partículas
(depois de separarmos o movimento livre do centro-de-massa) é limitado inferiormente pela
energia mais baixa possível que dois subsistemas independentes podem ter. No caso particular
de um átomo, o Teorema HVZ garante que o espectro essencial do hamiltoniano atômico é
[λNe −1 , ∞), em que o valor limite λNe −1 representa a energia mais baixa do sistema “núcleo +
(Ne − 1) elétrons.”
Com respeito ao espectro discreto do hamiltoniano atômico, pode-se mostrar que ele contém
uma infinidade de muitos níveis de energia (com λNe −1 como um possível ponto de acumu-
lação), desde que Ne = Z (átomos neutros), ou 0 < Ne < Z (íons carregados positivamente).
Fisicamente, isso não é muito surpreendente, pois Ne − 1 elétrons não blindam completamente
a carga nuclear, e sobre o último elétron atua ainda a grandes distâncias um potencial atrativo
de longo alcance. Para Ne > Z este argumento não se aplica, e Lieb elegantemente mostrou
que se desprezarmos o termo de Hughes-Eckart, o número máximo Ne de elétrons que po-
dem ser ligados a um núcleo de carga positiva +Ze necessariamente satisfaz a desigualdade
Nemax # 2Z + 1 (vamos provar este resultado no Teorema 10.32).
Infelizmente, a prova do Teorema HVZ não é apenas longa, como também requer um conhe-
cimento sobre a noção de clusters.
10.7.2.1 Decomposições em Clusters Para levar em conta o fato que algumas partículas
podem permanecer próximas umas das outras, enquanto outras se afastam, introduzimos a
noção de clusters.
DEFINIÇÃO 10.4. Se indexarmos os canais com um subscrito ℓ, para algum ℓ # N, então, uma
partição Cℓ do conjunto {1, . . . , N} nos subconjuntos disjuntos C1 , C2 , . . . , Cℓ é chamada de
decomposição em clusters. Cada +ℓ Ck é chamado de cluster e a união desses clusters é todo o
conjunto, isto é,{1, . . . , N} = k=1 Ck .
Na física, a propriedade de decomposição em clusters está relacionada com o conceito de

localidade. Na física atômica essa propriedade é usada para agrupar um sistema de muitas
partículas em clusters em localizações diferentes, muito afastadas umas das outras. Consequen-
temente, regiões suficientemente separadas se comportam de forma independente. A Figura
10.10 mostra uma ilustração geométrica da ideia por trás do Teorema HVZ.
35
Este teorema é assim chamado em homenagem a W. Hunziker, “On the Spectra of Schrödinger Multiparticle
Hamiltonians,” Helv. Phys. Acta 39 (1966) 451, C. van Winter, “Theory of Finite Systems of Particles, I, II,” Mat. Fys.
Skr. Dan. Vid Selsk 1 Nos. 8, 10 (1964/65) e G.M. Zhislin, “Discussion of the Spectrum of the Schrödinger Operator
for Systems of Many Particles,” (in Russian), Tr. Moskovsk. Matem. Obsshch. 9 (1960) 81. Observe que os nomes
são listados em ordem alfabética, mas em ordem cronológica inversa de descoberta.
713
átomo com alguns elétrons separados

“livres”
“livres”
C3 = {{1, 2}, {3, 4, 5}, {6, 7, . . . , 12}}
Figura 10.10: À medida que grupos de partículas são separadas, as interações com as demais
desaparecem. σess (H) “deveria” conter pontos correspondentes aos clusters que se afastam
“lentamente” da origem.
Agrupamentos diferentes são possíveis em um sistema de muitas partículas à medida que

as partículas vão para o infinito, algumas permanecendo unidas enquanto outras se afastam
cada vez mais delas. Formalmente, a equação de Schrödinger para N-partículas atua em um
espaço de configuração 3N-dimensional, e diferentes maneiras de distribuir as partículas em
clusters correspondem a regiões diferentes em R3N . Uma dada distribuição de 1, 2, . . . , N em
subconjuntos disjuntos, como {1, 2}, {3}, {4, 5, 6}, . . ., será uma abreviação para a afirmação
de que as partículas 1 e 2 permanecem ligadas, a partícula 3 se aproxima do infinito, as
partículas 4 a 6 estão ligadas, etc. Uma distribuição como essa é chamada de canal. Os
potenciais de pares Vαβ (xα − xβ ) não vão decair para zero nas direções em que xα − xβ
permanece constante. Dessa forma, a evolução temporal na região assintótica não é descrita
por um único hamiltoniano, mas depende do canal, isto é, depende da direção em relação a
qual o estado está submetido à condição que Vαβ (xα − xβ ) não decai para zero. Portanto,
o comportamento assintótico espacial dos canais, consistindo em agrupamentos de partículas,
determina como a interação entre esses agrupamentos muda à medida que a distância entre os
agrupamentos aumenta, e esse comportamento é caracterizado pela decomposição em clusters.
Exemplo 10.4. Considere 4 partículas e suponha que o centro-de-massa foi separado. Então, o
espaço de configuração apropriado especifica o movimento relativo das 4 partículas, e existem
15 canais, mostrados na Tabela 10.2. Por exemplo, de acordo com a Tabela 10.2, no canal-1 as
4 partículas foram completamente separadas, enquanto que no canal-14 as parículas 1 e 4 e as
parículas 2 e 3 permanecem unidas. Já no canal-15 as 4 partículas permanecem unidas.
1 − {{1}, {2}, {3}, {4}} 2 − {{1, 2}, {3}, {4}} 3 − {{1, 3}, {2}, {4}}
4 − {{1, 4}, {2}, {3}} 5 − {{2, 3}, {1}, {4}} 6 − {{2, 4}, {1}, {3}}
7 − {{3, 4}, {1}, {2}} 8 − {{1}, {2, 3, 4}} 9 − {{2}, {1, 3, 4}}
10 − {{3}, {1, 2, 4}} 11 − {{4}, {1, 2, 3}} 12 − {{1, 2}, {3, 4}}
13 − {{1, 3}, {2, 4}} 14 − {{1, 4}, {2, 3}} 15 − {1, 2, 3, 4}
Tabela 10.2: Decomposições em clusters de um conjunto de 4 partículas.
714
Seja Cℓ = {C1 , C2 , . . . , Cℓ } uma decomposição em clusters. Usaremos as seguintes nota-

ções: |Ck | denotará o número de elementos em Ck , o símbolo (αβ) ⊂ Cℓ indicará que as
partículas α e β pertencem ao mesmo cluster Ck para algum 1 # k # ℓ; analogamente, o
símbolo (αβ) ̸⊂ Cℓ denotará a situação em que as partículas α e β estão em diferentes clusters
(isto é, α ∈ Cn e β ∈ Cm com n ̸= m) e #C denotará o número de elementos em Cℓ , ou seja,
#C = ℓ. Existe somente uma decomposição em clusters com #C = 1 e uma com #C = N.
No primeiro caso, a decomposição consiste de um único cluster
C1 = {1, . . . , N} ,
e no segundo caso os clusters são formados por uma única partícula
CN = {{1}, . . . , {N}} ,
No Exemplo 10.4 estas situações estão representadas pelo canal-15 e pelo canal-1, respectiva-
mente.
Agora, defina para cada decomposição em clusters os potenciais intraclusters e interclusters,

respectivamente, pelas somas
< <
VC ℓ = Vαβ (xα − xβ ) e ICℓ = Vαβ (xα − xβ ) = V − VCℓ . (10.7.6)
(αβ)⊂Cℓ (αβ)̸⊂Cℓ
Assim, VCℓ é a soma dos potenciais entre partículas que pertencem ao mesmo cluster, enquanto
que ICℓ é soma de interações entre partículas de diferentes clusters!
Vamos escrever o hamiltoniano como a soma H = H0 + VCℓ + ICℓ atuando em L2 (R3N ).

Então,
H C ℓ = H − IC ℓ = H 0 + V C ℓ ,
é o hamiltoniano que descreve um subsistema de ℓ clusters, {C1 , C2 , . . . , Cℓ }, que não intera-
gem. Se ℓ = 1, HCℓ = H0 + VCℓ e para ℓ = N, HCℓ = H0 . Seja Ψ um estado do sistema de
N-partículas para o qual os clusters estejam muito distantes um do outro, então, HΨ = HCℓ Ψ,
aproximadamente. Em outras palavras, a interação ICℓ entre clusters muito separados será zero
quando t → ±∞, e a evolução no tempo de H se “aproxima” da de HCℓ , isto é, perto do
infinito, H deve se “parecer” com algum HCℓ , com ℓ " 2. Portanto, esperamos que
σ(HCℓ ) ⊂ σ(H) .
Governado pelo hamiltoniano HCℓ os clusters {C1 , C2, . . . , Cℓ }, com ℓ " 2, ainda podem se
mover livremente um em relação ao outro; portanto σ(HCℓ ) é contínuo, estendendo-se de um
número real ΣCℓ até +∞.
10.7.2.2 Teorema de Hunziker-van Winter-Zhislin As considerações feitas acima mostraram

que não é tão fácil determinar o espectro essencial do hamiltoniano de um átomo com Ne
elétrons, cujo núcleo está fixo na origem, pois o potencial V não decai em todas as direções
quando |x| → ∞. No entanto, ainda há algo que podemos fazer. Represente o ínfimo do
espectro de um átomo com Ne elétrons por λNe . Então, dividimos o átomo em (Ne − 1)
elétrons mais um único elétron. Se esse elétron estiver longe o suficiente do sistema restante,
de forma que haja pouca interação, a energia deve ser a soma da energia cinética desse elétron
715
e a energia do sistema restante. Em particular, se λNe < λNe −1 dizemos que Ne elétrons
estão ligados ao núcleo e o operador de Schrödinger atômico tem um estado fundamental
(pelo Princípio Min-Max). A energia de ionização de um átomo com Ne elétrons (isto é, a
energia necessária para remover um elétron do átomo em seu estado fundamental) é dada por
λNe − λNe −1 > 0 (não se pode remover nenhum elétron sem pagar alguma energia positiva).
Assim, se denotarmos o hamiltoniano (10.7.3) (com os termos de Hughes-Eckart omitidos) por
HNrele e o hamiltoniano com um elétron removido por HNrele −1 , do ponto de vista físico, deve-se
esperar que
. / . /
σess HNatom
e
= [λ N e −1 , ∞) , λ N e −1 = min σ(H atom
N e −1 ) <0,
sempre que se tem λNe # λNe −1 . Em outras palavras, diz-se que o intervalo [λNe −1 , ∞)
representa estados livres porque corresponde à situação em que um dos elétrons está livre, ou
seja, possui energia para se afastar dos outros. Assim, esperamos que o espectro essencial do
hamiltoniano (10.7.3) comece na energia do estado fundamental do hamiltoniano do átomo com
(Ne − 1) elétrons. Dessa forma, λNe , o ínfimo do espectro de um átomo com Ne elétrons, está
abaixo do espectro essencial e, portanto, é um auto-valor, isto é, existe um Ψ ∈ L2 (R3Ne ) tal
que HNrele Ψ = λNe Ψ. De fato, isto é provado através do seguinte
TEOREMA 10.25 (Teorema HVZ). Seja HNrele o operador auto-adjunto dado em (10.7.3). Então,
HNrele é limitado inferiormente e
. /
σess HNrele = [λNe −1 , ∞) ,
em que 6 .
rel
/7
λNe −1 = min σ HNe −1 .
. / . /
Além disso, a parte de σ HNrele no complemento de σess HNrele consiste apenas de auto-valores
de multiplicidade finita, possivelmente acumulando-se em λNe −1 .
Demonstração da Primeira Parte do Teorema 10.25: Parte Fácil. A prova do Teorema HVZ é divi-
dida
. em/ duas partes em. um /sentido natural: primeiro, devemos mostrar que [λNe −1 , ∞) ⊂
σ HNrele e, então, que σ HNrele ∩(−∞,
. rel /λNe −1 ) é discreto. Começamos pela parte mais fácil que
é mostrar que [λNe −1 , ∞) ⊂ σess HNe . Para isto, faremos uma análise mais geral seguindo a
versão de Hunziker36 e depois aplicamos esta análise no caso particular do operador HNrele .
Suponha que H é um hamiltoniano qualquer associado a um sistema de N-partículas (que

serão agrupadas em clusters) atuando sobre o espaço de Hilbert L2 (R3N ), depois de separar
o centro-de-massa e fixá-lo na origem. Assuma que #Cℓ " 2 e que λ ∈ σess (H). Além
disso, suponha que cada função potencial entre pares de partículas Vαβ ∈ L2 (R3 ) + L∞ (R3 )ε .
Como primeiro passo, vamos investigar em que sentido a interação entre os clusters desaparece,
quando os clusters de uma dada decomposição estão cada vez mais separados um do outro.
Sejam x1 , . . . , xN as coordenadas cartesianas das N-partículas. No espaço R3N −3 de coor-

denadas relativas, podemos escolher, para qualquer par de coordenadas xα , xβ , com (α ̸= β),
as (3N − 3) coordenadas independentes como sendo xαβ = xα − xβ e xκ , com (κ ̸= α, β),
36
W. Hunziker, “On the Spectra of Schrödinger Multiparticle Hamiltonians,” Helv. Phys. Acta 39 (1966) 451.
716
que serão denotadas por (xαβ , xκ ). Isto significa que as auto-funções Ψ ∈ L2 (R3N −3 ) podem
ser assumidas da forma
Ψ(xαβ , xκ ) = Φ(xαβ )Θ(xκ ) ,
com Φ ∈ L2 (R3 ) e Θ ∈ L2 (R3N −6 ). A norma no espaço L2 (R3N −3 ) é então dada por
($ )1/2
]
∥Ψ∥ = d3 xκ d3 xαβ |Ψ(xαβ , xκ )|2 .
κ̸=α,β
Seja Cℓ = (C1 , . . . , Cℓ ) uma decomposição de (1, . . . , N) em ℓ clusters (ℓ " 2). Para

qualquer vetor a = (a1 , . . . , aN ) ∈ R3N , associamos um conjunto s = (s1 , . . . , sℓ ) ∈ R3ℓ
(ℓ " 2), com aα = sβ se α ∈ Cβ , de forma que o operador (unitário) de translação dado por
Us (a) : Ψ(xαβ , xκ ) → Ψ(xαβ + aαβ , xκ ) , com aαβ = aα − aβ ,
representa uma translação de cada cluster Cβ , como um todo, por sβ . Lembramos que Us (a)
é uma isometria (veja a Seção 4.6).
Exemplo 10.5. Na Figura 10.10, a decomposição C3 = {{1, 2}, {3, 4, 5}, {6, 7, . . . , 12}} sina-
liza que a1 = a2 = s1 , a3 = a4 = a5 = s2 a6 = a7 = · · · = a12 = s3 . Em particular,
definindo sαβ = sα − sβ , então, da decomposição C3 e do operador translação Us (a), obtemos
para pares que pertencem a clusters distintos as seguintes situações:
Us (a)Ψ(x13 , xκ ) = Ψ(x13 + a13 , xκ )
= Ψ(x13 + s12 , xκ ) , para o par (1, 3) ,
Us (a)Ψ(x46 , xκ ) = Ψ(x46 + a46 , xκ )
= Ψ(x46 + s23 , xκ ) , para o par (4, 6) ,
Us (a)Ψ(x16 , xκ ) = Ψ(x16 + a16 , xκ )
= Ψ(x16 + s13 , xκ ) , para o par (1, 6) .

Já para pares que pertencem ao mesmo cluster temos que
Us (a)Ψ(xαβ , xκ ) = Ψ(xαβ , xκ ) para qualquer par (α, β) .
Portanto, o operador HCℓ comutará com o operador Us (a) se a seguinte condição é satisfeita:
aα = aβ se (αβ) ⊂ Cℓ .
Com base no Exemplo 10.5, para pares que pertencem a clusters distintos podemos definir
|s| = minα̸=β |sαβ |. Logo, quando |s| → ∞, os clusters se tornam cada vez mais separados
um do outro, e a interação entre eles desaparece como mostra o seguinte
LEMA 10.7. Defina Ψa (xαβ ) = Us (a)Ψ(xαβ ). Então, sob as hipóteses do Teorema 10.25
lim ∥ICℓ Ψa ∥ = 0 , (10.7.7)
|s|→∞
para todo Ψ ∈ Dom(H0 ).
717
Demonstração. Consideramos apenas um único termo Vαβ ∈ ICℓ . Assim, para qualquer ε > 0
arbitrário, podemos decompor Vαβ = Vαβ,1 + Vαβ,2 , com Vαβ,1 ∈ L2 (R3 ) e Vαβ,2 ∈ L∞ (R3 )ε .
Então, ∥Vαβ,2 Ψa ∥ # ε∥Ψa ∥ = ε∥Ψ∥ para todo s, uma vez que Us (a) é uma isometria, isto
é, ∥Us (a)Ψ∥ = ∥Ψ∥. Portanto, basta provar (10.7.7) sob a hipótese de que Vαβ ∈ L2 (R3 ). O
operador Us (a) é unitário e comuta com H0 no domínio Dom(H0 ). Dessa forma, segue que
∥Vαβ Ψa ∥ # a∥H0 Ψa ∥ + b∥Ψa ∥
= a∥Us (a)(H0 Ψ)∥ + b∥Us (a)Ψ∥
= a∥H0 Ψ∥ + b∥Ψ∥ ,
para todo Ψ ∈ Dom(H0 ). Assim, vemos que Vαβ Us (a) é um operador H0 -limitado. É
suficiente, portanto, provar (10.7.7) em um conjunto denso em Dom(H0 ), por exemplo, em
S (R3N −3 ). Podemos nos restringir aos estados Ψ da forma
Ψ(xαβ , xκ ) = Φ(xαβ )Θ(xκ ) ,
com Φ ∈ S (R3 ) e Θ ∈ S (R3N −6 ), uma vez que as combinações lineares finitas de tais
produtos são densos em S (R3N −3 ). Logo,
$ ]
2
∥Vαβ Ψa ∥ = d3 xκ d3 xαβ |Vαβ (xαβ )Ψa (xαβ , xκ )|2
κ̸=α,β
$ ]
= d3 xκ d3 xαβ |Θ(xκ )|2 |Vαβ (xαβ )Φa (xαβ )|2
κ̸=α,β
$
= ∥Θ∥ d3 xαβ |Vαβ (xαβ )Φ(xαβ + aα − aβ )|2 .
Agora, como α e β pertencem a diferentes clusters, então, |aαβ | = |aα − aβ | → ∞ quando

|s| → ∞. Visto que Vαβ ∈ L2 (R3 ) e Φ ∈ S (R3 ), a última integral desaparece quando
|s| → ∞. Isto prova o lema.
Agora é simples mostrar que σess (H) ⊂ σ(H). Primeiro, assuma que λ ∈ σ(HCℓ ). A
seguir, escolha uma sequência (Ψn )n∈N ⊂ Dom(H0 ) para HCℓ e λ, com ∥Ψn ∥ = 1, cujo os
elementos Ψn são estados para os quais os clusters de uma dada decomposição Cℓ estão cada
vez mais separados um do outro. Então, de acordo com a Proposição 5.12, λ ∈ σ(HCℓ ) se, e
somente se,
lim ∥(HCℓ − λ1I)Ψn ∥ = 0 , (10.7.8)
n→∞
Por outro lado, o operador de translação Us (a), correspondente à decomposição Cℓ , comuta

com HCℓ no domínio Dom(H0 ). Logo,
∥(H − λ1I)Us (a)Ψn ∥ = ∥(HCℓ + ICℓ − λ1I)Us (a)Ψn ∥
# ∥(HCℓ − λ1I)Us (a)Ψn ∥ + ∥ICℓ Us (a)Ψn ∥
= ∥Us (a)(HCℓ − λ1I)Ψn ∥ + ∥ICℓ Us (a)Ψn ∥
= ∥(HCℓ − λ1I)Ψn ∥ + ∥ICℓ Us (a)Ψn ∥ .
718
Agora, note que, de acordo com a Eq.(10.7.8) e o Lema 10.7, o lado direito pode ser tomado
arbitrariamente pequeno, escolhendo primeiro n e depois |s| grande o suficiente. Dessa forma,
temos que
∥(H − λ1I)Us (a)Ψn ∥ < ε ,
para qualquer ε > 0 arbitrariamente pequeno. Lembrando que H = H0 + VCℓ + ICℓ , que
Us (a)Ψn ∈ Dom(H0 ) e que ∥Us (a)Ψn ∥ = ∥Ψn ∥ = 1, segue, de acordo com a Proposição
5.12, que λ ∈ σ(H). Ou seja, mostramos que σ(HCℓ ) ⊂ σ(H). Mas, o espectro de HCℓ é
puramente essencial (devido ao fato dos clusters em Cℓ se moverem livremente)
σ(HCℓ ) = [ΣCℓ = λC1 + . . . + λCℓ , ∞) ,
em que λCk é a energia mais baixa do cluster Ck ⊂ Cℓ , com k = 1, . . . , ℓ, (ΣCℓ sendo o limiar
para que ocorra a ruptura da decomposição Cℓ ). Em outras palavras, σ(HCℓ ) = [ΣCℓ , ∞).
Assim, de fato, mostramos que [Σ, ∞) ⊂ σ(H). Por outro lado, fisicamente, estados no
espectro contínuo devem ser aqueles que podem ser divididos em pelo menos dois clusters
espacialmente separados. Assim, é de se esperar que a parte inferior do continuum seja
determinada da seguinte forma: primeiro considere a divisão de {1, . . . , N} em dois conjuntos
disjuntos C1 , C2 . Seja HCj o hamiltoniano do cluster Cj (de modo que HC1 + HC2 seja H
menos a interação entre C1 e C2 ). Em seguida, tome inf σ(HCj ) = λCj . Espera-se que
. /
Σ= min λC1 + λC2 .
C1 ∩C2 =∅
C1 ∪C2 ={1,...,N }
Em outras palavras, é suficiente tomar a energia mínima necessária para separar o sistema de
N-partículas em pelo menos dois clusters independentes, isto é,
. /
Σ = min ΣCℓ , com ΣCℓ = min σ(HCℓ ) .
#Cℓ "2
Neste ponto é importante enfatizar que, usando-se as hipóteses do Teorema HVZ, pode-se provar
indutivamente que37
min ΣCℓ " min ΣCℓ ,
#Cℓ "m+1 #Cℓ "m
e a partir disto concluir que

min ΣCℓ = min ΣCℓ .
#Cℓ =2 #Cℓ "2
Com efeito, qualquer que seja a decomposição em clusters de ℓ componentes, Cℓ = {C.1 , . . . , C/ℓ },
existe
. uma decomposição
/ em clusters de 2 componentes, C2 = {C1′ , C2′ }, tal que min σ(HC2 ) #
ℓ−1
min σ(HCℓ ) , porque tomando C2′ = Cℓ e C1′ = ∪j=1 Cj , obtemos a desigualdade necessária.
. / . /
De fato, se ℓ > 2, min σess (HC2 ) # min σ(HCℓ ) . Ou seja, este resultado estabelece que o
mínimo Σ do espectro essencial de H é sempre definido pela decomposição em clusters de 2
componentes. Consequentemente, se agora assumirmos que H = HNrele e separarmos o átomo
em (Ne − 1) elétrons mais um único elétron, então, com base na análise acima, obtemos que
. /
[λNe −1 , ∞) ⊂ σess HNrele ,
37
Veja M. Reed e B. Simon, “Methods of Modern Mathematical Physics. Analysis of Operators,” Vol.IV, Acade-
mic Press, 1978, Problema 42, ou B. Simon, “Quantum Mechanics for Hamiltonians Defined as Quadratic Forms,”
Princeton Series in Physics 68, 1971, Capítulo VII.
719
em que 6 . /7
λNe −1 = min σ HNrele −1 .
Isto finaliza a prova da primeira parte do Teorema HVZ!
Demonstração da Segunda Parte do Teorema 10.25: Parte Difícil. A parte mais difícil é. mostrar /
que HNrele tem espectro discreto apenas abaixo de λNe −1 ; isto é, vamos mostrar que σess HNrele ⊂
[λNe −1 , ∞). A principal ferramenta para provar a segunda parte do Teorema 10.25 é baseada
no conceito de partição da unidade (veja a Subseção 1.2.13). A importância das partições da
unidade no problema de muitos corpos na teoria quântica foi percebida em vários trabalhos na
literatura. Abaixo, usaremos a partição da unidade introduzida por Simon (uma partição análoga
foi usada por Ruelle na teoria quântica dos campos). Para referências completas e comentários
detalhados, consulte o Vol.IV da coleção de Reed-Simon ou o texto de H.L. Cycon, R.G. Froese,
W. Kirsch e B.Simon, “Schrödinger Operators with Application to Quantum Mechanics and Global
Geometry,” Second Edition, Springer, 2007.
Assim como fizemos na primeira parte, faremos uma análise mais geral e depois a aplicamos
no caso particular do operador HNrele . Suponha que H é um hamiltoniano qualquer associado
a um sistema de N-partículas (que serão agrupadas em clusters) atuando sobre o espaço de
Hilbert L2 (R3N ), depois de separar o centro-de-massa e fixá-lo na origem. Levando em conta a
observação feita no final da prova da primeira parte (baseda no Problema 42, Vol.IV, da coleção
de Reed-Simon), somente as decomposições em clusters com #Cℓ = 2 serão necessárias. Neste
(k)
caso, definimos C2 , em que k = 1, 2, . . . , 2N −1 − 1 rotula todas as formas distintas de de-
(k) (k)
composição de N-partículas em dois conjuntos não-vazios C1 e C2 (no caso particular com
N = 4, na Tabela 10.2, estas decomposições em dois conjuntos não-vazios estão representadas
pelo canal-8 até o canal-14).
Para qualquer x = (x1 , . . . , xN ) ∈ R3N , defina

( N <
N
)1/2
<
|x|0 = |xα − xβ |2 ,
α=1 α<β
3 4
(k) (k)
|x|k = min |xα − xβ | | xα ∈ C1 , xβ ∈ C2 .
LEMA 10.8. Para

√ qualquer x, existe algum k = 1, 2, . . . , 2N −1 − 1, de modo que |x|k " dN |x|0 ,
em que dN = 2N −1/2 (N − 1)−3/2 .
Demonstração. Começamos observando que para todo par (α, β), C(N, 2) nos dá o número
de combinações de tamanho 2 de N-partículas, isto é,
N(N − 1)
C(N, 2) = .
2
Assim, para um dado x
, -
N 1/2 (N − 1)1/2
|x|0 # √ max |xα − xβ | .
2
720
Agora, considere N planos perpendiculares a xα − xβ , igualmente espaçados, através de xj ,

com α # j # β. Claramente,
|xα − xβ | # (N − 1)|xj+1 − xj | ,
(k) (k)
em que |xj+1 − xj | é a distância entre dois planos adjacentes. Se escolhermos C1 e C2
como sendo as partículas sobre cada lado dos planos passando
3 por xα e xβ , então, |x|k 4
=
(k) (k)
(N − 1)|xj+1 − xj |. Tomando max |xα − xβ | = min |xα − xβ | | xα ∈ C1 , xβ ∈ C2 ,
√
segue que |x|k " dN |x|0 , em que dN = 2N −1/2 (N − 1)−3/2 .
DEFINIÇÃO 10.5 (Ruelle-Simon). Uma partição da unidade Ruelle-Simon é uma partição da
unidade composta por uma família {Jk } de funções suaves indexada por todas as decomposições
em dois clusters, isto é, #Cℓ = 2, com as seguintes propriedades:
(i) Jk é uma função homogênea de grau zero fora da esfera unitária, ou seja, Jk (sx) = Jk (x)
para todo s ∈ (0, ∞) e |x|0 = 1;
√
(ii) para |x|k " dN |x|0 , em que dN = 2N −1/2 (N − 1)−3/2 (a Figura 10.11 pode ajudar a
visualizar esta situação para x ∈ R),
3 4 3 4
supp Jk ∩ x ∈ R3N | |x|0 " 1 ⊆ x ∈ R3N | |x|k " dN |x|0 ;
;m
(iii) k=1 Jk2 (x) = 1.
Jk (x)
] [
−2 −1 −d 0 d 1 2 x
B CD E
Ωk
!
" A! função Jk , com supp Jk ⊂ Ωk "= (−2, 2) e a condição supp Jk ∩ x ∈ R |
Figura 10.11:
|x|0 " 1 ⊆ x ∈ R | |x|k " d|x|0 , 0 < d < 1 .
Nota 10.28. Exige-se a homogeneidade (i) apenas fora da esfera unitária para evitar uma
singularidade na origem, onde todas as partículas estão próximas. A condição (ii) é assumida
(k)
para garantir que as partículas em diferentes clusters de C2 estão distantes umas das outras.
(k) (k)
Em outras palavras, os clusters C1 e C2 desempenham o papel dos subconjuntos fechados
disjuntos de R3N no Lema de Urysohn (Lema 1.5). Observe que no supp Jk , duas partículas
pertencentes ao mesmo
; cluster não precisam estar próximas uma da outra. Além disso, em (iii)
assumimos ; que m 2
k=1 k (x) = 1 que é diferente da condição que aparece na Definição 1.50,
J
m
que requer k=1 Jk (x) = 1. No entanto, para nós a construção acima será mais conveniente.
PROPOSIÇÃO 10.14. Existe uma partição da unidade Ruelle-Simon.
721
LEMA+10.9. Seja Ω1 , . . . , Ωm conjuntos abertos em R3N e K um subconjunto ;m compacto tal que

K⊂ m Ω
k=1 k . Então, existe uma função jk ∈ C ∞
0 (Ωk ) tal que jk " 0 e k=1 jk (x) # 1, com
a igualdade acontecendo em uma vizinhança de x ∈ K.
Demonstração. Para todo x ∈ K existe algum εk > 0 arbitrário e algum k tais que B(x; εk ) ⊂
B(x; εk ) ⊂ Ωk . Pela compacidade de K, um número finito de muitas dessas bolas B(x; εk )
cobrem K. Pelo Teorema 6.33 existem funções hk ∈ C0∞ (Ωk ) tais que 0 # hk # 1, hk (x) ≡ 1
para x ∈ B(x; εk ) e hk (x) ≡ 0 para x ∈ R3N \ Ωk (a Figura 10.12 pode ajudar a visualizar
esta situação para x ∈ R).
hk (x)
[ ]
−2εk −εk 0 εk 2εk x
B CD E
B(x;εk )
B CD E
Ωk
Figura 10.12: A função hk , com supp hk ⊂ Ωk = (−2εk , 2εk ).
Tome k = 1 e, então, defina j1 = h1 tal que 0 # h1 # 1, h1 (x) ≡ 1 para x ∈ B(x; ε1 )

e h1 ≡ 0 para x ∈ R3N \ Ω1 . A seguir, tome k = 2. Note que, os conjuntos R3N \ Ω1 e
R3N \ Ω2 são subconjuntos de fechados disjuntos R3N . Logo, definindo j2 = h2 (1 − h1 ), segue
que 0 # j2 # 1, j2 (x) ≡ 1 para x ∈ B(x; ε2 ) e h2 ≡ 0 para x ∈ R3N \ Ω2 , uma vez que
para x ∈ B(x; ε1 ) temos que (1 − h1 ) = 0. Para k = 3, defina j3 = h3 (1 − h1 )(1 − h2 ).
Novamente, pelo fato de que (1 − hk ) = 0, para k = 1, 2, se x ∈ B(x; ε1 ) ou se x ∈ B(x; ε2 ),
segue que, 0 # j3 # 1, j3 (x) ≡ 1 para x ∈ B(x; ε3 ) e h3 ≡ 0 para x ∈ R3N \ Ω3 . Desta
forma, definindo
jk = hk (1 − h1 )(1 − h2 ) · · · (1 − hk−1 ) , j>1.
obtemos que, 0 # jk # 1, jk (x) ≡ 1 para x ∈ B(x; εk ), isto é, 0 # jk # 1 e supp jk ⊆

supp hk ⊂ Ωk . Finalmente, defina
gk = (1 − h1 )(1 − h2 ) · · · (1 − hk ) .
8 9
Para k > 1, gk−1 − gk = (1 − h1 )(1 − h2 ) · · · (1 − hk−1 ) 1 − (1 − hk ) = jk ; portanto
m
< m
<
jk = j1 + (gk−1 − gk ) = j1 + g1 − gm = 1 − gm .
k=1 k=2
+ +
Visto que K ⊂ k B(x; εk ) ⊂ k B(x; εk ) e jk (x) ≡ 1 para x ∈ B(x; εk ), gm ≡ 0 para
x ∈ K, pois para x ∈ B(x; εk ), para algum k = 1, . . . , m, temos que;
algum hk (x) = 1, o
m
que faz com que o produto na definição de gk desapareça. Portanto, k=1 jk = 1 em K,
completando a prova.
722
Demonstração da Proposição 10.14. O primeiro passo para se obter a família {Jk } deve ser dado
em direção à construção de uma cobertura aberta indexada finita do espaço R3N em relação a
qual a partição da unidade Ruelle-Simon estará subordinada. Por causa da homegeneidade, no
presente caso, basta construir a partição da unidade na esfera unitária, pois podemos estendê-la
para exterior e para interior de uma
! maneira (quase) arbitrária
" variando o parâmetro s ∈ (0, ∞).
3N −1 3N
Portanto, basta tomar S ≡ x ∈ R | |x|0 = 1 e os conjuntos {Ω}#C2 definidos por
3 4
Ωk = x ∈ R3N | |x|0 = 1, |x|k " dN ,
que pelo resultado do Lema 10.8 cobre S 3N −1 (veja uma ilustração idealizada desta situação na
figura abaixo no caso de S 1 ).
x1 x1
Ω1 Ω2
x2 x2
Figura 10.13: Uma cobertura da esfera unitária S 1 , o círculo. Note que, Ω1 ∪ Ω2 = S 1 .
Uma vez que temos uma cobertura (localmente) finita {Ω}#C2 de toda a esfera unitária
S 3N −1 , pelo Lema 10.9, o procedimento padrão é construir uma partição da unidade {Jk },
com supp Jk ⊂ Ωk (Figura 10.11), isto é, uma partição da unidade subordinada a esta cobertura.
Assim, para cada k, seja jk ∈ C0∞ (Ωk ) uma função que é igual a 1 em um conjunto Ω′k
um pouco menor (de modo que esses conjuntos menores ainda cubram S 3N −1 ). Portanto,
supp jk ⊂ Ω′k ⊂ Ωk . Então,
m
<
jk (x)
Jk (x) = H;m 2 =⇒ Jk2 (x) = 1 ,
k=1 jk (x) k=1
forma uma partição de unidade em S 3N −1 , com supp Jk ⊂ Ωk . Assim, Jk são as funções

desejadas.
O próximo resultado é conhecido como fórmula de localização IMS, e é devido a R.

Ismagilov, J.D. Morgan e B. Simon. Sua importância no contexto do operador de Schrödinger
atômico foi descoberta por I.M. Sigal.
LEMA 10.10 (Fórmula IMS). Para todo Ψ ∈ Dom(H) temos que
m
<
2
. . / /
∇ Ψ(x) = Jk (x)∇2 Jk Ψ (x) + |∇Jk (x)|2 Ψ(x) .
k=1
723
Demonstração. A prova segue de um cálculo direto, usando as identidades

m
< m
< . /
Jk (x)∇Jk (x) = 0 e |∇Jk (x)|2 + Jk (x)∇2 Jk (x) = 0 ,
k=1 k=1
;m
que seguem diferenciando k=1 Jk2 = 1.
Por causa do Lema 10.10, podemos usar {Jk } para decompor H em “partes localizadas” nos
suportes das funções Jk , além de um termo de “erro de localização:”
<m , -
#2 2
H= Jk (x)HJk (x) + |∇Jk (x)| .
k=1
2µ
O gradiente, associado ao erro de localização, é homogêneo de graus −1, pois Jk (sx) = Jk (x)
para s ∈ (0, ∞) e |x|0 " 1, o que implica ∇Jk (sx) = s−1 ∇Jk (x). Assim, ele tende a zero
no infinito. Portanto, o segundo termo à direita na equação acima é compacto em relação a H.
Por sua vez, no primeiro termo H = HC(k) + IC(k) , ou seja, podemos escrever
2 2
m
< . /
H= Jk (x) HC(k) + IC(k) Jk (x) .
2 2
k=1
Note que, como cada função Jk tem suporte compacto, segue que cada termo na soma
m
<
Jk (x)IC(k) Jk (x) ,
2
k=1
tem suporte compacto (apesar de IC(k) não ter suporte compacto). Logo, cada termo Jk (x)IC(k) Jk (x)
2 2
é um potencial da classe Kato-Rellich em relação à HC(k) que desaparece no infinito e, portanto,
2
é compacto em relação à HC(k) . Consequentemente, pelo Teorema de Weyl (Teorema 5.37), segue
2
que ( m )
<
σ(H) = σ Jk (x)HC(k) Jk (x) .
2
k=1
Como H é limitado inferiormente, pelo Corolário 4.8, H " (inf σ(H))1I e para todo Ψ ∈
Dom(H) temos que
⟨Ψ, Jk HC(k) Jk Ψ⟩ = ⟨Jk Ψ, HC(k) Jk Ψ⟩ " ΣC(k) ∥Jk Ψ∥2 " ΣC(k) ∥Ψ∥2 .
2 2 2 2
;m
Note que ΣC(k) # 0. Assim, Jk HC(k) Jk " ΣC(k) e, portanto, k=1 Jk (x)HC(k) Jk (x) " Σ. Isto
2 2 2 2
implica que ( m )
<
σ Jk (x)HC(k) Jk (x) ⊂ [Σ, ∞) ,
2
k=1
e, conseqüentemente, σess (H) ⊂ [Σ, ∞). Se agora assumirmos que H = HNrele e separarmos o
átomo em (Ne − 1) elétrons mais um único elétron, então, com base na análise acima, obtemos
que
. /
[λNe −1 , ∞) ⊃ σess HNrele .
724
Sob essas premissas, lembramos que os auto-valores do operador HNrele são caracterizados pelo
Teorema 5.13. Como HNrele é auto-adjunto, o Teorema 5.13 estabelece que se λ1 , λ2 , λ3 , . . . são
auto-valores de HNrele abaixo do espectro essencial, cada auto-valor λj possui multiplicidade
finita, possivelmente acumulando-se em λNe −1 . Isto conclui a prova da segunda parte do
Teorema HVZ, e do próprio teorema.
Para finalizar nossa discussão sobre o limite inferior do espectro essencial do operador de
Schrödinger atômico, vamos mencionar um resultado de A. Persson, publicado no artigo “Bounds
for the Discrete Part of the Spectrum of a Semi-bounded Schrödinger Operator,” Math. Scand. 8
(1960) 153. Persson descobriu uma interessante descrição geométrica para a parte inferior do
espectro essencial de um operador de Schrödinger limitado inferiormente.
TEOREMA 10.26 (Teorema de Persson). Sejam V um potencial real valorado na classe de
Kato-Rellich e H = H0 + V o correspondente operador de Schrödinger auto-adjunto e limitado
inferiormente, com domínio H2 (Rn ). Então, a parte inferior do espectro essencial é dada por
# = >%
−2 ∞ n
inf σess (H) = sup inf ⟨Ψ, HΨ⟩∥Ψ∥ | Ψ ∈ C0 (R \ K) ,
K⊂Rn Ψ̸=0
com o supremum sendo tomado sobre todos os subconjuntos compactos K ⊂ Rn .
A prova do Teorema de Persson pode ser encontrada no livro de P.D. Hislop e I.M. Sigal,
“Introduction to Spectral Theory with Applications to Schrödinger Operators,” Springer Verlag,
1996, Teorema 14.11, pg.145.
10.7.3 Ausência de Auto-Valores Positivos
Existe um argumento fisicamente aceitável e atraente que nos garante que um potencial indo
para zero no ∞ não pode ter estados ligados (ou seja, auto-funções de quadrado integráveis)
em energias positivas. A questão é, então, encontrar as condições que excluem a ocorrência
desses estados ligados de energia positiva. Nossa primeira proposição contém um critério para
essa inexistência.
PROPOSIÇÃO 10.15. Seja V uma função real valorada Rn que é relativamente H0 -limitada com
limite relativo < 1. Suponha que exista um número β ∈ (0, 2) tal que
V (αx) = α−β V (x) , (10.7.9)
para α ∈ (0, 1) e x ∈ Rn , com x ̸= 0. Então, o operador auto-adjunto H0 + V não tem
auto-valor contido em [0, +∞).
Demonstração. Pelo Teorema de Kato-Rellich (Teorema 4.35), H = H0 + V é um operador

auto-adjunto em Dom(H0 ). Seja λ ∈ R um auto-valor de H0 + V com auto-vetor Ψ, tal que
∥Ψ∥ = 1. Defina Ψα (x) = Ψ(αx), para α ∈ (0, 1). Usando a hipótese (10.7.9) e a equação
(H0 Ψ)(x) = −V (x)Ψ(x) + λΨ(x), derivamos
(H0 Ψα )(x) = α2 (H0 Ψ)(αx) = −α2 V (αx)Ψ(αx) + α2 λΨ(αx)
= −α2−β V (x)Ψα (x) + α2 λΨα (x) .
725
Usando esta relação e o fato de que os operadores H0 e V são simétricos, obtemos
−α2−β ⟨Ψ, V Ψα ⟩ + α2 λ⟨Ψ, Ψα ⟩ = ⟨Ψ, H0Ψα ⟩
= ⟨H0 Ψ, Ψα ⟩
= −⟨V Ψ, Ψα ⟩ + λ⟨Ψ, Ψα ⟩
= −⟨Ψ, V Ψα ⟩ + λ⟨Ψ, Ψα ⟩ ,
o que leva à equação

, -
α2−β − 1
λ⟨Ψ, Ψα⟩ = ⟨Ψ, V Ψα ⟩ .
α2 − 1
Tomando o limite α → 1− , concluímos que

, -
2−β
λ = λ⟨Ψ, Ψ⟩ = ⟨Ψ, V Ψ⟩ .
2
Portanto,
⟨Ψ, H0 Ψ⟩ = −⟨Ψ, V Ψ⟩ + λ⟨Ψ, Ψ⟩ = −2(2 − β)−1λ + λ = λβ(β − 2)−1 . (10.7.10)
Como ⟨Ψ, H0Ψ⟩ > 0 e β(2 − β)−1 < 0, segue de (10.7.10) que λ < 0.
Ilustramos o resultado anterior com o exemplo padrão do potencial coulombiano. Com

efeito, através do Teorema HVZ podemos obter explicitamente informações sobre a localização
do espectro essencial do operador de Schrödinger atômico, HNrele . Por outro lado, para obter
mais informações sobre os auto-valores de HNrele , usaremos o fato de que os operadores H0 e V
têm um comportamento simples em relação à uma transformação de escala.
Considere o grupo uni-paramétrico de transformações de escala sobre R3Ne , representado

pelo mapeamento x 3→ es x, s ∈ R que induz o operador
/ . /
(U (s)Ψ (x) = e3Ne s/2 Ψ(es x) , Ψ ∈ Dom HNrele .
De acordo com a Proposição 9.5, U (s) é fortemente contínuo, e pela Proposição 9.6 o gerador
infinitesimal do grupo das transformações de escala é o operador
3Ne 1 1! "
Λs = −i 1I + XP = X, P ,
2 # 2#
! "
em que X, P = XP + P X é o anti-comutador dos operadores X e P . Agora, vamos
investigar a ação de U (s) em HNrele :
HNrele (s) = U (−s)HNrele U (s) = U (−s)(H0 + V )U (s) ,
em que V é o potencial total que aparece no hamiltoniano (10.7.3) (lembramos que os ter-
mos de Hughes-Eckart estão sendo desprezados). Como todos os potenciais na Eq.(10.7.3) são
coulombianos, segue que
HNrele (s) = e−2Ne s H0 + e−Ne s V .
726
. /
Como Dom HNrele = Dom(H0 ) e U (s)Dom(H0 ) = Dom(H0 ), para todo s ∈ R,
suponha que HNrele Ψ = λΨ, então,
@ 8 9 A @ A @ A
rel rel rel
Ψ, U (s), HNe Ψ = Ψ, U (s)HNe Ψ − Ψ, HNe U (s)Ψ
[ \ [ \
= U (−s)Ψ, λΨ − λΨ, U (s)Ψ
[ \ [ \
= λ U (−s)Ψ, Ψ − λ U (−s)Ψ, Ψ
=0.
Note que, podemos escrever

@ A @ A
rel rel
Ψ, HNe U (s)Ψ = Ψ, U (s)U (−s)HNe U (s)Ψ
@ A
= U (−s)Ψ, U (−s)HNrele U (s)Ψ
@ A
= U (−s)Ψ, HNrele (s)Ψ .
Portanto,
O P
1@ 8 rel
9 A HNrele − HNrele (s)
0 = lim Ψ, U (s), HNe Ψ = lim U (−s)Ψ, Ψ
s→0 s s→0 s
= − ⟨Ψ, (2Ne H0 + Ne V )Ψ⟩ .
Isto prova o seguinte teorema sobre a inexistência de auto-valores imersos no espectro essencial:
TEOREMA 10.27 (Teorema Virial). Se λ é um auto-valor do operador de Schrödinger atômico,
HNrele e Ψ é a correspondente auto-função normalizada, ou seja, HNrele Ψ = λΨ, ∥Ψ∥ = 1, então,
1
λ = − ⟨Ψ, H0 Ψ⟩ = ⟨Ψ, V Ψ⟩ .
2
Em particular, como ⟨Ψ, H0 Ψ⟩ > 0, todos os auto-valores devem ser negativos.
O método virial é um caso particular de uma técnica mais geral que você pode encontrar
na literatura chamada Estimativa de Mourre. Mais detalhes sobre o Teorema Virial podem ser
obtidos nos Exercícios 10.18 e 10.19.
10.7.4 Espectro dos Átomos do Hidrogênio e do Hélio

“Mas, protestou Bohr, “ninguém acreditará em mim, a menos que eu possa explicar
todos os átomos e moléculas.” Rutherford respondeu rapidamente: “Bohr, você explica o hidrogênio e explica o hélio
e todos acreditarão no resto.”
John Archibald Wheeler (1986)
A seguir, vamos analisar o espectro dos átomos do hidrogênio e do hélio.
727
10.7.4.1 O Átomo do Hidrogênio “O átomo do hidrogênio é tão simples que uma análise matemática completa
pode ser realizada. Essa análise foi um divisor de águas da física atômica.”
Walter Thirring
Iniciaremos aplicando a caracterização do auto-valor mais baixo de um operador auto-adjunto

limitado inferiormente, como estabelecido no Corolário 5.10, para estimar a energia do estado
fundamental desse átomo. Para um cálculo aproximado destes auto-valores, geralmente se usa
o Método de Ritz.38 Em poucas palavras, como a auto-função exata associada ao estado funda-
mental não é conhecida, selecionamos uma função trial Ψ ∈ Dom(H1atom ) que deve respeitar
as condições de contorno (e quaisquer outras restrições físicas). A função trial pode depender
de um conjunto finito de parâmetros ajustáveis c1 , c2 , . . . , cn que variam em um domínio D
n-dimensional. Com eles, calculamos o valor esperado de H1atom e obtemos um limite superior
para a energia do estado fundamental, dependendo dos parâmetros c1 , c2 , . . . , cn . O resultado
obtido é então minimizado em relação aos c’s e, dessa forma, obtemos o melhor limite de toda
a família. Em outras palavrsa, com a função trial Ψ, ⟨Ψ, H1atom Ψ⟩/⟨Ψ, Ψ⟩ é uma função dos
parâmetros c1 , c2 , . . . , cn e fornecerá um valor esperado maior ou igual à energia do estado
fundamental, isto é,
⟨Ψ, H1atom Ψ⟩
= f (c1 , c2 , . . . , cn ) " λ , (10.7.11)
⟨Ψ, Ψ⟩
com
γ= inf f (c1 , c2 , . . . , cn ) " λ .
c1 ,c2 ,...,cn ∈D
Consideramos γ como um valor aproximado de λ. A desigualdade (10.7.11) é válida mesmo que

a σ(H1atom ) não seja puramente discreto. De fato, isto é uma consequência direta do Princípio
Min-Max, válido para qualquer operador auto-adjunto.
Se Ψ1 , Ψ2 , . . . , Ψn são elementos linearmente independentes em Dom(H1atom ), podemos

tomar Ψ = c1 Ψ1 + c2 Ψ2 + · · · + cn Ψn e escolher D como sendo todo Rn , exceto a origem.
Ignorando possíveis correções relativísticas e efeitos devido ao spin das partículas, o operador
de Schrödinger para o átomo do hidrogênio no espaço L2 (R3 ) tem a seguinte forma (levando-se
em conta a separação do centro-de-massa do sistema):
#2 #2 2 Ze2
H1atom = − ∇2xcm − ∇ − ,
2(me + mp ) 2µ ∥x∥
em que µ = me mp /(me + mp ) é massa reduzida e x = xe − xp é a posição relativa entre o
elétron e o núcleo. Observe que a equação acima mostra que o centro-de-massa se comporta
como se fosse uma partícula livre de massa M = me + mp .
Como observado anteriormente, dado que a massa do próton é aproximadamente 1800 vezes
maior que a massa do elétron, a localização do centro-de-massa do sistema elétron-próton
38
Walther Heinrich Wilhelm Ritz (22 de fevereiro de 1878 – 7 de julho de 1909) foi um físico teórico suíço. Ele é
mais famoso por seu trabalho com Johannes Rydberg sobre o Princípio da Combinação Rydberg-Ritz. Ritz também
é conhecido pelo método variacional que recebeu o seu nome, o Método de Ritz. O método variacional de Ritz é
também conhecido na literatura como Método de Rayleigh-Ritz, apesar de uma certa polêmica, como relata Shlomo
Sternberg no Capítulo 14 do seu livro “A Mathematical Companion to Quantum Mechanics,” Dover Publications,
2019.
728
quase que coincide com a localização do próton. Além disso, a massa reduzida do sistema é
muito próxima da massa do elétron, isto é, µ ≈ 0, 995me . Assim, numa primeira aproximação,
“removemos” o centro-de-massa, supondo que o próton está “congelado” em sua localização,
com o elétron “orbitando” em torno dessa localização. Com isto, só o movimento relativo pode
ser considerado para efeito de análise. Portanto, o hamiltoniano do sistema é simplemente
#2 2 Ze2
H1atom = − ∇ − .
2µ ∥x∥
Queremos minimizar a expressão

⟨Ψ, H1atom Ψ⟩
, Ψ ̸= 0 ,
⟨Ψ, Ψ⟩
para encontrar o menor auto-valor. Levando em conta que o potencial coulombiano V (x) =
1/∥x∥ é esfericamente simétrico, vamos assumir que a função trial dependa só de r = ∥x∥,
Ψ = Ψ(r). Mais especificamente, assuma que
Ψ(r) = e−cr .
(lembre-se que as auto-funções devem decair exponencialmente). Então, considerando que

, -
#2 d 2 2 d
H0 Ψ(r) = − + Ψ(r) ,
2µ dr 2 r dr
segue que,
, - F 2, - G
#2 d2 2 d e2 −cr # 2c e2 −cr
H1atom Ψ(r) =− + e−cr
− e = − 2
c − − e .
2µ dr 2 r dr r 2µ r r
Ao calcular as integrais (com relação a dϕdθdr r 2 sin θ), observe que39

$ ∞ $ ∞ $ ∞
−2cr 1 −2cr 1 1
dr e = , dr r e = 2 , dr r 2 e−2cr = 3 . (10.7.12)
0 2c 0 4c 0 4c
Portanto,
⟨Ψ, H1atom Ψ⟩ #2 2
= c − e2 c .
⟨Ψ, Ψ⟩ 2µ
O lado direito da igualdade acima atinge seu mínimo quando
µe2
c= .
#2
Deste modo, segue que
⟨Ψ, H1atom Ψ⟩ µe4
=− 2 .
⟨Ψ, Ψ⟩ 2#
39
Usamos a fórmula elementar
$ ∞
n!
dϱ ϱn e−cϱ = para c>0.
0 cn+1
729
Pode-se provar que este é também o auto-valor mais baixo do espectro de H1atom e, portanto,
a energia do estado fundamental do átomo do hidrogênio. Deve-se enfatizar que isso se deve
à nossa escolha da função exponencial como função trial. No Exercício 10.20 convidamos o
leitor a provar que se tivéssemos escolhido uma gaussiana como função trial, estaríamos fora
do valor mínimo cerca de 15%.
A maioria da literatura sobre mecânica quântica apresenta de forma detalhada o cálculo da

solução da equação de auto-valor para o operador de Schrödinger do átomo do hidrogênio.40
Os auto-valores do átomo do hidrogênio são
µe4
En = − , n∈N, (10.7.13)
2#2 n2
em que n2 dá a multiplicidade de En . O resultado (10.7.13) não depende do número quântico

orbital ℓ ou do número azimutal m; depende apenas do número quântico principal n. Para um
dado n, o número orbital ℓ pode assumir n − 1 valores: ℓ = 0, 1, 2, 3, . . . , n − 1; enquanto
que para cada ℓ, o número azimutal m assume 2ℓ + 1 valores: m = −ℓ, −ℓ + 1, . . . , ℓ − 1, ℓ.
Assim, para cada n, existem gn diferentes funções de onda, Ψnℓm , que correspondem à mesma
energia En , com
n−1
< n−1
< n−1
<
gn = (2ℓ + 1) = 2 ℓ+ 1 = n(n − 1) + n = n2 . (10.7.14)
ℓ=1 ℓ=1 ℓ=1
Consequentemente, de acordo com o Teorema 10.7, a Proposição 10.6 e o Exemplo 10.2, podemos
concluir que os auto-valores negativos do espectro do átomo do hidrogênio são auto-valores com
multiplicidade finita, com H1atom podendo ter apenas auto-valores negativos isolados. Em outras
palavras, o espectro σ(H) do operador de Schrödinger do átomo do hidrogênio está contido
em [−2−1 µe4 #−2 , ∞) e divide-se da seguinte forma: σ(H1atom ) = {En }n=1,2,... ∪ [0, ∞),
4
com o espectro discreto, σdisc (H1atom ) = {En }n=1,2,... , em que En = − 2#µe2 n2 , sendo que
E1 < E2 < E3 < · · · , En → 0 quando n → ∞ e σess (H1atom ) = [0, ∞) é o espectro
essencial. Enquanto o espectro discreto corresponde aos níveis de energia do estados ligados
próton-elétron, o espectro essencial desempenha um papel importante na teoria dos estados
espalhados do sistema. Além disso, de acordo com a Proposição 10.13, o operador de Schrödinger
do átomo do hidrogênio é essencialmente auto-adjunto em C0∞ (R3 ). Note que, pela Proposição
10.7, a Eq.(10.7.13) nos revela que no intervalo [−2−1 µe4 #−2 , 0) o átomo do hidrogênio tem um
número infinito de auto-valores isolados, de multiplicidade finita, que se acumulam em zero.
Por este motivo, o espectro discreto não é um conjunto fechado, já que neste caso o espectro
discreto é uma sequência de auto-valores tendendo a 0, mas 0 não pertence ao espectro discreto.
Nota 10.29. É interessante notar que o resultado da teoria espectral do átomo do hidrogênio
é um caso especial do Teorema HVZ. Qualquer sistema de dois corpos que se aproxime do
limiar do continuum será separado exclusivamente nas duas partículas (neste caso o próton e o
elétron). O limiar contínuo de H1atom (o menor valor do espectro essencial) é, portanto, a soma
da energia do estado fundamental de duas partículas livres e independentes, que é zero.
Nota 10.30. Quando o spin é levado em conta, o experimento Stern-Gerlach estabelece que a
40
Por exemplo, este cálculo, com todos os detalhes, pode ser encontrado no livro de F. Williams, “Topics in
Quantum Mechanics,” PMP 27, Birkhäuser, 2003, no Capítulo 5.
730
multiplicidade dos níveis de energia do hidrogênio deve ser dada por

n−1
<
gn = 2 (2ℓ + 1) = 2n2 ,
ℓ=1
uma vez que, além da degenerescência (10.7.14), cada nível é duplamente degenerado em relação
ao grau de liberdade do spin. Portanto, para acomodar os dois graus de liberdade associado
ao spin do elétron, os elementos do espaço de estado do elétron são, agora, expressos por um
spinor do tipo:
( )
Ψ1/2 (x)
Ψnℓm,±1/2 (x) = ,
Ψ−1/2 (x)
Ψ1/2 corresponde ao estado cuja projeção do spin é 21 # e Ψ−1/2 a − 12 #. Deste modo, o

estado fundamental do hidrogênio é duplamente degenerado: para cada estado puro Ψnℓm
correspondem, agora, dois estados ortogonais
( ) ( )
Ψ1/2 (x) 0
Ψ100,1/2 (x) = e Ψ100,−1/2 (x) = ,
0 Ψ−1/2 (x)
com mesma energia −13, 6 eV . Da mesma forma, o primeiro estado excitado é oito vezes
degenerado (2(2)2 = 8) porque os oito estados Ψ200,±1/2 , Ψ211,±1/2 , Ψ210,±1/2 e Ψ21−1,±1/2
correspondem à mesma energia −13, 6/4 eV = −3, 4 eV .
Nota 10.31 (Fato histórico). Foi Weyl quem primeiro ajudou Schrödinger no cálculo dos auto-
valores do átomo do hidrogênio, En . Posteriormente, a concordância desse cálculo com as
linhas espectrais experimentais do átomo do hidrogênio foi muito importante para validar a
proposta de Schrödinger para seu operador de energia quântica.
10.7.4.2 Átomos do Tipo Hélio “Embora a equação de Schrödinger para átomos do tipo-hélio não
seja exatamente solúvel, é possível fazer afirmações sobre ela com precisão arbitrariamente boa. Por esse motivo, tem
sido um princípio básico para avaliar a qualidade da mecânica quântica.”
Walter Thirring
Estudaremos agora um sistema composto por um núcleo de massa M e carga Ze e dois

elétrons de massa me carga e com me << M. Exemplos desse sistema são o íon do hidrogênio
com carga negativa H − (Z = 1), o átomo do hélio HHe (Z = 2), o íon Li+ ionizado (Z = 3),
o íon Be++ duplamente ionizado (Z = 4) e assim por diante. No caso em que Z é um
inteiro maior que dois, o sistema representa átomos de terras raras ionizadas. Cada elétron
desses sistemas sente os efeitos de dois campos de Coulomb: um do núcleo Ze e outro do
outro elétron. Como no caso do átomo do hidrogênio, aqui consideramos que, numa primeira
aproximação, o centro-de-massa pode ser “removido,” supondo que o núcleo está “congelado”
em sua localização com os elétrons “orbitando” em torno dessa localização. Logo, assumindo-se
o núcleo “congelado” na origem (veja a Figura 10.14), ignorando-se os efeitos relativíticos, efeitos
de spin-órbita e o efeito da corrente provocado pelo movimento de um elétron sobre o outro,
o hamiltoniano de íons do tipo hélio, atuando em L2 (R3·2 ) (com a identificação natural desse
731
espaço com L2 (R3 ) ⊗ L2 (R3 )), é dado por

, 2 - , 2 -
atom # 2 Ze2 # 2 Ze2 e2
H2 = − ∇x 1 − + − ∇x 2 − + , (10.7.15)
2µ ∥x1 ∥ 2µ ∥x2 ∥ ∥x − x ∥
B CD E B CD E B 2 CD 1 E
H1 H2 V21
em que µ = me M/(me + M) é massa reduzida de cada elétron em relação ao núcleo, x1 e

x2 são as coordenadas eletrônicas do primeiro e segundo elétron, respectivamente, em relação
ao núcleo e x2 − x1 é a separação entre os dois elétrons. De acordo com o Teorema 10.24, o
operador (10.7.15) é essencialmente auto-adjunto em C0∞ (R3·2 ).
−e
z
x21
x1 −e
x2
+Ze y
Figura 10.14: Coordenadas utilizadas na formulação do hamiltoniano de íons do tipo hélio.
Desprezando a interação elétron-elétron, chega-se ao operador

, 2 - , 2 -
# 2 Ze2 # 2 Ze2
H 0 = − ∇x 1 − + − ∇x 2 −
2µ ∥x1 ∥ 2µ ∥x2 ∥
, 2 - , 2 -
# 2 Ze2 # 2 Ze2
= − ∇x 1 − ⊗ 1I2 + 1I1 ⊗ − ∇x2 − .
2µ ∥x1 ∥ 2µ ∥x2 ∥
Dado que os operadores Hj , com j = 1, 2, são auto-adjuntos, podemos usar os resultados sobre
o átomo do hidrogênio para computar o espectro de H0 em termos do espectro de Hj . Em
4
outras palvras, os auto-valores de Hj já são explicitamente conhecidos, isto é, {− 2#µe2 n2 }∞
n=1 , de
#2 2 Ze2
modo que o espectro de H0 seja a soma dos espectros de duas cópias de − 2µ ∇x − ∥x∥ em
L2 (R3 ). Portanto, H0 tem auto-valores
# , -%∞
µZ 2 e4 1 1
En,m = − + . (10.7.16)
2#2 n2 m2 n,m=1
Sabemos que σess (Hj ) = [0, ∞); por outro lado, de acordo com o Teorema HVZ
n , 2 - ) n )
atom # 2 Ze2 µZ 2 e4
σess (H2 ) = inf σ − ∇x − ,∞ = − ,∞ ,
2µ ∥x∥ 2#2
732
uma vez que o espectro de H1atom é dado por

# %∞
atom µZ 2 e4
σ(H1 ) = − 2 2 ∪ [0, ∞) .
2# n n=1
Observe que o espectro essencial de H2atom não é influenciado pelo potencial V21 , já que um
elétron permanece no estado fundamental enquanto o outro “vai para o infinito.” Em outras
8 2 4 /
palavras, diz-se que o intervalo − µZ2#2e , ∞ representa estados livres porque corresponde à
situação em que um dos elétrons está livre, ou seja, possui energia para se afastar dos outros.
De fato, isto pode ser justificado a partir de toda argumentação relacionada ao Teorema HVZ:
heuristicamente, os estados no espectro essencial não devem ser estados ligados e, portanto,
devem envolver clusters de partículas distantes umas das outras. Assim, tomando-se como base
o Exemplo 10.4, podemos tomar um espaço de configuração apropriado que especifica o movi-
mento relativo dos 2 elétrons nos átomos do tipo hélio, e, neste caso, existem 5 possibilidades
representadas pelos seguintes canais:
* Canal-1 – C1 = {+Ze, e1 , e2 }: Neste canal todas as partículas estão ligadas e

2
#2 < 2
H2atom =− ∇ + V C 1 + IC 1 ,
2µ j=1 xj
em que VC1 = V (x1 ) + V (x2 ) + V (x21 ) e IC1 = 0.
* Canal-2 – C2 = {{+Ze, e1 }, {e2 }}: Neste canal o elétron 1 permanece ligado ao núcleo,
enquanto o elétron 2 se desliga completamente do sistema
2
#2 < 2
H2atom =− ∇ + V C 2 + IC 2 ,
2µ j=1 xj
em que VC2 = V (x1 ) e IC3 = V (x2 ) + V (x21 ).
* Canal-3 – C2 = {{+Ze, e2}, {e1 }}: Neste canal o elétron 2 permanece ligado ao núcleo,
enquanto o elétron 1 se desliga completamente do sistema
2
#2 < 2
H2atom =− ∇ + V C 2 + IC 2 ,
2µ j=1 xj
* Canal-4 – C2 = {{+Ze}, {e1 , e2 }}: Neste canal os elétrons 1 e 2 permanecem ligados

e desligados do núcleo, o que é obviamente impossível para os elétrons (mas seria realista no
espalhamento de um pósitron a partir de um átomo de hidrogênio). Nesse caso,
2
#2 < 2
H2atom =− ∇ + V C 2 + IC 2 ,
2µ j=1 xj
733
* Canal-5 – C3 = {{+Ze}, {e1 }, {e2 }}: Neste canal todas as partículas estão separadas, o
que é obviamente uma configuração que não gera um átomo. Nesse caso,
2
#2 < 2
H2atom =− ∇ + V C 3 + IC 3 ,
2µ j=1 xj
em que VC3 = 0 e IC3 = V (x1 ) + V (x2 ) + V (x21 ).
O Teorema HVZ nos diz que o continuum começa em Σ = min#Cℓ "2 ΣCℓ , em que ΣCℓ =
{λC1 , . . . , λCℓ }, com λCk sendo a energia mais baixa do cluster Ck ⊂ Cℓ , para k = 1, . . . , ℓ.
Veja que nos canais acima, por exemplo, no canal-2 o elétron 1 permanece ligado ao núcleo,
+Ze, enquanto o elétron 2 vai para o infinito. No canal-3 nós temos a mesma situação, com
os elétrons 1 e 2 trocados. Para esses canais
, 2 - , 2 -
# 2 Ze2 # 2
ΣC2 = inf σ − ∇x1 − + inf σ − ∇x2 ,
2µ ∥x1 ∥ 2µ
ou , - , 2 -
#2 Ze2 # 2
ΣC2 = inf σ − ∇2x2 − + inf σ − ∇x1 .
2µ ∥x2 ∥ 2µ
Já para o canal-1
, 2 -
# 2 #2 2 Ze2 Ze2 e2
ΣC1 = inf σ − ∇x1 − ∇ − − + ,
2µ 2µ x2 ∥x1 ∥ ∥x1 ∥ ∥x1 − x2 ∥
Para o canal-4
, 2 -
# 2 #2 2 e2
ΣC2 = inf σ − ∇x1 − ∇ + ,
2µ 2µ x2 ∥x1 − x2 ∥
e para o canal-5 , - , 2 -
#2 # 2
ΣC3 = inf σ − ∇2x1 + inf σ − ∇x2 .
2µ 2µ
Observe que levamos em consideração o fato de termos assumido que o núcleo está fixo na
2 4
origem. Portanto, da análise acima, os canais-2 e 3 terão ΣC2 começando com a energia − µZ2#2e ,
#2 2
a energia do estado fundamental do operador hidrogenóide, − 2µ ∇2x − Ze
∥x∥
. Considerando as
outras possibilidades, percebe-se, então, que é esperado em termos físicos que σess (H2atom ) =
8 µZ 2 e4 /
− 2#2 , ∞ , como estabelecido pelo Teorema HVZ (Teorema 10.25).
Por sua vez, o espectro de H2atom tem uma parte discreta dada pela soma λ1 + λ2 das
energias dos elétrons. Assim, podemos concluir que
# # %∞ %
atom µe4
σ(H2 ) = λ1 + λ2 | λ1 , λ2 ∈ − 2 2 ∪ [0, ∞)
2# n n=1
# , -%∞ n )
µZ 2 e4 1 µZ 2 e4
= − 1+ 2 ∪ − ,∞ .
2#2 n n=1 2#2
734
Um dos resultados mais intrigantes relacionado ao átomo do hélio diz respeito ao fato
de σdisc (H2atom ) ter infinitos auto-valores abaixo do infimum do seu espectro essencial, mais
8 2 4 2 4/
especificamente no intervalo − µZ#2e , − µZ2#2e (ou seja, um sistema de três corpos com duas
forças coulombianas atrativas de magnitude 2 e uma força coulombiana repulsiva de magnitude
1 tem infinitos estados ligados). Que isso pode ser mostrado é uma prova do poder dos métodos
qualitativos da análise funcional. Os primeiros resultados sobre este problema foram obtidos por
T. Kato,41 que mostrou que se os termos de Hughes-Eckart fossem ignorados (a chamada massa
nuclear infinita), então existia infinitos estados ligados. Quando os termos de Hughes-Eckart
foram contabilizados e as massas físicas usadas, Kato mostrou que havia pelo menos 25.585
estados ligados. A única razão pela qual Kato não obteve um número infinito de estados ligados
foi que ele foi incapaz de mostrar que o continuum estava localizado onde é determinado pelo
Teorema de HVZ. Considerando o Teorema HVZ, o argumento original de Kato implica, de fato,
que o hamiltoniano do átomo do hélio (com as massas físicas) tem uma infinidade de estados
ligados.
Vamos agora analisar os níveis de energia do hamiltoniano H0 dos três estados mais baixos.
Neste caso idealizado, no qual os dois elétrons ignoram-se um ao outro, a energia mais baixa
é E1,1 = −27, 2Z 2 eV . No primeiro estado excitado, um elétron ocupa o nível mais baixo
n = 1 e o outro elétron ocupa o nível n = 2 ou vice-versa. A energia pode assim ser deduzidas
de (10.7.16): E1,2 = −17, 0Z 2 eV . Finalmente, a energia do segundo estado excitado, que
corresponde aos dois elétrons ocupando o segundo nível n = 2, pode também ser inferida
a partir de (10.7.16): E2,2 = −6, 8Z 2 eV . Obviamente, não se espera que esses resultados
sejam precisos porque, ao se desprezar a interação coulombiana entre os elétrons, fizemos
uma aproximação grosseiramente imprecisa. Por exemplo, o valor numérico da energia no
teor
estado fundamental obtido de (10.7.16) para o átomo do hélio E1,1 = −108, 8 eV , enquanto o
exp
valor experimental é E1,1 = −78, 975 eV ; isto é, o valor teérico é 378% menor que o valor
experimental.
A energia de ionização, ou seja, a energia necessária para remover um elétron do estado

fundamental e afastá-lo suficientemente para que a sua interação com o restante do sistema
possa ser desprezada é Eioniz = 13, 6Z 2 eV e, o que é mais interessante, o início do espectro
essencial encontra-se abaixo do estado excitado, no qual ambos os elétrons estão no estado
n = 2, e este resultado introduz um novo fenômeno: a existência de auto-valores embedded no
espectro essencial, isto é, todos os auto-valores En,m estão no espectro contínuo se n " 2 e
m " 2 (veja a Figura 10.15). No entanto, pelo Teorema Virial (Teorema 10.27) não podem existir
auto-valores no intervalo [0, ∞).
σ(H0) =
−1 − 12 R
Figura 10.15: O espectro de H0 em unidades atômicas.
41
Veja a prova da Proposição de Kato no livro-texto de M. Reed e B. Simon, “Methods of Modern Mathematical
Physics. Analysis of Operators,” Vol.IV, Academic Press, 1978, pg.89.
735
Quando se “liga” a interação elétron-elétron, V (x21 ), espera-se que os estados ligados pre-
sentes no continuum de H0 se dissolvam. Isto realmente acontece, mas, no caso do átomo do
hélio observa-se um efeito de “memória” desses auto-valores (veja mais detalhes no texto de M.
Reed e B. Simon, “Methods of Modern Mathematical Physics. Analysis of Operators,” Vol.IV, Aca-
demic Press, 1978). Uma boa discussão (resumida) das implicações da existência de auto-valores
acima do limiar de ionização pode também ser encontrada no texto de S. Gasirorowicz, “Física
Quântica,” Guanabara Dois, 1979, na pg.280.
Para finalizar nossa discussão sobre átomos de dois elétrons, vamos estimar, usando o método
variacional de Ritz, o valor mais baixo do espectro de H2atom .
TEOREMA 10.28. Para o valor mais baixo λ do espectro de H2atom nós temos que
3µe4
λ#− (2Z − 8)2 .
#2
Demonstração. Por analogia com o caso do átomo do hidrogênio, podemos escolher uma função
trial como sendo a produto de duas funções de onda hidrogenóides, isto é, assumimos que
Ψ(x, y) = e−c(∥x∥+∥y∥) , com 0 < c < ∞ .
Com isto, computamos
⟨Ψ, H2atom Ψ⟩
, Ψ ̸= 0 e γ = inf f (c)
⟨Ψ, Ψ⟩ 0<c<∞
Começamos com o cáculo de ⟨Ψ, Ψ⟩, isto é,

$ ,$ -2 $ ∞
−2c(∥x∥+∥y∥) −2c∥x∥ 2 π2
⟨Ψ, Ψ⟩ = dxdy e = dx e = (4π) dr r 2 e−2cr = .
R6 R3 0 c6
Aqui, usamos a última integral que aparece na Eq.(10.7.12).
Nosso próximo passo é computar ⟨Ψ, H2atom Ψ⟩, isto é,

$ n
#2 6 7
⟨Ψ, H2atom Ψ⟩ = dxdy |∇x Ψ(x, y)|2 + |∇y Ψ(x, y)|2
R6 2µ
, - o
Ze2 Ze2 e2
− + − |Ψ(x, y)|2 .
∥x∥ ∥y∥ ∥x − y∥
Primeiro, observe que
$ $
Ze2 2 Ze2
dxdy |Ψ(x, y)| = dxdy |Ψ(x, y)|2
R 6 ∥x∥ R 6 ∥y∥
,$ ∞ - ,$ ∞ -
2 2 −2cr1
= (4π) Ze dr1 r1 e dr2 r22 e−2cr2
0 0
π 2 Ze2
= .
c5
736
Aqui, desta vez, usamos as duas últimas integrais da Eq.(10.7.12). A seguir, considere a integral
$ $
e2 2 2 e−2c(∥x∥+∥y∥)
dxdy |Ψ(x, y)| = e dxdy
R6 ∥x − y∥ R6 ∥x − y∥
$ ,$ -
2 −2c∥x∥ e−2c∥y∥
=e dx e dy .
R3 R3 ∥x − y∥
Vamos isolar o único termo que depende dos ângulos entre x e y, isto é,
1 1
= 2 2
,
∥x − y∥ (r1 + r2 − 2r1 r2 cos θ)1/2
em que r1 = ∥x∥, r2 = ∥y∥ e θ é o ângulo entre as direções x e y. Devido à invariância

rotacional, podemos prosseguir escolhendo a direção r1 como o eixo dos z, isto é, podemos
assumir que (0, 0, r1) = x ∈ R3 . Logo, obtemos
$ $ n o1
2π 1
1 (r12 + r22 − 2r1 r2 cos θ)1/2
dϕ d(cos θ) 2 = −2π
0 −1 (r1 + r22 − 2r1 r2 cos θ)1/2 2r1 r2
−1
n. /o
r1 + r2 − |r1 − r2 |
=π
r1 r2
⎧
⎪ 1
⎪ se r1 > r2
⎨ r1 ,
⎪
= 2π
⎪
⎪ 1
⎪
⎩ , se r2 > r1
r2
# %
1 1
= 2π min , .
r1 r2
Dessa forma, temos

$ $ ∞ # %
e−2c∥y∥ 2 −2cr2 1 1
dy = 2π dr2 r2 e min ,
R3 ∥x − y∥ 0 r1 r2
, $ r1 $ ∞ -
1 2 −2cr2 −2cr2
= 2π dr2 r2 e + dr2 r2 e
r1 0 r1
, -
1 1
= 2π γ(3, 2cr1 ) + 2 Γ(2, 2cr1 )
2c3 r1 2c
, -
1 3 r1
= −2π 3 + 2 + e−2cr1 .
c r1 2c c
Aqui, usamos a Tabela de Integrais de Gradshtein-Ryzhik (fórmulas 3.351, 1.8 e 2.11 , pg.340) e o
fato que
8 9 8 9
γ(3, 2cr1 ) = −e−2cr1 2 + 4cr1 + 4c2 r22 e Γ(2, 2cr1) = e−2cr1 1 + 2cr1 ,
737
também usando a Tabela de Integrais de Gradshtein-Ryzhik, pg.901. Seguindo, nós temos que
computar as integrais
$ ∞ , -
2 r1 3r12 r13 −4cr1 8π 2
−8π dr1 + + e = − .
0 c3 2c2 c c5
Consequentemente,
$
e2 8π 2 e2
dxdy |Ψ(x, y)|2 = − 5 .
R6 ∥x − y∥ c
Finalmente, computamos as integrais

$ $
#2 2 #2
dxdy |∇x Ψ(x, y)| = dxdy |∇y Ψ(x, y)|2
2µ R6 2µ R6
$ , -2
#2 ∂Ψ(x, y)
= dxdy
2µ R6 ∂∥x∥
$
# 2 c2
= dxdy e−2c(∥x∥+∥y∥)
2µ R6
,$ -2
# 2 c2 −2c∥x∥
= dx e
2µ R3
$ ∞
# 2 c2 2
= (4π) dr r 2 e−2cr
2µ 0
#2 π 2
= .
12µc4
Resumindo, obtemos
⟨Ψ, H2atom Ψ⟩ # 2 c2
= − e2 (2Z − 8)c .
⟨Ψ, Ψ⟩ 12µ
O lado direito da igualdade acima atinge seu mínimo quando
6µe2
c= (2Z − 8) .
#2
Deste modo, segue que
⟨Ψ, H2atom Ψ⟩ 3µe4
= − 2 (2Z − 8)2 ,
⟨Ψ, Ψ⟩ #
o que encerra a prova do teorema.
Para o átomo do hélio, pode-se provar que o valor mais baixo de λ do espectro de H2atom é
um auto-valor e, portanto, o Teorema 10.28 nos dá uma estimativa do menor auto-valor. Como
738
ilustração numérica,42 a energia do estado fundamental do átomo do hélio é obtida substituindo-

se Z = 2 no Teorema 10.28. Isso produz E1,1 = 77, 456 eV , em excelente concordância com o
exp
valor experimental E1,1 = 78, 975 eV . Portanto, o método variacional superestima o resultado
correto em apenas 1, 9%. Este resultado é significativamente mais preciso que a teoria de
perturbação de primeira ordem. O cálculo usando o método de perturbação de primeira ordem
discorda do valor experimental por 4 eV , ou seja, por um erro relativo de 5, 3%. Fisicamente,
isso pode ser atribuído ao fato de que o método não leva em conta o efeito de blindagem: a
presença de um elétron tende a diminuir a carga líquida “vista” pelo outro elétron. Suponha
que o elétron 1 esteja “entre” o núcleo e o elétron 2; então, o elétron 2 não “verá” uma carga
nuclear Ze, mas uma carga nuclear efetiva (Z − 1)e proveniente do núcleo. Por sua vez, o
método variacional já inclui o efeito de blindagem e o elétron 2 “verá” uma carga nuclear efetiva
(Z − 5/16)e.
10.8 Os Termos de Hughes-Eckart e o Teorema HVZ

Vimos que ao se adotar o sistema de coordenadas ycm , y1 , y2 , . . . , yNe , o laplaciano em
3Ne
R em termos dessas coordenadas nos permitiu reescrever o hamiltoniano atômico (10.7.1)
nas novas coordenadas como a soma
HNatom
e
atom
= Hcm + HNrele ,
atom
em que Hcm é dado pela Eq.(10.7.2) e HNrele é dado pela Eq.(10.7.3). Isto implica que existem
três termos para a energia cinética: a energia cinética do centro-de-massa, com a massa
total; a energia cinética dos elétrons, com massas reduzidas dependendo da massa nuclear; e
finalmente uma correção na ordem de 1/M, conhecida como termo de Hughes-Eckart. Como
é obviamente limitado em relação ao segundo termo, nada impede que este termo seja tratado
como uma perturbação analítica. Além disso, como o termo Hughes-Eckart não é compacto
em relação a H0 , uma pergunta razoável é se ele influencia o espectro essencial. Vimos que,
sem esse termo, o espectro essencial de HNe começa no ponto mais baixo do espectro de
HNe −1 . Isso é fisicamente razoável e é interpretado como o limiar da ionização. Expressos de
maneira diferente, provamos que, sem o termo de ordem de 1/M, o inf σess (H0 + VNe ) =
inf σ(H0 + VNe −1 ), em que VNe −1 é o potencial desprezando-se o último elétron. Mas esse
estado de coisas não deve ser afetado pela presença dos termos de Hughes-Eckart. De fato,
a compacidade dos termos individuais não é destruída por uma perturbação relativamente
limitada. Nosso objetivo agora é mostrar porque os termos de Hughes-Eckart não afetam o
Teorema HVZ. Reproduziremos nesta seção a prova de B. Simon, publicada no artigo “On the
Infinitude or Finiteness of the Number of Bound States of an N-Body Quantum System, I.,” Helv.
Phys. Acta 43 (1970) 607.
Primeiro, resumimos como os termos de Hughes-Eckart surgem. Sejam (r1 , r2 , . . . , rn ) as

coordenadas do as coordenadas de um conjunto de n-partículas em relação a um referencial
42
Considerando a função trial Ψ(x, y) = π −1 a−3 c3 e−c(∥x∥+∥y∥)/a, em que a = #2 /(me e2 ). Aqui, considera-
se me em vez de µ pois o núcleo é tomado como tendo massa infinita. Veja os detalhes no texto de N. Zettili
“Quantum Mechanics Concepts and Applications,” Second Edition, John Wiley and Sons, Ltd., Publication, 2009,
pg.559.
739
inercial e mj , j = 1, . . . , n, suas massas. Em geral, consideramos a energia cinética

n
<
T = (2m−1 2
j )Pj .
j=1
Vamos introduzir o sistema de coordenadas do centro-de-massa e relativas Rcm e η1 , . . . , ηn−1 :

n
< n
<
−1
Rcm = M mj rj , coordenadas do centro-de-massa, com M = mj ,
j=1 j=1
ηj = rj − rn , coordenadas relativas a rn .
De
n−1
< n−1
< n−1
<
mj ηj = mj rj − mj rn = MRcm − Mrn ,
j=1 j=1 j=1
obtemos que
n−1
< n−1
<
−1
rn = Rcm − M mj ηj e rj = Rcm + ηj − M −1 mj ηj .
j=1 j=1
Vamos definir
n−1
<
ξ= M −1 mj ηj
j=1
e escrever T em termos das velocidades

n−1
< n−1
<
2T = mj ṙj2 ˙ 2+
+ mn ṙn = mn (Ṙcm − ξ) ˙2
mj (η̇j + Ṙcm − ξ)
j=1 j=1
n−1
<
= 2
M Ṙcm + mj η̇j2 − M ξ˙2 .
j=1
Seja Pj o momento conjugado a ηj , isto é, Pj = ∂T /∂ η̇j e Pcm o momento conjugado a

˙ η̇j = M −1 mj , segue que
Rcm . Uma vez que ∂ ξ/∂
∂ ξ˙
Pcm = M Ṙcm e Pj = mj η̇j − M ξ˙ ˙ .
= mj (η̇j − ξ)
∂ η̇j
Logo, η̇j = m−1 ˙

j Pj + ξ. Em particular,
n−1
< n−1
< n−1
<
. /
ξ˙ = M −1
mj η̇j = M −1
mj m−1 ˙
j Pj + ξ =⇒ ξ˙ = m−1
n Pj ,
j=1 j=1 j=1
740
em que M ′ = M − Ne me . Portanto, segue que

n−1
( n−1
)2 ( n−1
)2
< < <
2T = M −1 P2cm + mj m−1 j Pj + mn
−1
Pk − M m−1
n Pj .
j=1 k=1 j=1
Finalmente, desenvolvendo a equação acima, a energia cinética nas coordenadas do centro-

de-massa e relativas assume a seguinte forma:
n−1
< <
T = (2M)−1 P2cm + (2µj )−1 P2j + (2mn )−1 Pj Pk ,
j=1 j̸=k#n−1
em que µ−1 = m−1 −1

j + mn . Os termos cruzados j ↔ k foram originalmente descobertos por
Hughes e Eckart e são conhecidos como Hughes-Eckart, polarização de massa ou termos de
massa específica.
Vamos retornar ao nosso objetivo de tornar explícita a afirmação feita anteriormente de

que os termos de Hughes-Eckart não influenciam no resultado estabelecido pelo Teorema HVZ.
Vamos considerar o átomo do hélio. Se o núcleo tem massa M e a massa reduzida do elétron
é µ = me M/(M + me ), o hamiltoniano do átomo do hélio hamiltoniano com centro-de-massa
removido e coordenadas relativas ao núcleo é:
Ze2 Ze2 e2
HHe − Hcm = (2µ)−1(p21 + p22 ) + M −1 p1 · p2 − − + . (10.8.1)
∥x1 ∥ ∥x2 ∥ ∥x2 − x1 ∥
O Teorema HVZ nos diz explicitamente que obtemos o limite do contínuo dividindo {1, 2, 3}
em aglomerados e considerando a energia do estado fundamental dos hamiltonianos com os
potenciais dos interclusters descartados. Da análise feita anteriormente, vimos que para o
4
átomo do hélio os canais-2 e 3 terão ΣC2 começando com a energia − 2µe #2
. Portanto, o
hamiltoniano (10.8.1) tem espectro contínuo começando na energia do estado fundamental do
operador hidrogenóide,
Ze2
HHe+ = (2µ)−1p2 − .
∥x∥
Assim, o continuum para o HHe começa na parte inferior do espectro de
2
N He+ = (2µ)−1(p21 + p22 ) + M −1 p1 · p2 − Ze
H (contando o termo de Hughes-Eckart) .
∥x1 ∥
Dessa forma, precisamos mostrar que inf σ(H N He+ ) = inf σ(HHe+ ). Na superfície, uma vez que
descartamos os potenciais dos interclusters, mas não dos interclusters dos termos de Hughes-
Eckart, não está claro que essa igualdade deva ser mantida. Seja P o momento do centro-
de-massa, me a massa do elétron, K o momento do núcleo e kj o j-ésimo elétron. Sejam
x0 , x1 , x2 as posições do núcleo e dos dois elétrons, respectivamente. Então,
N He+ + (2M + 4µ)P 2 = H
H ^ He+ ,
B CD E
Hcm
741
em que
^ He+ = (2me )−1 (k 2 + k 2 ) + (2M)−1 k 2 − 2e2 ∥x1 − x0 ∥2 .
H 1 2 0
N He+ envolvem coordenadas independentes, então,

Uma vez que P e H
^ He+ ) = inf σ(H
inf σ(H N He+ ) + inf σ(Hcm ) = inf σ(H
N He+ ) .
Além disso, como k22 e H^ He+ − (2me )−1 k 2 = H ′ + também envolvem coordenadas indepen-
2 He
dentes, segue que
. /
^ He+ ) = inf σ(H ′ + ) + inf σ (2me )−1 k22 = inf σ(H ′ + ) .
inf σ(H He He
′ −1
Finalmente, dado que HHe + = HHe+ + (2me + 2M) (k1 + K)2 , temos que inf σ(HHe
′
+) =
N
inf σ(HHe+ ). Logo, inf σ(HHe+ ) = inf σ(HHe+ ), como desejávamos provar.
10.9 Estabilidade da Matéria

“Why doesn’t the collection of negatively charged electrons and positively charged nuclei, which are the basic
constituents of the theory, implode into a minuscule mass of amorphous matter thousands of times denser than the
material normally seen in our world? ”
E.H. Lieb and R. Seiringer
em “The Stability of Matter in Quantum Mechanics”
O valor esperado da energia em um estado Ψ é E(Ψ) = ⟨Ψ, HΨ⟩ e podemos perguntar

sobre sua faixa de valores. Obviamente, E(Ψ) pode ser arbitrariamente grande e positivo,
mas pode ser arbitrariamente negativo? A resposta no caso clássico é sim! Por exemplo,
de acordo com a mecânica clássica, o átomo do hidrogênio é modelado pelo hamiltoniano
H(p, x) = p2 − Z∥x∥−1 , com (p, x) ∈ R6 , em que Z é a carga do núcleo. Claramente, se nós
fixarmos o momento do elétron como sendo p0 e deixarmos x aproximar da origem (estamos
assumindo que o núcleo está na origem), então a energia do sistema pode ser arbitrariamente
negativa. Em outras palavras, o átomo de hidrogênio seria instável: o elétron orbitando o
núcleo irradiaria energia continuamente e colapsaria sobre o núcleo (veja a representação dessa
situação na Figura 10.16).
Órbita
Núcleo
Elétron
Figura 10.16: De acordo com a Física Clássica, uma partícula carregada que orbita em torno de
um centro deve continuamente perder energia e seguir uma órbita espiral que a transporta ao
núcleo.
742
Desta forma, deveria ocorrer uma aniquilação completa do átomo do hidrogênio.43 Mas este
é um resultado da mecânica clássica que não corresponde à realidade. O hidrogênio é um dos
elementos mais abundantes no universo e é um fato observacional que este é estável. Então, o
que está errado? Quem responde é a mecânica quântica. Assim, imediatamente surge a questão:
como a mecânica quântica define limites inferiores para a energia dos elétrons nos átomos? Ou
seja, se
! " #
2
λ0 = inf E(Ψ) | |Ψ(x)| dx = 1 , (10.9.1)
Rn
é finito, qual é o seu valor? Observe que se o ínfimo for um mínimo (ou seja, λ0 = EΨ0 para
alguma função Ψ0 , então λ0 é o valor mais baixo da energia que o sistema pode atingir e,
portanto, é chamado de energia do estado fundamental. Neste caso, a função Ψ0 é chamada
de estado fundamental. O mínimo não é atingido se houver muitos elétrons em um átomo
(veja o Capítulo 12, do livro de E.H. Lieb and R. Seiringer, “The Stability of Matter in Quantum
Mechanics,” Cambridge University Press, 2010.). A finitude de λ0 é referida como estabilidade
de primeiro tipo. Por outro lado, quando a finitude de λ0 é limitada pelo número de partículas
nos referimos a ela como estabilidade do segundo tipo. Essa última noção é mais complicada
e está relacionada à energia de sistemas macroscópicos. Os átomos ou moléculas individuais
são sistemas relativamente pequenos, com alguns graus de liberdade. A matéria macroscópica,
entretanto, consiste em uma enorme quantidade de átomos, ou seja, é formada por um número
macroscópico de núcleos e elétrons.
A estabilidade do primeiro tipo decorre de um princípio de incerteza. De maneira ge-

ral, o princípio da incerteza diz que não se pode tornar a energia potencial muito negativa
sem também tornar a energia cinética muito grande. Em discussões elementares do assunto,
costuma-se dizer que a desigualdade matemática que garante esse fato é o princípio da incerteza
de Heisenberg. Mais especificamente, para Ψ ∈ H1 (Rn ) e ∥Ψ∥22 = ⟨Ψ, Ψ⟩ = 1,
n2
⟨Ψ, p2 Ψ⟩ ! ⟨Ψ, x2 Ψ⟩−1 , (10.9.2)
4
ou (assumindo que ! = 2m = 1),
n2 n2
⟨Ψ, −∇2 Ψ⟩ ! ⟨Ψ, x2 Ψ⟩−1 =⇒ ∥∇Ψ∥22 ∥xΨ∥22 ! ,
4 4
isto é
$" % $" %
2 2 2 n2
|∇Ψ(x)| dx x |Ψ(x)| dx ! .
Rn Rn 4
Esta formulação do príncípio da incerteza é a original e mais conhecida; ela nos diz que se
o estado Ψ está localizado em torno da origem, o lado direito da desigualdade (10.9.2) tende
ao infinito, implicando um momentum grande. No entanto, como salientado por E.H. Lieb e R.
43
Com efeito, essa interpretação se baseava na invenção do radiotransmissor por Heinrich Hertz em 1887, funda-
mentada na Teoria Eletromagnética Clássica de Maxwell, dentro do qual elétrons são “agitados” e, como resultado,
ondas eletromagnéticas são emitidas. Portanto, não havia dúvidas quanto à teoria de cargas em movimento e a
emissão de energia. O que deixava os físicos desconcertados era explicar como os elétrons conseguiam manter a
órbita ao redor do núcleo.
743
Seiringer, no livro “The Stability of Matter in Quantum Mechanics,” Cambridge University Press,
2010, página 2, a desigualdade (10.9.2), infelizmente, não é suficiente para provar a estabilidade
do átomo do tipo hidrogênico. Ela permite apenas dar uma explicação heurística do poder da
mecânica quântica para se entender o não-colapso do átomo. Com efeito, o valor esperado
⟨Ψ, x2 Ψ⟩ é uma medida pobre para se avaliar o quão localizado é um estado, pois é possível
tornar esse valor muito grande sem alterar muito a energia cinética. Para vermos isto, considere,
por exemplo, o estado
√
Ψy (x) = 1 − ε2 Ψ1 (x) + εΨ2 (x − y) ,
com ε ∈ !(0, 1), Ψ1 , Ψ2 ∈ C0∞ (B(0; 1)), normalizadas em L2 (Rn ), e ∥y∥ > 2. Então,
∥Ψy ∥2 = Rn |Ψy |2 = 1. Com efeito,
√ √
∥Ψy ∥2 = (1 − ε2 )∥Ψ1 ∥2 + ε 1 − ε2 ⟨Ψ1 , Ψ2 ⟩ + ε 1 − ε2 ⟨Ψ2 , Ψ1 ⟩ + ε2 ∥Ψ2 ∥2 .
" # "
Agora, observe que o supp Ψ#1 = x ∈ Rn | ∥x∥ < 1 , enquanto que o supp Ψ2 = x ∈ Rn |
∥x − y∥ < 1, com ∥y∥ > 2 . Portanto, a interseção entre essas duas funções é o conjunto
vazio. Logo, ⟨Ψ1 , Ψ2 ⟩ = ⟨Ψ2 , Ψ1 ⟩ = 0. Como ∥Ψ1 ∥2 = ∥Ψ2 ∥2 = 1, segue que ∥Ψy ∥2 = 1.
Além disso, imediatamente, temos que
$ $ $
2 2 2 2 2 2
dx x |Ψy (x)| = (1 − ε ) dx x |Ψ1 (x)| + ε dx (y + x)2 |Ψ2 (x)|2
Rn B(0;1) B(0;1)
! (1 − ε2 ) + ε2 (∥y∥ + 1)2 .
Isto implica que
$
dx x2 |Ψy (x)|2 " ε2 (∥y∥ + 1)2 " ε2 (∥y∥ − 1)2 ,
Rn
enquanto que
$ $ $
2 2 2 2
dx |∇Ψy (x)| = (1 − ε ) dx |∇Ψ1 (x)| + ε dx |∇Ψ2 (x)|2 .
Rn B(0;1) B(0;1)
Dessa forma, tomando simultaneamente ε ≪ 1 e ∥y∥ ≫ ε−1 , segue que ∥y∥ → ∞, e

⟨Ψ, x2 Ψ⟩ → ∞. Assim, o lado direito de (10.9.2) vai para zero quando ∥y∥ → ∞, enquanto o
lado esquerdo permanece essencialmente o mesmo.
Uma maneira mais útil de quantificar as propriedades de localização de Ψ em torno de

algum ponto (a origem, digamos) é por meio da desigualdade de Hardy, que discutiremos a
seguir. O principal ponto dessa desigualdade é que ela serve como um princípio de incerteza
refinado, ou seja, essa desigualdade limita efetivamente a norma do gradiente de uma função
inferiormente em termos da norma da função.
Para provar a estabilidade do átomo do hidrogênio utilizaremos o seguinte

TEOREMA 10.29 (Versão refinada do princípio da incerteza). Em L2 (R3 ), vale a desigualdade
operatorial
1
−∇2 " ,
4∥x∥2
em que, ∇2 é o laplaciano em R3 .
744
Demonstração. Queremos provar que

O , - P
1
Ψ, −∇2 − Ψ "0,
4∥x∥2
para Ψ ∈ Dom(−∇2 ), em que Dom(−∇2 ) é um domínio denso. Podemos tomar como

domínio denso o conjunto C0∞ (R3 ). A desigualdade acima pode ser reescrita da seguinte forma:
$ $
2 1
− dx Ψ(x)∇ Ψ(x) " dx ∥x∥−2 |Ψ(x)|2 ,
R 3 4 R 3
ou, depois de uma integração por partes, como

$ $
2 1
dx |∇Ψ(x)| " dx ∥x∥−2 |Ψ(x)|2 . (10.9.3)
R3 4 R3
Para provar a desigualdade (10.9.3), e assim o teorema, precisaremos do seguinte

LEMA 10.11 (Desigualdade de Hardy). Para n " 3, qualquer Ψ ∈ C0∞ (Rn ) satisfaz a estimativa
O P
2 (n − 2)2 1
⟨Ψ, p Ψ⟩ " Ψ, 2 Ψ . (10.9.4)
4 x
ou,
O P ? ?
(n − 2)2 1 (n − 2)2 ? 1 ?2
2
⟨Ψ, −∇ Ψ⟩ " Ψ, 2 Ψ =⇒ ∥∇Ψ∥22 " ? Ψ? ,
4 x 4 ? x2 ?
2
isto é,
$ $
(n − 2)2
2 1
dx |∇Ψ(x)| " dx |Ψ(x)|2 . (10.9.5)
Rn 4 Rn x2
Demonstração. Introduzindo as coordenadas esféricas (r, ω) em Rn , temos que

$ $ $ ∞ n, -2 o
∂Ψ 1
dx |∇Ψ(x)|2 = dω dr r n−1 + 2 |∇ω Ψ|2
Rn S n−1 0 ∂r r
$ $ ∞ , -2
n−1 ∂Ψ
" dω dr r . (10.9.6)
S n−1 0 ∂r
Em seguida, vamos dar uma olhada na parte radial na expressão (10.9.6). Observe que
, -
∂ n−2 2 n−3 2 n−2 ∂Ψ
(r Ψ ) = (n − 2)r Ψ + 2r Ψ .
∂r ∂r
Então, integrando a equação acima de 0 até ∞, obtemos:
$ ∞ $ ∞ $ ∞ , -
∂ n−2 2 n−3 2 n−2 ∂Ψ
dr (r Ψ ) = (n − 2) dr r Ψ + 2 dr r Ψ . (10.9.7)
0 ∂r 0 0 ∂r
745
Lembremos que, em geral, como Ψ ∈ C0∞ (Rn ) e r n−2 é uma função diferenciável, cujo suporte
não é necessariamente limitado, então, r n−2 Ψ ∈ C0∞ (Rn ) e o suporte de r n−2Ψ está contido
na interseção dos suportes de r n−2 e Ψ. Assim, a integral do lado esquerdo na Eq.(10.9.7) é
zero. Portanto, em módulo, temos que
5$ ∞ 5 5$ ∞ , -5
5 5 2 5 ∂Ψ 5
5 dr r Ψ 55 =
n−3 2 5 n−2
dr r Ψ 5 . (10.9.8)
5 5
(n − 2) 0 ∂r 5
0
Note que o lado direito da Eq.(10.9.8) pode ser reescrito da seguinte forma:
5$ ∞ , -5 5$ ∞ , -5
2 5 ∂Ψ 5 2 5 ∂Ψ 5
5 n−2
dr r Ψ 5= 5 dr r (2n−4)/2
Ψ 5
(n − 2) 05 ∂r 5 (n − 2) 05 ∂r 5
5$ ∞ , -5
2 5 ∂Ψ 5
= 5 dr r (n−1)/2
r (n−3)/2
Ψ 5 .
(n − 2) 5 0 ∂r 5
Assim, usando a desigualdade de Cauchy-Schwarz-Bunjakowski para integrais na Eq.(10.9.8),
obtemos que
$ ∞ $ ∞ 5 , -5
n−3 2 2 5
(n−1)/2 (n−3)/2 5 ∂Ψ 55
dr r |Ψ| = dr r r 5Ψ ∂r 5
0 (n − 2) 0
,$ -1/2 ($ 5, -52 )1/2
2 ∞ ∞ 5 ∂Ψ 5
# dr r n−3|Ψ|2 dr r n−1 55 5 .
(n − 2) 0 0 ∂r 5
Portanto, segue que

$ $ 5, -5
(n − 2)2 ∞ ∞
n−1 5
5 ∂Ψ 52
dr r n−3 2
|Ψ| # dr r 5 (10.9.9)
4 5 ∂r 5 .
0 0
O uso de (10.9.9) em (10.9.6) conclui a prova do lema.
No lema acima, a constante (n − 2)2 /4 na Eq.(10.9.4) é a melhor possível para toda função
Ψ ∈ C0∞ (Rn ), com a igualdade acontecendo se, e somente se, Ψ = 0. Observe que a
desigualdade de Hardy é muito semelhante à desigualdade de Heisenberg, com uma diferença
importante: no lado direito, tem-se o valor esperado do inverso de x2 em vez do inverso do
valor esperado de x2 .
A desigualdade de Heisenberg é uma consequência da desigualdade de Hardy em L2 (Rn ),

mas com uma constante menor. De fato, pela desigualdade de Cauchy-Schwarz-Bunjakowski,
segue que
,$ -2 ,$ - ,$ -
2 2 2 1 2
dx |Ψ(x)| # dx x |Ψ(x)| dx 2 |Ψ(x)| (check isto) .
Rn Rn Rn x
d
Assim, se Rn dx |Ψ(x)|2 = 1 e n " 3, a combinação da desigualdade acima com a desigual-
dade de Hardy produz
,$ - ,$ -
2 2 2 (n − 2)2
dx |∇Ψ(x)| dx x |Ψ(x)| " .
Rn Rn 4
746
Nota 10.32. A desigualdade de Hardy foi provada pela primeira vez pelo famoso matemático
britânico Godfrey Harold Hardy no artigo “Note on a Theorem of Hilbert,” Math. Z. 6 (1920)
314.44 De uma forma um pouco diferente, a desigualdade de Hardy estabelece que qualquer
Ψ ∈ C0∞ (R), com Ψ(0) = 0, satisfaz
$ ∞ $
′ 2 1 ∞
dx |Ψ (x)| " dx x−2 |Ψ(x)|2 .
−∞ 4 −∞
É importante enfatizar que a situação é diferente em duas dimensões; dado qualquer potencial
não-trivial V (x) " 0, nenhuma estimativa da forma
$ $
2
dx |∇Ψ(x)| " dx V (x)|Ψ(x)|2 ,
R2 R2
pode acontecer para qualquer Ψ ∈ C0∞ (R2 ). Isso se deve ao fato do laplaciano em duas
dimensões ser um operador crítico, o que significa que subtrair qualquer potencial não-negativo
criará imediatamente um espectro negativo (veja, por exemplo, o caso discutido na Subseção
10.6).
Retornando à demonstração do Teorema 10.29. Fica claro a partir da desigualdade de Hardy

que a desigualdade (10.9.3) é satisfeita tomando-se n = 3 na desigualdade (10.9.5).
TEOREMA 10.30 (Estabilidade do átomo do hidrogênio). Seja
#2 2 e2
H1atom = − ∇ − ,
2µ ∥x∥
o hamiltoniano associado ao átomo do hidrogênio no espaço L2 (R3 ), em que µ e −e são,

respectivamente,
H a massa reduzida do sistema elétron-próton e a carga do elétron, e ∥x∥ =
x + y + z . Então, H1atom " −2µe4 #−2 .
2 2 2
Demonstração. Assuma que

# $ %
2
λ0 = inf E(Ψ) | Ψ " 0, dx |Ψ(x)| = 1 , (10.9.10)
R3
em que $ , -
#2 e2
E(Ψ) = ⟨Ψ, H1atom Ψ⟩ = dx |∇Ψ(x)|2 − |Ψ(x)|2 .
R3 2µ ∥x∥
Então, usando-se a versão refinada do Princípio da Incerteza obtemos
#2 e2
H1atom " − .
8µ∥x∥2 ∥x∥
Isto implica que o lado direito da desigualdade acima atinge seu mínimo quando ∥x∥−1 =
4µ2 #−2 e assim H1atom " −2µe4 #−2 . Logo, a energia do átomo do hidrogênio é limitada
inferiormente; ela estará sempre acima de −2µe4 #−2 . Consequentemente, o elétron não colapsa
sobre o núcleo e, portanto, o átomo do hidrogênio é estável!
44
Hardy foi tutor de outro famoso matemático, o indiano Srinivasa Ramanujan.
747
De acordo com o Teorema 10.30, a energia do estado fundamental do átomo do hidrogê-

nio deve ser, necessariamente, maior ou igual a −2µe4 #−2 . Compare este resultado com a
Eq.(10.7.13), que mostra que, para n = 1, o valor da energia fundamental do átomo do hidrogê-
nio é −2−1 µe4 #−2 , que por sua vez está acima do mínimo encontrado no Teorema 10.30, isto
é, −2µe4 #−2 < −2−1 µe4 #−2 .
Vamos, agora, discutir brevemente como estender o argumento acima para um átomo qual-
quer, considerando por simplicidade o núcleo de carga Z > 0 fixo na origem. O operador
Schrödinger deste sistema é dado por
<Ne , - < Ne <Ne

#2 2 e2 Z e2
HNatom = − ∇x α − + ,
e
α=1
2µ ∥xα ∥ α=1 α<β
∥xα − xβ ∥
agindo em L2 (R3Ne ). Para um átomo neutro, Z = Ne . O problema de minimização associado

com o operador HNatom
e
é agora
# $ %
2
λNe = inf ENe (Ψ) | Ψ " 0, dx1 · · · dxNe |ΨNe (x1 , . . . , xNe )| = 1 .
R3Ne
A estabilidade do primeiro tipo para o sistema descrito pelo operador HNatom

e
não é muito difícil
de provar. Com efeito, ignore, por um momento, que os elétrons são férmions e observe que
o potencial de interação elétron-elétron é positivo. Portanto, simplesmente omita as partes
repulsivas positivas. Por sua vez, as partes atrativas podem ser estudadas para um elétron de
cada vez. Isto nos leva ao seguinte limite inferior para o HNatom
e
:
<Ne , -
#2 2 e2 Z
HNatom " − ∇x α − .
e
α=1
2µ ∥xα ∥
Usando, para cada termo da direita da desigualdade acima, o limite inferior H1atom " −2µe4 #−2 ,
com e2 substituído por e2 Z, obtemos
2µe4 Z 2
HNatom " −Ne .
e
#2
Esse limite funciona, mas é bastante grosseiro: ignoramos que os elétrons são férmions, além
da repulsão elétron-elétron. Os detalhes de como levar em consideração esses fatos podem ser
encontrados no livro de E.H. Lieb e R. Seiringer, “The Stability of Matter in Quantum Mechanics,”
Cambridge University Press, 2010.
10.10 Quantos Elétrons um Núcleo Atômico Pode Ligar?

Considere um átomo com carga nuclear Z. Átomos neutros com um número de elétrons
iguais a Z formam sistemas estáveis. Uma questão fundamental, aparentemente não relacionada
à estabilidade da matéria, é saber o número máximo de elétrons que uma determinada carga
nuclear Z pode se ligar para formar um sistema estável. Dados experimentais mostram que a
afinidade eletrônica é positiva para a maioria dos elementos.45 A afinidade eletrônica mede a
45
Na Wikipedia, https://en.wikipedia.org/wiki/Electron_affinity_(data_page) [Online: accessed 01-June-2017], o leitor
pode encontrar um grande número de dados sobre isto.
748
diferença de energia entre o estado inicial e final no processo de “adição” de um elétron a um

átomo para formar um íon carregado negativamente. Parece que a maioria dos núcleos pode
realmente se ligar a um número de elétrons Ne = Z + 1 ou Ne = Z + 2, mas não existem
íons negativos mais altos. Provar esse fato, rigorosamente, para o operador de Schrödinger
(10.7.1) é um problema de longa data na física-matemática, chamado de conjectura de ionização.
Nesta seção, vamos apresentar dois resultados fundamentais relacionados com a conjectura de
ionização, um para a existência (Teorema de Zhislin) e outro para a não-existência (Teorema de
Lieb).
Como antes, partimos com o modelo atômico assumindo que o núcleo de carga Z > 0 está
fixo na origem e “circundado” por uma quantidade Ne de elétrons não-relativísticos interagindo
entre si e com o próprio núcleo por meio de uma interação de Coulomb. Este modelo é descrito
pelo operador de Schrödinger atômico46
< Ne , - < Ne <Ne
atom 2 Z 1
H Ne = −∇xα − + .
α=1
∥xα ∥ α=1 α<β
∥xα − xβ ∥
Neste ponto é importante destacar que a questão do espaço de estados para sistemas de
muitas partículas é realmente mais sutil do que o que apareceu até agora. Diferentemente da
física clássica, partículas idênticas são indistinguíveis na física quântica. Para tornar isso mais
preciso, precisamos levar em consideração o spin das partículas. No caso que temos Ne -elétrons
de spin s = 1/2, o operador HNatom e
atua em funções da forma
ΨNe (x1 , s1 , . . . , xNe , sNe ) ∈ L2 (R3 , C2 )⊗Ne ≡ L2 (R3Ne , C2Ne ) , (10.10.1)
com s1 = · · · = sNe = 1/2, em que o termo no meio é o produto tensorial de Ne espaços de
Hilbert L2 (R3 , C2 ), definido como o espaço de Hilbert gerado pelos produtos de elementos de
bases ortonormais em cada L2 (R3 , C2 ).
A indistinguibilidade dos elétrons significa que todas as distribuições de probabilidade que

podem ser extraídas de uma função-de-onda de Ne -elétrons (10.10.1) devem ser simétricas
em relação às permutações das coordenadas e spins dos elétrons. Como para estados liga-
dos podemos nos restringir a funções-de-onda reais, isso é equivalente à propriedade que
ΨNe (x1 , s1 , . . . , xNe , sNe ) seja invariante sob tais permutações, modulo uma mudança de si-
nal.47 Em particular, o espaço de estado para os elétrons de spin 1/2 é composto por funções-
de-onda de quadrado integrável nas 3Ne variáveis, totalmente anti-simétricas, para as quais
46
Para simplificar um pouco as coisas, estamos adotando as unidades atômicas, isto é, # = 2µ = e = 1.
47
Lembramos que todas as partículas elementares (e compostas) são divididas em dois grupos, as partículas
com spin semi-inteiro, que são chamadas de férmions (por exemplo, além dos elétrons, prótons e nêutrons
têm spin 1/2) e as partículas com spin inteiro, denominadas bósons (partículas relacionadas com as interações).
Para os bósons, as funções-de-onda Ψ(x1 , s1 , . . . , xN , sN ) devem ser simétricas em relação às permutações
das coordenadas e spins, enquanto que para os férmions, devem ser anti-simétricas. Em resumo, para o espaço
bosônico L2 (Rn , C2s+1 )⊗s N
Ψ(x1 , s1 , . . . , xα , sα , . . . , xβ , sβ , . . . , xN , sN ) = Ψ(x1 , s1 , . . . , xβ , sβ , . . . , xα , sα , . . . , xN , sN ) ,
enquanto que para o espaço fermiônico L2 (Rn , C2s+1 )⊗a N
Ψ(x1 , s1 , . . . , xα , sα , . . . , xβ , sβ , . . . , xN , sN ) = −Ψ(x1 , s1 , . . . , xβ , sβ , . . . , xα , sα , . . . , xN , sN ) .
749
temos
ΨNe (x1 , . . . , xNe ) = sgn(π)ΨNe (xπ(1) , . . . , xπ(Ne ) ) , (10.10.2)
para qualquer permutação π dos Ne índices, isto é, π : (1, . . . , Ne ) → (π(1), . . . , π(Ne )),
refletindo a natureza anti-simétrica dos elétrons relacionados ao princípio de exclusão de Pauli.
Observe que, em (10.10.2) estamos desprezando o spin dos elétrons, uma vez que o operador
HNatom não atua nas variáveis de spin (que, no entanto, pode ser facilmente incluído, permitindo
e
t e t
que HNe atue em N
atom
1 L2 (R
3Ne
, C2Ne ), em que o símbolo representa o produto tensorial
anti-simétrico). Entretanto, chamamos a atenção para o fato que, o que realmente é necessário
na prova para a ionização máxima é a simetria do quadrado absoluto das funções-de-onda, ou
seja,
|ΨNe (x1 , . . . , xNe )|2 = |ΨNe (xπ(1) , . . . , xπ(Ne ) )|2 , (10.10.3)
o que também ocorre no caso bosônico quando a Eq.(10.10.2) é satisfeita sem levar em conta
o sinal da permutação. A prova, portanto, é válida tanto para férmions quanto para bósons!
Lembre-se que, |ΨNe (x1 , . . . , xNe )|2 é a densidade de probabilidade para encontrar a partícula
1 em x1 , a partícula 2 em x2 , etc. Essa interpretação faz sentido em vista da condição
$
2
∥ΨNe ∥ = dx1 , . . . , dxNe |ΨNe (x1 , . . . , xNe )|2 = 1 .
R3Ne
A partir do Teorema de Kato, sabemos que o operador de Schrödinger atômico é essenci-

almente auto-adjunto em C0∞ (R3Ne ) e limitado inferiormente, isto é, sua energia no estado
fundamental
λNe = inf σ(HNatom
e
),
é finita. Além disso, a partir do Teorema HVZ, sabemos que
σess (HNatom
e
) = [λNe −1 , ∞) ,
em que λNe −1 é a energia do estado fundamental do HNatom

e −1
(mas, com a mesma carga nuclear
atom
Z). Consequentemente, HNe tem um estado fundamental se tivermos a desigualdade estrita
de ligação λNe < λNe −1 . Em princípio, quando λNe = λNe −1 , HNatom e
ainda pode ter um
estado fundamental (embora o estado fundamental seja muito instável, pois uma partícula pode
escapar para o infinito sem perder energia).
Foi mostrado por Zhislin48 que a desigualdade estrita de ligação ocorre pelo menos se
Ne < Z + 1, como mostra o seguinte
TEOREMA 10.31 (Teorema da existência de Zhislin). Seja HNatom e
o operador de Schrödinger
3Ne 49
atômico com a carga nuclear fixa na origem e atuando em L2 (R ). Para qualquer 1 # Ne <
Z + 1, temos a desigualdade estrita de ligação λNe < λNe −1 . Consequentemente, o hamiltoniano
HNatom
e
tem um estado fundamental.
48
G. Zhislin, “Discussion of the Spectrum of Schrödinger Operator for System of Many Particles,” Trudy. Mosk.
Mat. Obs. 9 (1960) 81.
49
As modificações necessárias para se levar em conta a estatística das partículas podem ser encontradas no
livro de S.J. Gustafson e I.M. Sigal, “Mathematical Concepts of Quantum Mechanics,” Seção 10.2, Second Edition,
Springer, 2011.
750
Demonstração. Nós provaremos que λNe < λNe −1 por indução. Tome Ne = 1; este é o caso
do átomo do hidrogênio
Z
H1atom = −∇2 − .
∥x∥
Sabemos que inf σ(H1atom ) = λ1 = −1/2 (veja a Eq.(10.7.13)). Logo, λ1 < λ0 = 0. A seguir,
suponha que tenhamos provado que λNe −1 < λNe −2 para algum Ne < Z. Agora, mostraremos
que λNe < λNe −1 . Pelo princípio variacional, precisamos encontrar uma função-de-onda ΨNe
tal que
⟨ΨNe , HNatom
e
ΨNe ⟩ < λNe −1 .
A partir da hipótese de indução que λNe −1 < λNe −2 e do Teorema HVZ, sabemos que HNatom
e −1
possui um estado fundamental ΨNe −1 ∈ L2 (R3(Ne −1) ). Tome uma função suave Φ : R3 → R
com supp Φ ⊂ {x ∈ R3 | 1 < |x| < 2} e ∥Φ∥L2 (R3 ) = 1. Para R ∈ N, definimos
1 6x7
ΦR (x) = 3/2 Φ .
R R
Logo, as funções acima são ortonormais e têm suportes disjuntos, isto é,
! "
supp ΦR ⊂ x ∈ R3 | R < |x| < 2R , ∥ΦR ∥L2 (R3 ) = 1 .
Assim, as funções trial ΨNe ,R ∈ L2 (R3Ne ) definidas por ΨNe ,R = ΨNe −1 ⊗ ΦR , isto é,
ΨNe ,R (x1 , . . . , xNe ) = ΨNe −1 (x1 , . . . , xNe −1 )ΦR (xNe ) ,
satisfazem a condição de ortonormalidade, ou seja, ⟨ΨNe ,R1 , HNatom e

ΨNe ,R2 ⟩ = 0, para R1 ̸= R2 ,
e
∥ΨNe ,R ∥L2 (R3Ne ) = ∥ΨNe −1 ∥L2 (R3(Ne −1) ) ∥ΦR ∥L2 (R3 ) = 1 .
Resta mostrar que ⟨ΨNe ,R , HNatom
e
ΨNe ,R ⟩ < λNe −1 .
Da mesma forma que fizemos na prova do Teorema HVZ, decompomos

, - N
< e −1
Z 1
HNatom = HNatom
e −1
+ −∇2xNe − + .
e
∥xNe ∥ α=1
∥xα − xNe ∥
Portanto,
$
|ΦR (xNe )|2
⟨ΨNe ,R , HNatom ΨNe ,R ⟩ = λNe −1 + ∥∇ΦR ∥2L2 (R3 ) −Z dxNe
e
R3 ∥xNe ∥
N
< e −1 $
|ΨNe −1 (x1 , . . . , xNe −1 )|2 |ΦR (xNe )|2
+ dx1 · · · dxNe .
α=1 R3Ne ∥xα − xNe ∥
Pela escolha de ΦR , temos

1
∥∇ΦR ∥2L2 (R3 ) = 2
∥∇Φ∥2L2 (R3 ) ,
R
e $ $
|ΦR (xNe )|2 Z |Φ(xNe )|2
−Z dxNe =− dxNe .
R3 ∥xNe ∥ R R3 ∥xNe ∥
751
Além disso, uma vez que |ΦR (xNe )|2 é a densidade de probabilidade de se encontrar o Ne -
elétron em xNe , podemos, de acordo com a unidades adotadas, interpretar
N
< e −1 $
|ΦR (xNe )|2
V (x1 , . . . , xNe −1 ) = dxNe , (10.10.4)
α=1 R3 ∥xα − xNe ∥
como o potencial em xα , com α = 1, . . . , Ne − 1, devido à distribuição de carga do Ne -elétron

e, consequentemente,
$
dx1 · · · dxNe −1 |ΨNe −1 (x1 , . . . , xNe −1 )|2 V (x1 , . . . , xNe −1 ) ,
R3Ne
é a energia eletrostática de interação dos (Ne − 1)-elétrons com esse potencial. Podemos avaliar
a integral em (10.10.4) usando o Teorema de Newton que estabelece que fora de uma distribuição
de carga que é esfericamente simétrica em torno de um ponto (que pode ser tomado como sendo
a origem), o potencial coulombiano se comporta como se toda a carga estivesse concentrada
nesse ponto. Com efeito, assuma que ΦR é radial50
$ $ ∞ $
|ΦR (xNe )|2 2 |ΦR (rNe ω)|2
dxNe = drNe rN dω .
R3 ∥xα − xNe ∥ 0
e
s2 ∥xα − rNe ω∥
Vamos isolar o único termo que depende dos ângulos entre xα e xNe , isto é,
1 1
= 2 2
,
∥xα − xNe ∥ (rα + rNe − 2rα rNe cos θ)1/2
em que rα = ∥xα ∥, rNe = ∥xNe ∥ e θ é o ângulo entre xα e xNe . Devido à invariância

rotacional, podemos prosseguir escolhendo a direção rα como o eixo dos z, isto é, podemos
assumir que (0, 0, rα) = xα ∈ R3 . Logo, obtemos, da mesma forma que fizemos para o cálculo
do valor mais baixo λ do espectro dos átomos tipo hélio, que
$ 2π $ 1 # %
1 1 1
dϕ d(cos θ) 2
= 2π min , .
0 −1 (rα2 + rN e
− 2rα rNe cos θ)1/2 ∥xα ∥ ∥xNe ∥
Dessa forma, de acordo com o Teorema de Newton, temos que

$ $
|ΦR (xNe )|2 |ΦR (xNe )|2
dxNe = dxNe
R3 ∥xα − xNe ∥ R3 max{∥xα ∥, ∥xNe ∥}
$ $
1 2 |ΦR (xNe )|2
= dxNe |ΦR (xNe )| + dxNe
∥xα ∥ ∥xNe ∥#∥xα ∥ ∥xNe ∥>∥xα ∥ ∥xNe ∥
$
|ΦR (xNe )|2
# dxNe ,
R3 ∥xNe ∥
50
Não existe perda de generalidade em assumirmos isto, já que ΨNe ,R = ΨNe −1 ⊗ ΦR é uma função trial.
752
o que implica que

N
! e −1 "
1
dx1 · · · dxNe |ΨNe−1 (x1 , . . . , xNe −1 )|2 |ΦR (xNe )|2
α=1 R3Ne ∥xα − xNe ∥
N
! e −1 " #" $
2 |ΦR (xNe )|2
= dx1 · · · dxNe −1 |ΨNe −1 (x1 , . . . , xNe −1 )| dxNe
α=1 R3(Ne −1) R3 ∥xα − xNe ∥
N
! e −1 " # " $
2 1 |Φ(xNe )|2
! dx1 · · · dxNe −1 |ΨNe −1 (x1 , . . . , xNe −1 )| dxNe
α=1 R3(Ne −1) R R3 ∥xNe ∥
# $"
Ne − 1 |Φ(xNe )|2
= dxNe .
R R3 ∥xNe ∥
Em resumo, obtemos que
# $"
1 Ne − 1 − Z |Φ(xNe )|2
⟨ΨNe ,R , HNatom ΨNe ,R ⟩ ! λNe −1 + 2 ∥∇Φ∥2L2 (R3 ) + dxNe .
e
R R R3 ∥xNe ∥
O fato de termos assumido que Φ é suave e de suporte compacto implica que Φ ∈ C0∞ (R3 ) ⊂
S (R3 ) ⊂ L2 (R3 ). E mais, pelo Exemplo 6.28, a função 1/∥xNe ∥ define uma distribuição em
S ′ (R3 ). Portanto, a última integral acima é bem comportada do ponto de vista distribucional.
Dessa forma, sob a condição que Z < Ne − 1, ou seja, que Ne − 1 − Z < 0, segue que para
R > 0 suficientemente grande, temos
# $"
1 2 Ne − 1 − Z |Φ(xNe )|2
∥∇Φ∥ 3
L2 (R ) + dxNe →0,
R2 R R3 ∥xNe ∥
o que implica a desigualdade estrita de ligação
λNe ! ⟨ΨNe ,R , HNatom

e
ΨNe ,R ⟩ < λNe −1 .
Consequentemente, o hamiltoniano HNatom

e
tem um estado fundamental. Isto conclui a prova do
Teorema de Zhislin.
Depois do aparecimento do resultado de Zhislin, houve um grande progresso sobre a questão

relacionada com o número máximo Nemax de elétrons para o qual a condição da desigualdade
estrita de ligação λNe < λNe −1 é satisfeita. Um dos resultados mais celebrados foi obtido por
Lieb, conhecido como Limite da Máxima Ionização.51 Ele provou que Nemax < 2Z + 1 para
todo Z > 0. É este resultado que apresentaremos a seguir.
TEOREMA 10.32 (Teorema de não-existência de Lieb). Se Ne " 2Z + 1, o hamiltoniano
HNatom
e
não possui um estado fundamental.
Demonstração. Suponha que HNatom

e
tenha um estado fundamental ΨNe . Então, HNatom
e
satisfaz
a equação de Schrödinger
HNatom
e
Ψ Ne = λ Ne Ψ Ne .
51
E.H. Lieb, “Bound on the Maximum Negative Ionization of Atoms and Molecules,” Phys. Rev. A 29 (1984) 3018.
753
Multiplicando a equação acima por ∥xNe ∥ΨNe (em que xNe é o vetor posição do Ne -ésimo
elétron) e integrando, obtemos
0 = ⟨∥xNe ∥ΨNe , (HNatom

e
− λNe )ΨNe ⟩
I n , - N
o J
< e −1
Z 1
= ∥xNe ∥ΨNe , HNatom
e −1
− λ Ne + −∇2xNe − + Ψ Ne .
∥xNe ∥ α=1
∥xα − xNe ∥
Observe que
⟨∥xNe ∥ΨNe , (HNatom
e −1
− λNe )ΨNe ⟩ " 0 .
Com efeito, pelo Teorema HVZ, para um sistema com (Ne − 1)-partículas, segue que HNatom
e −1
"
λNe −1 " λNe . A seguir, defina
ΦNe (xNe ) = ∥xNe ∥ΨNe (xNe ) .
Logo,
O , -P
ΦNe
⟨∥xNe ∥ΨNe , −∇2xNe ΨNe ⟩ = ΦNe , −∇2xNe
∥xNe ∥
O , -P
1 1
= ∇ΦNe , ΦNe ∇ + ∇ΦNe
∥xNe ∥ ∥xNe ∥
O P O P
1 1
= ∇ΦNe , ΦNe ∇ + ∇ΦNe , ∇ΦNe . (10.10.5)
∥xNe ∥ ∥xNe ∥
Note que, como ⟨∥xNe ∥ΨNe , −∇2xNe ΨNe ⟩ é um número real, o primeiro termo na soma acima
pode ser escrito da seguinte forma:
O P O P O P
1 1 1 1 1
∇ΦNe , ΦNe ∇ = ∇ΦNe , ΦNe ∇ + ∇ΦNe , ΦNe ∇
∥xNe ∥ 2 ∥xNe ∥ 2 ∥xNe ∥
O P O P
1 1 1 1
= ∇ΦNe , ΦNe ∇ + ΦNe ∇ , ∇ΦNe .
2 ∥xNe ∥ 2 ∥xNe ∥
Assim, segue que
O P $
1 1 . /
∇ΦNe , ΦNe ∇ = dxNe ∇ΦNe (xNe )ΦNe (xNe ) + ΦNe (xNe )∇ΦNe (xNe )
∥xNe ∥ 2 R3Ne
1
×∇
∥xNe ∥
$
1 . / 1
= dxNe ∇ ΦNe (xNe )ΦNe (xNe ) ∇
2 R3Ne ∥xNe ∥
$
1 1
=− dx |ΦNe (xNe )|2 ∇2xNe
2 R3Ne ∥xNe ∥
$
= 2π dxNe |ΦNe (xNe )|2 δ(xNe ) .
R3Ne
754
Na última passagem usamos o fato, já provado no Teorema 6.35, que ∇2xNe (1/∥xNe ∥) =
−4πδ(xNe ) no sentido distribucional. Como ΨNe ∈ L2 (R3Ne ), temos que ΦNe (0) = 0 e,
portanto, o primeiro termo da soma na Eq.(10.10.5) desaparece. Por sua vez, para o segundo
termo da soma temos
O P $
1 1
∇ΦNe , ∇ΦNe = dxNe |∇ΦNe (xNe )|2 " 0 .
∥xNe ∥ R 3Ne ∥x N e ∥
Consequentemente, podemos concluir que ⟨∥xNe ∥ΨNe , −∇2xNe ΨNe ⟩ " 0. Dessa forma, segue
que
0 = ⟨∥xNe ∥ΨNe , (HNatom
e
− λNe )ΨNe ⟩
I n , - N
o J
< e −1
Z 1
= ∥xNe ∥ΨNe , HNatom
e −1
− λNe + −∇2xNe − + Ψ Ne
∥xNe ∥ α=1
∥xα − xNe ∥
I n , - N
o J
< e −1
Z 1
" ∥xNe ∥ΨNe , λNe −1 − λNe + −∇2xNe − + Ψ Ne
∥xNe ∥ α=1
∥xα − xNe ∥
I n N
o J
< e −1
Z 1
> ∥xNe ∥ΨNe , − + Ψ Ne .
∥xNe ∥ α=1
∥xα − xN e ∥
Assim, a condição que

I n N
o J
< e −1
Z 1
0> ∥xNe ∥ΨNe , − + Ψ Ne
∥xNe ∥ α=1
∥xα − xNe ∥
$ (N −1 )
<e
∥xNe ∥
= −Z + dx |ΨNe (x1 , . . . , xNe )|2 ,
R3Ne α=1
∥xα − xNe ∥
implica que devemos ter

$ (N −1 )
<e
∥xNe ∥
Z> dx |ΨNe (x1 , . . . , xNe )|2 .
R3Ne α=1
∥xα − xNe ∥
Para finalizar, vamos levar em conta a simetria (10.10.3).52 Com efeito, tome Ne = 2, então,
observe que por causa da simetria do quadrado absoluto da função-de-onda
∥x2 ∥ 1 ∥x2 ∥ 6 7
|Ψ2 (x1 , x2 )|2 = |Ψ2 (x1 , x2 )|2 + |Ψ2 (x2 , x1 )|2 .
∥x1 − x2 ∥ 2 ∥x1 − x2 ∥
Troque x1 por x2 no segundo termo a direita. Logo, segue que
, -
∥x2 ∥ 2 1 ∥x2 ∥ 2 ∥x1 ∥ 2
|Ψ2 (x1 , x2 )| = |Ψ2 (x1 , x2 )| + |Ψ2 (x1 , x2 )|
∥x1 − x2 ∥ 2 ∥x1 − x2 ∥ ∥x2 − x1 ∥
, -
1 ∥x1 ∥ + ∥x2 ∥ 2
= |Ψ2 (x1 , x2 )| .
2 ∥x1 − x2 ∥
52
E também a simetria de ∥xα − xβ ∥!
755
Agora, tome Ne = 3, então, por causa da simetria do quadrado absoluto da função-de-onda
1 < ∥x3 ∥ 6
2
< 2
∥x3 ∥ 2
|Ψ3 (x1 , x2 , x3 )| = |Ψ3 (x1 , x2 , x3 )|2 + |Ψ3 (x1 , x3 , x2 )|2
α=1
∥xα − x3 ∥ 3 α=1 ∥xα − x3 ∥
7
+ |Ψ3 (x3 , x2 , x1 )|2 .
Como no caso anterior, trocando x3 por x2 no segundo termo, x3 por x1 no terceiro termo e
abrindo o somatório, obtemos
2
< , -
∥x3 ∥ 1 ∥x1 ∥ + ∥x2 ∥ ∥x1 ∥ + ∥x3 ∥ ∥x2 ∥ + ∥x3 ∥
|Ψ3 (x1 , x2 , x3 )|2 = + +
α=1
∥xα − x3 ∥ 3 ∥x1 − x2 ∥ ∥x1 − x3 ∥ ∥x2 − x3 ∥
× |Ψ3 (x1 , x2 , x3 )|2 .
Portanto, procedendo de acordo com os dois casos analisados acima, no caso de Ne -elétrons,
por causa da simetria (10.10.3), nós temos uma invariância ao trocar xNe com qualquer outra
variável xβ , com β ̸= α. Dessa forma, podemos reescrever a soma
N
< e −1 Ne Ne
∥xNe ∥ 2 1 < < ∥xα ∥ + ∥xβ ∥
|ΨNe (x1 , . . . , xNe )| = |ΨNe (x1 , . . . , xNe )|2 .
α=1
∥xα − xNe ∥ Ne α=1 β=1,β̸=α ∥xα − xβ ∥
Além disso, usando a desigualdade triangular ∥xα ∥ + ∥xβ ∥ " ∥xα − xβ ∥, o que implica que
∥xα ∥ + ∥xβ ∥
"1,
∥xα − xβ ∥
e o fato de a soma a direita conter Ne (Ne − 1)/2 termos, obtemos

$ ( Ne Ne
)
1 < < ∥xα ∥ + ∥xβ ∥ Ne − 1
Z> dx |ΨNe (x1 , . . . , xNe )|2 " .
R3Ne Ne α=1 β=1,β̸=α ∥xα − xβ ∥ 2
Como essa desigualdade é estrita em R3Ne , obtemos a desigualdade estrita desejada, isto é,
Nemax < 2Z + 1.
Nota 10.33 (Fatos importantes relacionados com o Teorema de Lieb). (i) Para Z = 1 (átomo
de hidrogênio), o Teorema de Lieb implica que o íon negativo H −− (um sistema de um próton
e três elétrons) não existe, enquanto se sabe (matematicamente) que H − existe. (ii) Para Z
maior, o fator 2 no limite de Lieb não é optimum. De fato, por um longo tempo, o Teorema
de Lieb era o resultado rigoroso mais conhecido, sem o uso de modelos de aproximação (como
a teoria de Thomas-Fermi ou Hartree-Fock), mas, em um artigo publicado em 2012, P.T. Nam
melhorou o limite superior de Lieb para Z " 6, mostrando que Nemax # 1, 22Z + 3Z 1/3 .53
(iii) Quando Z → ∞, a inexistência de estados fundamentais fermiônicos é conhecida quando
Ne " (1 + ε)Z, para qualquer ε > 0. Isto é chamado neutralidade assintótica, provada
pela primeira vez por Lieb-Sigal-Simon-Thirring.54 (iv) A inexistência de estados fundamentais
53
P.T. Nam, “New Bounds on the Maximum Ionization of Atoms,” Commun. Math. Phys. 312 (2012) 427.
54
E.H. Lieb, I.M. Sigal, B. Simon e W. Thirring, “Asymptotic Neutrality of Large-Z Ions,” Phys. Rev. Lett. 52
(1984) 994.
756
fermiônicos quando Ne " Z + C para uma constante universal C (possivelmente C = 2)

permanece um problema em aberto. (v) Quando o HNatom e
atua no espaço bosônico, existe
um estado fundamental até Ne ∼ 1, 21Z. Isso foi provado por Benguria e Lieb.55 Isto é uma
evidência de que a estatística de partículas altera drasticamente as propriedades espectrais do
sistema quântico.
55
R. Benguria e E.H. Lieb, “Proof of the Stability of Highly Negative Ions in the Absence of the Pauli Principle,”
Phys. Rev. Lett. 50 (1983) 1771.
757
Apêndice 10A: O Princípio de Birman-Schwinger

M. Sh. Birman, no artigo “The spectrum of singular boundary problems,” Math. Sb. 55
(1971) 124 e J. Schwinger, no artigo “On the bound states of a given potential,” Proc. Nat. Acad.
Sci. U. S.A. 47 (1961) 122, descobriram independentemente que as auto-funções do operador
−∇2 + V ,56 com auto-valores negativos E = −λ < 0, estão relacionadas com as auto-funções
de um operador compacto, no caso em que V não é positivo, isto é, quando V # 0. Com
efeito, o Princípio de Birman-Schwinger conta ou no mínimo estima o número de estados
ligados do operador −∇2 + V . Como vimos, este princípio foi usado de uma forma ou de outra
para derivar a Desigualdade Cwikel-Lieb-Rozenbljum e também pode ser usado para derivar as
Desigualdades de Lieb-Thirring (veja o Apêndice 10B).
A partir de agora vamos considerar apenas a parte negativa de V , como definimos na Nota
10.12, na pg.671. Para V− " 0, suponha que V− ∈ Ln/2 (Rn ) + L∞ (Rn )ε , se n " 3, em que
ε indica que para qualquer ε > 0 podemos decompor V− = V1 + V2 , com V1 ∈ Ln/2 (Rn )
e V2 ∈ L∞ (Rn ), tal que ∥V2 ∥∞ < ε. Em outras palavras, o potencial V− é Lloc n
n/2 (R ) e
desaparece no infinito, isto é, existem constantes R e ε tais que
$
dx |V1 (x)|n/2 < ∞ e ∥V2 ∥∞ = sup |V (x)| < ε (com |x| > R) .
|x|#R x∈Rn
Nota 10.34. A condição que n " 3 ao assumirmos que V− ∈ Ln/2 (Rn ) + L∞ (Rn )ε segue
diretamente do
TEOREMA 10.33 (Desigualdade de Hardy-Littlewood-Sobolev). Assuma que 1 < p, r < ∞ e
que 0 < α < n, tal que 1/p + α/n + 1/r = 2. Sejam Ψ ∈ Lp (Rn ) e Φ ∈ Lr (Rn ). Então,
existe uma constante C(n, α, p, r), independente de Ψ e Φ, tal que
$ $
|Ψ(x)||Φ(y)|
dydx # C(n, α, p, r)∥Ψ∥p∥Φ∥r . (10A.1)
Rn Rn ∥x − y∥α
A melhor constante C(n, α, p, r) satisfaz
n, -α/n , -α/n o
n 6 ωn−1 7α/n 1 α α
C(n, α, p, r) # + ,
n−α n pr n(1 − 1/p) n(1 − 1/r)
em que ωn−1 é a área da esfera unitária S n−1 em Rn . Se p = r = 2n/(2n − α), então,

F G−1+α/n
α/2 Γ(n/2 − α/2) Γ(n/2)
C(n, α, p, r) = C(n, α, p) = π .
Γ(n − α/2) Γ(n)
Neste caso, existe igualdade em (10A.1) se, e somente se, Φ = (const.)Ψ e
Ψ(x) = A(β 2 + ∥x − a∥2 )−(2n−α)/2 ,
para algum A ∈ C, 0 ̸= β ∈ R e a ∈ Rn .
A prova deste teorema pode ser encontrada no livro do E.H. Lieb e M. Loss, “Analysis,”
Second Edition, American Mathematical Society, Providence, 2001.
56
Outra vez, estamos ignorando as constantes físicas, isto é, estamos assumindo que # = 2m = 1.
758
Retornando ao Princípio de Birman-Schwinger, tome a equação de auto-valor
(−∇2 − V− )Ψ(x) = −λΨ(x) ,

1/2
em que Ψ ∈ H1 (Rn ) e λ > 0. Defina Φ = V− Ψ. Então, Φ ∈ L2 (Rn ) pela hipótese sobre
V− e, claramente, Φ ̸= 0. Com efeito, para mostrar que Φ ∈ L2 (Rn ) se Ψ ∈ H1 (Rn ) é uma
auto-função de −∇2 − V− com auto-valor −λ, considere a expressão
$
2 1/2 2 1/2
∥Φ∥2 = ∥V− Ψ∥2 = dx |V− (x)Ψ(x)|2
Rn
$ $
1/2 1/2
# dx |V1 (x)Ψ(x)|2 + dx |V2 (x)Ψ(x)|2 .
Rn Rn
A seguir, vamos tratar separadamente as integrais do lado direito da desigualdade acima. De

acordo com a desigualdade de Hölder com expoentes conjugados p = n e q = 2n/(n − 2),
segue que
$
1/2 2 1/2 1/2
∥V1 Ψ∥2 = dx |V1 (x)Ψ(x)|2 # ∥V1 ∥2n ∥Ψ∥2q = ∥V1 ∥n/2 ∥Ψ∥2q .
Rn
Agora, pela desigualdade de Poincaré-Sobolev (considerando o caso quando Ω = Rn , veja a

Nota 10.15) sabemos que ∥Ψ∥2q # C(n, 2)∥∇Ψ∥22 , com q = 2n/(n − 2). Portanto, temos que
1/2
∥V1 Ψ∥22 # C(n, 2)∥V1 ∥n/2 ∥∇Ψ∥22 ,
com a constante C(n, 2) sendo dada pelo seu melhor valor através da Eq.(10.3.11). Da mesma
forma, aplicando a desigualdade de Hölder na segunda integral, segue que
$ $
1/2 2 1/2 2
∥V2 Ψ∥2 = dx |V2 (x)Ψ(x)| # dx |V2(x)Ψ(x)|2 # ∥V2 ∥2∞ ∥Ψ∥22 < ε2 ∥Ψ∥22 .
Rn Rn
Isto mostra que

1/2
∥Φ∥22 = ∥V− Ψ∥22 # C(n, 2)∥V1 ∥n/2 ∥∇Ψ∥22 + ε2 ∥Ψ∥22 < ∞ .
Assim, Φ ∈ L2 (Rn ). Por conseguinte, nossa equação de auto-valor implica que (−∇2 +λ1I)Ψ =
1/2
V− Ψ = V− Φ. Uma vez que −λ está no conjunto resolvente do operador −∇2 (lembre que
pelo Teorema 10.3 temos que σ(−∇2 ) = [0, ∞)), podemos inverter (−∇2 + λ1I) para obter
1/2
Ψ = (−∇2 + λ1I)−1 V− Φ, ou equivalente, Φ = Kλ Φ, com o operador integral Kλ definido
por
$ = >
1/2 1/2
Kλ Φ(x) = dy V− (−∇2 + λ1I)−1 V− (x, y)Φ(y) . (10A.2)
Rn
Desta expressão, definimos o operador

1/2 1/2
Kλ (x, y) = V− (x)G(x − y; λ)V− (y) , (10A.3)
em que G(x − y; λ) é o kernel integral (ou função de Green) para o inverso do operador
positivo (−∇2 + λ1I)−1 . Assim, a maioria das propriedades do operador Kλ (x, y) são quase
759
consequências imediatas das correspondentes propriedades de G(x − y; λ). O operador integral

Kλ é chamado operador kernel de Birman-Schwinger. Dessa forma, a equação Φ = Kλ Φ
1/2
indica que 1 é um auto-valor de Kλ , tendo Φ = V− Ψ como auto-função. Isto implica
que, Kλ mapeia L2 (Rn ) em L2 (Rn ); ou seja, Φ é uma auto-função L2 (Rn ) de um operador
L2 (Rn ) → L2 (Rn ). Assim, de acordo com a Definição 10.3, o operador kernel de Birman-
Schwinger é um operador integral do tipo de Hilbert-Schmidt e para todo elemento Φ ∈ L2 (Rn ),
segue que
,$ $ -1/2
2
∥Kλ ∥2 # dxdy |Kλ (x, y)| .
Rn Rn
Isto mostra que o operador Kλ é um operador limitado em L2 (Rn ). Mais do que isso, Kλ é
de fato compacto pelo Teorema 10.9.
Reciprocamente, se Φ ∈ L2 (Rn ) é uma auto-função de Kλ com auto-valor 1, definindo

1/2
Ψ = (−∇2 + λ1I)−1 V− Φ, então,
1/2 1/2 1/2
(−∇2 + λ1I)Ψ = V− Φ = V− Kλ Φ = V− (−∇2 + λ1I)−1 V− Φ = V− Ψ .
O fato de que Ψ ∈ L2 (Rn ) segue da desigualdade operatorial (−∇2 + λ1I)−2 # λ−1 (−∇2 +
λ1I)−1 , que pode ser verificada através da representação de Fourier. Logo,
1/2 1/2
∥Ψ∥22 = ⟨Ψ, Ψ⟩ = ⟨(−∇2 + λ1I)−1 V− Φ, (−∇2 + λ1I)−1 V− Φ⟩
1/2 1/2
= ⟨V− Φ, (−∇2 + λ1I)−2 V− Φ⟩
1/2 1/2
# λ−1 ⟨V− Φ, (−∇2 + λ1I)−1 V− Φ⟩
1/2 1/2
= λ−1 ⟨Φ, V− (−∇2 + λ1I)−1 V− Φ⟩
= λ−1 ⟨Φ, Kλ Φ⟩ = λ−1 ⟨Φ, Φ⟩ = λ−1 ∥Φ∥22 .

1/2
Além disso, Ψ ̸= 0, caso contrário V− Φ seria zero e, portanto, Kλ Φ = 0. Esta correspondên-
cia um-para-um entre Ψ e Φ implica que as multiplicidades do auto-valor −λ de −∇2 − V−
e o auto-valor 1 de Kλ são iguais.
Existem outras observações importantes sobre (10A.2) e (10A.3). Primeiro, é bem conhecido
que a função de Green G(x − y; λ) é dada pela transformada de Fourier inversa
$
1 1
G(x − y; λ) = n
dk 2
e−ik(x−y)
(2π) Rn ∥k∥ + λ
$
1 1 1 ′ ′ ′
= (2−n)/2 n
dk ′ ′ 2
e−ik (x −y ) , (forma mais conveniente)
λ (2π) Rn ∥k ∥ + 1
′
√ ′ ′
√
em que
√ k = k/ λ
√ 2 e (x − y ) = λ(x − y). Pela Proposição 6.9 (com α = 2), a função
^ −1
G(k/ λ) = (∥k/ λ∥ + 1) pode ser representada pela integral
√ $ ∞ √ 2
^
G(k/ λ) = dδ e−δ(1+∥k/ λ∥ ) .
0
760
√
Isto implica que a função de Green G(x − y; λ) = λ−(2−n)/2 G( λ(x − y)) tem a seguinte
representação integral:
$ ∞
1 1 λ 2
G(x − y; λ) = (2−n)/2 n n/2 dδ δ −n/2 e−δ e− 4δ ∥x−y∥ , (10A.4)
λ 2 π 0
sinalizando que Kλ → 0, quando λ → ∞. Portanto, para todo λ suficientemente negativo,

todos os auto-valores de Kλ são menores que 1. Ainda, a derivada da função G(x − y; λ) é
negativa; isto indica que
∂Kλ (x − y)
<0, ∀λ > 0 .
∂λ
E mais, se λ < λ′ , então, Kλ − Kλ′ < 0. De fato, pela Primeira Identidade do Resolvente (veja
a Proposição 5.5), segue que
= >
1/2 1/2
Kλ (x, y) − Kλ′ (x, y) = V− (−∇2 + λ1I)−1 − (−∇2 + λ′ 1I)−1 V−
= >
′ 1/2 2 −1 2 ′ −1 1/2
= (λ − λ ) V− (−∇ + λ1I) (−∇ + λ 1I) V− <0,
e pelo Princípio Min-Max µℓ (λ) # µℓ (λ′ ), em que µℓ (λ) é um auto-valor não-negativo de

Kλ . Como resultado, todos os auto-valores µℓ (λ) de Kλ crescem de forma monótona com λ.
Eles também são facilmente vistos como contínuos. Logo, se µℓ (λj ) = 1 para algum λj > 0,
então, µℓ (0) > µℓ (λj ) = 1. Da mesma forma, se µℓ (0) > 1, então, existe um λj > 0 tal
que µℓ (λj ) = 1. Em outras palavras, existe uma correspondência de um-para-um entre os
auto-valores µℓ (0) de K0 que são maiores que 1, e os pontos λj para os quais algum auto-valor
µℓ (λ) cruza 1 (veja a Figura 10.17).
Figura 10.17: Os auto-valores µ0 # µ1 # · · · de Kλ são esquematicamente mostrados como

uma função de λ. Apenas os cinco primeiros são mostrados aqui. Os auto-valores do operador
−∇2 −V− são Ej = −λj e λj são os valores de λ para os quais µℓ = 1. Note a correspondência
de um-para-um entre os auto-valores µℓ (0) de K0 que são maiores que 1, e os pontos λj para
os quais algum auto-valor µℓ (λ) cruza 1, representada pelos pontos no gráfico.
761
Pelo Princípio
! Min-Max, podemos definir
" os auto-valores
! de Kλ da maneira óbvia, definindo
"
µ1 (λ) = sup ⟨Φ, Kλ Φ⟩ | ∥Φ∥2 = 1 , µ2 (λ) = sup ⟨Φ, Kλ Φ⟩ | ∥Φ∥2 = 1, ⟨Φ, Φ1 ⟩ = 0 ,
etc. Todos esses supremos são alcançados e satisfazem, para ℓ = 1, 2, . . ., Kλ Φℓ = µℓ Φℓ .
Reciprocamente, uma solução L2 (Rn ) para esta equação corresponde a um dos auto-valores
listados. Podemos escolher os auto-vetores como ortonormais.
O gráfico na Figura 10.17 leva-nos imediatamente à seguinte conclusão: para cada número
λ > 0 podemos definir
N(λ; (−∇2 + V )) = número de auto-valores de −∇2 + V menor ou igual a −λ ,
incluindo a multiplicidade, como de costume.57 Também podemos definir
N(µ(λ) = 1; Kλ ) = número de auto-valores de Kλ igual a 1 .
N(µ(0) > 1; K0 ) = número de auto-valores de K0 maior ou igual a 1 .
Então, segue que N(λ; (−∇2 + V )) = N(µ(λ) = 1; Kλ) = N(µ(0) > 1; K0 ).
O seguinte resultado resume a discussão acima sobre o kernel de Birman-Schwinger.
TEOREMA 10.34 (Princípio de Birman-Schwinger). O número −λ < 0 é um auto-valor da

forma quadrática
$ $ $
2 2
dx |∇Ψ| − dx V− |Ψ| , com dx |Ψ|2 = 1 ,
Rn Rn Rn
se, e somente se, 1 é um auto-valor do operador compacto de Birman-Schwinger Kλ . Se for esse

o caso, eles têm a mesma multiplicidade. Os auto-valores do operador de Birman-Schwinger são
funções monótonas crescentes de λ. Além disso, existe uma correspondência de um-para-um entre
os dois conjuntos de auto-funções
3 4 3 4
1 n 2 n
Ψ ∈ H (R ) | (−∇ + V )Ψ = −λΨ e Φ ∈ L2 (R ) | Kλ Φ = Φ ,
√ √
via Φ = V− Ψ e Ψ = (−∇2 + λ1I)−1 V− Φ, em que V− " 0 é a parte negativa de V que é
puramente atrativa.
Vamos finalizar este apêndice com a
Demonstração√do Teorema 10.12. Primeiro, vamos escrever a função de Green G(x − y; λ) =

λ−(2−n)/2 G( λ(x − y)) com o auxílio da Eq.(6.11.2), tomando α = 2; ou seja,
1 1 √ √ 2−n
G(x − y; λ) = (2−n)/2 n/2 n/2
K n−2 ( λ∥x − y∥) ( λ∥x − y∥) 2 ,
λ 2 π 2
57
Lembre-se de que a multiplicidade de um aut-ovalor é o número de auto-vetores linearmente independentes
correspondentes a esse auto-valor.
762
em que K n−α é a função de Bessel modificada do terceiro tipo. Para n = 3, segue que
2
λ1/2 √ 1 1
G(x − y; λ) = K 1( λ∥x − y∥) .
23/2 π 3/2 2 λ1/4 ∥x − y∥1/2
De acordo com a tabela de integrais de I.S. Gradshteyn e I.M. Ryzhik, “Table of Integrals, Series,
√ Seventh Edition, Elsevier (Academic Press), 2007, fórmula 8.469, 3., pg.925, a
and Products,”
função K 1 ( λ∥x − y∥) tem a seguinte representação:
2
√ π 1/2 1 1 √
− λ∥x−y∥
K 1 ( λ∥x − y∥) = 1/2 1/4 e .
2 2 λ ∥x − y∥1/2
Logo,
1 1 √
G(x − y; λ) = e− λ∥x−y∥ . (10A.5)
4π ∥x − y∥
A seguir, observe que, se tomarmos n = 3 e α = 2 no Teorema 10.33, segue que se

um potencial V ∈ L3/2 (R3 ), então, V ∈ R, em que R é a classe de potenciais de Rollnik
discutida brevemente na Nota 10.6, pg.642. De fato, temos que ∥V ∥R # C(3, 2, 3/2)∥V ∥3/2 .
Em particular, isto implica que V− ∈ L3/2 (R3 ) + L∞ (R3 )ε ⊂ R + L∞ (R3 )ε .
Como terceiro e último passo, levamos em conta o fato estabelecido pelo Teorema 10.34 que
<
N(λ; (−∇2 + V )) = 1
µℓ (λj ) = 1 a.v. Kλ
<
# µ2ℓ (0)
µℓ (0) a.v. K0
<
= ∥K0 Φℓ ∥22
µℓ (0) a.v. K0
$ $
# dxdy |K0 (x, y)|2 (pelo Teorema 10.9) .
R3 R3
Aqui, a soma dos auto-valores de Kλ levou em consideração suas multiplicidades. Consequen-

temente, temos
$ $ , -2 $ $
2 1 V− (x)V− (y)
dxdy |K0 (x, y)| = dxdy .
R3 R3 4π R3 R3 ∥x − y∥2
Assim, nós obtemos para a classe de potenciais de Rollnik que

, -2 $ $
2 1 V− (x)V− (y)
N(λ; (−∇ + V )) # dxdy .
4π R3 R3 ∥x − y∥2
como desejado.
763
Nota 10.35. Na prova do Teorema 10.34, enquanto o operador (−∇2 +λ1I)−1 em três dimensões
tem o Kernel integral dado pela função de Green (10A.5), que converge quando λ → 0 para
x ̸= y, o que implica que uma estimativa para N(λ; (−∇2 + V )) pode ser obtida ao final
tomando λ → 0, o mesmo não funciona
√ em duas dimensões, pois neste caso o Kernel integral
2 −1
de (−∇ + λ1I) contém ln(− λ∥x − y∥) que diverge quando λ → 0.
Exemplo 10.6. Com este exemplo, abordamos a questão de saber se o operador de Schrödinger
−∇2 + V tem um número finito (incluindo possivelmente o valor 0) ou infinito de auto-valores
negativos. Suponha que V (x) = −C∥x∥−α para alguma constante C. Invocando a Proposição
10.7, sabemos que se α < 2 e C > 0, então, o operador −∇2 + V tem um número infinito
de estados ligados. A prova da finitude do espectro discreto para α > 2 segue diretamente do
Teorema 10.12, isto é, sob nossa hipótese sobre o potencial V , com α > 2,
$ $
V− (x)V− (y)
dxdy <∞,
R3 R3 ∥x − y∥2
de modo que o número de auto-valores negativos do operador −∇2 + V é finito (verifique!).
764
Apêndice 10B: Desigualdades de Lieb-Thirring

As célebres Desigualdades de Lieb-Thirring são uma combinação do princípio da incerteza
e da exclusão, dois dos conceitos mais importantes da mecânica quântica. Uma discussão
sobre essas desigualdades e o papel crucial que elas desempenham em nossa compreensão
da estabilidade da matéria é o assunto do excepcional livro de E.H. Lieb e R. Seiringer, “The
Stability of Matter in Quantum Mechanics,” Cambridge University Press, 2010. Neste apêndice
vamos apresentar a prova das Desigualdades de Lieb-Thirring, uma das mais importantes e belas
da física-matemática.
Antes de apresentarmos as desigualdades, vamos discutir sua interpretação “semi-clássica,”

que as tornarão mais transparentes e naturais. De acordo com a famosa lei de Weyl, o
comportamento assintótico dos auto-valores negativos −λ0 # −λ1 # · · · < 0 do operador
hamiltoniano de Schrödinger ∇2 + αV em L2 (Rn ) pode ser determinado pela aproximação
semi-clássica no limite de acoplamento forte α → ∞. Esta prescrição, no espaço de fase
2n-dimensional, pode ser quantificada da seguinte forma:
< $ $
0 1 . /
|λj | ≈ n
dkdx Θ |k|2 − αV− (x) ,
j"0
(2π) Rn Rn
em que Θ(s) = 1 se s " 0 e Θ(s) = 0 se s < 0. Aqui, |λj |0 = 1, mesmo se λj for um

auto-valor zero. A integral acima pode serHfacilmente calculada fazendo primeiro a integração
na variável k sobre a bola em Rn de raio V− (x). Esta integral é bem conhecida sendo igual
n/2
a [π n/2 /Γ(n/2 + 1)]V− (x) (verifique!). Disto concluímos que a aproximação semi-clássica
d n/2
para o número de auto-valores negativos é [(4π)−n/2 /Γ(n/2 + 1)] Rn dx V− (x). Observe
que esta quantidade não;dependeγ de V+ . Podemos ir além e calcular somas −n de potências dos
auto-valores negativos, j"0 |λj | , para todo γ " 0, integrando a função (2π) ||k|2 + V (x)|γ
sobre o subconjunto do espaço de fase em que |k|2 + V (x) < 0. Faz-ze a integração na variável
k primeiro e encontra-se a aproximação semi-clássica
< $ $ 7γ
γ
.
|λj | ≈ dkdx |k|2 − αV− (x)
j"0 Rn Rn
$
n
classical
= Cγ,n dx V− (x)γ+ 2 , (10B.1)
Rn
em que
classical Γ(γ + 1)
Cγ,n = (4π)−n/2 . / .
Γ γ + 1 + n2
A questão agora é verificar se a Eq.(10B.1) pode ser transformada em desigualdades para

um potencial V arbitrário, assumindo-se apenas a propriedade de que V− esteja no espaço
Lγ+ n2 (Rn ) sem que o limite α → ∞ seja tomado. De fato, as desigualdades de Lieb-Thirring são
estimativas não-assintóticas para os auto-valores de operadores de Schrödinger que concordam
com a aproximação semi-clássica, possivelmente até um fator constante universal. Naturalmente,
classical
podemos esperar que tais desigualdades se mantenham apenas com as constantes Cγ,n no
classical
lado direito substituídas por algumas outras constantes Cγ,n . O fato de Cγ,n ser válido
classical
assintoticamente implica que Cγ,n nunca pode ser menor que Cγ,n .
765
TEOREMA 10.35 (Desigualdades de Lieb-Thirring). Fixe um γ " 0 e assuma que a parte

negativa V− do potencial V satisfaz a condição V− ∈ Lγ+n/2 (Rn ). Suponha que −λ0 # −λ1 #
· · · sejam os auto-valores não positivos, se houver algum, de −∇2 + V em Rn . Então, para n
LT
adequados, definidos abaixo, existe uma constante finita Cγ,n ∈ (0, ∞), que é independente de
V , tal que
< $
n
γ LT
|λj | # Cγ,n dx V− (x)γ+ 2 , (10B.2)
j"0 Rn
dado que
⎧
1
⎨γ " 2 ,
⎪ se n=1,
γ>0, se n=2, (10B.3)
⎪
⎩
γ"0, se n"3,
em que
LT 2γ π n/2 Γ(α − n/2)Γ(γ − α + n/2)

Cγ,n = γα .
(2π)n Γ(γ + 1 + n/2)
Demonstração. As Desigualdades de Lieb-Thirring são baseadas no Princípio de Birman-Schwinger.

Em primeiro lugar, note que para cada número λ, λj > 0 podemos definir
∂N(λ; (−∇2 − V− )) <

= δ(λ − λj ) .
∂λ j"0
Portanto, podemos escrever

< γ <$ ∞ $ ∞
∂N(λ; (−∇2 − V− ))
γ
λj = dλ λ δ(λ − λj ) = dλ λγ
j"0 j"0 0 0 ∂λ
$ ∞
=γ dλ λγ−1 N(λ; (−∇2 − V− )) , (10B.4)
0
que é facilmente verificado realizando uma integração por partes. Neste ponto, antes de avançar-
mos com a prova, vamos abrir um parêntese para lembrar, de forma breve, uma caracterização
mais geral de um operador integral do tipo Hilbert-Schmidt usando a noção do traço de um
operador. Começamos com a
DEFINIÇÃO 10.6. Um operador; linear K definido no espaço de Hilbert separável H é deno-
minado classe traço se a série ℓ ⟨Φℓ , KΦℓ ⟩ converge e tem o mesmo valor em qualquer base
ortonormal {Φℓ }ℓ∈N de H . A soma
<
Tr K = ⟨Φℓ , KΦℓ ⟩ , (10B.5)
ℓ
é chamada o traço de K.
766
Lembremos que a fórmula do traço para matrizes finitas afirma que se A é uma matriz
;n n com autovalores
n × ;n λ1 , . . . , λn , contado de acordo com a multiplicidade, então, Tr A =
j=1 Ajj = j=1 λj . O traço de um operador linear K é uma generalização da noção usual
da soma dos elementos diagonais de uma matriz, mas como somas infinitas estão envolvidas,
nem todo operador tem um traço.
Nota 10.36. Deve-se ressaltar que todo operador linear K em um espaço de Hilbert H n-
dimensional tem um traço; isto é, se {Φ1 , . . . , Φn } e {Φ′1 , . . . , Φ′n } são quaisquer duas bases
ortonormais, a soma em (10B.5) é finita e a mesma em ambas as bases (verifique!). Entretanto,
no caso de dimensão infinita não podemos estabelecer, imediatamente, que a soma em (10B.5)
não depende da base empregada. A razão é que, ao lidar com múltiplas somas infinitas, a troca
da ordem das somas só é legítima se soubermos que a convergência das múltiplas somas é
incondicional. Este é o caso quando K é positivo-definido, ou seja, quando ⟨Φ, KΦ⟩ " 0 para
todo Φ ∈ H .
Desejamos investigar a existência do traço no caso de um operador integral K do tipo

Hilbert-Schmidt. É comum (especialmente nos livros de física) calcular o traço de K usando a
fórmula
$
Tr K = dx K (x, x) , (10B.6)
Rn
o que é heuristicamente uma extensão para o caso de dimensão infinita da definição usual do
traço de uma matriz como a soma de seus elementos diagonais. Todavia, esta fórmula não
segue imediatamente da expressão
$
KΦ(x) = dy K (x, y)Φ(y) . (10B.7)
Rn
Parte do folclore da física para se usar a Eq.(10B.6) como o análogo contínuo da fórmula do
traço para operadores integrais é assumir que |K (x, x)| é integrável, o que não é um fato geral.
Aqui, existe um ponto técnico que deve ser observado. A Eq.(10B.7) não define a função kernel
sobre a diagonal, em que x = y. A razão é que o conjunto de pontos sobre a diagonal em
Rn ×Rn é meramente um conjunto de medida zero.58 Para contornar este problema, exatamente
como no caso de dimensão finita, suponha que {λj }Jj=1 e {Φj }Jj=1 (J finito ou infinito) são os
auto-valores positivos, organizados em ordem de magnitude decrescente λ1 " λ2 " λ3 " · · · ,
e as auto-funções ortonormais, respectivamente, do operador de Hilbert-Schmidt K, com kernel
integral K ∈ L2 (Ω × Ω). Pelo Teorema 10.9, sabemos que o operador K é compacto. Então,
pelo Teorema 5.27, em termos dos auto-valores e das auto-funções ortonormais acima, pode-se
mostrar que o kernel tem a expansão canônica
J
< J
<
K (x, y) = λj Φj (x) ⊗ Φj (y) = λj Φj (x)Φj (y) , (10B.8)
j=1 j=1
58
Medida é uma generalização matemática precisa de comprimento, área e volume. Portanto, neste sentido, um
conjunto de medida zero é aquele com volume zero, quase sem interior. Você pode compreender intuitivamente
que na reta real um intervalo [a, b] tem medida b − a, enquanto, por comparação, um único ponto tem medida
zero, embora o intervalo seja composto de um conjunto de pontos. Um conjunto com medida de Lebesgue zero é
tão pequeno que tem menos medida do que qualquer intervalo. Do ponto de vista da integral de Lebesgue, isso
significa que quando você integra funções, tais conjuntos não contribuem, no sentido de que se você modificar o
domínio de integração por um conjunto de medida zero, a integral permanece inalterada.
767
que converge em L2 (Ω × Ω). É possível fortalecer a convergência de (10B.8) para a convergência

uniforme assumindo-se condições adicionais para K e K , como mostra a seguinte
PROPOSIÇÃO 10.16 (Teorema de Mercer). Suponha que Ω ⊂ Rn seja um domínio limitado
e K seja um operador de Hilbert-Schmidt positivo em L2 (Ω), i.e., ⟨Φ, KΦ⟩ " 0 para todo
Φ ∈ L2 (Ω). Se o kernel integral K (·, ·) é contínuo em Ω × Ω, então, a auto-função Φj é
contínua em Ω se λj > 0, e a série (10B.8) converge uniformemente em conjuntos compactos.
A prova da Proposição 10.16 pode ser encontrada no livro de D. Borthwick, “Spectral Theory:
Basic Concepts and Applications,” Springer, 2020, pg.94.
O seguinte teorema estabelece em que condições a Eq.(10B.6) pode ser considerada o análogo
contínuo da fórmula do traço para operadores integrais.
TEOREMA 10.36. Suponha que Ω ⊂ Rn seja um domínio limitado e K um operador integral
em L2 (Ω) definido por
$
KΦ(x) = dy K (x, y)Φ(y) ,
Ω
em que K (x, y) é uma função contínua em Ω × Ω. Suponha que K (x, y) satisfaz as seguintes
condições:
1. K (x, y) = K (y, x).

2.
$ $
dxdy Φ(x)K (x, y)Φ(y) " 0 , ∀ Φ ∈ L2 (Ω) (condição de Mercer) .
Ω Ω
Em particular, isto implica que K (x, x) " 0.

3. Assuma também que
$
dx K (x, x) < ∞ (condição de Simon) .
Ω
Sejam {λj }Jj=1 e {Φj }Jj=1 os auto-valores positivos e as auto-funções ortonormais de K, respec-
tivamente. Então,
$ <J
Tr K = dx K (x, x) = λj ,
Ω j=1
Demonstração. Sejam {λj }Jj=1 e {Φj }Jj=1 os auto-valores positivos e as auto-funções ortonor-
mais de K, respectivamente. Uma vez que λℓ " 0, o teorema da convergência monótona
implica que
$ ( J ) J J
< < <
2 2
dx λj |Φj (x)| = λj ∥Φj ∥2 = λj .
Ω j=1 j=1 ℓ=1
768
Como K (x, y) é uma função contínua em Ω × Ω, segue se da Proposição 10.16 que

$ J
<
Tr K = dx K (x, x) = λj .
Ω j=1
Assim, os valores singulares do operador integral não-negativo K coincidem com seus auto-
valores.
Nota 10.37. O inverso do Teorema 10.36 não é verdadeiro. De fato, mesmo quando a integral
em (10B.6) é absolutamente convergente, essa fórmula não é suficiente para garantir que K
seja de classe traço. Consequentemente, qualquer tentativa de prova que faça tal suposição
deve ser tratada com extrema cautela. Do lado positivo, no entanto, B. Simon observa em seu
livro “Trace Ideals and Their Application,” Second Edition, Math. Survey sand Monographs 120,
Amer.
d Math. Soc., 2005, que se um operador de classe traço K tem kernel K satisfazendo
Rn
dx K (x, x) < ∞, então estamos “quase certos” (embora às vezes apenas após algum
esforço considerável) de que a fórmula (10B.6) é válida. Claro que esta afirmação, embora tran-
quilizadora, não é uma carta em branco que permite-nos fazer cálculos despreocupadamente!
Voltando à prova do Teorema 10.35, observamos que de acordo com o Princípio de Birman-
Schwinger e o Teorema 10.36
< $
2 α α
N(λ; (−∇ − V )− ) # µℓ (λ) # (Tr Kλ ) = dx Kλα (x, x) .
µℓ a.v. Kλ Rn
Para computar o traço acima, usamos a desiguadade59
(Tr B 1/2 AB 1/2 )α # Tr B α/2 Aα B α/2 .
Portanto, temos
α/2 α/2
N(λ; (−∇2 − V− )) # Tr V− Gα V−
$
= dx V−α (x)Gα (0; λ) (10B.9)
Rn
, $ -$
1 1
= dk dx V−α (x) .
(2π)n Rn (∥k∥ + λ)α
2
Rn
Usando $ $ ∞
2π n/2
dk = dk k n−1 ,
Rn Γ(n/2) 0
segue que
$ $ ∞
1 1 1 1 2π n/2 1
dk = dk k n−1 .
(2π)n Rn (∥k∥2 + λ)α (2π)n λ(2α−n)/2 Γ(n/2) 0 (k 2 + 1)α
59
Veja o Teorema 4.5 no livro de E.H. Lieb e R. Seiringer, “The Stability of Matter in Quantum Mechanics,”
Cambridge University Press, 2010, pg.86.
769
Da Tabela de Integrais Gradshteyn-Ryzhik, Sétima Edição, Fórmula 3.241, 4.11 , pg.322, a última
integral é finita se, e somente se, α > n/2. Neste caso, obtemos
$ ∞
1 1 Γ(n/2)Γ(α − n/2)
dk k n−1 2 α
= .
0 (k + 1) 2 Γ(α)
Logo,
$
1 1 1 π n/2 Γ(α − n/2)
dk = .
(2π)n Rn (∥k∥2 + λ)α (2π)n λ(2α−n)/2 Γ(α)
Assim,
$
2 1 π n/2 Γ(α − n/2)
N(λ; (−∇ − V− )) # dx V−α (x) . (10B.10)
(2π)n λ(2α−n)/2 Γ(α) Rn
A seguir, substituímos (10B.10) em (10B.4), i.e.,

< $ $
α π n/2 Γ(α − n/2) ∞
λj # γ n
dλdx λγ−α−1+n/2 V−α (x) ,
j"0
(2π) Γ(α) 0 Rn
Infelizmente, a integral na variável λ é divergente em λ = 0 ou em λ = ∞, para qualquer valor

de γ. Para resolver este impasse, neste ponto a prova das desigualdades de Lieb-Thirring nos
revela a relação perfeita entre a Matemática e a Física. Com efeito, para remediar o problema
acima, consideremos que para todo λ " 0
⟨Ψ, (−∇2 + V + λ)Ψ⟩ = ⟨Ψ, (−∇2 + V + λ/2 + λ/2)Ψ⟩
= ⟨Ψ, (−∇2 + λ/2) + (V + λ/2))Ψ⟩ .

Então, é fácil ver que
⟨Ψ, (−∇2 − (V + λ/2)− )Ψ⟩ # ⟨Ψ, (−∇2 − V− )Ψ⟩ ,
e isto implica que
N(λ; (−∇2 − V− )) # N(λ; (−∇2 − (V + λ/2)− ) .
Aqui, (V + λ/2)− é definido pela fórmula
(V + λ/2)− (x) = max{−V (x) − λ/2, 0}
⎧
⎨−(V (x) + λ/2) , se (V (x) + λ/2) < 0
= − min{V (x) + λ/2, 0} .
Portanto, segue que −2V (x) < λ, ou seja 2V− (x) < λ. Vamos, dessa forma, substituir λ por
λ/2 e V− por V− − λ/2 no lado direito de (10B.9) e realizar os mesmos cálculos acima. Assim,
temos
$
N(λ; (−∆ − V− − λ/2)) # dx (V− (x) − λ/2)α Gα (0; λ/2)
Rn
, $ -$
1 1
= dk dx (V− (x) − λ/2)α .
(2π)n Rn (∥k∥ + λ/2)α
2
Rn
770
Como antes, segue-se que

$
1 1 1 2(2α−n)/2 π n/2 Γ(α − n/2)
dk = .
(2π)n Rn (∥k∥2 + λ/2)α (2π)n λ(2α−n)/2 Γ(α)
Consequentemente,
< $ 2V− $
2(2α−n)/2 π n/2 Γ(α − n/2)
λαj #γ dλdx λγ−α−1+n/2 (V− (x) − λ/2)α .
j"0
(2π)n Γ(α) 0 Rn
A troca das duas integrais60 leva a

< $ ,$ 2V− -
2(2α−n)/2 π n/2 Γ(α − n/2)
λαj #γ dx dλ λ γ−α−1+n/2
(V− (x) − λ/2) α
.
j"0
(2π)n Γ(α) Rn 0
Para calcular a integral na variável λ, vamos usar a seguinte fórmula:

$ u
Γ(µ)Γ(ν)
dx xν−1 (u − x)µ−1 = uµ+ν−1 , [Re µ > 0, Re ν > 0] .
0 Γ(µ + ν)
Portanto, se α < γ + n/2, segue-se que

$ 2V−
γ+n/2 Γ(α + 1)Γ(γ − α + n/2)
dλ λγ−α−1+n/2 (V− (x) − λ/2)α = 2γ−α+n/2 V− (x) .
0 Γ(γ + 1 + n/2)
Considerando que Γ(α + 1) = αΓ(α), então

< $
2γ π n/2 Γ(α − n/2)Γ(γ − α + n/2) γ+n/2
λαj # γα dx V− (x) , (10B.11)
j"0
(2π)n Γ(γ + 1 + n/2) Rn
que é exatamente o que queríamos, exceto pela escolha de α. Aqui, notamos que para que a
integração na variável λ em (10B.11) seja finita, precisamos exigir que α < γ + n/2, enquanto
para que a integração na variável k em (10B.9) seja finita, temos que exigir que α > n/2.
Resumindo, precisamos que n/2 < α < γ + n/2. Ao escolher α = (γ + n)/2 quando n > 1
ou n = 1, γ " 1, e α = 1 quando n = 1, os valores dados no teorema são obtidos para
todos os casos, exceto para os casos críticos n = 1, γ = 1/2 e n " 3, γ = 0. O caso
especial γ = 0, correspondendo à Desigualdade CLR (Teorema 10.13), não é coberto diretamente
no desenvolvimento acima. A prova para γ = 1/2, n = 1 veio muito depois, dada por T. Weidl,
no artigo “On the Lieb-Thirring Constants Lγ,1 for γ " 1/2,” Commun. Math. Phys. 178 (1996)
135.
60
Isto é possível pelo Teorema de Fubini.
771
Lista de Exercícios
Exercícios do Capítulo 1
& Exercício 1.1. Considere os conjuntos A = {x | x2 é um inteiro} e B = {x | x2 é um racional}.

(i) Encontre um exemplo de um real x tal que x ∈ A e x ∈ / Q. (ii) Encontre um exemplo de
um x ∈ R tal que x ∈ / A e x ∈ B. (iii) Encontre um exemplo de um x ∈ Q tal que x ∈ B.
& Exercício 1.2. Complete o exemplo exposto na Nota 1.5. Mostre que as leis idempotente,
comutativa, associativa, distributiva, de dualidade, do complemento e a segunda lei de Mor-
gan, são meramente teoremas que podem ser provados pelo uso direto das definições sobre
subconjuntos e igualdades de conjuntos.
& Exercício 1.3. Prove que (A ∪ B) ∩ B c = A se, e somente se, A ∩ B = ∅.
& Exercício 1.4. Prove que A ⊆ B se, e somente se, B c ⊆ Ac .
& Exercício 1.5. Prove que ∅ é único.
& Exercício 1.6. !Seja X um conjunto.
" Denota-se por P(X) o conjunto das partes de X;
isto é, P(X) = S | S ⊂ X . Nota-se que ∅, X ∈ P(X) e que para todo x ∈ X vale
{x} ∈ P(X). Mostre que se X for um conjunto finito com n elementos, então P(X) é
também finito e tem 2n elementos.
!
& Exercício
" 1.7. Considere
! os seguintes subconjuntos
" dos racionais: A = x ∈ Q | x2 >
2, x > 0 e B = x ∈ Q | x2 < 2, x > 0 . Mostre que A não possui ínfimo, enquanto que
B não possui supremo.
& Exercício 1.8. Considere P(Rn ). Então para conjuntos abertos em Rn vale as seguintes
propriedades: (i) ∅ e Rn são abertos, (ii) se U e V são abertos,
+ então U ∩ V é aberto e (iii)
dada uma família de (Uα )α∈A de abertos, a reunião da família α∈A Uα é aberta.
& Exercício 1.9 (Espaço métrico discreto). Tome um conjunto qualquer E e sobre ele defina
a função
b
0 , se x = y
d(x, y) =
1 , se x =
̸ y
Prove que d(x, y) é uma métrica.
773
& Exercício 1.10 (Distância entre funções contínuas). Seja C[0, 1] o espaço que consiste de
todas as funções contínuas definidas no intervalo fechado [0, 1]. Prove que as regras d1 , d2 e d3
definidas no Exemplo 1.3 satisfazem os axiomas de métrica. Sugestão: Se necessário, consulte a
bibliografia no final do livro!
& Exercício 1.11. Quais das seguintes funções são métricas em R?
a) d(x, y) = |x + y|;
b) d(x, y) = |x| − |y|;

5 5
c) d(x, y) = 5|x| − |y|5;
H
d) d(x, y) = |x − y|;
e) d(x, y) = |x − y| + |x2 + y 2|;
f ) d(x, y) = 2|x − y|.

& Exercício 1.12. Seja M um conjunto sobre o qual está definida uma métrica d(x, y).8 Verifique
9n
se para todo k > 0 e n ∈ N − {1}, as funções d1 (x, y) = kd(x, y) e d2 (x, y) = d(x, y)
são métricas em M ou não.
& Exercício 1.13. Seja M um conjunto sobre o qual está definida uma métrica. Dados a ̸= b
em M, determine r > 0 e s > 0 tais que B(a; r) ∩ B(b; s) = ∅.
/ B[a; r], prove que existe s > 0 tal que B[a; r] ∩ B[b; s] = ∅.
& Exercício 1.14. Se b ∈
& Exercício 1.15. Seja M um conjunto sobre o qual está definida uma métrica e A e B
subconjuntos de M. Dado que A ∩ B ̸= ∅, diam A # K, diam B # K e a ∈ A, mostre que
A ∪ B ⊂ B[a; 2K].
& Exercício 1.16. Para todo conjunto M sobre o qual está definida uma métrica, tem-se
∞
' 6 17
B[a; r] = B a; r +
n=1
n
e ∞
' 17
6
{a} = B a; .
n=1
n
Exprima, dualmente, cada bola aberta de M como a união de bolas fechadas.
& Exercício 1.17. Sejam A, B conjuntos não-vazios de números reais. Mostre que se x # y
para todo xinA e y ∈ B, então sup A # inf B.
& Exercício 1.18. Sejam A, B conjuntos não-vazios de números reais. Defina
A − B = {z | z = x − y para algum x ∈ A e y ∈ B} .
Mostre que
sup(A − B) = sup A − inf B e inf(A − B) = inf A − sup B .
& Exercício 1.19. Seja M um conjunto sobre o qual está definida uma métrica e A e B
subconjuntos limitados de M. Mostre que diam (A ∪ B) # diam A + diam B + d(A, B).
774
& Exercício 1.20. Seja M um conjunto sobre o qual está definida! uma métrica e A e " B
subconjuntos limitados e não vazios de5 M. Ponha α(A, B)
5 = sup d(x, y) | x ∈ A, y ∈ B .
5 5
Mostre que, para todo z ∈ M tem-se d(z, A) − d(z, B) # α(A, B).
& Exercício 1.21. Seja M um conjunto abstrato e A ⊂ E. Prove que intA ∪ ∂A ∪ extA = E.
& Exercício 1.22. Dados A, B ⊂ M, mostre que:
a) intA ∪ intB ⊂ int(A ∪ B);
b) intA ∩ intB = int(A ∩ B).

& Exercício 1.23. Sejam f : A → B e C ⊂ A e D ⊂ B. Mostre que:
a) C ⊂ f −1 (f (C)) e que a igualdade acontece se f é injetiva;
b) f −1 (f (D)) ⊂ D e que a igualdade acontece se f é sobrejetiva.

& Exercício 1.24. Sejam f : A → B e Ai ⊂ A e Bi ⊂ B, para = 1, 2. Mostre que:
a) B1 ⊂ B2 ⇒ f −1 (B1 ) ⊂ f −1 (B1 );
b) f (A1 ∪ A2 ) = f (A1 ) ∪ f (A2 );
c) f (A1 ∩ A2 ) ⊂ f (A1 ) ∩ f (A2 );
d) f −1 (B1 ∪ B2 ) = f −1 (B1 ) ∪ f −1 (B2 );
e) f −1 (B1 ∩ B2 ) = f −1 (B1 ) ∩ f −1 (B2 ).

& Exercício 1.25. Seja F a família dos subconjuntos fechados de um conjunto U sobre o qual
esteja definida uma métrica. Mostre que
(i) ∅ ∈ F e U ∈ F ,
(ii) a interseção arbitrária de elementos de F pertence a F ,
(iii) a união de um número finito de elementos de F pertence a F . Isso mostra que

ao invés de conjuntos abertos, uma topologia sobre um conjunto pode também ser definida por
uma coleção de conjuntos fechados.
& Exercício 1.26. Se Y é um subconjunto de X, dizemos que um conjunto A é fechado em
Y se A é um subconjunto de Y e se Y − A é aberto em Y . Mostre que um conjunto A é
fechado em Y ⊂ X se, e somente se, A é igual à interseção de um conjunto fechado de X
com Y .
& Exercício 1.27. Seja Y ⊂ X. Mostre que se A é fechado em Y e Y é fechado em X, então
A é fechado em X.
& Exercício 1.28. Mostre que uma bola fechada com respeito à métrica d(x, y) = ∥x − y∥ no
Rn , coincide com o fecho da bola aberta segundo a topologia gerada pela métrica d(x, y).
& Exercício 1.29. Seja Y ⊂ X. Mostre que intY = X − X − Y .
775
& Exercício 1.30. Uma coleção F de partes de um conjunto abstrato E (não necessariamente
espaço topológico) é um filtro se
a) ∅ ∈
/ F;
b) U, V ∈ F , então U ∩ V ∈ F ;
c) U ∈ F , então V ⊃ U, então V ∈ F .
Mostre que o conjunto de todas as vizinhanças de um ponto x ∈ E é um filtro. Isso mostra

que uma topologia sobre E pode ser dada dos dois modos equivalentes seguintes: pela coleção
dos abertos, ou pelos filtros das vizinhanças de cada ponto x ∈ E.
& Exercício 1.31. Em Rn as funções
n n o1/2
<
d(x, y) = (xi − yi )2 ,
i=1
n
< 5 5
′
d (x, y) = 5xi − yi 5 ,
i=1
5 5
d (x, y) = max 5xi − yi 5 ,
′′
1#i#n
definem a distância entre dois pontos. Mostre que para quaisquer x, y ∈ Rn tem-se
d′′ (x, y) # d(x, y) # d′ (x, y) # n · d′′ (x, y).
& Exercício 1.32. Sejam X e Y espaços topológicos. A topologia produto sobre X × Y é

a topologia tendo como base a coleção B de todos os conjuntos da forma U × V , onde U é
um conjunto aberto de X e V é um conjunto aberto de Y . Mostre que as topologias sobre
Rn induzidas pelas métricas d e d′′ do exercício anterior são equivalentes à topologia produto
sobre Rn .
& Exercício 1.33. Seja d uma métrica no conjunto M. Defina
d(x, y)
d1 (x, y) = ,
1 + d(x, y)
e
d2 (x, y) = min{1, d(x, y)} .
Prove que d1 e d2 definem métricas em M. Mostre d1 e d2 são ambas equivalentes a d.
& Exercício 1.34. Sejam d1 (x, y) e d2 (x, y) duas métricas sobre um conjunto M. Supondo-se
que d1 (x, y) seja dominada por d2 (x, y) (isso significa que existe uma constante c > 0 tal que
d1 (x, y) # c · d2(x, y) para quaisquer x, y ∈ M), mostre que toda sequência em M de Cauchy
segundo a métrica d2 (x, y), é de Cauchy segundo a métrica d1 (x, y).
& Exercício 1.35. Demonstre diretamente cada uma das implicações (a) ⇒ (c) ⇒ (b) ⇒ (a)
do Teorema 1.15.
& Exercício 1.36. 1) Mostre que f : E → F é contínua se, e somente se, para qualquer
conjunto B ⊂ E, tem-se f (B) ⊂ f (B). 2) Mostre que f : E → F é contínua se, e somente
se, a imagem inversa de qualquer fechado de F é fechado em E.
776
& Exercício 1.37. Demonstre que se xn ̸→ x, então existe uma bola aberta B(x; ε), de centro
x e raio ε > 0, tal que xn ∈/ B(x; ε) para um número infinito de índices n. Sugestão: Veja a
Proposição 1 e seu Corolário, no livro do Elon, “Elementos de Topologia Geral,” pg.108.
& Exercício 1.38. Prove a implicação inversa do Teorema 1.16.
& Exercício 1.39. Assuma que F é um subconjunto compacto do espaço Euclidiano Rn , então
prove a equivalência aludida no Exemplo 1.32.
& Exercício 1.40. Prove que Rn e Cn não são compactos.
& Exercício 1.41. Prove que um espaço métrico discreto (veja Exercício 1.9) consistindo de uma
infinidade de pontos não é compacto.
& Exercício 2.1. Seja Y = {x1 , . . . , xn } um subconjunto de espaço vetorial X . Como

definido, o span linear de Y é o menor subespaço vetorial de X contendo Y , ou seja, é a
interseção de todos os subespaços vetoriais de X contendo Y . Já o span linear fechado de
Y , denotado por span(Y ), é definido como sendo o menor subespaço vetorial fechado de X
contendo Y , ou seja, é a interseção de todos os subespaços vetoriais fechados de X contendo
Y . Mostre que span(Y ) é o fecho de span(Y ).
& Exercício 2.2. Seja Y = {x1 , . . . , xn } um subconjunto de X . Seja Y ′ = {x1 , . . . , xn , 0}
o conjunto obtido adicionando-se o vetor zero ao conjunto Y . Mostre que span(Y ) =
span(Y ′ ). Seja Y ′ = {x1 , . . . , xn , u} o conjunto obtido adicionando-se u ∈ span(Y ) ao
conjunto Y . Mostre que span(Y ) = span(Y ′ ).
& Exercício 2.3. Seja Y um subconjunto em X . Mostre que (α + β)Y ⊂ αY + βY , e que
pode acontecer que (α + β)Y ̸= αY + βY . Dê um exemplo.
& Exercício 2.4. Mostre que um subconjunto Y de um conjunto convexo X é um subconjunto
convexo de X se, e somente se, (1 − α)x1 + αx2 ∈ Y , para α ∈ [0, 1] e x1 , x2 ∈ Y .
& Exercício 2.5. Sejam X e Y conjuntos8 convexos. Mostre
9 que f : X → Y é um
mapeamento convexo se, e somente se, f (1 − α)x1 + αx2 = (1 − α)f (x1 ) + αf (x2 ), para
α ∈ [0, 1] e x1 , x2 ∈ X .
& Exercício 2.6. Seja Y = {x1 , . . . , xn } um subconjunto de um espaço vetorial X . Como
definido, o envelope convexo de Y é o menor conjunto convexo de X contendo Y , ou seja,
é a interseção de todos os conjuntos convexos de X contendo Y . Já o envelope convexo
fechado de Y , denotado por Ch(Y ), é definido como sendo o menor conjunto convexo
fechado de X contendo Y , ou seja, é a interseção de todos os conjuntos convexos fechados
de X contendo Y . Mostre que Ch(Y ) é o fecho de Ch(Y ).
& Exercício 2.7. Mostre que se X é um espaço vetorial de dimensão finita e {x1 , x2 , . . . , xm }
é um conjunto de vetores linearmente independentes, então, a não ser que este conjunto seja
uma base, podemos estender {x1 , x2 , . . . , xm } adicionando xm+1 , xm+2 , . . . , xn de maneira
que o conjunto {x1 , x2 , . . . , xn } é uma base para X .
& Exercício 2.8. Sejam X um espaço vetorial de dimensão finita " 1 sobre K e Y um
subespaço de X . Mostre que,
dimK X = dimK Y + dimK X /Y .
777
& Exercício 2.9. Mostre que um espaço vetorial X , munido com a métrica discreta
⎧
⎨0 se x = y
d(x, y) =
⎩1 se x = ̸ y
onde x, y ∈ X , não é um espaço normado.

& Exercício 2.10. Mostre que d(x, y) = |x − y| + |x2 − y 2 | define uma métrica sobre R. Sendo
R um espaço vetorial, mostre que a métrica d(x, y) não resulta de uma norma.
& Exercício 2.11. Outros exemplos de espaços vetoriais métricos, que não são normados, estão
baseados na desigualdade
|a + b| |a| |b|
# + .
1 + |a + b| 1 + |a| 1 + |b|
Por exemplo, a classe de todas as sequências x = (xn )n∈N torna-se um espaço vetorial métrico,
chamado espaço-S, se definimos
<∞
1 |xn − yn |
d(x, y) = n 1 + |x − y |
.
n=1
2 n n
Mostre que: (i) o espaço-S é um espaço vetorial, (ii) o espaço-S é um espaço métrico e (iii)
o espaço-S não é um espaço normado. Sugestão: Use o fato que a função f (x) = x/(1 + x)
é monótona crescente para x " 0.
& Exercício 2.12. Com base nos Exs. 2.9-2.11 e no Teorema 2.5, em que situação um espaço
vetorial sobre o qual esteja definida uma métrica, tem a métrica obtida de uma norma?
& Exercício 2.13. Espaços Lp (Rn ) são classes de espaços de Banach cuja as normas são
definidas por integrais
F$ G1/p
p
∥f ∥p = |f | dµ ,
com 1 # p < ∞. Mostre que os espaços Lp (Rn ) são completos. Sugestão: Veja o livro do
Royden, “Real Analysis,” Third Edition, pg. 125!
& Exercício 2.14. Mostre que as funções definidas pelas Equações (2.3.1) e (2.3.2) satisfazem as
propriedades da norma.
& Exercício 2.15. Mostre que as propriedades (d), (f ) e (g) do Teorema 2.9 implicam que as
aplicações + e · são contínuas.
& Exercício 2.16. Sejam X um espaço vetorial sobre R e S um conjunto convexo em X .
Mostre que S é balanceado se, e somente se, ele é simétrico.
& Exercício 2.17 (Generalização do Teorema 4.7). Nem sempre um par de espaços vetoriais
topológicos n-dimensionais são homeomorfos. Se X é um espaço vetorial topológico n-
dimensional, uma topologia pode ser definida sobre X de tal forma que os únicos conjuntos
abertos sejam ∅ e X , e certamente X não é homeomorfo a ℓ2 (n) (verifique!). Contudo, esta
situação anômala é evitada se tratamos com espaços do tipo-Tychonoff, ou espaços-T1 . Mostre
que espaços vetoriais topológicos do tipo-Tychonoff n-dimensionais, sobre o mesmo corpo de
escalares, são homeomorfos.
778
& Exercício 3.1. Mostre que a norma em um espaço de Hilbert é estritamente convexa; isto é,
se ∥x∥ = ∥y∥ = 1 e x ̸= y, então ∥x + y∥ # 2.
& Exercício 3.2. Mostre que em um espaço de Hilbert ∥x − y∥ + ∥y − z∥ = ∥x − z∥ se, e
somente se, y = αx + (1 − α)z para algum α ∈ [0, 1].
& Exercício 3.3. Seja X um subconjunto de Rn . Tome, para η ∈ Rn ,
HX (η) = sup ⟨η, x⟩ .
x∈X
! " !
Tome X ′ = η ∈ Rn | HX (η) # 1 e X ′′ = x ∈ Rn | supη∈X ′ ⟨η, x⟩ # 1}. Prove que
X ′ é convexo, que X ′′ é o envelope convexo de X e que HX ′′ (η) = HX (η).
& Exercício 3.4. Sejam X1 , . . . , Xn espaços vetoriais com um produto interno. Mostre que
[ \
[x1 , . . . , xn ], [y1 , . . . , yn ] = ⟨x1 , y1⟩ + · · · + ⟨xn , yn ⟩ ,
define um produto interno em X = X1 × · · · × Xn . Se X1 , . . . , Xn são espaços de Hilbert,
mostre que X é um espaço de Hilbert com a norma definida por
H
∥[x1 , . . . , xn ]∥ = ∥x1 ∥2 + · · · + ∥xn ∥2 .
& Exercício 3.5. Complete a prova do Teorema 3.2 mostrando que o produto escalar ⟨x, y⟩
(mais as leis algébricasH
para o produto escalar, como descritas pelas propriedades na Definição
3.1) e a norma ∥x∥ = ⟨x, x⟩ em H podem ser estendidos e comprovados como válidos em
H por um processo de passar ao limite.
& Exercício 3.6. Prove o Teorema 3.3 para o caso em que H é um espaço de Banach complexo.
& Exercício 3.7. Seja M um subespaço fechado do espaço de Hilbert H . Prove que H /M
é isomorfo a M ⊥ = {0}.
& Exercício 3.8. Prove que o Teorema da Projeção não vale se M não é um subespaço fechado
do espaço de Hilbert H .
& Exercício 3.9. Mostre que em um espaço de Hilbert de dimensão finita a convergência fraca
implica a convergência forte.
& Exercício 3.10. Se (an )n∈N é uma sequência ortonormal em um espaço de Hilbert H e
(αn )n∈N é uma sequência em ℓ2 , mostre que existe x ∈ H tal que
? ?
⟨x, an ⟩ = αn e ?(αn )n∈N ? = ∥x∥ ,
? ?
onde ?(αn )n∈N ? denota o norma em ℓ2 .
& Exercício 3.11. Seja {e1 , . . . , en } um conjunto ortonormal em um espaço de Hilbert H ,
onde n é fixo. Seja x ∈ H qualquer elemento fixo e y = α1 e1 + · · · + αn en . Então, ∥x − y∥
depende dos coeficientes α, . . . , αn . Mostre, por cálculo direto, que ∥x − y∥ é mínimo se, e
somente se, αj = ⟨ej , x⟩, onde j = 1, . . . , n.
& Exercício 3.12. Seja (en )n∈N uma sequência ortonormal em um espaço de Hilbert H .
Mostre que para quaisquer x, y ∈ H a relação de completeza
<
⟨x, y⟩ = ⟨x, ei ⟩⟨ei , y⟩ ,
i∈I
é equivalente a cada uma das afirmativas do Teorema 3.9.
779
& Exercício 3.13. Seja (en )n∈N uma sequência ortonormal em um espaço de Hilbert H .
Mostre que para quaisquer x, y ∈ H
<5 5
5⟨x, ei ⟩⟨ei , y⟩5 # ∥x∥∥y∥ .
i∈I
& Exercício 3.14. Mostre que se M e N são subespaços de um espaço de Hilbert H e

dim M < dim N, então, M ⊥ ∩ N é não-trivial, isto é, M ⊥ ∩ N ̸= {0}.
& Exercício 3.15. Seja P um sistema ortonormal completo em um espaço de Hilbert H .
Mostre que se P = P1 ∪ P2 e P1 ∩ P2 = ∅, então P1⊥ = span(P2 ).
& Exercício 4.1. Sejam X , Y dois espaços vetoriais sobre o mesmo corpo K e A um operador
linear de X para Y . Mostre que, Ker(A) é um subespaço linear de Dom(A) e que Ran(A)
é um subespaço linear de Y .
& Exercício 4.2. Seja X um espaço vetorial. Associe com cada a ∈ X e cada escalar λ ̸= 0
o operador de translação Ta e o operador multiplicação Mλ pelas fórmulas
Ta (x) = x + a , Mλ (x) = λx (x ∈ X ) .
Mostre que o operador Mλ é linear, enquanto que o operador Ta não, exceto quando a = 0.
& Exercício 4.3 (Outra forma de descrever operadores lineares limitados). Seja A um
operador linear mapeando o espaço vetorial normado X no espaço vetorial normado Y .
Mostre que A é limitado se, e somente se, A mapea conjuntos limitados em X em conjuntos
limitados em Y .
& Exercício 4.4. Seja A : X → R um funcional linear contínuo no espaço vetorial normado
X . Mostre que A é limitado em toda bola aberta
! "
B(x0 ; r) = x ∈ X | ∥x − x0 ∥ < r ⊂ X ,
mas não atinge seu inf nem seu sup em B(x0 ; r).
& Exercício 4.5. Sejam H = L2 (0, 1),√ o espaço de funções de quadrado integrável definidas
no intervalo I = (0, 1) e φn (x) = 2 sin nπx, n = 1, 2, 3, . . .. Mostre que φn converge
fracamente para zero, mas não fortemente. Sugestão: Como L2 (0, 1) é auto-dual, qualquer
função f caracteriza um funcional linear limitado sobre L2 (0, 1).
& Exercício 4.6. Mostre que se um operador A é invertível e os vetores x1 , . . . , xn são
linearmente independente, então Ax1 , . . . , Axn são linearmente independentes. Mostre que se
os operadores A e B são invertíveis, então o operador AB é invertível e temos (AB)−1 =
B −1 A−1 .
& Exercício 4.7. Seja (en )n∈N um sistema ortonormal completo em um espaço de Hilbert H
e (λn )n∈N uma sequência de escalares. Mostre que (i) existe um único operador T sobre H
tal que T en = λn en ; (ii) que T é limitado se, e somente se, a sequência (λn )n∈N é limitada.
780
& Exercício 4.8. Mostre que se {e1 , e2 , . . .} é uma base ortonormal em um espaço de Hilbert
H e U um operador unitário em H , então, {U e1 , U e2 , . . .} também é uma base ortonor-
mal. Reciprocamente, mostre que se {e1 , e2 , . . .} e {e′1 , e′2 , . . .} são duas bases ortonormais
em H , então, existe um único operador unitário U tal que e′κ = U eκ , com κ ∈ N.
& Exercício 4.9. Prove as seguintes propriedades do operador adjunto (é assumido que os
domínios de todos os operadores considerados são densos em H e que A e B são operadores
de H1 em H2 ):
1. (λA)∗ = λA∗ , para λ ̸= 0;

2. se A ⊂ B, então A∗ ⊃ B ∗ ;
3. (A + B)∗ ⊃ A∗ + B ∗ ;
4. se A e B são operadores de H2 em H3 e de H1 em H2 , respectivamente, então,
(AB)∗ ⊃ B ∗ A∗ ;
5. se A é um operador em H , então, (A + λ1I)∗ = A∗ + λ1I.
& Exercício 4.10. Seja T : R2 → R2 definido por T (x, y) = (x + 3y, 2x + y). Mostre que
T ∗ ̸= T .
& Exercício 4.11. Seja T : R3 → R3 definido por T (x, y, z) = (3x − z, 2y, −x + 3z). Mostre
que T é auto-adjunto.
& Exercício 4.12. Sejam A e B operadores lineares tais que A ⊆ B. Mostre que se A for
sobrejetivo e B for injetivo, então A = B.
& Exercício 4.13. Seja T um operador auto-adjunto e U um operador limitado. Mostre que
U ∗ T U é auto-adjunto.
& Exercício 4.14. Sejam H um espaço de Hilbert. Suponha que A é um operador ilimitado em
H e que B é um operador limitado definido em todo espaço H . Seja A + B o operador com
Dom(A + B) = Dom(A) e dado por (A + B)Ψ = AΨ + BΨ para todo Ψ ∈ Dom(A).
Mostre que (A + B)∗ tem o mesmo domínio que A∗ e (A + B)∗ Ψ = A∗ Ψ + B ∗ Ψ para todo
Ψ ∈ Dom(A∗ ). Além disso, mostre que, em particular, a soma de um operador auto-adjunto
ilimitado e um operador auto-adjunto limitado (definido em todo H ) é auto-adjunto no domínio
do operador ilimitado.
& Exercício 4.15. Suponha que A seja um operador simétrico em um espaço de Hilbert H que
tenha uma base ortonormal de auto-vetores. Ou seja, suponha que exista uma base ortonormal
{ej } para H tal que para cada j, temos ej ∈ Dom(A) e Aej = λj ej para algum número
real λj . Mostre que A é auto-adjunto.
& Exercício 4.16. Suponha que H seja uma soma direta de espaços de Hilbert de uma
sequência de espaços de Hilbert separáveis Hj :
∞
h
H = Hj .
j=1
Suponha também que Aj é um operador auto-adjunto limitado em Hj , para cada j. Defina

um subespaço V de H por
b ∞
c
<
V = Ψ = (ψ1 , ψ2 , . . .) | (∥ψj ∥2 + ∥Aj ψj ∥2 ) < ∞ .
j=1
781
Suponha agora que A é 5um operador simétrico em H cujo domínio contém a soma direta
finita dos Hj e tal que A5Hj = Aj . Mostre que A é essencialmente auto-adjunto, Dom(A)
N =
∗
Dom(A ) = V , e
N = A∗ Ψ = (A1 ψ1 , A2 ψ2 , . . .) ,
AΨ ∀ Ψ = (ψ1 , ψ2 , . . .) ∈ V .
& Exercício 4.17 (Fórmula de von Neumann). Sabemos do Teorema 4.28 que todo vetor
w ∈ Dom(A∗ ) pode ser unicamente representável da forma
w = x+y+z com x ∈ Dom(A) , y ∈ Kλ , z ∈ Kλ .
Mostre que
Im ⟨A∗ w, w⟩ = ∥y∥2 − ∥z∥2 .
Com base nesse resultado, decomponha o conjunto Dom(A∗ ) nos subconjuntos E0 , E− e E+
para os quais Im ⟨A∗ w, w⟩ é igual, menor, ou maior que zero. Então, mostre que um vetor
w ∈ Dom(A∗ ) situa-se em E0 , E− e E+ se Im ⟨A∗ w, w⟩ é igual, menor, ou maior que zero.
Esta afirmação segue da seguintes relações:
Dom(A) ⊂ E0 , Kλ ⊂ E− ∪ {0} , Kλ ⊂ E+ ∪ {0} .
& Exercício 4.18. Considere o operador hamiltoniano da partícula livre
#2 d 2
H0 = − ,
2m dx2
definido no intervalo (a, b). Estude este operador em três situações distintas: num intervalo
finito, no semi-eixo e na reta real completa. Sugestão: Expresse as condições de contorno sobre
uma função Ψ ∈ Dom(H) em termos de quantidades de duas componentes
, - , -
Ψ(a) Ψ(b)
F (a) = e F (b) = ,
Ψ′ (a) Ψ′ (b)
e assuma que F (b) = U F (a), onde U é uma matriz-2 × 2 não-singular.

& Exercício 4.19. Mostre que se p(x) e q(x) são funções reais de classe C ∞ e p(x) > 0, para
a # x # b, então, o operador Sturm-Liouville regular A dado por
, -
d dΨ(x)
AΨ(x) = − p(x) + q(x)Ψ(x) ,
dx dx
com domínio
3 4
Dom(A) = Ψ ∈ L2 (a, b) | AΨ(x) ∈ L2 (a, b), Ψ(a) = Ψ(b) = 0 ,
é auto-adjunto.
& Exercício 4.20. Mostre que todo operador simétrico A é A2 -limitado, com limite relativo
igual a zero.
& Exercício 4.21. Considere o operador A = px2n+1 + x2n+1 p, onde p = −i#d/dx e n ∈ N.
Encontre os auto-valores e as auto-funções de A. Quais os índices de deficiência de A? O
espaço de Hilbert neste caso é L2 (−∞, ∞).
782
& Exercício 5.1. Seja A um operador linear limitado em um espaço de Hilbert complexo H .
Mostre que o espectro de A∗ é o complexo conjugado do espectro de A, isto é, σ(A∗ ) = {λ |
λ ∈ σ(A)}.
& Exercício 5.2. Seja X = C[0, 1] o espaço vetorial formado pelas funções complexas con-
tínuas no intervalo 0 # x # 1, com a norma do supremo. Considere o operador linear
A : X → X definido por
$ x
Aϕ(x) = dy f (y) , 0 # x # 1 .
0
Mostre que σ(A) = σres (A) = {0}. Sugestão: Consulte o livro do Nivaldo A. Lemos, “Convite
à Física Matemática,” pg.402.
& Exercício 5.3. Use a primeira identidade do resolvente junto com a expressão (5.2.13) para
mostrar que se A é um operador limitado, então, e(s+t)A = esA · etA . Sugestão: Escolha dois
círculos C1 e C2 em torno do origem, com C1 dentro de C2 , de raios R1 e R2 , respectivamente,
maiores que ∥A∥ e use a fórmula integral de Cauchy.
& Exercício 5.4. Seja H um espaço de Hilbert complexo. Mostre que para um operador A
comutar com um operador limitado B que está definido em todo H , é necessário que B
comute com o resolvente Rλ (A) = (A − λ1I)−1 para todo valor regular λ, e é suficiente que
B e Rλ (A) comutem pelo menos para um valor regular λ.
& Exercício 5.5. Assuma que ϕn é uma auto-função normalizada de um operador auto-adjunto
A com σ(A) = σd (A), isto é, o espectro de A é puramente discreto. Mostre que o operador
Pn Ψ = ⟨ϕn , Ψ⟩ϕn é um operador projeção e que A pode ser escrito da seguinte forma:
<$ <
AΨ = dx λn ϕn (x)Ψ(x)ϕ(x) = λn Pn Ψ .
n n
& Exercício 5.6. Mostramos no Exemplo 5.7 que quando V = 0 o espectro do operador
hamiltoniano
#2 d 2
H0 = − ,
2m dx2
atuando em H = L2 (R) é σ(H0 ) = [0, ∞). Agora, queremos determinar o espectro de
H = H0 + V em algumas situações particulares. Assumindo que Dom(H) = Dom(H0 ),
mostre que
(i) se V (x) " b para todo x, então todo λ < b pertence ao conjunto ρ(H), isto é,
(−∞, b) ⊂ ρ(H);
(ii) se V (x) = b, uma constante, sobre um intervalo ilimitado I ∈ R, então todo λ " b
pertence ao conjunto σ(H), isto é, [b, ∞) ⊂ σ(H).
& Exercício 5.7. Use o exercício anterior para determinar os conjuntos ρ(H) e σ(H) no caso
quando
⎧
⎨b1 se x < a
V (x) = .
⎩b se x > a
2
783
& Exercício 5.8. Use o Teorema Minimax para mostrar que se A " B " 0 para operadores
compactos A e B, então, λn (A) " λn (B) for each n, em que λn (A) e λn (B) são os
auto-valores de A e B, respectivamente.
& Exercício 5.9. Suponha que Ax = νx. Mostre que
⎧
` ` ⎨x se ν = λ
1 1 −1
Pλ x = dµ Rµ (A)x = dµ (ν − µ) x = .
2πi |µ−λ|=r 2πi |µ−λ|=r ⎩0 se ν ̸= λ
Sugestão: Use a parametrização µ(s) = λ + reis onde −π # s # π.

& Exercício 5.10. Se um operador A : R3 → R3 é representado, com respeito a uma base
ortonormal, pela matriz
⎛ ⎞
0 1 0
⎜ ⎟
A=⎜ ⎝ 1 0 0 ⎟ ,
⎠
0 0 1
qual é a correspondente família espectral?
& Exercício 5.11. Seja A um operador auto-adjunto no espaço de Hilbert H com a família
espectral {E(λ)}λ∈R . Mostre que A é limitado (isto é, ∥Ax∥ # m∥x∥) se, e somente se, o
espectro de A é vazio para |λ| > m. Sugestão: A prova é similar à prova do Teorema 5.45.
d∞
& Exercício 5.12 (Fórmula de Stone). Seja A = −∞ dE(λ) um operador auto-adjunto asso-
ciado com a família espectral {E(λ)}λ∈R . Mostre que para −∞ < λ1 < λ2 < ∞ tem-se
(i)
$
1= > 1 λ2 = >
P [λ1 , λ2 ] + P (λ1 , λ2 ) = s − lim+ dλ Rλ+iε (A) − Rλ−iε (A) ,
2 ε→0 2πi λ1
(ii)
$ λ2 −δ = >
1
P (λ1 , λ2 ) = s − lim+ s − lim+ dλ Rλ+iε (A) − Rλ−iε (A) ,
δ→0 ε→0 2πi λ1 +δ
com a ordem dos limites sendo importante.
Sugestão: Considere a função definida

$ λ2 , -
1 1 1
fε (x) = dλ − ,
2πi λ1 x − (λ + iε) x − (λ − iε)
que é uniformemente limitada como uma função de ε e a seguinte convergência pontual se
acontece
⎧
⎪
⎪ 0 se x ∈ / [λ1 , λ2 ]
⎪
⎨
fε (x) = 12 se x = λ1 ou x = λ2 .
⎪
⎪
⎪
⎩
1 se x ∈ (λ1 , λ2 )
Consulte o livro de W.O. Amrein, “Hilbert Space Methods in Quantum Mechanics,” CRC Press,
2009, pg.171.
784
& Exercício 6.1. Mostre que o suporte da derivada de uma distribuição T está contido no
suporte de T .
& Exercício 6.2. Mostre que o espaço D(Rn ) é denso em E (Rn ).
2 2
& Exercício 6.3. Verifique que as funções e−x , P (x)e−x , onde P (x) é um polinômio, e
2 4
(1 − x5 )ecos x −x são elementos de S (R).
& Exercício 6.4. Verifique se a função e−t|x| , t > 0, é um elemento de S (R).
& Exercício 6.5. Prove que S (Rn ) é um espaço métrico completo quando munido da distância
< ∥f − g∥α,β
d(f , g) = 2−(|α|+|β|) ,
α,β
1 + ∥f − g∥ α,β
e que a métrica em questão não provém de uma norma.

2
& Exercício 6.6. Mostre que e−1/x ln x2 é de crescimento lento.
& Exercício 6.7. Mostre que δx não provém de uma função contínua e limitada polinomial-
mente.
n
& Exercício 6.8. Sejam f ∈ OM e T ∈ S ′ (Rn ). Mostre que f T ∈ S ′ (Rn ).
& Exercício 6.9. Mostre que os coeficientes constantes cα em (6.2.8) são unicamente determi-
nados.
& Exercício 6.10. Mostre que as sequências de funções
n 2 2 1 nx 1 − cos nx
fn (x) = √ e−n x , gn (x) = sin , hn (x) = , x∈R, n∈N,
π π x πnx2
convergem para δ, quando n → ∞.
& Exercício 6.11. Mostre que o conjunto direcionado formado pela família de funções
1 1 2
ft (x) = √ e− 4t x x∈R, t>0,
4πt
converge para δ, quando t → 0.
& Exercício 6.12. Prove que S é denso em E ; isto é, prove que para toda função f ∈ E (Rn )
existe uma sequência de funções (fn )n∈N ⊂ S (Rn ) que converge para f .
& Exercício 6.13. Mostre que (i) se escrevermos (6.3.4) para transformações infinitesimais como
1
Λµ ν = δ µ ν + ω αβ (Σαβ )µ ν + O(ω 2) ,
2
e se compararmos essa expressão com (6.3.5), então os elementos de matriz dos geradores são
da seguinte forma:
(Σαβ )µ ν = δ µ α gβν − δ µ β gαν . (10.10.1)
(ii) De posse dessa particular representação, mostre que os geradores satisfazem à seguinte
relação de comutação
[Σαβ , Σµν ] = gαν Σβµ + gβµ Σαν − gαµ Σβν − gβν Σαµ , (10.10.2)
que corresponde à álgebra de Lie do grupo SO(1, 3).
785
& Exercício 6.14. Prove a Proposição 6.3.

& Exercício 6.15. Mostre que os polinômios de Hermite, Laguerre e Legendre são ortogonais,
respectivamente, nos intervalos I = R, I = R+ e I = [−1, +1].
& Exercício 6.16. Mostre que a convolução satisfaz as seguintes propriedades algébricas:
(i) Comutatividade: f ∗ g = g ∗ f ;
(ii) Associatividade: f ∗ (g ∗ h) = (f ∗ g) ∗ h;
(iii) Distributividade: f ∗ (g + h) = (f ∗ g) + (f ∗ h);
(iv) Associatividade com a multiplicação escalar: a(f ∗ g) = (af ) ∗ g = f ∗ (ag), para

qualquer número real (ou complexa) a;
∂ ∂f ∂g
(v) Diferenciação: ∂xi
(f ∗ g)(x) = ∂xi
∗g =f ∗ ∂xi
.
& Exercício 6.17. Mostre que se duas distribuições de T , S ∈ D ′ (Rn ) satisfazem a condição
de suporte, então, o produto de convolução T ∗ S é uma distribuição em Rn , bem definida pela
fórmula (6.9.2).
& Exercício 6.18. Mostre que as convoluções δ ∗ f e (Dδ) ∗ f são bem definidas. Isto segue
do fato que δ e Dδ são concentradas em um ponto. Com base sobre o que sabemos sobre
o produto de funcionais, mostre que a convolução para duas distribuições é comutativa (no
mínimo sob as circunstâncias acima).
& Exercício 6.19. Mostre que a convolução não é uma operação associativa para distribuições.
Sugestão: Calcule (1 ∗ δ) ∗ θ e 1 ∗ (δ ∗ θ) e mostre que (1 ∗ δ) ∗ θ ̸= 1 ∗ (δ ∗ θ). (Este
exercício deixa claro que a operação de associatividade é válida para distribuições se duas das
três distribuições são de suporte compacto, ou se as três têm suporte compacto.)
S
& Exercício 6.20. Mostre que se a sequência (ϕk )k∈N ⊂ S (Rn ) é tal que ϕk −→ ϕ, então
S
^k −→ ϕ.
ϕ ^
& Exercício 6.21. Mostre que a distribuição delta de Dirac pertence ao espaço de Sobolev
Hs (Rn ) se s < − n2 .
& Exercício 6.22. Mostre que e−|x| ∈ Hs (R) se s < 32 .
& Exercício 6.23. Seja a > 0. Mostre que χ[−a,a] ∈ Hs (R) se s < 12 . Aqui χ[−a,a] é a função
característica associada ao intervalo fechado [−a, a].
& Exercício 6.24. Seja Ω um subconjunto aberto em Rn . Mostre que se u ∈ D ′ (Ω) e
−∞ < s < ∞, então ψu ∈ Hs (Rn ) para todo ψ ∈ D(Ω).
& Exercício 6.25. Sejam r, s números reais arbitrários, com s > r. Mostre que S ⊂ Hs ⊂
Hr ⊂ S ′ e que os mapeamentos identidade S → Hs → Hr → S ′ são contínuos. Mostre
também que S é denso em Hs , para todo s ∈ R.
& Exercício 6.26 (Propriedades essenciais do operador potencial de Riesz). Considere o
operador potencial de Riesz definido na Seção 6.10. Mostre que, para todo ϕ ∈ S (Rn ), (i)
Iα (Iβ ϕ) = Iα+β ϕ para α, β > 0, com α + β < n, (ii) ∇(Iα ϕ) = Iα (∇ϕ) = −Iα−2 ϕ, para
2 # α < n.
786
& Exercício 6.27 (Inverso do Teorema 6.22). Mostre que se (6.12.4) acontece, então o suporte
de u está contido na bola de raio R.
& Exercício 6.28. Encontre o conjunto de frente de ondas da seguinte função:
b
1 para |x1 | # 1, |x2 | # 1
u(x1 , x2 ) = .
0 em toda parte
& Exercício 6.29. Mostre que W F (P u) ⊆ W F (u) se P é um operador diferencial linear,
isto é, que a diferenciação não “aumenta” o conjunto de frente de ondas de u.
& Exercício 6.30. Mostre que, do ponto de vista das distribuições,
d ln |x|
= P(1/x) .
dx
& Exercício 6.31. Seja T uma distribuição temperada em Rn , que é homogênea de grau a.
Mostre que sua transformada de Fourier é homogênea de grau −n − a.
& Exercício 6.32. Seja t uma distribuição temperada em Rn \ {0}, que é homogênea de grau
s = ℓ. Mostre que sua extensão T para Rn é dada por
< <
Tλ = λℓ+n T + cα λℓ+n (1 − λℓ−|α| )D α δ + ln λ dα D α δ ,
|α|#ℓ |α|#ℓ
onde definimos Tλ como sendo o funcional T atuando sobre a função teste ϕλ . Sugestão:
Consulte o livro do L. Hörmander, “The Analysis of Linear Partial Differential Operators I,”
Springer Verlag, Second Edition, 1990, pg.76.
& Exercício 6.33. Mostre que
$ ∞
^ eikx
f (k) = lim dx = −2πiθ(−k) .
ε→0 −∞ x + iε
Sugestão: Observe que neste caso, o pólo foi deslocado para baixo por meio de uma quantidade
infinitesimal ε, e que para o Lema de Jordan valer devemos ter k < 0 e CR no semi-plano
inferior Imz < 0. Além disso, a orientação da curva C deve ser tomada no sentido negativo,
isto é, no sentido horário.
& Exercício 7.1. Mostre que a desigualdade no princípio de incerteza posição-momentum é

equivalente a
∥xΨ∥2 + ∥P Ψ∥2 " #∥Ψ∥2 .
& Exercício 7.2. Mostre que, se Ψ ∈ Dom(X) ∩ Dom(P ), então para quaisquer a, b ∈ R
? ?? ?
?(x − a1I)Ψ??(P − b1I)Ψ? " # ∥Ψ∥2 .
2
tem como incerteza mínima a função
2 /#
Ψa,b (x) = Ce−λ(x−a) eibx/# ,
para algum C ∈ C e λ > 0.
787
& Exercício 8.1. Mostre que um semi-grupo fortemente contínuo T (t), com t " 0, em espaço
de Hilbert H tem a seguinte propriedade: para todo ω > ω0 , existe uma constante Mω tal que
para cada t " 0 temos ∥T (t)∥ # Mω eωt . A constante ω0 é chamada de limite de crescimento
do semi-grupo. Quando Mω = 1 e ω = 0 nós temos o semi-grupo de contração. Mostre que a
desigualdade ∥T (t)∥ # Mω eωt não precisa ser válida para ω = Ω0 .
& Exercício 8.2. Seja T (t), com t " 0, um semi-grupo-C0 em espaço de Hilbert H . (a) Seja
λ ∈ C. Mostre que eλt T (t) também é um semi-grupo-C0. Qual é o limite de crescimento deste
semi-grupo? (b) Prove que o gerador infinitesimal de eλt T (t) é λ1I + A, onde A é o gerador
infinitesimal de T (t).
& Exercício 8.3. Seja A0 um operador auto-adjunto e não-negativo em um espaço de Hilbert
H . Prove que −A0 é o gerador infinitesimal de um semi-grupo de contração em H .
& Exercício 8.4. Seja A o gerador infinitesimal do semi-grupo-C0 T (t), com t " 0, em espaço
de Hilbert H . Prove que T (t) é um semi-grupo de contração se, e somente se,
⟨AΨ, Ψ⟩ + ⟨Ψ, AΨ⟩ # 0 ,
para todo Ψ ∈ Dom(A).

& Exercício 8.5. Prove o inverso da Proposição 8.2, isto é, mostre que se T é um semi-grupo-
C0 que satisfaz a proprieddade de continuidade uniforme (∥T − 1I∥ → 0 quando t → 0), então,
o gerador infinitesimal A de T é um operador limitado e T (t) = etA .
& Exercício 8.6. Prove a suficiência do Teorema de Hille-Yosida usando a fórmula etA =
limλ→∞ etAλ , onde limλ→∞ Aλ = A, com Aλ sendo o operador definido na aproximação de
Yosida discutida no Capítulo 5.
& Exercício 8.7. Mostre que, na prova da suficiência do Teorema de Hille-Yosida, T (t) obtido
como o limite forte na Eq.(8.2.20) tem as propriedades esperadas da função exponencial. Suges-
tão: Veja o livro de T. Kato “Perturbation Theory for Linear Operators, Second Edition, Springer,
1980, pg.482.
& Exercício 8.8. Seja H um espaço de Hilbert. Diz-se que um operador linear A em H é
dissipativo se Re⟨Ψ, AΨ⟩ # 0 para todo Ψ ∈ Dom(A) (se Re⟨Ψ, AΨ⟩ " 0, então, A é
chamado de acretivo). Um operador dissipativo A em um espaço de Hilbert H é chamado
de maximalmente dissipativo se A não admite nenhuma extensão dissipativa própria. Sejam A
o gerador infinitesimal de um semi-grupo-C0 de contração e B um operador dissipativo, com
Dom(B) ⊃ Dom(A). Suponha que existam constantes 0 # a < 1 e b > 0 tais que
∥BΨ∥ # a∥AΨ∥ + b∥Ψ∥ , ∀ Ψ ∈ Dom(A) .
Mostre que A + B, com domínio Dom(A), gera um semi-grupo-C0 de contração. Sugestão:

Veja o livro de J. Goldstein “Semigroups of Linear Operators and Aplications, Dover Edition, 2017,
pg.38.
& Exercício 8.9. Sejam H um espaço de Hilbert e A : Dom(A) ⊂ H → H um operador
linear. Assuma que A é o gerador infinitesimal de um semi-grupo-C0 de contração e que B
é uma perturbação de Kato de A e dissipativo (veja a definição de perturbação de Kato no
Capítulo 4). Mostre que A + B gera um semi-grupo-C0 de contração.
788
& Exercício 8.10 (Revisitando a Proposição 8.4). Seja H o hamiltoniano, independente do

tempo, de um sistema quântico. Assuma que Ψ ∈ Dom(H). Se Ψ ∈ Dom(H 2 ), mostre que
∥HΨ∥2 # 2 ∥H 2Ψ∥∥Ψ∥ ,
com a igualdade acontecendo se, e somente se,
H 2 Ψ + λHΨ + λ2 Ψ = 0 e Re⟨Ψ, H 2Ψ⟩ = 0 ,
para algum λ ∈ R+ . Sugestão: Veja o livro de J. Goldstein “Semigroups of Linear Operators and
Aplications, Dover Edition, 2017, pg.65.
& Exercício 8.11. Mostre que A gera um grupo-C0 de isometria se, e somente se, A e −A
geram semigrupos-C0 de contração em um espaço de Hilbert H . Para tal A e para Ψ ∈
Dom(A2 ), mostre que
∥AΨ∥2 # ∥A2 Ψ∥∥Ψ∥ .
& Exercício 10.1. Mostre que o operador momentum P definido sobre S (R) é essencialmente
auto-adjunto.
& Exercício 10.2. Seja B um campo magnético em R3 dado por um potencial vetor A : R3 →
R3 , com A ∈ C 1 (R3 ), tal que B = ∇ × A. Considere uma partícula no campo magnético
B. O hamiltoniano do sistema é dado pela expressão (bem conhecida)
1 6 e 72
H= −i#∇ − A .
2m c
Suponha que A e todas as suas derivadas são funções limitadas. Mostre que o hamiltoniano
acima é auto-adjunto no domínio Dom(H0 ).
& Exercício 10.3. Seja B um campo magnético constante em R2 dado por um potencial vetor
A : R2 → R2 , com A ∈ C 1 (R2 ), tal que B = ∇ × A. Assuma que B > 0. Mostre que o
hamiltoniano
1 6 e 72
H= −i#∇ − A ,
2m c
∞ 2
restrito ao espaço C0 (R ) satisfaz a desigualdade
$
⟨Ψ, HΨ⟩ " dx B(x)|Ψ(x)|2 , ∀ Ψ ∈ C0∞ (R2 ) .
R2
& Exercício 10.4. Verifique a Eq.(10.7.2).

& Exercício 10.5. Aplique o Teorema de Kato-Rellich ao operador de Schrödinger
κ
H = H0 − , κ∈R,
∥x∥α
para determinar para quais valores de α o operador H é auto-adjunto em 1, 2 e 3-dimensões;
isto é, para os casos dos espaços de Hilbert L2 (R), L2 (R2 ) e L2 (R3 ), respectivamente.
789
& Exercício 10.6. Aplique o Teorema de Kato-Rellich ao operador de Schrödinger

κ −a∥x∥
H = H0 − e , κ∈R.
∥x∥α
O potencial
κ −a∥x∥
V (x) = − e ,
∥x∥α
é um potencial tipo-Yukawa.
& Exercício 10.7. Estude a auto-adjunção do operador de Schrödinger H = H0 + V para o
seguinte potencial:
⎧
⎨V0 , se |x| # ℓ
V (x) = .
⎩0 , se |x| > ℓ
& Exercício 10.8. Estude a auto-adjunção do operador de Schrödinger H = H0 + V para os

seguinte potenciais:
1. Potencial de Hulthén
1
VH (x) = .
e∥x∥−1
2. Potencial de Morse
VM (x) = −2e−2∥x∥ + e∥x∥ .
Sugestão: Use coordenadas esféricas.

& Exercício 10.9. Verifique que
H1 = H0 + x2 + β|x| e H4 = H0 + x2 + βx4
para β " 0, são operadores com espectros puramente discretos.
√ Mostre que H
√1 (resp. H4 ) tem
um auto-valor no intervalo [1 − βa, 1 + βa], com a = π/2 (resp. a = 105 π/16).
& Exercício 10.10. Sejam a e b vetores fixos em Rn . Denote por aX + bP o operador dado
por
<n
∂Ψ(x)
(aX + bP )Ψ(x) = (ax)Ψ(x) − i# bj .
j=i
∂xj
Mostre que aX + bP é essencialmente auto-adjunto em C0∞ (Rn ).

& Exercício 10.11. Mostre que o operador H = P 2 /(2m) − X 4 não é essencialmente auto-
adjunto em C0∞ (Rn ), mesmo que H seja simétrico. Em contraste, mostre que o operador
P 2 /(2m) + X 4 é essencialmente auto-adjunto em C0∞ (Rn ).
& Exercício 10.12. Seja H um espaço de Hilbert e H0 : Dom(H0 ) → H um operador
auto-adjunto. Além disso, assuma que o operador V : Dom(V ) → H seja relativamente
H0 -limitado, com o limite relativo a < 1 (veja a Definição 4.31), e defina
H = H0 + V , com Dom(H) = Dom(H0 ) .
Prove que existem constantes c, d, c1, d1 > 0 tais que
∥H0 Ψ∥ # c∥HΨ∥ + d∥Ψ∥ e ∥HΨ∥ # c1 ∥H0 Ψ∥ + d1 ∥Ψ∥ , ∀ Ψ ∈ Dom(H0 ) .
790
& Exercício 10.13. Em R3 , seja V uma função da classe R de Rollnik – ver Nota 10.6. Mostre
1/2
que se Ψ ∈ Dom(H0 ) ⊂ Dom(|V |1/2 ), então, existe um a < 1 tal que
1/2
∥|V |1/2 Ψ∥ # a∥H0 Ψ∥ + aλ∥Ψ∥ .
& Exercício 10.14. Seja p = 2 se n # 3, p > 2 se n = 4 e p > n/2 se n " 5. Assuma que V
em Rn satisfaz as seguintes condições:
(I) Para cada ε > 0 existe δ > 0 tal que

$
|V (x + y) − V (x)|p dx # ε ,
Rn
para y ∈ Rn com |y| < δ, ou seja, V é uniformemente suave.
(II) Para cada ε > 0 existe R > 0 tal que

$
|V (x)|p dx # ε ,
|x|>R
ou seja, V decai uniformemente quando R → ∞. Então, conclua que V é relativamente H0 -

limitado e, portanto, H0 + V é auto-adjunto. Sugestão: Consulte o artigo de H. Hanche-Olsen,
H. Holden e E. Malinnikova “An Improvement of the Kolmogorov-Riesz Compactness Theorem”
Expo. Math. 37 (2019) 84 e a Proposição 8.7 no livro de K. Schmüdgen, “Unbounded Self-Adjoint
Operators on Hilbert Space,” Springer, 2012.
& Exercício 10.15. Seja V um potencial H0 -compacto em Rn e H = H0 + V o operador
auto-adjunto associado, com Dom(H) = H2 (Rn ). Se existe um α > 0 tal que
$ 6 7n/2
−2α2 ∥x∥2 2−n π
dx V (x)e < −nα ,
Rn 2
então, H tem (pelo menos) um auto-valor isolado negativo de multiplicidade finita.
& Exercício 10.16. Encontre a representação do resolvente do operador −∇2 no espaço-x, isto
é, a função de Green livre, em L2 (R) e L2 (R2 ). Sugestão: lembre-se que a função de Green
pode ser expressa em termos da função de Bessel modificada do terceiro tipo K n−α .
2
& Exercício 10.17. Usando as coordenadas do centro-de-massa e as coordenadas atômicas,

mostre que o hamiltoniano (10.7.1) pode ser escrito como uma soma dos hamiltonianos (10.7.2)
e (10.7.3).
& Exercício 10.18 (Teorema Virial). Suponha que V é um operador multiplicação atuando em
L2 (Rn ) e que (i) V seja H0 -limitado, com limite relativo menor que 1; (ii) existe um operador
multiplicação W também atuando em L2 (Rn ), com Dom(H0 ) ⊂ Dom(W ), de forma que
para todo Ψ ∈ Dom(H0 )
(s − 1)−1 (Vs − V )Ψ → W Ψ , quando s → 1 .
Mostre que se Ψ ∈ Dom(H0 ) e H0 Ψ + V Ψ = EΨ, então
2⟨Ψ, H0Ψ⟩ = ⟨Ψ, W Ψ⟩ = 2⟨Ψ, (E − V )Ψ⟩ .
791
& Exercício 10.19. Seja V uma função valorada no conjunto dos reais e H0 -limitada, com
limite relativo menor que 1. Mostre que H0 + V não tem auto-valores positivos se no mínimo
uma das seguintes condições são satisfeitas:
(i) V satisfaz as hipóteses do Exercício 10.18 e V é repulsivo, isto é, V (αx) # V (x) para
todo x ∈ Rn e todo α > 1;
(ii) V é homogêneo de grau −s, onde 0 < s < 2, isto é, V (αx) = α−s V (x);
(iii) V satisfaz as hipóteses do Exercício 10.18 e para algum b > 0, segue que
1
H0 − (1 + b)W − bV " 0 .
2
Enfatizamos que os potenciais neste exercício não requerem em nenhum momento que
V → 0 no infinito, Logo, este exercício pode ser aplicado para operadores de Schrödinger de
N-partículas. De fato, o Teorema 10.27 é um caso particular deste exercício, uma vez que o
potencial coulombiano tem grau de homogeneidade −1.
& Exercício 10.20 (Estado d’arte da função-trial). Determine a energia do estado fundamental
de um átomo de hidrogênio supondo que a função trial seja uma gaussiana da forma Ψ(r) =
2
Ne−(r/c) , onde N é a constante de normalização e c é um parâmetro variacional. Compare
o valor dessa energia com a energia exata do estado fundamental e verifique que o valor
encontrado é cerca de 2, 04 eV maior que a energia exata. Em outras palavras, este valor está
fora do valor mínimo em cerca de 15%.
& Exercício 10.21. Vimos que a Desigualdade de Cwikel-Lieb-Rozenbljum dá uma estimativa do
número de auto-valores negativos do operador de Schröndinger em Rn , para n " 3. Na outra
direção nós temos a seguinte situação: mostre que em Rn , para n = 1, 2, se
$
dx V (x) < 0 ,
Rn
então, o operador de Schrödinger tem no mínimo um auto-valor negativo. Sugestão: Tome

V ∈ C0∞ (Rn ) e considere a função-trial Ψa (x) = e−a|x| , com a > 0, no caso n = 1;
posteriormente, tome a pequeno o suficiente. Para o caso n = 2, considere a função-trial
1 a
Ψa (x) = e− 2 ∥x∥ , novamente com a > 0.
& Exercício 10.22 (Auto-vetor do estado fundamental). Mostre que se Ψ0 é um estado
fundamental com ⟨Ψ0 , HΨ0 ⟩ = λ, então, HΨ0 = λΨ0 , ou seja, Ψ0 é um auto-vetor de H
com auto-valor λ. Sugestão: considere o vetor normalizado
Ψ + εΦ
Φε = ,
∥Ψ + εΦ∥
para Φ ∈ Dom(H). Use que a derivada de ⟨Φε , HΦε ⟩ com respeito a ε é zero em ε = 0.
& Exercício 10.23. Considere o operador de Schrödinger H1atom para o átomo do hidrogênio.
Escolha uma função, Ψ ∈ C0∞ (R3 ) que satisfaz
3 4
∥Ψ∥ = 1 e supp Ψ ⊂ x ∈ R3 | 1 < ∥x∥ < 2 .
792
A seguir, considere (Ψn )n∈N uma sequência de funções trial normalizadas, com
Ψn (x) = n−3/2 Ψ(n−1 x) para n = 1, 2, 4, 8, 16, . . .
Mostre que ⟨Ψm , Ψn ⟩ = δmn e que ⟨Ψm , H1atom Ψn ⟩ = 0 se m ̸= n.

& Exercício 10.24. Considere o operador de Schrödinger para um oscilador harmônico unidi-
#2 2
mensional H = − 2m d /dx2 + 21 mω 2 x2 . Estime a energia do estado fundamental usando uma
2
função trial da forma Ψ(x) = Ne−αx , com α > 0, onde N é a constante de normalização.
& Exercício 10.25. Considere os dois hamiltonianos
1 1
H1 = −∇2 − e H 2 = ∇2 − ,
∥x∥ ∥x − x0 ∥
atuando nas funções-de-onda da variável x ∈ R3 . Aqui, x0 ∈ R3 \ {0} é um parâmetro. Defina

as respectivas energias do estado fundamental como
E1 = inf ⟨Ψ, H1 Ψ⟩ e E2 = inf ⟨Ψ, H2 Ψ⟩ ,

Ψ∈Ω Ψ∈Ω
∥Ψ∥=1 ∥Ψ∥=1
! "
onde Ω = Ψ ∈ L2 (R3 ) | ∇2 Ψ, ∥ · ∥−1 Ψ ∈ L2 (R3 ) . Lembre-se de que E1 = −1/2 (o estado
fundamental é Ψ(x) = e−c∥x∥ ). (i) Prove que E2 # E1 − be−c∥x0 ∥ , para todo x0 ∈ R3 ; (ii)
determine b. Sugestão: escolha uma função trial adequada. (iii) Prove que existem constantes
d, R > 0 tais que E2 " E1 − d∥x0 ∥−1 , para todo ∥x0 ∥ " R. Sugestão: use a fórmula IMS.
& Exercício 10.26. Considre H = −∇2 + V em L2 (R3 ), e suponha que V− ∈ L5/2 (R3 ).
Sejam −λj , com λj > 0, os auto-valores negativos de H. Use o Limite de Birman-Schwinger
(10.3.4), a Desigualdade de Hardy-Littlewood-Sobolev (10A.1) com p = r = 2 e a Eq.(10B.4) para
mostrar que $
< 5/2
λj # C dx V− (x) ,
j R3
em que C é uma constante a ser determinada. Compare o valor de C encontrado com o valor
LT
de Cγ,n nas desigualdades de Lieb-Thirring.
& Exercício 10.27. Suponha que K seja um operador de Hilbert-Schmidt, com kernel integral
K ∈ L2 (Ω × Ω). Sejam {λj }j∈J e {Φj }j∈J os auto-valores positivos, organizados em
ordem de magnitude decrescente λ1 " λ2 " λ3 " · · · , e as auto-funções ortonormais de K,
respectivamente. Pelo Teorema 10.9, sabemos que o operador K é compacto. Use o Teorema
5.27 para mostrar que em termos dos auto-valores e das auto-funções ortonormais, o kernel tem
a expansão canônica
∞
<
K (x, y) = λj Φj (x)Φj (y) ,
j=1
Mostre que a série acima converge em L2 (Ω × Ω).
793
Referências
1. Adams, D.R. e Hedberg L.I., “Function Spaces and Potential Theory,” Springer, 1996.
2. Agmon, S., “Lectures on Exponencial Decay of Solutions of Second Order Elliptic Equations,
Princeton Universty Press, 1982.
3. Akhiezer, N.I. e Glazman I.M., “Theory of Linear Operators in Hilbert Space,” Dover Publi-
cations, 1993.
4. Amrein, W.O., “Non-Relativistic Quantum Dynamics,” D. Reidel Publishing Company, 1981.
5. Amrein, W.O., “Hilbert Space Methods in Quantum Mechanics,” CRC Press, 2009.
6. Ávila, G., “Variáveis Complexas e Aplicações,” Livros Técnicos e Científicos Editora, 1990.
7. Bachman, G. e Narici, L., “Functional Analysis,” Dover Publications, 2000.
8. Balsinky, A.A, Evans, W.D. e Lewis, R.T., “The Analysis and Geometry of Hardy’s Inequality,”
Springer, 2015.
9. Berberian, S.K., “Lectures in Functional Analysis and Operator Theory,” Springer Verlag,
1974.
10. Blanchard, P. e Brüning, E., “Mathematical Methods in Physics. Distributions, Hilbert Space
Operators and Variational Methods,” Birkhäuser, 2003.
11. Boas, M., “Mathematical Methods in the Physical Sciences,” John Wiley, 1983.
12. Bogoliubov, N.N., Logunov, A.A., e Todorov, I.T., “Introduction to Axiomatic Quantum Field
Theory,” Benjamin, 1975.
13. Bogoliubov, N.N. e Shirkov, D.V., “Quantum Fields,” Benjamin, 1982.
14. Bogoliubov, N.N., Logunov, A.A., Oksak A.I. e Todorov, I.T., “General Principles of Quantum
Field Theory,” Kluwer, 1990.
795
Referências
15. Bonneau, G., Faraut, J. e Valent, G., “Self-Adjoint Extensions of Operators and the Teaching
of Quantum Mechanics,” Am. J. Phys. 69 (2001) 322.
16. Braga, C.L.R., “Notas de Física Matemática: Equações Diferenciais, Funções de Green e
Distribuições,” Livraria da Física, 2006.
17. Brezis, H., “Functional Analysis, Sobolev Spaces and Partial Differential Equations,” Sprin-
ger, 2011.
18. Bros, J. e Iagolnitzer, D., “Causality and Local Analyticity: Mathematical Study,” Ann.
Inst. Henri Poincaré 18 (1973) 147.
19. Bueno, H.P., “Álgebra Linear: Um Segundo Curso,” Coleção Textos Universitários, SBM,
2005.
20. Butkov, E., “Física Matemática,” Guanabara Dois, 1983.
21. Byron Jr., F.W. e Fuller, R.W., “Mathematics of Classical and Quantum Physics,” Dover
Publications, 1989.
22. Capri, A.Z., “Nonrelativistic Quantum Machanics,” World Scientific, 2002.
23. Carvalho, A.N., “Análise Funcional II,” Notas de Aula, São Carlos, Março de 2020.
24. Cicogna, G., “Metodi Matematici della Fisica,” Springer Verlag, 2008.
25. Coelho, F.U. e Lourenço, M.L., “Um Curso de Álgebra Linear,” Segunda Edição, EdUSP,
2005.
26. Cycon, H.L., Froese, R.G., Kirsch, W. e Simon, B., “Schrödinger Operators with Applications
to Quantum Mechanics and Global Geometry,” Springer, 1987.
27. Constantinescu, F., “Distributions and Their Applications in Physics,” Pergamon Press, 1980.
28. Conway, J.B., “A Course in Functional Analysis,” Second Edition, Springer Verlag,1990.
29. D’ Ambrosio, U., “Métodos da Topologia. Introdução e Aplicações,” Livros Técnicos e

Científicos, 1977.
30. De Lima, W.B., “Estados Ligados Elétron-Elétron na Eletrodinâmica Quântica Planar,”

Monografia de Conclusão do Curso de Física, Universidade Federal de Viçosa, 2016.
31. De Lima, W.B., Del Cima, O.M., Franco, D.H.T. e Neves, B.C., “On the Two-Dimensional
Schrödinger Operator with an Attractive Potential of the Bessel-Macdonald Type,” Annals
of Physics 427 (2021) 168385.
32. De Jager, E.M., “Applications of Distributions in Mathematical Physics,” Mathematical Cen-

tre Tracts, Vol. 10, 1964.
33. Debnath, L. e Mikusiński, P., “Introduction to Hilbert Spaces with Applications,” Academic
Press, 2005.
34. Dell’ Antonio, G., “Lectures on the Mathematics of Quantum Mechanics I,” Atlantis Studies
in Mathematical Physics: Theory and Applications, Atlantis Press, 2015.
796
Referências
35. Dixmier, J., “General Topology,” Springer Verlag, 1984.
36. Duistermaat, J.J. e Hörmander, L., “Fourier Integral Operators. II, ” Acta Math. 128 (1972)
183.
37. Duistermaat, J.J. e Kolk, J.A.C., “Distributions: Theory and Applications,” Birkhäuser, 2010.
38. Engel, K.-J. e Nagel, R. “One-Parameter Semigroups for Linear Evolution Equations,” Sprin-
ger Verlag, 2000.
39. Fano, G., “Mathematical Methods of Quantum Mechanics,” McGraw-Hill Book Company,
1971.
40. Faria, E. e Melo, W., “Mathematical Aspects of Quantum Field Theory,” Cambridge Uni-
versty Press, 2010.
41. Faris, W.G., “Self-Adjoint Operators,” in Lecture Notes in Mathematics 433, Springer-Verlag,
1975.
42. Figueiredo, D.G., “Análise de Fourier e Equações Diferenciais Parciais,” Projeto Euclides,
IMPA, 2007.
43. Franco, D.H.T. e Lima L.S., “A Simple Application of the Time Evolution Operator in the
Solution of a Paradox in Quantum Mechanics,” Quantum Stud.: Math. Found. 5 (2018)
273.
44. Epstein, H. e Glaser, V., “The Role of Locality in Perturbation Theory,” Ann. Inst. Henri
Poincaré 19 (1973) 211.
45. Edwards, R.E., “Functional Analysis: Theory and Applications,” Dover Publications, 1995.
46. Edmunds, D.E. e Evans, W.D., “Spectral Theory of Differential Operators,” Second Edition,
Oxford Science Publications, 2018.
47. Galindo, A. e Pascual, P., “Quantum Mechanics,” Vol. I e II, Springer-Verlag, 1991.
48. Gasirorowicz S., “Física Quântica,” Guanabara Dois, 1979.
49. Gel’fand, I.M. e Shilov, G.E., “Generalized Functions. Properties and Operations,” Vol. 1,
Academic Press, 1964.
50. Gel’fand, I.M. e Shilov, G.E., “Generalized Functions. Spaces of Fundamental and Generali-
zed Functions,” Vol. 2, Academic Press, 1968.
51. Gel’fand, I.M. e Vilenkin, N. Ya, “Generalized Functions. Applications of Harmonic Analy-
sis,” Vol. 4, Academic Press, 1964.
52. Gieres, F., “Mathematical Surprises and Dirac’s Formalism in Quantum Mechanics,” Rep.
Prog. Phys. 63 (2000) 1893;
53. Gill, T.L. e Zachary, W.W., “Functional Analysis and the Feynman Operator Calculus,”
Springer, 2016.
797
Referências
54. Giral, C.B. e Bermejo, E.F., “Analisis Funcional I,” Monografias del Instituto de Matematicas,
Vol. 21, Universidad Nacional Autonoma de Mexico, 1989.
55. Gitman, D.M., Tyutin, I.V. e Voronov, B.L., “Self-Adjoint Extensions in Quantum Mechanics,”
Progress in Mathematical Physics, Vol. 62, Birkhäuser, 2012.
56. Gohberg, I., Goldberg, S. e Kaashoek, M.A., “Basic Classes of Linear Operators,” Springer
Basel AG, 2003.
57. Goldberg, S., “Unbounded Linear Operators. Theory and Applications,” Second Edition,
Dover Publications, 2006.
58. Goldstein, J.A., “Semigroups of Linear Operators & Applications,” Second Edition, Dover
Publications, 2017.
59. Gradshteyn, I.S. e Ryzhik, I.M., “Table of Integrals, Series, and Products,” Seventh Edition,
Elsevier (Academic Press), 2007.
60. Grigis, A. e Sjöstrand, J., “Microlocal Analysis for Differential Operators,” London Mathe-
matical Society, Lecture Note Series 196, Cambridge University Press, 1994.
61. Gustafson, S.J. e Sigal, I.M„ “Mathematical Concepts of Quantum Mechanics,” Second
Edition, Springer Verlag, 2011.
62. Haag, R., “Local Quantum Physics: Fields, Particles and Algebras,” Second Revised Edition,
Springer Verlag, 1996.
63. Hall, B.C. , “Quantum Theory for Mathematicians,” Springer, 2013.
64. Halmos, P.R., “Teoria Ingênua dos Conjuntos,” Coleção Clássicos da Matemática, Ciência
Moderna, 2001.
65. Hanson, G.W. e Yakovlev A.B., “Operator Theory for Electromagnetics,” Springer Verlag,
2001.
66. Helffer, B., “Spectral Theory and its Applications,” Cambridge University Press, 2013.
67. Hellwig, G., “Differential Operators of Mathematical Physics,” Addison-Wesley, 1967.
68. Hille, E., “Methods in Classical and Functional Analysis,” Addison-Wesley, 1972.
69. Hirsch, F. e Lacombe, G, “Elements of Functional Analysis,” Springer Verlag, 1999.
70. Hislop, P.D. e Sigal, I.M, “Introduction to Spectral Theory with Applications to Schrödinger
Operators,” Springer Verlag, 1996.
71. Hörmander, L., “Fourier Integral Operators. I, ” Acta Math. 127 (1971) 79.
72. Hörmander, L., “The Analysis of Linear Partial Differential Operators I, ” Springer Verlag,
Second Edition, 1990.
73. Hunziker, W., “On the Spectra of Schrödinger Multiparticle Hamiltonians,” Helv. Phys.
Acta 39 (1966) 451.
798
Referências
74. Hunziker, W., “The Schrödinger Eigenvalue Problem for N-Particle Systems,” Proceedings of
the International Symposium “50 Years Schrödinger Equation,” Viena 10 -12 de Junho de
1976, pg.43, Editado por W. Thirring e P. Urban.
75. Iório Jr., R. e Iório, V.M., “Equações Diferenciais Parciais: Uma Introdução,” Projeto Euclides,
IMPA, 1988.
76. Iório Jr., R. e Iório, V.M., “Fourier Analysis and Partial Differential Equations,” Cambridge
University Press, 2001.
77. Joshi, K.D., “Introduction to General Topology,” New Age, Revised Edition, 2006.
78. Junghenn, H.D., “Principles of Analysis: Measure, Integration, Functional Analysis, and
Applications,” CRC Press, 2018.
79. Junker, W., “Adiabatic Vacua and Hadamard States for Scalar Quantum Fields on Curved
Spacetime,” Doctoral dissertation, University of Hamburg, 1995, hep-th/9507097.
80. Kato, T., “Perturbation Theory for Linear Operators,” Springer Verlag, Second Edition, 1980.
81. Kelley, J.L. e Namioka, I., “Linear Topological Spaces,” Springer Verlag, 1963.
82. Kohlmann, M., “Schrödinger Operators and their Spectra,” Lecture Notes, curso ministrado
na Universidade de Göttingen, no inverno de 2017/2018.
83. Kolmogorov, A. N. e Fomin, S. V., “Introductory Real Analysis,” Dover Publications, 1975.
84. Kühlkamp, N., “Introdução à Topologia Geral,” Editora da UFSC, Segunda Edição, 2002.
85. Lang, S., “Linear Algebra,” Addison-Wesley, 1966.
86. Lax, P.D., “Functional Analysis,” Wiley-Interscience, 2002.
87. Lemos, N.A., “Convite à Física Matemática,” Editora Livraria da Física, 2013.
88. Lieb, E.H. e Loss, M., “Analysis,” Second Edition, American Mathematical Society, Provi-
dence, 2001.
89. Lieb, E.H. e Seiringer, R., “The Stability of Matter in Quantum Mechanics,” Cambridge
University Press, 2010.
90. Lima, E.L., “Elementos de Topologia Geral,” Ao Livro Técnico, 1970.
91. Lima, E.L., “Espaços Métricos,” Projeto Euclides, IMPA, Terceira Edição, 1993.
92. Lima, E.L., “Curso de Análise,” Vol. 1, Projeto Euclides, IMPA, Quinta Edição, 1987.
93. Lima, E.L., “Curso de Análise,” Vol. 2, Projeto Euclides, IMPA, Segunda Edição, 1985.
94. Miranda, M.M., “Análise Espectral em Espaços de Hilbert,” Segunda Edição, Editora da
Universidade Estadual da Paraíba (EDUEPB), 2013.
95. Möller, S., “Stone’s Theorem and Applications,” Bachelor’s Thesis, Lunds Universtitet, 2010.
96. Munkres, J.R., “Topology,” Second Edition, Prentice Hall, 2000.
799
Referências
97. Nachbin, L., “Introdução à Análise Funcional: Espaços de Banach e Cálculo Diferencial,”
Programa de Monografias Científicas da Organização dos Estados Americanos, 1976.
98. Nachbin, L., “Convex Cones and Convex Sets,” Portugaliae Mathematica, Volume 50 (1993)
467-487.
99. Naimark, M.A., “Linear Differential Operators, Part II. Linear Differential Operators in Hil-
bert Spaces,” Frederick Ungar Publishing Co., 1968.
100. Naimark, M.A., “Normed Algebras,” Wolters-Noordhoff Publishing, Groningen, The Nether-
lands, 1972.
101. Nam, P.T., “Mathematical Quantum Mechanics II,” Lecture Notes, curso ministrado na
Universidade de Munique, Summer 2020.
102. Oden, J.T., “Applied Functional Analysis. A First Course for Students of Mechanics and
Engineering Science,” Prentice-Hall, 1979.
103. Oliveira, C.R., “Introdução à Análise Funcional,” Projeto Euclides, IMPA, 2010.
104. Oliveira, C.R., “Intermediate Spectral Theory and Quantum Dynamics,” Progress in Mathe-
matical Physics 54, Birkhäuser, 2009.
105. Pankov, A., “Introduction to Spectral Theory of Schrödinger Operators,” Lecture Notes, curso
ministrado na Universidade Giessen, ano letivo de 1999-2000.
106. Pankrashkin, K., “Introduction to the Spectral Theory,” Lecture Notes, curso ministrado na
Universidade Paris-Sud (Orsay, França) em setembro-dezembro de 2012.
107. Pazy, A., “Semigroups of Linear Operators and Applications to Partial Differential Equations,
Applied Mathematical Sciences, Vol. 44, Springer Verlag, 1983.
108. Prugovečki, E., “Quantum Mechanics in Hilbert Space,” Second Edition, Dover Publications,
2006.
109. Radzikowski, M.J., “The Hadamard Condition and Kay’s Conjecture in (Axiomatic) Quan-
tum Field Theory on Curved Spacetime,” Ph.D. dissertation, Princeton University, 1992.
110. Reed, M. e Simon, B., “Methods of Modern Mathematical Physics. Functional Analysis,”
Vol. I, Academic Press, Second Edition, 1980.
111. Reed, M. e Simon, B., “Methods of Modern Mathematical Physics. Fourier Analysis, Self-
Adjointness,” Vol. II, Academic Press, 1975.
112. Reed, M. e Simon, B., “Methods of Modern Mathematical Physics. Analysis of Operators,”
Vol. IV, Academic Press, 1978.
113. Richtmyer, R.D., “Principles of Advanced Mathematical Physics,” Vol. 1, Springer Verlag,
1978.
114. Riesz, F. e Sz-Nagy, B. “Functional Analysis,” Dover, 1990.
115. Robertson, A.P. e Robertson, W., “Topological Vector Spaces,” Cambridge University Press,
1966.
800
Referências
116. Royden, H.L., “Real Analysis,” Third Edition, Prentice-Hall, 1988.
117. Rudin, W., “Functional Analysis,” MacGraw-Hill, 1973.
118. Rudin, W., “Princípios de Análise Matemática,” Editora Universidade de Brasília, 1971.
119. Salof-Coste, L., “Aspects of Sobolev-Type Inequalities,” London Mathematical Society, Lec-
ture Note Series 289, Cambridge University Press, 2002.
120. Schaefer, H.H., “Topological Vector Spaces,” Springer Verlag, 1970.
121. Schücker, T., “Distributions, Fourier Transforms and Some of Their Applications to Physics,”
World Scientific, 1991.
122. Schmüdgen, K., “Unbounded Self-Adjoint Operators on Hilbert Space,” Springer, 2012.
123. Schwartz, L., “Théorie des Distributions,” Hermann, 1966.
124. Schwartz, L, “Mathematics for the Physical Sciences,” Dover Publications, 2008.
125. Shima, H., “Functional Analysis for Physics and Engineering: An Introduction,” CRC Press,
2016.
126. Simon, B., “On the Infinitude or Finiteness of the Number of Bound States of an N-Body
Quantum System, I.,” Helv. Phys. Acta 43 (1970) 607.
127. Simon, B., “Quantum Mechanics for Hamiltonians Defined as Quadratic Forms,” Princeton
Series in Physics 68, 1971.
128. Simon, B., “An Introduction to the Self-Adjointness and Spectral Analysis of Schrödinger
Operators,” Proceedings of the International Symposium “50 Years Schrödinger Equation,”
Viena 10 -12 de Junho de 1976, pg.19, Editado por W. Thirring e P. Urban.
129. Simon, B., “Some Aspects of the Theory of Schrödinger Operators,” in Lecture Notes in
Mathematics 1159, Schrödinger Operators, Springer-Verlag. Lectures given at the 2nd 1984,
Session of the Centro Internationale Matematico Estivo (C.I.M.E.) held at Como, Italy, Aug.
26 - Sept. 4, 1984.
130. Simon, B., “Operator Theory: A Comprehensive Course in Analysis,” Part 4, American
Mathematical Society, 2015.
131. Soares, M.G., “Cálculo em uma Variável Complexa,” Coleção Matemática Universitária,
IMPA, 2001.
132. Sobolev, S.L., “On a Theorem of Functional Analysis,” Mat. Sb. (N.S.) 4 (1938) 471; English
transl. in Am. Math. Soc. Transl. II Ser. 34 (1963) 39.
133. Stein, E., “Singular Integrals and Differentiability Properties of Functions,” Princeton Uni-
versity Press, 1970.
134. Sternberg, S., “A Mathematical Companion to Quantum Mechanics,” Dover Publications,

2019.
801
Referências
135. Streater, R.F. e Wightman A.S., “PCT, Spin-Statistics and All That,” Benjamin, New York,
1964.
136. Strichartz, R., “A Guide to Distribution Theory and Fourier Transforms,” Série Studies in
Advanced Mathematics, CRC Press, 1994.
137. Swartz, E.T., “On the Number of Bound States of the Schrödinger Hamiltonian – A Review,”
Master’s Thesis, Rice University, Houston, Texas, 1981.
138. Swartz, C., “An Introduction to Functional Analysis,” Marcel Dekker, 1992.
139. Talenti, G., “Best Constant in Sobolev Inequality, Ann. Mat. Pura Appl. 110 (1976) 353.
140. Taylor, A.E., “Introduction to Functional Analysis,” John Wiley, 1958.
141. Teschl, G., “Mathematical Methods in Quantum Mechanics,” Second Edition, American
Mathematical Society, 2014.
142. Thayer, J., “Operadores Auto-Adjuntos e Equações Diferenciais Parciais,” Projeto Euclides,
IMPA, 1987.
143. Thirring, W., “Quantum Mathematical Physics: Atoms, Molecules and Large Systems,” Se-
cond Edition, Springer, 2002.
144. Treves, F., “Topological Vector Spaces, Distributions and Kernels,” Academic Press, 1967.
145. Vladimirov, V.S., “Equations of Mathematical Physics,” Marcel Dekker, 1971.
146. Vladimirov, V.S., “Methods of the Theory of Generalized Functions,” Taylor & Francis, 2002.
147. Zeidler, E., “Applied Functional Analysis. Applications to Mathematical Physics,” Vol. 108,
Springer, 1995.
148. Zemanian, A.H., “Distribution Theory and Transform Analysis: An Introduction to Genera-
lized Functions with Applications,” Dover Publications, 1987.
149. Zettili, N., “Quantum Mechanics Concepts and Applications,” Second Edition, John Wiley
and Sons, Ltd., Publication, 2009.
150. Ziemer, W.P., “Weakly Differentiable Functions. Sobolev Spaces and Functions of Bounded
Variation,” Springer, 1989.
151. Zwart, K., “The Spectral Theorem for Unbounded Self-Adjoint Operators and Nelson’s Theo-
rem,” Bachelor’s Thesis, Wis- en Natuurkunde (TWIN), 2018.
152. Weidmann, J., “Linear Operators in Hilbert Spaces,” Springer Verlag, 1980.
153. Werner, P., “A Distribution-Theoretical Approach to Certain Lebesgue and Sobolev Spaces,”
J. Math. Anal. Appl. 29 (1970) 18.
154. Werner, P., “Bemerkungen zur Theorie der Lp -Räume,” J. Reine Angew. Math. 34 (1969)
401.
155. Williams, F., “Topics in Quantum Mechanics,” PMP 27, Birkhäuser, 2003.
156. Yosida, K., “Functional Analysis,” reprint of the Sixth Edition, Springer Verlag, 1980.
802
& Aplicações na Teoria Quântica
Baseado em uma série de aulas ministradas pelo autor no Departamento de

Física da Universidade Federal de Viçosa, este livro vai muito além do material
apresentado originalmente. O objetivo é fornecer os elementos de Análise Funcional
de uma maneira facilmente compreensível, de forma a salientar a sua profunda
relação com a teoria quântica. Destinado, sobretudo, a estudantes do final de
bacharelado e início de pós-graduação em física e matemática, este texto assume
que o leitor tem conhecimentos de álgebra linear e cálculo avançado no nível do
bacharelado destas áreas, podendo ser utilizado, quer para o estudo independente,
quer como texto-base para um curso de introdução de análise funcional, quer ainda
como texto suplementar de consulta de cursos de física que utilizem os conceitos,
a linguagem e os resultados desta área da matemática.

Elementos de Análise Funcional e Aplicações Na Teoria Quântica

Enviado por

Dados do documento

Título original

Direitos autorais

Formatos disponíveis

Compartilhar este documento

Compartilhar ou incorporar documento

Opções de compartilhamento

Você considera este documento útil?

Este conteúdo é inapropriado?

Direitos autorais:

Formatos disponíveis

Elementos de Análise Funcional e Aplicações Na Teoria Quântica

Enviado por

Direitos autorais:

Formatos disponíveis

No Au

Elementos de Análise Funcional

Elementos de Análise Funcional

Departamento de Física (DPF)

Franco, Daniel Heber Theodoro, 1962-

1. Física matemática. 2. Análise funcional. 3. Teoria

CDD 22. ed. 530.15

Bibliotecária responsável: Bruna Silva CRB6/2552

Primeira Parte: Elementos de Análise e Espaços Vetoriais 2

1 Noções sobre Conjuntos e Topologia 3

2 Espaços Vetoriais Normados 59

Segunda Parte: Elementos de Teoria de Operadores Lineares 138

4 Operadores Lineares em Espaços de Hilbert 139

Terceira Parte: Elementos de Teoria de Distribuições 376

6 Teoria de Distribuições e Análise de Fourier 377

Quarta Parte: Elementos de Teoria Quântica não-Relativística 530

7 Aspectos Matemáticos da Mecânica Quântica 531

8 O Teorema de Stone e o Fluxo do Tempo na Mecânica Quântica 551

9 O Teorema de Stone e as Simetrias na Mecânica Quântica 597

10 Operadores de Schrödinger 631

de axiomas de Wightman (também chamados axiomas de Gårding-Wightman), bem como a

5 analisamos o papel central desempenhado pela noção do “espectro” de um operador linear

Belo Horizonte, 12 de Julho de 2022. Daniel H. T. Franco

“Os matemáticos trabalham com termos

Para “trilharmos” os caminhos da Análise Funcional precisamos de um certo background em

1.1 Primeiras Noções sobre Conjuntos

para indicar que A é a coleção de elementos a, b, c. Se um elemento x pertence a um conjunto

Normalmente não descrevemos um conjunto listando cada elemento entre as chaves { }

representa o conjunto formado por todos os elementos de A para os quais a proposição

1.1.1 Subconjuntos e Igualdade de Conjuntos

• Números naturais: N = {1, 2, 3, 4, . . .}; também N0 = {0, 1, 2, 3, 4, . . .}.

• Números inteiros: Z = {. . . , −4, −3, −2, −1, 0, 1, 2, 3, 4, . . .}.

• Números racionais: Q = {p/q | p, q ∈ Z, q ̸= 0 . . .}.

• Números reais: denotado por R.

• Números complexos: C = {a + ib | a, b ∈ R}.

Naturalmente, temos a seguinte sequência de inclusões: N ⊂ Z ⊂ Q ⊂ R ⊂ C.

1.1.2 Operações com Conjuntos

* Interseção: A interseção de dois conjuntos A e B é o conjunto de elementos x que

A inteserção de um número de conjuntos A1 , A2 , . . . , An é o conjunto de elementos comuns

* Complemento: No caso particular em que B ⊂ A, a diferença A − B chama-se comple-

Em geral, se A, B ⊂ C, a diferença A − B sendo o conjunto dos elementos de A que não

1.1.3 Álgebra de Conjuntos

• Leis de Dualidade: sendo U um conjunto universal, segue que

que é o mesmo que dizer que

que é o mesmo que dizer que

1.1.4 Supremo e Ínfimo de Conjuntos

DEFINIÇÃO 1.1. Seja M um conjunto. Uma métrica – ou função distância – em M é uma

M1. d(x, y) " 0 (axioma da separação) ,

M2. d(x, y) = 0 se, e somente se, x = y (axioma da coincidência) ,

M3. d(x, y) = d(y, x) (simetria) ,

M4. d(x, z) # d(x, y) + d(y, z) (subaditividade) ,

quaisquer que sejam x, y, z ∈ M.

Na definição acima, a Propriedade M1 diz que a função distância d nunca é negativa e a

d1 (f , g) = max |f (x) − g(x)| .

A métrica d em M é chamada de intrínseca se quaisquer dois pontos x e y em M podem ser

Ainda, uma pseudométrica em M é uma função d : M ×M → [0, ∞) que satisfaz os axiomas

d(x, y) = d(x + a, y + a) (invariância por translações) ,

d(αx, αy) = |α|d(x, y) (homogeneidade) ,

d(y, z) # d(y, x0) + d(x0 , z) # r + r = 2r .

1. x ≺ x para todo x ∈ X (propriedade reflexiva),

2. x ≺ y e y ≺ z implica que x ≺ z (propriedade transitiva),

3. x ≺ y e y ≺ x implica que x = y (propriedade anti-simétrica).

define a seguinte ordem: v ≺ x, u ≺ x, u ≺ y, y ≺ z, x ≺ z e por causa da transitividade